Global ETD Search

171	Combinação de classificadores para inferência dos rejeitados Rocha, Ricardo Ferreira da 16 March 2012 (has links) Made available in DSpace on 2016-06-02T20:06:06Z (GMT). No. of bitstreams: 1 4300.pdf: 2695135 bytes, checksum: c7742258a75f77aa35ccb54abc3439fe (MD5) Previous issue date: 2012-03-16 / Financiadora de Estudos e Projetos / In credit scoring problems, the interest is to associate to an element who request some kind of credit, a probability of default. However, traditional models uses samples biased because the data obtained from the tenderers has only clients who won a approval of a request for previous credit. In order to reduce the bias sample of these models, we use strategies to extract information about individuals rejected to be able to infer a response, good or bad payer. This is what we call the reject inference. With the use of these strategies, we also use the bagging technique (bootstrap aggregating), which consist in generate models based in some bootstrap samples of the training data in order to get a new predictor, when these models is combined. In this work we will discuss about some of the combination methods in the literature, especially the method of combination by logistic regression, although little used but with interesting results.We'll also discuss some strategies relating to reject inference. Analyses are given through a simulation study, in data sets generated and real data sets of public domain. / Em problemas de credit scoring, o interesse é associar a um elemento solicitante de algum tipo de crédito, uma probabilidade de inadimplência. No entanto, os modelos tradicionais utilizam amostras viesadas, pois constam apenas de dados obtidos dos proponentes que conseguiram a aprovação de uma solicitação de crédito anterior. Com o intuito de reduzir o vício amostral desses modelos, utilizamos estratégias para extrair informações acerca dos indivíduos rejeitados para que nele seja inferida uma resposta do tipo bom/- mau pagador. Isto é o que chamamos de inferência dos rejeitados. Juntamente com o uso dessas estratégias utilizamos a técnica bagging (bootstrap aggregating ), que é baseada na construção de diversos modelos a partir de réplicas bootstrap dos dados de treinamento, de modo que, quando combinados, gera um novo preditor. Nesse trabalho discutiremos sobre alguns dos métodos de combinação presentes na literatura, em especial o método de combinação via regressão logística, que é ainda pouco utilizado, mas com resultados interessantes. Discutiremos também as principais estratégias referentes à inferência dos rejeitados. As análises se dão por meio de um estudo simulação, em conjuntos de dados gerados e em conjuntos de dados reais de domínio público. Estatística Riscos Financeiros Combinação de classificadores Credit scoring Regressão logística Bagging Combinação de modelos Inferência dos rejeitados Bagging Credit scoring Logistic regression Model combination Reject inference
172	Modelagem de fraude em cartão de crédito Moraes, Dalila de 02 September 2008 (has links) Made available in DSpace on 2016-06-02T20:06:06Z (GMT). No. of bitstreams: 1 4329.pdf: 1652803 bytes, checksum: aad7f31afeb38bcd450c35fd9ed227be (MD5) Previous issue date: 2008-09-02 / Universidade Federal de Sao Carlos / The transactions volume increase brought the fraud increase, which result in a annual loss of billions of reais to all .nancial institutions in the world. Therefore, it.s very important the development of detection methods and fraud prevention. The di¢ cult in modeling this kind of data due the fact the data sets are extremely unbalanced. In this work, a bounded logit model will be proposed for fraud detection. It will also be discussed state- dependent sampling and compared with logit and bounded logit model performances. Two applications, one with a simulated data set and another with a real data set, will be presented. The Bayesian approach to these models will also be discussed. The data set analyses will be implemented in SAS and Winbugs software. / O aumento no volume de transações com cartões de crédito trouxe como consequência o aumento do número de fraudes, o que acarreta em uma perda de bilhões de reais anu- almente à todas instituições .nanceiras do mundo. Com isso é muito importante que metodologias de detecção e prevenção à fraude sejam desenvolvidas. A grande di.cul- dade na modelagem deste tipo de dados é que estes são extremamentes desbalanceados. Neste presente trabalho, será proposto o modelo logito limitado na detecção de fraude. Também será discutido as amostras do tipo state-dependent e comparado os desempenhos dos modelos logito e logito limitado. Duas aplicações, uma com um conjunto de dados simulados e outra com um conjunto de dados reais, serão apresentadas. A abordagem bayesiana para estes modelos também será discutida. As análises dos conjuntos de dados serão realizadas nos softwares SAS e Winbugs. Estatística Modelagem de dados Regressão logística Modelo logito limitado Amostras statedependent Modelo logito Análise Bayesiana Logit model Bounded logit model State-dependent sampling Bayesian analysis
173	FITOSSOCIOLOGIA DE COMUNIDADES ARBÓREAS EM SAVANAS DO BRASIL CENTRAL / PHYTOSOCIOLOGY OF THE ARBOREAL COMMUNITIES IN SAVANNAS FROM CENTRAL BRAZIL Finger, Zenesio 11 February 2008 (has links) These studies were undertaken in the state of Mato Grosso, Brazil, in the area of Chapada dos Guimarães and Baixada Cuiabana, which are constituted of a high plateau and a big low plain, respectively, being limited to two areas covered by vegetation with a savannic physiognomy, type Cerrado stricto sensu. Considering the hypothesis that the knowledge both of the biotic and abiotic components of the scenery and their interrelations allows a better understanding of the environmental dynamic, this dissertation had as objectives to characterize the savanna communities' arboreal stratum floristically and phytosociologically, concerning their richness, phytosociological structures and diversity; to identify floristic groupings through varied statistical techniques, representing them by dendrograms; to select species which are really able to make discrimination among the groups; to obtain some discriminant functions to allow classification and reclassification of specimen units, in the groups, to which they have more probability of belonging; to analyze and to characterize the obtained groups; to determine the patterns of distribution of the species of trees by the analysis of correlations of environmental variables with the distribution of the species and plots in the communities being studied; to determine the similarity indexes among the floristic groups and to compare themselves and, finally, to test methods of assorted statistical analysis for application in studies of vegetable communities. Data of vegetation were obtained by the method of multiple plots, with size of 20 X 20 m (400 m2), randomly disposed in each one of the areas being studied. 82 plots were randomly installed. In each one of the 82 patternless units, the circumferences of all the arboreal plants with perimeter to 0,30 m from the level of the soil (PAB) larger or equal to 15,7 cm (DAB 5,0 cm) and the total height of the plants were obtained. In the core of each plot, for determination of the chemical and textural variables of the soil, simple samples of superficial soil were collected (0-30 cm depth). Species were organized according to the families recognized by Angiosperm Phylogeny Group II. The sampling sufficiency was obtained based on the analysis of the curve of the collector. Phytosociological parameters were calculated for each formed group, with the purpose of characterizing them phytosociologically. Having as variables the Index of Covering Value (IVC) of the species, the classification was accomplished by the TWINSPAN (Two-Way Indicator Species Analysis) method, regarding the plots, with the objective of classifying them in floristic groups. The diversity was determined by the Shannon-Wienner and the Simpson Index. The discriminant analysis was undertaken through the STEPWISE method. Considering the matrix of presence and absence of the species in the groups, the floristic similarity was calculated among the groups by the Sorensen Index. To evaluate the hypothesis of the correlation existence between the distribution of the species and environmental variables, the canonical correspondence analysis was accomplished (CCA). The test of permutation of Monte Carlo was applied to verify the importance of the correlations between the emerging distribution patterns of the species and the environmental variables in final CCA. To determine the responsible environmental factors for the distribution of the species, the analysis of regression logistics was used. The Forward Stepwise (Wald) method was used for the sequential selection of the variables. By the species-area curve, it could be observed that, from the plot 75 (30.000 m2 out of the area used as sample), the curve is stabilized with the occurrence of 114 species in the 82 studied plots, distributed between 81 genera and 36 botanical families. The families better represented were Fabaceae, Myrtaceae and Vochysiaceae. The alpha diversity from the arboreal vegetation found in the area being studied was of 4,033 considering the Shannon-Wiener Index and of 0,975 considering the Simpson Index, representing a great floristic diversity. The divisions generated by the classification through the TWINSPAN method separated the plots into four groups: Group 1 Myrcia albo-tomentosa Camb. Association; Group 2 Pterodon emarginatus Vog. Association ; Group 3 Curatella americana L. Association; and Group 4 Qualea multiflora Mart. Association. In the discriminant analysis, 100% of the plots were classified correctly in the Groups 1, 2, 3 and 4, indicating precision of the grouping technique used. The largest similarity could be observed in the Groups 2 and 3, whose Sorensen Index was close to 1 (0,7310). In the four floristic groups, Fabaceae, Myrtaceae, Vochysiaceae, Annonaceae and Apocynaceae families were the most representative floristically in terms of genera and species. In CCA the correlations of the environmental variables with the first ordination axis were, in decreasing order of absolute values, saturation for aluminum, altitude s.n.m., saturation of bases, saturation for magnesium, relationship magnesium/potassium, saturation for hydrogen, potassium tenor, pH(H2O) and relationship calcium/potassium. The saturation for calcium variable presented very weak correlation with the first axis, however, with the second ordination axis, it was very strong. In the diagram of ordination of the plots, the four floristic groups were discriminated in sections different from the diagram, reinforcing their visualization as much defined habitats and with composition of particular species, resulting in clear separation of the four soil classes previously identified. The logistic regression analysis was useful to prove the results obtained from CCA, concerning the environmental variables which determined the distribution of the indicative species of the floristic groups in the studied communities. / Estes estudos foram desenvolvidos no estado de Mato Grosso, Brasil, na região de Chapada dos Guimarães e Baixada Cuiabana, que compreendem, respectivamente, um alto platô e uma grande planície baixa, restringindo-se a duas áreas cobertas por vegetação com fisionomia savânica do tipo Cerrado stricto sensu. Partindo-se da hipótese de que o conhecimento tanto dos componentes bióticos e abióticos da paisagem como de suas inter-relações permite um melhor entendimento da dinâmica ambiental, o presente estudo teve como objetivos caracterizar o estrato arbóreo das comunidades de savana estudadas, florística e fitossociologicamente, quanto a riqueza, estrutura fitossociológica e diversidade; identificar agrupamentos florísticos, por meio de técnicas estatísticas multivariadas, representando-os por meio de dendrograma; selecionar espécies com poder real de discriminação entre os grupos; obter funções discriminantes que permitam classificar e reclassificar unidades amostrais, nos grupos, para os quais têm maior probabilidade de pertencerem; analisar e caracterizar os grupos obtidos; determinar os padrões de distribuição das espécies de árvores, por meio da análise de correlações de variáveis ambientais com a distribuição das espécies e parcelas nas comunidades estudadas; determinar os índices de similaridade entre os grupos florísticos obtidos e compará-los; e testar métodos de análise estatística multivariada para aplicação em estudos de comunidades vegetais. Os dados da vegetação foram obtidos empregando-se o método de parcelas múltiplas, com tamanho de 20 X 20 m (400 m2), dispostas aleatoriamente em cada uma das áreas de estudos. Foram instaladas aleatoriamente 82 parcelas. Em cada uma das 82 unidades amostrais, foram obtidas as circunferências de todos as plantas arbóreas com perímetro a 0,30 m do nível do solo (PAB) maior ou igual a 15,7 cm (DAB  5,0 cm), e a altura total das plantas. No centro de cada parcela, para determinação das variáveis químicas e texturais do solo, coletaram-se amostras simples de solo superficial (0-30 cm de profundidade). As espécies foram organizadas de acordo com as famílias reconhecidas pelo Angiosperm Phylogeny Group II. A suficiência de amostragem foi obtida com base na análise da curva do coletor. Os parâmetros fitossociológicos foram calculados para cada grupo formado, com a finalidade de caracterizá-los fitossociológicamente. Tendo como variáveis o Índice de Valor de Cobertura (IVC) das espécies, foi realizada a classificação, por meio do método TWINSPAN (Two-Way Indicator Species Analisys), com relação às parcelas, com o objetivo de classificá-las em grupos florísticos. A diversidade foi determinada por meio do Índice de Shannon-Wienner e de Simpson. Realizou-se a análise discriminante por meio do método STEPWISE. A partir da matriz de presença e ausência das espécies nos grupos, foi calculada a similaridade florística entre os grupos, por meio do Índice de Sorensen. Para avaliar a hipótese da existência de correlação entre a distribuição das espécies e variáveis ambientais, foi realizada a análise de correspondência canônica (CCA). Foi aplicado o teste de permutação de Monte Carlo para verificar a significância das correlações entre os padrões de distribuição emergentes das espécies e as variáveis ambientais na CCA final. Para determinar os fatores ambientais responsáveis pela distribuição das espécies, foi utilizada a análise de regressão logística. À seleção seqüencial das variáveis foi utilizado o método Forward Stepwise (Wald). Pela curva espécie-área, pode-se observar que, a partir da parcela 75 (30.000 m2 da área amostrada), a curva estabiliza-se com a ocorrência de 114 espécies nas 82 parcelas estudadas, distribuídas entre 81 gêneros e 36 famílias botânicas. As famílias mais bem representadas foram Fabaceae, Myrtaceae e Vochysiaceae. A diversidade alfa da vegetação arbórea encontrada na área estudada foi de 4,033 pelo índice de Shannon-Wiener e de 0,975 pelo de Simpson, indicando alta diversidade florística. As divisões geradas pela classificação por meio do método TWINSPAN separaram as parcelas em quatro grupos. Grupo 1 - Associação Myrcia albo-tomentosa Camb.; Grupo 2 - Associação Pterodon emarginatus Vog.; Grupo 3 - Associação Curatella americana L.; e Grupo 4 - Associação Qualea multiflora Mart.. Na análise discriminante, observou-se que 100% das parcelas foram classificadas corretamente nos grupos 1, 2, 3 e 4, indicando precisão da técnica de agrupamento utilizada. A maior similaridade se deu entre os grupos 2 e 3, cujo índice de Sorensen foi próximo de 1 (0,7310). Nos quatro grupos florísticos obtidos, as famílias Fabaceae, Myrtaceae, Vochysiaceae, Annonaceae e Apocynaceae foram as mais representativas florísticamente em número de gêneros e espécies. Na CCA, as correlações das variáveis ambientais com o primeiro eixo de ordenação foram, em ordem decrescente de valores absolutos, saturação por alumínio, altitude s.n.m., saturação de bases, saturação por magnésio, relação magnésio/potássio, saturação por hidrogênio, teor de potássio, pH(H2O) e relação cálcio/potássio. A variável saturação por cálcio apresentou correlação muito fraca com o primeiro eixo, entretanto, com o segundo eixo de ordenação, foi muito forte. No diagrama de ordenação das parcelas, os quatro grupos florísticos foram discriminados em setores diferentes do diagrama, reforçando a visualização dos mesmos como hábitats bem definidos e com composição de espécies particular, resultando em clara separação das quatro classes de solo identificadas previamente. A análise de regressão logística comprovou os resultados obtidos da CCA, em relação às variáveis ambientais que determinaram a distribuição das espécies indicadoras dos grupos florísticos nas comunidades estudadas. Cerrado Fitossociologia Método TWINSPAN Análise discriminante Diagramas de ordenação Análise de regressão logística Cerrado Phytosociology TWINSPAN method Discriminant analysis Canonical correspondence analysis (CCA) Ordination diagrams Logistic regression analysis
174	Proposta metodológica para identificar fatores contribuintes de acidentes viários por meio de geotecnologias / Methodological proposal to identify contributing factors of road accidents through geotechnologies Batistão, Mariana Dias Chaves [UNESP] 02 February 2018 (has links) Submitted by Mariana Dias Chaves null (mariana.unesp@hotmail.com) on 2018-02-16T19:43:53Z No. of bitstreams: 1 Batistao, MDC-TeseDr.pdf: 6348711 bytes, checksum: 0f1b9c7f3392530f6d2f279ee0b58768 (MD5) / Approved for entry into archive by Claudia Adriana Spindola null (claudia@fct.unesp.br) on 2018-02-19T11:31:34Z (GMT) No. of bitstreams: 1 batistao_mdc_dr_prud.pdf: 6348711 bytes, checksum: 0f1b9c7f3392530f6d2f279ee0b58768 (MD5) / Made available in DSpace on 2018-02-19T11:31:34Z (GMT). No. of bitstreams: 1 batistao_mdc_dr_prud.pdf: 6348711 bytes, checksum: 0f1b9c7f3392530f6d2f279ee0b58768 (MD5) Previous issue date: 2018-02-02 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Essa pesquisa apresenta um estudo acerca dos fatores contribuintes de acidentes rodoviários com o objetivo de fornecer evidências para analisar o comportamento dos fatores contribuintes envolvidos nesses acidentes, mais especificamente nos trechos críticos. Desejase identificar a relação dos fatores com o grau de severidade de um acidente (danos materiais, sem vítimas fatais e com vítimas fatais) e o impacto de cada classe de fator na ocorrência de um acidente. A intensão é embasar uma análise geoespacial levando em consideração técnicas estatísticas e cartográficas e contribuir para melhorar a qualidade das informações sobre segurança viária no país e seu atual cenário crítico. A estrutura metodológica da pesquisa consiste em três etapas principais: (I) Identificação e determinação de segmentos de trechos críticos, (II) Mapeamento dos fatores contribuintes “via” para o acidente e (III) Investigação e estudo dos fatores contribuintes. Quatro trechos de rodovias do oeste do estado de São Paulo foram escolhidos como área de estudo. Na etapa I propôs-se um método de interpolação espacial de escolha de segmentos de trechos críticos levando a premissa existência da dependência geográfica dos acidentes em consideração. No total, foram identificados oito segmentos de trechos críticos na área de estudo. A etapa II concentrou-se no mapeamento dos fatores contribuintes desses segmentos de trechos críticos. Essa etapa trouxe o caráter tecnológico à pesquisa por fazer uso da integração de geotecnologias e a contribuição das Ciências Cartográficas para os estudos de segurança viária, por gerar informação a partir do mapeamento da localização dos fatores contribuintes. Das quatro classes de fatores (humano, ambiente, veículo e via) as características da via foram escolhidas para serem mapeadas, tendo-se deparado com a ausência de qualquer dado dessa classe de fatores tanto no banco de dados dos acidentes como no boletim de ocorrências. A relação com as outras três classes de fatores foi tratada na etapa III da pesquisa, cujos resultados proporcionaram montar o ranking dos seis fatores contribuintes da via mais frequentes nos segmentos de trechos críticos. Adicionalmente, foram construídos três modelos de regressão logística ordinal para investigar o impacto de cada uma das quatro classes de fatores no grau de severidade do acidente (três graus de severidade). Para isso, o grau foi tratado como variável dependente dos modelos. Quatro variáveis independentes (fatores contribuintes) foram consideradas significativas e escolhidas para compor os modelos: consumo de drogas (da classe de fator contribuinte humano), estado dos pneus (da classe de fator veículo), vegetação (da classe de fator via) e sinalização (da classe de fator via). Por fim, os modelos puderam ser analisados a partir da razão de chances (odds ratio) para complementar as informações e sintetizar os resultados como contribuições da pesquisa. / This research presents a study about the contributing factors of road accidents in order to provide evidences to analyse the behaviour of contributing factors involved in these accidents more specifically in critical sections. The intention is to identify the relationship between those factors and the severity degree of an accident (material damage, no fatalities and fatalities) and the impact of each factor class on an accident occurrence. The aim is to base on geospatial analysis taking into account statistical and cartographic techniques and contribute to improve the quality of the road safety information in the country which has a current critical scene. The methodological structure of this thesis consists of following three main steps: (I) Identification and determination of critical sections segments, (II) mapping “road” contributing factors for each accident and (III) Investigation and study of the contributing factors. Four sections of highways in the west of São Paulo state were chosen as the study area. In Step I, proposed a spatial interpolation method to choose critical sections segments premising the existence of geographical dependence of the considered accidents. In entire, eight critical sections segments were identified in the study area. Step II focused on mapping the contributing factors of these segments. This step brought the technological character to this research by making use of geotechnologies integration and the contribution of Cartographic Sciences to road safety by generating information of the contributing factors location from mapping. Of the four factors classes (human, environment, vehicle and road), the road characteristics were chosen to be mapped, since no data from this factor class was found in both the accident database and the occurrence report. The relation with the other three factors classes was the subject of step III, which results provided a ranking of the six most frequent contributing factors in critical sections segments. In addition, three ordinal logistic regression models were constructed to investigate the impact of each of the four factors classes on the accident severity degree (three severity degrees). For this, the severity degree was considered as the models dependent variable. Four significant independent variables (contributing factors) were chosen to compose the following models: drug consumption (from the human contributing factor class), tire condition (vehicle factor class), vegetation (road factor class) and signaling (road factor class). Lastly, the models could be analysed by the odds ratio method to complement the information and synthesize the results as research contributions. Acidentes rodoviários Fator contribuinte Mapeamento móvel Geoinformação Mapas de Kernel Krigagem indicatriz Regressão logística ordinal Road accidents Contributing factor Mobile mapping Geoinformation Kernel maps Indicator kriging Ordinal logistic regression model
175	Enfoque da estatística espacial em modelos dinâmicos de mudança do uso do solo. / A spatial statistical approach to dynamic simulation models of land use and cover range. Luis Iván Ortiz Valencia 17 September 2008 (has links) Fundação de Amparo à Pesquisa do Estado do Rio de Janeiro / O atual nível das mudanças uso do solo causa impactos nas mudanças ambientais globais. Os processos de mudanças do uso e cobertura do solo são processos complexos e não acontecem ao acaso sobre uma região. Geralmente estas mudanças são determinadas localmente, regionalmente ou globalmente por fatores geográficos, ambientais, sociais, econômicos e políticos interagindo em diversas escalas temporais e espaciais. Parte desta complexidade é capturada por modelos de simulação de mudanças do uso e cobertura do solo. Uma etapa do processo de simulação do modelo CLUE-S é a quantificação da influência local dos impulsores de mudança sobre a probabilidade de ocorrência de uma classe de uso do solo. Esta influência local é obtida ajustando um modelo de regressão logística. Um modelo de regressão espacial é proposto como alternativa para selecionar os impulsores de mudanças. Este modelo incorpora a informação da vizinhança espacial existente nos dados que não é considerada na regressão logística. Baseado em um cenário de tendência linear para a demanda agregada do uso do solo, simulações da mudança do uso do solo para a microbacia do Coxim, Mato Grosso do Sul, foram geradas, comparadas e analisadas usando o modelo CLUE-S sob os enfoques da regressão logística e espacial para o período de 2001 a 2011. Ambos os enfoques apresentaram simulações com muito boa concordância, medidas de acurácia global e Kappa altos, com o uso do solo para o ano de referência de 2004. A diferença entre os enfoques foi observada na distribuição espacial da simulação do uso do solo para o ano 2011, sendo o enfoque da regressão espacial que teve a simulação com menor discrepância com a demanda do uso do solo para esse ano. / Present state of land use changes impacts global environmental changes. Land use and cover changes are complex processes and do not occur at random pattern in an area. In general, they are determined locally, regionally and globally by geographic, environmental, social, economic and political factors interacting at diverse temporal and spatial scales. Part of this complexity can be modeled by land use and cover change simulation models. An important step of simulation process in CLUE-S model is local influence of driving forces over the occurrence of a land use type. This influence is obtained by logistic regression model. A spatial lag regression model is proposed to select driving forces. This model incorporates spatial neighborhood information which is ignored by logistic regression. Based on a lineal trend scenario of land use demand, simulations of land use changes for Coxim microbasin, Mato Grosso do Sul, were generated, analyzed and compared using CLUE-S model under logistic and spatial regression approaches. The period of simulations was 2001-2011. Both approaches revealed elevated concordance, high global accuracy and Kappa index, to land use for 2004 reference year. Differences were observed for spatial distribution for land use simulations for 2011. Spatial lag regression simulation for 2011 reached less discrepancy to land use demand for that year. Engenharia da Computação CLUE-S Regressão logística Regressão espacial com defasagem Simulação Computer Engineering Land use and cover change models CLUE-S Logistic regression Spatial lag regression model Simulation ENGENHARIAS
176	Desigualdades no uso e acesso aos serviços de saúde entre a população idosa do município de São Paulo / Inequalities in use and access to health care services among the elderly population in São Paulo. Marilia Cristina Prado Louvison 16 August 2006 (has links) Objetivos: Este estudo é parte do Projeto Saúde, Bem-estar e Envelhecimento (SABE), com o objetivo de identificar as desigualdades no acesso e uso de serviços de saúde entre idosos no município de São Paulo, Brasil. Métodos: Em 2000, foram entrevistados, 2143 indivíduos com 60 anos ou mais, utilizando-se o questionário padronizado do SABE. A amostra foi obtida em dois estágios, utilizando-se setores censitários com reposição, probabilidade proporcional à população e complementação da amostra de pessoas de 75 anos. Os dados finais foram ponderados, de forma a serem expandidos. Foi mensurado o uso de serviços hospitalares (internações) e ambulatoriais (consultas médicas) nos últimos quatro meses e o não uso de serviços de saúde (mesmo precisando), relacionando-os com fatores de capacidade, necessidade e predisposição (renda total, escolaridade, seguro saúde, morbidade referida, auto-percepção, sexo e idade). Resultados: A proporção dos entrevistados que referiu ter utilizado algum serviço de saúde, nos últimos quatro meses, foi de 4,7 por cento com relação à internação hospitalar e 64, 4 por cento com referência ao atendimento ambulatorial. Dos atendimentos ambulatoriais, 24,7 por cento ocorreu em hospital público e 24,1 por cento em serviço ambulatorial público sendo que nos serviços privados, 14,5 por cento ocorreu em hospital e 33,7 por cento em clínicas. A não utilização foi relacionada à pouca gravidade da doença, qualidade e distância dos serviços e custo. Na regressão logística multivariada, observou-se associação entre a utilização de serviços e sexo, presença de doenças, auto-percepção de saúde, interação da renda e escolaridade e posse de seguro saúde, sendo que a escolaridade isoladamente apresentou efeito inverso. Conclusão: Foram observadas desigualdades no uso e acesso aos serviços de saúde e inadequação do modelo de atenção, indicando necessidade de políticas públicas que levem em conta as especificidades dessa população, facilitem o acesso e possam reduzir essas desigualdades / Objectives: This research is part of a project called Health, Well-being and Aging in Latin America and the Caribbean, SABE study, and aims to study the inequalities in use and access to health care services among the elderly persons in the Municipality of São Paulo, Brazil. Methods: In 2000, 2.143 individuals aged 60 or older, dwelling in the urban area of São Paulo, were interviewed using census sectors with replacement and probability proportional to population. To achieve the desired number of respondents 75 or older, additional homes close to the selected census sector were used, with weighting of the final results. The use and access to health services were measured for outpatient medical services and hospital admission in the context of the personal characteristics of the subjects, context and need for health care. Results: Considering the elderly who needed healthcare assistance in the four months prior to the interview, 4,7% were hospitalized and 64,4% needed ambulatory care, being 24,7% in public hospitals and 24,1% in public ambulatory health services. As for the private services, this number was 14, 5% for hospitals and 33, 7% for medical clinics. In the multivariate analysis, there is an association between use of health services, sex, diseases, wealth quintiles and health insurance. However, the opposite effect was found for the variable educational level. Conclusions: The results demonstrate inequalities in use and access to health services and a problematic health care system. Public policies should take into account the different needs of this older population, in order to facilitate access to health care services and reduce inequalities. Acesso aos serviços de saúde Assistência ambulatorial Eqüidade no acesso Fatores socioeconômicos Iniqüidade na saúde Prestação de cuidados de saúde Regressão logística (Saúde Pública) Saúde do idoso Serviços de saúde para idosos Health services for the aged Inequalities in health Use and access to health care services
177	Estudo de expansões assintóticas, avaliação numérica de momentos das distribuições beta generalizadas, aplicações em modelos de regressão e análise discriminante BRITO, Rejane dos Santos 20 March 2009 (has links) Submitted by (ana.araujo@ufrpe.br) on 2016-08-10T13:00:13Z No. of bitstreams: 1 Rejane dos Santos Brito.pdf: 1642561 bytes, checksum: 084711a62c79f703133a032643c8d19f (MD5) / Made available in DSpace on 2016-08-10T13:00:13Z (GMT). No. of bitstreams: 1 Rejane dos Santos Brito.pdf: 1642561 bytes, checksum: 084711a62c79f703133a032643c8d19f (MD5) Previous issue date: 2009-03-20 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / We make a review about Edgeworth, Lugannani-Rice, Daniels and Cordeiro-Ferrari asymptotic approximations. We use the Cordeiro-Ferrari asymptotic approximation to approximate the gamma distribution G(m;f ) by the exponential distribution with mean a. In a further application, based on the statistical proposed by them, we approximate the t-Student distribution with n degrees of freedom using the normal standard distribution. Moreover, we realize a study about the functionalities of the beta generalized distributions. We obtain moments of the generalized beta distributions using the Lauricella and Kampé de Fériet generalized functions. Beyond this, we propose a new generalized beta distribution called beta power. Finally, we realize some applications in regression models by logistic regression and further more using discriminant analysis. / Inicialmente, realiza-se uma revisão literária sobre as expansões assintóticas de Daniels, Edgeworth, Lugannani-Rice e Cordeiro-Ferrari. Mediante uso da expansão de Cordeiro- Ferrari, torna-se possível realizar um estudo correspondente a aproximação da distribuição gama G(m;f ) em função da distribuição exponencial com média a. E, ainda, numa outra aplicação, faz-se a aproximação da distribuição t-Student com n graus de liberdade em função da distribuição normal padrão. Além disso, apresenta-se um estudo correspondente às funcionalidades das distribuições beta generalizadas e, ainda, a obtenção dos momentos das distribuições beta generalizadas mediante as funções de Lauricella e generalizada de Kampé de Fériet. Propõe-se, ainda, a generalização da distribuição power como sendo uma nova distribuição beta generalizada. Por fim, realizam-se algumas aplicações em modelos de regressão, mediante regressão logística, bem como em modelos de análise discriminante. Distribuições beta generalizadas Aproximação ponto de sela Distribuição beta power Regressão logística Análise discriminante Generalized Beta Distribution Saddle Point Approximation Beta Power Distribution Logistic Regression Discriminant Analysis
178	Padrões espaciais do suicídio na cidade de São Paulo e seus correlatos socioeconômico-culturais / Spatial patterns of suicide in the city of São Paulo and its socioeconomic-cultural correlates Daniel Hideki Bando 06 October 2008 (has links) O presente estudo tem o objetivo de analisar os padrões espaciais das ocorrências de suicídio no município de São Paulo, no período de 1996 a 2005, e verificar a sua associação com variávies socioeconômico-culturais (estado civil, renda, instrução, religião, migração). A escolha das variáveis analíticas foi baseada nos fatores de risco ao suicídio levantados pela OMS, OPAS e na teoria sobre o suicídio de Durkheim. Os dados socioeconômicos utilizados foram provenientes do IBGE e os dados de mortalidade do PRO-AIM. Para a identificação do padrão espacial das taxas de suicídio foi utilizado o teste de varredura espacial. Para a verificação da associação com as variáveis socioeconômicas e culturais foi utilizada análise de regressão logísica. No período estudado ocorreram 4275 óbitos por suicídio no município de São Paulo, com uma taxa média de 4,1/100 mil hab/ano. O primeiro teste de varredura espacial, considerando-se 50% da população total como tamanho máximo do agrupamento, identificou 2 agrupamentos significativos, um de risco (RR = 1,66) composto por 18 distritos da região central, centro-sul e centrooeste da cidade (Alto de Pinheiros, Barra Funda, Bela Vista, Bom Retiro, Brás, Cambuci, Consolação, Itaim Bibi, Jardim Paulista, Liberdade, Moema, Morumbi, Pinheiros, Perdizes, República, Santa Cecília, Sé, Vila Mariana) e um de proteção (RR = 0,78) formado por 14 distritos da região sul (Campo Grande, Campo Limpo, Capão Redondo, Cidade Ademar, Cidade Dutra, Grajaú, Jardim Ângela, Jardim São Luís, Santo Amaro, Socorro, Pedreira, Raposo Tavares, Vila Andrade, Vila Sônia). O teste considerando-se 5% da população total como tamanho máximo do agrupamento, encontrou 2 agrupamentos significativos. Nesse teste, o agrupamento de risco do primeiro teste foi desmembrado em dois agrupamentos menores, ambos de risco. O agrupamento primário apresentou RR = 1,92 em 9 distritos centrais, o agrupamento secundário RR = 1,58 em 6 distritos da região centro-sul. Para a análise de regressão logística, o agrupamento de risco identificado no primeiro teste de varredura espacial (18 distritos) e os demais 78 distritos (contraste) foram definidos como variáveis dependentes e as variáveis socioeconômicoculturais independentes. O primeiro modelo ajustado na regressão multivariada identificou as seguintes variáveis como risco: solteiros (OR = 2,36); migrantes (OR = 1,49); católicos (OR = 1,36); elevada renda (OR = 1,05). O segundo modelo multivariado identificou as seguintes variáveis como proteção: casados (OR = 0,48); evangélicos (0,60). Os resultados podem ser explicados pelos fatores de risco da literatura, pela teoria de Durkheim adaptada à realidade paulistana e pela diferença entre suicídio e homicídio. / The present study aims to analyse the space patterns of suicide occurence in the city of São Paulo, in the period from 1996 to 2005, and check its association with the socioeconomic-cultural variables (marital status, income, education, religion, migration). The choice of the analytical variables was based on the suicide risk factors lifted by the WHO and OPAS, and in the Durkheim´s suicide theory. The socioeconomic data used were originated from the IBGE and the mortality data from the PRO-AIM. The spatial scan test was applied to identify space patterns of suicide rates. In order to check the association with the socioeconomic-cultural variables, the logistic regression analysis was used. In the studied period, 4275 suicide deaths took place in the city of São Paulo, with a mean rate of 4,1/100 thousand inhabitant/year. The first spatial scan test, considering 50% of the total population as the maximum cluster size, identified 2 significant clusters, one of risk (RR = 1,66) composed by 18 districts of the central region, south-center and western-center of the city (Alto de Pinheiros, Barra Funda, Bela Vista, Bom Retiro, Brás, Cambuci, Consolação, Itaim Bibi, Jardim Paulista, Liberdade, Moema, Morumbi, Pinheiros, Perdizes, República, Santa Cecília, Sé, Vila Mariana) and one of protection (RR = 0,78) formed by 14 districts of the south region (Campo Grande, Campo Limpo, Capão Redondo, Cidade Ademar, Cidade Dutra, Grajaú, Jardim Ângela, Jardim São Luís, Santo Amaro, Socorro, Pedreira, Raposo Tavares, Vila Andrade, Vila Sônia). The test considering 5% of the total population as the maximum cluster size, found 2 significant clusters. In this test, the risk cluster of the first test was dismembered in two minor clusters, both of risk. The primary cluster presented RR = 1,92 in 9 central districts the secondary cluster RR = 1,58 in 6 districts of the south-centre. To the logistic regression analysis, the risk cluster identified in the first spatial scan test (18 districts) and the others 78 districts (contrast) were defined as dependent variables and the socioeconomic-cultural variables as independent. The first adjusted model in the multivaried regression identified these variables like risk: singles (OR = 2,36); migrant (OR = 1,49); catholics (OR = 1,36); high income (OR = 1,05). The second multivaried model identified these variables like protection: married (OR = 0,48); evangelic (0,60). The results can be explained by the literature risk factors, the Durkheim´s theory well-adjusted for the reality of São Paulo and by the difference between suicide and homicide. Análise de varredura espacial Cidade de São Paulo Fatores de risco Padrão espacial Regressão logística Suicídio Variáveis socioeconômico-culturais City of São Paulo Logistic regression Risk factors Socioeconomic and cultural variables Spatial pattern Spatial scan test Suicide
179	O processo de satisfação do consumidor: uma análise do mercado corporativo de comunicação móvel celular. Reis, Eduardo Ferreira dos 12 1900 (has links) Submitted by Estagiário SPT BMHS (spt@fgv.br) on 2013-08-08T14:21:01Z No. of bitstreams: 1 Dissertação Eduardo Ferreira dos Reis.pdf: 829547 bytes, checksum: c2739a6a6f01d870ad0929a337f80f5a (MD5) / Approved for entry into archive by Estagiário SPT BMHS (spt@fgv.br) on 2013-08-08T14:21:15Z (GMT) No. of bitstreams: 1 Dissertação Eduardo Ferreira dos Reis.pdf: 829547 bytes, checksum: c2739a6a6f01d870ad0929a337f80f5a (MD5) / Approved for entry into archive by Estagiário SPT BMHS (spt@fgv.br) on 2013-08-08T14:21:32Z (GMT) No. of bitstreams: 1 Dissertação Eduardo Ferreira dos Reis.pdf: 829547 bytes, checksum: c2739a6a6f01d870ad0929a337f80f5a (MD5) / Made available in DSpace on 2013-08-08T14:21:45Z (GMT). No. of bitstreams: 1 Dissertação Eduardo Ferreira dos Reis.pdf: 829547 bytes, checksum: c2739a6a6f01d870ad0929a337f80f5a (MD5) Previous issue date: 2004-12 / O presente trabalho tem o propósito de analisar o processo de fidelização do consumidor corporativo no mercado de comunicação móvel celular. Serão investigadas as práticas comerciais da operadora de telefonia móvel celular Vivo, sob a ótica das teorias propostas. Para que esta análise ocorra será realizada uma pesquisa quantitativa com 120 empresas, divididas entre clientes e ex-clientes, entrevistas em profundidade com 08 empresas, também dividas entre clientes e ex-clientes e entrevistas em profundidade com os executivos responsáveis pela arquitetura das estratégias comerciais. Baseado no resultado da pesquisa, das entrevistas e da análise das teorias propostas, este estudo pretende apontar as práticas de marketing que podem gerar lealdade nos clientes empresariais de pequeno e médio porte no mercado de telefonia móvel celular. / The present work has the purpose of analyzing the process of the corporate consumer's loyalty in the market of cellular mobile communication. The commercial practices of the Vivo operator of cellular mobile telephony will be investigated, under the optics of the proposed theories. So that this analysis happens a quantitative research will be accomplished with 120 companies, divided between customers and former-customers, interviews in depth with 08 companies, also divide between customers and former-customers and interviews in depth with the responsible executives for the architecture of the commercial strategies. Based on the result of the research, of the interviews and of the analysis of the proposed theories, this study intends the marketing practices that can generate loyalty in the business customers of small and medium load in the market of cellular mobile telephony to appear. Satisfação Expectativas Serviços Processo de decisão Qualidade Atendimento Telefonia celular Regressão logística Comportamento do consumidor Expectations Cellular telephony Behavior of the Consumer Satisfaction Services Process of decision Quality Logistic regression Administração de empresas Serviço ao cliente Satisfação do consumidor Comportamento do consumidor
180	Modelos de classificação : aplicações no setor bancário / Classification models : applications in banking sector Caetano, Mateus, 1983- 02 June 2015 (has links) Orientadores: Antonio Carlos Moretti, Márcia Aparecida Gomes Ruggiero / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-26T18:03:59Z (GMT). No. of bitstreams: 1 Caetano_Mateus_M.pdf: 1249293 bytes, checksum: f8adb755363291250261872ea756f58c (MD5) Previous issue date: 2015 / Resumo: Técnicas para solucionar problemas de classificação têm aplicações em diversas áreas, como concessão de crédito, reconhecimento de imagens, detecção de SPAM, entre outras. É uma área de intensa pesquisa, para a qual diversos métodos foram e continuam sendo desenvolvidos. Dado que não há um método que apresente o melhor desempenho para qualquer tipo de aplicação, diferentes métodos precisam ser comparados para que possamos encontrar o melhor ajuste para cada aplicação em particular. Neste trabalho estudamos seis diferentes métodos aplicados em problemas de classificação supervisionada (onde há uma resposta conhecida para o treinamento do modelo): Regressão Logística, Árvore de Decisão, Naive Bayes, KNN (k-Nearest Neighbors), Redes Neurais e Support Vector Machine. Aplicamos os métodos em três conjuntos de dados referentes à problemas de concessão de crédito e seleção de clientes para campanha de marketing bancário. Realizamos o pré-processamento dos dados para lidar com observações faltantes e classes desbalanceadas. Utilizamos técnicas de particionamento do conjunto de dados e diversas métricas, como acurácia, F1 e curva ROC, com o objetivo de avaliar os desempenhos dos métodos/técnicas. Comparamos, para cada problema, o desempenho dos diferentes métodos considerando as métricas selecionadas. Os resultados obtidos pelos melhores modelos de cada aplicação foram compatíveis com outros estudos que utilizaram os mesmos bancos de dados / Abstract: Techniques for classification problems have applications on many areas, such as credit risk evaluation, image recognition, SPAM detection, among others. It is an area of intense research, for which many methods were and continue to be developed. Given that there is not a method whose performance is better across any type of problems, different methods need to be compared in order to select the one that provides the best adjustment for each application in particular. In this work, we studied six different methods applied to supervised classification problems (when there is a known response for the model training): Logistic Regression, Decision Tree, Naive Bayes, KNN (k-Nearest Neighbors), Neural Networks and Support Vector Machine. We applied these methods on three data sets related to credit evaluation and customer selection for a banking marketing campaign. We made the data pre-processing to cope with missing data and unbalanced classes. We used data partitioning techniques and several metrics, as accuracy, F1 and ROC curve, in order to evaluate the methods/techniques performances. We compared, for each problem, the performances of the different methods using the selected metrics. The results obtained for the best models on each application were comparable to other studies that have used the same data sources / Mestrado / Matematica Aplicada / Mestra em Matemática Aplicada Classificação - Modelos matemáticos Análise de regressão logística Redes neurais (Computação) Maquina de vetores de suporte Árvores de decisões Classification - Mathematical models Logistic regression analysis Neural networks (Computer science) Support vectors machine Decision trees

Search results