Global ETD Search

91	Regressão quantílica para dados censurados / Censored quantile regression Louise Rossi Rasteiro 18 May 2017 (has links) A regressão quantílica para dados censurados é uma extensão dos modelos de regressão quantílica que, por levar em consideração a informação das observações censuradas na modelagem, e por apresentar propriedades bastante satisfatórias, pode ser vista como uma abordagem complementar às metodologias tradicionais em Análise de Sobrevivência, com a vantagem de permitir que as conclusões inferenciais sejam tomadas facilmente em relação aos tempos de sobrevivência propriamente ditos, e não em relação à taxa de riscos ou a uma função desse tempo. Além disso, em alguns casos, pode ser vista também como metodologia alternativa aos modelos clássicos quando as suposições destes são violadas ou quando os dados são heterogêneos. Apresentam-se nesta dissertação três técnicas para modelagem com regressão quantílica para dados censurados, que se diferenciam em relação às suas suposições e forma de estimação dos parâmetros. Um estudo de simulação para comparação das três técnicas para dados com distribuição normal, Weibull e log-logística é apresentado, em que são avaliados viés, erro padrão e erro quadrático médio. São discutidas as vantagens e desvantagens de cada uma das técnicas e uma delas é aplicada a um conjunto de dados reais do Instituto do Coração do Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo. / Censored quantile regression is an extension of quantile regression, and because it incorporates information from censored data in the modelling, and presents quite satisfactory properties, this class of models can be seen as a complementary approach to the traditional methods in Survival Analysis, with the advantage of allowing inferential conclusions to be made easily in terms of survival times rather than in terms of risk rates or as functions of survival time. Moreover, in some cases, it can also be seen as an alternative methodology to the classical models when their assumptions are violated or when modelling heterogeneity of the data. This dissertation presents three techniques for modelling censored quantile regression, which differ by assumptions and parameter estimation method. A simulation study designed with normal, Weibull and loglogistic distribution is presented to evaluate bias, standard error and mean square error. The advantages and disadvantages of each of the three techniques are then discussed and one of them is applied to a real data set from the Heart Institute of Hospital das Clínicas, University of São Paulo. Análise de sobrevivência Árvore de sobrevivência Dados censurados Estimador de Kaplan-Meier Kernel Regressão quantílica Censored data Kaplan-Meier estimator Kernel Quantile regression Survival analysis Survival tree
92	Modelagens estatística para dados de sobrevivência bivariados : uma abordagem bayesiana / Statistical modeling to bivariate survival data : a bayesian approach Ribeiro, Taís Roberta 31 March 2017 (has links) Submitted by Ronildo Prado (ronisp@ufscar.br) on 2017-08-17T14:39:42Z No. of bitstreams: 1 DissTRR.pdf: 2739559 bytes, checksum: 80c76b7b0d4fcf15e1c9962556cd8745 (MD5) / Approved for entry into archive by Ronildo Prado (ronisp@ufscar.br) on 2017-08-17T14:39:52Z (GMT) No. of bitstreams: 1 DissTRR.pdf: 2739559 bytes, checksum: 80c76b7b0d4fcf15e1c9962556cd8745 (MD5) / Approved for entry into archive by Ronildo Prado (ronisp@ufscar.br) on 2017-08-17T14:39:58Z (GMT) No. of bitstreams: 1 DissTRR.pdf: 2739559 bytes, checksum: 80c76b7b0d4fcf15e1c9962556cd8745 (MD5) / Made available in DSpace on 2017-08-17T14:40:04Z (GMT). No. of bitstreams: 1 DissTRR.pdf: 2739559 bytes, checksum: 80c76b7b0d4fcf15e1c9962556cd8745 (MD5) Previous issue date: 2017-03-31 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / The frailty models are used to model the possible associations between survival times. Another alternative developed for modeling the dependence between multivariate data is the use of models based on copulas functions. In this paper we propose two derived survival models of copula of the Ali-Mikhail-Haq (AMH) and of the Frank to model the dependence of bivariate data in the presence of covariates and censored observations. For inferential purposes, we conducted a Bayesian approach using Monte Carlo methods in Markov Chain (MCMC). Some discussions on the model selection criteria were presented. In order to detect influential observations we use the Bayesian method of cases of deletion of influence analysis based on the difference ^. Finally, we show the applicability of the proposed models to sets of simulated and real data. We present, too, a new survival model with bivariate fraction of healing, which takes into account three settings for the latent activation mechanism: random activation, first activation and final activation. We apply this model to a set of Direct Credit loan data to the Consumer mode (DCC) and compare the settings, through Bayesian criteria for selection of models, which of the three models best fit. Finally, we show our future proposal for further research. / Os modelos de fragilidade são utilizados para modelar as possíveis associações entre os tempos de sobrevivência. Uma outra alternativa desenvolvida para modelar a dependência entre dados multivariados e o uso dos modelos baseados em funções cápulas. Neste trabalho propusemos dois modelos de sobrevivência derivados das copulas de Ali-Mikhail-Haq (AMH) e de Frank para modelar a dependência de dados bivariados na presença de covariáveis e observações censuradas. Para fins inferenciais, realizamos uma abordagem bayesiana usando métodos Monte Carlo em Cadeias de Markov (MCMC). Algumas discussões sobre os critérios de seleção de modelos são apresentadas. Com o objetivo de detectar observações influentes utilizamos o método bayesiano de analise de influencia de deleção de casos baseado na divergência. Por fim, mostramos a aplicabilidade dos modelos propostos a conjuntos de dados simulados e reais. Apresentamos, também, um novo modelo de sobrevivência bivariado com fração de cura, que leva em consideração três configurações para o mecanismo de ativação latente: ativação aleatória, primeira ativação e áltima ativação. Aplicamos este modelo a um conjunto de dados de empréstimo de Credito Direto ao modo do Consumidor (DCC) e comparamos os ajustes por meio dos critérios bayesianos de seleção de modelos para verificar qual dos três modelos melhor se ajustou. Por fim, mostramos nossa proposta futura para a continuaçaão da pesquisa. Análise de sobrevivência Dados de sobrevivência bivariados Funções cópulas Fração de cura Survival analysis Bivariate survival data Copula functions Cure fraction
93	Estimação e diagnóstico na disribuição Weibull-Binomial-Negativa em análise de sobrevivência / Estimation and diagnosis for the Weibull-Negative-Binomial distribution in survival anaçysis Bao Yiqi 28 May 2012 (has links) Neste trabalho propomos a distribuição Weibull-Binomial-Negativa (WBN) considerando uma estrutura de ativação latente para explicar a ocorrência do evento de interesse, em que o número de causas competitivas é modelado pela distribuição Binomial Negativa, e os tempos não observados devido às causas seguem a distribuição Weibull. Em geral, as causas competitivas podem ter diferentes mecanismos de ativação, sendo assim os casos de primeira ativação, última ativação e ativação aleatória foram considerados no estudo. Desse modo o modelo proposto inclui uma ampla distribuição, tais como Weibull-Geométrico (WG) e Exponencial-Poisson Complementar (EPC), introduzidas por Barreto-Souza et al. (2011) e G. et al. (2011), respectivamente. Baseando-nos na mesma estrutura, consideramos o modelo de regressão locação-escala baseado na distribuição proposta (WBN) e o modelo para dados de sobrevivência com fração de cura. Os principais objetivos deste trabalho é estudar as propriedades matemáticas dos modelos propostos e desenvolver procedimentos de inferências desde uma perspectiva clássica e Bayesiana. Além disso, as medidas de diagnóstico Bayesiana baseadas na \'psi\'-divergência (Peng & Dey, 1995; Weiss, 1996), que inclui como caso particular a medida de divergência Kullback-Leibler (K-L), foram consideradas para detectar observações influentes / In this work we propose the Weibull-Negative-Binomial (WNB) considering a latent activation structure to explain the occurrence of an event of interest, where the number of competing causes are modeled by the Negative Binomial distribution and the no observed time due to the causes following the Weibull distribution. In general, the competitive causes may have different activation mechanisms, cases of first, last and random activation were considered in the study. Thus, the proposed model includes a wide distribution such as Weibull-Geometric distribution (WG) and Exponential-Poisson complementary (EPC) introduced by (Barreto-Souza et al., 2011) and (G. et al., 2011) respectively. Based on the same structure, we propose a location-scale regression model based on the proposed distribution (WNB) and the model for survival data with cure fraction. The main objectives of this work is to study the mathematical properties of the proposed models and develop procedures inferences from a classical and Bayesian perspective. Moreover, the Bayesian diagnostic measures based on the \'psi\'-divergence (Peng & Dey, 1995; Weiss, 1996), which includes Kullback-Leibler (K-L) divergence measure as a particular case, were considered to detect influential observations Análise de sobrevivência Distribuição binomial negativa Distribuição Weibull Inferência bayesiana Bayesian inference Negative binomial distribution Survival analysis Survival models with a cure fraction Weibull distribution
94	Alterações de atributos físicos de subsolo revegetado e condicionado com resíduos, para recuperação de ambiente degradado no Cerrado / Mizobata, Kellian Kenji Gonzaga da Silva. January 2017 (has links) Orientador: Kátia Luciene Maltoni / Resumo: O Cerrado é um dos biomas brasileiros que apresenta elevada riqueza natural e endemismo de espécies, carece de urgente conservação e/ou recuperação devido acelerada degradação. Muitos estudos sobre recuperação de áreas degradadas vêm sendo conduzidos, no entanto, é necessário aprofundar o entendimento sobre os processos envolvidos na recuperação de uma área, com esclarecimento e conhecimento das técnicas e avaliações que contribuam para melhorar cada vez mais este processo. Dentro deste contexto este trabalho teve por objetivo avaliar os atributos físicos de uma área degradada em recuperação (ADR) após ter sido condicionada com resíduos orgânico (RO) e agroindustrial (RA) e revegetada, utilizando um controle (área degradada sem intervenção - AD) e uma testemunha (fragmento de Cerrado conservado - CER) como parâmetros de referência. O experimento foi desenvolvido na Fazenda de Ensino Pesquisa e Extensão (FEPE) da Universidade Estadual Paulista, UNESP-Faculdade de Engenharia/campus de Ilha Solteira/SP, em área de subsolo exposto onde existiam Latossolos Vermelhos. O delineamento experimental utilizado foi em blocos casualizados, em esquema fatorial 3 x 4 + 2, com três doses de RO, quatro doses de RA, e dois tratamentos adicionais, CER e AD, perfazendo um total de 14 tratamentos com 3 repetições e profundidades em parcela subdividida. Os atributos avaliados foram densidade do solo, porosidade (macro e micro) nas camadas de 0,0 a 0,05 m; 0,05 a 0,10 m e 0,10 a 0,20 m; estabilidad... (Resumo completo, clicar acesso eletrônico abaixo) / Mestre Agregados Solos - Formação. Morfologia. Sobrevivência. Teoria dos conjuntos. Soil formation Morfologia (Biologia) Survival
95	Dinâmica espacial e análise de sobrevivência no setor sucroenergético do Brasil: 2001 - 2016 / Spatial dynamics and survival analysis on the Brazilian sugar and ethanol industry: 2001 - 2016 Bastos, André da Cunha 17 April 2019 (has links) O setor sucroenergético do Brasil encarou uma década de expansão da produção, seguida por um período de retração das atividades. Neste período, 80 usinas e destilarias deixaram de operar por motivo de falência das empresas ou decisões operacionais dos grupos controladores. A cana de açúcar possui características biológicas que determinam a necessidade de processamento industrial em poucas horas após a atividade de colheita, sob pena de grande perda de teor de sacarose. Essa questão tecnológica determina que a organização espacial da produção de açúcar e etanol seja preferencialmente realizada dentro de um raio geográfico reduzido em relação aos canaviais. O objetivo desta tese é analisar se as recentes paralisações e falências no setor sucroenergético do Brasil foram influenciadas pelas condições operacionais dos mercados regionais de cana de açúcar, assim como identificar os principais determinantes dos eventos de paralisação das atividades das usinas e destilarias entre 2001 e 2016. Indicadores de estrutura de mercado e concentração espacial são desenvolvidos e discutidos com base no conceito de mercado antitruste usado pelas principais agências de defesa da concorrência. A descrição da estrutura de mercado e a intensidade dos eventos de desligamento e falência em cada região são avaliados considerando a existência de múltiplas unidades de processamento que são de propriedade de uma mesma empresa em cada região. Os resultados indicam que a concentração e a disputa pela cana de açúcar como insumo por usinas localizadas próximas umas das outras estão espacialmente associadas aos eventos de falência e desligamento. No entanto, a análise de sobrevivência indica que o aumento do número de concorrentes demandando este insumo e a expansão do processamento de cana de açúcar no raio geográfico de colheita viável não foram fatores que contribuíram isoladamente para as falências e interrupções. Estes eventos foram menos frequentes entre as unidades industriais cuja empresa controladora conta com investidores estrangeiros na estrutura de capital e nos casos em que uma parcela mais alta dos insumos é obtida por meio de uma estrutura verticalmente integrada. / Brazil\'s sugar and ethanol industry faced a decade of expansion of production, followed by a period of retraction of activities. During this period, 80 mills and distilleries ceased to operate due to corporate bankruptcy or operational decisions of the controlling groups. Sugarcane has biological characteristics that determine the need for industrial processing in a few hours after harvesting, under penalty of great loss of sucrose content. This technological issue determines that the spatial organization of sugar and ethanol production is preferably carried out within a reduced geographic radius in relation to sugar cane fields. The objective of this thesis is to analyze if the recent shutdowns and bankruptcies in the Brazilian sugarcane industry were influenced by the operational conditions of the regional sugarcane markets, as well as to identify the main determinants of stoppage events of the maills and distilleries between 2001 and 2016. Indicators of market structure and spatial concentration are developed and discussed based on the concept of the antitrust market used by the major antitrust agencies. The description of the market structure and the intensity of the shutdown and bankruptcy events in each region are evaluated considering the existence of multiple processing units that are owned by the same company in each region. The results indicate that the concentration and the dispute for sugarcane as an input by plants located close to each other are spatially associated with the events of bankruptcy and shutdown. However, the survival analysis indicates that the increase in the number of competitors demanding this input and the expansion of sugarcane processing in the viable crop geographical radius were not factors that contributed in isolation to bankruptcies and interruptions. These events were less frequent among industrial units whose parent company relies on foreign investors in the capital structure and where a higher share of inputs are obtained through a vertically integrated structure. Análise de sobrevivência Cana de açúcar Econometria espacial Estrutura de mercado. Market structure. Spatial econometrics Sugarcane Survival analysis
96	Modelos multiestado com fragilidade / Multistate models with frailty Costa, Renata Soares da 31 March 2016 (has links) Frequentemente eventos intermediários fornecem informações mais detalhadas sobre o processo da doença ou recuperação, por exemplo, e permitem uma maior precisão na previsão do prognóstico de pacientes. Tais eventos não fatais durante o curso da doença podem ser vistos como transições de um estado para outro. A ideia básica dos modelos multiestado é que o indivíduo se move através de uma serie de estados em tempo contínuo, sendo possível estimar as probabilidades e intensidades de transição entre eles e o efeito das covariáveis associadas a cada transição. Muitos estudos incluem o agrupamento dos tempos de sobrevivência como, por exemplo, em estudos multicêntricos, e também é de interesse estudar a evolução dos pacientes ao longo do tempo, caracterizando assim dados multiestado agrupados. Devido ao fato de os dados virem de diferentes centros/grupos, os tempos de falha desses indivíduos estarem agrupados e a fatores de risco comuns não observados, é interessante considerar o uso de fragilidades para que possamos capturar a heterogeneidade entre os grupos no risco para os diferentes tipos de transição, além de considerar a estrutura de dependência entre transições dos indivíduos de um mesmo grupo. Neste trabalho apresentamos a metodologia dos modelos multiestado, dos modelos de fragilidade e, em seguida, a integração dos modelos multiestado com modelos de fragilidade, tratando do seu processo de estimação paramétrica e semiparamétrica. O estudo de simulação realizado mostrou a importância de considerarmos fragilidade sem modelos multiestado agrupados, pois sem considerá-las, as estimativas tornam-se viesadas. Além disso, verificamos as propriedades frequentistas dos estimadores do modelo multiestado com fragilidades aninhadas. Por fim, como um exemplo de aplicação a um conjunto de dados reais, utilizamos o processo de recuperação de transplante de medula óssea de pacientes tratados em quatro hospitais. Fizemos uma comparação de modelos por meio das medidas de qualidade do ajuste AIC e BIC, chegando à conclusão de que o modelo que considera dois efeitos aleatórios (uma para o hospital e outro para a interação transição-hospital) ajusta-se melhor aos dados. Além de considerar a heterogeneidade entre os hospitais, tal modelo também considera a heterogeneidade entre os hospitais em cada transição. Sendo assim, os valores das fragilidades estimadas da interação transição-hospital revelam o quão frágeis os pacientes de cada hospital são para experimentarem determinado tipo de evento/transição. / Often intermediate events provide more detailed information about the disease process or recovery, for example, and allow greater accuracy in predicting the prognosis of patients. Such non-fatal events during the course of the disease can be seen as transitions from one state to another. The basic idea of a multistate models is that the person moves through a series of states in continuous time, it is possible to estimate the transition probabilities and intensities between them and the effect of covariates associated with each transition. Many studies include the grouping of survival times, for example, in multi-center studies, and is also of interest to study the evolution of patients over time,characterizing grouped multistate data. Because the data coming from different centers/groups, the failure times these individuals are grouped and the common risk factors not observed, it is interesting to consider the use of frailty so that we can capture the heterogeneity between the groups at risk for different types of transition, in addition to considering the dependence structure between transitions of individuals of the same group. In this work we present the methodology of multistate models, frailty models and then the integration of models with multi-state fragility models, dealing with the process of parametric and semi-parametric estimation. The conducted simulation study showed the importance of considering frailty in grouped multistate models, because without conside- ring them, the estimates become biased. Furthermore, we find the frequentist properties of estimators of multistate model with nested frailty. Finally, as an application example to a set of real data, we use the process of bone marrow transplantation recovery of patients in four hospitals. We did a comparison of models through quality measures setting AIC and BIC, coming to the conclusion that the model considers two random effects (one for the hospital and another for interaction transition-hospital) fits the data better. In addition to considering the heterogeneity between hospitals, such a model also considers the heterogeneity between hospitals in each transition. Thus,the values of the frailty estimated interaction transition-hospital reveal how fragile patients from each hospital are to experience certain type of event/transition. Análise de sobrevivência Frailty Models Modelos de fragilidade Modelos Multiestado Multistate Models Survival Analysis
97	O modelo Weibull Modificado Exponenciado de Longa Duração aplicado à sobrevida do câncer de mama / Exponentiated Modified Weibull model for Long-Term survivors applied on breast cancer survival Souza, Hayala Cristina Cavenague de 04 May 2015 (has links) O câncer de mama é a neoplasia mundialmente mais incidente em mulheres, representando a causa mais frequente de morte feminina por câncer, excetuando-se os tumores de pele não melanoma. O conhecimento da dinâmica de óbitos ao logo do tempo em pacientes com tal neoplasia é de grande importância para auxílio na definição de tratamentos e de políticas de prevenção. Modelos de risco que contemplem parâmetros com referência a situações de longa duração e diferentes funções de risco podem ser úteis nesse contexto. O objetivo desta dissertação é investigar as propriedades de um particular modelo, o modelo Weibull Modificado Exponenciado de Longa Duração (WMELD), para aplicação na avaliação de risco e sobrevida de mulheres diagnosticadas com câncer de mama atendidas no Hospital das Clínicas de Ribeirão Preto, São Paulo. As propriedades avaliadas neste estudo consideraram métodos de estimação pontual de Máxima Verossimilhança e estimação intervalar via teoria assintótica, reamostragem bootstrap e verossimilhança perlada. Critérios de seleção de modelos foram considerados: Teste de Razão de Verossimilhanças (TRV), critério de Akaike (AIC) e critério de Informação de Bayes (BIC), bem como métodos gráficos para avaliar a qualidade do ajuste do modelo: gráfico TTT na presença de censuras com intervalo de confiança bootstrap paramétrico. Foram realizados estudos de simulação de Monte Carlo em diferentes cenários do modelo WMELD, considerando Vício, Erro Quadrático Médio (EQM) e Custo dos estimadores pontuais, Probabilidade de Cobertura e Amplitude Média dos intervalos de confiança. Em relação ao estudo das propriedades do modelo, as estimativas pontuais de máxima verossimilhança apresentaram vício e EQM baixos e mais próximos de zero quanto maior o tamanho amostral e menor a proporção de pacientes imunes. Os intervalos construídos com base em reamostragem bootstrap mostraram-se mais adequados em relação à probabilidade de cobertura e amplitude média, com vantagem para o bootstrap paramétrico. AIC e TRV alcançaram poder discriminativo superior ao BIC, porém os três métodos apresentam-se defasados para pequenos tamanhos amostrais e valores dos parâmetros próximos do valor de nulidade. Os métodos de inferência com melhor desempenho nesse estudo foram considerados para avaliar os fatores associados ao risco e sobrevida de pacientes com câncer de mama atendidas no HCFMRP. Com o ajuste do modelo WMELD, mostraram-se associados à sobrevida os fatores: Estadiamento, Faixa Etária e Quantidade de tratamentos. A sobrevida em oito anos ou mais foi maior quanto menor o estadiamento e os óbitos ocorreram de forma mais acelerada ao longo do tempo em estadiamentos avançados. Pacientes com menos de 35 anos de idade nos estadiamentos II e III e com mais de 75 anos no estadiamento III têm menor sobrevida do que as pacientes com 35 a 75 anos. Pacientes que realizaram menos tratamentos nos estadiamentos III ou IV vão a óbito mais rapidamente do que pacientes que zeram mais tratamentos, porém a sobrevida após oito ou mais anos é igual nos dois grupos. Adicionalmente, e fundamental no contexto da clínica médica, o modelo WMELD apresenta interpretações relevantes em relação a seus parâmetros na dinâmica do processo de ocorrência de óbitos ao longo do tempo. Verificamos que os parâmetros , e p levam informações sobre o tempo de vida, já os parâmetros, e descrevem o comportamento do risco de óbito. / Breast cancer is the world\'s most common cancer in women, representing the most frequent cause of female death from cancer, except for non-melanoma skin tumors. Knowledge of the death dynamics over time in patients with such cancer is very important to support definition of treatments and prevention policies. Hazard models that include parameters with reference to long-term situations and dierent hazard functions can be useful in this context. This paper aims to investigate the properties of a particular model, Exponentiated Modified Weibull Model for long-term survivors (EMWLT), for use in risk of death and survival assessment of women diagnosed with breast cancer and treated at Hospital das Clínicas de Ribeirão Preto (HCFMRP), São Paulo. The properties evaluated in this study considered point estimation methods of Maximum Likelihood and interval estimation through asymptotic theory, bootstrap resampling and profile likelihood. Model selection criteria were considered: Likelihood Ratio Test (LRT), Akaike Criterion (AIC) and Bayesian Information Criterion (BIC), as well graphical methods to assess the quality of the model fit: TTT plot in the presence of censorship with an parametric bootstrap confidence interval. Monte Carlo simulation studies were performed in diferent model\'s scenarios considering Bias, Mean Square Error (MSE) and Cost of point estimators, Coverage Probability and Average Size of confidence intervals. Regarding the study of model properties, the point estimates of maximum likelihood showed lower and closer to zero bias and MSE the larger the sample size and the lower the proportion of immune patients. The intervals constructed based on bootstrap resampling seemed more appropriated in relation to the coverage probability and average size, advantageously the parametric bootstrap. AIC and LRT reached a higher discriminative power than BIC; however, all of these three methods seemed lagged for small sample sizes and close to null values of parameters. The inference methods with better performance in this study were considered to evaluate the factors associated with risk of death and survival in patients with breast cancer treated at HCFMRP. By adjusting the EMWLT model, the following were associated to survival: Staging, Age Group and Number of treatments. The survival of eight years or more was higher as the lower the staging was; and the deaths occurred more rapidly over time in advanced staging. Patients under 35 years old in stages II and III and older than 75 years in staging III had lower survival than patients aged 35 to 75 years. Patients who underwent fewer treatments in staging III or IV die earlier than patients who underwent more treatments, but survival after eight years or more is equal in both groups. In addition, the EMWLT model showed to be fundamental in clinical medicine presenting relevant interpretations regarding its parameters in the dynamics of the process of occurrence of deaths over time. We verified that the parameters , and p have information about the lifetime, on the other hand the parameters, and describe the risk of death behavior. Breast cancer Câncer de mama Long-term Longa duração Risco Risk of death Sobrevivência Survival
98	Modelos baseados em pseudo-valores e sua aplicabilidade em credit scoring / Models based on pseudo-values with application to credit scoring Silva, Liliane Travassos da 02 August 2010 (has links) Os modelos de credit scoring têm sido bastante difundidos nos últimos anos como uma importante ferramenta para agilizar e tornar mais confiável o processo de concessão de crédito por parte das instituições financeiras. Esses modelos são utilizados para classificar os clientes em relação a seus riscos de inadimplência. Neste trabalho, é avaliada a aplicabilidade de uma nova metodologia, baseada em pseudo-valores, como alternativa para a construção de modelos de credit scoring. O objetivo é compará-la com abordagens tradicionais como a regressão logística e o modelo de riscos proporcionais de Cox. A aplicação prática é feita para dados de operações de crédito pessoal sem consignação, coletados do Sistema de Informações de Crédito do Banco Central do Brasil. As performances dos modelos são comparadas utilizando a estatística de Kolmogorov-Smirnov e a área sob a curva ROC. / Credit Scoring models have become popular in recent years as an important tool in the credit granting process, making it more expedite and reliable. The models are mainly considered to classify customers according to their default risk. In this work we evaluate the apllicability of a new methodology, based on pseudo-values, as an alternative to constructing credit scoring models. The objective is to compare this novel methodology with traditional approaches such as logistic regression and Cox proportional hazards model. The models are applied to a dataset on personal credit data, collected from the Credit Information System of Central Bank of Brazil. The performances of the models are compared via Kolmogorov-Smirnov statistic and the area under ROC curve. análise de sobrevivência credit scoring credit scoring logistic regression pseudo-valores pseudo-values regressão logística survival analysis
99	Uso de métodos bayesianos na análise de dados de sobrevida para pacientes com câncer na mama na presença de censuras, fração de cura e covariáveis / Use of Bayesian methods in the analysis of survival data for pacients with breast cancer in presence of censoring, cure fraction and covariates Icuma, Tatiana Reis 10 June 2016 (has links) Introdução: A maior causa de mortes no mundo é devido ao câncer, cerca de 8,2 milhões em 2012 (World Cancer Report, 2014). O câncer de mama é a forma mais comum de câncer entre as mulheres e a segunda neoplasia mais frequente, seguida do câncer de pele não melanoma, representando cerca de 25% de todos os tipos de cânceres diagnosticados. Modelos estatísticos de análise sobrevivência podem ser úteis para a identificação e compreensão de fatores de risco, fatores de prognóstico, bem como na comparação de tratamentos. Métodos: Modelos estatísticos de análise de sobrevivência foram utilizados para evidenciar fatores que afetam os tempos de sobrevida livre da doença e total de um estudo retrospectivo realizado no Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo, Ribeirão Preto, referente a 54 pacientes com câncer de mama localmente avançado com superexpressão do Her-2 que iniciaram a quimioterapia neoadjuvante associada com o medicamento Herceptin® (Trastuzumabe) no período de 2008 a 2012. Utilizaram-se modelos univariados com distribuição Weibull sem e com a presença de fração de cura sob o enfoque frequentista e bayesiano. Utilizou-se modelos assumindo uma estrutura de dependência entre os tempos observados baseados na distribuição exponencial bivariada de Block Basu, na distribuição geométrica bivariada de Arnold e na distribuição geométrica bivariada de Basu-Dhar. Resultados: Resultados da análise univariada sem a presença de covariáveis, o modelo mais adequado às características dos dados foi o modelo Weibull com a presença de fração de cura sob o enfoque bayesiano. Ao incorporar nos modelos as covariáveis, observou-se melhor ajuste dos modelos com fração de cura, que evidenciaram o estágio da doença como um fator que afeta a sobrevida livre da doença e total. Resultados da análise bivariada sem a presença de covariáveis estimam médias de tempo de sobrevida livre da doença para os modelos Block e Basu, Arnold e Basu-Dhar de 108, 140 e 111 meses, respectivamente e de 232, 343, 296 meses para o tempo de sobrevida total. Ao incorporar as covariáveis, os modelos evidenciam que o estágio da doença afeta a sobrevida livre da doença e total. No modelo de Arnold a covariável tipo de cirurgia também se mostrou significativa. Conclusões: Os resultados do presente estudo apresentam alternativas para a análise de sobrevivência com tempos de sobrevida na presença de fração de cura, censuras e várias covariaveis. O modelo de riscos proporcionais de Cox nem sempre se adequa às características do banco de dados estudado, sendo necessária a busca de modelos estatísticos mais adequados que produzam inferências consistentes. / Introduction: The leading worldwide cause of deaths is due to cancer, about 8.2 million in 2012 (World Cancer Report, 2014). Breast cancer is the most common form of cancer among women and the second most common cancer, followed by non-melanoma skin cancer, accounting for about 25% of all diagnosed types of cancers. Statistical analysis of survival models may be useful for the identification and understanding of risk factors, prognostic factors, and the comparison treatments. Methods: Statistical lifetimes models were used to highlight the important factors affecting the disease-free times and the total lifetime about a retrospective study conducted at the Hospital das Clinicas, Faculty of Medicine, University of São Paulo, Ribeirão Preto, referring to 54 patients with locally advanced breast cancer with Her-2 overexpression who started neoadjuvant chemotherapy associated with the drug Herceptin® (Trastuzumab) in the time period ranging from years 2008 to 2012. It was used univariate models assuming Weibull distribution with and without the presence of cure fraction under the frequentist and Bayesian approaches. It was also assumed models assuming a dependence structure between the observed times based on the bivariate Block-Basu exponential distribution, on the bivariate Arnold geometric distribution and on the bivariate Basu-Dhar geometric distribution. Results: From the results of the univariate analysis without the presence of covariates, the most appropriate model for the data was the Weibull model in presence of cure rate under a Bayesian approach. By incorporating the covariates in the models, there was best fit of models with cure fraction, which showed that the stage of the disease was a factor affecting disease-free survival and overall survival. From the bivariate analysis results without the presence of covariates, the estimated means for free survival time of the disease assuming the Block- Basu, Arnold and Basu-Dhar models were respectively given by 108, 140 and 111; for the overall survival times the means were given respectively by, 232, 343, 296 months. In presence of covariates, the models showed that the stage of the disease affects the disease-free survivals and the overall survival times. Assuming the Arnold model, the covariate type of surgery also was significant. Conclusions: The results of this study present alternatives for the analysis of survival times in the presence of cure fraction, censoring and covariates. The Cox proportional hazards model not always is apropriate to the database characteristics studied, which requires the search for more suitable statistical models that produce consistent inferences. Análise de sobrevivência Bayesian inference Breast neoplasms Cure model Fração de cura Inferência bayesiana, Neoplasia de mama Survival analysis
100	As distribuições Kumaraswamy-log-logística e Kumaraswamy-logística / Distributions Kumaraswamy-log-logistic and Kumaraswamy-logistic Santana, Tiago Viana Flor de 18 October 2010 (has links) Neste trabalho apresenta-se duas novas distribuições de probabilidade obtidas de dois métodos de generalização da distribuição log-logística com dois parâmetros (LL(?,?)). O primeiro método descrito em Marshall e Olkin (1997) transforma a nova distribuição, agora com três parâmetros e denominada distribuição log-logística modificada (LLM (v,?,?)), mais flexível porém, não muda a forma geral da função de taxa de falha e o novo parâmetro v, não influência no cálculo da assimetria e curtose. O segundo método utiliza a classe de distribuições Kumaraswamy proposta por Cordeiro e Castro (2010), para construir a nova distribuição de probabilidade, denominada distribuição Kumaraswamy log-logística (Kw-LL(a,b,?,?)), a qual considera dois novos parâmetros a e b obtendo ganho nas formas da função de taxa de falha, que agora além de modelar dados onde a função de taxa de falha tem forma decrescente e unimodal, modela forma crescente e forma de U. Também foi proposto as distribuições logística modificada (LM (v,µ,?)) e Kumaraswamy logística (Kw-L (a,b, µ,?)$) para a variável Y=log(T), em que T ~ LLM (v,?,?) no caso da distribuição logística modificada e T ~ Kw-LL(a,b,?,?) no caso da distribuição Kw-L. Com reparametrização ? = exp(µ) e ? = 1/?. Da mesma forma que a distribuição LLM, não há ganho quanto a forma da função de taxa de falha da distribuição logística modificada e o parâmetro v não contribuiu para o cálculo da assimetria e curtose desta distribuição. O modelo de regressão locação e escala foi proposto para ambas as distribuições. Por fim, utilizou-se dois conjuntos de dados, para exemplificar o ganho das novas distribuições Kw-LL e Kw-L em relação as distribuições log-logística e logística. O primeiro conjunto refere-se a dados de tempo até a soro-reversão de 143 crianças expostas ao HIV por via vertical, nascidas no Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto no período de 1995 a 2001, onde as mães não foram tratadas. O segundo conjunto de dados refere-se ao tempo até a falha de um tipo de isolante elétrico fluido submetivo a sete níveis de voltagem constante. / In this work, are presented two new probability distributions, obtained from two generalization methods of the log-logistic distribution, with two parameters (LL (?, ?)). The first method described in Marshall e Olkin (1997) turns the new distribution, now with three parameters, called modified log-logistic distribution (LLM(v, ?, ?)). This distribution is more flexible, but, does not change the general shape of the failure rate function, as well as the new parameter v, does not influence the calculus of skewness and kurtosis. The second method, uses the class of distributions Kumaraswamy proposed by Cordeiro and Castro (2010). To build the new probability distribution, called Kumaraswamy log-logistic distribution (Kw-LL(a,b,?,?)), which considers two new parameters a and b gaining in the forms of failure rate function, that now, even modeling data where the failure rate function has decreasing and unimodal shape, models the increasing form and the U-shaped. Also, were proposed the distributions modified logistic (LM (v,µ,?)) and Kumaraswamy logistics (Kw-L (a,b,µ,?)) for the variable Y=log(T), where T ~ LLM(v,?,?) in the case of the modified logistic distribution and T ~ Kw-LL (a,b,?,?) in the case of Kw-L distribution, with reparametrization ? =exp(µ) and ? = 1/?. As in the distribution LLM, there is no gain for the shape of the failure rate function of modified logistic distribution and the parameter v does not contribute to the calculation of skewness and kurtosis of the distribution. The location and scale regression models were proposed for both distributions. As illustration, were used two datasets to exemplify the gain of the new distributions Kw-LL and Kw-L compared with the log-logistic and logistic distributions. The first dataset refers to the data of time until soro-reversion of 143 children exposed to HIV through vertical, born in the Hospital of the Medical School of Ribeirão Preto during the period 1995 to 2001, where mothers were not treated. The second dataset refers to the time until the failure of a type of electrical insulating fluid subjected to seven constant voltage levels Análise de regressão e de correlação Análise de sobrevivência Distribuições (Probabilidade) Distributions (Probability) Logística. Logistics. Regression analysis and correlation Survival analysis

Search results