Spelling suggestions: "subject:"análise dda sobrevivência"" "subject:"análise daa sobrevivência""
81 |
Um estudo de métodos bayesianos para dados de sobrevivência com omissão nas covariáveis / A study of Bayesian methods for survival data with missing covariates.Demerson Andre Polli 14 March 2007 (has links)
O desenvolvimento de métodos para o tratamento de omissões nos dados é recente na estatística e tem sido alvo de muitas pesquisas. A presença de omissões em covariáveis é um problema comum na análise estatística e, em particular nos modelos de análise de sobrevivência, ocorrendo com freqüência em pesquisas clínicas, epidemiológicas e ambientais. Este trabalho apresenta propostas bayesianas para a análise de dados de sobrevivência com omissões nas covariáveis considerando modelos paramétricos da família Weibull e o modelo semi-paramétrico de Cox. Os métodos estudados foram avaliados tanto sob o enfoque paramétrico quanto o semiparamétrico considerando um conjunto de dados de portadores de insuficiência cardíaca. Além disso, é desenvolvido um estudo para avaliar o impacto de diferentes proporções de omissão. / The development of methods dealing with missing data is recent in Statistics and is the target of many researchers. The presence of missing values in the covariates is very common in statistical analysis and, in particular, in clinical, epidemiological and enviromental studies for survival data. This work considers a bayesian approach to analise data with missing covariates for parametric models in the Weibull family and for the Cox semiparametric model. The studied methods are evaluated for the parametric and semiparametric approaches considering a dataset of patients with heart insufficiency. Also, the impact of different omission proportions is assessed.
|
82 |
Extensões de distribuições com aplicação à analise de sobrevivência / Extensions of distributions with application to survival analysisYolanda Magaly Gómez Olmos 09 February 2017 (has links)
Nesta tese serão estudadas diferentes generalizações de algumas distribuições bem conhecidas na literatura para os tempos de vida, tais como exponencial, Lindley, Rayleigh e exponencial segmentada, entre outras, e compará-las com outras extensões com suporte positivo. A finalidade dessas generalizações é flexibilizar a função de risco de modo que possam assumir formas mais flexíveis. Além disso, pretende-se estudar propriedades importantes dos modelos propostos, tais como os momentos, coeficientes de curtose e assimetria e função quantílica, entre outras. A estimação dos parâmetros é abordada através dos métodos de máxima verossimilhança, via algoritmo EM (quando for possível) ou também, do método dos momentos. O comportamento desses estimadores foi avaliado em estudos de simulação. Foram ajustados a conjuntos de dados reais, usando uma abordagem clássica, e compará-los com outras extensões na literatura. Finalmente, um dos modelos propostos é considerado no contexto de fração de cura. / The main focus of this thesis is the study of generalizations for some positive distributions widely known in the literature of lifetime analysis, such as the exponential, Lindley, Rayleigh and segmented exponential. Comparisons of the proposed extensions and alternative extensions in the literature such as the generalized exponential distribution, are reported. Moreover, of interest is also the study of some properties of the proposed distributions such as moments, kurtosis and asymmetry coefficients, quantile functions and the risk function. Parameter estimation is approached via maximum likelihood (using the EM-algorithm when available) and the method of moments as initial parameter estimators. Results of simulation studies are reported comparing the performance of these estimators with small and moderate sample sizes. Further comparisons are reported for real data applications, where the proposed models show satisfactory performance. Finally, one of the models proposed is considered no context of cure rate.
|
83 |
Modelos de regressão log-gama generalizado com fração de cura / The generalized log-gama mixture model with covariatesFernanda Bührer Rizzato 08 February 2007 (has links)
Neste trabalho considera-se uma reparametrização no modelo log-gama generalizado para a inclusão de dados com sobreviventes de longa duração. Os modelos tentam estimar separadamente os efeitos das covariáveis na aceleração ou desaceleração no tempo e na fração de sobreviventes que é a proporção da população para o qual o evento não ocorre. A função logística é usada para o modelo de regressão com fração de cura. Os parâmetros do modelo, serão estimados através do método de máxima verossimilhança. Alguns métodos de influência, como a influência local e a influência local total de um indivíduo, serão introduzidos, calculados, analisados e discutidos. Finalmente, um conjunto de dados médicos será analisado sob o modelo log-gama generalizado com fração de cura. Uma análise de resíduos será executada para verificar a qualidade de ajuste do modelo. / In this work the generalized log-gama model is modified for possibility that long-term survivors are present in the data . The models attempt to estimate separately the effects of covariates on the accelaration/decelaration of the timing of a given event and surviving fraction; that is, the proportion of the population for which the event never occurs. The logistic function is used for the regression model of the surviving fraction. Inference for the model parameters is considered via maximum likelihood. Some influence methods, such as the local influence, total local influence of an individual are derived, analyzed and discussed. Finally, a data set from the medical area is analyzed under log-gama generalized mixture model. A residual analysis is performed in order to select an appropriate model.
|
84 |
Árvore de regressão para dados censurados e correlacionados / Regression tree for censored and correlated dataArgenton, Juliana Luz Passos, 1984- 12 May 2013 (has links)
Orientador: Hildete Prisco Pinheiro / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica / Made available in DSpace on 2018-08-24T02:10:38Z (GMT). No. of bitstreams: 1
Argenton_JulianaLuzPassos_M.pdf: 2087574 bytes, checksum: b6014c3478501f5128fd13ddf952e6dd (MD5)
Previous issue date: 2013 / Resumo: O objetivo deste trabalho é apresentar uma metodologia de árvore de regressão para dados censurados e correlacionados. O conjunto de dados analisado foi obtido a partir de uma pesquisa realizada entre Dezembro de 2005 e Janeiro de 2006, que entrevistou 119 famílias (1712 indivíduos) que vivem no pequeno vilarejo de Baependi, no Estado de Minas Gerais. São apresentadas duas metodologias com base no modelo de riscos proporcionais, a primeira desconsidera a possível correlação existente entre os indivíduos de uma mesma família e usa a primeira iteração da estimativa da verossimilhança completa nas divisões dos nós. Na segunda metodologia apresentada, a correlação entre os indivíduos de uma mesma família é incorporada no modelo de riscos proporcionais através de uma variável de fragilidade com distribuição Gama, neste caso o valor da estatística Escore é usado para escolher a melhor divisão dos nós. O objetivo da análise é avaliar as variáveis que aumentam o risco de apresentar hipertensão, diabetes tipo II e colesterol alto, que são os três principais fatores que aumentam o risco de doenças no coração. As variáveis respostas são as idades de diagnóstico desses fatores de risco. A censura é definida de acordo com a observação da idade do indivíduo no momento do diagnóstico da doença e a idade do indivíduo no momento da pesquisa. Desta forma, uma idade de diagnóstico maior que a idade no momento da pesquisa caracteriza a censura. / Abstract: The objective of this work is to present methods of regression trees for censored and correlated data. The dataset analyzed was obtained from a survey, in which 119 families (1712 individuals) living in Baependi village, in the Brazilian state of Minas Gerais, were interviewed. Two methodologies based on the proportional hazard model are presented. The first disregards the possible correlation among the individuals of the same family, using the first step of a full likelihood estimation procedure for splitting nodes. In the second methodology, the correlation among the individuals of the same family is incorporated in the proportional hazard model through a frailty variable with Gamma distribution. In this case, the value of the Score statistic is used for choosing the best splitting node. The main purpose of the analysis is to evaluate the variables that increase the risk of hypertension, type II diabetes and high cholesterol, which are the top three main factors that increase the risk of heart conditions. The response variables are the age-of-onset of these risk factors. Censoring is defined by observing the individual's age-of-onset at the moment of diagnosis and also at the moment of the survey. This way, an age-of-onset higher than the age at the moment of the survey indicates censoring. / Mestrado / Estatistica / Mestra em Estatística
|
85 |
Avaliação do desempenho de modelos preditivos no contexto de análise de sobrevivência / Evaluation of predictive models in survival analysis.Tiago Mendonça dos Santos 17 May 2013 (has links)
Modelos estatísticos com objetivos preditivos são frequentemente aplicados como ferramentas no processo de tomadas de decisão em diversas áreas. Uma classe importante de modelos estatísticos é composta por modelos de análise de sobrevivência. Duas quantidades são de interesse nessa classe: o tempo até o instante do evento de interesse ou o status para um determinado instante de tempo fixado. Aplicações importantes desses modelos incluem a identificação de novos marcadores para certas doenças e definição de qual terapia será mais adequada de acordo com o paciente. Os marcadores utilizados podem ser dados por biomarcadores, assim como por marcadores baseados em modelos de regressão. Um exemplo de marcador baseado em modelos de regressão é dado pelo preditor linear. Ainda que a utilização de modelos de sobrevivência com objetivos preditivos seja de suma importância, a literatura nesse assunto é muito esparsa e não há consenso na forma de se avaliar o desempenho preditivo desses. Esse trabalho pretende reunir e comparar diferentes abordagens de se avaliar o desempenho preditivo de modelos de sobrevivência. Essa avaliação é feita principalmente utilizando-se funções de perda para o tempo de sobrevivência e quantidades associadas a diferentes definições de curva ROC para o status. Para a comparação dessas diferentes metodologias foi feito um estudo de simulação e no final aplicou-se essas técnicas em um conjunto de dados de um estudo do Instituto do Câncer de São Paulo. / In many fields, predictive models are often applied as a helpful tool in the decision making process. An important class of predictive models is composed by survival models. Two quantities of special interest in these class are: time until the occurrence of a specified event and survival status for a fixed moment of time. Important applications of these models include new markers identification for certain diseases, as well as defining which therapy is the most appropriated for a patient. Markers can be given by biomarkers, but they can also be derived from regression models. An example of regression models based markers is the linear predictor. Despite the importance of survival models applications with predictive goals, literature is this subject is very sparse and there is no agreement on the best methodology to evaluate predictive performance of these models. In this work we intend to assemble and to compare different methodologies for assessing the predictive performance of survival models. This assessment is made mainly with loss functions for the survival time and ROC curve associated quantities for status. An simulation study was done in order to compare these different methodologies, which were also applied to a study about survival of patients at ICU of ICESP (Instituto do Câncer de São Paulo)
|
86 |
Família Kumaraswamy-G para analisar dados de sobrevivência de longa duração / Kumaraswamy-G family to analyze long-term survival dataD\'Andrea, Amanda Morales Eudes 25 February 2015 (has links)
Em análise de sobrevivência estuda-se o tempo até a ocorrência de um determinado evento de interesse e na literatura, a abordagem mais usual é a paramétrica, em que os dados seguem uma distribuição de probabilidade. Diversas distribuições conhecidas são utilizadas para acomodar dados de tempos de falha, porém, grande parte destas distribuições não é capaz de acomodar funções de risco não monótonas. Kumaraswamy (1980) propôs uma nova distribuição de probabilidade e, baseada nela, mais recentemente Cordeiro e de Castro (2011) propuseram uma nova família de distribuições generalizadas, a Kumaraswamy generalizada (Kum-G). Esta distribuição além de ser flexível, contém distribuições com funções de risco unimodal e em forma de banheira. O objetivo deste trabalho é apresentar a família de distribuições Kum-Ge seus casos particulares para analisar dados de tempo de vida dos indivíduos em risco, considerando que uma parcela da população nunca apresentará o evento de interesse, além de considerarmos que covariáveis influenciem na função de sobrevivência e na proporção de curados da população. Algumas propriedades destes modelos serão abordadas, bem como métodos adequa- dos de estimação, tanto na abordagem clássica quanto na bayesiana. Por fim, são apresentadas aplicações de tais modelos a conjuntos de dados existentes na literatura. / In survival analysis is studied the time until the occurrence of a particular event of interest and in the literature, the most common approach is parametric, that the data follow a probability distribution. Various known distributions are used to accommodate failure times data, however, most of these distributions is not able to accommodate non monotonous hazard functions. Kumaraswamy (1980) proposed a new probability distribution and, based on it, most recently Cordeiro e de Castro (2011) proposed a new family of generalized distributions, Kumaraswamy generalized (Kum-G). This distribution besides being flexible, has distributions with unimodal and tub form of hazard functions. The objective of this paper is to present the family of Kum-G distributions and their particular cases to analyze lifetime data of individuals at risk, considering that part of the population never present the event of interest, and considering that covariates influencing in the survival function and the cured proportion of the population. Some properties of these models will be discussed as well as appropriate estimation methods, in the classical and Bayesian approaches. Finally, applications of such models are presented to data sets existingin the literature.
|
87 |
Comparação de modelos com censura intervalar em análise de sobrevivência / Comparison of interval-censored models in survival analysisStrapasson, Elizabeth 20 April 2007 (has links)
Censura intervalar resulta quando os tempos de sobrevivência não são exatamente conhecidos, sabe-se apenas que eles ocorreram dentro de um intervalo. Dados de sobrevivência agrupados são casos particulares de censura intervalar quando os indivíduos são avaliados nos mesmos intervalos de tempo, ocasionando um grande número de empates. Um procedimento comum para a análise desse tipo de dados é ignorar a natureza de censura intervalar dos dados, ou seja, tratar a variável aleatória tempo como contínua e assumir que o evento ocorreu no início, no ponto médio ou no final do intervalo e, então, usar um método padrão de análise de sobrevivência. Neste estudo, simulações de Monte Carlo, com o modelo de Weibull, foram realizadas para comparar esses três procedimentos e um método novo proposto que é uma combinação desses três métodos e é orientado pela observação do histograma do tempo versus a freqüência de cada intervalo para a decisão de qual valor a ser usado. Considera-se também a análise dos dados como censura intervalar. Os resultados mostram que analisar os dados exatamente como censura intervalar é a forma correta. Entretanto, quando a taxa de falha aumenta o ponto médio poderia ser usado. A natureza discreta dos tempos de falha deve ser reconhecida quando existe um grande número de empates. Métodos de regressão para tratar dados agrupados são apresentados por Lawless (2003) e Collett (2003), cuja estrutura é especificada em termos da probabilidade de um indivíduo falhar em um intervalo, condicionada à sua sobrevivência ao intervalo anterior. Os modelos considerados na literatura são o de riscos proporcionais de Cox ou o logístico. O modelo de Weibull é proposto, neste trabalho, como uma alternativa ao modelo de Cox para ajustar dados de sobrevivência com censura intervalar no contexto de modelos discretos. Através de simulações foram construídas as estatísticas da razão de verossimilhança e do teste escore para a discriminação entre esses dois modelos. Para ilustrar as simulações duas aplicações em dados agronômicos foram utilizadas. / Interval-censored results when survival times are not exactly known, knowing only that they occur in an interval. Grouped survival data are particular cases of intervalcensored when individuals are evaluated in the same time-intervals, causing a great number of ties. A common procedure for the analysis this type of data is to ignore the nature of interval-censored data, or rather, treat the random variable time as continuous, and assume that the event occurred in the beginning, midpoint or interval end, and then use a standard method of survival analysis. In this study, Monte Carlo simulations according to Weibull model, were performed in order to compare these three procedures and a new method proposed which is a combination of the three, and is directed by the observation of time histogram versus each interval frequency in order to decide which value be used. Interval-censored data is also considered. The results show that to analyse the data exactly as interval-censored is the correct form. However, when the failure rate increase the midpoint could be used. The discrete nature of failure time must be recognized when there are a great number of ties. Regression methods to treat grouped data are presented by Lawless (2003) and Collett (2003), whose structure is specified in terms of the probability of an individual failing in an interval, conditioned to his survival to previous interval. The models considered in literature are either those of Cox proportional hazards or the logistic one. Weibull model is proposed in this study as an alternative to Cox model in order to adjust survival data with interval-censored in the context of discrete models. Through simulations were built the statistics of ratio likelihood and score test to distinguish between these two models. To illustrate the simulations two applications in agronomy data were used.
|
88 |
Análise de sobrevivência de bancos privados no Brasil / Survival analysis of private banks in BrazilAlves, Karina Lumena de Freitas 16 September 2009 (has links)
Diante da importância do sistema financeiro para a economia de um país, faz-se necessária sua constante fiscalização. Nesse sentido, a identificação de problemas existentes no cenário bancário apresenta-se fundamental, visto que as crises bancárias ocorridas mundialmente ao longo da história mostraram que a falta de credibilidade bancária e a instabilidade do sistema financeiro geram enormes custos financeiros e sociais. Os modelos de previsão de insolvência bancária são capazes de identificar a condição financeira de um banco devido ao valor correspondente da sua probabilidade de insolvência. Dessa forma, o presente trabalho teve como objetivo identificar os principais indicadores característicos da insolvência de bancos privados no Brasil. Para isso, foi utilizada a técnica de análise de sobrevivência em uma amostra de 70 bancos privados no Brasil, sendo 33 bancos insolventes e 37 bancos solventes. Foi possível identificar os principais indicadores financeiros que apresentaram-se significativos para explicar a insolvência de bancos privados no Brasil e analisar a relação existente entre estes indicador e esta probabilidade. O resultado deste trabalho permitiu a realização de importantes constatações para explicar o fenômeno da insolvência de bancos privados no Brasil, bem como, permitiu constatar alguns aspectos característicos de bancos em momentos anteriores à sua insolvência. / The financial system is very important to the economy of a country, than its supervision is necessary. Accordingly, the identification of problems in the banking scenario is fundamental, since the banking crisis occurring worldwide throughout history have shown that and instability of the financial system generates huge financial and social costs. The banking failure prediction models are able to identify the financial condition of a bank based on the value of its probability of insolvency. Thus, this study aimed to identify the main financial ratios that can explain the insolvency of private banks in Brazil. For this, it was used the survival analysis to analize a sample of 70 private banks in Brazil, with 33 solvent banks and 37 insolvent banks. It was possible to identify the key financial indicators that were significantly to explain the bankruptcy of private banks in Brazil and it was possible to examine the relationship between these financial ratios and the probability of bank failure. The result of this work has enabled the achievement of important findings to explain the phenomenon of the bankruptcy of private banks in Brazil, and has seen some characteristic of banks in times prior to its insolvency.
|
89 |
Modelo de regressão log-Weibull modificado e a nova distribuição Weibull modificada generalizada / Log-modified Weibull regression models and a new generalized modified Weibull distributionFarfán Carrasco, Jalmar Manuel 09 November 2007 (has links)
Neste trabalho propomos um modelo de regress~ao utilizando a distribuição Weibull modificado, esta distribuição pode ser usada para modelar dados de sobrevivência quando a de função de risco tem forma de U ou banheira. Assumindo dados censurados, é considerado os estimadores de máxima verossimilhança e Jackknife para os parâmetros do modelo proposto. Foram derivadas as matrizes apropriadas para avaliar influiência local sobre os parâmetros estimados considerando diferentes peturbações e também é apresen- tada alguma medidas de influência global. Para diferentes parâmetros fixados, tamanhos de amostra e porcentagem de censuras, varia simulações foram feitas para avaliar a distribuição empírica do resíduo deviance modificado e comparado coma distribuição normal padrão. Esses estudos sugerem que a distribuição empírica do resíduo devianve modificado para o modelo de regressão log-Weibull modificado com dados censurados aproxima-se de uma dis- tribuição normal padrão. Finalmente analisamos um conjunto de dados utilizando o modelo de regressão log-Weibull modificado. Uma nova distribuição de quatro parâmetros é definida para modelar dados de tempo de vida. Algumas propriedades da distribuição é discutida, assim como ilustramos com exemplos a aplicação dessa nova distribuição. Palavras-chaves: Modelo de regressão; Distribuição Weibull modificada; Distribuição weibull modificada generalizada; Análise de sensibilidade; Dados censurados; Análise de resíduo / In this paperwork are proposed a regression model considering the modified Weibull distribution. This distribution can be used to model bathtub-shaped failure rate functions. Assuming censored data, we consider a classic and Jackknife estimator for the parameters of the model. We derive the appropriate matrices for assessing local influence on the parameter estimates under diferent perturbation schemes and we also present some ways to perform global influence. Besides, for diferent parameter settings, sample sizes and censoring percentages, various simulations are performed and the empirical distribution of the deviance modified residual is displayed and compared with the standard normal distribution. These studies suggest that the residual analysis usually performed in normal linear regression models can be straightforwardly extend for a martingale-type residual in log-modifiedWeibull regression models with censored data. Finally, we analyze a real data set under log-modified Weibull regression models. A diagnostic analysis and a model checking based on the deviance modified residual are performed to select an appropriate model. A new four-parameter distribution is introduced. Various properties the new distribution are discussed. Illustrative examples based on real data are also given.
|
90 |
Caracterização e extensões da distribuição Burr XII: propriedades e aplicações / Characterization and extensions of the Burr XII distribution: Properties and ApplicationsParanaíba, Patrícia Ferreira 21 September 2012 (has links)
A distribuição Burr XII (BXII) possui, como casos particulares, as distribuições normal, log-normal, gama, logística, valor extremo tipo I, entre outras. Por essa razão, ela é considerada uma distribuição flexível no ajuste dos dados. As ideias de Eugene; Lee e Famoye (2002) e Cordeiro e Castro (2011) foram utilizadas para o desenvolvimento de duas novas distribuições de probabilidade a partir da distribuição BXII. Uma delas é denominada beta Burr XII (BBXII) e possui cinco parâmetros. Desenvolveu-se o modelo de regressão log-beta Burr XII (LBBXII). A outra distribuição é denominada de Kumaraswamy Burr XII (KwBXII) e possui cinco parâmetros. A vantagem desses novos modelos reside na capacidade de acomodar várias formas da função risco, além disso, eles também se mostraram úteis na discriminação de modelos. Para cada um dos modelos foram calculados os momentos, função geradora de momentos, os desvios médios, a confiabilidade e a função densidade de probabilidade da estatística de ordem. Foi realizado um estudo de simulação para avaliar o desempenho desses modelos. Para a estimação dos parâmetros, foram utilizados os métodos de máxima verossimilhança e bayesiano e, finalmente, para ilustrar a aplicação das novas distribuições foram analisados alguns conjuntos de dados reais. / The Burr XII (BXII) distribution has as particular cases the normal, lognormal, gamma, logistic and extreme-value type I distributions, among others. For this reason, it is considered a flexible distribution for fitting data. In this paper, the ideas of Eugene; Lee e Famoye (2002) and Cordeiro and Castro (2011) is used to develop two new probability distributions based on the BBXII distribution. The first is called beta Burr XII (BBXII) and has five parameters. Based in these, we develop the extended generalized log-beta Burr XII regression model. The other distribution is called Kumaraswamy Burr XII (KwBXII) and has five parameters. The advantage of these new models rests in their capacity to accommodate various risk function forms. They are also useful in model discrimination. We calculate the moments, moments generating function, mean deviations, reliability and probability density function of the order statistics. A simulation study was conducted to evaluate the performance of these models. To estimate the parameters we use the maximum likelihood and Bayesian methods. Finally, to illustrate the application of the new distributions, we analyze some real data sets.
|
Page generated in 0.0857 seconds