Muitas questões de importância biológica ligadas à evolução e filogenias podem ser abordadas por meio de análises estatísticas que utilizam a função de verossimilhança. Para que tais análises sejam feitas, são necessários modelos que designem probabilidades a eventos mutacionais, os modelos de substituição de bases. Como existem diversos destes modelos, critérios estatísticos para escolher entre eles são importantes nessa area. Assim, o objetivo desse trabalho é estudar as propriedades de um dos mais amplamente utilizados critérios para seleção desses modelos, o teste da razão de verossimilhança. Utilizando teoria assintótica, nós propomos um estimador consistente e de baixo custo computacional para o poder do teste. Nós também utilizamos Simulações de Monte Cario para estudar a distribuição da estatística do teste. Além disso, estudamos propriedades dos estimadores de máxima verossimilhança para parâmetros do modelo, como sua distribuição assintótica em casos particulares e cotas inferiores para sua variância. A técnica do Jackknife é utihzada para a correção do vício destes estimadores, com bons resultados. Os modelos de substituição de bases mais utilizados tem pressupostos restritivos sobre o processo de evolução molecular, assim, nós também estudamos alguns modelos mais realistas que permitem variação das taxas de mutação e dependência entre sítios. / Many important biological questions, especially regarding evolutionary history and phylogenies, may be tackled by statistical analysis of DNA sequences that use the likelihood function. In order to make these analysis, statistical models that assign probabilities to mutational events are needed. Since several of these base substitution models exist, statistical methods that choose between models are important in this field. The goal of this dissertation is to study the properties of likelihood ratio tests that compare base substitution models, the most widely used hypothesis tests for this purpose. Through asymptotic theory, we propose a low computational cost consistent estimator for the power of the likelihood ratio test. We also study the distribution of the t e s f s statistic through Monte Cario simulations. Properties of the maximum likehhood estimators for model parameters, such as its asymptotic distribution in special cases and lower bounds for it's variance are presented, as well as the suggestion of using the resampling method Jackknife for bias correction. The widely used base substitution models have strong assumptions about the process of evolution that are not generally valid, thus we also study models that alow for rate variation and dependency between sites.
Identifer | oai:union.ndltd.org:IBICT/oai:lume.ufrgs.br:10183/115494 |
Date | January 2009 |
Creators | Cybis, Gabriela Bettella |
Contributors | Lopes, Silvia Regina Costa |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, instname:Universidade Federal do Rio Grande do Sul, instacron:UFRGS |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0023 seconds