Return to search

Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets

O método da análise de flutuações destendenciadas (Detrended Fluctuation Analysis - DFA), proposto por Peng et al. (1994), é um exemplo de metodologia recente, sendo utilizada em um crescente número de aplicações, para identificar longa dependência em séries temporais. Como não existe uma regra específica para a escolha dos números de regressores no método de DFA, apresentamos aqui uma escolha ótima assintótica. Para um ruído Gaussiano fracionário, provamos que o estimador bHDFA tem distribuição Gaussiana exata e assintótica. O parâmetro mais importante para ser estimado em dados com caudas pesadas é a sua taxa de decaimento α que determina a probabilidade de ocorrência dos valores extremos da distribuição subjacente. Propomos, neste trabalho, um novo estimador para o parâmetro α, baseado na função característica empírica e no procedimento de encolhimento de wavelets. Estamos interessados em analisar a longa dependência em sequência de DNA utilizando a metodologia de mudança de regimes, proposta por Liu (2000). Nesta metodologia, se a duração dos regimes de uma série temporal tem uma distribuição de caudas pesadas com parâmetro α ∈ (1, 2), então a série temporal apresenta a característica de longa dependência. Além disso, aplicando-se qualquer transformação linear que preserva a propriedade de variância finita na série temporal, igualmente preservará a propriedade de longa dependência. Por fim, estudamos as distribuições de distâncias das regiões codantes e não codantes em sequências de DNA. Concluímos que todas as técnicas apresentadas neste trabalho, para analisar longa dependência em série temporais, envolvendo conceitos de análise de flutuações destendenciadas, distribuições com caudas pesadas e encolhimento de wavelets, mostram a existência de longa dependência em todas sequências de DNA aqui estudadas. / The method of detrended fluctuation analysis (DFA), proposed by Peng et al. (1994), is useful in revealing the extent of long-range dependence in time series. Since there is not a specific rule for the choice of the numbers of regressors in DFA method, we present here an asymptotic optimal choice. For a fractional Gaussian noise, we prove the exact and the asymptotic Gaussian distributions for the bHDFA estimator. The most important parameter to estimate in a heavy-tailed data is the tail rate of decay α which determines the probability of occurrence of extreme values of the underlying distribution. Here we propose a novel estimator for α based on the empirical characteristic function and on the principal of wavelet shrinkage. Here we are interested in analyzing the long-range dependence in several DNA sequences, under the heavy-tail regime switching mechanism, proposed by Liu (2000). In this mechanism, if the duration of the regimes of a given time series has a heavy tail distribution with index parameter α ∈ (1, 2), then there is long-range dependence in this time series, and any functional transformation of the original time series preserving the property of finite variance, also preserves the property of long-range dependence. We also study the length distribution of coding and noncoding regions in DNA sequences. We conclude that all techniques presented in this paper to analyze longrange dependence in time series, involving concepts of detrended fluctuation analysis, heavy tail distributions and wavelet shrinkage, show the existence of long-range dependence in all DNA sequences studied here.

Identiferoai:union.ndltd.org:IBICT/oai:www.lume.ufrgs.br:10183/86626
Date January 2011
CreatorsLinhares, Raquel Romes
ContributorsLopes, Silvia Regina Costa
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UFRGS, instname:Universidade Federal do Rio Grande do Sul, instacron:UFRGS
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.002 seconds