Return to search

Otimização de periodicidades fracas em genomas utilizando transformadas de Fourier e algoritmos genéticos.

Programa de Pós-Graduação em Biotecnologia. Núcleo de Pesquisas em Ciências Biológicas, Pró-Reitoria de Pesquisa e Pós Graduação, Universidade Federal de Ouro Preto. / Submitted by Oliveira Flávia (flavia@sisbin.ufop.br) on 2014-12-09T15:49:52Z
No. of bitstreams: 1
DISSERTAÇÃO_OtimizaçãoPeriodicidadesFracas.pdf: 2409585 bytes, checksum: f6c5582e68fe17edc6d95f5b2a5c8edc (MD5) / Approved for entry into archive by Gracilene Carvalho (gracilene@sisbin.ufop.br) on 2014-12-09T20:19:36Z (GMT) No. of bitstreams: 1
DISSERTAÇÃO_OtimizaçãoPeriodicidadesFracas.pdf: 2409585 bytes, checksum: f6c5582e68fe17edc6d95f5b2a5c8edc (MD5) / Made available in DSpace on 2014-12-09T20:19:36Z (GMT). No. of bitstreams: 1
DISSERTAÇÃO_OtimizaçãoPeriodicidadesFracas.pdf: 2409585 bytes, checksum: f6c5582e68fe17edc6d95f5b2a5c8edc (MD5)
Previous issue date: 2013 / Transformadas de Fourier discretas e os seus espectros de potˆencia associados são utilizados em biologia molecular e na bioinformática para a detecção de periodicidades e regiões codificastes no DNA. Tipicamente, o genoma primeiramente é mapeado para uma série numérica, então é feita sua transformada de Fourier, que será monitorada em busca de periodicidades biologicamente relevantes. A detecção de uma determinada periodicidade é criticamente dependente da forma como o genoma foi convertido numa sequência numérica. Uma vez que existem inúmeras maneiras de se mapear uma sequência de DNA, periodicidades biologicamente importantes podem passar despercebidas. Aqui apresentamos um método que utiliza um algoritmo genético para otimizar o mapeamento numérico que maximizará um pico em dada frequência do espectro de potências de Fourier. Nós mostramos que o método tem a capacidade de detectar periodicidades fracas que são normalmente perdidas com esquemas de mapeamento tradicionais, e dessa forma, aumenta em muito a sensibilidade de técnicas baseadas na transformada de Fourier discreta. Para exemplificar o uso deste novo método, nós o aplicamos para encontrar as periodicidades de 3 e 10 nucleotídeos em trechos dos genomas do Plasmodium falciparum e Drosophila melanogaster, além de aplicá-lo também em sequências promotoras de Homo sapiens, que foram recentemente analisadas para a detecção do período de 10 nucleotídeos. Trabalhos anteriores publicaram afirmações conflitantes sobre a presença desta periodicidade em torno dos sítios de iniciação de transcrição (TSS) de promotores humanos. Nós mostramos que esta periodicidade está realmente presente nessas sequências e também que o nosso método é robusto e eficiente para descobrir periodicidades fracas em genomas. ______________________________________________________________________________________________ / ABSTRACT: Discrete Fourier transforms and their associated power spectra are used in molecular biology and bioinformatics for detecting periodicities and protein-coding genes. Typically, the genome is mapped into a numerical series which is Fourier-transformed and monitored for biologically relevant periodicities. The detection of a given periodicity is critically dependent on how the genome was converted into a numerical sequence. Since there are numerous ways of mapping the sequence, biologically important periodicities may go undetected. Here we present a method which employs a genetic algorithm to detect periodicities by optimising a given frequency peak of the Fourier power spectrum. We show that the method has the capability of detecting weak periodicities which are ordinarily missed with traditional mapping schemes, therefore greatly enhancing the sensitivity of discrete-Fourier-transform based techniques. To exemplify the use of this new method we apply it to find periodicities of 3 and 10 nucleotides on the Plasmodium falciparum and Drosophila melanogaster genomes and Homo sapiens promoter sequences, which were recently analysed for the detection of period 10. Previous works made confliting assertions about the presence of this periodicity around human TSS. We show that this periodicity is indeed present in these sequences and show that our method is robust and efficient to uncover weak periodicities in genomes.

Identiferoai:union.ndltd.org:IBICT/oai:localhost:123456789/4112
Date January 2013
CreatorsNunes, Míriam Celi de Souza
ContributorsWeber, Gerald
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFOP, instname:Universidade Federal de Ouro Preto, instacron:UFOP
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0027 seconds