Return to search

Comparação entre distância entrópica e distância genética para análise de sequências de DNA

Submitted by (ana.araujo@ufrpe.br) on 2016-08-02T15:07:16Z
No. of bitstreams: 1
Lucemberg de Araujo Pedrosa.pdf: 3265244 bytes, checksum: 674b5892ba98761c5fb9c4acb7dd8e2c (MD5) / Made available in DSpace on 2016-08-02T15:07:16Z (GMT). No. of bitstreams: 1
Lucemberg de Araujo Pedrosa.pdf: 3265244 bytes, checksum: 674b5892ba98761c5fb9c4acb7dd8e2c (MD5)
Previous issue date: 2013-07-29 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Due to the large amount of data that is generated in the area of molecular genetics the need of new fast and precise methods for data analysis is increasingly needed. In the present study we discuss the concept of entropy to analyse DNA sequences, where the notion of entropic distance is defined. In order to check its efficiency the Mantel test was performed, which makes the correlation between the two distances matrices, the entropic distance and the genetic distance in which the Jukes - Cantor (JC69) distance. Nine types of genetic sequences were analysed, first the gene BoLA, where was conducted a more detailed study, showing a descriptive statistics and performing the dendograms. Subsequently sequences of larger size were analyzed, the stingless bees Melipona quinquefasciata, and finaly a much larger sequence, the chromosome 5 of Homo Sapiens. 6 simulations were also conducted to verify the behavior of results, in each of these three analysis the alignment was performed before the JC69 distance. It was possible to obtain good results when used the conditional entropy, which was introduced the concept of entropy in blocks, the method proved to be more effective in very long sequences. / Diante da grande quantidade de dados que é gerada na área da genética molecular, sente-se cada vez mais a necessidade de novos métodos para análise dos dados de maneira rápida e precisa. Assim, no presente estudo abordamos o conceito de entropia para análise de sequências de DNA, onde utiliza-se a distância entrópica. Para verificar a sua eficiência foi realizado o teste de Mantel, que faz a correlação entre as duas matrizes de distâncias, a distância entrópica e a distância genética, na qual foi utilizada a distância de Jukes – Cantor (JC69). Foram analisadas nove tipos de sequências genéticas, primeiramente o gene BoLA, onde foi realizado um estudo mais detalhado, mostrando uma estatística descritiva e realizando os dendogramas. Posteriormente analisamos sequências de tamanho maiores, que foram as abelhas sem ferrão Melipona quinquefasciata, e em seguida analisamos sequências muito maiores, o cromossomo 5 do Homo Sapiens. Foram realizadas também 6 simulações para verificar o comportamento dos resultados, em cada uma dessas nove análises foi realizado o alinhamento antes da distância de JC69. Foi possível obter bons resultados quando utilizou-se entropia condicional, onde foi introduzido o conceito de entropia em blocos, o método mostrou ser mais eficiente em sequências de grande comprimento.

Identiferoai:union.ndltd.org:IBICT/oai:tede2:tede2/5156
Date29 July 2013
CreatorsPEDROSA, Lucemberg de Araújo
ContributorsOLIVEIRA JUNIOR, Wilson Rosa de, SANTORO, Kleber Régis, LUDEMIR, Teresa Bernarda, STOSIC, Tatijana
PublisherUniversidade Federal Rural de Pernambuco, Programa de Pós-Graduação em Biometria e Estatística Aplicada, UFRPE, Brasil, Departamento de Estatística e Informática
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UFRPE, instname:Universidade Federal Rural de Pernambuco, instacron:UFRPE
Rightsinfo:eu-repo/semantics/openAccess
Relation768382242446187918, 600, 600, 600, 600, -6774555140396120501, -5836407828185143517, 2075167498588264571

Page generated in 0.0023 seconds