Return to search

Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade

As sequências genômicas carregam uma ampla gama de informações sobre os organismos que a compõem. Obviamente, devido à grande semelhança destas informações e funções, espera-se que uma determinada sequência possa pertencer a muitos organismos, com probabilidades semelhantes. Entretanto, cada genoma carrega dentro de si certas peculiaridades que podem ser extraídas utilizando as ferramentas adequadas. Neste contexto, este trabalho propõe um processo de análise de sequências genômicas de bactérias, utilizando algumas medidas que são particularmente importantes: a entropia de triples (Sn), a quantificação da periodicidade 3 (P3) em uma sequência, o coeficiente de clusterização (D) e o percentual de GC. O processo aqui proposto nos permite inferir a qual organismo uma determinada sequência genômica pode pertencer, mostrando-se viável a sua utilização em metagenômica. Os resultados neste trabalho demonstram a eficácia deste método. Foram identificados 100% dos organismos presentes nas amostras estudadas (VP). Por outro lado, foi encontrado um grande número de organismos não pertencentes às amostras (FP), o que indica a grande similaridade de determinadas sequências, corroborando com alguns estudos que indicam que o genoma carrega consigo sequências órtologas, comuns a inúmeros organismos. / Submitted by Ana Guimarães Pereira (agpereir@ucs.br) on 2015-11-17T13:29:43Z
No. of bitstreams: 1
Tese Ricardo Augusto Manfredini.pdf: 3422485 bytes, checksum: f6111d39384f0d874a1c4820a7faf475 (MD5) / Made available in DSpace on 2015-11-17T13:29:43Z (GMT). No. of bitstreams: 1
Tese Ricardo Augusto Manfredini.pdf: 3422485 bytes, checksum: f6111d39384f0d874a1c4820a7faf475 (MD5) / Genomic sequences carry a wide range of information on organism that compose it. Obviously, by reason that great similarity of this information and functions, it is expected that each sequence can belong to many organisms with a similar probability. However, each genome carries within itself certain peculiarities that can be extracted using appropriate tools. In this context , this paper proposes a methodology for the analysis of genomic sequences of bacteria , using some measures that are particularly important : The entropy of triples ( Sn ) , the quantification of frequency 3 (P3) in a sequence , the clustering coefficient ( D ) and the percentage of GC . The method proposed here allows us to infer which a particular organism genome sequence may belong, being feasible for use in Metagenomics. The results of this study demonstrate the effectiveness of this method, 100 % of the organisms were identified in the samples studied (VP). On the other hand, a large number of bodies which did not belong samples were found (FP), which indicates the high similarity of certain sequences, corroborating some studies indicate that the genome carries ortholog sequences, common to countless organisms.

Identiferoai:union.ndltd.org:IBICT/oai:vkali40.ucs.br:11338/1061
Date27 April 2015
CreatorsManfredini, Ricardo Augusto
ContributorsFerreira, Henrique Bunselmeyer, Delamare, Ana Paula Longaray, Silva, Scheila de Ávila e, Echeverrigaray, Sérgio
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Sourcereponame:Repositório Institucional da UCS, instname:Universidade de Caxias do Sul, instacron:UCS
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0016 seconds