Global ETD Search

Return to search

Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade

As sequências genômicas carregam uma ampla gama de informações sobre os organismos que a compõem. Obviamente, devido à grande semelhança destas informações e funções, espera-se que uma determinada sequência possa pertencer a muitos organismos, com probabilidades semelhantes. Entretanto, cada genoma carrega dentro de si certas peculiaridades que podem ser extraídas utilizando as ferramentas adequadas. Neste contexto, este trabalho propõe um processo de análise de sequências genômicas de bactérias, utilizando algumas medidas que são particularmente importantes: a entropia de triples (Sn), a quantificação da periodicidade 3 (P3) em uma sequência, o coeficiente de clusterização (D) e o percentual de GC. O processo aqui proposto nos permite inferir a qual organismo uma determinada sequência genômica pode pertencer, mostrando-se viável a sua utilização em metagenômica. Os resultados neste trabalho demonstram a eficácia deste método. Foram identificados 100% dos organismos presentes nas amostras estudadas (VP). Por outro lado, foi encontrado um grande número de organismos não pertencentes às amostras (FP), o que indica a grande similaridade de determinadas sequências, corroborando com alguns estudos que indicam que o genoma carrega consigo sequências órtologas, comuns a inúmeros organismos. / Submitted by Ana Guimarães Pereira (agpereir@ucs.br) on 2015-11-17T13:29:43Z
No. of bitstreams: 1
Tese Ricardo Augusto Manfredini.pdf: 3422485 bytes, checksum: f6111d39384f0d874a1c4820a7faf475 (MD5) / Made available in DSpace on 2015-11-17T13:29:43Z (GMT). No. of bitstreams: 1
Tese Ricardo Augusto Manfredini.pdf: 3422485 bytes, checksum: f6111d39384f0d874a1c4820a7faf475 (MD5) / Genomic sequences carry a wide range of information on organism that compose it. Obviously, by reason that great similarity of this information and functions, it is expected that each sequence can belong to many organisms with a similar probability. However, each genome carries within itself certain peculiarities that can be extracted using appropriate tools. In this context , this paper proposes a methodology for the analysis of genomic sequences of bacteria , using some measures that are particularly important : The entropy of triples ( Sn ) , the quantification of frequency 3 (P3) in a sequence , the clustering coefficient ( D ) and the percentage of GC . The method proposed here allows us to infer which a particular organism genome sequence may belong, being feasible for use in Metagenomics. The results of this study demonstrate the effectiveness of this method, 100 % of the organisms were identified in the samples studied (VP). On the other hand, a large number of bodies which did not belong samples were found (FP), which indicates the high similarity of certain sequences, corroborating some studies indicate that the genome carries ortholog sequences, common to countless organisms.

https://repositorio.ucs.br/handle/11338/1061

Identifer	oai:union.ndltd.org:IBICT/oai:vkali40.ucs.br:11338/1061
Date	27 April 2015
Creators	Manfredini, Ricardo Augusto
Contributors	Ferreira, Henrique Bunselmeyer, Delamare, Ana Paula Longaray, Silva, Scheila de Ávila e, Echeverrigaray, Sérgio
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	Portuguese
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Source	reponame:Repositório Institucional da UCS, instname:Universidade de Caxias do Sul, instacron:UCS
Rights	info:eu-repo/semantics/openAccess

Page generated in 0.0016 seconds

Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade

Description

Links & Downloads

Tags

Additional Fields