A comparação de genomas, genes ou até sequências de nucleotídeos não condificantes é uma importante tarefa na qual a bioinformática pode ser aplicada, uma vez que ela auxiliar em diversas atividades, por exemplo, análises filogenéticas. Análise filogenética, por sua vez, busca analisar a relação evolutiva de cada espécie, considerando suas características genéticas. Esses processos e as técnicas que os implementam se baseiam em sequências de nucleotídeos sequenciadas e armazenadas em bancos de dados de genomas públicos. Com análise filogenética também é possível identificar possíveis origens de um gene. Essa tarefa é de grande importância, pois auxilia na identificação da origem de genes patogênicos, podendo auxiliar no combate e prevenção do surgimento de doenças. Um problema potencial dessas sequências é a possibilidade de haver erros nas anotações (marcações de sequências como genes). Esses erros são pouco explorados por pesquisadores atualmente. Outro tema pouco explorado é a análise filogenética de genes exclusivos, que são genes que se manifestam em apenas uma espécie, considerando um grupo de espécies próximas. A identificação de genes exclusivos de alguma espécie pode servir para a correta identificação de, por exemplo, a espécie que causa uma doença, de forma a permitir o uso do tratamento mais específico e adequado. A importância da descoberta de filogenias de genes exclusivos e a dificuldade de garantir a consistência nas anotações genéticas motivaram este trabalho, que teve como objetivo implementar ferramentas para interpretar dados de comparação genética, identificando potenciais erros em anotação de genes exclusivos e criando estratégias para identificar a origem desses genes. As origens de genes exclusivos exploradas neste trabalho envolvem a possibilidade dos genes exclusivos terem derivado de outras famílias de genes do próprio organismo, ou, os genes exclusivos se diferenciaram muito dos genes ancestrais. Essas hipóteses, juntamente com a hipótese da existência de erros de anotação, foram exploradas em experimentos utilizando as ferramentas desenvolvidas. Os experimentos visaram a analisar a aplicabilidade da estratégia desenvolvida. Foram utilizados genomas de bactérias do gênero Xanthomonas, que contém um grande grupo de bactérias que causam doenças em plantas. Os resultados obtidos demonstram que existe uma quantidade considerável de potenciais erros de anotação nos genomas considerados, provando a hipótese de que a inconsistência nas anotações genômicas possui grande influência para a dificuldade na identificação de filogenias (tanto de genes exclusivos como para não exclusivos). Os resultados também demonstraram que boa parte dos genes exclusivos possivelmente se originaram de outras famílias de genes do próprio genoma. Ou ainda, que esses genes sofreram modificações em relação aos genes ancestrais, mas ainda possuem certas semelhanças com sequências de nucleotídeos que não codificam genes em outras espécies mais distantes. Por fim, a estratégia desenvolvida se mostrou útil na análise filogenética das bactérias estudadas, sendo este um forte indício de que a mesma abordagem pode ser utilizada para problemas similares com outras espécies de seres vivos / Comparison of genomes, genes or even non-coding nucleotide sequences is an important task in which bioinformatics can be applied, since it allows the application of phylogenetic analyses. Phylogenetic analysis, in its turn, seeks to analyze the evolutionary relation of each species, considering its genetic characteristics. These processes and the techniques that implement them are based on nucleotide sequences sequenced and stores in databases of public genomes. With phylogenetic analysis it is also possible to identify possible origins of a gene. This task has a great importance, because it allows the identification of the origin of pathogenic genes, which may help to combat or prevent deseases. A potencial problem of these sequences is the possibility of having annotation errors (sequences marking as genes). These errors are little explored by researchers nowadays. Another unexplored topic is the phylogenetic analysis of exclusive genes, which are genes thaht manifest in only one species, considering a group of nearby species. The identification of exclusive genes of a species may serve to correctly identify, for example, a desease, in order to allow the use of a more especific and appropriate treatment. The importance of discovering phylogenies of exclusive genes and the difficulty of guaranteeing the consistency of genetic annotations motivated this work, whose objective was to implement tools to interpret data of genetic comparison, identifying annotation errors in exclusive genes and creating strategies to identify the origin of these genes.The origins of exclusive genes explored in this work involve the possibility of the exclusive genes have derived of other gene families of the organism itself, or, the exclusive genes differed a lot from the ancestral genes. Theses hypotheses, with the hypotesis of the existance of annotation errors, were explored in experiments using the developed tools. The experiments aimed to analyse the applicability of the developed strategy. Genomes of bacteria of the genus Xanthomonas were used, which contains a large group of bacteria that cause diseases in plants. The results show that there is a considerable amount of annotation errors on the genomes, proving the hypothesis that the inconsistency in genomic annotations has a great influence on the difficulty in identifying phylogenies (both exclusive and non-exclusive genes). The results also show that much of exclusive genes possibly originated from other gene families of the genome itself. Furthermore, these genes may have sufferedmodifications in relation to the ancestral genes, but still have certain similarities with nucleotide sequences that don\'t encode genes in other more distant species. Finally, the strategy developed proved useful on phylogenetic analysis of the studied bacteria, which is a strong indication that the same approach can be used for similar problems with other species of living beings
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-24052018-175017 |
Date | 26 March 2018 |
Creators | Wagner, Priscilla Koch |
Contributors | Digiampietri, Luciano Antonio |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | Portuguese |
Type | Dissertação de Mestrado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.0026 seconds