Na última década tem sido possível reconstruir o genoma de bactérias e arquéias presentes em comunidades microbianas de ambientes naturais a partir de dados metagenômicos. Isso tem revolucionado nosso entendimento sobre a topologia da árvore da vida e a descoberta de novas capacidades metabólicas, bem como auxiliado na identificação mais acurada de genes de interesse industrial, visto que os dados estão mais completos e menos fragmentados. Com base neste contexto, o objetivo geral deste projeto foi reconstruir o genoma de bactérias ligadas a degradação de biomassa vegetal em comunidades microbianas da compostagem, focando em análises de diversidade de enzimas de Glicosil Hidrolases (GHs), a partir de dados de sequências metagenômicas gerados no projeto temático processo 11/50870-6. Para alcançar os nossos objetivos, foram desenvolvidos pipelines computacionais com softwares já disponíveis na literatura e foram utilizados dois conjuntos principais de dados de sequenciamento massivo (um conjunto de dados seriados que engloba inúmeros estágios do processamento da compostagem e um conjunto de dados do metagenoma de um consórcio microbiano celulolítico e termofílico construído a partir de amostras da compostagem). Foram reconstruídos 13 genomas (sete genomas em amostras dos dados seriados e seis genomas na amostra do consórcio microbiano), sendo identificado no mínimo quatro novas espécies. As análises baseadas em filogenômica indicam a presença de pelo menos uma nova classe dentro do filo Firmicutes, uma nova espécie da família Paenibacillaceae e a reconstrução pela primeira vez do genoma da espécie Bacillus thermozeamaize. Também foram identificadas 33 lacunas/ilhas metagenômicas (IMs). Essas regiões apresentaram genes diretamente ligados a biossíntese de polissacarídeos do envelope celular, pseudogenes e proteínas hipotéticas. Algumas dessas proteínas estão diretamente ligadas ao reconhecimento de bacteríofagos durante a fase de infecção viral. A presença de IMs também indica uma divergência entre as populações microbianas presentes na compostagem com a espécie de referência. Quanto ao potencial de degradação de biomassa vegetal, todos os microrganismos apresentam genes com potencial para degradação de material lignocelulolítico durante o processamento de diferentes estágios da compostagem, indicando a importância do papel funcional dessas bactérias na compostagem. / In the last decade it has been possible to reconstruct Bacteria and Archaea genomes that are in natural microbial communities from metagenomic samples. This has revolutionized our understanding of the topology of the tree of life and the discovery of new metabolic functions, as well as aided in more accurate identification of industrial bioprospecting genes, since the genomic data are more complete and less fragmented. Based on this background, the aim of this project was to reconstruct the bacterial genomes linked to plant biomass degradation in composting communities, focusing on diversity analysis of Glycosyl Hydrolases (GHs) from metagenomic sequence data generated in the Thematic Project (Process 11/50870-6). To achieve our objectives, computational pipelines have been developed (this pipelines were based on software already available in the literature) and we use these pipelines in two massive data sets generated by high-throughput sequencing (one data set of time series compost sample which includes several stages of the composting process and other data set from a cellu- lolytic and thermophilic microbial consortium). Thirteen genomes were reconstructed (seven genomes from time series metagenomic data and six genomes from microbial consortium). At least four new species have been identified, and the analyzes based on phylogenomic inferences indicate the presence of at least one new class of Firmicutes phylum, and a new Paenibacillaceae family and the reconstruction for the first time the Bacillus thermozeamaize genome. They also identified 33 gaps/metagenomic Islands (IMs). These gaps had genes directly linked to polysaccharide biosynthesis of the cell envelope, pseudogenes and hypothetical proteins. Some of these proteins are directly linked to the bacteriophage during the recognition phase of viral infection. The presence of gaps also indicates a divergence between microbial populations present in the compost with the reference genome. All microbial genomes reconstructed in this studyhave genes linked to lignocellulolytic potential degradation during the different stages of composting process, indicating the functional role this bactéria in this environment.
Identifer | oai:union.ndltd.org:IBICT/oai:teses.usp.br:tde-07012016-094306 |
Date | 23 September 2015 |
Creators | Leandro Nascimento Lemos |
Contributors | João Carlos Setubal, Welington Luiz de Araujo, Vivian Helena Pellizari |
Publisher | Universidade de São Paulo, Bioinformática, USP, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Biblioteca Digital de Teses e Dissertações da USP, instname:Universidade de São Paulo, instacron:USP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0024 seconds