Return to search

Bioinformática e biogeografia para buscar produtos naturais em metagenomas / Bioinformatics and biogeography to mine natural products in metagenomes

Os produtos naturais microbianos (NP) tem demonstrado ser inestimáveis pontos de partida na descoberta e desenvolvimento de medicamentos aprovados pelo FDA. A abordagem tradicional para a identificação de produtos naturais microbianos exige a cultura em laboratório. Infelizmente, os métodos convencionais baseados nesta metodologia foram desestimulados devido a altas taxas de redescoberta de moléculas. Os métodos independentes de cultura que se baseiam no sequenciamento do metagenoma microbiano sugerem a ocorrência de um enorme reservatório inexplorado de clusters biossintéticos de produtos naturais (BGCs) no meio ambiente. Neste trabalho utilizamos uma metodologia baseada em PCR e barcoding amplicon-sequencing para buscar importantes famílias de produtos naturais como peptídeos não ribossomais (NRP), ácido 3-amino-5-hidroxibenzóico (AHBA), dímeros de triptofano (TD), policetídeos, aminoglicosídeos e outros. Para isto desenvolvemos um script chamado SecMetPrimer que nos permitiu bioinformaticamente desenhar conjuntos de primers contendo um gradiente de degenerâncias. No total, desenhamos 165 conjuntos de primers. Os amplicons foram obtidos por PCR padrão, tendo sido concatenados barcodes específicos por amostra e sequenciados através de Illumina MiSeq. Para validar, utilizamos eDNA (environmental DNA) de bibliotecas metagenômicas, totalizando 223 milhões de clones. Através das análises bioinformáticas, as curvas de rarefação foram calculadas e a diversidade para cada família foi determinada. Foi realizada uma reamplificação dos domínios de adenilação de peptídeo não ribossomal e domínios de cetosintase de policetídeos utilizando eDNA isolado de 25 amostras diferentes coletadas em Mata Atlântica, Cerrado e ambiente marinho. Nossos dados indicaram a correlação entre distância geográfica e o tipo ecológico dos biomas. Deste modo, foi possível assim atribuir genes relacionados à clusters biossintéticos que codificam importantes produtos naturais à informações taxonômicas e metabólicas. Deste modo identificamos os melhores hotspots para busca de diversidade biossintética dentre as amostras analisadas. / Microbial natural products (NP) have proven to be invaluable starting points in the discovery and development of many drugs approved by FDA. The traditional approach to identify microbial natural products requires the culturing in the laboratory. Unfortunately, conventional culture-based methods have been deemphasized due to high rediscovery rates. Culture-independent methods applying microbial (meta)genome sequencing suggest the occurrence of an enormous untapped reservoir of natural-product-encoding biosynthetic gene clusters (BGCs) in the environment. Here we have used a PCR-based approach and barcoding ampliconsequencing derived from important families of microbial natural products such as nonribosomal peptides (NRP), polyketides (PK), 3-amino-5-hydroxybenzoic acidcontaining NPs (AHBA), tryptophan dimmers (TD), aminoglycosides, phosphonocontaining NPs and others. We have written an internal script called SecMetPrimer that allowed us to bioinformatically design sets of primers containing a range of degeneracy to amplify these genes. At the total, we designed 165 different sets of primers. The amplicons were obtained by standard PCR containing double-barcodedtarget primers and sequenced by Illumina MiSeq platform. The validation process was conducted using eDNA from metagenomic libraries containing a 223 millions of clones. The rarefaction and diversity analyses were assigned, and the best-hit primer for each family was chosen. We have re-amplified the nonribosomal peptide adenylation domains and polyketide ketosynthase domains, using as substrate environmental DNA isolated from 25 different samples collected in Atlantic Forest, Cerrado and marine environment. Our data indicate a correlation between geographic distance and biome-type, and the biosynthetic diversity found in these environments. Thus, by assigning reads to known BGCs against taxonomic and metabolic profiles, we have identified the hotspots of relevant biosynthetic diversity among the analyzed samples.

Identiferoai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-22052018-163525
Date14 December 2017
CreatorsFrias, Ulysses Amâncio de
ContributorsPupo, Monica Tallarico
PublisherBiblioteca Digitais de Teses e Dissertações da USP
Source SetsUniversidade de São Paulo
LanguagePortuguese
Detected LanguagePortuguese
TypeTese de Doutorado
Formatapplication/pdf
RightsReter o conteúdo por motivos de patente, publicação e/ou direitos autoriais.

Page generated in 0.0025 seconds