Return to search

Genômica comparativa de Microcystis aeruginosa (Cyanobacteria: Chroococcales), com ênfase em genes envolvidos com síntese de produtos naturais / Comparative genomics of Microcystis aeruginosa (Cyanobacteria: Chroococales), with emphasis on genes related to natural product synthesis

A ampla diversidade metabólica das cianobactérias é associada não somente a sua importância nos ciclos biogeoquímicos, mas também a sua distribuição global. Tal característica também é responsável pela capacidade destes organismos em produzir uma ampla variedade de substâncias de estruturas incomuns e atividades de interesse para o homem. Microcystis é um gênero cianobacteriano reconhecido como produtor de mais de duas centenas de produtos naturais, incluindo cianotoxinas. Microcystis aeruginosa é uma espécie frequentemente encontrada em florações, portanto causando preocupações sobre sua influência ecológica, especialmente em corpos d\'água doce utilizados para consumo humano. Desta forma, o objetivo deste trabalho foi o levantamento da diversidade e quantidade de metabólitos secundários que podem ser produzidos pela espécie, através de análises genômicas, além de variáveis que podem potencialmente interferir nas análises computacionais, procurando-se por padrões na espécie, e comparando-se 18 linhagens de todos os continentes. Foi encontrado o total de 235 agrupamentos relacionados ao metabolismo secundário, categorizados em 12 classes segundo as estruturas de seus produtos, nas 18 linhagens, evidenciando a riqueza de agrupamentos relacionados ao metabolismo secundário encontrados nesta espécie. Destes agrupamentos, os mais abundantes pertencem às categorias dos Terpenos, Híbridos, Bacteriocinas e NRPS. Entre as NRPS, nenhuma foi comum a todas as linhagens. Ainda, a quantidade de agrupamentos variou entre 6 e 21, e a quantidade de categorias de produtos variou entre 4 e 10, mostrando uma distribuição heterogênea de agrupamentos e tipos de metabólitos preditos. Esta distribuição heterogênea foi detalhada para melhor compreensão deste padrão encontrado na espécie. Dos agrupamentos de NRPS, os três mais frequentes foram selecionados para uma análise pormenorizada de sua estrutura e sequência: aeruginosina (15 linhagens), microcistina (11 linhagens), e micropeptina (15 linhagens). O agrupamento de micropeptina encontrado nas linhagens SPC777, TAIHU98 e PCC 9806 se mostrou amplamente dissimilar com relação à referência utilizada, potencialmente indicando um erro de identificação causado pela plataforma antiSMASH utilizada para a localização dos agrupamentos. Análises de colinearidade genômica mostram uma baixíssima sintenia entre os genomas das linhagens em análise, sugerindo frequentes eventos de reorganização genômica. Ainda, análises de pangenoma mostram um cenário em que mais genomas desta espécie são necessários para a estimativa da quantidade total de genes diferentes que a espécie pode possuir, o que é interessante para futuros estudos de procura de metabólitos secundários. Análises do genoma cerne apontam para uma estimativa segura de 1.944 genes comuns a todos os genomas desta espécie, o que corresponde entre 35% e 50% dos genes em cada linhagem. Análises estatísticas apontam para diferentes graus de interferência não linear da quantidade de sequências contíguas na observação de diferentes padrões de outras características genômicas, sugerindo precaução nas expectativas com relação ao metabolismo secundário em caso de linhagens em que a montagem gênica ultrapasse o limite superior aproximado de 100 sequências contíguas. / The wide metabolic diversity of cyanobacteria is associated not only with their importance in biogeochemical cycles, but also with their global distribution. Such a feature is also responsible for the ability of these organisms to produce a wide variety of substances with unusual structures and activities of interest to man. Microcystis is a cyanobacterial genus recognized as a producer of more than two hundred natural products, including cyanotoxins. Microcystis aeruginosa is a species frequently found in cyanobacterial blooms, thus causing concerns about its ecological influence, especially in freshwater bodies used for human consumption. In this way, the objective of this work was the survey of the diversity and quantity of secondary metabolites that can be produced by the species, through genomic analyzes, besides variables that can potentially interfere in the computational analyzes, searching for patterns in the species, and comparing 18 strains from all the continents. A total of 235 clusters, categorized in 12 classes according to the structure of their products, were found in the 18 strains, evidencing the richness of clusters related to the secondary metabolism found in this species. Of these clusters, the most abundant belong to the categories of Terpenes, Hybrids, Bacteriocins and NRPS. Among NRPS, none were common to all strains. Also, the number of groups ranged from 6 to 21, and the number of product categories ranged from 4 to 10, showing a heterogeneous distribution of predicted groupings and types of metabolites. Such a heterogeneous distribution was detailed for a better understanding of this pattern found in the species. Of the NRPS clusters, the three most frequent were selected for a detailed analysis of their structure and sequence: aeruginosin (15 strains), microcystin (11 strains), and micropeptin (15 strains). The micropeptide cluster found in the SPC777, TAIHU98 and PCC 9806 strains was widely dissimilar to the reference, só potentially indicating an identification error caused by the antiSMASH platform used to locate the clusters. Genomic collinearity analyzes showed a very low synteny among the genomes of the strains under analysis, suggesting frequent events of genomic reorganization. Also, pangenome analyzes show a scenario in which more genomes of this species are needed for the estimation of the total amount of different genes the species may possess, which is interesting for future studies conserning secondary metabolites. Coregenome analyzes point to a reliable estimate of 1,944 genes common to all genomes of this species, which corresponds to 30% up to 50% of the genes in each strain. Statistical analyzes point to different degrees of non-linear interference of the number of contiguous sequences on the observation of different patterns of other genomic characteristics, suggesting necessary caution about expectations regarding the secondary metabolism in case of strains in which the gene assembly exceeds the approximate upper limit of 100 contiguous sequences.

Identiferoai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-15082017-173620
Date04 April 2017
CreatorsWeiss, Bruno
ContributorsFiore, Marli de Fatima
PublisherBiblioteca Digitais de Teses e Dissertações da USP
Source SetsUniversidade de São Paulo
LanguagePortuguese
Detected LanguageEnglish
TypeDissertação de Mestrado
Formatapplication/pdf
RightsLiberar o conteúdo para acesso público.

Page generated in 0.0233 seconds