Metagenômica é a técnica que permite analisar os genomas de microorganismos que habitam determinados nichos do ambiente sem a necessidade de isolar e cultivar cada um separadamente. Ao conjunto de microorganismos que habita um determinado nicho se dá o nome de microbi- oma. Análises do perfil da diversidade taxonômica e funcional de comunidades microbianas em microbiomas são comuns em estudos de metagenômica. No entanto, atualmente as plata- formas de uso geral (como MG-RAST e IMG/M) tendem a separar as análises baseadas em reads (sequências não montadas) das baseadas em contigs (sequências montadas), isto dificulta as análises destes dados. Motivado por esta separação, desenvolvemos uma plataforma web, batizada de CARAVELA, que facilita a conexão entre os resultados de análises de diversidade taxonômica e funcional baseadas em reads e contigs respectivamente. Uma das principais fun- ções da plataforma CARAVELA é associar a identificação taxonômica de cada read com o contig que este read faz parte e, anotações funcionais do contig, quando existirem. Essa função deve permitir a rápida identificação de contigs potencialmente quiméricos bem como contigs taxonomicamente bem resolvidos. Também é possvel fazer buscas, tais como: listar todos os contigs que tenham um ou mais reads classificados como Pseudoxanthomonas suwonensis em sua composição e ainda, é possvel navegar nos contigs de maneira similar a navegadores de metagenomas tradicionais. Podem ser utilizados como arquivos de entrada a sada de outros programas, desde que o formato atenda certos padrões. A plataforma CARAVELA foi desenvol- vida com Java, HTML, CSS, Javascript e Mysql, e com o fim de testar a ferramenta, utilizamos o conjunto de dados metagnômicos obtidos a partir da operação de compostagem do Parque Zoológico de São Paulo. / The taxonomic diversity analysis (read-based) and functional analysis (contig / gene-based) from metagenomic studies usually generate information that is complementary. However, the tools that produce gene annotations (eg IMG / M) and taxonomic assignments (eg MyTaxa) do not allow easy integration of these results. Motivated by this split, we are develop a web platform called Caravela to facilitate the integration, search and visualization of information provided by read-based analyzes and contig / gene-based analyzes. The tool is able to display the list of contigs and for each contig, it displays annotated genes, reads participating in its composition and rate associated with each read (when such association exists). Such a capability enable manual / automated curation of assembly as well as taxonomic assignments (detection of possible mis-assignments). The platform able to accept output files from a variety of tools, as long as the file formats follow certain standards. The tests was performed on a dataset of metagenomic reads obtained from the composting operation of the São Paulo Zoological Park. The tool was implemented using Java technology, HTML, CSS and Javascript. Information was stored in a MySQL database.
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-26092017-075422 |
Date | 12 June 2017 |
Creators | Silva, Gianluca Major Machado da |
Contributors | Setubal, João Carlos |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | Portuguese |
Type | Dissertação de Mestrado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.0032 seconds