Return to search

Otimiza??es qualitativas e quantitativas nas fases de leitura e an?lise em pipelines metagen?micos

Made available in DSpace on 2015-04-14T14:49:55Z (GMT). No. of bitstreams: 1
444045.pdf: 8676416 bytes, checksum: 5dc6fddb810c5c4102aeef934f1d8983 (MD5)
Previous issue date: 2012-08-06 / Metagenomic sequencing technologies are advancing rapidly and the size of output data from high-throughput genetic sequencing has increased substantially over the years. Our optim?zations and performance evaluations are focused in some of the most critical and time-consuming steps of a metagenomic analys?s: pre-processing, taxonomic classification assignment and post-processing of classification results. Optimizations and functions were implemented and introduced in a new architecture, PANGEA+, based on the PANGEA metagenomic pipeline. The main improvements of the present tool are: support of new input file formats and NCBI taxonomy database, new species classification methods, consensus analysis, implementation of distributed memory (MPI) for species classification step, and low complexity optimizations for the post-processing of classification results. The evaluation of the new architecture, shows remarkable improvements in many features and, mainly, in the species classification accuracy and performance. / As tecnologias de sequenciamento metagen?mico tem avan?ado rapidamente e a quantidade de dados gerados a partir do sequenciamento em larga escala tem aumentado substancialmente ao longo dos anos. As presentes otimiza??es e avalia??es de desempenho tem foco em algumas das etapas mais cr?ticas e que consomem mais tempo em uma an?lise metagen?mica: pr?-processamento, classifica??o taxon?mica e p?s - processamento dos resultados de classifica??o. Otimiza??es e fun??es foram implementadas e introduzidas em uma nova arquitetura, PANGEA+, baseada no pipeline metagen?mico PANGEA. Os principais melhoramentos alcan?ados com a presente ferramenta foram: suporte a v?rios formatos de arquivos de entrada e a base de dados taxon?micos do NCBI, novos m?todos de classifica??o de esp?cies inclu?dos, an?lise consenso, implementa??o de mem?ria distribu?da para a fase de classifica??o de esp?cies, otimiza??es de baixa complexidade para o p?s-processamento dos resultados de classifica??o. A avalia??o da nova arquitetura, PANGEA+, demonstra melhoramentos consider?veis em v?rias funcionalidades e, principalmente, na etapa de classifica??o de esp?cies, tanto em exatid?o quanto em desempenho computacional.

Identiferoai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/5196
Date06 August 2012
CreatorsDias, Raquel
ContributorsRose, C?sar Augusto Fonticielha de
PublisherPontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, BR, Faculdade de Inform?ca
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS
Rightsinfo:eu-repo/semantics/openAccess
Relation1974996533081274470, 500, 600, 1946639708616176246

Page generated in 0.0486 seconds