Return to search

GenSeed-HMM: desenvolvimento de uma plataforma para reconstrução de sequências e sua aplicação em dados de sequenciamento de nova geração. / GenSeed-HMM: development of a platform for sequence reconstruction and application on next-generation sequencing data.

O programa GenSeed, descrito previamente pelo nosso grupo, implementa um método de montagem progressiva dirigida por semente, o qual permite reconstruir sequências de DNA para montagem alvo-específicas partindo-se de sequências semente curtas de DNA ou proteína. Esse programa pode ser aplicado para a reconstrução de fragmentos genômicos, extracromossômicos e cDNAs, mas não é adequado para a reconstrução de sequências utilizando sementes e bases de dados derivadas de amostras heterólogas. O presente trabalho teve como objetivo o desenvolvimento do GenSeed-HMM, uma versão do GenSeed, capaz de utilizar HMMs de perfis como sementes para a reconstrução de sequências específicas, e de processar dados gerados pelas novas plataformas de sequenciamento, incluindo leituras curtas. Este trabalho relata a implementação do programa GenSeed-HMM, e sua validação utilizando dados reais de diferentes plataformas de sequenciamento, originados de procariotos, eucariotos, bem como de amostras metagenômicas. / The program GenSeed, previously described by our group, implements a seed-driven progressive assembly method for target-specific assembly of DNA sequences, starting from short DNA or protein seed sequences. The program can be applied for the reconstruction of genomic fragments, extrachromosomal genomes, and cDNAs, but is not adequate for sequence reconstruction using seed sequences and databases derived from heterologous samples. The present work aimed at developing GenSeed-HMM, a new version of GenSeed program that can use profile HMMs as seeds for the reconstruction of specific sequences, and incorporates the ability to work with data generated by the new sequencing platforms, including short reads. This work reports the implementation of GenSeed-HMM program and its validation using real life data produced by different next-generation sequencing platforms, and originated from prokaryotic, eukaryotic and metagenomic samples.

Identiferoai:union.ndltd.org:IBICT/oai:teses.usp.br:tde-09112012-111833
Date14 August 2012
CreatorsAndré Luiz de Oliveira
ContributorsArthur Gruber, Paulo Sérgio Lopes de Oliveira, Gerhard Wunderlich
PublisherUniversidade de São Paulo, Ciências (Biologia da Relação Patógeno-Hospedeiro), USP, BR
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Biblioteca Digital de Teses e Dissertações da USP, instname:Universidade de São Paulo, instacron:USP
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0028 seconds