Return to search

GenSeed-HMM: desenvolvimento de uma plataforma para reconstrução de sequências e sua aplicação em dados de sequenciamento de nova geração. / GenSeed-HMM: development of a platform for sequence reconstruction and application on next-generation sequencing data.

O programa GenSeed, descrito previamente pelo nosso grupo, implementa um método de montagem progressiva dirigida por semente, o qual permite reconstruir sequências de DNA para montagem alvo-específicas partindo-se de sequências semente curtas de DNA ou proteína. Esse programa pode ser aplicado para a reconstrução de fragmentos genômicos, extracromossômicos e cDNAs, mas não é adequado para a reconstrução de sequências utilizando sementes e bases de dados derivadas de amostras heterólogas. O presente trabalho teve como objetivo o desenvolvimento do GenSeed-HMM, uma versão do GenSeed, capaz de utilizar HMMs de perfis como sementes para a reconstrução de sequências específicas, e de processar dados gerados pelas novas plataformas de sequenciamento, incluindo leituras curtas. Este trabalho relata a implementação do programa GenSeed-HMM, e sua validação utilizando dados reais de diferentes plataformas de sequenciamento, originados de procariotos, eucariotos, bem como de amostras metagenômicas. / The program GenSeed, previously described by our group, implements a seed-driven progressive assembly method for target-specific assembly of DNA sequences, starting from short DNA or protein seed sequences. The program can be applied for the reconstruction of genomic fragments, extrachromosomal genomes, and cDNAs, but is not adequate for sequence reconstruction using seed sequences and databases derived from heterologous samples. The present work aimed at developing GenSeed-HMM, a new version of GenSeed program that can use profile HMMs as seeds for the reconstruction of specific sequences, and incorporates the ability to work with data generated by the new sequencing platforms, including short reads. This work reports the implementation of GenSeed-HMM program and its validation using real life data produced by different next-generation sequencing platforms, and originated from prokaryotic, eukaryotic and metagenomic samples.

Identiferoai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-09112012-111833
Date14 August 2012
CreatorsOliveira, André Luiz de
ContributorsGruber, Arthur
PublisherBiblioteca Digitais de Teses e Dissertações da USP
Source SetsUniversidade de São Paulo
LanguagePortuguese
Detected LanguagePortuguese
TypeDissertação de Mestrado
Formatapplication/pdf
RightsLiberar o conteúdo para acesso público.

Page generated in 0.0028 seconds