Return to search

[en] A STUDY OF BIOSEQUENCE DATA COMPRESSION / [pt] UM ESTUDO DE COMPACTAÇÃO DE DADOS PARA BIOSSEQÜÊNCIAS

[pt] A família de algoritmos BLAST é a mais utilizada pelos
biólogos para a
busca de similaridade entre biosseqüências, e por esta
razão, melhoras nestes
algoritmos, em suas estruturas de dados ou em seus métodos
de acesso à
memória secundária são muito importantes para o avanço das
descobertas
biológicas. Nesta dissertação, foi estudada detalhadamente
uma versão do
programa BLAST, analisando as suas estruturas de dados e
os algoritmos que
as manipulam. Além disso, foram realizadas medições de
desempenho com o
intuito de identificar os possíveis gargalos de
processamento dentro das fases de
execução do BLAST. A partir das informações obtidas,
técnicas de compactação
de dados foram utilizadas como uma estratégia para redução
de acesso à
memória secundária com o objetivo de melhorar o desempenho
para a execução
do BLAST. Finalmente, foi gerada uma versão modificada do
BLAST no
ambiente Windows, na qual foi alterado diretamente o
código do programa. Os
resultados obtidos foram comparados com os resultados
obtidos na execução do
algoritmo original. / [en] The BLAST is the sequence comparison strategy mostly used
in
computational biology. Therefore, research on data
structures, secondary
memory access methods and on the algorithm itself, could
bring important
optimizations and consequently contributions to the area.
In this work, we study a
NCBI BLAST version by analyzing its data structures and
algorithms for data
manipulating. In addition, we collect performance data for
identifying processing
bottleneck in all the BLAST execution phases. Based on
this analysis, data
compress techniques were applied as a strategy for
reducing number of
secondary memory access operations. Finally, a modified
version of BLAST was
implemented in the Microsoft Windows environment, where
the program was
directly altered. Finally, an analysis was made over using
the results of execution
of original BLAST against modified BLAST.

Identiferoai:union.ndltd.org:puc-rio.br/oai:MAXWELL.puc-rio.br:9762
Date09 April 2007
CreatorsJANAINA OLEINIK MOURA ROSA
ContributorsSERGIO LIFSCHITZ
PublisherMAXWELL
Source SetsPUC Rio
LanguagePortuguese
Detected LanguagePortuguese
TypeTEXTO

Page generated in 0.0058 seconds