Return to search

Política de armazenamento de dados em nuvens federadas para dados biológicos

Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2014. / Submitted by Ana Cristina Barbosa da Silva (annabds@hotmail.com) on 2014-11-20T16:39:03Z
No. of bitstreams: 1
2014_RicardoFernandesGallon.pdf: 1641798 bytes, checksum: 0acfed544c445d0bab511a4a677e857c (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2014-11-24T15:14:24Z (GMT) No. of bitstreams: 1
2014_RicardoFernandesGallon.pdf: 1641798 bytes, checksum: 0acfed544c445d0bab511a4a677e857c (MD5) / Made available in DSpace on 2014-11-24T15:14:24Z (GMT). No. of bitstreams: 1
2014_RicardoFernandesGallon.pdf: 1641798 bytes, checksum: 0acfed544c445d0bab511a4a677e857c (MD5) / A computação em nuvem tem possibilitado a integração de diversos provedores para a execução de tarefas de forma mais rápida em comparação a utilização dos modelos anteriores,e uma visão ao usuário de que os recursos de armazenamento e processamento são ilimitados. A Bioinformática, que lida com grande volume de informações, pode utilizar-se da infraestrutura de computação em nuvem para disponibilizar suas ferramentas,para serem utilizadas nos fluxos de trabalhos, chamados workflows. Além disso, as instituições podem associar-se a outras instituições para formar uma federação de nuvens computacionais, proporcionando maior flexibilidade na escolha de provedores de serviço.Neste contexto, o desempenho da execução de workflows de Bioinformática é fortemente afetado pelo armazenamento e recuperação de dados, devido ao grande volume de informações das sequências genômicas. Desta forma, a escolha da melhor nuvem para estas operações é fundamental para a eficiência da execução do workflow. O presente trabalho tem por objetivo propor uma política de armazenamento de dados genômicos para nuvens computacionais federadas buscando, através da definição de alguns critérios de seleção e estratégias, diminuir o tempo de transferência dos dados e assim contribuir para a diminuição do tempo total de execução do workflow. Foi realizado um estudo de caso, com dados reais, utilizando a plataforma BioNimbuZ[1], que é uma arquitetura para execução de workflows de bioinformática no ambiente de nuvens federadas. Com os resultados obtidos, foi possível determinar o peso de cada critério da política de armazenamento e realizar as análises em relação a política originalmente criada para a arquitetura. Desta forma, a política de armazenamento proposta apresentou ganhos quanto a eficiência, principalmente em nuvens com grande poder computacional. ________________________________________________________________________________ ABSTRACT / Cloud computing has enabled the integration of providers to perform tasks faster, and has allowed users to view the processing and storage resources as unlimited. Bio informatics, which handles large volume of information produced by high-throughput sequencing machines, may use the infrastructure of cloud computing to provide tools to be used in workflows. In addition, institutions may join other institutions to form a federation of computing clouds, providing greater flexibility in the choice of service providers. In this context, the performance of the implementation of a workflow is strongly affected by the storage and retrieval of data, due to the large amount of information from genomic sequences. Thus, choosing the best cloud for these operations is critical to the efficiency of the workflow. This work aims to propose a policy for the storage of genomic data for federated cloud computing seeking, by defining some selection criteria and strategies, toreduce the time of data transfer and thus contribute to the reduction of total execution time of the workflow. A case study was carried out with real data, using BioNimbuZ platform, which is an architecture for the implementation of bioinformatics workflows infederated cloud environments. With the results obtained, it was possible to determine the weight of each storage policy criteria and perform the analysis regarding the policy originally created for the architecture. Thus, the storage policy proposal presented efficiency gains, especially in clouds with great computing power.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/17003
Date07 July 2014
CreatorsGallon, Ricardo Fernandes
ContributorsAraújo, Aletéia Patrícia Favacho de, Holanda, Maristela Terto de
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB
RightsA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data., info:eu-repo/semantics/openAccess

Page generated in 0.0023 seconds