Return to search

Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas

Workflows científicos são projetados para realizar experimentos in silico com o
intuito de processar e analisar uma grande quantidade de dados usando simulação
computacional. Os experimentos são organizados como uma sequência de etapas que
caracterizam um fluxo de execução, onde em cada etapa utilizam-se diferentes
softwares. Estes softwares não possuem um modelo de representação de dados comum.
Por isto, quando um workflow científico é construído com o objetivo de integrar e
processar dados, cada etapa precisa analisar a estrutura dos dados, processá-los e
preparar os mesmos de acordo com a estrutura necessária para a execução da próxima
etapa do workflow. Desta maneira, os workflows científicos usam diferentes algoritmos
provenientes das áreas da matemática e da ciência da computação, os quais são capazes
de processar, armazenar e transformar os dados utilizados em informação útil para
diferentes análises de pesquisadores de biologia. Adicionalmente, a biologia de sistemas
é uma subárea da bioinformática que ajuda a compreender as interações observadas
entre populações de moléculas, células e organismos resultantes do aumento da
complexidade biológica. Assim, nesta tese de doutorado, buscou-se desenvolver
workflows científicos utilizando-se ferramentas de bioinformática e biologia de sistemas
para comparar processos biológicos através da geração de redes de interação proteínaproteína.
Para tanto, o programa Dis2PPI foi gerado por meio de um workflow científico
que possibilitou integrar os bancos de dados de doenças monogênicas OMIM (Online
Mendelian Inheritance in Man) com o programa de metabuscas STRING (Search Tool
for the Retrieval of Interacting Genes/Proteins). O objetivo desta integração foi gerar
uma rede de interação proteína-proteína associada com doenças de natureza
monogênica. Como prova de conceito, o programa Dis2PPI foi utilizado para a
obtenção de redes de interação para as síndromes xeroderma pigmentosa e de Cockayne, duas doenças monogênicas raras e cujos fenótipos estão associados com
acúmulos de danos de DNA, câncer, progeria e neurodegeneração. Uma vez geradas,
estas redes foram avaliadas com o uso ferramentas de biologia de sistemas para análise
de ontologia gênica e de centralidade no programa Cytoscape. Da mesma forma, o
programa Net2Homology foi gerado através de um desenho de um workflow científico
que possibilitasse integrar o resultado de um alinhamento de sequências de proteínas,
usando o programa NCBI PSI-BLAST, com o programa de metabuscas STRING. Neste
sentido, o programa Net2Homology possibilitou recuperar duas redes de interação
proteína-proteína associada a dois organismos diferentes. Este mesmo programa foi
utilizado para a obtenção de redes de interação para a doença xeroderma pigmentosa e
para a enzima ciclo-oxigenase-1 cruzando as informações dos organismos Homo
sapiens e Mus musculus. As redes de interação obtidas foram comparadas visando obter
os processos biológicos evolutivamente conservados. / Submitted by Marcelo Teixeira (mvteixeira@ucs.br) on 2014-06-17T12:38:59Z
No. of bitstreams: 1
Tese Daniel Luis Notari.pdf: 7846140 bytes, checksum: ebfd645042f867b8840d5ab9083411bc (MD5) / Made available in DSpace on 2014-06-17T12:38:59Z (GMT). No. of bitstreams: 1
Tese Daniel Luis Notari.pdf: 7846140 bytes, checksum: ebfd645042f867b8840d5ab9083411bc (MD5) / Scientific workflows can be used to design in silico experiments to process and
analyse a great amount of data using computational simulation. In this sense, all in
silico experiments are organized as a sequence of steps that characterize an execution
flow, where each steps employ different softwares. It is important to note that these
softwares do not employ a common structure or model to represent data. Thus, taking
into account the diversity of softwares and data representation, a scientific workflow
should be built to integrate and process data, where each step must be able to analyse
the data structure, to process these data and finally generate a new data structure that
provide the requirements needed to execute the next step of the workflow. It is
important to note that scientific workflows use mathematics and computer sciences
methods capable to process, storage, and transform these data into useful information.
In addition, a subarea of Bioinformatics termed Systems biology helps to understand the
interactions observed between populations of molecules, cells and organisms as the
result of the increase of biological complexity. Thus, the purpose of this work was to
develop scientific workflows using bioinformatics and system biology softwares with
the purpose to compare different biological processes from the generation of proteinprotein
interaction (PPI) networks. In this sense, the Dis2PPI software was design as a
scientific workflow to integrate OMIM (Online Mendelian Inheritance in Man)
database with metasearch program STRING (Search Tool for the Retrieval of
Interacting Genes/Proteins) in order to retrieve protein-protein interaction networks
associated to monogenic diseases. The Dis2PPI was used to generate PPI networks for
xeroderma pigmentosum and cockayne syndromes, two rare monogenic diseases
associated with DNA damage, cancer, progeria, and neurodegeneration. The PPI
networks generated were analyzed with Cytoscape program and specific plugins that evaluate gene ontologies and centrality analysis. By its turn, Net2Homology program
was designed as a scientific workflow to integrate NCBI PSI-BLAST sequence
alignments with STRING metasearch program to recovery PPI networks associate with
two different species. In this sense, Net2Homology was used to obtain PPI network for
xeroderma pigmentosum disease and cyclooxigenase-1 enzyme by crossing Homo
sapiens and Mus musculus information. A comparison between these networks was
realized to verify the major evolutively conserved biological process.

Identiferoai:union.ndltd.org:IBICT/oai:vkali40.ucs.br:11338/694
Date12 December 2012
CreatorsNotari, Daniel Luís
ContributorsVerli, Hugo, Echeverrigaray, Sérgio, Ribeiro, Helena Graziottin, Bonatto, Diego
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Sourcereponame:Repositório Institucional da UCS, instname:Universidade de Caxias do Sul, instacron:UCS
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0034 seconds