Return to search

GENNET : uma abordagem automatizada na análise, reconstrução e gerenciamento de redes de interações gênicas utilizando dados longitudinais de transcriptomas de hospedeiros / GENNET : an automated approach in the analysis,reconstruction and managing of genetic interactions networks using transcriptome longitudinal data of siv host

Submitted by Maria Cristina (library@lncc.br) on 2015-04-07T14:04:08Z
No. of bitstreams: 1
thesis_RLC.pdf: 14146223 bytes, checksum: 3e764cd68f4c65f0572940fb339e5708 (MD5) / Approved for entry into archive by Maria Cristina (library@lncc.br) on 2015-04-07T14:04:34Z (GMT) No. of bitstreams: 1
thesis_RLC.pdf: 14146223 bytes, checksum: 3e764cd68f4c65f0572940fb339e5708 (MD5) / Made available in DSpace on 2015-04-07T14:04:50Z (GMT). No. of bitstreams: 1
thesis_RLC.pdf: 14146223 bytes, checksum: 3e764cd68f4c65f0572940fb339e5708 (MD5)
Previous issue date: 2014-10-31 / Recent developments in molecular assays to study the transcriptome associated with statistical, mathematics and computational methods, introduced great advances in the comprehension of biological systems, in understanding the viral infectious process
associated with immune response and the choice of targets for the development of vaccines and antiviral therapies.
On one hand side, the modelling process involves different stages, including transcriptome acquisition, the integration with information available in biological databases and the visualization and analysis of networks therein obtained.
On the other hand side, during the modelling process, many software systems are employed with differences in structure, design assumptions and heterogeneity in input data, making the whole analysis process, besides laborious and fragmented, error-prone.
In this context, infrastructure to support e-science such as scientific workflows and databases are used in automating, structuring, execution, organization and management of scientific experiments in silico.
In this thesis, we studied gene expression data (DNA microarray) of primates infected with SIV (Simian Virus Imunodeficiency) composing a time-series reflecting the evolution of infection.
SIV infects more than 40 species in African continent that are known as natural hosts, as they do not develop the immunodeficiency syndrome (AIDS). However, when SIV strains infect non African primates, known as non-natural hosts, among them Asian rhesus monkey (Macaca mulatta), they develop a syndrome similar to the human immunodeficiency virus HIV.
The evolutionary closeness of the virus, SIV and HIV, and between the hosts, human and non-human primates, enables biological studies in non-human models relevant to understanding the biological mechanisms of various innate and adaptive immunity in
the host.
Thus, we used data corresponding to sampling points in three different stages of SIV infection: before infection, acute and chronic phases of infection.
Data process analysis was based on systems biology approaches. These analyzes included steps such as, data normalization, filtering, annotation, clustering, enrichment, interactions biological database and visualizations of the results in gene interaction networks.
Among the main biological results, we selected: identification of co-expressed genes; functional characterization profiles from ontologies related to biological processes; interactions between genes host-host and virus-host and differences in the
timing of immune responses during acute phase of infection between the different types of hosts.
We implemented the analytical process described above in a framework denominated GenNet that consisting of a scientific workflow, GenNet.W, responsible for the automation of scientific experiments in silico and a database, GenNet.DB.
The database adopted a graph data model, within a NoSQL based system, to store the inferred gene interaction networks, as well as other information generated by the scientific workflow.
The graph data model natively supports the representation of gene interaction networks and enables the comparison between different inferred networks, as much as path explorations such as co??-expression genes in high-level declarative query language. / O recente desenvolvimento de ensaios moleculares para estudo do transcriptoma, associados a métodos estatísticos, matemáticos e computacionais, trouxeram grandes avanços no entendimento de sistemas biológicos, dentre os quais, a compreensão de processos infecciosos virais associados à resposta imune e escolha de alvos para o desenvolvimento de vacinas e terapias antivirais.
De um lado, o processo de modelagem envolve diferentes etapas, desde a aquisição dos dados de transcriptoma, integração de informações disponíveis em bancos de dados biológicos até visualizações e análises das redes obtidas. Por outro lado, durante o processo de modelagem, são utilizados diversos sistemas de software com diferentes pressupostos de organização e forma de dados de entrada, fazendo com que todo esse processo seja, além de trabalhoso e fragmentado, passível de erros. Nesse sentido, infraestruturas de apoio a e-science como workflows científicos e banco de dados são utilizados na automação, estruturação, execução, organização e gerenciamento de experimentos científicos in silico.
Nessa tese, utilizamos diferentes dados de séries temporais de expressão gênica (microarranjo de DNA) em primatas infectados pelo SIV (do inglês, Simian Imunodeficiency Virus). O SIV infecta várias espécies de primatas africanos, conhecidos como hospedeiros naturais, que não desenvolvem doença. Entretanto, quando linhagens de SIV infectam primatas não africanos, conhecidos como hospedeiros não naturais, dentre os quais o macaco asiático rhesus (Macaca mulatta), esses desenvolvem uma imunodeficiência semelhante a que ocorre em humanos pelo HIV.
A proximidade evolutiva entre os vírus, SIV e HIV, e entre os hospedeiros, humanos e primatas não humanos, possibilitam estudos em modelos biológicos não humanos relevantes na compreensão dos diferentes mecanismos da imunidade inata e adaptativa nos hospedeiros. Os dados utilizados corresponderam a pontos amostrais em três diferentes fases da infecção pelo SIV: antes da infecção, fase aguda e fase crônica. O processo de análise desses dados baseou-se em abordagens de biologia de sistemas. Tais análises incluíram etapas de normalização dos dados, filtragem, anotação, agrupamento, enriquecimento, integração com base de dados biológicas e visualização dos resultados em redes de interações gênicas.
Dentre os principais resultados biológicos obtidos, selecionamos: a identificação dos genes co-expressos nos perfis de expressão gênica, caracterização funcional a partir das ontologias relacionadas aos processos
biológicos, interações entre os genes hopedeiro-hospedeiro e vírus-hospedeiro e diferenças nos tempos
das respostas imunes na fase aguda da infecção entre os tipos de hospedeiros.
Inserimos o processo analítico descrito acima em uma framework chamada GenNet consistindo de um workflow científico GenNet.W responsável pela automação do experimento científico in silico e um banco de dados GenNet.DB. O banco de dados adotou um modelo de dados em grafos, NoSQL, para armazenar
as redes de interações gênicas inferidas, bem como outras informações geradas pelo workflow científico.
O modelo de dados em grafo suporta nativamente a representação das redes de interações gênicas e permite a comparação entre diferentes redes inferidas e a exploração de vias de como co-expressão gênica, usando consultas que expressam em alto nível de linguagem que o sistema suporta.

Identiferoai:union.ndltd.org:IBICT/oai:tede-server.lncc.br:tede/200
Date31 October 2014
CreatorsCosta, Raquel Lopes
ContributorsPorto, Fábio André Machado, Soares, Marcelo Ribeiro, Cavalcanti, Maria Cláudia Reis, Nicolás, Marisa Fabiana, Kritz, Mauricio Vieira
PublisherLaboratório Nacional de Computação Científica, Programa de Pós-Graduação em Modelagem Computacional, LNCC, Brasil, Serviço de Análise e Apoio a Formação de Recursos Humanos
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações do LNCC, instname:Laboratório Nacional de Computação Científica, instacron:LNCC
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0029 seconds