Global ETD Search

1	Epidemiologia genética dos sintomas de asma e da atopia em crianças de um centro urbano da América Latina Costa, Gustavo Nunes de Oliveira 30 April 2014 (has links) Submitted by Maria Creuza Silva (mariakreuza@yahoo.com.br) on 2014-10-03T18:26:58Z No. of bitstreams: 1 TESE FINAL GUSTAVO COSTA. 2014.pdf: 2966354 bytes, checksum: 03e2bef54d23cadea3e32bfc6a5e8093 (MD5) / Approved for entry into archive by Maria Creuza Silva (mariakreuza@yahoo.com.br) on 2014-10-07T14:06:06Z (GMT) No. of bitstreams: 1 TESE FINAL GUSTAVO COSTA. 2014.pdf: 2966354 bytes, checksum: 03e2bef54d23cadea3e32bfc6a5e8093 (MD5) / Made available in DSpace on 2014-10-07T14:06:06Z (GMT). No. of bitstreams: 1 TESE FINAL GUSTAVO COSTA. 2014.pdf: 2966354 bytes, checksum: 03e2bef54d23cadea3e32bfc6a5e8093 (MD5) / As doenças complexas são aquelas cujas manifestações, dependem da exposição a múltiplos fatores ambientais e sociais e a fatores genéticos. Os estudos epidemiológicos clássicos são incapazes de abranger todos estes fatores que determinam uma doença complexa. Houve a necessidade de novas abordagens metodológicas que preenchesse esta lacuna. Neste contexto, a epidemiologia genética surgiu como uma área com grandes perspectivas de avanços no que corresponde a melhor compreensão destas doenças. É um campo que busca ampliar o conhecimento tradicional da epidemiologia nos determinantes de doenças e, em especial, nos efeitos conjuntos de determinantes genéticos, ambientais e sociais. Este campo se ampliou com o desenvolvimento da genômica e de suas técnicas de varredura do material genético dos indivíduos. Grandes esforços da comunidade científica internacional têm sido feitos para determinar a arquitetura genética de diversas doenças complexas A mãe da criança, entre as quais incluem-se a asma e as alergias. A causalidade genética vem ganhando cada vez mais importância no entendimento da asma e alergias e apesar da descoberta de diversos genes associados a estes desfechos a reprodutibilidade nos estudos de gene candidato é baixa. No Brasil, o projeto SCAALA (Social Changes, Asthma and Allergy in Latin America Programme) vem contribuindo com informações importantes para a compreensão dos fatores ambientais e sociais relacionados a prevalência de asma e alergias em uma população miscigenada. Isto criou oportunidade para desenvolvermos um estudo sobre fatores genéticos que possa contribuir para o entendimento da alta ocorrência de asma e alergias nesta população. A tese foi desenvolvida sob a forma de três artigos, o primeiro teve como objetivos estudar os efeitos de fatores de risco genéticos no desenvolvimento dos sintomas de asma, através de uma análise exploratória, por varredura genômica, além disso, visava estimar a herdabilidade e identificar possíveis rotas metabólicas associadas a sintomas de asma. O segundo artigo teve como objetivo estudar os efeitos de fatores de risco genéticos no surgimento da atopia através da análise de um painel com alta densidade de polimorfismos genéticos numa população susceptivel a niveis elevados de IgE especifica, estimar pequenos efeitos genéticos e inferir rotas metabólicas associadas a atopía. O terceiro artigo teve como objetivo confirmar o papel das variantes genéticas da região 17q21 nos sintomas de asma na infância em uma população urbana de crianças latino-americanas, e explorar as interações com atopia e outras exposições selecionadas pela sua relevância. Saúde Coletiva Asma Atopia Doenças Complexas Epidemiologia Genética
2	Comparação de métodos de priorização de genes associados a transtornos do neurodesenvolvimento Feltrin, Arthur Sant'Anna January 2016 (has links) Orientador: David Corrêa Martins Júnior / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Neurociência e Cognição, 2016. / A biologia sistêmica é um campo de pesquisa interdisciplinar que estuda as complexas interações que ocorrem entre os componentes biológicos de um organismo vivo com o objetivo de entender o seu comportamento, o qual emerge a partir dessas interações. Essas interações compõem uma rede altamente complexa, cujos interagentes podem ser de diversas naturezas. Nesse contexto, as doenças complexas são caracterizadas justamente por serem poligênicas e multifatoriais, ou seja, a gênese e o desenvolvimento dessas doenças são uma consequência da interação conjunta de diversos fatores, incluindo não apenas genes, proteínas e outras moléculas, como também fatores epigenéticos e ambientais. No entanto, diferentes métodos de priorização gênica apresentam resultados (listas de genes) com baixa convergência. Assim, a comparação desses métodos é uma questão crucial. Os objetivos principais da presente dissertação foram a realização de uma extensa revisão da literatura em relação às técnicas de priorização de genes associados a doenças complexas e a comparação de algumas dessas técnicas. Foram selecionadas duas ferramentas: o WGCNA (Weighted Gene Correlation Network Analysis) e o NERI (Network-Medicine Relative Importance), ambos métodos que baseiam-se em teoria de redes complexas e co-expressão para priorização gênica, sendo que o NERI tem o diferencial de modelar as hipóteses da Network Medicine para priorização com base na integração de dados de expressão, de redes de interação proteína-proteína (PPI) e de estudos de associação. Para comparação dos resultados, foram utilizados três bancos de dados de expressão gênica relacionados a esquizofrenia. Como previsto, devido ao diferencial de integração de dados proposto pelo NERI, tal técnica resultou em listas de genes com replicação superior à obtida pelo WGCNA para os três bancos de dados em questão. Além disso a interseção entre as listas de genes priorizados de cada metodologia foi baixa, com poucos genes sendo compartilhados pelos resultados dos dois métodos. Ambas metodologias selecionaram genes com relevância biológica relacionada a esquizofrenia, incluindo grupos de genes relacionados a atividade do sistema imune (infecções, estresse), atividade do Sistema Nervoso Central (atividade sináptica, crescimento axonal) e também de embriogênese. Baseando-se nesses resultados, conclui-se que a análise de redes e a integração de dados biológicos são fundamentais para uma ferramenta apresentar resultados promissores, sobretudo no âmbito da descoberta de novos genes e suas redes de interação biológica que seriam possivelmente desconhecidas se fosse realizada apenas a análise individual de cada tipo de dado biológico disponível. / Systems Biology is an interdisciplinary research field which studies the complex interactions that occur between biological compounds of a living organism in order to understand their behavior, which emerges from these interactions. Such interactions compose a highly complex network, whose elements can be of several types. In this context, complex diseases are characterized precisely by being of polygenic and multifactorial nature, i.e., the genesis and development of these diseases are a result of the joint interaction of several factors, including not only genes, proteins and other molecules, but also epigenetic and environmental factors. However, many methods for gene prioritization present results (list of genes) with small convergence. Thus, the comparison involving those methods is a crucial issue. The main objectives of this master thesis was to perform an extensive literature review related to gene prioritization techniques associated to complex diseases and the comparison of part of these techniques. Two techniques were selected: WGCNA (Weighted Gene Correlation Network Analysis) and NERI (Network-Medicine Relative Importance), both methods based on complex networks theory and co-expression for gene prioritization, but NERI having the differential of modeling the Network Medicine hypotheses for prioritization based on integration of expression, protein-protein interaction (PPI) network and association studies. For comparison of the results, three gene expression databases related to schizophrenia were adopted. As predicted, due to the data integration proposed by NERI, such technique resulted in genes lists with superior replication for the three databases mentioned. Additionally, the intersection between the results of the genes lists prioritized by the two methodologies was small, with few genes being found in both lists. Both methods selected biologically relevant to schizophrenia, including groups of genes related to imune system activity (infections, stress), Central Nervous System activity (synaptic activity, axonal growth) and embryogenesis. From these results, it follows that network analysis and biological data integration are fundamental for a gene prioritization method to present promising results, mainly for discovery of new genes and their biological interaction networks that would possibly be unknown if only an individual analysis of each biological data available were performed. DOENÇAS COMPLEXAS ANÁLISE DE REDES COMPLEXAS PRIORIZAÇÃO GÊNICA COMPLEX DISEASES COMPLEX NETWORKS GENES PRIORITIZATION
3	Uma abordagem de integração de dados de redes PPI e expressão gênica para priorizar genes relacionados a doenças complexas / An integrative approach combining PPI networks and gene expression to prioritize genes related to complex diseases Simões, Sérgio Nery 30 June 2015 (has links) Doenças complexas são caracterizadas por serem poligênicas e multifatoriais, o que representa um desafio em relação à busca de genes relacionados a elas. Com o advento das tecnologias de sequenciamento em larga escala do genoma e das medições de expressão gênica (transcritoma), bem como o conhecimento de interações proteína-proteína, doenças complexas têm sido sistematicamente investigadas. Particularmente, baseando-se no paradigma Network Medicine, as redes de interação proteína-proteína (PPI -- Protein-Protein Interaction) têm sido utilizadas para priorizar genes relacionados às doenças complexas segundo suas características topológicas. Entretanto, as redes PPI são afetadas pelo viés da literatura, em que as proteínas mais estudadas tendem a ter mais conexões, degradando a qualidade dos resultados. Adicionalmente, métodos que utilizam somente redes PPI fornecem apenas resultados estáticos e não-específicos, uma vez que as topologias destas redes não são específicas de uma determinada doença. Neste trabalho, desenvolvemos uma metodologia para priorizar genes e vias biológicas relacionados à uma dada doença complexa, através de uma abordagem integrativa de dados de redes PPI, transcritômica e genômica, visando aumentar a replicabilidade dos diferentes estudos e a descoberta de novos genes associados à doença. Após a integração das redes PPI com dados de expressão gênica, aplicamos as hipóteses da Network Medicine à rede resultante para conectar genes sementes (relacionados à doença, definidos a partir de estudos de associação) através de caminhos mínimos que possuam maior co-expressão entre seus genes. Dados de expressão em duas condições (controle e doença) são usados separadamente para obter duas redes, em que cada nó (gene) dessas redes é pontuado segundo fatores topológicos e de co-expressão. Baseado nesta pontuação, desenvolvemos dois escores de ranqueamento: um que prioriza genes com maior alteração entre suas pontuações em cada condição, e outro que privilegia genes com a maior soma destas pontuações. A aplicação do método a três estudos envolvendo dados de expressão de esquizofrenia recuperou com sucesso genes diferencialmente co-expressos em duas condições, e ao mesmo tempo evitou o viés da literatura. Além disso, houve uma melhoria substancial na replicação dos resultados pelo método aplicado aos três estudos, que por métodos convencionais não alcançavam replicabilidade satisfatória. / Complex diseases are characterized as being poligenic and multifactorial, so this poses a challenge regarding the search for genes related to them. With the advent of high-throughput technologies for genome sequencing and gene expression measurements (transcriptome), as well as the knowledge of protein-protein interactions, complex diseases have been sistematically investigated. Particularly, Protein-Protein Interaction (PPI) networks have been used to prioritize genes related to complex diseases according to its topological features. However, PPI networks are affected by ascertainment bias, in which the most studied proteins tend to have more connections, degrading the quality of the results. Additionally, methods using only PPI networks can provide just static and non-specific results, since the topologies of these networks are not specific of a given disease. In this work, we developed a methodology to prioritize genes and biological pathways related to a given complex disease, through an approach that integrates data from PPI networks, transcriptomics and genomics, aiming to increase replicability of different studies and to discover new genes associated to the disease. The methodology integrates PPI network and gene expression data, and then applies the Network Medicine Hypotheses to the resulting network in order to connect seed genes (obtained from association studies) through shortest paths possessing larger coexpression among their genes. Gene expression data in two conditions (control and disease) are used to obtain two networks, where each node (gene) in these networks is rated according to topological and coexpression aspects. Based on this rating, we developed two ranking scores: one that prioritizes genes with the largest alteration between their ratings in each condition, and another that favors genes with the greatest sum of these scores. The application of this method to three studies involving schizophrenia expression data successfully recovered differentially co-expressed gene in two conditions, while avoiding the ascertainment bias. Furthermore, when applied to the three studies, the method achieved a substantial improvement in replication of results, while other conventional methods did not reach a satisfactory replicability. Complex diseases Data integration Doenças complexas Gene prioritization Integração de dados Interação proteína-proteína Network Medicine Network Medicine Priorização gênica Protein-protein interaction
4	Uma abordagem de integração de dados de redes PPI e expressão gênica para priorizar genes relacionados a doenças complexas / An integrative approach combining PPI networks and gene expression to prioritize genes related to complex diseases Sérgio Nery Simões 30 June 2015 (has links) Doenças complexas são caracterizadas por serem poligênicas e multifatoriais, o que representa um desafio em relação à busca de genes relacionados a elas. Com o advento das tecnologias de sequenciamento em larga escala do genoma e das medições de expressão gênica (transcritoma), bem como o conhecimento de interações proteína-proteína, doenças complexas têm sido sistematicamente investigadas. Particularmente, baseando-se no paradigma Network Medicine, as redes de interação proteína-proteína (PPI -- Protein-Protein Interaction) têm sido utilizadas para priorizar genes relacionados às doenças complexas segundo suas características topológicas. Entretanto, as redes PPI são afetadas pelo viés da literatura, em que as proteínas mais estudadas tendem a ter mais conexões, degradando a qualidade dos resultados. Adicionalmente, métodos que utilizam somente redes PPI fornecem apenas resultados estáticos e não-específicos, uma vez que as topologias destas redes não são específicas de uma determinada doença. Neste trabalho, desenvolvemos uma metodologia para priorizar genes e vias biológicas relacionados à uma dada doença complexa, através de uma abordagem integrativa de dados de redes PPI, transcritômica e genômica, visando aumentar a replicabilidade dos diferentes estudos e a descoberta de novos genes associados à doença. Após a integração das redes PPI com dados de expressão gênica, aplicamos as hipóteses da Network Medicine à rede resultante para conectar genes sementes (relacionados à doença, definidos a partir de estudos de associação) através de caminhos mínimos que possuam maior co-expressão entre seus genes. Dados de expressão em duas condições (controle e doença) são usados separadamente para obter duas redes, em que cada nó (gene) dessas redes é pontuado segundo fatores topológicos e de co-expressão. Baseado nesta pontuação, desenvolvemos dois escores de ranqueamento: um que prioriza genes com maior alteração entre suas pontuações em cada condição, e outro que privilegia genes com a maior soma destas pontuações. A aplicação do método a três estudos envolvendo dados de expressão de esquizofrenia recuperou com sucesso genes diferencialmente co-expressos em duas condições, e ao mesmo tempo evitou o viés da literatura. Além disso, houve uma melhoria substancial na replicação dos resultados pelo método aplicado aos três estudos, que por métodos convencionais não alcançavam replicabilidade satisfatória. / Complex diseases are characterized as being poligenic and multifactorial, so this poses a challenge regarding the search for genes related to them. With the advent of high-throughput technologies for genome sequencing and gene expression measurements (transcriptome), as well as the knowledge of protein-protein interactions, complex diseases have been sistematically investigated. Particularly, Protein-Protein Interaction (PPI) networks have been used to prioritize genes related to complex diseases according to its topological features. However, PPI networks are affected by ascertainment bias, in which the most studied proteins tend to have more connections, degrading the quality of the results. Additionally, methods using only PPI networks can provide just static and non-specific results, since the topologies of these networks are not specific of a given disease. In this work, we developed a methodology to prioritize genes and biological pathways related to a given complex disease, through an approach that integrates data from PPI networks, transcriptomics and genomics, aiming to increase replicability of different studies and to discover new genes associated to the disease. The methodology integrates PPI network and gene expression data, and then applies the Network Medicine Hypotheses to the resulting network in order to connect seed genes (obtained from association studies) through shortest paths possessing larger coexpression among their genes. Gene expression data in two conditions (control and disease) are used to obtain two networks, where each node (gene) in these networks is rated according to topological and coexpression aspects. Based on this rating, we developed two ranking scores: one that prioritizes genes with the largest alteration between their ratings in each condition, and another that favors genes with the greatest sum of these scores. The application of this method to three studies involving schizophrenia expression data successfully recovered differentially co-expressed gene in two conditions, while avoiding the ascertainment bias. Furthermore, when applied to the three studies, the method achieved a substantial improvement in replication of results, while other conventional methods did not reach a satisfactory replicability. Doenças complexas Integração de dados Interação proteína-proteína Network Medicine Priorização gênica Complex diseases Data integration Gene prioritization Network Medicine Protein-protein interaction
5	Seleção de características a partir da integração de dados por meio de análise de variação de número de cópias (CNV) para associação genótipo-fenótipo de doenças complexas Meneguin, Christian Reis January 2018 (has links) Orientador: Prof. Dr. David Corrêa Martins Júnior / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, Santo André, 2018. / As pesquisas em biologia sistêmica caracterizam-se pela interdisciplinaridade, a compreensão com visão ampla sobre as interações ocorridas internamente em organismos biológicos, hereditariedade e a influência de fatores ambientais. Neste cenário, é constituída uma rede complexa de interações na qual seus componentes são de diferentes tipos, como as variações do número de cópias (Copy Number Variation - CNVs), genes, entre outros. As doenças complexas que ocorrem neste contexto normalmente são consequências de perturbações intracelulares e intercelulares em tecidos e órgãos, sendo desenvolvidas de forma multifatorial, ou seja, a causa e o desenvolvimento dessas doenças são fruto de diversos fatores genéticos e ambientais. Nos últimos anos, tem sido produzido um volume bastante elevado de dados biológicos gerados por técnicas de sequenciamento de alto desempenho, requerendo pesquisas que envolvam para uma análise integrada desses dados. As variações do número de cópias (Copy Number Variation - CNVs), ou seja, a variação no número de repetições de subsequências de DNA entre indivíduos, se mostram úteis visto que estão relacionadas com outros tipos de dados como genes e dados de expressão gênica (abundâncias de mRNAs transcritos pelos genes em diferentes contextos). Devido a natureza heterogênea e a imensa quantidade de dados, a análise integrativa é um desafio computacional para o qual abordagens vêm sendo propostas. Neste sentido, nesta dissertação foi proposto um método que realiza a integração de dados (CNVs, dados de expressão gênica, haploinsuficiência, imprint, entre outros) por meio de um processo que permite identificar trechos comuns de CNVs entre amostras de diferentes indivíduos, sejam estas amostras de caso ou de controle e que possuem informações obtidas a partir das integrações feitas. Com este processo, o método aqui proposto diferencia-se dos métodos que realizam integração de dados por meio da análise de sobreposição dos dados biológicos, mas não geram novos dados contendo intervalos de CNVs existentes entre as amostras. O método proposto foi analisado com base no estudo de caso do autismo (Transtornos do Espectro Autista - TEA). O autismo, além de ser considerado uma doença complexa, possui algumas particularidades que dificultam o seu estudo quando comparado a outros tipos de doenças complexas como o câncer, por exemplo. Foram realizados dois experimentos que envolveram dados dos CNVs de indivíduos com TEA (caso) e indivíduos sem este transtorno (controle). Também foi feito um experimento utilizando amostras de CNVs de TEA e amostras de CNVs relacionados a outras doenças do neurodesenvolvimento. Os experimentos envolveram a integração dos tipos de dados propostos. Foi possível identificar trechos de CNVs que estão presentes somente em amostras associadas aos casos e não em controles, ou cenários de trechos de CNVs presentes em amostras de TEA e ausentes nas amostras de outras doenças do neurodesenvolvimento, e vice-versa. Os resultados também refletiram a tendência de indivíduos do gênero masculino serem mais afetados por TEA em relação ao feminino. Foi possível também identificar genes associados e informações como o biotipo e se estão presentes em dados de haploinsuficiência, imprint ou ainda dados de expressão agrupados em regiões e períodos. Finalmente, análises de enriquecimento das listas de genes dos CNVs resultantes do método apontam para diversas vias relacionadas com o TEA, tais como as vias de sinalização do receptor toll-like dependente de TRIF, do ácido gama-aminobutírico (GABA), de transmissão sináptica e secreção neurotransmissora, de recepção da insulina, de percepção sensorial olfativa, e de adesão celular independente de cálcio. / Researches in systems biology are characterized by interdisciplinarity, wide-ranging understanding of interactions within biological organisms, heredity, and the influence of environmental factors. In this scenario, a complex network of interactions is constituted of different types of components, such as CNVs (Copy Number Variations), genes, and others. Complex diseases that occur in this context are usually consequences of intracellular, intercellular, tissue, organ, and multifactorial disorders, i.e., the cause and development of these diseases are the result of various genetic and environmental factors. In recent years, a very large volume of biological data generated by high performance sequencing techniques has been produced, requiring researches involving an integrated analysis of these data. CNVs, i.e., the variation in the number of DNA subsequences between individuals, are useful because they are related to other types of data such as genes and gene expression data (abundances of mRNAs transcribed by genes in different contexts). Due to the heterogeneous nature and the immense amount of data, integrative analysis is a computational challenge for which approaches have been proposed. In this sense, in this dissertation a method was proposed that performs a data integration (CNVs, gene expression data, haploinsufficiency, imprint, among others) through a process that allows to identify common portions of CNVs between samples of different individuals, being these case or control samples and that have information obtained from the integration performed. In this context, the method proposed here differs from the methods that carry out data integration through the analysis of the overlay of the biological data, but does not generate new data containing ranges of CNVs existing between the samples. The proposed method was analyzed on the basis of the case study of Autistic Spectrum Disorder (ASD). Besides being considered a complex disease, TEA has some peculiarities that hinder its study when compared to other types of complex diseases such as cancer, for example. As a case study, two experiments were carried out that involved data from the CNVs of individuals with ASD (case) and individuals without this disorder (control). An experiment was also done using samples of ASD CNVs and CNVs samples related to other neurodevelopmental diseases. The experiments involved the integration of the proposed data types. Among the results, the method identified excerpts of CNVs that are present only in samples associated with the cases and not in controls, or scenarios of CNVs snippets present in TEA samples and not present in other neurodevelopmental disease samples, and vice-versa. The results also reflected the tendency for males to be more affected by TEA compared to the females. In the excerpts of CNVs in certain results, it was possible to identify associated gene informations such as the biotype and whether they are present in Haploinsufficiency, imprint or even expression data grouped in regions and periods. Finally, enrichment analyses involving lists of genes from the resulting CNVs point to several signaling pathways related to TEA, such as TRIF-dependent toll-like receptor signaling, gamma aminobutyric acid (GABA), synaptic transmission and neurotransmitter secretion, insulin reception, olfactory sensorial perception, and calcium independent cell-cell adhesion. VARIAÇÃO NO NÚMERO DE CÓPIAS DADOS DE EXPRESSÃO GÊNICA DOENÇAS COMPLEXAS INTEGRAÇÃO DE DADOS MINERAÇÃO DE DADOS COPY NUMBER VARIATION GENE EXPRESSION DATA COMPLEX DISEASES DATA INTEGRATION DATA MINING

1

Page generated in 0.0537 seconds