Spelling suggestions: "subject:"doença complexa""
1 |
Epidemiologia genética dos sintomas de asma e da atopia em crianças de um centro urbano da América LatinaCosta, Gustavo Nunes de Oliveira 30 April 2014 (has links)
Submitted by Maria Creuza Silva (mariakreuza@yahoo.com.br) on 2014-10-03T18:26:58Z
No. of bitstreams: 1
TESE FINAL GUSTAVO COSTA. 2014.pdf: 2966354 bytes, checksum: 03e2bef54d23cadea3e32bfc6a5e8093 (MD5) / Approved for entry into archive by Maria Creuza Silva (mariakreuza@yahoo.com.br) on 2014-10-07T14:06:06Z (GMT) No. of bitstreams: 1
TESE FINAL GUSTAVO COSTA. 2014.pdf: 2966354 bytes, checksum: 03e2bef54d23cadea3e32bfc6a5e8093 (MD5) / Made available in DSpace on 2014-10-07T14:06:06Z (GMT). No. of bitstreams: 1
TESE FINAL GUSTAVO COSTA. 2014.pdf: 2966354 bytes, checksum: 03e2bef54d23cadea3e32bfc6a5e8093 (MD5) / As doenças complexas são aquelas cujas manifestações, dependem da exposição a múltiplos fatores ambientais e sociais e a fatores genéticos. Os estudos epidemiológicos clássicos são incapazes de abranger todos estes fatores que determinam uma doença complexa. Houve a necessidade de novas abordagens metodológicas que preenchesse esta lacuna. Neste contexto, a epidemiologia genética surgiu como uma área com grandes perspectivas de avanços no que corresponde a melhor compreensão destas doenças. É um campo que busca ampliar o conhecimento tradicional da epidemiologia nos determinantes de doenças e, em especial, nos efeitos conjuntos de determinantes genéticos, ambientais e sociais. Este campo se ampliou com o desenvolvimento da genômica e de suas técnicas de varredura do material genético dos indivíduos. Grandes esforços da comunidade científica internacional têm sido feitos para determinar a arquitetura genética de diversas doenças complexas A mãe da criança, entre as quais incluem-se a asma e as alergias. A causalidade genética vem ganhando cada vez mais importância no entendimento da asma e alergias e apesar da descoberta de diversos genes associados a estes desfechos a reprodutibilidade nos estudos de gene candidato é baixa. No Brasil, o projeto SCAALA (Social Changes, Asthma and Allergy in Latin America Programme) vem contribuindo com informações importantes para a compreensão dos fatores ambientais e sociais relacionados a prevalência de asma e alergias em uma população miscigenada. Isto criou oportunidade para desenvolvermos um estudo sobre fatores genéticos que possa contribuir para o entendimento da alta ocorrência de asma e alergias nesta população. A tese foi desenvolvida sob a forma de três artigos, o primeiro teve como objetivos estudar os efeitos de fatores de risco genéticos no desenvolvimento dos sintomas de asma, através de uma análise exploratória, por varredura genômica, além disso, visava estimar a herdabilidade e identificar possíveis rotas metabólicas associadas a sintomas de asma. O segundo artigo teve como objetivo estudar os efeitos de fatores de risco genéticos no surgimento da atopia através da análise de um painel com alta densidade de polimorfismos genéticos numa população susceptivel a niveis elevados de IgE especifica, estimar pequenos efeitos genéticos e inferir rotas metabólicas associadas a atopía. O terceiro artigo teve como objetivo confirmar o papel das variantes genéticas da região 17q21 nos sintomas de asma na infância em uma população urbana de crianças latino-americanas, e explorar as interações com atopia e outras exposições selecionadas pela sua relevância.
|
2 |
Comparação de métodos de priorização de genes associados a transtornos do neurodesenvolvimentoFeltrin, Arthur Sant'Anna January 2016 (has links)
Orientador: David Corrêa Martins Júnior / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Neurociência e Cognição, 2016. / A biologia sistêmica é um campo de pesquisa interdisciplinar que estuda as complexas
interações que ocorrem entre os componentes biológicos de um organismo vivo com o
objetivo de entender o seu comportamento, o qual emerge a partir dessas interações.
Essas interações compõem uma rede altamente complexa, cujos interagentes podem ser de
diversas naturezas. Nesse contexto, as doenças complexas são caracterizadas justamente
por serem poligênicas e multifatoriais, ou seja, a gênese e o desenvolvimento dessas doenças
são uma consequência da interação conjunta de diversos fatores, incluindo não apenas
genes, proteínas e outras moléculas, como também fatores epigenéticos e ambientais. No
entanto, diferentes métodos de priorização gênica apresentam resultados (listas de genes)
com baixa convergência. Assim, a comparação desses métodos é uma questão crucial. Os
objetivos principais da presente dissertação foram a realização de uma extensa revisão da
literatura em relação às técnicas de priorização de genes associados a doenças complexas e a
comparação de algumas dessas técnicas. Foram selecionadas duas ferramentas: o WGCNA
(Weighted Gene Correlation Network Analysis) e o NERI (Network-Medicine Relative
Importance), ambos métodos que baseiam-se em teoria de redes complexas e co-expressão
para priorização gênica, sendo que o NERI tem o diferencial de modelar as hipóteses da
Network Medicine para priorização com base na integração de dados de expressão, de
redes de interação proteína-proteína (PPI) e de estudos de associação. Para comparação
dos resultados, foram utilizados três bancos de dados de expressão gênica relacionados
a esquizofrenia. Como previsto, devido ao diferencial de integração de dados proposto
pelo NERI, tal técnica resultou em listas de genes com replicação superior à obtida pelo
WGCNA para os três bancos de dados em questão. Além disso a interseção entre as listas de
genes priorizados de cada metodologia foi baixa, com poucos genes sendo compartilhados
pelos resultados dos dois métodos. Ambas metodologias selecionaram genes com relevância
biológica relacionada a esquizofrenia, incluindo grupos de genes relacionados a atividade
do sistema imune (infecções, estresse), atividade do Sistema Nervoso Central (atividade
sináptica, crescimento axonal) e também de embriogênese. Baseando-se nesses resultados,
conclui-se que a análise de redes e a integração de dados biológicos são fundamentais para
uma ferramenta apresentar resultados promissores, sobretudo no âmbito da descoberta de
novos genes e suas redes de interação biológica que seriam possivelmente desconhecidas se
fosse realizada apenas a análise individual de cada tipo de dado biológico disponível. / Systems Biology is an interdisciplinary research field which studies the complex interactions
that occur between biological compounds of a living organism in order to understand
their behavior, which emerges from these interactions. Such interactions compose a highly
complex network, whose elements can be of several types. In this context, complex diseases
are characterized precisely by being of polygenic and multifactorial nature, i.e., the
genesis and development of these diseases are a result of the joint interaction of several
factors, including not only genes, proteins and other molecules, but also epigenetic and
environmental factors. However, many methods for gene prioritization present results
(list of genes) with small convergence. Thus, the comparison involving those methods is
a crucial issue. The main objectives of this master thesis was to perform an extensive
literature review related to gene prioritization techniques associated to complex diseases
and the comparison of part of these techniques. Two techniques were selected: WGCNA
(Weighted Gene Correlation Network Analysis) and NERI (Network-Medicine Relative
Importance), both methods based on complex networks theory and co-expression for
gene prioritization, but NERI having the differential of modeling the Network Medicine
hypotheses for prioritization based on integration of expression, protein-protein interaction
(PPI) network and association studies. For comparison of the results, three gene expression
databases related to schizophrenia were adopted. As predicted, due to the data integration
proposed by NERI, such technique resulted in genes lists with superior replication for the
three databases mentioned. Additionally, the intersection between the results of the genes
lists prioritized by the two methodologies was small, with few genes being found in both
lists. Both methods selected biologically relevant to schizophrenia, including groups of
genes related to imune system activity (infections, stress), Central Nervous System activity
(synaptic activity, axonal growth) and embryogenesis. From these results, it follows that
network analysis and biological data integration are fundamental for a gene prioritization
method to present promising results, mainly for discovery of new genes and their biological
interaction networks that would possibly be unknown if only an individual analysis of
each biological data available were performed.
|
3 |
Uma abordagem de integração de dados de redes PPI e expressão gênica para priorizar genes relacionados a doenças complexas / An integrative approach combining PPI networks and gene expression to prioritize genes related to complex diseasesSimões, Sérgio Nery 30 June 2015 (has links)
Doenças complexas são caracterizadas por serem poligênicas e multifatoriais, o que representa um desafio em relação à busca de genes relacionados a elas. Com o advento das tecnologias de sequenciamento em larga escala do genoma e das medições de expressão gênica (transcritoma), bem como o conhecimento de interações proteína-proteína, doenças complexas têm sido sistematicamente investigadas. Particularmente, baseando-se no paradigma Network Medicine, as redes de interação proteína-proteína (PPI -- Protein-Protein Interaction) têm sido utilizadas para priorizar genes relacionados às doenças complexas segundo suas características topológicas. Entretanto, as redes PPI são afetadas pelo viés da literatura, em que as proteínas mais estudadas tendem a ter mais conexões, degradando a qualidade dos resultados. Adicionalmente, métodos que utilizam somente redes PPI fornecem apenas resultados estáticos e não-específicos, uma vez que as topologias destas redes não são específicas de uma determinada doença. Neste trabalho, desenvolvemos uma metodologia para priorizar genes e vias biológicas relacionados à uma dada doença complexa, através de uma abordagem integrativa de dados de redes PPI, transcritômica e genômica, visando aumentar a replicabilidade dos diferentes estudos e a descoberta de novos genes associados à doença. Após a integração das redes PPI com dados de expressão gênica, aplicamos as hipóteses da Network Medicine à rede resultante para conectar genes sementes (relacionados à doença, definidos a partir de estudos de associação) através de caminhos mínimos que possuam maior co-expressão entre seus genes. Dados de expressão em duas condições (controle e doença) são usados separadamente para obter duas redes, em que cada nó (gene) dessas redes é pontuado segundo fatores topológicos e de co-expressão. Baseado nesta pontuação, desenvolvemos dois escores de ranqueamento: um que prioriza genes com maior alteração entre suas pontuações em cada condição, e outro que privilegia genes com a maior soma destas pontuações. A aplicação do método a três estudos envolvendo dados de expressão de esquizofrenia recuperou com sucesso genes diferencialmente co-expressos em duas condições, e ao mesmo tempo evitou o viés da literatura. Além disso, houve uma melhoria substancial na replicação dos resultados pelo método aplicado aos três estudos, que por métodos convencionais não alcançavam replicabilidade satisfatória. / Complex diseases are characterized as being poligenic and multifactorial, so this poses a challenge regarding the search for genes related to them. With the advent of high-throughput technologies for genome sequencing and gene expression measurements (transcriptome), as well as the knowledge of protein-protein interactions, complex diseases have been sistematically investigated. Particularly, Protein-Protein Interaction (PPI) networks have been used to prioritize genes related to complex diseases according to its topological features. However, PPI networks are affected by ascertainment bias, in which the most studied proteins tend to have more connections, degrading the quality of the results. Additionally, methods using only PPI networks can provide just static and non-specific results, since the topologies of these networks are not specific of a given disease. In this work, we developed a methodology to prioritize genes and biological pathways related to a given complex disease, through an approach that integrates data from PPI networks, transcriptomics and genomics, aiming to increase replicability of different studies and to discover new genes associated to the disease. The methodology integrates PPI network and gene expression data, and then applies the Network Medicine Hypotheses to the resulting network in order to connect seed genes (obtained from association studies) through shortest paths possessing larger coexpression among their genes. Gene expression data in two conditions (control and disease) are used to obtain two networks, where each node (gene) in these networks is rated according to topological and coexpression aspects. Based on this rating, we developed two ranking scores: one that prioritizes genes with the largest alteration between their ratings in each condition, and another that favors genes with the greatest sum of these scores. The application of this method to three studies involving schizophrenia expression data successfully recovered differentially co-expressed gene in two conditions, while avoiding the ascertainment bias. Furthermore, when applied to the three studies, the method achieved a substantial improvement in replication of results, while other conventional methods did not reach a satisfactory replicability.
|
4 |
Uma abordagem de integração de dados de redes PPI e expressão gênica para priorizar genes relacionados a doenças complexas / An integrative approach combining PPI networks and gene expression to prioritize genes related to complex diseasesSérgio Nery Simões 30 June 2015 (has links)
Doenças complexas são caracterizadas por serem poligênicas e multifatoriais, o que representa um desafio em relação à busca de genes relacionados a elas. Com o advento das tecnologias de sequenciamento em larga escala do genoma e das medições de expressão gênica (transcritoma), bem como o conhecimento de interações proteína-proteína, doenças complexas têm sido sistematicamente investigadas. Particularmente, baseando-se no paradigma Network Medicine, as redes de interação proteína-proteína (PPI -- Protein-Protein Interaction) têm sido utilizadas para priorizar genes relacionados às doenças complexas segundo suas características topológicas. Entretanto, as redes PPI são afetadas pelo viés da literatura, em que as proteínas mais estudadas tendem a ter mais conexões, degradando a qualidade dos resultados. Adicionalmente, métodos que utilizam somente redes PPI fornecem apenas resultados estáticos e não-específicos, uma vez que as topologias destas redes não são específicas de uma determinada doença. Neste trabalho, desenvolvemos uma metodologia para priorizar genes e vias biológicas relacionados à uma dada doença complexa, através de uma abordagem integrativa de dados de redes PPI, transcritômica e genômica, visando aumentar a replicabilidade dos diferentes estudos e a descoberta de novos genes associados à doença. Após a integração das redes PPI com dados de expressão gênica, aplicamos as hipóteses da Network Medicine à rede resultante para conectar genes sementes (relacionados à doença, definidos a partir de estudos de associação) através de caminhos mínimos que possuam maior co-expressão entre seus genes. Dados de expressão em duas condições (controle e doença) são usados separadamente para obter duas redes, em que cada nó (gene) dessas redes é pontuado segundo fatores topológicos e de co-expressão. Baseado nesta pontuação, desenvolvemos dois escores de ranqueamento: um que prioriza genes com maior alteração entre suas pontuações em cada condição, e outro que privilegia genes com a maior soma destas pontuações. A aplicação do método a três estudos envolvendo dados de expressão de esquizofrenia recuperou com sucesso genes diferencialmente co-expressos em duas condições, e ao mesmo tempo evitou o viés da literatura. Além disso, houve uma melhoria substancial na replicação dos resultados pelo método aplicado aos três estudos, que por métodos convencionais não alcançavam replicabilidade satisfatória. / Complex diseases are characterized as being poligenic and multifactorial, so this poses a challenge regarding the search for genes related to them. With the advent of high-throughput technologies for genome sequencing and gene expression measurements (transcriptome), as well as the knowledge of protein-protein interactions, complex diseases have been sistematically investigated. Particularly, Protein-Protein Interaction (PPI) networks have been used to prioritize genes related to complex diseases according to its topological features. However, PPI networks are affected by ascertainment bias, in which the most studied proteins tend to have more connections, degrading the quality of the results. Additionally, methods using only PPI networks can provide just static and non-specific results, since the topologies of these networks are not specific of a given disease. In this work, we developed a methodology to prioritize genes and biological pathways related to a given complex disease, through an approach that integrates data from PPI networks, transcriptomics and genomics, aiming to increase replicability of different studies and to discover new genes associated to the disease. The methodology integrates PPI network and gene expression data, and then applies the Network Medicine Hypotheses to the resulting network in order to connect seed genes (obtained from association studies) through shortest paths possessing larger coexpression among their genes. Gene expression data in two conditions (control and disease) are used to obtain two networks, where each node (gene) in these networks is rated according to topological and coexpression aspects. Based on this rating, we developed two ranking scores: one that prioritizes genes with the largest alteration between their ratings in each condition, and another that favors genes with the greatest sum of these scores. The application of this method to three studies involving schizophrenia expression data successfully recovered differentially co-expressed gene in two conditions, while avoiding the ascertainment bias. Furthermore, when applied to the three studies, the method achieved a substantial improvement in replication of results, while other conventional methods did not reach a satisfactory replicability.
|
5 |
Seleção de características a partir da integração de dados por meio de análise de variação de número de cópias (CNV) para associação genótipo-fenótipo de doenças complexasMeneguin, Christian Reis January 2018 (has links)
Orientador: Prof. Dr. David Corrêa Martins Júnior / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, Santo André, 2018. / As pesquisas em biologia sistêmica caracterizam-se pela interdisciplinaridade, a compreensão
com visão ampla sobre as interações ocorridas internamente em organismos biológicos,
hereditariedade e a influência de fatores ambientais. Neste cenário, é constituída uma
rede complexa de interações na qual seus componentes são de diferentes tipos, como as
variações do número de cópias (Copy Number Variation - CNVs), genes, entre outros.
As doenças complexas que ocorrem neste contexto normalmente são consequências de
perturbações intracelulares e intercelulares em tecidos e órgãos, sendo desenvolvidas de
forma multifatorial, ou seja, a causa e o desenvolvimento dessas doenças são fruto de
diversos fatores genéticos e ambientais. Nos últimos anos, tem sido produzido um volume
bastante elevado de dados biológicos gerados por técnicas de sequenciamento de alto
desempenho, requerendo pesquisas que envolvam para uma análise integrada desses dados.
As variações do número de cópias (Copy Number Variation - CNVs), ou seja, a variação
no número de repetições de subsequências de DNA entre indivíduos, se mostram úteis
visto que estão relacionadas com outros tipos de dados como genes e dados de expressão
gênica (abundâncias de mRNAs transcritos pelos genes em diferentes contextos). Devido
a natureza heterogênea e a imensa quantidade de dados, a análise integrativa é um desafio
computacional para o qual abordagens vêm sendo propostas. Neste sentido, nesta
dissertação foi proposto um método que realiza a integração de dados (CNVs, dados de
expressão gênica, haploinsuficiência, imprint, entre outros) por meio de um processo que
permite identificar trechos comuns de CNVs entre amostras de diferentes indivíduos, sejam
estas amostras de caso ou de controle e que possuem informações obtidas a partir das
integrações feitas. Com este processo, o método aqui proposto diferencia-se dos métodos
que realizam integração de dados por meio da análise de sobreposição dos dados biológicos,
mas não geram novos dados contendo intervalos de CNVs existentes entre as amostras. O
método proposto foi analisado com base no estudo de caso do autismo (Transtornos do
Espectro Autista - TEA). O autismo, além de ser considerado uma doença complexa, possui
algumas particularidades que dificultam o seu estudo quando comparado a outros tipos
de doenças complexas como o câncer, por exemplo. Foram realizados dois experimentos
que envolveram dados dos CNVs de indivíduos com TEA (caso) e indivíduos sem este
transtorno (controle). Também foi feito um experimento utilizando amostras de CNVs de
TEA e amostras de CNVs relacionados a outras doenças do neurodesenvolvimento. Os
experimentos envolveram a integração dos tipos de dados propostos. Foi possível identificar
trechos de CNVs que estão presentes somente em amostras associadas aos casos e não em
controles, ou cenários de trechos de CNVs presentes em amostras de TEA e ausentes nas
amostras de outras doenças do neurodesenvolvimento, e vice-versa. Os resultados também
refletiram a tendência de indivíduos do gênero masculino serem mais afetados por TEA em
relação ao feminino. Foi possível também identificar genes associados e informações como
o biotipo e se estão presentes em dados de haploinsuficiência, imprint ou ainda dados de
expressão agrupados em regiões e períodos. Finalmente, análises de enriquecimento das
listas de genes dos CNVs resultantes do método apontam para diversas vias relacionadas
com o TEA, tais como as vias de sinalização do receptor toll-like dependente de TRIF, do
ácido gama-aminobutírico (GABA), de transmissão sináptica e secreção neurotransmissora,
de recepção da insulina, de percepção sensorial olfativa, e de adesão celular independente
de cálcio. / Researches in systems biology are characterized by interdisciplinarity, wide-ranging understanding
of interactions within biological organisms, heredity, and the influence of
environmental factors. In this scenario, a complex network of interactions is constituted of
different types of components, such as CNVs (Copy Number Variations), genes, and others.
Complex diseases that occur in this context are usually consequences of intracellular,
intercellular, tissue, organ, and multifactorial disorders, i.e., the cause and development
of these diseases are the result of various genetic and environmental factors. In recent
years, a very large volume of biological data generated by high performance sequencing
techniques has been produced, requiring researches involving an integrated analysis of
these data. CNVs, i.e., the variation in the number of DNA subsequences between individuals,
are useful because they are related to other types of data such as genes and
gene expression data (abundances of mRNAs transcribed by genes in different contexts).
Due to the heterogeneous nature and the immense amount of data, integrative analysis
is a computational challenge for which approaches have been proposed. In this sense, in
this dissertation a method was proposed that performs a data integration (CNVs, gene
expression data, haploinsufficiency, imprint, among others) through a process that allows
to identify common portions of CNVs between samples of different individuals, being these
case or control samples and that have information obtained from the integration performed.
In this context, the method proposed here differs from the methods that carry out data
integration through the analysis of the overlay of the biological data, but does not generate
new data containing ranges of CNVs existing between the samples. The proposed method
was analyzed on the basis of the case study of Autistic Spectrum Disorder (ASD). Besides
being considered a complex disease, TEA has some peculiarities that hinder its study
when compared to other types of complex diseases such as cancer, for example. As a case
study, two experiments were carried out that involved data from the CNVs of individuals
with ASD (case) and individuals without this disorder (control). An experiment was also
done using samples of ASD CNVs and CNVs samples related to other neurodevelopmental
diseases. The experiments involved the integration of the proposed data types. Among the
results, the method identified excerpts of CNVs that are present only in samples associated
with the cases and not in controls, or scenarios of CNVs snippets present in TEA samples
and not present in other neurodevelopmental disease samples, and vice-versa. The results
also reflected the tendency for males to be more affected by TEA compared to the females.
In the excerpts of CNVs in certain results, it was possible to identify associated gene
informations such as the biotype and whether they are present in Haploinsufficiency, imprint
or even expression data grouped in regions and periods. Finally, enrichment analyses
involving lists of genes from the resulting CNVs point to several signaling pathways related
to TEA, such as TRIF-dependent toll-like receptor signaling, gamma aminobutyric acid
(GABA), synaptic transmission and neurotransmitter secretion, insulin reception, olfactory
sensorial perception, and calcium independent cell-cell adhesion.
|
Page generated in 0.0409 seconds