O estudo de doenças complexas, tais como hipertensão e glicemia, é de grande importância na área médica, pois essas doenças afetam muitas pessoas no mundo e seu padrão de variação envolve componentes ambientais, genéticos e suas possíveis interações. Para o mapeamento de genes a amostragem do genoma humano é feita por meio de plataformas de marcadores moleculares e, em geral, destacam-se duas classes de marcadores: os do tipo microsatélites e os SNPs (do inglês, Single Nucleotide Polimorphisms). Os dados de famílias são comumente analisados via modelos mistos e marcadores microsatélites de efeitos aleatórios, sendo que os estudos caso-controle com indivíduos não relacionados têm sido vinculados a dados de SNPs. Neste contexto, surge a problemática de como modelar o SNP em dados de famílias, pois o mesmo pode ser modelado como um fator fixo ou aleatório. Com a finalidade de trazer contribuições a esta discussão, um dos objetivos deste trabalho é propor um exercício de simulação e análise de dados genéticos que facilite o ensino e o entendimento de conceitos de genética e do mapeamento de genes modelados a partir de efeitos fixos ou aleatórios utilizando o software R. Além disso, na análise de dados envolvendo mapas densos de SNPs é necessário contornar o problema de múltiplos testes, e a proposta em multiestágios de Aulchenko et al. (2007) é uma alternativa de análise, na qual o efeito do SNP é modelado como um fator fixo e associado a um componente residual. Logo, surge também como desafio deste trabalho, aplicar o modelo em multiestágios para o mapeamento dos genes e discutir suas vantagens e limitações. / The study of complex diseases such as hypertension and glucose is of great importance in the medical field because these diseases affect many people in the world and its pattern of variation involves environmental and genetics components and their possible interactions. For genes mapping the human genome sampling is performed by means of molecular markers platforms, generally including two kinds of markers: the type microsatellite and SNPs (Single Nucleotide Polimorphisms). The family data is commonly analyzed by mixed models and random effects microsatellite markers and the case-control studies with unrelated individuals have been linked to data from SNPs. In this context the question arises of how to model the SNP on family data because it can be modeled as a fixed or random factor. In order to bring contributions to this discussion, one of the objectives of this study is to propose a simulation exercise and analysis of genetic data to facilitate the teaching and understanding of concepts of genetics and gene mapping modeled from fixed or random effects using software R. Furthermore, analysis of data involving dense maps of SNPs is necessary to overcome the problem of multiple tests, and the proposal multistage Aulchenko et al. (2007) is an alternative analysis in which the effect of SNP is modeled as a fixed factor and associated with a residual component. So there is also a challenge of this study to apply the multistage model for the mapping of genes and discuss their advantages and limitations.
Identifer | oai:union.ndltd.org:IBICT/oai:teses.usp.br:tde-04092012-195941 |
Date | 28 May 2012 |
Creators | Mirian de Souza |
Contributors | Julia Maria Pavan Soler, Viviana Giampaoli, Suely Ruiz Giolo |
Publisher | Universidade de São Paulo, Estatística, USP, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Biblioteca Digital de Teses e Dissertações da USP, instname:Universidade de São Paulo, instacron:USP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0014 seconds