Atualmente, um dos problemas mais importantes da Genética é a identificação de genes associados com doenças complexas. Um delineamento adequado para esta finalidade corresponde à coleta de dados de famílias e plataformas de marcadores moleculares do tipo SNP (do inglês, Single Nucleotide Polimorphism). Estas plataformas representam pontos de referência estrategicamente dispostos ao longo do genoma dos indivíduos e são de alta dimensão. A análise destes dados traz desafios analíticos como o problema de múltiplos testes e a seleção de variáveis preditoras. Nesta tese, propõe-se um critério para discriminar as variáveis preditoras genéticas em efeitos devidos ao componente aleatório poligênico e ao componente residual, sob a estrutura de um modelo linear misto. Também, considerando que o efeito individual das variáveis preditoras é esperado ser pequeno, é sugerido um método para encontrar subconjuntos ordenados destas variáveis e estudar o seu efeito simultâneo sobre a variável resposta em estudo. Neste contexto, utiliza-se a teoria associada ao Gráfico da Variável Adicionada em modelos mistos. As propostas são validadas por meio de um estudo de simulação, o qual é baseado em estruturas de famílias envolvidas no Projeto ``Corações de Baependi\" (InCor/USP), cujo objetivo é identificar genes associados a fatores de risco cardiovascular na população brasileira. Para a implementação dos procedimentos, usa-se o programa R e na geração das variáveis preditoras genéticas adota-se o aplicativo SimPed. / Recently, one of the most important problems in genetics is the identification of genes associated with complex diseases. A useful design for this proposal corresponds to collect data from extended families and molecular markers platforms SNPs (Single Nucleotide polymorphism). These platforms represent points of reference strategically placed along the genome of the individuals and are high dimensional. Analysis of these data brings analytical challenges as the problem of multiple testing and selection of predictive variables. In this thesis, we propose a criterion for discriminating predictors of genetic effects due to random polygenic component and the residual component, under the framework of a linear mixed model. Also, considering that the individual effects of predictor variables is expected to be small, it is suggested a method for finding ordered subsets of these variables and study their simultaneous effect on the response variable under study. In this context, is used the theory of the added variable plot under a mixed model framework. The proposals are validated through a simulation study, which is based on structures of families involved in the Project `` Baependi Heart Study (FAPESP Process 2007/58150-7), whose objective is to identify genes associated with cardiovascular risk factors in the Brazilian population. This proposal is implemented by using the R statistical environment and for the simulation of genetic predictors is adopted the SimPed application.
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-23062013-204844 |
Date | 11 May 2012 |
Creators | Duarte, Nubia Esteban |
Contributors | Soler, Julia Maria Pavan |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | English |
Type | Tese de Doutorado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.0091 seconds