Spelling suggestions: "subject:"snp+""
71 |
A label-free, fluorescence based assay for microarrayNiu, Sanjun 23 August 2004 (has links)
DNA chip technology has drawn tremendous attention since it emerged in the mid 90 s as a method that expedites gene sequencing by over 100-fold. DNA chip, also called DNA microarray, is a combinatorial technology in which different single-stranded DNA (ssDNA) molecules of known sequences are immobilized at specific spots. The immobilized ssDNA strands are called probes. In application, the chip is exposed to a solution containing ssDNA of unknown sequence, called targets, which are labeled with fluorescent dyes. Due to specific molecular recognition among the base pairs in the DNA, the binding or hybridization occurs only when the probe and target sequences are complementary. The nucleotide sequence of the target is determined by imaging the fluorescence from the spots.
The uncertainty of background in signal detection and statistical error in data analysis, primarily due to the error in the DNA amplification process and statistical distribution of the tags in the target DNA, have become the fundamental barriers in bringing the technology into application for clinical diagnostics. Furthermore, the dye and tagging process are expensive, making the cost of DNA chips inhibitive for clinical testing. These limitations and challenges make it difficult to implement DNA chip methods as a diagnostic tool in a pathology laboratory. The objective of this dissertation research is to provide an alternative approach that will address the above challenges..
In this research, a label-free assay is designed and studied. Polystyrene (PS), a commonly used polymeric material, serves as the fluorescence agent. Probe ssDNA is covalently immobilized on polystyrene thin film that is supported by a reflecting substrate. When this chip is exposed to excitation light, fluorescence light intensity from PS is detected as the signal. Since the optical constants and conformations of ssDNA and dsDNA (double stranded DNA) are different, the measured fluorescence from PS changes for the same intensity of excitation light.. The fluorescence contrast is used to quantify the amount of probe-target hybridization. A mathematical model that considers multiple reflections and scattering is developed to explain the mechanism of the fluorescence contrast which depends on the thickness of the PS film. Scattering is the dominant factor that contributes to the contrast. The potential of this assay to detect single nucleotide polymorphism is also tested. / Ph. D.
|
72 |
Characterization of T-DNA integration sites within a population of insertional mutants of the diploid strawberry Fragaria vesca L.Ruiz-Rojas, Juan Jairo 02 December 2010 (has links)
Cultivated strawberry (Fragaria × ananassa) is an octoploid (2n=8x=56) species that belongs to the Rosaceae family and the high ploidy level makes genetic and molecular studies difficult. However, its commercial success because of its unique flavor and nutritious qualities has increased interest in the development of genomic resources. Fragaria vesca L. is a diploid (2n=2x=14) species with a small genome size (206 Mbp), short reproductive cycle, and facile vegetative and seed propagation that make it an attractive model for genomic studies. The availability of an efficient transformation methodology for Fragaria vesca has facilitated the use of a T-DNA mutagenesis system to develop a collection of several hundred insertional T-DNA mutants at Virginia Tech, using either of two commercially available vectors, pCAMBIA 1302 and 1304. In this study, we have used expression of the green fluorescent protein (GFP) as a tool to identify homozygous mutant lines. Three different approaches were conducted, first we identified 11 homozygous lines by PCR, then another 55 homozygous lines by absence of segregation of GFP expression in T2 seedlings, and finally we attempted to distinguish homozygous from hemizygous lines by relative GFP expression measured using a commercially available GFP meter. The latter methodology was unsuccessful due to uncontrolled variability in the readings. Continuing the characterization of our mutant population, we used thermal asymmetric interlaced PCR (TAIL-PCR) to obtain the nucleotide sequence of the genomic DNA regions that flank the T-DNA insertion sites in independent transgenic strawberry lines. Primers were designed that would amplify the derived strawberry flanking sequences in the two parents of an interspecific mapping population between the two diploid species, F. vesca x F. bucharica. The amplified products were sequenced and examined for the occurrence of SNPs (single nucleotide polymorphisms). The same primers were then used on the F2 mapping population. Segregation of SNP markers with previously mapped genetic markers allowed us to position 74 SNP markers, and hence their corresponding insertional mutants, on a well-populated genetic linkage map for the diploid strawberry. Finally, we analyzed the insertion site from more than 190 mutants looking at both the right and left borders of the T-DNA where microsimilarities of a few base pairs between ends of T-DNA and genomic DNA were observed, indicating that T-DNA integration had not occurred randomly in strawberry. We have also characterized the insertion sites through gene annotation found in the strawberry genome database. / Ph. D.
|
73 |
Perímetro Escrotal: Marcadores Moleculares, Bioquímicos e sua Influência na Produção In Vitro de Embriões em Bovinos / Scrotal Circumference in Cattle: Molecular and Biochemistry Markers and its Influence on In Vitro Production of EmbryosCipriano, Vivian Taís Fernandes 14 April 2014 (has links)
Os programas de melhoramento genético objetivam a seleção de animais geneticamente e fenotipicamente superiores. Dentre as características selecionadas para aumentar o ganho genético do rebanho, o perímetro escrotal destaca-se por sua alta herdabilidade e correlação com precocidade sexual, peso do animal e morfologia espermática. A seleção fenotípica para perímetro escrotal pode ser auxiliada pela junção da DEP PE 365 (diferença esperada na progênie para perímetro escrotal aos 365 dias) com a biotecnologia reprodutiva PIVE (produção in vitro de embriões), e tecnologias moleculares como o uso de marcadores do tipo SNPs (Single Nucleotide Polymorphism) e marcadores bioquímicos (proteínas). Desta forma, o presente trabalho teve por objetivo: verificar se os SNPs presentes nos genes atuantes na maturação sexual B4GALT1 (Beta 1,4- galactosyltransferase), FSHR (Follicle-stimulating hormone), LHR (Luteinizing hormone receptor) e IGF2 (Insulin-like growth factor 2) podem estar associados a maiores valores de DEP PE 365 em touros da raça Nelore; fazer o estudo global de proteínas no sêmen de touros da raça Nelore que possam ser indicativas de maior DEP PE 365 e verificar se a DEP PE 365 interfere negativamente ou positivamente nos resultados da PIVE. Para as análises de SNP, 178 touros foram divididos em dois grupos, sendo um com 104 animais de DEP PE 365 negativa e outro com 74 animais com DEP positiva. O DNA foi extraído do sangue destes animais e a região genômica de interesse foi amplificada e analisada por RFLP (restriction fragment lengh polymorphism). No caso da proteômica, dois pools de sêmen foram comparados entre si quanto aos seus perfis protéicos por LCMS (Liquid chromatographymass spectrometry): um proveninete de três touros que produzem em média 17,6% de embriões/oócito in vitro e DEP PE 365 média de -0,3 (inferiores) e outro pool proveniente de três touros que produzem em média 34,25% de embriões/oócito, com DEP PE 365 média de 1,07 (superiores). Para verificar se a DEP PE 365 de touros utilizados na PIVE influencia na quantidade e cinética de embriões produzidos, 48 touros foram divididos em três grupos (superior, neutro e inferior) por meio da amplitude total de suas DEPs PE 365 e então utilizados na PIVE. Então, observou-se a quantidade e os tipos de blastocistos gerados por cada um dos grupos. Os resultados do presente trabalho mostraram: o genótipo CC no SNP analisado no gene LHR, e o genótipo TT no SNP analisado no gene IGF2 podem estar relacionados a animais de maiores DEP PE 365 (p 0.05); proteínas envolvidas em vias metabólicas foram predominantes no grupo dos touros superiores e portanto podem ser prováveis marcadores bioquímicos de reprodutores com maiores DEP PE 365; touros com maiores DEPs PE 365 resultam na maior PIV de embriões favoráveis para serem transferidos para vacas receptoras (Bl e Bx; blastocisto e blastocisto expandido; p 0.05). Tais resultados apresentam informações que podem auxiliar na seleção de animais com melhores dados fenotípicos de DEP PE 365 e, portanto, melhores reprodutores. / The breeding programs aim the selection of phenotypically and genetically superior animals . Among the selected characteristics to increase genetic gain in the herd, scrotal circumference stands out for its high heritability and correlation with sexual precocity, animal weight and morphology . Phenotypic selection for scrotal circumference may be aided by the addition of EPD SC 365 (expected progeny difference for scrotal circumference at 365 days ) to IVPE (in vitro production of embryos) reproductive biotechnology and molecular technologies such as the use of molecular markers like SNPs (Single Nucleotide Polymorphism ) and biochemical markers (proteins). Thus, this study aimed to: determine whether the SNPs present in genes B4GALT1 (Beta 1,4 - galactosyltransferase), FSHR (Follicle - stimulating hormone), LHR (Luteinizing hormone receptor) and IGF2 (Insulin- like growth factor 2) may be associated with higher values of EPD SC 365 in Nelore bulls; make global study of proteins in semen from Nelore bulls that may be indicative of greater EPD SC 365 and check if EPD SC 365 interferes negatively or positively on the results of IVPE. For the analysis of SNP, 178 bulls were divided into two groups, one with 104 animals of 365 negative EPD SC 365 and another with 74 animals with positive EPD SC 365. DNA was extracted from blood of these animals and genomic region of interest was amplified and analyzed by RFLP (restriction fragment polymorphism lengh). In the case of proteomics, two pools of semen were compared in respect to their protein profiles by LCMS (Liquid chromatography - mass spectrometry): One from three bulls that produce on average 17.6 % of in vitro embryo/oocyte and with EPD SC 365 average -0.3 (lower) and another pool from three bulls that produce on average 34.25% of in vitro embryo/oocyte with EPD SC 365 average of 1.07 (upper). To check if EPD SC 365 bulls used in IVPE influences the amount and kinetics of embryos, 48 bulls were divided into three groups (upper, lower and neutral ) through the full range of their EPDs SC 365 and then used in IVPE. Then, it was observed the amount and types of blastocysts generated by each group. The results of this study showed: the CC genotype at SNP analyzed in LHR gene, and the TT genotype at SNP analyzed in the IGF2 gene may be related to larger EPD SC 365 animals (p 0.05); proteins involved in metabolic pathways were predominant in group of senior bulls and can therefore be likely biochemical markers of breeding with larger EPD SC 365; bulls with larger EPD SC 365 used in IVPE result in greater favor of embryos to be transferred to recipient cows (Bl and Bx; blastocyst and expanded blastocyst, p 0:05). These results provide information that can assist in the selection of animals with improved phenotypic data EPS SC 365 and, therefore, the best breeders.
|
74 |
Desequilíbrio de Ligação e Blocos de Haplótipos Determinados pela Análise de 250K SNPs em Três Remanescentes de Quilombos / Linkage Disequilibrium and Haplotype Blocks Determined by the Analysis of 250K SNPs in Three Quilombo Remnants CommunitiesAndrade, Edilene Santos de 20 September 2013 (has links)
A associação não aleatória entre alelos de diferentes lócus caracteriza o que é chamado de desequilíbrio de ligação (DL) entre eles. A extensão do DL nas populações humanas pode ser influenciada por muitos fatores, tais como taxa de recombinação, características demográficas (idade, tamanho e taxa de crescimento) e fatores evolutivos (deriva genética, efeito fundador, gargalos populacionais, mutação, seleção e fluxo gênico). Portanto, o conhecimento dos padrões do DL fornecem dados que auxiliam na descrição dos eventos demográficos e evolutivos sofridos pelas populações. O objetivo deste estudo foi descrever os padrões de DL de quatro populações brasileiras e correlacioná-los com suas respectivas histórias demográficas, uma vez que estas populações experimentaram alguns dos eventos evolutivos que geram ou retardam o decréscimo do DL, como fundação por poucos indivíduos, miscigenação no momento da fundação e posterior isolamento. Foram analisadas amostras de três populações remanescentes de quilombos do Estado do Piauí, Gaucinha (GAU, n = 14), Mimbó (MIB, n = 15) e Sítio Velho (STV, n = 15) e da população urbana de Teresina, Piauí (TES, n = 15), além de sete amostras populacionais do projeto HapMap (CEU, CHB, JPT, ASW, LWK, MKK, YRI, todas com n = 15). Foram genotipados mais de 250 mil SNPs (Single Nucleotide Polymorphisms) utilizando-se o GeneChip® Human Mapping 250K Nsp I Array - Affymetrix® nas amostras das quatro populações brasileiras. Os dados brutos das populações do HapMap para este array foram obtidos na página do projeto. Os genótipos para todas as amostras foram determinados pelo algoritmo CRLMM após comparação com o algoritmo BRLMM, e as análises de DL e determinação dos blocos de haplótipos foram realizadas com o uso do programa Haploview. Considerando-se o número de blocos de haplótipos detectados em cada população estudada, padrão semelhante foi observado em todos os autossomos. Em geral, a população europeia (CEU) e as duas populações asiáticas (CHB e JPT) do HapMap apresentaram os maiores números de blocos, enquanto que os menores números foram observados nos quilombos GAU e MIB e na população TES. As populações africanas LWK, MKK e YRI e a população afro-americana ASW apresentaram os valores intermediários e a população afro-brasileira STV, apresentou um número de blocos apenas inferior a CEU, CHB e JPT. A grande contribuição africana nos quilombos GAU e MIB pode explicar o menor DL observado nestas comunidades. Por outro lado, o menor DL em TES se deve, provavelmente, à sua fundação, que envolveu um maior número de indivíduos e foi seguida por um rápido crescimento. A possível explicação para o maior DL observado em STV, em relação aos demais quilombos, consiste em sua peculiar história demográfica: esta comunidade experimentou uma miscigenação no momento de sua fundação, que foi seguida por um crescimento lento e pouca diferenciação. Assim, foi demonstrado como os eventos demográficos de cada população influenciam seus respectivos padrões de DL. / The non-random association between alleles of different loci characterizes what is called linkage disequilibrium (LD) between them. The LD extent in human populations can be influenced by many factors, such as recombination rate, demographic features (age, size and growth rate) and evolutionary events (genetic drift, founder effects, population bottlenecks, mutation, selection and gene flow). Therefore, knowledge of the LD patterns provides data that assists in describing the evolutionary and demographic events experienced by populations. The aim of this study was to describe the LD patterns of four Brazilian populations and correlate these patterns with their respective demographic histories, since these populations have experienced some of the evolutionary events that produce or retard the LD decrease, such as foundation by few individuals, admixture at the founding moment and subsequent isolation. Samples from three quilombo remnants populations of the Piauí State, Gaucinha (GAU, n = 14), Mimbó (MIB, n = 15) and Sítio Velho (STV, n = 15) and the urban population of Teresina, Piauí (TES, n = 15), and seven population samples from the HapMap Project (CEU, CHB, JPT, ASW, LWK, MKK, YRI, all with n = 15) were analyzed. More than 250 thousand SNPs (Single Nucleotide Polymorphisms) were genotyped using the GeneChip ® Human Mapping 250K Nsp Array I - Affymetrix ® in the samples of the four Brazilian populations. Raw data of the HapMap population samples for this array were obtained from the HapMap homepage. Genotypes for all samples were determined by CRLMM algorithm after comparison with the BRLMM algorithm. LD analyzes and determination of haplotype blocks were performed using the Haploview software. Considering the number of haplotype blocks detected in each population, a consistent pattern was observed for all autosomes. The European population (CEU) and the two Asian populations (CHB and JPT) of the HapMap showed the highest numbers of blocks, while the lowest numbers were observed in the GAU and MIB quilombos and in the TES population. The African populations, LWK, MKK and YRI, and the African-American ASW exhibited intermediate values and the African-Brazilian population STV, presented a number of blocks smaller than that observed for CEU, CHB and JPT. The great African contribution in the GAU and MIB quilombos may explain the lower LD observed in these communities. On the other hand, the lower LD in TES is probably due to its foundation that involved a larger number of individuals and was followed by a fast growth. A possible explanation for the higher LD observed in STV, compared to other quilombos, consists in its particular demographic history: this community experienced admixture at the time of its foundation, which was followed by slow growth and low differentiation. Thus, it was shown how the demographic events of each population influence their respective LD patterns.
|
75 |
Mapeamento genético utilizando a teoria do gráfico da variável adicionada em modelos mistos / Genetic mapping using the theory of the Added Variable Plot in the mixed modelsDuarte, Nubia Esteban 11 May 2012 (has links)
Atualmente, um dos problemas mais importantes da Genética é a identificação de genes associados com doenças complexas. Um delineamento adequado para esta finalidade corresponde à coleta de dados de famílias e plataformas de marcadores moleculares do tipo SNP (do inglês, Single Nucleotide Polimorphism). Estas plataformas representam pontos de referência estrategicamente dispostos ao longo do genoma dos indivíduos e são de alta dimensão. A análise destes dados traz desafios analíticos como o problema de múltiplos testes e a seleção de variáveis preditoras. Nesta tese, propõe-se um critério para discriminar as variáveis preditoras genéticas em efeitos devidos ao componente aleatório poligênico e ao componente residual, sob a estrutura de um modelo linear misto. Também, considerando que o efeito individual das variáveis preditoras é esperado ser pequeno, é sugerido um método para encontrar subconjuntos ordenados destas variáveis e estudar o seu efeito simultâneo sobre a variável resposta em estudo. Neste contexto, utiliza-se a teoria associada ao Gráfico da Variável Adicionada em modelos mistos. As propostas são validadas por meio de um estudo de simulação, o qual é baseado em estruturas de famílias envolvidas no Projeto ``Corações de Baependi\" (InCor/USP), cujo objetivo é identificar genes associados a fatores de risco cardiovascular na população brasileira. Para a implementação dos procedimentos, usa-se o programa R e na geração das variáveis preditoras genéticas adota-se o aplicativo SimPed. / Recently, one of the most important problems in genetics is the identification of genes associated with complex diseases. A useful design for this proposal corresponds to collect data from extended families and molecular markers platforms SNPs (Single Nucleotide polymorphism). These platforms represent points of reference strategically placed along the genome of the individuals and are high dimensional. Analysis of these data brings analytical challenges as the problem of multiple testing and selection of predictive variables. In this thesis, we propose a criterion for discriminating predictors of genetic effects due to random polygenic component and the residual component, under the framework of a linear mixed model. Also, considering that the individual effects of predictor variables is expected to be small, it is suggested a method for finding ordered subsets of these variables and study their simultaneous effect on the response variable under study. In this context, is used the theory of the added variable plot under a mixed model framework. The proposals are validated through a simulation study, which is based on structures of families involved in the Project `` Baependi Heart Study (FAPESP Process 2007/58150-7), whose objective is to identify genes associated with cardiovascular risk factors in the Brazilian population. This proposal is implemented by using the R statistical environment and for the simulation of genetic predictors is adopted the SimPed application.
|
76 |
Estudo genético e genômico da ingestão e eficiência alimentar em bovinos da raça Nelore (Bos indicus) / Genetic and genomic study of intake and feed efficiency in Nellore (Bos indicus) cattleSantana, Miguel Henrique de Almeida 13 December 2013 (has links)
O objetivo dessa pesquisa foi avaliar os parâmetros genéticos e correlações das medidas de ingestão e eficiência alimentar com desempenho e características de carcaça, além de realizar o estudo de associação de amplo genoma (GWAS) para ingestão de matéria seca (IMS), consumo alimentar residual (CAR) e ganho de peso (GMD) em bovinos da raça Nelore (Bos indicus). Foram utilizados dados de 1.058 animais com fenótipo para IMS, taxa de conversão alimentar (CA), CAR, ganho de peso residual (GPR), consumo e ganho residuais (CGR), ganho de peso diário (GMD) e características de carcaça. Os parâmetros genéticos da IMS, CA, CAR, GPR e CGR e suas as correlações com GMD e características de carcaça foram estimados utilizando abordagem bayesiana. Quatro marcadores do tipo SNP (Single Nucleotide Polymorphism), localizados em genes relacionados ao controle de apetite (NPY e PDE3B) e transporte iônico (TRPM3 e ITPR1), foram associados com o desempenho, ingestão e medidas de eficiência alimentar. Adicionalmente, os animais foram genotipados em dois chips distintos (Illumina Bovine HD e Illumina BovineSNP50) e as informações genotípicas foram combinadas por meio de estudo de imputação. As centenas de milhares de SNPs foram utilizadas para o GWAS da IMS, CAR e GMD pelo teste de associação GRAMMAR-Gamma. A herdabilidade da IMS, CAR e CGR foi de 0,40, 0,38 e 0,54, respectivamente. Não foram encontradas associações nos SNPs localizados nos genes TRPM3, NPY e ITPR1, no entanto, o SNP no gene PDE3B foi associados significativamente (P≤0,05) com IMS, CAR e CGR. Os SNPs mais associados com a IMS e CAR, no GWAS, estão localizados nos cromossomos 4, 8, 14 e 21 em regiões genômicas relacionadas com transporte iônico e regulação da ingestão. O GWAS para o GMD apontou os cromossomos 3, 6 e 10 como os que continham os marcadores com maior associação. A ingestão e eficiência alimentar são passíveis de seleção genética, principalmente o CGR. O gene PDE3B deve ser melhor estudado pois, aparenta ter relação com esses fenótipos. Por fim, esse trabalho apontou regiões genômicas, por meio de associação de amplo genoma, relacionadas com a IMS, CAR e GMD, acredita-se ser o primeiro estudo desse tipo para esses fenótipos em animais da raça Nelore. / The aim of this study was to evaluate the genetic parameters and correlations of intake and feed efficiency with performance and carcass traits, and perform the genome-wide association study (GWAS) for dry matter intake (DMI), residual feed intake (RFI) and average daily gain (ADG) in Nelore cattle (Bos indicus). Data from 1,058 animals phenotyped for DMI, feed conversion ratio (FCR), RFI, residual body weight gain (RG), residual intake and body weight gain (RIG), average daily gain (ADG) and carcass traits were used. Genetic parameters of DMI, FCR, RFI, RG and RIG and their correlations with ADG and carcass traits were estimated using Bayesian approach. Four SNPs (Single Nucleotide Polymorphism), located in genes related to appetite control (NPY and PDE3B) and ion transport (TRPM3 and ITPR1), were associated with performance, intake and feed efficiency traits. Additionally, the animals were genotyped in two different chips (Illumina Bovine HD and Illumina BovineSNP50) and genotypic information were combined by imputation. The hundreds of thousands of SNPs were used for GWAS of DMI, RFI and ADG by GRAMMAR-Gamma association test. The heritability of DMI, RFI and RIG was 0.40, 0.38 and 0.54, respectively. No associations were found in SNPs in genes TRPM3, NPY and ITPR1, however, the SNP in PDE3B gene was significantly associated (P≤0.05) with DMI, RFI and RIG. The SNPs most associated with DMI and RFI, in GWAS, are located on chromosomes 4, 8, 14 and 21 in genomic regions associated with ion transport and appetite regulation. The GWAS pointed chromosomes 3, 6 and 10 as those containing more associated markers for ADG. Feed intake and feed efficiency are amenable to genetic selection, especially the RIG. The PDE3B gene should be further studied thus appears to be related to these phenotypes. Finally, this work shows genomic regions by genome-wide association, related to DMI, RFI and ADG, believed to be the first study of its kind for these phenotypes in Nellore cattle.
|
77 |
Mapeamento genético utilizando a teoria do gráfico da variável adicionada em modelos mistos / Genetic mapping using the theory of the Added Variable Plot in the mixed modelsNubia Esteban Duarte 11 May 2012 (has links)
Atualmente, um dos problemas mais importantes da Genética é a identificação de genes associados com doenças complexas. Um delineamento adequado para esta finalidade corresponde à coleta de dados de famílias e plataformas de marcadores moleculares do tipo SNP (do inglês, Single Nucleotide Polimorphism). Estas plataformas representam pontos de referência estrategicamente dispostos ao longo do genoma dos indivíduos e são de alta dimensão. A análise destes dados traz desafios analíticos como o problema de múltiplos testes e a seleção de variáveis preditoras. Nesta tese, propõe-se um critério para discriminar as variáveis preditoras genéticas em efeitos devidos ao componente aleatório poligênico e ao componente residual, sob a estrutura de um modelo linear misto. Também, considerando que o efeito individual das variáveis preditoras é esperado ser pequeno, é sugerido um método para encontrar subconjuntos ordenados destas variáveis e estudar o seu efeito simultâneo sobre a variável resposta em estudo. Neste contexto, utiliza-se a teoria associada ao Gráfico da Variável Adicionada em modelos mistos. As propostas são validadas por meio de um estudo de simulação, o qual é baseado em estruturas de famílias envolvidas no Projeto ``Corações de Baependi\" (InCor/USP), cujo objetivo é identificar genes associados a fatores de risco cardiovascular na população brasileira. Para a implementação dos procedimentos, usa-se o programa R e na geração das variáveis preditoras genéticas adota-se o aplicativo SimPed. / Recently, one of the most important problems in genetics is the identification of genes associated with complex diseases. A useful design for this proposal corresponds to collect data from extended families and molecular markers platforms SNPs (Single Nucleotide polymorphism). These platforms represent points of reference strategically placed along the genome of the individuals and are high dimensional. Analysis of these data brings analytical challenges as the problem of multiple testing and selection of predictive variables. In this thesis, we propose a criterion for discriminating predictors of genetic effects due to random polygenic component and the residual component, under the framework of a linear mixed model. Also, considering that the individual effects of predictor variables is expected to be small, it is suggested a method for finding ordered subsets of these variables and study their simultaneous effect on the response variable under study. In this context, is used the theory of the added variable plot under a mixed model framework. The proposals are validated through a simulation study, which is based on structures of families involved in the Project `` Baependi Heart Study (FAPESP Process 2007/58150-7), whose objective is to identify genes associated with cardiovascular risk factors in the Brazilian population. This proposal is implemented by using the R statistical environment and for the simulation of genetic predictors is adopted the SimPed application.
|
78 |
Herdabilidade e Estudo de Associação Genômica Ampla (GWAS) de atividade física autorreportada: uma investigação de famílias brasileiras / Heritability and Genome-Wide Association Study of self-reported physical Activity: a brazilian family-based investigation.Leite, Jean Michel Rocha Sampaio 09 August 2019 (has links)
O advento das tecnologias de sequenciamento de DNA e sua revolução na ciência tem gerado uma quantidade imensa e sem precedentes de informações moleculares. Assim, estudos atuais em diversas áreas objetivam principalmente analisar a associação entre centenas a milhões de variantes genéticas e fenótipos de interesse. Dentre essas variações moleculares, destaque tem sido dado aos SNPs (polimorfismos de nucleotídeo único) e CNVs (variações no número de cópias), os quais têm sido implicados na variabilidade e manifestação de diversos fenótipos, incluindo os relacionados à atividade fisica e desempenho esportivo. No Brasil, algumas iniciativas têm trazido luz à contribuição genética nessas características, como o Projeto Atletas do Futuro e o Projeto Corações de Baependi. Considerando a alta miscigenação que caracteriza a população brasileira, a qual traz grandes desafios, e levando em conta que este último estudo é pioneiro em considerar a estrutura familiar com uma riqueza de informações moleculares e fenotípicas única, nosso objetivo neste trabalho é, fazendo uso desses dados, investigar o papel de variantes genéticas, em particular SNPs e CNVs, na manifestação de comportamentos sedentários e no engajar em atividade física leve, moderada e intensa, verificando a possível existência de heterogeneidades relativamente ao sexo dos indivíduos. As informações referentes a SNPs e CNVs são provenientes do Affymetrix Genome-Wide Human SNP Array 6.0 que, após processamento e limpeza, consiste de um número final de cerca de 843.039 SNPs e 8.974 CNVs. Dados fenotípicos de atividade física e sedentarismo para 760 indivíduos foram derivados do questionário IPAQ-SF e ajustados por uma medida de gasto energético de equivalentes metabólicos de tarefa (METs). A análise descritiva dessas variáveis mostrou uma prevalência de atividade física de 55,3%, sendo maior para homens que para mulheres. Além disso, utilizando os modelos lineares mistos poligênicos e a abordagem de componentes de variância, estimamos a herdabilidade (h2) desses fenótipos obtendo valores de 0,21, 0,11, 0,22 e 0,28 para atividade física total, leve, moderada-vigorosa e sedentarismo, respectivamente. Foi identificado heterogeneidade em relação ao sexo, em geral com h2 de homens sendo maiores que a de mulheres. O mapeamento gênico (GWAS) de SNPs e CNVs identificou potenciais picos de associação sob a correção de Bonferroni e sob um critério mais flexível, especialmente nos cromossomos 3, 5 e 6. Essas variantes carecem ainda de informação quanto às suas funções biológicas, as quais podem ser melhor compreendidas através de procedimentos de anotação usando bases de dados como o SCAN. / The onset of DNA sequencing technologies and its revolution in Science generates an unprecedent and large amount of molecular information. Thus, the current studies in multiple areas aim to evaluate the association between hundreds to thousands of genetic variants and phenotypes of interest. Among these variants, the ones that have received most of the focus are Single Nucleotide Polymorphisms (SNPs) and Copy Number Variations (CNVs), which have been implicated in the variability and manifestation of multiple phenotypes, including the ones related to physical activity and sports performance. In Brazil, some initiatives have brought light to the genetic contribution in these features, such as the project Atletas do Futuro and the project Corações de Baependi. The later is a pioneer study that considers the pedigree structure of a highly admixed population with a unique and rich amount of molecular and phenotypic information. Thus, our role is to investigate the role of genetic variants, in particular SNPs and CNVs, in the manifestation of sedentary behaviour and practice of light, moderate and vigorous physical activity, checking for the existence of heterogeneity related to sex. SNP and CNV information was acquired through the Affymetrics TM 6.0 SNP Array, processed and cleaned, leading to a final number of 843,039 SNPs. and 8,794 CNVs. Sedentarism and physical activity data of 760 individuals were gathered through the IPAQ-SF and adjusted by a measure of metabolic energy cost named metabolic equivalent tasks (METs). The descriptive analysis showed a total physical activity prevalence of 55.3% and mens one was higher than womens. In addition, using linear mixed polygenic model and the variance components approach, we estimated the heritability of these phenotypes obtaining the values 0.21, 0.11, 0.22 e 0.28 for total, weak, moderate-vigorous physical activities and sedentary behaviour, respectively. There was sex-related heterogeneity in the h2, with men having higher estimates than women for most of the evaluated phenotypes. In addition, GWAS of SNPs and CNVs showed several potential candidate markers, especially after using a more flexible significance criteria. These markers were present mainly in chromosomes 3, 5 and 6, and their possible biological functions remain to be clarified through annotation procedures, using databases such as SCAN.
|
79 |
Seleção genômica ampla em suínos usando o modelo de sobrevivência de Cox / Genomic Wide Selection (GWS) in pigs using the survival model of CoxSantos, Vinicius Silva dos 26 February 2013 (has links)
Made available in DSpace on 2015-03-26T13:32:19Z (GMT). No. of bitstreams: 1
texto completo.pdf: 1498414 bytes, checksum: a554a4debb559e9eaa2ce04ffbc8d4c9 (MD5)
Previous issue date: 2013-02-26 / Fundação de Amparo a Pesquisa do Estado de Minas Gerais / The genomic wide selection (GWS) emerged in 2001 with the goal of increasing efficiency and accelerating the selection gain in genetic improvement based exclusively on markers after their genetic effects estimated from phenotypic data. In the context of survival analysis, Cox s proportional risk model with random effects was compared to the mixed linear model, both using parenthood matrices based on markers in substitution to basing on pedigree, this method being named GBLUP. The application was made on real data from an F2 population of pigs in which the dependent variable was the time in days, from birth to slaughter of the animal and the covariables: SNP markers (238), sex and handled lot. The data was previously corrected for fixed effects and the accuracy of the method was calculated based on the correlation of the ranks of genomic genetic values predicted in both models with the phenotypic values corrected. The analysis was repeated considering the least number of SNP markers that presented the greatest effect in module. The results showed agreement in the prediction of genomic genetic values and estimation of the effects of markers for both models in the situation of uncensored data and normality. However, when considering censored data, the Cox model with normal random effect was more appropriate, since there was no agreement in the prediction of genomic genetic values and estimation of the effects of markers with the mixed linear model with imputed data. The selection of markers allowed an increase in correlations between the positions of genomic genetic values predicted by the linear model and the Cox frailty model with phenotypic values corrected, being that for the characteristic being analyzed, 120 markers were sufficient to increase the predictive power. / A seleção genômica ampla (GWS) surgiu em 2001 com o objetivo de aumentar a eficiência e acelerar o ganho de seleção no melhoramento genético baseando-se exclusivamente em marcadores após terem seus efeitos genéticos estimados a partir de dados fenotípicos. No contexto de análise de sobrevivência, o modelo de riscos proporcionais de Cox com efeito aleatório foi comparado ao modelo linear misto, ambos usando a matriz de parentesco baseada em marcadores em substituição à baseada em pedigree, método esse denominado GBLUP. A aplicação foi feita aos dados reais de uma população F2 de suínos em que a variável resposta foi o tempo em dias, do nascimento até o abate do animal e as covariáveis: marcadores SNPs (238), sexo e lote de manejo. Os dados foram previamente corrigidos para seus efeitos fixos e a acurácia do método foi calculada com base na correlação dos postos dos valores genéticos genômicos preditos em ambos os modelos com os valores fenotípicos corrigidos. A análise foi repetida considerando menor número de marcadores SNPs que apresentassem maiores efeitos em módulo. Os resultados demonstraram concordância na predição dos valores genéticos genômicos e na estimação dos efeitos de marcadores para ambos os modelos na situação de dados não censurados e normalidade. No entanto, ao considerar a censura, o modelo de Cox com efeito aleatório normal foi o mais apropriado, uma vez que não houve concordância na predição dos valores genéticos genômicos e na estimação dos efeitos de marcadores com o modelo linear misto com dados imputados. A seleção de marcas permitiu um aumento nas correlações entre os postos dos valores genéticos genômicos preditos pelo modelo linear e pelo modelo de fragilidade de Cox com os valores fenotípicos corrigidos, sendo que para a característica analisada, 120 marcadores foram suficientes para maximizar a capacidade preditiva.
|
80 |
Associating genotype sequence properties to haplotype inference errorsROSA, Rogério dos Santos 12 March 2015 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2016-03-16T15:28:47Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
RogerioSantosRosa_Tese.pdf: 1740026 bytes, checksum: aa346f64c34419c4b83269ccb99ade6a (MD5) / Made available in DSpace on 2016-03-16T15:28:48Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
RogerioSantosRosa_Tese.pdf: 1740026 bytes, checksum: aa346f64c34419c4b83269ccb99ade6a (MD5)
Previous issue date: 2015-03-12 / Haplotype information has a central role in the understanding and diagnosis of certain
illnesses, and also for evolution studies. Since that type of information is hard to obtain directly,
computational methods to infer haplotype from genotype data have received great attention
from the computational biology community. Unfortunately, haplotype inference is a very hard
computational biology problem and the existing methods can only partially identify correct
solutions. I present neural network models that use different properties of the data to predict
when a method is more prone to make errors. I construct models for three different Haplotype
Inference approaches and I show that our models are accurate and statistically relevant. The
results of our experiments offer valuable insights on the performance of those methods, opening
opportunity for a combination of strategies or improvement of individual approaches. I formally
demonstrate that Linkage Disequilibrium (LD) and heterozygosity are very strong indicators
of Switch Error tendency for four methods studied, and I delineate scenarios based on LD
measures, that reveal a higher or smaller propension of the HI methods to present inference
errors, so the correlation between LD and the occurrence of errors varies among regions along
the genotypes. I present evidence that considering windows of length 10, immediately to the
left of a SNP (upstream region), and eliminating the non-informative SNPs through Fisher’s
Test leads to a more suitable correlation between LD and Inference Errors. I apply Multiple
Linear Regression to explore the relevance of several biologically meaningful properties of the
genotype sequences for the accuracy of the haplotype inference results, developing models for
two databases (considering only Humans) and using two error metrics. The accuracy of our
results and the stability of our proposed models are supported by statistical evidence. / Haplótipos têm um papel central na compreensão e diagnóstico de determinadas doenças
e também para estudos de evolução. Este tipo de informação é difícil de obter diretamente,
diante disto, métodos computacionais para inferir haplótipos a partir de dados genotípicos têm
recebido grande atenção da comunidade de biologia computacional. Infelizmente, a Inferência
de Halótipos é um problema difícil e os métodos existentes só podem predizer parcialmente
soluções corretas. Foram desenvolvidos modelos de redes neurais que utilizam diferentes
propriedades dos dados para prever quando um método é mais propenso a cometer erros. Foram
calibrados modelos para três abordagens de Inferência de Haplótipos diferentes e os resultados
validados estatisticamente. Os resultados dos experimentos oferecem informações valiosas sobre
o desempenho e comportamento desses métodos, gerando condições para o desenvolvimento
de estratégias de combinação de diferentes soluções ou melhoria das abordagens individuais.
Foi demonstrado que Desequilíbrio de Ligação (LD) e heterozigosidade são fortes indicadores
de tendência de erro, desta forma foram delineados cenários com base em medidas de LD, que
revelam quando um método tem maior ou menor propensão de cometer erros. Foi identificado
que utilizando janelas de 10 SNPs (polimorfismo de um único nucleotídeo), imediatamente a
montante, e eliminando os SNPs não informativos pelo Teste de Fisher leva-se a uma correlação
mais adequada entre LD e a ocorrência de erros. Por fim, foi aplicada análise de Regressão Linear
para explorar a relevância de várias propriedades biologicamente significativas das sequências de
genótipos para a precisão dos resultados de Inferência de Haplótipos, estimou-se modelos para
duas bases de dados (considerando apenas humanos) utilizando duas métricas de erro. A precisão
dos resultados e a estabilidade dos modelos propostos foram validadas por testes estatísticos.
|
Page generated in 0.0458 seconds