81 |
Associação entre polimorfismos de base única com perfil de ácidos graxos da carne em bovinos da raça Nelore, utilizando painéis de alta densidade / Association study of single nucleotide polymorphisms with fatty acid profile of the Nellore meat using high-density panelsRezende, Romulo Germano de 12 February 2015 (has links)
Há grande preocupação por parte da população com o consumo de gorduras saturadas, e a carne bovina é geralmente tida como importante fonte da mesma. A gordura intramuscular não pode ser separada da carne para o consumo, por isso a manipulação do perfil de ácidos graxos da carne (AG's) se torna de suma importância para se obter uma carne bovina com riscos reduzidos a saúde humana. Este estudo teve como objetivo identificar regiões que influenciam na composição de AG's da carne de bovinos Nelore.para isso foi realizado análise de perfil de ácidos graxos para quantificação de ácido esteárico (C18:0), ácido palmítico (C16:0), ácido linoleico (C:18:2; 9,12 ω6), ácido linoleico conjugado (CLA) (C18:2; c9, t11), ácido linolênico (C18:3; 9,12,15 ω3), ácido oleico (C18:1; 9 ω9), do músculo Longissimus dorsi de 929 animais, que foram genotipados com o chip de alta densidade (Illumina SNP800 BeadChip).para a realização do estudo de associação ampla de genoma (GWAS), para a identificação de regiões associadas às características de interesse , e posterior identificação de genes candidatos posicionais. Para isto foram utilizados 929 bovinos da raça Nelore para a genotipagem com chip de 770K, amostras do músculo Longissimus dorsi foram coletadas para análise do perfil de AG's. Foram encontradas 148 regiões que explicam mais do que 0,04% da composição dos seis AG's avaliados. As regiões explicam em porcentagem da variação fenotípica: 1,24% para C18:0, 1,01% para C16:0, 2,31% para:18:2;, 1,34% para CLA C18:2;, 1,74% para C18:3, 1,83% para C18:1. Foram encontrados no presente estudo, 85 QTL's descritos na literatura relacionados a outras raças. Um total de 107 genes candidatos posicionais foram encontrados no presente estudo relacionados ao metabolismo de AG's. Os resultados deste estudo ajudam a elucidar as regiões que influenciam o perfil de AG da carne possibilitando sua utilização em programas de seleção assistida, com impacto a saúde humana / There is great concern among the population with the consumption of saturated fats, and beef is generally viewed as an important source of it. Intramuscular fat can not be separated from meat for consumption, so the handling of the meat fatty acid profile (AG's) becomes extremely important to obtain a beef with reduced risks to human health. This study aimed to identify regions that influence the AG's composition of Nelore meat there for was accomplished profile analysis of fatty acids for quantification of stearic acid (C18: 0), palmitic acid (C16: 0), linoleic acid (C: 18: 2; 9.12 - ω6), conjugated linoleic acid (CLA) (C18: 2; c9, t11), linolenic acid (C18: 3; 9,12,15 - ω3), oleic acid (C18 1; 9 ω9), of Longissimus dorsi of 929 animals genotyped with high density chip (Illumina BeadChip SNP800) for the realization of wide genome association study (GWAS), for identify regions associated with characteristics of interest, and subsequent identification of positional candidate genes. 929 Nelore bulls were genotyped with 770K chip, muscle Longissimus dorsi samples were collected for analysis of the AG's profile. 148 regions able to explaining more than 0.04% of the composition of the six AG's evaluated. The regions account for a percentage of the phenotypic variation: 1.24% for C18:0, 1.01% for C16:0, 2.31% for 18:2 ;, 1.34% CLA C18:2; 1 74% of C18: 3, 1.83% for C18:1. Were found in this study, 85 QTL described in the literature related to other breeds. A total of 107 positional candidate genes were foundin this study associated with fatty acids metabolism. The results of this study help to elucidate the regions that influence the AG profile of the meat allowing their use in assisted selection programs, impacting human health
|
82 |
Unraveling important genetic associations and differential methylation profiles using reduced genome sequencing in chickens / Desvendando associações genéticas importantes e perfis de metilação diferenciais utilizando sequenciamento reduzido do genoma da galinhaFábio Pértille 01 November 2016 (has links)
Chickens are ideal model organism to improve understanding of several research areas as phylogenetic, embryology, biomedicine, livestock, and have recently been suggested as a promising model for epigenetic studies. In the livestock area, chickens are source of protein to humans and had been selected to achieve a high production standards based on genetic breeding by the traditional selection. We are now in the genomics and epigenomics era and it is time be concern about the use of new tools to improve selection not only thinking about production, but also in the health and welfare of animals. The use of molecular approaches, have been a fundamental tool to understand biological models and improve selection strategies based on genomic information in breeding programs. Molecular approaches have also contributed to understanding of the evolutionary history of these models and the genetics and epigenetics mechanisms involved in evolution process and genetic diversification of chickens. In this context, many technologies have emerged to produce high-throughput data using Next-generation sequencing (NGS) approaches. NGS provided a large amount of information for diverse purposes such as to detect single nucleotide polymorphisms (SNPs), and methylated DNA profiles in chickens. In addition, NGS has allowed the development of pre-designed SNP arrays for genome-wide association studies (GWAS) with specific phenotypes of interest. Moreover, although NGS has enough power to detect informative polymorphisms, its high cost makes it impractical to be used in GWAS and Methylated DNA immunoprecipitation sequencing (MeDIPseq) studies. The demand for an economical, efficient, simple-step and reliable genome-wide method of SNPs discovery, validation and characterization, was the reason for the development of this study. We applied reduced representation sequence by restriction enzyme (RE) cleavage of target chicken genome to be applied in GWAS. Thereafter, to combine the reduced representation of the genome with MeDIPseq method, we developed a novel approach to perform differential methylation studies using reduced libraries. These works allowed us to identify SNPs associated with performance traits and differential methylation windows related to different stress conditions in chickens. / A galinha é um organismo modelo ideal para melhorar o entendimento de diversas áreas da pesquisa como: filogenética, embriologia, biomedicina, pecuária, e tem sido recentemente sugerida como um modelo promissor para estudos em epigenética. Na pecuária, as galinhas são fonte de proteína para os seres humanos e tem sido alvo de seleção para alcançar um alto padrão de produção com base no melhoramento genético tradicional. Mas agora, estamos na era genômica e epigenômica e as atenções devem ser voltadas para o uso de novas ferramentas para melhorar a seleção não só pensando em produção, mas também na saúde e bem-estar dos animais. O uso de abordagens moleculares, tem sido uma ferramenta fundamental para compreender modelos biológicos e melhorar as estratégias de seleção baseadas na informação genômica em programas de melhoramento. Abordagens moleculares, também tem contribuído para a compreensão da história evolutiva desses modelos e os mecanismos genéticos e epigenéticos envolvidos no processo de evolução e diversificação genética das galinhas. Neste contexto, tecnologias evoluíram para produção de dados de sequenciamento de alto rendimento por sequenciamento de próxima geração (NGS). NGS forneceu uma grande quantidade de informação a ser utilizado para diversos fins, como para detectar polimorfismos de nucleotídeo único (SNPs) e perfis de metilação diferencial do DNA em galinhas. NGS tem permitido também o desenvolvimento de painéis de SNP para testes de associações genômica ampla (GWAS) com fenótipos específicos de interesse. Embora NGS tem poder suficiente para detectar polimorfismos informativos, o seu elevado custo o torna impraticável para ser utilizado em GWAS ou estudos de metilação diferencial por sequenciamento de DNA metilado por imunoprecipitação (MeDIPseq). A procura de um método de genotipagem eficiente, simples, econômico e confiável para descoberta, caracterização e validação de SNPs, foi a razão para o desenvolvimento deste estudo. Utilizamos sequenciamento do genoma reduzido por enzima de restrição (RE) que cliva o genoma alvo para identificação de SNPs nestas bibliotecas reduzidas e aplicação deste método em GWAS. Em seguida, para combinar a representação reduzida do genoma com o método MeDIPS, desenvolvemos uma nova abordagem para a realização de estudos de metilação diferencial utilizando as bibliotecas reduzidas. Estes trabalhos permitiram a identificação de SNPs associados com características de desempenho e janelas de metilação diferencial relacionados a diferentes condições de manejo em galinhas.
|
83 |
Estudo de associação genômica ampla para as diferenças genéticas entre as marchas batida e picada em equinos Mangalarga Marchador / Genome-wide association study for the genetic differences between marcha batida and marcha picada gaits in Mangalarga Marchador equineBussiman, Fernando de Oliveira 13 December 2018 (has links)
O gene DMRT3 tem sido descrito como o principal gene a atuar na determinação da marcha em diversas raças equinas. O alelo A do SNP 23:g.22999655C>A do DMRT3 foi apontado como responsável por essa característica. Na raça brasileira Mangalarga Marchador, a qual apresenta dois padrões de marcha com características bem definidas, os genótipos AA e CA vem sendo associados à marcha picada e o genótipo CC à marcha batida. O objetivo geral do presente prospectar regiões genômicas associadas às marchas batida e picada em equinos Mangalarga Marchador. Foram utilizados 1.230 dados fenotípicos sobre o tipo de andamento (marcha batida N = 1.006; marcha picada N = 227) e, considerando a totalidade da genealogia conhecida para cada animal, 3172 animais no pedigree. Primeiramente foram testadas estratégias de modelagem para esta característica a fim de determinar os efeitos a serem considerados no modelo, bem como a melhor forma de inclusão (efeito fixo ou aleatório). Posteriormente, foi estudada a relação entre as frequências alélicas e genotípicas do gene DMRT3 com os padrões de parentesco e endogamia de acordo com cada tipo de marcha. Um estudo de associação genômica ampla em passo único (considerando informações de animais genotipados e não-genotipados simultaneamente) foi conduzido para verificar regiões genômicas, polimorfismos de nucleotídeo único e genes relacionados com a determinação do tipo de marcha em cavalos Mangalarga Marchador. Vinte e dois polimorfismos de nucleotídeo único localizados nos cromossomos 4(N = 5), 6 (2), 16 (1), 23 (11), 26 (1) e 29 (2), foram responsáveis por 42,43% da variância genética aditiva. Foram associados ao tipo de marcha 69 genes, mas cerca de 39 não estavam anotados em equinos. Foi conduzido um blast a fim de recuperar a função mais provável destes genes. Foram encontradas oito vias metabólicas associadas ao tipo de marcha. Os principais genes envolvidos estavam relacionados à percepção de estímulos externos, metabolismo energético-oxidativo, sistema imune e aprendizado e ritmo da locomoção. Não foi possível identificar a(s) variante(s) causal(ais) do tipo de marcha, contudo este estudo foi o primeiro e verificar que a possível determinação genética do tipo de marcha em cavalos Mangalarga Marchador passa por diferenças em níveis metabólicos que garantem a adaptação dos animais ao tipo de andamento. / The DMRT3 gene has been described as the main gene to act in gait determination in several equine breeds. The allele A of the SNP 23:g.22999655C>A of DMRT3 gene was identified as responsible for this trait. In the Brazilian Mangalarga Marchador breed, which presents two gait patterns with characteristics well defined, the AA and CA genotypes have been associated with marcha picada gait and CC genotype with marcha batida gait. The general aim of this study was to prospect genomic regions associated with marcha batida and marcha picada gaits in Mangalarga Marchador equines. 1,230 phenotypic data were used on the type of gait (marcha batida N = 1.006; marcha picada N = 227) and, considering the totality of known genealogy for each animal, 3,172 animals in the pedigree. Firstly, modelling strategies were tested for this trait in order to determine the effects to be considered in the model, as well as the best form of inclusion (fixed or random effect). Based on the best modelling strategy to be used, the relationship between the allelic and genotypic frequencies of the DMRT3 gene with kinship and inbreeding patterns was studied according to each type of gait. A single-step wide genomic association study (considering information from both genotyped and non-genotyped animals simultaneously) was conducted to verify genomic regions, single nucleotide polymorphisms and genes related to determination of gait type in Mangalarga Marchador horses. Twenty two single nucleotide polymorphisms located on chromosomes 4 (N = 5), 6 (2), 16 (1), 23 (11), 26 (1) and 29 (2) were responsible for 42.43% of the additive genetic variance. 69 genes were associated with gait type, but about 39 were not annotated in horses. A blast was conducted in order to recover the most likely function of these genes. Eight metabolic pathways were found associated with gait type and the main genes involved were related to the perception of external stimuli, energy-oxidative metabolism, immune system and learning and rhythm of locomotion. It was not possible to identify the causal variant(s) of the type of gait; however, this study was the first and to verify that the possible genetic determination of gait type in Mangalarga Marchador horses goes through differences in the metabolic levels that guarantee the adaptation of the animals to the type of gait.
|
84 |
Herdabilidade e Estudo de Associação Genômica Ampla (GWAS) de atividade física autorreportada: uma investigação de famílias brasileiras / Heritability and Genome-Wide Association Study of self-reported physical Activity: a brazilian family-based investigation.Leite, Jean Michel Rocha Sampaio 09 August 2019 (has links)
O advento das tecnologias de sequenciamento de DNA e sua revolução na ciência tem gerado uma quantidade imensa e sem precedentes de informações moleculares. Assim, estudos atuais em diversas áreas objetivam principalmente analisar a associação entre centenas a milhões de variantes genéticas e fenótipos de interesse. Dentre essas variações moleculares, destaque tem sido dado aos SNPs (polimorfismos de nucleotídeo único) e CNVs (variações no número de cópias), os quais têm sido implicados na variabilidade e manifestação de diversos fenótipos, incluindo os relacionados à atividade fisica e desempenho esportivo. No Brasil, algumas iniciativas têm trazido luz à contribuição genética nessas características, como o Projeto Atletas do Futuro e o Projeto Corações de Baependi. Considerando a alta miscigenação que caracteriza a população brasileira, a qual traz grandes desafios, e levando em conta que este último estudo é pioneiro em considerar a estrutura familiar com uma riqueza de informações moleculares e fenotípicas única, nosso objetivo neste trabalho é, fazendo uso desses dados, investigar o papel de variantes genéticas, em particular SNPs e CNVs, na manifestação de comportamentos sedentários e no engajar em atividade física leve, moderada e intensa, verificando a possível existência de heterogeneidades relativamente ao sexo dos indivíduos. As informações referentes a SNPs e CNVs são provenientes do Affymetrix Genome-Wide Human SNP Array 6.0 que, após processamento e limpeza, consiste de um número final de cerca de 843.039 SNPs e 8.974 CNVs. Dados fenotípicos de atividade física e sedentarismo para 760 indivíduos foram derivados do questionário IPAQ-SF e ajustados por uma medida de gasto energético de equivalentes metabólicos de tarefa (METs). A análise descritiva dessas variáveis mostrou uma prevalência de atividade física de 55,3%, sendo maior para homens que para mulheres. Além disso, utilizando os modelos lineares mistos poligênicos e a abordagem de componentes de variância, estimamos a herdabilidade (h2) desses fenótipos obtendo valores de 0,21, 0,11, 0,22 e 0,28 para atividade física total, leve, moderada-vigorosa e sedentarismo, respectivamente. Foi identificado heterogeneidade em relação ao sexo, em geral com h2 de homens sendo maiores que a de mulheres. O mapeamento gênico (GWAS) de SNPs e CNVs identificou potenciais picos de associação sob a correção de Bonferroni e sob um critério mais flexível, especialmente nos cromossomos 3, 5 e 6. Essas variantes carecem ainda de informação quanto às suas funções biológicas, as quais podem ser melhor compreendidas através de procedimentos de anotação usando bases de dados como o SCAN. / The onset of DNA sequencing technologies and its revolution in Science generates an unprecedent and large amount of molecular information. Thus, the current studies in multiple areas aim to evaluate the association between hundreds to thousands of genetic variants and phenotypes of interest. Among these variants, the ones that have received most of the focus are Single Nucleotide Polymorphisms (SNPs) and Copy Number Variations (CNVs), which have been implicated in the variability and manifestation of multiple phenotypes, including the ones related to physical activity and sports performance. In Brazil, some initiatives have brought light to the genetic contribution in these features, such as the project Atletas do Futuro and the project Corações de Baependi. The later is a pioneer study that considers the pedigree structure of a highly admixed population with a unique and rich amount of molecular and phenotypic information. Thus, our role is to investigate the role of genetic variants, in particular SNPs and CNVs, in the manifestation of sedentary behaviour and practice of light, moderate and vigorous physical activity, checking for the existence of heterogeneity related to sex. SNP and CNV information was acquired through the Affymetrics TM 6.0 SNP Array, processed and cleaned, leading to a final number of 843,039 SNPs. and 8,794 CNVs. Sedentarism and physical activity data of 760 individuals were gathered through the IPAQ-SF and adjusted by a measure of metabolic energy cost named metabolic equivalent tasks (METs). The descriptive analysis showed a total physical activity prevalence of 55.3% and mens one was higher than womens. In addition, using linear mixed polygenic model and the variance components approach, we estimated the heritability of these phenotypes obtaining the values 0.21, 0.11, 0.22 e 0.28 for total, weak, moderate-vigorous physical activities and sedentary behaviour, respectively. There was sex-related heterogeneity in the h2, with men having higher estimates than women for most of the evaluated phenotypes. In addition, GWAS of SNPs and CNVs showed several potential candidate markers, especially after using a more flexible significance criteria. These markers were present mainly in chromosomes 3, 5 and 6, and their possible biological functions remain to be clarified through annotation procedures, using databases such as SCAN.
|
85 |
Associação aditiva, dominante e epistática de SNPs à produção e composição do leite em vacas da raça Holandesa / Additive, dominance and epistatic association with milk yield and composition in Holstein cattleLaiza Helena de Souza Iung 17 July 2014 (has links)
O leite bovino é um alimento essencial na nutrição humana, principalmente para os mais jovens por ser uma fonte importante de proteínas, minerais e vitaminas. A crescente demanda por quantidade e qualidade de leite nos últimos anos tem impulsionado inúmeras pesquisas, principalmente em relação ao perfil de ácidos graxos por diferir substancialmente das exigências humanas. Nutrição e melhoramento genético são os principais fatores capazes de promover a alteração da qualidade nutricional do leite. Por muito tempo as mudanças alcançadas via melhoramento genético foram obtidas exclusivamente com base na genética quantitativa, mas a partir dos anos 90 o interesse nesta área passou a ser divido com a genética molecular. Os avanços alcançados na biologia molecular obtidos por meio do mapeamento e sequenciamento do genoma das diversas espécies e de estudos de associação fenótipo-genótipo vêm auxiliando a explicar o fundo genético das características quantitativas. Atualmente, a maioria dos estudos de associação fenótipo-genótipo foram delineados para estimar apenas efeitos genéticos aditivos em um único lócus. No entanto, parte da variação observada nestes fenótipos resultam da interação entre loci ou genes, tornando estes estudos fundamentais para conhecer a origem da variação biológica destas características. Assim, os objetivos deste estudo foram: I) Associar polimorfismos de nucleotídeo único (SNPs) com características produtivas e o perfil de ácidos graxos no leite; e II) Identificar interações entre os SNPs associados a estas características no leite de bovinos da raça Holandesa. Fenótipo ajustado de 760 vacas para o efeito fixo de grupo de contemporâneo e covariáveis dias em lactação, idade à mensuração e produção de leite, e 6.553 SNPs foram considerados para realizar a associação por meio de regressão SNP a SNP. No total nove SNPs foram associados a uma ou mais características relacionadas ao teor de gordura e perfil de ácidos graxos. Algumas destas associações evidenciam a presença de epistasia e/ou pleiotropia entre estas regiões. Para a identificação de interação entre os SNPs, foram usados modelos que consideraram os efeitos individuais (aditivo e dominante) e os efeitos individuais e de interação entre os nove SNPs para comparação por meio do teste de razão de verossimilhança (LRT). Foi observado efeito epistático aditivo x dominante (P < 0,01) somente entre os marcadores ARS-BFGL-NGS-71749 e ARS-BFGL-NGS-34135, ambos situados no cromossomo 14 bovino (BTA14), para as características teor de ácidos graxos saturados e teor de ácido palmítico (C16:0). Para o melhor entendimento da sua interação biológica existe ainda a necessidade de maior conhecimento sobre as rotas metabólicas em que tais genes identificados estão situados estes marcadores. Mais estudos nestas regiões cromossômicas possibilitarão ampliar o conhecimento sobre os genes e suas interações. / Bovine milk is an essential food in human nutrition, especially for younger people for being as important source of proteins, minerals and vitamins. The growing for quantity and quality for milk in recent years has stimulated numerous studies, especially regarding the fatty acid profile by differ substantially of human requirements. Nutrition and animal breeding are the main factors which would enhance change the nutritional quality of cow milk. For a long time the changes achieved by animal breeding were obtained purely based on quantitative genetics, but from 90 the interest in this area came to be divided with molecular genetics. The advances made in the molecular biology obtained through the mapping and sequencing of the genomes of different species and genome-wide association studies is helping to explain more about the genetic background of quantitative traits. Currently, most of genome-wide association studies were designed to estimate additive genetic effects only at a single locus, excluding additional effects. However, part of the observed variation in these phenotypes result from the interaction between genes or loci, thus, such studies are also important for the understanding of the origin of biological variation of these traits, such as their metabolic and biochemical pathways. The aims of this study were: I) Associate single nucleotide polymorphisms (SNPs) with production traits and fatty acid profile in milk; and II) Identify interactions between SNPs associated with these traits in milk from Holstein cows. Phenotype adjusted of 760 cows for the fixed effects of contemporary group and covariates days in milk, age at measurement and milk yield, and information from 6,553 SNPs were considered for performing the association using single SNP regression method. A total of nine SNPs were associated with one or more traits related to the fat percentage and fatty acid profile. Some of these associations showed the presence of epistasis and/or pleiotropy between these regions. To identify interaction between SNPs, models that consider the individual effects (additive and dominance); and individual and interaction effects between the nine SNPs for comparison using the likelihood ratio test (LRT). Additive x dominance epistatic effect (P < 0.01) was observed only between markers ARS-BFGL-NGS- 71749 and ARS-BFGL-NGS-34135, both located on chromosome 14 (Bos taurus autossome, BTA14), for fat percentage (FP), saturated fatty acids (SFA) and palmitic acid (C16:0). For a better understanding of its biological interaction there is a need for greater knowledge of the metabolic pathways in with these genes identified these markers are located. More studies will enable these chromosomal regions expand knowledge about genes and their interactions.
|
86 |
Uso de random forests e redes biológicas na associação de poliformismos à doença de AlzheimerARAÚJO, Gilderlanio Santana de 07 March 2013 (has links)
Submitted by Irene Nascimento (irene.kessia@ufpe.br) on 2016-10-18T19:17:10Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertacao -Gilderlanio Santana de Araujo.pdf: 9533988 bytes, checksum: 951b1cf090729a87ebf3a8741ff00ad4 (MD5) / Made available in DSpace on 2016-10-18T19:17:10Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertacao -Gilderlanio Santana de Araujo.pdf: 9533988 bytes, checksum: 951b1cf090729a87ebf3a8741ff00ad4 (MD5)
Previous issue date: 2013-03-07 / FACEPE / O desenvolvimento de técnicas de genotipagem de baixo custo (SNP arrays) e as
anotações de milhares de polimorfismos de nucleotídeo único (SNPs) em bancos de
dados públicos têm originado um crescente número de estudos de associação em
escala genômica (do inglês, Genome-Wide Associations Studies - GWAS). Nesses
estudos, um enorme número de SNPs (centenas de milhares) são avaliados com
métodos estatísticos univariados de forma a encontrar SNPs associados a um
determinado fenótipo. Testes univariados são incapazes de capturar relações de alta
ordem entre os SNPs, algo comum em doenças genéticas complexas e são afetados
pela alta correlação entre SNPs na mesma região genômica. Métodos de aprendizado
de máquina, como o Random Forest (RF), têm sido aplicados em dados de GWAS
para realizar a previsão de riscos de doenças e capturar os SNPs associados às
mesmas. Apesar de RF ser um método com reconhecido desempenho em dados de
alta dimensionalidade e na captura de relações não-lineares, o uso de todos os SNPs
presentes em um estudo GWAS é computacionalmente inviável. Neste estudo
propomos o uso de redes biológicas para a seleção inicial de SNPs candidatos a serem
usados pela RF. A partir de um conjunto inicial de genes já relacionados à doença na
literatura, usamos ferramentas de redes de interação gene-gene, para encontrar novos
genes que possam estar associados a doença. Logo, é possível extrair um número
reduzido de SNPs tornando a aplicação do método RF viável. Os experimentos
realizados nesse estudo concentram-se em investigar quais polimorfismos podem
influenciar na suscetibilidade à doença de Alzheimer (DA) e ao comprometimento
cognitivo leve (MCI). O resultado final das análises é a delineação de uma
metodologia para o uso de RF, para a análise de dados de GWAS, assim como a
caracterização de potenciais fatores de riscos da DA. / The development of low cost genotyping techniques (SNP arrays) and annotations of
thousands of single nucleotide polymorphisms (SNPs) in public databases has led to
an increasing number of Genome-Wide Associations Studies (GWAS). In these
studies, a large number of SNPs (hundreds of thousands) are evaluated with univariate
statistical methods in order to find SNPs associated with a particular phenotype.
Univariate tests are unable to capture high-order relationships among SNPs, which are
common in complex genetic diseases, and are affected by the high correlation
between SNPs at the same genomic region. Machine learning methods, such as the
Random Forest (RF), have been applied to GWAS data to perform the prediction of
the risk of diseases and capture a set of SNPs associated with them. Although, RF is a
method with recognized performance in high dimensional data and capacity to capture
non-linear relationships, the use of all SNPs present in GWAS data is computationally
intractable. In this study we propose the use of biological networks for the initial
selection of candidate SNPs to be used by RF. From an initial set of genes already
related to a disease based on the literature, we use tools for construct gene-gene
interaction networks, to find novel genes that might be associated with disease.
Therefore, it is possible to extract a small number of SNPs making the method RF
feasible. The experiments conducted in this study focus on investigating which
polymorphisms may influence the susceptibility of Alzheimer’s disease (AD) and
mild cognitive impairment (MCI). This work presents a delineation of a methodology
on using RF for analysis of GWAS data, and characterization of potential risk factors
for AD.
|
87 |
Estudo genético e genômico da ingestão e eficiência alimentar em bovinos da raça Nelore (Bos indicus) / Genetic and genomic study of intake and feed efficiency in Nellore (Bos indicus) cattleMiguel Henrique de Almeida Santana 13 December 2013 (has links)
O objetivo dessa pesquisa foi avaliar os parâmetros genéticos e correlações das medidas de ingestão e eficiência alimentar com desempenho e características de carcaça, além de realizar o estudo de associação de amplo genoma (GWAS) para ingestão de matéria seca (IMS), consumo alimentar residual (CAR) e ganho de peso (GMD) em bovinos da raça Nelore (Bos indicus). Foram utilizados dados de 1.058 animais com fenótipo para IMS, taxa de conversão alimentar (CA), CAR, ganho de peso residual (GPR), consumo e ganho residuais (CGR), ganho de peso diário (GMD) e características de carcaça. Os parâmetros genéticos da IMS, CA, CAR, GPR e CGR e suas as correlações com GMD e características de carcaça foram estimados utilizando abordagem bayesiana. Quatro marcadores do tipo SNP (Single Nucleotide Polymorphism), localizados em genes relacionados ao controle de apetite (NPY e PDE3B) e transporte iônico (TRPM3 e ITPR1), foram associados com o desempenho, ingestão e medidas de eficiência alimentar. Adicionalmente, os animais foram genotipados em dois chips distintos (Illumina Bovine HD e Illumina BovineSNP50) e as informações genotípicas foram combinadas por meio de estudo de imputação. As centenas de milhares de SNPs foram utilizadas para o GWAS da IMS, CAR e GMD pelo teste de associação GRAMMAR-Gamma. A herdabilidade da IMS, CAR e CGR foi de 0,40, 0,38 e 0,54, respectivamente. Não foram encontradas associações nos SNPs localizados nos genes TRPM3, NPY e ITPR1, no entanto, o SNP no gene PDE3B foi associados significativamente (P≤0,05) com IMS, CAR e CGR. Os SNPs mais associados com a IMS e CAR, no GWAS, estão localizados nos cromossomos 4, 8, 14 e 21 em regiões genômicas relacionadas com transporte iônico e regulação da ingestão. O GWAS para o GMD apontou os cromossomos 3, 6 e 10 como os que continham os marcadores com maior associação. A ingestão e eficiência alimentar são passíveis de seleção genética, principalmente o CGR. O gene PDE3B deve ser melhor estudado pois, aparenta ter relação com esses fenótipos. Por fim, esse trabalho apontou regiões genômicas, por meio de associação de amplo genoma, relacionadas com a IMS, CAR e GMD, acredita-se ser o primeiro estudo desse tipo para esses fenótipos em animais da raça Nelore. / The aim of this study was to evaluate the genetic parameters and correlations of intake and feed efficiency with performance and carcass traits, and perform the genome-wide association study (GWAS) for dry matter intake (DMI), residual feed intake (RFI) and average daily gain (ADG) in Nelore cattle (Bos indicus). Data from 1,058 animals phenotyped for DMI, feed conversion ratio (FCR), RFI, residual body weight gain (RG), residual intake and body weight gain (RIG), average daily gain (ADG) and carcass traits were used. Genetic parameters of DMI, FCR, RFI, RG and RIG and their correlations with ADG and carcass traits were estimated using Bayesian approach. Four SNPs (Single Nucleotide Polymorphism), located in genes related to appetite control (NPY and PDE3B) and ion transport (TRPM3 and ITPR1), were associated with performance, intake and feed efficiency traits. Additionally, the animals were genotyped in two different chips (Illumina Bovine HD and Illumina BovineSNP50) and genotypic information were combined by imputation. The hundreds of thousands of SNPs were used for GWAS of DMI, RFI and ADG by GRAMMAR-Gamma association test. The heritability of DMI, RFI and RIG was 0.40, 0.38 and 0.54, respectively. No associations were found in SNPs in genes TRPM3, NPY and ITPR1, however, the SNP in PDE3B gene was significantly associated (P≤0.05) with DMI, RFI and RIG. The SNPs most associated with DMI and RFI, in GWAS, are located on chromosomes 4, 8, 14 and 21 in genomic regions associated with ion transport and appetite regulation. The GWAS pointed chromosomes 3, 6 and 10 as those containing more associated markers for ADG. Feed intake and feed efficiency are amenable to genetic selection, especially the RIG. The PDE3B gene should be further studied thus appears to be related to these phenotypes. Finally, this work shows genomic regions by genome-wide association, related to DMI, RFI and ADG, believed to be the first study of its kind for these phenotypes in Nellore cattle.
|
88 |
Associação entre polimorfismos de base única com perfil de ácidos graxos da carne em bovinos da raça Nelore, utilizando painéis de alta densidade / Association study of single nucleotide polymorphisms with fatty acid profile of the Nellore meat using high-density panelsRomulo Germano de Rezende 12 February 2015 (has links)
Há grande preocupação por parte da população com o consumo de gorduras saturadas, e a carne bovina é geralmente tida como importante fonte da mesma. A gordura intramuscular não pode ser separada da carne para o consumo, por isso a manipulação do perfil de ácidos graxos da carne (AG's) se torna de suma importância para se obter uma carne bovina com riscos reduzidos a saúde humana. Este estudo teve como objetivo identificar regiões que influenciam na composição de AG's da carne de bovinos Nelore.para isso foi realizado análise de perfil de ácidos graxos para quantificação de ácido esteárico (C18:0), ácido palmítico (C16:0), ácido linoleico (C:18:2; 9,12 ω6), ácido linoleico conjugado (CLA) (C18:2; c9, t11), ácido linolênico (C18:3; 9,12,15 ω3), ácido oleico (C18:1; 9 ω9), do músculo Longissimus dorsi de 929 animais, que foram genotipados com o chip de alta densidade (Illumina SNP800 BeadChip).para a realização do estudo de associação ampla de genoma (GWAS), para a identificação de regiões associadas às características de interesse , e posterior identificação de genes candidatos posicionais. Para isto foram utilizados 929 bovinos da raça Nelore para a genotipagem com chip de 770K, amostras do músculo Longissimus dorsi foram coletadas para análise do perfil de AG's. Foram encontradas 148 regiões que explicam mais do que 0,04% da composição dos seis AG's avaliados. As regiões explicam em porcentagem da variação fenotípica: 1,24% para C18:0, 1,01% para C16:0, 2,31% para:18:2;, 1,34% para CLA C18:2;, 1,74% para C18:3, 1,83% para C18:1. Foram encontrados no presente estudo, 85 QTL's descritos na literatura relacionados a outras raças. Um total de 107 genes candidatos posicionais foram encontrados no presente estudo relacionados ao metabolismo de AG's. Os resultados deste estudo ajudam a elucidar as regiões que influenciam o perfil de AG da carne possibilitando sua utilização em programas de seleção assistida, com impacto a saúde humana / There is great concern among the population with the consumption of saturated fats, and beef is generally viewed as an important source of it. Intramuscular fat can not be separated from meat for consumption, so the handling of the meat fatty acid profile (AG's) becomes extremely important to obtain a beef with reduced risks to human health. This study aimed to identify regions that influence the AG's composition of Nelore meat there for was accomplished profile analysis of fatty acids for quantification of stearic acid (C18: 0), palmitic acid (C16: 0), linoleic acid (C: 18: 2; 9.12 - ω6), conjugated linoleic acid (CLA) (C18: 2; c9, t11), linolenic acid (C18: 3; 9,12,15 - ω3), oleic acid (C18 1; 9 ω9), of Longissimus dorsi of 929 animals genotyped with high density chip (Illumina BeadChip SNP800) for the realization of wide genome association study (GWAS), for identify regions associated with characteristics of interest, and subsequent identification of positional candidate genes. 929 Nelore bulls were genotyped with 770K chip, muscle Longissimus dorsi samples were collected for analysis of the AG's profile. 148 regions able to explaining more than 0.04% of the composition of the six AG's evaluated. The regions account for a percentage of the phenotypic variation: 1.24% for C18:0, 1.01% for C16:0, 2.31% for 18:2 ;, 1.34% CLA C18:2; 1 74% of C18: 3, 1.83% for C18:1. Were found in this study, 85 QTL described in the literature related to other breeds. A total of 107 positional candidate genes were foundin this study associated with fatty acids metabolism. The results of this study help to elucidate the regions that influence the AG profile of the meat allowing their use in assisted selection programs, impacting human health
|
89 |
Análise de agrupamento e estabilidade para aquisição e validação de conhecimento em bases de dados de alta dimensionalidadeBrum, Vinicius Campista 28 August 2015 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-06-06T12:39:52Z
No. of bitstreams: 1
viniciuscampistabrum.pdf: 846002 bytes, checksum: 5ac93812c3739c70741f6052b77b22c8 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-06-06T14:06:19Z (GMT) No. of bitstreams: 1
viniciuscampistabrum.pdf: 846002 bytes, checksum: 5ac93812c3739c70741f6052b77b22c8 (MD5) / Made available in DSpace on 2017-06-06T14:06:19Z (GMT). No. of bitstreams: 1
viniciuscampistabrum.pdf: 846002 bytes, checksum: 5ac93812c3739c70741f6052b77b22c8 (MD5)
Previous issue date: 2015-08-28 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Análise de agrupamento é uma tarefa descritiva e não-supervisionada de mineração de dados que utiliza amostras não-rotuladas com o objetivo de encontrar grupos naturais, isto é, grupos de amostras fortemente relacionadas de forma que as amostras que per-tençam a um mesmo grupo sejam mais similares entre si do que amostras em qualquer outro grupo. Avaliação ou validação é considerada uma tarefa essencial dentro da análise de agrupamento. Essa tarefa apresenta técnicas que podem ser divididas em dois tipos: técnicas não-supervisionadas ou de validação interna e técnicas supervisionadas ou de va-lidação externa. Trabalhos recentes introduziram uma abordagem de validação interna que busca avaliar e melhorar a estabilidade do algoritmo de agrupamento por meio de identificação e remoção de amostras que são consideradas prejudiciais e, portanto, de-veriam ser estudadas isoladamente. Por meio de experimentos foi identificado que essa abordagem apresenta características indesejáveis que podem resultar em remoção de todo um grupo e ainda não garante melhoria de estabilidade. Considerando essas questões, neste trabalho foi desenvolvida uma abordagem mais ampla utilizando algoritmo genético para análise de agrupamento e estabilidade de dados. Essa abordagem busca garantir melhoria de estabilidade, reduzir o número de amostras para remoção e permitir que o usuário controle o processo de análise de estabilidade, o que resulta em maior aplicabi-lidade e confiabilidade para tal processo. A abordagem proposta foi avaliada utilizando diferentes algoritmos de agrupamento e diferentes bases de dados, sendo que uma base de dados genotípicos também foi utilizada com o intuito de aquisição e validação de conhe-cimento. Os resultados mostram que a abordagem proposta é capaz de garantir melhoria de estabilidade e também é capaz de reduzir o número de amostras para remoção. Os resultados também sugerem a utilização da abordagem como uma ferramenta promissora para aquisição e validação de conhecimento em estudos de associação ampla do genoma (GWAS). Este trabalho apresenta uma abordagem que contribui para aquisição e valida-ção de conhecimento por meio de análise de agrupamento e estabilidade de dados. / Clustering analysis is a descriptive and unsupervised data mining task, which uses non-labeled samples in order to find natural groups, i.e. groups of closely related samples such that samples within the same cluster are more similar than samples within the other clusters. Evaluation and validation are considered essential tasks within the clustering analysis. These tasks present techniques that can be divided into two kinds: unsuper-vised or internal validation techniques and supervised or external validation techniques. Recent works introduced an internal clustering validation approach to evaluate and im-prove the clustering algorithm stability through identifying and removing samples that are considered harmful and therefore they should be studied separately. Through experi-mentation, it was identified that this approach has two undesirable characteristics, it can remove an entire cluster from dataset and still decrease clustering stability. Taking into account these issues, in this work a broader approach was developed using genetic algo-rithm for clustering and data stability analysis. This approach aims to increase stability, to reduce the number of samples for removal and to allow the user control the stability analysis process, which gives greater applicability and reliability for such process. This approach was evaluated using different kinds of clustering algorithm and datasets. A genotype dataset was also used in order to knowledge acquisition and validation. The results show the approach proposed in this work is able to increase stability, and it is also able to reduce the number of samples for removal. The results also suggest the use of this approach as a promising tool for knowledge acquisition and validation on genome-wide association studies (GWAS). This work presents an approach that contributes for knowledge acquisition and validation through clustering and data stability analysis.
|
90 |
Contributions to genomic selection and association mapping in structured and admixed populations : application to maize / Contributions à la sélection génomique et à la génétique d'association en populations structurées et admixées : application au maïsRio, Simon 26 April 2019 (has links)
L'essor des marqueurs moléculaires (SNPs) a révolutionné les méthodes de génétique quantitative en permettant l'identification de régions impliquées dans le déterminisme génétique des caractères (QTLs) via la génétique d'association (GWAS), ou encore la prédiction des performances d'individus sur la base de leur information génomique (GS). La stratification des populations en groupes génétiques est courante en sélection animale et végétale. Cette structure peut impacter les méthodes de GWAS et de GS via des différences de fréquence et d'effets des allèles des QTL, ainsi que par des différences de déséquilibre de liaison (LD) entre SNP et QTL selon les groupes.Pendant cette thèse, deux panels de diversité de maïs ont été utilisés, présentant des niveaux différents de structuration: le panel “Amaizing Dent” représentant les lignées dentées utilisées en Europe et le panel “Flint-Dent” incluant des lignées dentées, cornées européennes, ainsi que des lignées admixées entre ces deux groupes.En GS, l'impact de la structure génétique sur la qualité des prédictions a été évalué au sein du premier panel pour des caractères de productivité et de phénologie. Cette étude a mis en évidence l'intérêt d'une population d'entraînement (TS) dont la constitution en matière de groupes génétiques est similaire à celle de la population à prédire. Assembler les différents groupes au sein d'un TS multi-groupe apparaît comme une solution efficace pour prédire un large spectre de diversité génétique. Des indicateurs a priori de la précision des prédictions génomiques, basés sur le coefficient de détermination, ont également été évalués, mettant en évidence une efficacité variable selon le groupe et le caractère étudié.Une nouvelle méthodologie GWAS a ensuite été développée pour étudier l'hétérogénéité des effets capturés par les SNPs selon les groupes. L'intégration des individus admixés à l'analyse permet de séparer les effets des facteurs responsables de l'hétérogénéité des effets alléliques: différence génomique locale (liée au LD ou à une mutation spécifique d'un groupe) ou interactions épistatiques entre le QTL et le fonds génétique. Cette méthodologie a été appliquée au panel “Flint-Dent” pour la précocité de floraison. Des QTL ont été détéctés comme présentant des effets groupe-spécifiques interagissant ou non avec le fonds génétique. De nombreux QTL présentant un profil original ont pu être mis en évidence, incluant des locus connus tels que Vgt1, Vgt2 ou Vgt3. Une importante épistasie directionnelle a aussi été mise en évidence grâce aux individus admixés, confortant l'existence d'interactions épistatiques avec le fonds génétique pour ce caractère.Sachant l'existence de cette hétérogénéité d’effets alléliques, nous avons développé deux modèles de prédictions génomiques nommées Multi-group Admixed GBLUP (MAGBLUP). Ceux-ci modélisent des effets groupe-spécifiques aux QTLs et sont adaptés à la prédiction d'individus admixés. Le premier permet d'identifier la variance génétique additionnelle créée par l'admixture (variance de ségrégation), alors que le second permet d'évaluer le degré de conservation des effets alléliques entre groupes. Ces deux modèles ont montré un intérêt certain par rapport à des modèles standards pour prédire des caractères simulés, mais plus limité sur des caractères réels.Enfin, l'intérêt des individus admixés dans la constitution de TS multi-groupes a été évalué à l'aide du second panel. Si leur intérêt a clairement été mis en évidence pour des caractères simulés, des résultats plus variables ont été observés avec les caractères réels, pouvant s'expliquer par la présence d'interactions avec le fonds génétique.Les nouvelles méthodes et l'utilisation d'individus admixés ouvrent des pistes de recherches intéressantes pour les études de génétique quantitative en population structurée. / The advent of molecular markers (SNPs) has revolutionized quantitative genetics methods by enabling the identification of regions involved in the genetic determinism of traits (QTLs) thanks to association studies (GWAS), or the prediction of the performance of individuals using genomic information (GS). The stratification of populations into genetic groups is common in animal and plant breeding. This structure can impact GWAS and GS methods through group differences in QTL allele frequencies and effects, as well as in linkage disequilibrium (LD) between SNP and QTL.During this thesis, two maize diversity panels were used, presenting different levels of structuration: the "Amaizing Dent" panel representing the diversity of dent lines used in Europe and the "Flint-Dent" panel including dent, flint and admixed lines between these two groups.In GS, the impact of genetic structure on genomic prediction accuracy was evaluated in the first panel for productivity and phenology traits. This study highlighted the interest of a training population (TS) whose constitution in terms of genetic groups is similar to that of the population to be predicted. Assembling the different groups within a multi-group TS appears as an effective solution to predict a broad spectrum of genetic diversity. A priori indicators of genomic prediction accuracy, based on the coefficient of determination, were also evaluated and highlighted a variable efficiency depending on the group and the trait.A new GWAS methodology was then developed to study the heterogeneity of the allele effects captured by SNPs depending on the group. The integration of admixed individuals to such analyses allows to disentangle the factors causing the heterogeneity of allele effects across groups: local genomic difference (related to LD or group-specific mutation) or epistatic interactions between the QTL and the genetic background. This methodology was applied to the "Flint-Dent" panel for flowering time. QTLs have been detected as presenting group-specific effects interacting or not with the genetic background. QTLs with an original profile have been highlighted, including known loci such as Vgt1, Vgt2 or Vgt3. Significant directional epistasis has also been demonstrated using admixed individuals and supported the existence of epistatic interactions with the genetic background for this trait.Based on the existence of such heterogeneity of allele effects, we have developed two genomic prediction models named Multi-group Admixed GBLUP (MAGBLUP). Both model group-specific QTL effects and are suited to the prediction of admixed individuals. The first allows the identification the additional genetic variance created by the admixture (segregation variance), while the second allows the evaluations of the degree of conservation of SNP allele effects across groups. These two models showed a certain interest compared to standard models to predict simulated traits, but it was more limited on real traits.Finally, the interest of admixed individuals in multi-group TS was evaluated using the second panel. Although their interest has been clearly demonstrated for simulated traits, more variable results have been observed with the real traits, which can be explained by the presence of interactions with the genetic background.The new methods and the use of admixed individuals open interesting lines of research for quantitative genetics studies in structured population.
|
Page generated in 0.038 seconds