Spelling suggestions: "subject:"equilíbrio dde ligação"" "subject:"equilíbrio dee ligação""
1 |
Prospecção de assinaturas de seleção em regiões de QTL associadas com características reprodutivas em novilhas Nelore / Prospection of selection signatures in QTL regions associated to reproductive features in Nelore heifersMontes Vergara, Donicer Eduardo [UNESP] 24 March 2016 (has links)
Submitted by DONICER EDUARDO MONTES VERGARA null (donicer.montes@unisucre.edu.co) on 2016-04-11T17:24:33Z
No. of bitstreams: 1
H.Tese-Donicer- Defensa Definitivo -08-04-2016.pdf: 1794206 bytes, checksum: a97a3f4dcd0f3e1489260272006d51af (MD5) / Approved for entry into archive by Juliano Benedito Ferreira (julianoferreira@reitoria.unesp.br) on 2016-04-12T14:43:11Z (GMT) No. of bitstreams: 1
montesvergara_de_dr_jabo.pdf: 1794206 bytes, checksum: a97a3f4dcd0f3e1489260272006d51af (MD5) / Made available in DSpace on 2016-04-12T14:43:11Z (GMT). No. of bitstreams: 1
montesvergara_de_dr_jabo.pdf: 1794206 bytes, checksum: a97a3f4dcd0f3e1489260272006d51af (MD5)
Previous issue date: 2016-03-24 / Características reprodutivas, como a ocorrência de prenhez precoce, são mais importantes economicamente ao comparar-se com as características de crescimento. Desta forma, o aumento da taxa de fertilidade e emprego de animais geneticamente superiores é determinante no progresso da produtividade nas fazendas comerciais de produção de carne bovina. A seleção modifica as frequências alélicas de uma população ao transmitir as variantes gênicas mais interessantes. Considerando o desequilíbrio de ligação, alguns locos adjacentes às mutações favoráveis são transmitidos ao longo das gerações. Estes são conhecidos como assinaturas de seleção e podem ser identificados com o uso de “chips” de SNP e metodologias estatísticas adequadas. Com o objetivo de identificar assinaturas de seleção recentes em QTL previamente mapeados para características reprodutivas de fêmeas bovinas ligadas à precocidade sexual, foram genotipadas 2.035 fêmeas da raça Nelore (Bos taurus indicus) com o chip “Illumina BovineHD BeadChip”. Posteriormente foi inferida a fase de ligação dos SNPs e a reconstrução dos haplótipos. A detecção de assinaturas de seleção foi realizada por meio da aplicação da metodologia “Relative Extended Haplotype Homozygosity” (REHH). A identificação de genes que contribuem para a importância da característica nestas regiões foi feita com a ferramenta Map Viewer do “National Center for Biotechnology Information”- NCBI e GBrowse carregada com o genoma bovino versão UMD 3.1. Foram detectadas 2.756 regiões núcleo, com tamanho médio 27,6 ± 29,1 Kb, abrangendo 70,1 Mb dos 25 cromossomos estudados. Dos SNPs utilizados, 17.312 participaram da formação das regiões núcleo, com o mínimo de 10 no BTA27 e o máximo de 20 SNPs nos cromossomos 1, 3-7, 9-15,18-21, e 23-24. Foram identificadas 40 assinaturas de seleção recentes com diferentes níveis de significância e 56 genes A maioria dos genes localizados nas regiões de assinaturas de seleção tem relação com os processos biológicos de metabolismo mitocondrial, desenvolvimento pós-embrionário, regulação da taxa de ovulação e fertilidade, resposta imune, metabolismo de triglicerídeo, proliferação celular e neurônios receptores olfativos. A investigação de mecanismos regulatórios da expressão dos genes associados aos processos biológicos descritos pode oferecer conhecimentos sobre os mecanismos moleculares que afetam a característica ocorrências de prenhez precoce, na raça Nelore. / Some reproductive traits such as early pregnancy are more profitable than those related to growth. Increasing fertility rate and using genetically superior animals are crucial in productivity of meat commercial farms. Artificial selection modifies allele frequencies of a cattle population by transmitting the most significant gene variants. Considering linkage disequilibrium, some loci adjacent to favorable mutations are transmitted across generations. Known as signatures of selection, such locations can be identified by the SNP chips, and appropriate statistical methods. To determine recent selection signature in quantitative trait loci (QTL) previously mapped for reproductive cow features linked to sexual precocity, 2,035 Nelore (Bos taurus indicus) females were genotyped by Illumina Bovine chip. After, inferring the connection phase of SNPs allowed haplotype reconstruction. Selection signatures were detected by Relative Extended Haplotype Homozygosity (REHH) method. Genes supposedly important were recognized by Map Viewer from the National Center for Biotechnology Information (NCBI), and also through a loaded GBrowse with bovine genome UMD, version 3.1. A total of 2,756 core regions were detected, with an average size of 27.6 ± 29.1 Kb, covering 70.1 Mb of 25 chromosomes. 17,312 SNPs are involved in the formation of core regions with at least 10 on BTA27, and a maximum of 20 SNPs on 1, 3-7, 9-15, 18-21, and 23-24 chromosomes. We identify 40 possible recent selection signatures, with different levels of significance, and 56 positional candidate genes. Most of genes located in selection signature regions are related to biological processes of mitochondrial metabolism, post-embryonic development, ovulation rate regulation and fertility, immune response, triglyceride metabolism, cell proliferation, and olfactory receptor neurons. The investigation of regulatory mechanisms of gene expression associated with biological processes described can provide knowledge on the molecular mechanisms affecting characteristic of early pregnancy occurrences in Nellore.
|
2 |
Análise de associação aplicada ao mapeamento genético de doenças. / Analysis of association applied to the genetic diseases mapping.Batista, Maria Jacqueline 03 March 2006 (has links)
O mapeamento genético e a genética funcional de doenças são de grande importância na pesquisa médica e genômica. Para estas finalidades o estudo de associação entre fatores de risco genéticos e doença tem ganhado destaque na literatura. Neste trabalho disserta-se sobre a análise de associação aplicada ao mapeamento genético de doenças, caracterizando diferentes possibilidades de planejamentos experimentais e de utilização de modelos estatísticos de análise de dados. As formalizações estatísticas, como o tipo de delineamento experimental, a inclusão ou não de dados familiares, bem como a escolha do método estatístico de análise, que são decisivos na avaliação do poder dos testes obtidos e na sua aplicabilidade ao mapeamento genético, também são discutidas. Além disso, considera-se a análise de associação por meio de modelos de regressão logística em que, as análises de dados genéticos são abordadas via dados no nível genotípico e cromossômico. Finalmente, os conceitos supracitados são aplicados a conjuntos de dados reais, fornecidos pelo Laboratório de Cardiologia e Genética Molecular do InCor/USP, com o objetivo de ilustrar o problema teórico tratado e motivar a aplicação das metodologias estatísticas envolvidas. / The genetic mapping and functional genetics have great importance in the genomics research. In order to conduct these researches the study of the association between genetic risk factors and disease has been becoming an important role in the literature. In this work we consider the association analyses applied to the genetic diseases mapping, charactering different possibilities of experimental designs and the use of statistical models to analyze data sets. The statistical concepts, as the kind of experimental design, the inclusion of familiar records or not, as well as the choice of the statistical analyze method, which are very important to the evaluation of the power of the tests obtained and to their applicability in the genetic mapping, are also discussed. Furthermore, we consider the association analysis at person level and chromosome data set. Finally, the latter concepts are applied to a real data set, provided by the Molecular Genetic and Cardiology Laboratory of InCor/USP, in order to illustrate the theoretical problem treated in this work and to motive the use of the involved statistical methodologies.
|
3 |
Efeito da densidade de marcadores e do tipo de matriz de parentesco genômico na acurácia da seleção genômica em milho tropical / Effect of markers density and type of genomic relationship matrix in the accuracy of genomic selection in tropical maizeSantos, Anna Rita Marcondes dos 21 July 2016 (has links)
A seleção genômica (Genomic Selection - GS) permite identificar indivíduos superiores com base no seu método genômico e apresenta a possibilidade de incorporação do melhoramento quantitativo à genética molecular. O melhor preditor linear não viesado (Best Linear Unbiased Prediction - BLUP) é um método de predição dos efeitos aleatórios do modelo com base nos componentes de variância obtidos por meio do método máxima verossimilhança restrita (Restricted maximum likelihood - REML). A eficiência do REML\\BLUP pode ser incrementada por meio da incorporação de matrizes de parentesco genômico nos modelos de seleção genômica, uma vez que os efeitos genéticos genômicos aditivos dos indivíduos avaliados constituem os componentes aleatórios dos modelos mistos abordados. Dentre os algoritmos disponíveis para estimá-las, a partir de dados de polimorfismo de nucleotídeo único (Single-nucleotide polymorphism - SNP\'s) há as matrizes de Vanraden (2008) Astle e Balding (2009) e as de Yang et al. (2010) (matriz de parentesco unificado e matriz de parentesco unificado ajustado). Adicionalmente ao método de estimação da matriz de parentesco, a acurácia da GS depende da densidade de marcadores e da extensão e padrão de desequilíbrio de ligação (Linkage desequilibrium - LD) que existe no painel. Com isto, os objetivos foram: i) investigar o efeito da redução nas densidades de marcadores SNP\'s, por meio do LD, na estimativa do parentesco genético dos indivíduos e, consequentemente, na acurácia preditiva da GS; ii) estudar o efeito do uso de diferentes tipos de matrizes de parentesco genômico na acurácia da seleção genômica para linhagens e híbridos de milho tropical. Para isso, foram considerados dois painéis distintos de milho tropical: uma composta por 64 linhagens endogâmicas e a outra, por 452 híbridos. Estas foram avaliadas para o caráter produtividade de grãos, em oito e cinco ambientes, respectivamente. As linhagens e os híbridos foram genotipados com a plataforma Affymetrix® Axiom® Maize Genotyping Array, com cerca de 600 mil marcadores. Foram construídos diferentes cenários de GS quanto ao tipo de painel (linhagens e híbridos), densidade de marcadores (400k, 60k, 9586 e 1304 para linhagens e 50k, 4458 e 495, para híbridos) e tipos de matrizes de parentesco (citadas acima). Em cada um destes cenários foi estimada a herdabilidade, acurácia, capacidade preditiva e a coincidência de seleção. A partir dos resultados conclui-se que: tanto para híbridos como para linhagens, a densidade de marcas pode ser reduzida significativamente por meio do LD existente entre os SNP\'s, sem gerar prejuízos quanto à acurácia da GS, mas reduzindo os custos com genotipagem e a demanda computacional. Para predição genômica das linhagens, a matriz de Vanraden (2008) apresenta o melhor custo benefício, pois tem menor demanda computacional e proporciona resultados satisfatórios quanto à acurácia e coincidência de seleção. Para a predição genômica de híbridos, as matrizes de Yang et al. (2010) são superiores em relação às demais testadas, quanto à acurácia preditiva e coincidência de seleção. / The efficiency of the Best Linear Unbiased Prediction (BLUP), along with the Restricted maximum likelihood (REML) methods, can be increased by incorporating genomic kinship matrices to Genomic Selection models (GS). Among the available algorithms to estimate these matrices from single-nucleotide polymorphism (SNP) data there are Vanraden (2008), Astle e Balding (2009) and Yang et al. (2010) (unified relationship matrix and adjusted unified relationship matrix). In addition to the estimation method of the relationship matrix, the accuracy of GS depends on the density of markers and the extent and pattern of linkage disequilibrium (LD) that there is in the panel. Thus, the aims were: i) assess the effect of marker density reduction, based on LD, on the estimative of the genetic relationship of individuals and, consequently, on the predictive accuracy of GS; ii) study the effects of types of genomic relationship matrices on the accuracy of genomic selection for tropical maize lines and hybrids. In order to achieve there, two distinct panel of tropical maize were used: the first consisting of 64 inbred lines and latter of 452 hybrids. These panels were evaluated in field trials for grain yield in eight and five environments, respectively. The lines and hybrids were genotyped by the Affymetrix® Axiom® Maize Genotyping Array platform with 612 thousand markers. Distinct scenarios of GS were comprised considering panel type (lines and hybrids), marker density (400k, 60k, 9586 and 1304 for lines and, 50k, 4458 and 495 for hybrids) and, types of kinship matrices cited aboved. In each of these scenarios heritability, accuracy, predictive capacity and the selection coincidence were estimated. From the results it was concluded that: for both, hybrids and lines, marker density can be significantly reduced based on LD between SNP\'s without affecting the accuracy. Furthermore, this reduction also decreases genotyping costs and computational requirements. For genomic prediction of lines, Vanraden (2008) matrix shows the best cost-benefit, because it demands less computer resources and provides satisfactory results in terms of accuracy and selection coincidence. On the other hand, for genomic prediction of hybrids, the matrices of Yang et al. (2010) yielded higher predictive accuracies and selection coincidences.
|
4 |
Análise de associação aplicada ao mapeamento genético de doenças. / Analysis of association applied to the genetic diseases mapping.Maria Jacqueline Batista 03 March 2006 (has links)
O mapeamento genético e a genética funcional de doenças são de grande importância na pesquisa médica e genômica. Para estas finalidades o estudo de associação entre fatores de risco genéticos e doença tem ganhado destaque na literatura. Neste trabalho disserta-se sobre a análise de associação aplicada ao mapeamento genético de doenças, caracterizando diferentes possibilidades de planejamentos experimentais e de utilização de modelos estatísticos de análise de dados. As formalizações estatísticas, como o tipo de delineamento experimental, a inclusão ou não de dados familiares, bem como a escolha do método estatístico de análise, que são decisivos na avaliação do poder dos testes obtidos e na sua aplicabilidade ao mapeamento genético, também são discutidas. Além disso, considera-se a análise de associação por meio de modelos de regressão logística em que, as análises de dados genéticos são abordadas via dados no nível genotípico e cromossômico. Finalmente, os conceitos supracitados são aplicados a conjuntos de dados reais, fornecidos pelo Laboratório de Cardiologia e Genética Molecular do InCor/USP, com o objetivo de ilustrar o problema teórico tratado e motivar a aplicação das metodologias estatísticas envolvidas. / The genetic mapping and functional genetics have great importance in the genomics research. In order to conduct these researches the study of the association between genetic risk factors and disease has been becoming an important role in the literature. In this work we consider the association analyses applied to the genetic diseases mapping, charactering different possibilities of experimental designs and the use of statistical models to analyze data sets. The statistical concepts, as the kind of experimental design, the inclusion of familiar records or not, as well as the choice of the statistical analyze method, which are very important to the evaluation of the power of the tests obtained and to their applicability in the genetic mapping, are also discussed. Furthermore, we consider the association analysis at person level and chromosome data set. Finally, the latter concepts are applied to a real data set, provided by the Molecular Genetic and Cardiology Laboratory of InCor/USP, in order to illustrate the theoretical problem treated in this work and to motive the use of the involved statistical methodologies.
|
5 |
Diversidade genética e mapeamento por associação em linhagens de milho para maturação de grãos / Genetic diversity and mapping by association in maize inbred lines for grain maturationFriske, Élcio 29 February 2016 (has links)
Made available in DSpace on 2017-07-10T17:37:17Z (GMT). No. of bitstreams: 1
Elcio_Friske.pdf: 2134254 bytes, checksum: a68baa9abb11f51692fe7500a517561f (MD5)
Previous issue date: 2016-02-29 / Fundação Araucária / The aim of this work was to evaluate the genetic diversity and map genomic regions associated with grains maturation in common corn lineages. The phenotypic attributes of 81 elite inbred lines of corn were assessed in field experiment implanted in square lattice design with three repetitions. The variance and multivariate analysis were carried out considering complete randomized blocks due to its equivalence with the estimation for the lattice efficiency. For the mapping by linkage disequilibrium, 72 elite inbred lines have been genotyped for SNP markers at platform 650K (Affymetrix®) and associated with the genotypic values of the traits related to maturation: number of days for the male flowering (DFM) and female (DFF), and the grain moisture loss, determined by the area below the moisture curve (AACUM). The results of the variance analysis pointed out the existence of genetic diversity in the germplasm for all the assessed traits, detecting a wide variability for DFM, DFF and AACUM. Weak genetic correlations between yield and maturation components indicated the possibility of selection for earliness without compromising the grain yield. The genetic diversity quantified by the distances of Mahalanobis enabled the suggestion of hybrid combinations of higher heterotic effect for earliness and grain yield. There were similarities in the Tocher and UPGMA grouping, which were efficient to classify the genetic variability. By the mixed linear model (MLM) it was possible to detect associations among days for male and female flourishing with SNP markers in all chromosomes, with predominance of chromosomes 1 and 3 and for the loss of moisture in the chromosomes 5 and 6. With of multiple regression analysis of stepwise for DFM, DFF and AACUM, the complete models explained 79%, 93% and 56% of the variation for the genotypic values, respectively, being found predominantly significant markers in the chromosomes 1 and 3. The detection of similar and also different genomic regions for these traits, which are highly correlated, makes possible to raise the hypothesis of the importance of the genetic linkage and pleiotropy to explain the maturation of grains in corn inbred lines. The results obtained are promising and the genomic regions associated with DFM, DFF and AACUM, will be evaluated in validation experiments, which will be useful in selection programs of genotypes with the maturity sought by the breeder / O trabalho teve como objetivos avaliar a diversidade genética e mapear regiões genômicas associadas com maturação de grãos em linhagens de milho comum. Os atributos fenotípicos de 81 linhagens elites de milho foram avaliados em experimento de campo implantado em delineamento de látice quadrado com três repetições. Procedeu-se a análise de variância e multivariada considerando blocos completos casualizados devido a sua equivalência com a estimação para eficiência do látice. Para o mapeamento por desequilíbrio de ligação, 72 linhagens elites foram genotipadas para marcadores SNP na plataforma 650K (Affymetrix®) e associados aos valores genotípicos dos caracteres relacionados à maturação: número de dias para o florescimento masculino (DFM) e feminino (DFF), e perda de umidade dos grãos, determinada pela área abaixo da curva de umidade (AACUM). Os resultados da análise de variância indicaram a existência de diversidade genética no germoplasma para todos os caracteres avaliados, detectando-se ampla variabilidade para DFM, DFF e AACUM. Correlações genéticas fracas entre os componentes de rendimento e de maturação indicaram a possibilidade de seleção para precocidade sem comprometer a produtividade. A diversidade genética quantificada pelas distâncias de Mahalanobis permitiu sugerir combinações hibridas de maior efeito heterótico para precocidade e produtividade. Houve semelhanças no agrupamento de Tocher e UPGMA, que foram eficientes para classificar a variabilidade genética. Pelo modelo linear misto (MLM) foi possível detectar associações entre dias para o florescimento masculino e feminino com marcadores SNP em todos os cromossomos, com predominância nos cromossomos 1 e 3, e para perda de umidade nos cromossomos 5 e 6. Com a análise de regressão múltipla de stepwise para DFM, DFF e AACUM, os modelos completos explicaram 79%, 93% e 56% da variação para os valores genotípicos, respectivamente, encontrando-se predominantemente marcadores significativos nos cromossomos 1 e 3. A detecção de regiões genômicas semelhantes e também distintas para esses caracteres, que são altamente correlacionados, torna possível levantar a hipótese da importância de ligação gênica e de pleiotropia para explicar a maturação de grãos em linhagens de milho. Os resultados obtidos são promissores e as regiões genômicas associadas com DFM, DFF e AACUM, serão avaliadas em experimentos de validação, que poderão ser úteis em programa para seleção de genótipos com a maturidade buscada pelo melhorista
|
6 |
Caracterização por linhagens, mapeamento por associação e controle genético para resistência às doenças foliares em milho no Oeste do ParanáKaefer, Kaian Albino Corazza 21 February 2017 (has links)
Submitted by Helena Bejio (helena.bejio@unioeste.br) on 2017-11-23T18:28:14Z
No. of bitstreams: 2
Kaian AC Kaefer 2017.pdf: 1845326 bytes, checksum: edb6796b0ffa6e8bd03f93ee005810c6 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-11-23T18:28:14Z (GMT). No. of bitstreams: 2
Kaian AC Kaefer 2017.pdf: 1845326 bytes, checksum: edb6796b0ffa6e8bd03f93ee005810c6 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2017-02-21 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The work aimed to characterize common corn strains for resistance to main leaf diseases and to suggest crosses based on the genetic diversity detected in SNP markers, besides to identify genomic regions and to study of control involved in the resistance of white leaf spot (WLS) and northern leaf blight (NLB). For genetic diversity, the 72 maize lines were genotyped with SNP markers using the 650K Platform (Affymetrix®) and quantified using the Tocher and UPGMA methods. For the characterization, the experiment was conducted in a randomized complete block design with three repetitions. The genotypic values of the main diseases were predicted using by the procedure of REML / BLUP. For association mapping, 72 maize lines genotyped for SNP markers were associated with genotypic values of WLS and NLB. For the study of genetic control, the experiment was conducted in the agricultural year 2016 and it was composed of a randomized block design with three replications, being estimates based on the analysis of the variances of the segregating and nonsegregating generations. According to the results, the existence of genetic variability was detected among maize lines and this way, with the data of the distances through the molecular markers, it is possible to orient the crosses accurately, aiming at genetically resistant genotypes to the foliar diseases. The use of association mapping may be an efficient strategy in the selection of WLS and NLB resistant genotypes, without the need for crosses. With genetic control studies, inheritances of the quantitative type allied with the high restricted heritabilities of WLS and NLB, allow good selection efficiency and satisfactory selection gains. / Os objetivos do trabalho foram caracterizar linhagens de milho comum para resistência às principais doenças foliares e sugerir cruzamentos com base na diversidade genética detectada em marcadores SNP, além de mapear regiões genômicas e estudar o controle genético envolvido nas resistências à mancha branca (MB) e à helmintosporiose (HT). Para a caracterização das 72 linhagens, o experimento foi conduzido no delineamento em blocos casualizados com três repetições. Os valores genotípicos para às principais doenças foram preditos empregando-se o procedimento REML/BLUP. Para a diversidade genética, as 72 linhagens foram genotipadas com marcadores SNP empregando-se a Plataforma 650K (Affymetrix®), sendo quantificada utilizando-se os métodos de Tocher e UPGMA. Para o mapeamento por associação, as 72 linhagens genotipadas com marcadores SNP foram associados aos valores genotípicos da MB e HT, utilizando o modelo linear misto (MLM). Para o estudo do controle genético, o experimento foi conduzido no ano de 2016 e foi composto por blocos casualizados com três repetições, sendo as estimativas genotípicas baseadas na análise das variâncias das gerações segregantes e não segregantes. De acordo com os resultados, detectou-se a existência de variabilidade genética entre as linhagens de milho e deste modo, com os dados das distâncias por meio dos marcadores moleculares é possível orientar com maior precisão os cruzamentos, visando obter genótipos mais resistentes às principais doenças foliares. O emprego do mapeamento por associação pode ser uma estratégia eficiente na seleção de genótipos resistentes à MB e à HT, sem a necessidade de cruzamentos. Com os estudos de controle genético, heranças do tipo quantitativa aliadas com as altas herdabilidades restritas de MB e HT, permitem boa eficiência na seleção e ganhos de seleção satisfatórios.
|
7 |
Efeito da densidade de marcadores e do tipo de matriz de parentesco genômico na acurácia da seleção genômica em milho tropical / Effect of markers density and type of genomic relationship matrix in the accuracy of genomic selection in tropical maizeAnna Rita Marcondes dos Santos 21 July 2016 (has links)
A seleção genômica (Genomic Selection - GS) permite identificar indivíduos superiores com base no seu método genômico e apresenta a possibilidade de incorporação do melhoramento quantitativo à genética molecular. O melhor preditor linear não viesado (Best Linear Unbiased Prediction - BLUP) é um método de predição dos efeitos aleatórios do modelo com base nos componentes de variância obtidos por meio do método máxima verossimilhança restrita (Restricted maximum likelihood - REML). A eficiência do REML\\BLUP pode ser incrementada por meio da incorporação de matrizes de parentesco genômico nos modelos de seleção genômica, uma vez que os efeitos genéticos genômicos aditivos dos indivíduos avaliados constituem os componentes aleatórios dos modelos mistos abordados. Dentre os algoritmos disponíveis para estimá-las, a partir de dados de polimorfismo de nucleotídeo único (Single-nucleotide polymorphism - SNP\'s) há as matrizes de Vanraden (2008) Astle e Balding (2009) e as de Yang et al. (2010) (matriz de parentesco unificado e matriz de parentesco unificado ajustado). Adicionalmente ao método de estimação da matriz de parentesco, a acurácia da GS depende da densidade de marcadores e da extensão e padrão de desequilíbrio de ligação (Linkage desequilibrium - LD) que existe no painel. Com isto, os objetivos foram: i) investigar o efeito da redução nas densidades de marcadores SNP\'s, por meio do LD, na estimativa do parentesco genético dos indivíduos e, consequentemente, na acurácia preditiva da GS; ii) estudar o efeito do uso de diferentes tipos de matrizes de parentesco genômico na acurácia da seleção genômica para linhagens e híbridos de milho tropical. Para isso, foram considerados dois painéis distintos de milho tropical: uma composta por 64 linhagens endogâmicas e a outra, por 452 híbridos. Estas foram avaliadas para o caráter produtividade de grãos, em oito e cinco ambientes, respectivamente. As linhagens e os híbridos foram genotipados com a plataforma Affymetrix® Axiom® Maize Genotyping Array, com cerca de 600 mil marcadores. Foram construídos diferentes cenários de GS quanto ao tipo de painel (linhagens e híbridos), densidade de marcadores (400k, 60k, 9586 e 1304 para linhagens e 50k, 4458 e 495, para híbridos) e tipos de matrizes de parentesco (citadas acima). Em cada um destes cenários foi estimada a herdabilidade, acurácia, capacidade preditiva e a coincidência de seleção. A partir dos resultados conclui-se que: tanto para híbridos como para linhagens, a densidade de marcas pode ser reduzida significativamente por meio do LD existente entre os SNP\'s, sem gerar prejuízos quanto à acurácia da GS, mas reduzindo os custos com genotipagem e a demanda computacional. Para predição genômica das linhagens, a matriz de Vanraden (2008) apresenta o melhor custo benefício, pois tem menor demanda computacional e proporciona resultados satisfatórios quanto à acurácia e coincidência de seleção. Para a predição genômica de híbridos, as matrizes de Yang et al. (2010) são superiores em relação às demais testadas, quanto à acurácia preditiva e coincidência de seleção. / The efficiency of the Best Linear Unbiased Prediction (BLUP), along with the Restricted maximum likelihood (REML) methods, can be increased by incorporating genomic kinship matrices to Genomic Selection models (GS). Among the available algorithms to estimate these matrices from single-nucleotide polymorphism (SNP) data there are Vanraden (2008), Astle e Balding (2009) and Yang et al. (2010) (unified relationship matrix and adjusted unified relationship matrix). In addition to the estimation method of the relationship matrix, the accuracy of GS depends on the density of markers and the extent and pattern of linkage disequilibrium (LD) that there is in the panel. Thus, the aims were: i) assess the effect of marker density reduction, based on LD, on the estimative of the genetic relationship of individuals and, consequently, on the predictive accuracy of GS; ii) study the effects of types of genomic relationship matrices on the accuracy of genomic selection for tropical maize lines and hybrids. In order to achieve there, two distinct panel of tropical maize were used: the first consisting of 64 inbred lines and latter of 452 hybrids. These panels were evaluated in field trials for grain yield in eight and five environments, respectively. The lines and hybrids were genotyped by the Affymetrix® Axiom® Maize Genotyping Array platform with 612 thousand markers. Distinct scenarios of GS were comprised considering panel type (lines and hybrids), marker density (400k, 60k, 9586 and 1304 for lines and, 50k, 4458 and 495 for hybrids) and, types of kinship matrices cited aboved. In each of these scenarios heritability, accuracy, predictive capacity and the selection coincidence were estimated. From the results it was concluded that: for both, hybrids and lines, marker density can be significantly reduced based on LD between SNP\'s without affecting the accuracy. Furthermore, this reduction also decreases genotyping costs and computational requirements. For genomic prediction of lines, Vanraden (2008) matrix shows the best cost-benefit, because it demands less computer resources and provides satisfactory results in terms of accuracy and selection coincidence. On the other hand, for genomic prediction of hybrids, the matrices of Yang et al. (2010) yielded higher predictive accuracies and selection coincidences.
|
8 |
Desequilíbrio de Ligação e Blocos de Haplótipos Determinados pela Análise de 250K SNPs em Três Remanescentes de Quilombos / Linkage Disequilibrium and Haplotype Blocks Determined by the Analysis of 250K SNPs in Three Quilombo Remnants CommunitiesAndrade, Edilene Santos de 20 September 2013 (has links)
A associação não aleatória entre alelos de diferentes lócus caracteriza o que é chamado de desequilíbrio de ligação (DL) entre eles. A extensão do DL nas populações humanas pode ser influenciada por muitos fatores, tais como taxa de recombinação, características demográficas (idade, tamanho e taxa de crescimento) e fatores evolutivos (deriva genética, efeito fundador, gargalos populacionais, mutação, seleção e fluxo gênico). Portanto, o conhecimento dos padrões do DL fornecem dados que auxiliam na descrição dos eventos demográficos e evolutivos sofridos pelas populações. O objetivo deste estudo foi descrever os padrões de DL de quatro populações brasileiras e correlacioná-los com suas respectivas histórias demográficas, uma vez que estas populações experimentaram alguns dos eventos evolutivos que geram ou retardam o decréscimo do DL, como fundação por poucos indivíduos, miscigenação no momento da fundação e posterior isolamento. Foram analisadas amostras de três populações remanescentes de quilombos do Estado do Piauí, Gaucinha (GAU, n = 14), Mimbó (MIB, n = 15) e Sítio Velho (STV, n = 15) e da população urbana de Teresina, Piauí (TES, n = 15), além de sete amostras populacionais do projeto HapMap (CEU, CHB, JPT, ASW, LWK, MKK, YRI, todas com n = 15). Foram genotipados mais de 250 mil SNPs (Single Nucleotide Polymorphisms) utilizando-se o GeneChip® Human Mapping 250K Nsp I Array - Affymetrix® nas amostras das quatro populações brasileiras. Os dados brutos das populações do HapMap para este array foram obtidos na página do projeto. Os genótipos para todas as amostras foram determinados pelo algoritmo CRLMM após comparação com o algoritmo BRLMM, e as análises de DL e determinação dos blocos de haplótipos foram realizadas com o uso do programa Haploview. Considerando-se o número de blocos de haplótipos detectados em cada população estudada, padrão semelhante foi observado em todos os autossomos. Em geral, a população europeia (CEU) e as duas populações asiáticas (CHB e JPT) do HapMap apresentaram os maiores números de blocos, enquanto que os menores números foram observados nos quilombos GAU e MIB e na população TES. As populações africanas LWK, MKK e YRI e a população afro-americana ASW apresentaram os valores intermediários e a população afro-brasileira STV, apresentou um número de blocos apenas inferior a CEU, CHB e JPT. A grande contribuição africana nos quilombos GAU e MIB pode explicar o menor DL observado nestas comunidades. Por outro lado, o menor DL em TES se deve, provavelmente, à sua fundação, que envolveu um maior número de indivíduos e foi seguida por um rápido crescimento. A possível explicação para o maior DL observado em STV, em relação aos demais quilombos, consiste em sua peculiar história demográfica: esta comunidade experimentou uma miscigenação no momento de sua fundação, que foi seguida por um crescimento lento e pouca diferenciação. Assim, foi demonstrado como os eventos demográficos de cada população influenciam seus respectivos padrões de DL. / The non-random association between alleles of different loci characterizes what is called linkage disequilibrium (LD) between them. The LD extent in human populations can be influenced by many factors, such as recombination rate, demographic features (age, size and growth rate) and evolutionary events (genetic drift, founder effects, population bottlenecks, mutation, selection and gene flow). Therefore, knowledge of the LD patterns provides data that assists in describing the evolutionary and demographic events experienced by populations. The aim of this study was to describe the LD patterns of four Brazilian populations and correlate these patterns with their respective demographic histories, since these populations have experienced some of the evolutionary events that produce or retard the LD decrease, such as foundation by few individuals, admixture at the founding moment and subsequent isolation. Samples from three quilombo remnants populations of the Piauí State, Gaucinha (GAU, n = 14), Mimbó (MIB, n = 15) and Sítio Velho (STV, n = 15) and the urban population of Teresina, Piauí (TES, n = 15), and seven population samples from the HapMap Project (CEU, CHB, JPT, ASW, LWK, MKK, YRI, all with n = 15) were analyzed. More than 250 thousand SNPs (Single Nucleotide Polymorphisms) were genotyped using the GeneChip ® Human Mapping 250K Nsp Array I - Affymetrix ® in the samples of the four Brazilian populations. Raw data of the HapMap population samples for this array were obtained from the HapMap homepage. Genotypes for all samples were determined by CRLMM algorithm after comparison with the BRLMM algorithm. LD analyzes and determination of haplotype blocks were performed using the Haploview software. Considering the number of haplotype blocks detected in each population, a consistent pattern was observed for all autosomes. The European population (CEU) and the two Asian populations (CHB and JPT) of the HapMap showed the highest numbers of blocks, while the lowest numbers were observed in the GAU and MIB quilombos and in the TES population. The African populations, LWK, MKK and YRI, and the African-American ASW exhibited intermediate values and the African-Brazilian population STV, presented a number of blocks smaller than that observed for CEU, CHB and JPT. The great African contribution in the GAU and MIB quilombos may explain the lower LD observed in these communities. On the other hand, the lower LD in TES is probably due to its foundation that involved a larger number of individuals and was followed by a fast growth. A possible explanation for the higher LD observed in STV, compared to other quilombos, consists in its particular demographic history: this community experienced admixture at the time of its foundation, which was followed by slow growth and low differentiation. Thus, it was shown how the demographic events of each population influence their respective LD patterns.
|
9 |
Polimorfismo e expressão de genes de celulose sintase em eucalyptus / Polymorphism and expression of cellulose synthase genes in eucalyptusTrigueiro, Elaine Lima January 2007 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2014-08-06T15:10:39Z
No. of bitstreams: 2
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Elaine Lima Trigueiro.pdf: 2172405 bytes, checksum: 872d4e471b17e830b4eafc478bfb3cf5 (MD5) / Made available in DSpace on 2014-08-06T15:10:39Z (GMT). No. of bitstreams: 2
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Elaine Lima Trigueiro.pdf: 2172405 bytes, checksum: 872d4e471b17e830b4eafc478bfb3cf5 (MD5)
Previous issue date: 2007 / Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPq / Cellulose is one of the most important and the most abundant biopolymer on
the planet, playing a key role on the evolutionary history of plants. Important advances
have been made in recent years, in particular on the identification of genes and co-
expressed genes for the formation of cellulose in the primary and secondary cellular walls
of plants. In addition to its biological relevance, cellulose has a great economic importance,
not only in Brazil but in the world, especially due to the production of cellulose and paper
from Eucalyptus. The high levels of production and competition in the international market
are guaranteed by great investments, which are carried through by the forestal sector, in
particular by the Genolyptus Project – Brazilian Network for Research on Eucalyptus
Genome. This project is the result of a collective effort of companies involved on the
production of cellulose and paper and various public research institutions. Their main goal
is to identify and characterize genes involved in wood formation with the intent to
genetically improve Eucalyptus. Based on this goal, this work was developed with two
objectives. The first is doing a preliminary characterization of the cellulose synthase gene
in Eucalyptus, which is associated with the synthesis of the secondary cellular wall and is
orthologous to the gene EgCeA2, of E. grandis. The second objective is to study the
linkage disequilibrium in another gene of cellulose synthase, orthologous to the EgCesA3
gene, sampled from a wild population of E. urophylla. Regarding the CesA2 gene, an
exonic region with 427bp was sequenced from DNA samples of 12 individuals from
different species and geographic regions. The next step was to proceed with an analysis to
detect polymorphism which gave an estimate of three SNPs synonymous along the contig,
with an estimated π = 0.00212 diversity index. A clone containing the CesA2 gene was
identified through a selection from a BAC library generated in the scope of the Genolyptus
Project. This clone gives the prospect for the development of a minute characterization of
this gene structure in Eucalyptus. Additionally, concerning the CesA3 gene, the sequencing
of 32 individuals allowed for the formation of a 770bp contig with a π = 0.00185 diversity
index and detection of nine polymorphic loci distributed in intron and exon regions and at
the 3’-UTR of the gene. The analysis of the extension of linkage disequilibrium in the
CesA3 gene suggests that SNPs tend to be in strong linkage disequilibrium at a distance of
approximately 600bp. The knowledge of the position of the SNPs in the genes CesA2 and
CesA3 makes possible the use of these markers in future studies of genetic mapping. The
lack of non-synonymous SNPs in exon regions ensures that cellulose is in fact a very
important polymer for plant survival. Hence its synthesis machinery presents highly
conserved characteristics and so mutations in regions with effective transcription tend
mostly to be deleterious and therefore would not be fixed. Moreover, the analysis of CesA
gene expression in different species of Eucalyptus, was made from two boardings: “Digital
Differential Display”, from different libraries of ESTs and microarrays, optimized in the
scope of the Genolyptus project. The analysis with data of microarrays showed less
sensible in the detention of the distinguishing expression, probably had to the calls
“crossed relations”. / A celulose é um dos biopolímeros mais importantes do planeta, sendo também
o mais abundante, e sem dúvida uma característica chave na história evolutiva das plantas.
Contudo, sua biossíntese e regulação ainda não são bem compreendidas, embora avanços
importantes tenham ocorrido nos últimos anos, sobretudo na identificação de genes e
grupos de genes co-expressos para a formação de celulose na parede celular primária e
secundária de vegetais. Além de sua relevância biológica, a celulose possui uma grande
importância econômica no Brasil e no mundo, com destaque para a produção de celulose e
papel a partir de Eucalyptus. Para garantir os elevados níveis de produtividade e
competitividade no mercado internacional, grandes investimentos têm sido realizados pelo
setor florestal, destacando-se o Projeto Genolyptus – Rede Brasileira de Pesquisa do
Genoma de Eucalyptus, fruto de um esforço de empresas do setor de produção de celulose
e papel, e de diversas instituições públicas de pesquisa, que têm, dentre outros objetivos, o
intuito de identificar e caracterizar genes envolvidos na formação da madeira, para, no
futuro, usar essa informação no melhoramento genético do Eucalyptus. Nesse contexto,
este trabalho foi desenvolvido com o objetivo de realizar uma caracterização preliminar de
um gene de celulose sintase em Eucalyptus, que está relacionado à síntese da parede
celular secundária, sendo ortólogo ao gene EgCesA2, de E. grandis, bem como estudar o
desequilíbrio de ligação em outro gene de celulose sintase, ortólogo ao gene EgCesA3, em
uma amostra de uma população natural de E. urophylla. Em relação ao gene CesA2, foi
seqüenciada uma região exônica do gene, formada por 427pb, a partir de amostras de DNA
de 12 indivíduos de diferentes espécies e regiões geográficas. Procedeu-se a uma análise de
detecção de polimorfismo, e estimou-se a ocorrência de três SNPs sinônimos ao longo do
contig. Foi estimado um índice de diversidade π= 0,00212. Foi feita também uma triagem
em uma biblioteca de BAC, gerada no âmbito do Projeto Genolyptus, e foi identificado o
clone que contém o gene CesA2, o que permitirá o desenvolvimento futuro de
caracterização minuciosa da estrutura deste gene em Eucalyptus. Em relação ao gene
CesA3, a partir do seqüenciamento de 32 indivíduos, formou-se um contig de 770pb, e foi
encontrado um índice de diversidade π= 0,00185. Foi possível a detecção de nove locos
polimórficos distribuídos em regiões intrônicas, exônicas, e de 3’-UTR do gene. A análise
de extensão do desequilíbrio de ligação dentro do gene CesA3 sugere que os SNPs tendem
a se encontrar em forte desequilíbrio a uma distância de aproximadamente 600pb. O
conhecimento da posição dos SNPs nos genes CesA2 e CesA3 viabiliza a utilização destas
marcas em futuros estudos de mapeamento genético. A existência de SNPs sinônimos nas
regiões exônicas seqüenciadas corrobora com a idéia de que a celulose é um polímero
muito importante à sobrevivência da planta, e, portanto, sua maquinaria de síntese
apresenta características bastante conservadas, de modo que mutações em regiões
efetivamente transcritas tenderiam a ser deletérias e não seriam fixadas. Além disso, foi
feita uma análise da expressão gênica dos genes CesA em diferentes espécies de
Eucalyptus, a partir de duas abordagens: a “Digital Differential Display”, a partir de
diferente bibliotecas de ESTs e os microarrays, otimizados no âmbito do projeto
Genolyptus. A análise com dados de microarrays revelou-se menos sensível na detecção
da expressão diferencial, provavelmente devido às chamadas “relações cruzadas”.
|
10 |
Estrutura genômica de uma população de suínos base Landrace / Genomic structure of admixed Landrace pig populationJoaquim, Letícia Borges [UNESP] 22 February 2016 (has links)
Submitted by LETÍCIA BORGES JOAQUIM null (leticiajoaquim@gmail.com) on 2016-03-18T19:56:09Z
No. of bitstreams: 1
DissertaçãoLeticia.pdf: 1246720 bytes, checksum: 72c61040420200f71667f56d8d424fec (MD5) / Approved for entry into archive by Ana Paula Grisoto (grisotoana@reitoria.unesp.br) on 2016-03-22T12:39:49Z (GMT) No. of bitstreams: 1
joaquim_lb_me_jabo.pdf: 1246720 bytes, checksum: 72c61040420200f71667f56d8d424fec (MD5) / Made available in DSpace on 2016-03-22T12:39:49Z (GMT). No. of bitstreams: 1
joaquim_lb_me_jabo.pdf: 1246720 bytes, checksum: 72c61040420200f71667f56d8d424fec (MD5)
Previous issue date: 2016-02-22 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Os painéis de marcadores de alta densidade têm demonstrado a sua funcionalidade nos estudos de estrutura da população e conservação genética. Esses painéis permitem avaliar similaridades no padrão do desequilíbrio de ligação em toda população, assim como informações sobre parentesco da população. Segmentos de homozigose são utilizados como indicativo da estrutura da população e fornecem informações sobre o histórico demográfico e eventos de endogamia da mesma. O objetivo deste trabalho foi estudar a estrutura genômica de uma linhagem sintética base Landrace por meio de (i) análises de desequilíbrio de ligação; (ii) estimação do coeficiente de endogamia utilizando dados genômicos e de pedigree; (iii) análise do número e tamanho de segmentos de homozigose e (iv) determinação da estratificação da população. Foram utilizados registros de 300 fêmeas e 25 machos de uma linhagem fêmea sintética base Landrace genotipados com o painel Illumina PorcineSNP60 v2 BeadChip. A edição dos dados foi realizada no programa PLINK v.1.9 para remoção de marcadores SNPs (“Single Nucleotide Polymorphism”) que falharam em mais de 10% das amostras (“call rate”) e amostras que falharam em mais de 10% dos marcadores. A extensão do desequilíbrio de ligação foi avaliada entre todos os pares SNPs adjacentes presentes nos cromossomos autossômicos por meio da medida r2. O coeficiente de endogamia foi calculado usando registros de pedigree e de dados genômicos. Os segmentos de homozigose foram detectados para os cromossomos autossômicos com o programa computacional PLINK v.1.9, considerando pelo menos 50 SNPs homozigotos dentro de tamanho mínimo de 1.000 Kb por animal, permitindo um SNP heterozigoto e um SNP faltante/perdido dentro de uma janela de 50 SNPs. Os segmentos de homozigose detectados foram utilizados para cálculo do coeficiente de endogamia genômica e como indicativo do histórico da população. A estratificação da população foi avaliada utilizando análises de componentes principais e pelo modelo de ancestralidade por metodologia bayesiana aplicado no programa STRUCTURE. Na análise de ancestralidade foram testados valores de K (número de “clusters”) variando de um a oito usando período de burn-in de 1.000 iterações e Cadeia de Markov e Monte Carlo de 10.000 iterações. As análises foram repetidas dez vezes para cada K e a determinação do melhor número para K foi estimada utilizando a estatística Delta K. O valor médio de r² encontrado para todos os SNPs adjacentes que estão a uma distância menor que 100 Kb foi de 0,291 ± 0,312. Os coeficientes de endogamia médios obtidos a partir dos segmentos de homozigose e de registros de pedigree foram de 0,119 e 0,00011, respectivamente. A baixa correlação (r<0,04) encontrada entre os coeficientes de endogamia pode ser explicada pelo efeito de recombinação gênica sobre aqueles estimados a partir dos segmentos de homozigose que não é considerada nas estimativas obtidas à partir de registros de pedigree e devido aos erros de identificação dos animais no pedigree. A identificação de um grande número de longos segmentos de homozigose pode ser indicativa de endogamia recente na população estudada. O estudo da estratificação da amostra indicou que a mesma estaria dividida em duas populações (k=2), sendo que a separação pode ser explicada pelo cruzamento entre as raças ocidentais e orientais utilizadas na formação da linhagem. Os dados de genotipagem permitiram concluir que a população estudada possui endogamia recente, sugerindo-se que seja priorizado acasalamento entre indivíduos menos aparentados para assegurar a manutenção da diversidade genética. / High-density single nucleotide polymorphism (SNP) panels have been used in genomic studies, such as population structure and conservation genetic studies. These panels allow to assess similarities in the patterns of linkage disequilibrium across populations and to estimate relatedness between populations. Runs of homozygosity are used as indicative of population structure and it provides information about demographic history and recent inbreeding. The aim of this study was to describe the genomic structure of a synthetic Landrace line by (i) linkage disequilibrium (LD) analyses; (ii) inbreeding estimates through pedigree and genomic data; (iii) analysing the number and length of runs of homozygosity (ROH); and (iv) determination of population structure. A total of 300 females and 25 males from synthetic Landrace line were genotyped using Illumina PorcineSNP60 v2 BeadChip. Data editing was performed using PLINK v.1.9. The SNPs and samples with a call rate lower than 0.90 were excluded from the data set. Only the autosomal chromosomes were considered for LD an ROH analyses. The LD between all pairs of SNPs were measured by the means of the genotype correlation coefficient (r²) and it determined the decay of LD with physical distance. The coefficient of inbreeding was calculated using genomic and pedigree data. ROH were detected using PLINK v.1.9 considering the follow parameters: a minimum ROH of 50 SNPs with a minimum length of 1000 (Kb), one heterozygous SNP and one missing SNP were allowed within the sliding window of 50 SNPs. The individual genomic inbreeding and population history were identified from estimated ROH. The population structure was evaluated using principal component analysis and Bayesian admixture model. The number of clusters (K) was tested from two to eight considering a burning period of 1,000 followed by 10,000 Markov chain Monte Carlo repetitions and replicated ten times for each K. The best K was estimated using the Delta K statistic. For all SNPs adjacent less than 100 kilobase (kb) apart, the average r2 was 0.291 ± 0.312. The average inbreeding coefficient, calculated by ROH and pedigree analyses, were 0.119 and 0.00011, respectively. The low correlation between the inbreeding coefficients can be justified by the genetic recombination effect over those estimated from runs of homozygosity that were no considered on the estimates from the traditional pedigree. The high number of long ROH is an evidence of recent inbreeding in this population. The population structure analysis revealed K=2 was the best number of clusters and separation. This result can be explained by the crossbreeding between the Eastern and Western breeds used in the formation of the line. The genotyping data helped confirm that the inbreeding in the studied population is recent, which suggests that mating between individuals less related occurred to ensure the maintenance of genetic diversity.
|
Page generated in 0.0989 seconds