1 |
Diversidade, estruturação genética e mapeamento associativo em germoplasma japonês de arroz utilizando marcadores DArT-seq / Diversity, genetic structuring and association mapping in Japanese rice germoplasm using DArT-seq markersRizzi, Vanessa 31 August 2017 (has links)
O conhecimento da diversidade genética e da estrutura populacional das variedades mantidas em bancos de germoplasma é de fundamental importância para sua efetiva utilização em programas de melhoramento. O mapeamento por associação, também conhecido como mapeamento por desequilíbrio de ligação, é um dos principais métodos para relacionar genes e alelos às características de interesse, através da co-segregação de marcadores genéticos polimórficos com os genes envolvidos na variação das características em estudo. O Banco de Germoplasma de Arroz do Departamento de Genética da ESALQ contém 192 acessos japoneses que foram estudados com o objetivo de entender sua diversidade, estruturação genética e determinar a associação genômica de caracteres agronômicos relacionados a produção de grãos. A caracterização molecular foi conduzida através da tecnologia DArT-seq, que gerou dados de marcadores SNPs (single-nucleotide polymorphism) e silico DArTs. Em seguida, após a filtragem, 5.578 SNPs de alta qualidade foram utilizados para calcular as estimativas de diversidade no pacote hierfstat e a estrutura do painel de acessos através da análise discriminante de componentes principais (DAPC), que consiste em determinar existência de cluster em um grupo de genótipos em que não há informação a priori sobre existência de grupos. A diversidade genética nos acessos foi evidenciada pelo valor de heterozigosidade esperada (HS) (0,0279) e a estruturação foi evidenciada pela formação de três subgrupos. O mapeamento associativo foi realizado com o uso do pacote GAPIT, sendo considerados seis caracteres: número de dias para florescimento (NDF), estatura de planta (EP), comprimento da panícula (CP), peso de parcela (PP), massa de mil grãos (MMG) e CICLO, bem como 24.266 marcadores silico DArTs e 1.965 marcadores SNPs. Foram detectadas um total de 113 associações significativas genótipo-fenótipo (P<0,001) quando utilizado marcadores silico DArTs em todas as seis características analisadas e, um total de 21 associações significativas genótipo-fenótipo (P<0,001) quando utilizado marcadores SNPs para apenas quatro das seis características analisadas: EP, CICLO, MMG e PP. Considerando-se os 113 silico DArTs associados significativamente na análise, 90 foram localizados em regiões intergênicas e 23 foram localizados dentro de genes. Enquanto que, dos 21 SNPs significativos, 11 foram localizados em regiões intergênicas e 10 foram localizados dentro de genes. A informação gerada neste estudo foi útil para testar associações ao longo do genoma do arroz. O modelo linear misto (MLM) empregado no mapeamento associativo acredita-se ter conseguido controlar eficientemente os falsos positivos no mapeamento utilizando os marcadores SNPs. As informações geradas neste estudo servem de base para avaliações mais aprofundadas, utilizando o conjunto de marcadores significativos como ponto de partida para determinação dos genes mais importantes para a produtividade em arroz. / The knowledge of the genetic diversity and population structure of varieties maintained in germplasm banks is crucial for their effective use in breeding programs. Association mapping, also known as linkage disequilibrium mapping, is one of the main methods for relating genes and alleles to the characteristics of interest, through the co-segregation of polymorphic genetic markers with the genes involved in the variation of the characteristics under study. The Rice Germplasm Bank of the Department of Genetics of ESALQ contains 192 Japanese accessions that were studied with the purpose of understanding its diversity, genetic structuring and determining the genomic association of agronomic traits related to grain production. The molecular characterization was conducted by DArTseq technology, which generated data of SNPs (single-nucleotide polymorphism) markers and silico DArTs. Then, after filtering, 5,578 high-quality SNPs were used to calculate the diversity estimates in hierfstat package and the accession panel structure through discriminant analysis of principal components (DAPC), which consists of determining the cluster existence in a group of genotypes where there is no a priori information about the existence of groups. The genetic diversity in the accessions was evidenced by the expected heterozygosity value (HS) (0.0279) and the population structure was evidenced by the formation of three clusters. The association mapping was performed using the GAPIT package, considering six characters: number of days for flowering (NDF), plant height (EP), panicle length (CP), plot weight (PP), mass of thousand grains (MMG) and CYCLE, as well as 24.266 silico DArTs markers and 1.965 SNPs markers. We detected a total of 113 significant associations genotype-phenotype (P <0.001) when used silico DArTs markers in all six analyzed characteristics and a total of 21 significant associations genotype-phenotype (P<0.001) when used SNPs markers for only four of the six analyzed characteristics: EP, CYCLE, MMG and PP. Considering the 113 silico DArTs significantly associated in the analysis, 90 were located in intergenic regions and 23 were localized within genes. While of the 21 significant SNPs, 11 were located in intergenic regions and 10 were located within genes. The information generated in this study was useful for testing associations throughout the rice genome. The mixed linear model (MLM) used in association mapping is believed to have been able to efficiently control false positives in the mapping using the SNPs markers. The information generated in this study serves as a basis for further evaluation using the set of significant markers as a starting point for determining the most important genes for rice yield.
|
2 |
Diversidade, estruturação genética e mapeamento associativo em germoplasma japonês de arroz utilizando marcadores DArT-seq / Diversity, genetic structuring and association mapping in Japanese rice germoplasm using DArT-seq markersVanessa Rizzi 31 August 2017 (has links)
O conhecimento da diversidade genética e da estrutura populacional das variedades mantidas em bancos de germoplasma é de fundamental importância para sua efetiva utilização em programas de melhoramento. O mapeamento por associação, também conhecido como mapeamento por desequilíbrio de ligação, é um dos principais métodos para relacionar genes e alelos às características de interesse, através da co-segregação de marcadores genéticos polimórficos com os genes envolvidos na variação das características em estudo. O Banco de Germoplasma de Arroz do Departamento de Genética da ESALQ contém 192 acessos japoneses que foram estudados com o objetivo de entender sua diversidade, estruturação genética e determinar a associação genômica de caracteres agronômicos relacionados a produção de grãos. A caracterização molecular foi conduzida através da tecnologia DArT-seq, que gerou dados de marcadores SNPs (single-nucleotide polymorphism) e silico DArTs. Em seguida, após a filtragem, 5.578 SNPs de alta qualidade foram utilizados para calcular as estimativas de diversidade no pacote hierfstat e a estrutura do painel de acessos através da análise discriminante de componentes principais (DAPC), que consiste em determinar existência de cluster em um grupo de genótipos em que não há informação a priori sobre existência de grupos. A diversidade genética nos acessos foi evidenciada pelo valor de heterozigosidade esperada (HS) (0,0279) e a estruturação foi evidenciada pela formação de três subgrupos. O mapeamento associativo foi realizado com o uso do pacote GAPIT, sendo considerados seis caracteres: número de dias para florescimento (NDF), estatura de planta (EP), comprimento da panícula (CP), peso de parcela (PP), massa de mil grãos (MMG) e CICLO, bem como 24.266 marcadores silico DArTs e 1.965 marcadores SNPs. Foram detectadas um total de 113 associações significativas genótipo-fenótipo (P<0,001) quando utilizado marcadores silico DArTs em todas as seis características analisadas e, um total de 21 associações significativas genótipo-fenótipo (P<0,001) quando utilizado marcadores SNPs para apenas quatro das seis características analisadas: EP, CICLO, MMG e PP. Considerando-se os 113 silico DArTs associados significativamente na análise, 90 foram localizados em regiões intergênicas e 23 foram localizados dentro de genes. Enquanto que, dos 21 SNPs significativos, 11 foram localizados em regiões intergênicas e 10 foram localizados dentro de genes. A informação gerada neste estudo foi útil para testar associações ao longo do genoma do arroz. O modelo linear misto (MLM) empregado no mapeamento associativo acredita-se ter conseguido controlar eficientemente os falsos positivos no mapeamento utilizando os marcadores SNPs. As informações geradas neste estudo servem de base para avaliações mais aprofundadas, utilizando o conjunto de marcadores significativos como ponto de partida para determinação dos genes mais importantes para a produtividade em arroz. / The knowledge of the genetic diversity and population structure of varieties maintained in germplasm banks is crucial for their effective use in breeding programs. Association mapping, also known as linkage disequilibrium mapping, is one of the main methods for relating genes and alleles to the characteristics of interest, through the co-segregation of polymorphic genetic markers with the genes involved in the variation of the characteristics under study. The Rice Germplasm Bank of the Department of Genetics of ESALQ contains 192 Japanese accessions that were studied with the purpose of understanding its diversity, genetic structuring and determining the genomic association of agronomic traits related to grain production. The molecular characterization was conducted by DArTseq technology, which generated data of SNPs (single-nucleotide polymorphism) markers and silico DArTs. Then, after filtering, 5,578 high-quality SNPs were used to calculate the diversity estimates in hierfstat package and the accession panel structure through discriminant analysis of principal components (DAPC), which consists of determining the cluster existence in a group of genotypes where there is no a priori information about the existence of groups. The genetic diversity in the accessions was evidenced by the expected heterozygosity value (HS) (0.0279) and the population structure was evidenced by the formation of three clusters. The association mapping was performed using the GAPIT package, considering six characters: number of days for flowering (NDF), plant height (EP), panicle length (CP), plot weight (PP), mass of thousand grains (MMG) and CYCLE, as well as 24.266 silico DArTs markers and 1.965 SNPs markers. We detected a total of 113 significant associations genotype-phenotype (P <0.001) when used silico DArTs markers in all six analyzed characteristics and a total of 21 significant associations genotype-phenotype (P<0.001) when used SNPs markers for only four of the six analyzed characteristics: EP, CYCLE, MMG and PP. Considering the 113 silico DArTs significantly associated in the analysis, 90 were located in intergenic regions and 23 were localized within genes. While of the 21 significant SNPs, 11 were located in intergenic regions and 10 were located within genes. The information generated in this study was useful for testing associations throughout the rice genome. The mixed linear model (MLM) used in association mapping is believed to have been able to efficiently control false positives in the mapping using the SNPs markers. The information generated in this study serves as a basis for further evaluation using the set of significant markers as a starting point for determining the most important genes for rice yield.
|
Page generated in 0.0814 seconds