1 |
Associação genômica ampla para resistência a bacteriose em germoplasma de pessegueiro com base em SNPs / Genome-wide association mapping for bacterial spot resistance in peach germplasm based on SNPs.Thurow, Liane Bahr 14 March 2018 (has links)
Submitted by Gabriela Lopes (gmachadolopesufpel@gmail.com) on 2018-05-24T17:18:08Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Thesis Liane_Final version.pdf: 4719459 bytes, checksum: 27c7e78c16dd0cfaf24b4611c1aff8ff (MD5) / Approved for entry into archive by Aline Batista (alinehb.ufpel@gmail.com) on 2018-05-30T12:53:36Z (GMT) No. of bitstreams: 2
Thesis Liane_Final version.pdf: 4719459 bytes, checksum: 27c7e78c16dd0cfaf24b4611c1aff8ff (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-05-30T12:53:36Z (GMT). No. of bitstreams: 2
Thesis Liane_Final version.pdf: 4719459 bytes, checksum: 27c7e78c16dd0cfaf24b4611c1aff8ff (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2018-03-14 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / O pessegueiro (Prunus persica) é uma das espécies decíduas geneticamente melhor caracterizadas e a terceira frutífera mais importante de clima temperado em todo o mundo. A cultura é vulnerável à bacteriose causada pelo patógeno Xanthomonas arboricola pv. pruni (Xap) e o melhoramento genético visando resistência têm sido a melhor forma de controle da doença. Com o objetivo de contribuir para desenvolvimento de cultivares com maior resistência e implementar análises de associação genômica ampla (GWAS), foi explorado o uso de genotipagem por sequenciamento (GBS) para descoberta e genotipagem simultânea de SNPs em larga escala e realizada caracterização fenotípica para resposta à Xap, em um painel de 220 genótipos de pessegueiro, representativos do germoplasma disponível para melhoramento no Brasil. Um total de 93.353 marcadores SNPs foram descobertos e após filtragem de alta qualidade 18.373 SNPs foram utilizados. Destes, 34% estavam localizados em regiões genômicas, sendo 70% destes em regiões codificantes. Foi detectada forte estrutura genética de população e a distribuição dos genótipos dentro de subpopulações baseou-se principalmente em características relacionadas à fruta: polpa fundente e polpa não-fundente. Padrões de desequilíbrio de ligação (LD) sugeriram uma queda média de LD em relação à distância e a extensão do LD altamente dependente da subpopulação e das regiões do genoma. Avaliações de campo e através do bioensaio de folhas destacadas mostraram resultados confiáveis e complementares para identificar fontes resistentes à Xap. Os genótipos 'Norman', 'Cristal Taquari', 'La Feliciana' e 'Precocinho' foram considerados fontes altamente resistentes e podem ser alternativas efetivas para melhorar a resistência à Xap em pessegueiro. Em geral, o germoplasma avaliado mostrou grande variabilidade para resposta à Xap, permitindo a identificação de genótipos contrastantes para a característica de interesse. Os genótipos com resistência podem ser preferencialmente utilizados em áreas de produção com maior ocorrência da doença, ou utilizados como genitores no programa de melhoramento visando aumentar o nível de resistência. Análises de GWAS validaram e definiram com mais precisão as regiões genômicas identificadas com resistência ao patógeno em estudos anteriores, bem como possibilitaram a identificação de novos genes candidatos que necessitam ser melhor
ix
estudados. Vários SNPs informativos foram funcionalmente anotados em genes envolvidos em mecanismos de defesa à infecção por patógenos, com destaque para duas regiões genômicas, localizadas no cromossomo 1 (2,59 Mpb) e 2 (2,85 Mpb), respectivamente, ambas identificadas com vários genes R. Os resultados encontrados abrem novos caminhos para o melhoramento genético visando resistência a Xap, com grande potencial para subsequente aplicação de seleção assistida por marcadores. / Peach (Prunus persica) is one of the best genetically characterized deciduous trees and the third most important temperate fruit crop worldwide. This crop is vulnerable to bacterial spot caused by Xanthomonas arboricola pv. pruni (Xap) and breeding for resistance has been the main choice to control the disease. With the aim to contribute with breeding for more resistant cultivars, and perform genome-wide association analysis (GWAS), we explored the use of genotyping by sequencing (GBS) for large-scale SNP discovery and simultaneous genotyping and performed high quality phenotyping for Xap response, among a panel with 220 peach genotypes, representative of the Brazilian breeding germplasm. A total of 93,353 SNP markers were discovered, and after filtering 18,373 high quality SNPs were used in analyses. Thirty-four percent of selected SNPs were located in genic regions and 70% of these in the coding sequence. Strong population genetic structure was detected, with the distribution of genotypes within subpopulations based mainly on fruit-related traits: melting and non-melting flesh. Linkage disequilibrium (LD) patterns suggested a medium LD level, with the extent of LD highly dependent on the subpopulations and genome regions. Field evaluation and detached leaf assessments were reliable and complementary methods to identify Xap resistant sources. The genotypes ‘Norman’, ‘Cristal Taquari’, ‘La Feliciana’ and ‘Precocinho’ were considered highly resistant sources and may be effective alternatives to improve Xap resistance in peach. Overall, the germplasm evaluated showed great variability for response to Xap, allowing the identification of contrasting genotypes for the trait of interest. Genotypes with resistance could be preferred for peach production areas more subjected to disease occurrence, or used as parents by the breeding program to improve resistance. GWAS analysis validated and defined more accurately the known genomic regions underlying Xap resistance, as well as identified novel candidate genes that provide useful targets for further investigation. Several informative SNPs were functionally annotated in genes involved in defense mechanisms against pathogen infection, highlighting two genomic regions, located on chromosome 1 (2.59 Mbp) and 2 (2.85 Mbp), respectively, both housing several R genes. Our results provide new insights into breeding for Xap resistance in peach, with great potential for subsequent application of marker-assisted selection.
|
2 |
Construction of a high-density genetic map of Acca sellowiana (Berg.) Burret based on two connected mapping populations / Construção de um mapa genético de alta densidade em Acca sellowiana (Berg.) com base em duas populações de mapeamento geneticamente conectadasMacchiavello, Marianella Fernanda Quezada 26 September 2017 (has links)
Acca sellowiana, known as feijoa or pineapple guava, is a Myrtaceae fruit tree species native to Uruguay and Brazil. The species stand out for its highly aromatic fruits, with nutraceutical and therapeutic value. Despite its agronomically promising valuable, genetics studies on this species are limited. Linkage genetic maps are valuable tools for genetic and genomic studies, and can be employed in breeding programs to support the development of molecular breeding strategies. The lack of a high number of polymorphic markers is one of the main limitation to development saturated genetic maps. Recently, novel genotyping methods based on next generation sequencing technology allow to detect and genotype thousands of markers in mapping populations. This represents a rapid and cost-effective strategy, remarkably useful for minor species with limited genomic resources. In this study, we constructed a high-density integrated genetic linkage map of A. sellowiana using two populations, H5 (\'TCO × BR\' , n = 160) and H6 (\'TCO × DP\', n = 184), which have the same female parent. Genotyping by sequencing (GBS) approach was used to simultaneously discover and genotype single nucleotide polymorphism (SNP) markers in both populations. Two strategies were carried out to identify SNP markers: a reference pipeline using the reference genome of the closely-related species Eucalyptus grandis, and a de-novo pipeline that do not require a reference genome. After quantitative genotype calling, 5,350 and 4,227 high quality SNP markers were selected for mapping in H5 and H6 populations, respectively. The two resulting maps of populations H5 and H6 comprised 1,236 and 1,302 markers distributed over the expected 11 linkage groups. The H5 and H6 maps spanned a map length of 1,593 cM and 1,572 cM, with an average inter-marker distance of 1:29 cM and 1:21 cM, respectively. A high degree of collinearity was observed between the two maps. In addition, a large proportion of markers were common to both maps and were used to construct the composite genetic linkage map. A novel approach to estimate recombination of two connected populations is described, where the meiosis information of all individuals is captured in a single estimator using a multipoint maximum likelihood estimation. The composite map consisted of 641 SNPs markers with a total map length of 1011 cM. This composite map represent the best consensus ordering of markers, a valuable reference framework for future studies in A. sellowiana. The large number of SNPs identified allowed us to construct high-density genetic maps, molecular tools which represent a relevant contribution for future genetic research and breeding efforts in A. sellowiana. / Acca sellowiana, conhecida como feijoa, pineapple guava ou goiabeira-serrana, é uma árvore frutífera nativa do Uruguai e do Brasil, pertencente a família Myrtaceae. A espécie destaca-se por suas frutas altamente aromáticas, com reconhecido valor nutracêutico e terapêutico. Apesar do promissor valor agronômico, os estudos genéticos nesta espécie são limitados. Os mapas genéticos são valiosas ferramentas em tais estudos, sendo empregados no desenvolvimento de estratégias de melhoramento molecular nos programas de melhoramento. No entanto, a falta de um elevado número de marcadores polimórficos nas populações de mapeamento é uma das principais limitações no desenvolvimento de mapas genéticos saturados. Recentemente, novos métodos de genotipagem baseados em tecnologia de sequenciamento de nova geração permitem identificar e genotipar milhares de marcadores em populações de mapeamento. Esta rápida e eficiente estratégia é muito útil para culturas pouco estudadas, com recursos genômicos limitados. Neste estudo, foram construídos mapas genéticos saturados em A. sellowiana. Foram usadas duas populações de mapeamento, H5 (\'TCO × BR\', n = 160) e H6 (\'TCO × DP\', n = 184), conectadas geneticamente pelo mesmo genitor feminino. A estratégia de genotipagem por sequenciamento (genotyping by sequencing; GBS) foi usada para simultaneamente identificar e genotipar marcadores de polimorfismos de nucleotídeo único (single nucleotide polymorphism; SNP) em ambas populações. No processo de detecção de SNPs, duas estratégias foram implementadas: na primeira foi empregado o genoma de referência de especie relacionada Eucalyptus grandis; na segunda, foi empregado uma abordagem de novo, que não requer genoma de referência. Após o processo de genotipagem quantitativo, 5350 e 4227 SNPs de alta qualidade foram selecionados para mapeamento em H5 e H6, respectivamente. Os mapas integrados H5 e H6 compreendem 1236 e 1302 marcadores distribuídos no 11 grupos de ligação esperados. Os mapas genético abrangeram um comprimento total de 1593 cM e 1572 cM, com uma distância média entre marcadores de 1:29 cM e 1:21 cM, nas populações H5 e H6, respectivamente. Um alto nível de colinearidade foi observado entre os dois mapas. Além disso, uma grande proporção de marcadores foram mapeados em ambos mapas e posteriormente usados na construção de um mapa genético integrado, considerando a informação de ambas populações simultaneamente. Foi apresentada uma nova abordagem para estimar as frações de recombinação em duas populações conectadas, onde a informação das meioses de todos os indivíduos é capturado num único estimador, usando uma estimativa de máxima verossimilhança multiponto. O mapa integrado composto contém 641 marcadores SNP com um comprimento total de 1011 cM. Este mapa representa o melhor ordenamento consenso de marcadores, sendo una valiosa referencia para futuros estudos nesta espécie. O grande número de SNPs identificados permitiu-nos a construção de mapas genéticos de alta densidade, ferramentas moleculares que representam uma contribuição relevante para futuras pesquisas genéticas e avanços no melhoramento genético em A. sellowiana.
|
3 |
Exploiting next generation sequencing techniques (NGS) to identify molecular markers for monitoring the resistance of Spodoptera frugiperda (J.E. Smith) (Lepidoptera: Noctuidae) to insecticides and Bt proteins / Explorando técnicas de sequenciamento de próxima geração (NGS) para identificar marcadores moleculares para o monitoramento da resistência de Spodoptera frugiperda (J.E. Smith) (Lepidoptera: Noctuidae) a inseticidas e proteínas BtNascimento, Antonio Rogerio Bezerra do 16 August 2018 (has links)
In this study we used Next-generation sequencing \"NGS\" for DNA and RNA sequencing to search for molecular markers associated with resistance of Spodoptera frugiperda (J.E. Smith) to insecticides and Bacillus thuringiensis Berliner (Bt) proteins. For this purpose, we selected S. frugiperda resistant strains to insecticides (chlorpyrifos, lambda-cyhalothrin, lufenuron, teflubenzuron and spinosad) belonging to different chemical groups and to the YieldGard VT-PRO® maize expressing Cry1A.105 and Cry2Ab2 proteins. The results of gene expression between resistant and susceptible strains of the neurotoxic insecticides chlorpyrifos and lambda-cyhalothrin demonstrated 935 differentially expressed genes associated with chlorpyrifos resistance and 241 differentially expressed genes associated with lambda-cyhalothrin. Most of these genes was related to high levels of expression in detoxification enzymes, especially the CYP3 and CPY6 families. Regarding to the insecticide teflubenzuron, the inheritance of resistance was characterized as autosomal, incompletely recessive and polygenic. The results of gene expression between resistant and susceptible strains of teflubenzuron indicated 3,519 differentially expressed transcripts, mainly detoxification enzymes from the GSTs, UGTs, P450s, CEs, as well as transport and regulation genes. This gene expression profile was also identified to YieldGard VT-PRO® resistant strain, which also demonstrated changes in the expression levels of other gene groups such as cadherin, aminopeptidases and alkaline phosphatase. Finally, to identify SNP markers associated with resistance of S. frugiperda to insecticides and Bt proteins, we used a genotyping by sequencing (GBS) protocol to all resistant strains and the susceptible strain. A total of 4,276 SNPs was recovered after filtering processes, where 53 polymorphic loci under selection were statistically significant (FDR<=0.047) and none of them was associated with coding regions. However, several of these SNPs were associated with regulatory regions of the genome. Analyses using DAPC resulted in the formation of seven clusters, with the susceptible line being separated from all resistant strains. The resistant strain to chlorpyrifos presented an exclusive cluster separated from the other resistant strains, which were grouped together. The association analyses between susceptible and resistant strains indicated 17 loci associated with all resistant strains, 114 loci associated with resistance to chlorpyrifos, 105 to lambda-cyhalothrin, 84 to lufenuron, 87 to teflubenzuron, 108 to spinosad and 62 to YieldGard VT-PRO® maize. Therefore, we can conclude that the resistance processes associated to insecticides and Bt toxins are due to a large number of molecular modifications at specific sites associated with detoxification and regulation processes. The use of technologies that allow for a systematic and comprehensive analyses of these phenomena, such as new-generation sequencing, large-scale molecular marker search, and functional studies with several insecticide groups should be the new research base to advance the knowledge on adaptive processes driven by the evolution of insect resistance to insecticides and Bt proteins. / Técnicas de sequenciamento de DNA e RNA de próxima geração foram utilizadas para identificar marcadores moleculares associados à resistência de Spodoptera frugiperda (J.E. Smith) a inseticidas e proteínas de Bacillus thuringiensis Berliner (Bt). Para tanto, foram selecionadas linhagens de S. frugiperda resistentes a moléculas inseticidas (chlorpyrifos, lambda-cyhalothrin, lufenuron, teflubenzuron e spinosad) pertencentes a diferentes grupos químicos e ao milho YieldGard VT-PRO® que expressa proteínas Cry1A.105 e Cry2Ab2. Os resultados de expressão gênica entre as linhagens resistentes e suscetíveis aos inseticidas neurotóxicos chlorpyrifos e lambda-cyhalothrin, indicaram 935 genes associados à resistência a chlorpyrifos e 241 genes a lambda-cyhalothrin que foram diferencialmente expressos. A maior parte desses genes está relacionada a elevados nível de expressão de enzimas de detoxificação, principalmente das famílias CYP3 e CPY6. Com relação ao inseticida teflubenzuron, o padrão de herança da resistência foi caracterizado como resistência autossômica, incompletamente recessiva e poligênica. Os resultados de expressão gênica entre as linhagens resistente e suscetível a teflubenzuron indicou 3.519 transcritos diferencialmente expressos, principalmente de enzimas de detoxificação dos grupos GSTs, UGTs, P450s, CEs, além de genes de transporte e regulação. Esse perfil de expressão gênica também foi identificando na linhagem resistente ao milho YieldGard VT-PRO®, o qual também demonstrou modificações nos níveis de expressão de outros grupos gênicos como caderina, aminopeptidases e alcalino-fosfatase. Por último, com a finalidade de identificarmos marcadores tipo SNP associados à resistência de S. frugiperda a inseticidas e proteínas Bt, o protocolo de genotyping by sequencing (GBS) foi utilizado para todas as linhagens resistentes mencionadas e a linhagem suscetível de referência. Foram recuperados 4.276 SNPs após os processos de filtragem, sendo identificados 53 locos polimórficos sob seleção estatisticamente significantes (FDR<=0,047), sendo que nenhum deles associado a regiões codificantes. No entanto, vários desses SNPs foram associados a regiões reguladoras do genoma. As análises utilizando DAPC resultou na formação de sete grupos, com a separação da linhagem suscetível de todas as linhagens resistentes. A linhagem resistente a chlorpyrifos apresentou um grupo exclusivo separado das demais linhagens resistentes, as quais permaneceram agrupadas. As análises de associação entre as linhagens suscetível e resistentes indicaram 17 locos associados a todas as linhagens resistentes, 114 locos associados à linhagem resistente a chlorpyrifos, 105 a lambda-cyhalothrin, 84 a lufenuron, 87 a teflubenzuron, 108 a spinosad e 62 ao milho YieldGard VT-PRO®. Dessa forma podemos concluir que os processos de resistência associados a inseticidas e toxinas Bt são decorrentes de um grande número de modificações moleculares em sítios específicos associados a detoxificação e processos de regulação. Portanto, a utilização de tecnologias que possibilitem a análise sistêmica e ampla desses fenômenos, como sequenciamento de nova geração, busca de marcadores moleculares em larga escala e estudos funcionais com diversos grupos de inseticidas devem ser a nova base de pesquisa para avançar o conhecimento dos processos adaptativos impulsionados pela evolução da resistência de insetos a inseticidas e proteínas Bt.
|
4 |
Practical considerations for genotype imputation and multi-trait multi-environment genomic prediction in a tropical maize breeding program / Considerações práticas para a imputação de genótipos e predição genômica aplicada a múltiplos caracteres e ambientes em um programa de melhoramento de milho tropicalOliveira, Amanda Avelar de 17 June 2019 (has links)
The availability of molecular markers covering the entire genome, such as single nucleotide polymorphism (SNP) markers, allied to the computational resources for processing large amounts of data, enabled the development of an approach for marker assisted selection for quantitative traits, known as genomic selection. In the last decade, genomic selection has been successfully implemented in a wide variety of animal and plant species, showing its benefits over traditional marker assisted selection and selection based only on pedigree information. However, some practical challenges may still limit the wide implementation of this method in a plant breeding program. For example, we cite the cost of high-density genotyping of a large number of individuals and the application of more complex models that take into account multiple traits and environments. Thus, this study aimed to i) investigate SNP calling and imputation strategies that allow cost-effective high-density genotyping, as well as ii) evaluating the application of multivariate genomic selection models to data from multiple traits and environments. This work was divided into two chapters. In the first chapter, we compared the accuracy of four imputation methods: NPUTE, Beagle, KNNI and FILLIN, using genotyping-by-sequencing (GBS) data from 1060 maize inbred lines, which were genotyped using different depths of coverage. In addition, two SNP calling and imputation strategies were evaluated. Our results indicated that combining SNP-calling and imputation strategies can enhance cost-effective genotyping, resulting in higher imputation accuracies. In the second chapter, multivariate genomic selection models, for multiple traits and environments, were compared with their univariate versions. We used data from 415 hybrids evaluated in the second season in four years (2006-2009) for grain yield, number of ears and grain moisture. Hybrid genotypes were inferred in silico based on their parental inbred lines using SNP markers obtained via GBS. However, genotypic information was available only for 257 hybrids, motivating the use of the H matrix, which combines genetic information based on pedigree and molecular markers. Our results demonstrated that the use of multi-trait multi-environment models can improve predictive abilities, especially to predict the performance of hybrids that have not yet been evaluated in any environment. / A disponibilidade de marcadores moleculares cobrindo todo o genoma, como os polimorfismos de nucleotídeos individuais (single nucleotide polymorphism - SNP), aliada aos recursos computacionais para o processamento de grande volume de dados, tornou possível o desenvolvimento de uma abordagem de melhoramento assistido para caracteres de herança quantitativa, conhecida como seleção genômica. Na última década a seleção genômica tem sido implementada com sucesso em uma enorme variedade de espécies animais e vegetais, comprovando suas vantagens sobre a seleção assistida por marcadores tradicional e a seleção baseada apenas em informações de parentesco. No entanto, alguns desafios práticos ainda podem limitar a implementação deste método em um programa de melhoramento de plantas. Como exemplos, citam-se o custo da genotipagem de alta densidade de um grande número de indivíduos e a aplicação de modelos mais complexos, que consideram múltiplos caracteres e ambientes. Dessa forma, este estudo teve como objetivos: i) investigar estratégias de identificação de SNPs e imputação que possibilitem uma genotipagem de alta densidade economicamente viável; e ii) avaliar a aplicação de modelos multivariados de seleção genômica para múltiplos caracteres e ambientes. Este trabalho foi divido em dois capítulos. No primeiro capítulo, comparou-se a acurácia de quatro métodos de imputação: NPUTE, Beagle, KNNI e FILLIN, usando dados de genotipagem por sequenciamento (genotyping-by-sequencing - GBS) de 1.060 linhagens de milho, que foram genotipadas usando diferentes profundidades de cobertura. Além disso, duas estratégias de identificação de SNPs e imputação foram avaliadas. Os resultados indicaram que a combinação de estratégias de detecção de polimorfismos e imputação pode possibilitar uma genotipagem economicamente viável, resultando em maiores acurácias de imputação. No segundo capítulo, modelos multivariados de seleção genômica, para múltiplos caracteres e ambientes, foram comparados com suas versões univariadas. Dados de 415 híbridos avaliados na segunda safra em quatro anos (2006-2009) para os caracteres produtividade de grãos, número de espigas e umidade foram utilizados. Os genótipos dos híbridos foram inferidos in silico com base nos genótipos das linhagens parentais usando marcadores SNPs obtidos via GBS. No entanto, informações genotípicas estavam disponíveis para apenas 257 híbridos, de modo que foi necessário fazer uso da matriz H, a qual combina informações de parentesco genético baseadas em pedigree e marcadores. Os resultados obtidos demonstraram que o uso de modelos de seleção genômica para múltiplos caracteres e ambientes pode aumentar a capacidade preditiva, especialmente para predizer a performance de híbridos nunca avaliados em qualquer ambiente.
|
5 |
Métodos de seleção genômica aplicados a sorgo biomassa para produção de etanol de segunda geração / Genome wide selection methods applied to high biomass sorghum for the production of second generation ethanolOliveira, Amanda Avelar de 03 July 2015 (has links)
As crescentes preocupações com questões ambientais têm despertado interesse global pelo uso de combustíveis alternativos, e o uso da biomassa vegetal surge como uma alternativa viável para a geração de biocombustíveis. Diferentes materiais orgânicos têm sido utilizados, e dentre eles destaca-se o sorgo biomassa (Sorghum bicolor L. Moench). A seleção genômica apresenta grande potencial e pode, em médio prazo, reestruturar os programas de melhoramento de plantas, promovendo maiores ganhos genéticos quando comparada a outros métodos, além de reduzir significativamente o tempo necessário para o desenvolvimento de novas cultivares, através da seleção precoce. Este trabalho teve como objetivo avaliar modelos de seleção genômica e aplicá-los para a predição dos valores genéticos de indivíduos do painel de sorgo biomassa da Embrapa/Milho e Sorgo. Tal painel inclui materiais do banco de germoplasma e materiais utilizados em programas de melhoramento de sorgo dessa instituição, bem como coleções núcleo do CIRAD e ICRISAT, sendo, portanto, subdividido em dois sub-painéis. As 100 linhagens do sub-painel 1 foram avaliadas fenotipicamente por dois anos (2011 e 2012) e as 100 linhagens do sub-painel 2 por um ano (2011), ambas no município de Sete Lagoas-MG, para as seguintes características fenotípicas: tempo até o florescimento, altura de plantas, produção de massa verde e massa seca, proporções de fibra ácida e neutra, celulose, hemicelulose e lignina. Posteriormente, as 200 linhagens integrantes do painel foram genotipadas através da técnica de genotipagem por sequenciamento. A partir desses dados genotípicos e fenotípicos, os modelos de seleção genômica Bayes A, Bayes B, Bayes Cπ, Bayes Lasso, Bayes Ridge Regression e Random Regression BLUP (RRBLUP) foram ajustados e comparados. As capacidades preditivas obtidas foram elevadas e pouco variaram entre os diversos modelos, variando de 0,61 para o caráter florescimento a 0,85 para a proporção de fibra ácida, quando o modelo RRBLUP foi empregado na análise conjunta dos dois sub-painéis. Por outro lado, a predição cruzada entre sub-painéis resultou em capacidades preditivas substancialmente menores, nunca superiores a 0,66 e em alguns cenários virtualmente iguais a zero, além de apresentar maiores variações entre os modelos ajustados. Simulações do uso de subconjuntos dos marcadores moleculares são apresentadas e indicam possibilidades de obtenção de capacidades preditivas mais elevadas. Análises de enriquecimento funcional realizadas a partir dos efeitos preditos dos marcadores sugeriram associações interessantes, as quais devem ser investigadas com maiores detalhes em estudos futuros, com potencial de elucidação da arquitetura genética dos caracteres quantitativos. / Increased concerns about environmental issues have aroused global interest in the use of alternative fuels, and the use of plant biomass emerges as a viable alternative for the generation of biofuels. Different organic materials have been used, including high biomass sorghum (Sorghum bicolor L. Moench). Genomic selection has great potential and could, in the medium term, restructure plant breeding programs, promoting greater genetic gains when compared to other methods and significantly reducing the time required for the development of new cultivars through early selection. This work aimed at evaluating models of genomic selection and applying them to the prediction of breeding values for a panel of high biomass sorghum genotypes of Embrapa / Milho e Sorgo. This panel includes materials from the gene bank and materials used in sorghum breeding programs of this institution, as well as core collections from CIRAD and ICRISAT, and is therefore divided into two sub-panels. The 100 lines of sub-panel 1 were evaluated phenotypically for two years (2011 and 2012) and the 100 lines of sub-panel 2 for one year (2011), both in the city of Sete Lagoas, Minas Gerais, for the following phenotypic traits: days to flowering, plant height, fresh and dry matter yield and fiber, cellulose, hemicellulose and lignin proportions. Subsequently, the 200 lines were genotyped by via the genotyping by sequencing technique. From these genotypic and phenotypic data, genomic selection models Bayes A, Bayes B, Bayes Cπ, Bayes Lasso, Bayes Ridge Regression and Random Regression BLUP (RRBLUP) were fitted and compared. The predictive capabilities obtained were high and varied little between the different models, ranging from 0.61 for days to flowering to 0.85 for acid fiber, when the RRBLUP model was used on the combined analysis of the two sub-panels. On the other hand, cross prediction between sub-panels resulted in substantially lower predictive capability, never above 0.66 and in some scenarios virtually equal to zero, with greater variations between the fitted models. Simulations of using subsets of molecular markers are presented and indicate possibilities of achieving higher predictive capabilities. Functional enrichment analyses performed with the marker predicted effects suggested interesting associations, which should be investigated in more detail in future studies, with potential for elucidating the genetic architecture of quantitative traits.
|
6 |
Tropical forage breeding from classic to new genomic tools: an example with interspecific tetraploid Urochloa spp. hybrids / Melhoramento de forrageiras tropicais do clássico as modernas ferramentas genômicas: um exemplo em híbridos interespecíficos tetraploides de Urochloa spp.Matias, Filipe Inácio 05 December 2018 (has links)
A tropical forage breeding program contains several peculiarities, especially when it involves polyploid species and facultative apomixis. Despite their importance, there is still a lack of information on genetic studies of critical forage traits and on the employment of genomic tools when compared to other crops and temperate forages. The genus Brachiaria is the most important for forage in tropical regions mainly beef production. The commercial species in this genus are excellent perennial forage, and the identification of superior genotypes depends on the selection of many characteristics under complex genetic control, with high cost and time-consuming evaluation. Therefore, the knowledge about uses and applications of classic and genomic tools in forage traits may be useful to support breeding programs and the development of new cultivars. In this context, the aim was to evaluate several different classic and genomic tools to be employed as selection strategies in a traditional tropical forage breeding program. A panel of tetraploid hybrids obtained from crossing Urochloa brizantha x Urochloa ruziziensis was phenotyped and genotyped to evaluate genetic parameters and perform genomic studies. The classic phenotypic analysis showed no clear trend of the importance of additive and non-additive genetics effects for agronomical and nutritional traits. The Mulamba and Mock index should be used in the univariate level, due to the promotion of a more balanced response to selection for all traits in the multivariate selection. In the genomic extraction and evaluations, the reads that were aligned to a \'mock\' reference genome, created from GBS data of the cultivar \'Marandu\', had more SNP discovered compared to the closest true reference genomes, Setaria viridis and S. italica. We recommended different thresholds of sample depth and genotype quality (GQ) to eliminate poor quality reads without introducing genotype bias. Cross-validation revealed that missing genotypes were imputed with a median accuracy of 0.85 using Random Forest algorithm to produce a complete genotype matrix, regardless of heterozygote frequency. The genome-wide association analysis (GWAS) revealed candidate genes associated with many tropical forage traits across all cutting seasons, which could be the first step toward marker-assisted selection (MAS). Moreover, our results suggest that accounting for allele dosage is essential, since the tetraploid level provided more information about the true biological state. Therefore, our findings revealed the complexity of the genetic architecture of Urochloa spp. traits and provided important insights towards the application of GWAS in polyploids species. The genomic selection analysis revealed that GBLUP-A (additive) and GBLUP-AD (additive + dominance) showed similar prediction abilities considering both single and multi-trait models. Conversely, combining GBLUP-AD and tetraploid information could improve the selection coincidence. Furthermore, the multi-trait validation scheme 2 (VS2), where one trait is not evaluated for some individuals, provided an increment of up to 30% to the prediction ability. Therefore, it is an useful strategy for traits with low heritability. Overall, all genomic selection models considered provided greater genetic gains than the phenotypic selection. Similarly, the allele dosage associated with additive, dominance and multi-trait factors increased the accuracy of genomic prediction models for interspecific polyploid hybrids. Finally, genomic tools should be used in forages breeding programs in order to reduce cost and time. / Um programa de melhoramento de forragem tropical contém várias peculiaridades, especialmente quando se trata de espécies poliplóides e de apomixia facultativa. Apesar de sua importância, atualmente, faltam informações sobre estudos genéticos de características forrageiras e sobre o emprego de ferramentas genômicas quando comparadas a outras culturas e forragens de clima temperado. O gênero Brachiaria é o mais importante para formação de pastagens nas regiões tropicais, principalmente para produção de carne bovina. As espécies comerciais deste gênero são excelentes forrageiras perenes, e a identificação de genótipos superiores depende da seleção de muitas características sob controle genético complexo, com alto custo e avaliação demorada. Portanto, o conhecimento sobre usos e aplicações de ferramentas clássicas e genômicas em características forrageiras pode ser útil para apoiar programas de melhoramento e o desenvolvimento de novas cultivares. Nesse contexto, objetivou-se avaliar diversas ferramentas clássicas e genômicas a serem empregadas como estratégias de seleção em um programa tradicional de melhoramento de forrageiras tropicais. Um painel de híbridos tetraplóides obtidos do cruzamento Urochloa brizantha x Urochloa ruziziensis foi fenotipado e genotipado para avaliar parâmetros genéticos e realizar estudos genômicos. Para a análise fenotípica clássica, concluímos que não havia uma tendência clara da importância dos efeitos genéticos aditivos e não-aditivos para características agronômicas e nutricionais. O índice de Mulamba e Mock deve ser usado no nível univariado, devido à promoção de uma resposta mais equilibrada à seleção para todas as características na seleção multivariada. Na extração e nas avaliações genômicas, as leituras que foram alinhadas ao genoma de referência \'simulado\', criado a partir dos dados de GBS da cultivar \'Marandu\', tiveram a maior porcentagem de descoberta de marcadores SNP comparado aos genomas de referência mais próximos, Setaria viridis e S. italica. Recomendamos diferentes limiares de profundidade de leitura e qualidade de genótipo (GQ) para eliminar leituras de baixa qualidade sem introduzir viés de chamada de genótipo. A validação cruzada revelou que os genótipos ausentes foram imputados com uma precisão mediana de 0,85 pelo algoritmo Random Forest para produzir uma matriz genotípica completa, independentemente da frequência de heterozigotos. A análise de associação genômica ampla (GWAS) revelou genes candidatos associados a muitas características forrageiras tropicais, o que poderia ser o primeiro passo em direção à seleção assistida por marcadores (MAS). Além disso, nossos resultados sugerem que a contabilização da dosagem alélica é essencial, uma vez que o nível tetraploide fornece mais informações sobre o verdadeiro estado biológico. Portanto, nossos achados revelam a complexidade da arquitetura genética de características de Urochloa spp. e fornecem informações importantes para a aplicação de GWAS em espécies poliploides. A análise de seleção genômica revela que o GBLUP-A (aditivo) e o GBLUP-AD (aditivo + dominância) mostraram capacidades de predição semelhantes, considerando tanto os modelos simples quanto os multi-característica. Por outro lado, combinando-se GBLUP-AD e informação tetraploide foi possível melhorar a coincidência de seleção. Além disso, o esquema de validação multi-característica 2 (VS2), onde uma característica não é avaliada para alguns indivíduos, pode fornecer um incremento de até 30% da capacidade de previsão. Portanto, é uma estratégia útil para características com baixa herdabilidade. No geral, todos os modelos de seleção genômica considerados proporcionaram maiores ganhos genéticos do que a seleção fenotípica tradicional. Da mesma forma, a dosagem do alelo associado a fatores aditivos, de dominância e multicaracteres aumentou a acurácia dos modelos genômicos de predição para híbridos poliploides interespecíficos. Finalmente, ferramentas genômicas devem ser utilizadas em programas de melhoramento de forragens para reduzir custos e tempo.
|
7 |
Diversidade, estruturação genética e mapeamento associativo em germoplasma japonês de arroz utilizando marcadores DArT-seq / Diversity, genetic structuring and association mapping in Japanese rice germoplasm using DArT-seq markersRizzi, Vanessa 31 August 2017 (has links)
O conhecimento da diversidade genética e da estrutura populacional das variedades mantidas em bancos de germoplasma é de fundamental importância para sua efetiva utilização em programas de melhoramento. O mapeamento por associação, também conhecido como mapeamento por desequilíbrio de ligação, é um dos principais métodos para relacionar genes e alelos às características de interesse, através da co-segregação de marcadores genéticos polimórficos com os genes envolvidos na variação das características em estudo. O Banco de Germoplasma de Arroz do Departamento de Genética da ESALQ contém 192 acessos japoneses que foram estudados com o objetivo de entender sua diversidade, estruturação genética e determinar a associação genômica de caracteres agronômicos relacionados a produção de grãos. A caracterização molecular foi conduzida através da tecnologia DArT-seq, que gerou dados de marcadores SNPs (single-nucleotide polymorphism) e silico DArTs. Em seguida, após a filtragem, 5.578 SNPs de alta qualidade foram utilizados para calcular as estimativas de diversidade no pacote hierfstat e a estrutura do painel de acessos através da análise discriminante de componentes principais (DAPC), que consiste em determinar existência de cluster em um grupo de genótipos em que não há informação a priori sobre existência de grupos. A diversidade genética nos acessos foi evidenciada pelo valor de heterozigosidade esperada (HS) (0,0279) e a estruturação foi evidenciada pela formação de três subgrupos. O mapeamento associativo foi realizado com o uso do pacote GAPIT, sendo considerados seis caracteres: número de dias para florescimento (NDF), estatura de planta (EP), comprimento da panícula (CP), peso de parcela (PP), massa de mil grãos (MMG) e CICLO, bem como 24.266 marcadores silico DArTs e 1.965 marcadores SNPs. Foram detectadas um total de 113 associações significativas genótipo-fenótipo (P<0,001) quando utilizado marcadores silico DArTs em todas as seis características analisadas e, um total de 21 associações significativas genótipo-fenótipo (P<0,001) quando utilizado marcadores SNPs para apenas quatro das seis características analisadas: EP, CICLO, MMG e PP. Considerando-se os 113 silico DArTs associados significativamente na análise, 90 foram localizados em regiões intergênicas e 23 foram localizados dentro de genes. Enquanto que, dos 21 SNPs significativos, 11 foram localizados em regiões intergênicas e 10 foram localizados dentro de genes. A informação gerada neste estudo foi útil para testar associações ao longo do genoma do arroz. O modelo linear misto (MLM) empregado no mapeamento associativo acredita-se ter conseguido controlar eficientemente os falsos positivos no mapeamento utilizando os marcadores SNPs. As informações geradas neste estudo servem de base para avaliações mais aprofundadas, utilizando o conjunto de marcadores significativos como ponto de partida para determinação dos genes mais importantes para a produtividade em arroz. / The knowledge of the genetic diversity and population structure of varieties maintained in germplasm banks is crucial for their effective use in breeding programs. Association mapping, also known as linkage disequilibrium mapping, is one of the main methods for relating genes and alleles to the characteristics of interest, through the co-segregation of polymorphic genetic markers with the genes involved in the variation of the characteristics under study. The Rice Germplasm Bank of the Department of Genetics of ESALQ contains 192 Japanese accessions that were studied with the purpose of understanding its diversity, genetic structuring and determining the genomic association of agronomic traits related to grain production. The molecular characterization was conducted by DArTseq technology, which generated data of SNPs (single-nucleotide polymorphism) markers and silico DArTs. Then, after filtering, 5,578 high-quality SNPs were used to calculate the diversity estimates in hierfstat package and the accession panel structure through discriminant analysis of principal components (DAPC), which consists of determining the cluster existence in a group of genotypes where there is no a priori information about the existence of groups. The genetic diversity in the accessions was evidenced by the expected heterozygosity value (HS) (0.0279) and the population structure was evidenced by the formation of three clusters. The association mapping was performed using the GAPIT package, considering six characters: number of days for flowering (NDF), plant height (EP), panicle length (CP), plot weight (PP), mass of thousand grains (MMG) and CYCLE, as well as 24.266 silico DArTs markers and 1.965 SNPs markers. We detected a total of 113 significant associations genotype-phenotype (P <0.001) when used silico DArTs markers in all six analyzed characteristics and a total of 21 significant associations genotype-phenotype (P<0.001) when used SNPs markers for only four of the six analyzed characteristics: EP, CYCLE, MMG and PP. Considering the 113 silico DArTs significantly associated in the analysis, 90 were located in intergenic regions and 23 were localized within genes. While of the 21 significant SNPs, 11 were located in intergenic regions and 10 were located within genes. The information generated in this study was useful for testing associations throughout the rice genome. The mixed linear model (MLM) used in association mapping is believed to have been able to efficiently control false positives in the mapping using the SNPs markers. The information generated in this study serves as a basis for further evaluation using the set of significant markers as a starting point for determining the most important genes for rice yield.
|
8 |
Mapeamento genético de marcadores SNPs (Single Nucleotide Polymorphisms) em cana-de-açúcar (Saccharum spp.) / Genetic mapping of SNPs markers (Single Nucleotide Polymorphisms) in sugarcane (Saccharum spp.)Jardim, Priscila Magalhães da Veiga 30 July 2018 (has links)
Submitted by Onia Arantes Albuquerque (onia.ufg@gmail.com) on 2018-10-29T15:12:10Z
No. of bitstreams: 2
Dissertação - Priscila Magalhães da Veiga Jardim - 2018.pdf: 5590591 bytes, checksum: 41e09cc42da35c440c865965aaafae81 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Rejected by Luciana Ferreira (lucgeral@gmail.com), reason: Olhe as palavras-chaves, elas devem iniciar com letras maiúsculas. on 2018-10-30T11:15:40Z (GMT) / Submitted by Onia Arantes Albuquerque (onia.ufg@gmail.com) on 2018-10-30T12:28:06Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertação - Priscila Magalhães da Veiga Jardim - 2018.pdf: 5590591 bytes, checksum: 41e09cc42da35c440c865965aaafae81 (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2018-10-30T13:40:01Z (GMT) No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertação - Priscila Magalhães da Veiga Jardim - 2018.pdf: 5590591 bytes, checksum: 41e09cc42da35c440c865965aaafae81 (MD5) / Made available in DSpace on 2018-10-30T13:40:01Z (GMT). No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertação - Priscila Magalhães da Veiga Jardim - 2018.pdf: 5590591 bytes, checksum: 41e09cc42da35c440c865965aaafae81 (MD5)
Previous issue date: 2018-07-30 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Sugarcane is an important culture quite relevant to the Brazilian economy. The production is growing as well as a cultivated area is increasing every year. The genome of this culture is still deficient due to complications such as high ploidy and the big genome that presents. Among the different genetic characterization studies, the development of genetic maps is important for providing information about the genome structure of a species. In addition, it can help develop the techniques of interpretation and use of genetic information. They provide more understanding of how genetic information is organized in the genome of sugarcane supplying a lack in the basic element in this culture. The maps constructed for sugarcane, so far, not shown saturated. This work was obtained a map for sugarcane using SNP markers based on genotyping-by-sequencing technology in next-generation sequencing using the target sequencing strategy (RAPiD-Seq). For obtaining the map, 103 clones RB97327 and RB72454 were used. Probes were designed based on sequence similarity using the sorghum genome as a reference. The construction of the binding groups, considering as a binding criterion of a recombination fraction equal 0.20; allowed the identification of 249 binding groups for the biparental population with 1: 1 segregation. A total of 20555 polymorphic were scored in the analysis. The sum of the average sizes of homeologia groups identified, using the sorghum genome as a reference, was 3964.68 cM for the female parent and 3797.05 cM for the male parent. / A cana-de-açúcar é uma cultura de importância bastante relevante para a economia brasileira. A produção de cana-de-açúcar no Brasil é crescente assim como a área cultivada vem aumentando a cada ano. A compreensão do genoma da cana-de-açúcar ainda é deficiente devido a complicações como alta ploidia e o grande genoma que a cultura apresenta. Dentre os diferentes estudos de caracterização genética, o desenvolvimento de mapas genéticos é importante por fornecer informações acerca da estrutura do genoma de uma espécie. Além disso, pode auxiliar no desenvolvimento das técnicas de interpretação e uso da informação genética. Eles possibilitam a compreensão mais abrangente da organização da informação genética no genoma da cana-de-açúcar suprindo uma carência do estudo básico sobre essa cultura. Os mapas construídos para cana-de-açúcar, até agora, não se mostraram completos. Neste trabalho foi obtido um mapa de ligação para cana-de-açúcar utilizando marcadores SNPs baseados na tecnologia de genotipagem por sequenciamento de nova geração utilizando a estratégia de target sequencing (RAPiD-Seq). Para a obtenção do mapa foram utilizados 103 genótipos obtidos do cruzamento entre os clones RB97327 e RB72454. Foram desenhadas sondas baseadas em sequenciamento de semelhança utilizando o genoma de sorgo como referência. A construção dos grupos de ligação, considerando-se como critério de ligação uma fração de recombinação de 0,20; permitiu a identificação de 249 grupos de ligação para a população biparental com segregação 1:1. Foram consideradas 20555 marcas polimórficas nas análises de construção do mapa de ligação. A soma dos tamanhos médios dos grupos de homeologia identificados, utilizando-se o genoma de sorgo como referência, foi de 3964,68 cM para o genitor feminino e de 3797,05 cM para o genitor masculino.
|
9 |
Mapeamento associativo para produtividade em arroz sob déficit hídrico / Association mapping for rice grain yield under drought stressPantalião, Gabriel Feresin 26 March 2013 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2015-04-20T14:13:50Z
No. of bitstreams: 2
Dissertação - Gabriel Feresin Pantalião - 2103.pdf: 1079775 bytes, checksum: fb08083324cd3c94d9a60fd9eeddd83d (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2015-04-20T14:15:43Z (GMT) No. of bitstreams: 2
Dissertação - Gabriel Feresin Pantalião - 2103.pdf: 1079775 bytes, checksum: fb08083324cd3c94d9a60fd9eeddd83d (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2015-04-20T14:15:43Z (GMT). No. of bitstreams: 2
Dissertação - Gabriel Feresin Pantalião - 2103.pdf: 1079775 bytes, checksum: fb08083324cd3c94d9a60fd9eeddd83d (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Previous issue date: 2013-03-26 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Drought is an environmental factor which narrows crop production, such as upland rice (Oryza sativa L.). The knowledge of aspects related to drought stress, and plant response to it, may furnish plant breeding programs essential data for the development of tolerant cultivars, and hence with higher yields under such conditions. Association mapping has been a successful approach to elucidate the genetic basis of economically important traits in plants, and afterward in the implementation of marker assisted selection (MAS). Next-generation sequencing (NGS) technologies have been applied in a variety of contexts, including SNP identification and development. Among methodologies for marker discovery and high-throughput genotyping, GBS (Genotyping by Sequencing) points out by its low cost and speed at which samples can be analyzed. The aim of this work was to identify, by GBS, the polymorphism from SNP markers within 283 upland accessions from Embrapa Rice Core Collection (ERiCC) and associate them to yield under drought stress. After filtering the raw data of predetermined stringent parameters, 285.379 SNP were identified in the 12 rice chromosomes. For the association mapping, molecular and phenotypic data were combined for the identification of SNP associated to drought, aiming the subsequent development of a marker set for MAS besides the identification of genes for genetic engineering. The analysis identified 48 SNP associated with the evaluated traits, 13 associated to drought susceptibility index (DSI) and 35 to yield under drought stress. Among the 48 SNP, 35 was anchored in 31 rice genes. Seven genes, out of the 31, possessed SNP associated to DSI, and the other 24 genes to yield under drought stress. These genes may be evaluated to be effectively employed for MAS. If the overexpression of such genes provides an enhanced drought tolerance, they may be used in the development of tolerant rice cultivars. / A seca é um fator ambiental que limita a produção das culturas, como a do arroz de terras altas (Oryza sativa L.). O conhecimento de fatores envolvidos na tolerância à deficiência hídrica e das respostas das plantas a esse estresse podem fornecer subsídios aos programas de melhoramento para o desenvolvimento de cultivares tolerantes, e, consequentemente, com uma maior produtividade sob essas condições. O mapeamento associativo, ou análise de associação, tem sido aplicado com sucesso em plantas, sendo utilizado primeiramente na identificação de genes associados a caracteres de importância econômica, e posteriormente, na implementação de seleção assistida por marcadores (SAM). Tecnologias de sequenciamento de nova geração (NGS) têm sido recentemente utilizadas em projetos de sequenciamento e resequenciamento para identificar, validar e avaliar um grande número de SNPs, os quais podem ser utilizados em estudos de mapeamento associativo. Dentre os métodos desenvolvidos para a descoberta de marcadores moleculares e genotipagem de alto desempenho, destaca-se pela rapidez e baixo custo a genotipagem por sequenciamento (GBS). Esse trabalho objetivou detectar, via GBS, o polimorfismo de marcadores SNPs em 283 acessos de arroz de terras altas componentes da CNAE (Coleção Nuclear de Arroz da Embrapa) e associá-los à produtividade sob déficit hídrico. Após a filtragem dos dados brutos de acordo com parâmetros de estringência pré-definidos, foram contabilizados 285.379 SNPs distribuídos ao longo dos 12 cromossomos do arroz. As informações moleculares foram integradas aos dados fenotípicos derivados do experimento de avaliação de produtividade e Índice de Suscetibilidade à Seca (ISS), conduzido no ano de 2010 em Porangatu (GO) em ambiente com e sem deficiência hídrica, para possibilitar a análise de mapeamento associativo, e com isso, detectar marcadores SNPs relacionados à tolerância à seca e oportunizar o desenvolvimento de um conjunto de marcadores úteis para a seleção assistida para esse caráter, assim como genes para estudos de engenharia genética do arroz. Através da análise de associação, foram detectados 48 SNPs relacionados com os caracteres avaliados, dentre os quais 13 foram relacionados ao ISS e 35 à produtividade em condição de déficit hídrico. Dentre os 48 SNPs, foram identificados 35 SNPs ancorados em 31 genes de arroz. Dentre os genes identificados, sete deles continham SNPs associados ao ISS, enquanto que os restantes 24 genes continham SNPs associados à produtividade dos acessos em ambiente com deficiência hídrica. Esses genes podem ser avaliados para serem efetivamente utilizados na seleção assistida por marcadores. Adicionalmente, esses genes podem ser superexpressos para avaliar sua capacidade de aumentar a tolerância à seca, e em caso positivo, gerar cultivares comerciais de arroz geneticamente modificadas mais tolerantes a esse estresse.
|
10 |
Diversidade, estruturação genética e mapeamento associativo em germoplasma japonês de arroz utilizando marcadores DArT-seq / Diversity, genetic structuring and association mapping in Japanese rice germoplasm using DArT-seq markersVanessa Rizzi 31 August 2017 (has links)
O conhecimento da diversidade genética e da estrutura populacional das variedades mantidas em bancos de germoplasma é de fundamental importância para sua efetiva utilização em programas de melhoramento. O mapeamento por associação, também conhecido como mapeamento por desequilíbrio de ligação, é um dos principais métodos para relacionar genes e alelos às características de interesse, através da co-segregação de marcadores genéticos polimórficos com os genes envolvidos na variação das características em estudo. O Banco de Germoplasma de Arroz do Departamento de Genética da ESALQ contém 192 acessos japoneses que foram estudados com o objetivo de entender sua diversidade, estruturação genética e determinar a associação genômica de caracteres agronômicos relacionados a produção de grãos. A caracterização molecular foi conduzida através da tecnologia DArT-seq, que gerou dados de marcadores SNPs (single-nucleotide polymorphism) e silico DArTs. Em seguida, após a filtragem, 5.578 SNPs de alta qualidade foram utilizados para calcular as estimativas de diversidade no pacote hierfstat e a estrutura do painel de acessos através da análise discriminante de componentes principais (DAPC), que consiste em determinar existência de cluster em um grupo de genótipos em que não há informação a priori sobre existência de grupos. A diversidade genética nos acessos foi evidenciada pelo valor de heterozigosidade esperada (HS) (0,0279) e a estruturação foi evidenciada pela formação de três subgrupos. O mapeamento associativo foi realizado com o uso do pacote GAPIT, sendo considerados seis caracteres: número de dias para florescimento (NDF), estatura de planta (EP), comprimento da panícula (CP), peso de parcela (PP), massa de mil grãos (MMG) e CICLO, bem como 24.266 marcadores silico DArTs e 1.965 marcadores SNPs. Foram detectadas um total de 113 associações significativas genótipo-fenótipo (P<0,001) quando utilizado marcadores silico DArTs em todas as seis características analisadas e, um total de 21 associações significativas genótipo-fenótipo (P<0,001) quando utilizado marcadores SNPs para apenas quatro das seis características analisadas: EP, CICLO, MMG e PP. Considerando-se os 113 silico DArTs associados significativamente na análise, 90 foram localizados em regiões intergênicas e 23 foram localizados dentro de genes. Enquanto que, dos 21 SNPs significativos, 11 foram localizados em regiões intergênicas e 10 foram localizados dentro de genes. A informação gerada neste estudo foi útil para testar associações ao longo do genoma do arroz. O modelo linear misto (MLM) empregado no mapeamento associativo acredita-se ter conseguido controlar eficientemente os falsos positivos no mapeamento utilizando os marcadores SNPs. As informações geradas neste estudo servem de base para avaliações mais aprofundadas, utilizando o conjunto de marcadores significativos como ponto de partida para determinação dos genes mais importantes para a produtividade em arroz. / The knowledge of the genetic diversity and population structure of varieties maintained in germplasm banks is crucial for their effective use in breeding programs. Association mapping, also known as linkage disequilibrium mapping, is one of the main methods for relating genes and alleles to the characteristics of interest, through the co-segregation of polymorphic genetic markers with the genes involved in the variation of the characteristics under study. The Rice Germplasm Bank of the Department of Genetics of ESALQ contains 192 Japanese accessions that were studied with the purpose of understanding its diversity, genetic structuring and determining the genomic association of agronomic traits related to grain production. The molecular characterization was conducted by DArTseq technology, which generated data of SNPs (single-nucleotide polymorphism) markers and silico DArTs. Then, after filtering, 5,578 high-quality SNPs were used to calculate the diversity estimates in hierfstat package and the accession panel structure through discriminant analysis of principal components (DAPC), which consists of determining the cluster existence in a group of genotypes where there is no a priori information about the existence of groups. The genetic diversity in the accessions was evidenced by the expected heterozygosity value (HS) (0.0279) and the population structure was evidenced by the formation of three clusters. The association mapping was performed using the GAPIT package, considering six characters: number of days for flowering (NDF), plant height (EP), panicle length (CP), plot weight (PP), mass of thousand grains (MMG) and CYCLE, as well as 24.266 silico DArTs markers and 1.965 SNPs markers. We detected a total of 113 significant associations genotype-phenotype (P <0.001) when used silico DArTs markers in all six analyzed characteristics and a total of 21 significant associations genotype-phenotype (P<0.001) when used SNPs markers for only four of the six analyzed characteristics: EP, CYCLE, MMG and PP. Considering the 113 silico DArTs significantly associated in the analysis, 90 were located in intergenic regions and 23 were localized within genes. While of the 21 significant SNPs, 11 were located in intergenic regions and 10 were located within genes. The information generated in this study was useful for testing associations throughout the rice genome. The mixed linear model (MLM) used in association mapping is believed to have been able to efficiently control false positives in the mapping using the SNPs markers. The information generated in this study serves as a basis for further evaluation using the set of significant markers as a starting point for determining the most important genes for rice yield.
|
Page generated in 0.1175 seconds