Return to search

Seleção genômica e estudos de associação genômica ampla para características de crescimento em populações de melhoramento de Eucalyptus / Genomic selection and genome-wide association studies for growth traits in breeding populations of Eucalyptus

Tese (doutorado)—Universidade de Brasília, Departamento de Biologia Celular, Instituto de Ciências Biológicas, Programa de Pós-Graduação em Biologia Molecular, 2017. / Submitted by Patrícia Nunes da Silva (patricia@bce.unb.br) on 2018-05-04T16:36:40Z
No. of bitstreams: 1
2017_BárbaraMüllerSalomãodeFaria.pdf: 7857359 bytes, checksum: 1add6e6244a6621a34c2191694ccfd8b (MD5) / Approved for entry into archive by Patrícia Nunes da Silva (patricia@bce.unb.br) on 2018-05-04T16:43:45Z (GMT) No. of bitstreams: 1
2017_BárbaraMüllerSalomãodeFaria.pdf: 7857359 bytes, checksum: 1add6e6244a6621a34c2191694ccfd8b (MD5) / Made available in DSpace on 2018-05-04T16:43:45Z (GMT). No. of bitstreams: 1
2017_BárbaraMüllerSalomãodeFaria.pdf: 7857359 bytes, checksum: 1add6e6244a6621a34c2191694ccfd8b (MD5) / Esta tese de doutorado apresenta resultados de pesquisa em seleção genômica ampla (GS) e estudos de
associação genômica ampla (GWAS) em seis populações de melhoramento de Eucalyptus, com o objetivo
de avaliar o potencial destas abordagens em explicar a herdabilidade, detectar associações significativas
e predizer fenótipos de características de crescimento. No primeiro capítulo foram comparadas as
abordagens de predição genômica e associação genômica ampla para características de crescimento em
populações de melhoramento de Eucalyptus benthamii ( = 505) e Eucalyptus pellita ( = 732). Ambas as
espécies são de crescente interesse comercial para o desenvolvimento de germoplasma adaptado a
estresses ambientais. A capacidade preditiva atingiu 0,16 em E. benthamii e 0,44 em E. pellita para
crescimento em diâmetro. As capacidades preditivas usando BLUP genômico ou diferentes métodos
Bayesianos atingiram resultados semelhantes, indicando que as características de crescimento se ajustam
adequadamente ao modelo infinitesimal. Nenhuma diferença foi detectada na capacidade preditiva quando
diferentes conjuntos de SNPs foram utilizados, com base na posição (equidistantes no genoma, dentro de
genes, podados considerando o desequilíbrio de ligação ou em cromossomos individuais), desde que o
número total de SNPs utilizados fosse superior a 5.000. As capacidades preditivas obtidas pela remoção
de parentesco entre as populações de treinamento e validação caíram para quase zero em E. benthamii e
foram reduzidas pela metade em E. pellita. Esses resultados corroboram a visão atual de que o parentesco
é o principal motor da predição genômica, embora algum desequilíbrio de ligação histórico provavelmente
tenha sido capturado para E. pellita. Um estudo de associação genômica identificou apenas uma
associação significativa para volume em E. pellita, ilustrando o fato de que, embora a predição genômica
seja capaz de explicar grandes proporções da herdabilidade, muito pouco ou quase nada é capturado em
associações significativas usando a abordagem de GWAS nas populações de melhoramento do tamanho
avaliado neste estudo. Este estudo forneceu dados experimentais adicionais que indicam perspectivas
positivas de usar dados genômicos para capturar grandes proporções de herdabilidade e predizer
características de crescimento em espécies florestais com acurácias iguais ou melhores do que aquelas
capturadas pela seleção fenotípica convencional. Adicionalmente, esses resultados documentaram a
superioridade da abordagem de GS na capacidade de capturar grandes proporções da variância genética
para crescimento, em comparação com o valor limitado da abordagem de GWAS ao se considerar
aplicações no melhoramento operacional. A maioria dos estudos de GWAS em plantas, no entanto, assim
como este descrito acima, tem sofrido com um poder estatístico limitado, especialmente para
características complexas. Tamanhos amostrais maiores são necessários no sentido de aumentar a
capacidade de detecção de variantes, especialmente aquelas de baixa frequência e de pequeno efeito. Devido aos desafios logísticos e altos custos para aumentar o tamanho das populações em estudos de
associação, uma alternativa tem sido a implementação de Joint-GWAS, utilizando informações
combinadas de populações independentes. Joint-GWAS utiliza diferentes abordagens estatísticas para
combinar os resultados de múltiplos estudos em um esforço para aumentar o poder de detecção em
relação a estudos individuais, melhorar as estimativas do tamanho dos efeitos e/ou resolver a incerteza
quando resultados dos estudos individuais não concordam. No segundo capítulo desta tese de doutorado
foi realizado um estudo de associação genômica ampla utilizando dados de quatro populações
independentes para características de crescimento, montando assim uma população de associação
consideravelmente maior do que estudos anteriores em espécies florestais. Dados de um total de 3.373
árvores de quatro populações híbridas de Eucalyptus grandis x Eucalyptus urophylla não relacionadas,
cada uma delas com 758 a 979 indivíduos, foram utilizados. Estas populações haviam sido genotipadas
com uma plataforma de SNP comum desenvolvida para Eucalyptus permitindo assim a implementação de
Joint-GWAS. O impacto da correção para estrutura de população e/ou parentesco sobre a capacidade de
detecção de associações significativas foi explorado utilizando seis modelos estatísticos com base na
análise de SNPs individuais. Uma redução drástica no número de associações significativas foi observada
ao se adotar correções mais rigorosas. Foi avaliado ainda o desempenho de diferentes abordagens de
mapeamento de associação utilizando segmentos genômicos contendo vários SNPs em contrates com
SNPs individuais. A abordagem de mapeamento de herdabilidades regionais, nas quatro populações
analisadas de forma independente, identificou regiões genômicas que explicaram individualmente 3-13%
da herdabilidade genômica. Variantes raras foram detectadas usando abordagens de Joint-GWAS
baseadas em conjuntos de SNPs dentro de genes e em segmentos específicos. Associações foram
detectadas em genes relacionados à biossíntese da parede celular e resistência à doença, sugerindo
potenciais efeitos pleiotrópicos no crescimento da árvore. De maneira geral, o aumento do tamanho
amostral e a aplicação de diferentes abordagens de análise combinada de populações ainda revelaram
um número limitado de associações, corroborando a complexidade de características de crescimento e a
provável participação de um grande número de variantes de pequeno efeito de difícil detecção no controle
de crescimento. Entretanto, estes resultados indicam ainda que à medida que mais programas de
melhoramento de Eucalyptus adotarem genômica para predizer fenótipos com base em uma plataforma
SNP comum, conjuntos de dados cada vez maiores ficarão disponíveis e Joint-GWAS como descrito neste
estudo de forma inédita em espécies florestais, será capaz de contribuir para a identificação de SNPs ou
segmentos genômicos que controlam proporções relevantes da herdabilidade. / This doctoral thesis presents results of research in genomic selection (GS) and genome-wide associations
studies (GWAS) in six Eucalyptus breeding populations, with the objective of evaluating the potential of
these approaches in explaining heritability, detecting significant associations and predicting phenotypes of
growth traits. In the first chapter, genomic prediction approaches and association studies for growth traits
in Eucalyptus benthamii ( = 505) and Eucalyptus pellita ( = 732) breeding populations were compared.
Both species are of increasing commercial interest for the development of germplasm adapted to
environmental stresses. Predictive ability reached 0.16 in E. benthamii and 0.44 in E. pellita for diameter
growth. Predictive abilities using either Genomic BLUP or different Bayesian methods reached similar
results, indicating that growth adequately fits the infinitesimal model. No difference was detected in
predictive ability when different sets of SNPs were utilized, based on position (equidistantly genome-wide,
inside genes, linkage disequilibrium pruned or on single chromosomes), as long as the total number of
SNPs used was above ~5,000. Predictive abilities obtained by removing relatedness between training and
validation sets fell near zero for E. benthamii and were halved for E. pellita. These results corroborate the
current view that relatedness is the main driver of genomic prediction, although some historical linkage
disequilibrium was likely captured for E. pellita. A genome-wide association study identified only one
significant association for volume growth in E. pellita, illustrating the fact that while genome-wide regression
is able to account for large proportions of the heritability, very little or none is captured into significant
associations using GWAS in breeding populations of the size evaluated in this study. This study provided
further experimental data supporting positive prospects of using genome-wide information to capture large
proportions of trait heritability and predict growth traits in trees with accuracies equal or better than those
attainable by phenotypic selection. Additionally, our results documented the superiority of the wholegenome
regression approach in accounting for large proportions of the heritability of complex traits, such
as growth, in contrast to the limited value of the local GWAS approach toward breeding applications. Most
GWAS in plants, like the one described above, have suffered from limited statistical power especially for
complex traits. Larger sample sizes are needed to enhance the ability to identify variants, especially those
of low-frequency and small effect. Due to the challenges and high costs of increasing sample size in GWAS,
an alternative has been to implement Joint-GWAS, using the combined information from independent
populations. Joint-GWAS use different statistical approaches to combine the results from multiple studies
in an effort to increase detection power over individual studies, improve estimates of the size of the effect
and/or to resolve uncertainty when reports from individual studies disagree. In the second chapter of this
doctoral thesis, a GWAS for growth traits was performed by assembling a considerably larger association population than any previous GWAS in forest trees. Data for a total of 3,373 trees across four unrelated
Eucalyptus grandis x Eucalyptus urophylla hybrid breeding populations, with samples sizes varying
between 758 and 979 individuals, were used. These populations had been genotyped with a common SNP
platform for Eucalyptus species, thus allowing a Joint-GWAS implementation. The impact of correcting for
population structure and/or relatedness on the detection of significant associations was explored using six
single-SNP GWAS models. A drastic reduction in the number of significant associations detected was
observed when more stringent correction was adopted. We also evaluated the performance of different
segment-based GWAS approaches involving several SNPs simultaneously in comparison to single-SNP
analyses. Regional heritability mapping, in these four populations independently, pinpointed genomic
regions that individually explained 3-13% of the genomic heritability. Rare variants were detected using
gene and region-based Joint-GWAS approaches. Associations were detected into genes related to cell wall
biosynthesis and disease resistance, suggesting potential pleiotropic effects on tree growth. In general, the
increase in sample size and the application of different approaches of Joint-GWAS still revealed a limited
number of associations, corroborating the complexity of growth traits and the likely participation of a large
number of variants of small effect of difficult detection in the control of growth traits. However, these results
further indicate that as more Eucalyptus breeding programs adopt genomics to predict phenotypes based
on a common SNP platform, increasing datasets will be available and Joint-GWAS as described in this
study for the first time in forest trees, will be able to contribute to the identification of SNPs or genomic
segments controlling relevant portions of trait heritability.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/31769
Date12 December 2017
CreatorsFaria, Bárbara Müller Salomão de
ContributorsGrattapaglia, Dario
Source SetsIBICT Brazilian ETDs
LanguageInglês
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Sourcereponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB
RightsA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições:Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data., info:eu-repo/semantics/openAccess

Page generated in 0.0033 seconds