Return to search

Ridge, lasso and bayesian additive-dominance genomic models and new estimators for the experimental accuracy of genome selection / Modelos genômicos aditivo-dominante via abordagem ridge, lasso e bayesiana e novos estimadores para a acurácia experimental da seleção genômica

Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2016-01-13T08:21:37Z
No. of bitstreams: 1
texto completo.pdf: 1062061 bytes, checksum: 36720a2028bf76afcba32f3865472cd7 (MD5) / Made available in DSpace on 2016-01-13T08:21:37Z (GMT). No. of bitstreams: 1
texto completo.pdf: 1062061 bytes, checksum: 36720a2028bf76afcba32f3865472cd7 (MD5)
Previous issue date: 2015-10-26 / A principal contribuição da genética molecular no melhoramento é a utilização direta das informações de DNA no processo de identificação de indivíduos geneticamente superiores. Sob esse enfoque, idealizou-se a seleção genômica ampla (Genome Wide Selection – GWS), a qual consiste na análise de um grande número de marcadores SNPs (Single Nucleotide Polymorphisms) amplamente distribuídos no genoma. Este trabalho de simulação apresenta uma abordagem completa para a seleção genômica por meio de adequados modelos genéticos incluindo efeitos aditivos e devido à dominância, que são essenciais para a seleção de clones e de cruzamentos, bem como para melhorar a estimativa de efeitos aditivos para a seleção. Até o momento, as abordagens via Ridge Bayesiana e Lasso para modelos aditivo-dominante não foram avaliados e comparados na literatura. Neste trabalho, foram avaliados o desempenho de 10 modelos de predição aditivo-dominante (incluindo os modelos existentes e propostas de modificação). Um novo método Bayesiano/Lasso modificado (chamado BayesA* B* ou t-BLASSO) obteve melhor desempenho na estimação de valores genéticos genômicos dos indivíduos, em todos os quatro cenários (dois níveis de herdabilidades × duas arquiteturas genéticas). Os métodos do tipo BayesA*B* apresentaram melhor capacidade para recuperar a razão entre a variância de dominância e a variância aditiva. Além disso, o papel das três fontes de informação da genética quantitativa (chamadas de desequilíbrio de ligação, co-segregação e relações de parentesco) na seleção genômica foram elucidadas pela decomposição da herdabilidade e da acurácia nos três componentes, mostrando suas relações com a estrutura de populações e o melhoramento genético, a curto e longo prazo. Além disso, neste trabalho de simulação também foi desenvolvido dois novos estimadores para a acurácia preditiva da seleção genômica. O trabalho propõe e avalia o desempenho e a eficiência destes novos estimadores chamados estimador regularizado (RE) e estimador híbrido (HE). O estimador regularizado leva em consideração tanto a herdabilidade genômica quanto a herdabilidade da característica, além da capacidade preditiva. Enquanto, o estimador híbrido (HE), combina as acurácias experimental e esperada. As comparações entre RE e HE com o estimador tradicional (TE) foram feitas sob quatro procedimentos de validação. Em geral, RE apresentou acurácias mais próximas aos valores paramétricos, principalmente quando há seleção de marcadores. RE também foi menos tendencioso e mais preciso, com desvios padrão menores do que o estimador tradicional. Diante dos resultados, o TE pode ser usado apenas com a validação independente, em que tende a ter um melhor desempenho do que RE, embora superestimando a acurácia. O estimador híbrido (HE) provou ser muito eficaz na ausência de validação. Enquanto, que a validação independente mostrou-se superior em relação aos procedimentos de Jacknife, perseguindo melhor a acurácia paramétrica com ou sem seleção de marcador. As seguintes inferências podem ser feitas de acordo com o estimador de acurácia e tipo de validação: (i) a acurácia mais provável: HE sem validação; (ii) a maior acurácia possível (acurácia superestimada): TE com validação independente; (iii) a menor acurácia possível (acurácia subestimada): RE com validação independente. / The main contribution of molecular genetics is the direct use of DNA information to identify genetically superior individuals. Under this approach, genome-wide selection (GWS) can be used with this purpose. GWS consists in analyzing of a large number of SNP markers widely distributed in the genome. This simulation work presents a complete approach for genomic selection by using adequate genetic models including dominance effects, which are essential for selecting crosses and clones as well as for improving the estimation of additive effects for parent selection. To date, the approaches via Ridge, Lasso and Bayesian additive-dominance models have not been evaluated and compared in the literature.The performance of 10 additive-dominance prediction models (including current ones and proposed modifications) were evaluated. A new modified Bayesian/Lasso method (called BayesA*B* or t-BLASSO) performed best in the prediction of genomic breeding value of individuals, in all the four scenarios (two heritabilities × two genetic architectures). The BayesA*B*-type methods showed better ability for recovering the dominance variance/additive variance ratio. Also, the role of the three quantitative genetics information sources (called linkage disequilibrium, co- segregation and pedigree relationships) in genomic selection were elucidated by decomposing the heritability and accuracy in the three components and showing their relations with the structure of populations and the genetic improvement in the short and long run. Moreover, this simulation work also, we developed the new estimators for the prediction accuracy of genomic selection. The work proposes and evaluates the performance and efficiency of these new estimators called regularized estimator (RE) and hybrid estimator (HE). The regularized estimator takes in consideration both the genomic and trait heritabilities, in addition to the predictive ability. The hybrid estimator (HE), combines both experimental and expected accuracies. The comparisons of the RE and HE with the traditional (TE) were done under four validation procedures. In general, the new estimator presented accuracies closer to the parametric ones, mainly when selecting markers. It was also less biased and more precise, with smaller standard deviations than the traditional estimator. The TE can be used only with independent validation, where it tends to perform better than RE, although overestimating the accuracy. The hybrid estimator (HE) proved to be very effective in the absence of validation. The independent validation showed to be superior over the Jacknife procedures, chasing better the parametric accuracy with or without marker selection. The following inferences can be made according to the accuracy estimator and kind of validation: (i) most probable accuracy: HE without validation; (ii) highest possible accuracy: TE with independent validation; (iii) lowest possible accuracy: RE with independent validation. / Sem Agência de Fomento

Identiferoai:union.ndltd.org:IBICT/oai:localhost:123456789/7176
Date26 October 2015
CreatorsAzevedo, Camila Ferreira
ContributorsSilva, Fabyano Fonseca e, Nascimento, Moyses, Resende, Marcos Deon Vilela de
PublisherUniversidade Federal de Viçosa
Source SetsIBICT Brazilian ETDs
LanguageEnglish
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Sourcereponame:Repositório Institucional da UFV, instname:Universidade Federal de Viçosa, instacron:UFV
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0033 seconds