Return to search

Seleção e avaliação de marcadores moleculares com grande informatividade para a predição do valor genômico

Submitted by Geandra Rodrigues (geandrar@gmail.com) on 2018-06-27T13:01:17Z
No. of bitstreams: 1
Brunozonovellidasilva.pdf: 25114600 bytes, checksum: 87ca3e31048c3dd0c1068b3c39f6f7a8 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2018-06-27T13:50:08Z (GMT) No. of bitstreams: 1
Brunozonovellidasilva.pdf: 25114600 bytes, checksum: 87ca3e31048c3dd0c1068b3c39f6f7a8 (MD5) / Made available in DSpace on 2018-06-27T13:50:09Z (GMT). No. of bitstreams: 1
Brunozonovellidasilva.pdf: 25114600 bytes, checksum: 87ca3e31048c3dd0c1068b3c39f6f7a8 (MD5)
Previous issue date: 2018-03-07 / A seleção dos melhores indivíduos busca aprimorar uma característica ao longo do tempo. O uso de dados genômicos deram origem ao que é conhecido como seleção genômica. A construção de modelos genéticos eficientes para a avaliação do mérito de um indivíduo é complexa e no geral se baseia no pressuposto da herança aditiva. Entretanto, na presença de variabilidade genética não-aditiva os modelos podem não comportar toda a complexidade de possíveis interações entre os genes, a epistasia. O S4GS é um simulador de dados genômicos que busca mimetizar características importantes para o estudo em seleção genômica como, desequilíbrio de ligação, inseminação artificial e cruzamento geracional. Outro fator relevante é a capacidade de simular diferentes ações gênicas e interações em múltiplos níveis. Sendo utilizado na simulação de 8 cenários de estudo, com destaque para o cenário 8 que procurou simular o cruzamento do Girolando opção B. O método proposto consiste em duas etapas: seleção e a avaliação, gerando uma combinação ótima para o aumento de acurácia. Os algoritmos escolhidos para a etapa de seleção de atributos foram: o FFS; O SMS; e a CART como uma alternativa rápida. A etapa de avaliação utilizou duas técnicas clássicas o RR-BLUP e o BLASSO como referência, e o SVR. A associação das técnicas utilizadas na etapa de seleção e avaliação levam a três modelos: SVR + FFS; SVR + SMS; e SVR + CART. Nos resultados obtidos a seleção de atributos se mostrou um importante recurso no aumento da acurácia, em todos os 8 cenários. O processo de simulação possibilitou a obtenção de dados até a 15a geração
permitindo treinar os modelos na 1a ou 4a e aplicá-los nas subsequentes. A seleção
de atributos aumentou de forma significativa a acurácia dos modelos utilizando dados
genômicos, com exceção para o conjunto com amostra pequena e em dados totalmente lineares. O método proposto conseguiu para as bases com as características descristas serem eficientes, gerando um aumento significativo na correlação final. / The animal breeding seeks to maximize of a characteristic over time. The use of genomic data gave rise that we know as genomic selection. The made of efficient models for evaluate the merit of an animal is complex and generally is based on the assumption of additive genetic effects. However, in the presence of non-additive genetic variability, the models may not contain all the complexity of possible interactions between the genes, the epistasis. The S4GS is a genomic data simulator developed in this thesis, which seeks to mimic important features for the study in genomic selection such as linkage disequilibrium, artificial insemination and crossing over. Another relevant factor is the ability to simulate different gene actions and interactions at multiple levels. It was used in the creation of 8 study scenarios, highlighting the scenario 8 that sought to simulate the Girolando option B. The proposed method consists of a two-step selection and evaluation, generating an optimal combination for the increase of accuracy. The algorithms chosen for the feature selection step were: the FFS that was developed in this thesis; The SMS; and CART as a quick alternative. The evaluation stage used two classical techniques, the RR-BLUP and the BLASSO as a reference, and the SVR. The association of the techniques used in the selection and evaluation stage leads us to three models: SVR + FFS; SVR + SMS; and SVR + CART. In the results obtained, the selection of attributes proved to be an important resource in increasing accuracy in all 8 scenarios. The simulation process allowed data to be obtained up to 15th generation allowing the models generated in 1th or 4th to in subsequent ones to be applied. The application of feature selection significantly
increased accuracy in genomic data, except for the small sample set and in completely
linear data. The proposed method was able to the bases with the descriptive characteristics to be efficient, generating a significant increase in the final correlation.

Identiferoai:union.ndltd.org:IBICT/oai:hermes.cpd.ufjf.br:ufjf/6877
Date07 March 2018
CreatorsSilva, Bruno Zonovelli da
ContributorsBorges, Carlos Cristiano Hasenclever, Arbex, Wagner Antonio, Nascimento, Moyses, Costa, Claudio Napolis, Fonseca Neto, Raul, Villela, Saulo Moraes
PublisherUniversidade Federal de Juiz de Fora (UFJF), Programa de Pós-graduação em Modelagem Computacional, UFJF, Brasil, ICE – Instituto de Ciências Exatas
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Sourcereponame:Repositório Institucional da UFJF, instname:Universidade Federal de Juiz de Fora, instacron:UFJF
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds