Global ETD Search

1	Redes neurais artificiais para predição genômica na presença de interações epistáticas / Artificial neural network for genomic prediction of genetics values with espistatics interactions Sant'anna, Isabela de Castro 23 February 2018 (has links) Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-06-14T18:26:01Z No. of bitstreams: 1 texto completo.pdf: 1296377 bytes, checksum: 4cf50482fa770814eb465e7df5af6db5 (MD5) / Made available in DSpace on 2018-06-14T18:26:01Z (GMT). No. of bitstreams: 1 texto completo.pdf: 1296377 bytes, checksum: 4cf50482fa770814eb465e7df5af6db5 (MD5) Previous issue date: 2018-02-23 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / A identificação de genótipos com desempenho superior é um dos principais objetivos da maioria dos programas de melhoramento de plantas. No entanto, a capacidade de atingir esse objetivo é limitada pelo alto custo da fenotipagem e realização de experimentos. Neste contexto, a Seleção Genômica (SG) foi proposta para estimar o valor genético (VGG) de indivíduos que ainda não foram fenotipados por meio de informações de marcadores distribuídos em todo o genoma. No entanto, a maioria das modelagens da SG expressam o valor fenotípico como função apenas do efeito aditivo do valor genotípico o que dificulta, muitas vezes, uma representação mais realística da arquitetura genética de caracteres quantitativos, sendo a inclusão de efeitos dominância e interações epistáticas fatores cruciais para aumentar a acurácia da predição. O papel da epistasia na arquitetura genética de caracteres complexos tem sido discutido desde o surgimento da genética quantitativa e, embora seja visto por diferentes perspectivas, o reconhecimento sobre sua importância é crescente. Nas populações, a variância genética total é dividida em componentes de variância aditivo, de dominância e de epistasia, que dependem dos efeitos dos locos e das frequências dos alelos presentes na população. Assim, se a frequência do alelo epistático varia entre as populações, o efeito do gene de interesse pode significativo em uma população, mas não em outra, e o efeito pode até mesmo ser inverso sobre o caráter em ambientes diferenciados. Neste contexto, as Redes Neurais Artificias (RNAs) tornam-se alternativas de análise promissoras por capturar relações não lineares entre os marcadores a partir dos próprios dados, o que a maioria dos modelos comumente utilizados na SG não conseguem. Entretanto, a inclusão de todos os marcadores no genoma no modelo aumenta as chances de existência de alta correlação entre eles e representa um enorme desafio computacional, que acarreta menor precisão no treinamento da RNA, que utilizam boa parte de seus recursos para representar porções irrelevantes do espaço de busca, dificultando o aprendizado. Assim, um modelo mais realístico deveria incluir apenas os SNPs (Single Nucletiode polymorphism) ao caráter de interesse. Para minimizar os efeitos da dimensionalidade sobre a modelagem de SG usando RNA foi proposta, no presente trabalho, a utilização de métodos de redução de dimensionalidade do tipo Sonda e Stepwise para fins de seleção de um subconjunto de marcadores que serão utilizados na predição do valor genético. Após a seleção de marcadores, foi avaliada a eficiência do método de seleção genômica RR-BLUP e das redes neurais artificias do tipo de base radial (RNA-REF) e Perceptron de Múltiplas camadas (RNA-MLP) na predição do valor genético em população natural com desequilíbrio gamético. Para isso, foi simulada uma população Fl oriunda da hibridação de genitores divergentes, com 500 indivíduos, genotipados com 1000 marcadores do tipo SNP. As características fenotípicas foram determinadas adotando-se três modelos: aditivo, aditivo-dominante e epistático, atendendo duas situações de dominância: parcial e completa com caracteres quantitativos admitindo herdabilidades (hª) de 30 e 60%, controlados cada um por 100 locos, considerando dois alelos por loco, totalizando 12 cenários distintos. Para avaliar a capacidade de predição, o modelo RR-BLUP e RNA- RBF foram treinados utilizando 80% dos indivíduos da população e procedimento de validação cruzada com cinco repetições. Para tanto foram obtidos o quadrado da correlação entre o valor genômico predito (GEBV) e o valor genotípico/fenotípico para medir a acurácia seletiva (R2) e a raiz do erro do quadrado médio (REQM), para medir a acurácia preditiva. Os resultados obtidos pela validação genotípica no primeiro capitulo mostraram que o uso de redes neurais permite capturar as interações epistáticas levando a uma melhora na predição do valor genético e, principalmente, a grande redução da raiz do erro médio quadrado (REQM), o que indica maior confiabilidade da predição do valor genômico. No entanto, a partir dos resultados obtidos por validação fenotípica foi evidente que a acurácia de predição poderia ser melhorada ao introduzir a seleção de marcadores. Consequentemente, no segundo capítulo de trabalho, após aplicar os métodos de redução de dimensionalidade, sonda e Stepwise, acurácia de predição aumentou. Por exemplo, para a h2= 0.3 no cenário aditivo, o R2 de validação foi de 59.l% para rede neural (RNA-REF), 57% (RNA-MLP) e 57% para RR-BLUP e, no cenário epistático, os valores de R2 foram de 50%, 47 e 41%, respectivamente. Adicionalmente, ao analisarmos REQM, a diferença entre os desempenhos das técnicas é ainda maior. Para o cenário 1, as estimativas foram de 91 (RR-BLUP) e 5 para ambas as redes neurais e, no cenário mais crítico que incluía epistasia e dominância, de 427(RR-BLUP) e 20 para as redes neurais. Os resultados obtidos mostram que a utilização de redes neurais permite capturar as interações epistáticas levando a um aumento na acurácia da predição do valor genético e, principalmente, redução do erro quadrático médio, o que indica maior confiabilidade da predição do valor genômico. / The identification of elite individual is a critical component of most plant breeding programs. However, the ability to achieve this goal is limited by the high cost of phenotyping and conducting experiments. In this context the genomic selection was proposed to use all marks presents in the genome to estimate the genomic breeding value of individuals (GEBV) without the need to phenotyping. However, most applications of GS includes only the additive portion of the genetic value, and a more realistic representation of the genetic architecture of quantitative traits should have the inclusion of dominance and epistatics interaction. The role of epistasis in the genetic architecture of quantitative traits has been debated since first formulations of quantitative genetic theory, and different perspectives regarding the importance of epistasis arise. In populations, the total genetic variance is partitioned into components that are attributable to additive, dominance and epistatic variance, which depend on allele frequencies. If the allele frequency of the interacting locus varies among populations, the effect of the target locus can be significant in one population but not in another, or can even be of the opposite sign. In this context, Artificial Neural Networks (ANNs) has a great potential because they can capture non-linear relationships between markers from the data themselves, which most of the models commonly used in the GS can not. However, the inclusion of all markers in the prediction model increases the chances of a high correlation between the marks and represents a huge challenge that add less precision and a great computational demand for ANNs training that use a good part of their resources to represent irrelevant portions of the search space and compromising the learning process. Thus, a more realistic model should include only SNPs that are related to the traits of interest. Because of this, it was proposed to use dimensionality reduction methods, applied to the prediction of genetic values, for the purpose of selecting a subset of markers by means of specific procedures such as Sonda or Stepwise regressions. In this way, the objective of this work is to evaluate the efficiency of genome enabled prediction by using RR-BLUP (GS) and artificial neural networks as radial basis function neural network (RBFNN), and Multi-layer Perceptron (RNA-MLP) in the prediction of the genetic value in a natural population with linkage disequilibrium without (chapter 1) and with (chapter 2) the dimensionality reduction. For this, an Fl population from the hybridization of divergent parents with 500 individuals genotyped with l,000 SNP-type markers was simulated. The phenotypic traits were determined by adopting three different gene action models: additive, additive-dominance and epistasis, attending two dominance situations: partial and complete with quantitative traits admitting heritabilities (hz) ranging from 30 to 60%, each is controlled by 50 loci, considering two alleles per loco, totaling 12 different scenarios. To evaluate the predictive ability of RR-BLUP and the neural networks a cross- validation procedure with five replicates were trained using 80% of the individuals of the population. Two dimensionality reduction methods Stepwise and Sonda were used to calculated the square of the correlation between predicted genomic value (GEBV) and genotype/phenotype value was used to measure predictive reliability(R2) and the predictive mean-squared error root (MSER). In the chapter one of this work the results showed that the use of neural networks allows capturing the epistasic interactions leading to an improvement in the accuracy of the prediction of the genetic value and, mainly, a large reduction of the mean square error root (MSER) that indicates greater reliability of the prediction of the genomic value. But from the results using phenotypic validation it was clearly that is possible to make further improvements on the accuracy by introducing the variable selection. Consequently, in the second chapter, after applied the dimensionality reduction methods, the the accuracy increased. For example, for h2 = 0.3 in the additive scenario, the validation R2 was 59% for neural network (RBFNN), 57% (RNA-MLP) and 57% for RR-BLUP, and in the epistemic scenario R2 values were 50%, 47 and 41%, respectively. Additionally, when analyzing the mean-squared error root the difference in performance of the techniques is even greater. For additive scenario, the estimates were 9l (RR-BLUP) and 5 for both neural networks and, in the most critical scenario, 427 (RR-BLUP) and 20 for neural networks. The results show that the use of neural networks allows capturing the epistasis interactions leading to an improvement in the accuracy of the prediction of the genetic value and, mainly, a large reduction of the mean square error root that indicates greater reliability of the prediction of the genomic value. / A folha de aprovação está com o nome do curso errado. Seleção genômica Melhoramento genético Genética Quantitativa
2	Application of artificial neural networks to genome-enabled prediction in Nellore cattle / Ribeiro, André Mauric Frossard January 2019 (has links) Orientador: Henrique Nunes de [UNESP] Oliveira / Resumo: Nos últimos anos, o rápido desenvolvimento de tecnologias de sequenciamento de alto rendimento permitiu a genotipagem em larga escala de milhares de marcadores genéticos. Diversos modelos estatísticos foram desenvolvidos para predizer os valores genéticos para traços complexos usando as informações de marcadores moleculares em alta densidade, pedigrees ou ambos. Esses modelos incluem, entre outros, as redes neurais artificiais (RNA) que têm sido amplamente utilizadas em problemas de previsão em outros campos de aplicação e, mais recentemente, para predição genômica. O objetivo deste trabalho foi avaliar o desempenho de redes neurais artificiais na predição genômica de bovinos Nelore. Para isso foram testadas diferentes arquiteturas de rede (1 a 4 neurônios em camada oculta), 5 estratégias para seleção de animais com base na acurácia do EBV a serem declaradas para a rede de treinamento como entrada e avaliação de matrizes de relacionamento (NN_G (G como entrada); NN_GD (combinados G com D); e N_Guar (Guar como entrada)) a serem utilizados como entrada para predição genômica em características de peso corporal de bovinos Nelore em relação a modelos de regressão lineares bayesianos hierárquicos (BayesB). . Para isso, utilizou-se o dEBV de 8652 animais genotipados para peso corporal aos 120 dias, 240 dias, 365 dias e 455 dias. Esses animais foram divididos pela acurácia do EBV em população de treinamento e na validação. Todas as estratégias foram repetidas 5 vezes e a correlação ... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: In recent years, the fast development of high-throughput sequencing technologies has enabled large-scale genotyping of thousands of genetic markers. Several statistical models have been developed for predicting breeding genetic values for complex traits using the information on dense molecular markers, pedigrees, or both. These models include, among others, the artificial neural networks (ANN) that have been widely used in prediction problems in other fields of application and, more recently, for genome-enabled prediction. The objective of this work was to evaluate the performance of artificial neural networks in the genomic prediction of complex trait in Nellore cattle. For this, we has been tested different network architectures (1 to 4 neurons on hidden layer), 5 strategies to select animals based on their EBV accuracy to be declared for the training network as input and evaluation of relationship matrices [ NN_G (G as input); NN_GD(combined G with D), and N_Guar (Guar as input)] to be used as input for genomic prediction in body weight traits in Nellore cattle relative to hierarchical linear Bayesian regression models (BayesB) . The dEBV of 8652 animals genotyped for body weight at 120 days, 240 days, 365 days, and 455 days was used. Animals were divided into training population and validation by the predicted EBV accuracy. All strategies were repeated five times, and the correlation between dEBV and predicted dEBV was used as the accuracy measure of the models tested. Th... (Complete abstract click electronic access below) / Doutor Seleção genômica Aprenzado de máquina Zebu. Genomic selection Machine learning
3	Estudo genômico do nível de infecção por Babesia bovis em bovinos da raça angus / Genomic study of the level of infection by Babesia bovis in angus cattle Santana, Clarissa Helena [UNESP] 26 February 2016 (has links) Submitted by CLARISSA HELENA SANTANA null (santana.chs@gmail.com) on 2016-03-21T18:17:24Z No. of bitstreams: 1 Dissertação_Clarissa_Helena_Santana.pdf: 1159982 bytes, checksum: 1160868d6c0bff2c67119202847275c7 (MD5) / Approved for entry into archive by Ana Paula Grisoto (grisotoana@reitoria.unesp.br) on 2016-03-22T17:26:26Z (GMT) No. of bitstreams: 1 santana_ch_me_jabo.pdf: 1159982 bytes, checksum: 1160868d6c0bff2c67119202847275c7 (MD5) / Made available in DSpace on 2016-03-22T17:26:26Z (GMT). No. of bitstreams: 1 santana_ch_me_jabo.pdf: 1159982 bytes, checksum: 1160868d6c0bff2c67119202847275c7 (MD5) Previous issue date: 2016-02-26 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / A bovinocultura é um setor com importante destaque no agronegócio brasileiro. O carrapato Ripicephalus (Boophilus) microplus é responsável por perdas econômicas significativas aos pecuaristas e é vetor de hemoparasitoses como Anaplasma spp e Babesia spp. Sabe-se que os bovinos Bos taurus taurus são mais susceptíveis à infestação por carrapatos do que Bos taurus indicus. Acredita-se que o mesmo ocorra para a infecção por Babesia bovis. Neste trabalho, foram avaliados, em duas colheitas, 355 bovinos da raça Angus, pertencentes a uma fazenda de Uruguaiana-RS, nos quais foram realizadas contagens de carrapatos e colheitas de amostras de sangue para quantificação de B. bovis, pela técnica de qPCR, e genotipagem com chip de 150.000 marcadores SNP. Para qPCR utilizaram-se sequências iniciadoras que flanqueiam um fragmento do gene do citocromo B (mt-cytB), como oligonucleotídeos iniciadores. Após genotipagem dos bovinos com o chip Gene Seek Genomic Profiler™ (GGP-HD) da Illumina Infinium®, foi realizado imputação de genótipos, para recuperação de genótipos faltantes, e controle de qualidade. Foi realizada análise de associação genômica ampla (GWAS), para cada uma das características, infecção por B. bovis e resistência a carrapatos, através do método denominado “Single Step Genomic BLUP” (ssGBLUP). Todos os animais apresentaram infestação por carrapatos e infecção por B. bovis, determinada pela qPCR, e altos valores médios para ambas as características. Algumas regiões cromossômicas foram identificadas como significativas para as características estudadas, sendo que, sete dos cromossomos identificados no presente estudo já haviam sido descritos em outros trabalhos. Neste sentido, o presente estudo corrobora com outros resultados indicando que a técnica de qPCR é um método sensível de detecção de B. bovis em animais Angus e que as regiões genômicas identificadas como significativas podem ser importantes para a variação das características estudadas. / The cattle industry is a sector with importance in the Brazilian agribusiness. The Ripicephalus (Boophilus) microplus is responsible for economic losses and is a vector for hemoparasitoses, such as Anaplasma spp and Babesia spp. It is known that the Bos tauros animals are more susceptible to infestation by ticks when compared with infestation in Bos indicus animals. It is believed that the same behavior keeps for infection by Babesia bovis. They were evaluated, in two collections, 355 Angus cattle, from a farm in Uruguaiana city, estate of Rio Grande do Sul, where were performed tick counts, quantification of B. bovis by qPCR and genotyping with a 150K chip. Were used as primers, in the qPCR, sequences that flanking the fragment of the cytochrome b gene. The technique was standardized and optimized using specimens of isolates of B. bovis. After genotyping, imputation was carried out, for recovery of missing genotypes, and quality control. Genome association analysis was performed (GWAS), to each of the characteristics, through the method called "Single Step Genomic BLUP" (ssGBLUP). All animals showed tick infestation and infection by B. bovis and high average values for both characteristics. Some regions on chromosomes were identified as significant to the characteristics tick infestation and infection by B. bovis, and seven chromosomes, identified in the present study, were already described in other studies. The present study agrees with other results indicating that the qPCR technique is a sensitive method to detecting B. bovis in Angus and genomic regions identified may be significant for the variation of these characteristics. Angus Babesia bovis Rhipicephalus (Boophilus) microplus Seleção genômica Genomic selection
4	Predição de valores genéticos por abordagens de seleção genômica ampla e de inteligência computacional / Prediction of genetic values by genome wide selection and computational intelligence approaches Silva, Gabi Nunes 01 February 2018 (has links) Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-02-27T12:42:24Z No. of bitstreams: 1 texto completo.pdf: 1903320 bytes, checksum: 9c86d1ca2a5b6d4ab5edd2aa72795ffa (MD5) / Made available in DSpace on 2018-02-27T12:42:24Z (GMT). No. of bitstreams: 1 texto completo.pdf: 1903320 bytes, checksum: 9c86d1ca2a5b6d4ab5edd2aa72795ffa (MD5) Previous issue date: 2018-02-01 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Os programas de melhoramento genético existem com dois objetivos principais: identificação de genótipos superiores e a obtenção de combinações melhoradas por meio de cruzamento entre esses indivíduos elite. Os mais diversos ramos da genética, estatística e biometria contribuíram para o estabelecimento de diferentes estratégias de melhoramento para seleção de genótipos superiores. Em particular, metodologias baseadas em seleção genômica ampla tem apresentado grande destaque dentre os estudos mais recentes de seleção. A seleção genômica ampla (Genome Wide Selection), envolve estudos biométricos e une genética de populações, genética molecular e a genética quantitativa. A maior motivação para tais estudos consiste na possibilidade de utilizar genotipagem em grande escala e incorporar informações genômicas no processo de predição, de modo a aumentar a eficiência seletiva, obter ganhos genéticos de forma mais ágil e diminuir os custos. Nos modelos de genética, as variações fenotípicas dos indivíduos consistem na variância genotípica dos mesmos agregando variâncias devido a dominância, variância ambiental e também epistasia. No entanto, os modelos de GWS, de modo geral, negligenciam a influência de dominância e epistasia, levando em consideração apenas os efeitos aditivos das características. Além disso, a alta densidade de marcadores moleculares pode levar a problemas de dimensionalidade e multicolinearidade. Neste contexto, o uso de estratégias de redução de dimensionalidade e de metodologias baseadas em inteligência computacional que abordem mais adequadamente a inclusão de tais efeitos em estudos de seleção e predição constituem a proposta neste trabalho. O trabalho visa abordar três tópicos principais: o capitulo propõe avaliar a eficiência do RR-BLUP para predição de valores genéticos de uma população simulada com 12 características complexas que contemplavam efeitos de dominância, epistasia e efeitos ambientais. No capítulo 2 propõe-se a aplicação dos Métodos de Regressão Stepwise e da Sonda para redução de dimensionalidade a fim de aumentar a eficiência preditiva do método RR-BLUP aplicado na mesma população considerada no capitulo 1. Finalmente, o capítulo 3 visa avaliar a eficiência das metodologias de inteligência computacional baseadas em Redes Neurais Artificiais de Redes Perceptron Multicamadas e as Redes de Função de Base Radial para predição dos valores genéticos da população simulada abordada nos capítulos anteriores. Os resultados indicaram que o uso de metodologias de redução de dimensionalidade contribui para o aumento da eficiência do método RR-BLUP. No entanto, também evidenciaram a deficiência desse método para predizer valores genéticos de populações que incluam efeitos de dominância e epistasia no controle gênico das características de interesse. As metodologias de Redes Neurais Multicamadas e as Redes de função de Base Radial propostas apresentaram acurácia preditiva, expressa pelo erro quadrático médio, superior à apresentada pelo RR-BLUP, demonstrando que as metodologias de inteligência computacional foram mais eficientes que a Seleção Genômica Ampla para o estudo de características complexas com controle gênico envolvendo efeitos aditivos, dominantes e epistáticos. / Genetic breeding programs exist with two main objectives: to identify superior genotypes and to obtain improved combinations through cross-breeding among these elite individuals. The most diverse branches of genetics, statistics and biometry contributed to the establishment of different breeding strategies for selecting superior genotypes. In particular, methodologies based on genomic selection have shown great prominence among the most recent selection studies. Genome Wide Selection, involves biometric studies and gathers genetic of populations, molecular genetics and quantitative genetics. The greatest motivation for such studies is the possibility of using large-scale genotyping and incorporating genomic information into the prediction process, in order to increase selective efficiency, obtain genetic gains and reduce costs. In genetic models, the phenotypic variations of the individuals consist in the genotypic variance including variances due to dominance, environmental variance and also epistasis. However, the GWS models generally neglect the influence of dominance and epistasis, taking into consideration only the additive effects of the characteristics. In addition, the high density of molecular markers can lead to problems of dimensionality and multicollinearity. In this context, the use of dimensionality reduction strategies and methodologies based on computational intelligence that more adequately address the inclusion of effects due to dominance and epistasis in a selection and prediction study are the proposal in this work. The aim of this work is to address three main topics: Chapter ] proposes to evaluate the efficiency of RR-BLUP for predicting genetic values of a simulated population with 12 complex traits that included effects of dominance, epistasis and environmental effects. In Chapter 2 we propose the application of the Stepwise Regression and Sonda methods to reduce dimensionality in order to increase the predictive efficiency of the RR-BLUP method applied in the same population considered in chapter ]. Finally, chapter 3 aims to evaluate the efficiency of computational intelligence methodologies based on Artificial Neural Networks of Multilayer Perceptron and the Radial Basis Function Neural Networks to predict the genetic values of the simulated population discussed in previous chapters. The results indicated that the use of dimensionality reduction methodologies contribute to increase the efficiency of the RR-BLUP method. However, they also evidenced the deficiency of this method to predict genetic values for populations that include effects of dominance and epistasis in the gene control of the characteristics of interest. The methodologies of Multilayer Perceptron and Radial Basis Function Neural Networks proposed presented predictive accuracy, expressed by the mean square error, higher than that presented by the RR-BLUP, demonstrating that the computational intelligence methodologies were more efficient than the Genome Wide Selection for the study of complex characteristics with gene control involving additive, dominant and epistatic effects. Redes neurais (Computação) Seleção genômica Biometria Genética Quantitativa
5	Development and application of statistical genetic methods to genomic prediction in Coffea canephora / Desenvolvimento e aplicação de métodos genético-estatíticos para predição genômica em Coffea canephora Ferrão, Luís Felipe Ventorim 07 April 2017 (has links) Genomic selection (GS) works by simultaneously selecting hundreds or thousands of markers covering the genome so that the majority of quantitative trait loci are in linkage disequilibrium (LD) with such markers. Thus, markers associated with QTLs, regardless of the significance of their effects, are used to explain the genetic variation of a trait. Simulation and empirical results have shown that genomic prediction presents sufficient accuracy to help success in breeding programs, in contrast to traditional phenotypic analysis. For this end, an important step addresses the use of statistical genetic models able to predict the phenotypic performance for important traits. Although some crops have benefited from this approach, studies in the genus Coffea are still in their infancy. Until now, there have been no studies of how predictive models work across populations and environments or, even, their performance for different complex traits. Therefore, the main objective of this research is investigating important aspects related to statistical modeling in order to enable a more comprehensive understanding of what makes a robust prediction model and, as consequence, apply it in practical breeding programs. Real data from two experimental populations of Coffea canephora, evaluated in two brazilian locations and SNPs identified by Genotyping-by-Sequencing (GBS) were considered to investigate the genotype-phenotype relationship. In terms of statistical modelling, two classes of models were considered: i) Mixed models, based on genomic relationship matrix to define the (co)variance between relatives (called GBLUP model); and ii) Multilocus association models, which thousands of markers are modeled simultaneously and the marker effects are summed, in order to compute the genetic merit of individuals. Both approaches were considered in separated chapters. Chapter entitled \"A mixed model to multiplicative harvest-location trial applied to genomic prediction in Coffea canephora\" addressed an expansion of the traditional GBLUP to accommodate interaction effects (Genotype × Local and Genotype × Harvest). For this end, we have tested appropriate (co)variance structures for modeling heterogeneity and correlation of genetic effects and residual effects. The proposed model, called MET.GBLUP, showed the best goodness of fit and higher predictive ability, when compared to other methods. Chapter in the sequence was entitled \"Comparison of statistical methods and reliability of genomic prediction in Coffea canephora population\" and addressed the use of different modelling assumptions considering multilocos association models. The usual assumption of marker effects drawn from a normal distribution was relaxed, in order to seek for a possible dependency between predictive performance and trait, conditional on the genetic architecture. Although the competitor models are conceptually different, a minimal difference in predictive accuracy was observed in the comparative analysis. In terms of computational demand, Bayesian models showed higher time of analysis. Results discussed in both chapters have supported the potential of genomic selection to reshape traditional breeding programs. In practice, compared to traditional phenotypic evaluation, it is expected to accelerate the breeding cycle in recurrent selection programs, maintain genetic diversity and increase the genetic gain per unit of time. / Seleção Genômica pode ser definida como a seleção simultânea de centenas ou milhares de marcadores moleculares, os quais cobrem o genoma de forma densa, de modo que locos de caracteres quantitativos (QTL) estejam em desequilíbrio de ligação com uma parte desses marcadores. Assim, marcadores associados a QTLs, independentemente da significância dos seus efeitos, são utilizados na predição do mérito genético de um indivíduo para um determinado caráter. Simulações e estudos empíricos mostram que essa abordagem apresenta acurácia suficiente para garantir o sucesso em programas de melhoramento genético, quando comparado com os métodos tradicionais de seleção fenotípica. Para tanto, uma das etapas requeridas é o uso de modelos genético-estatísticos que contemplem a predição fidedigna da performance fenotípica da população sob estudo. Apesar da relevância, o número de estudos no gênero Coffea ainda são reduzidos, não havendo relatos sobre o desempenho desses modelos em diferentes populações e ambientes, ou mesmo, a sua performance para diferentes caracteres agronômicos do cafeeiro. Dessa forma, este estudo tem como finalidade investigar aspectos relacionados a modelagem estatística, a fim de compreender quais são os fatores que tornam os modelos preditivos mais acurados e utiliza-los em programas aplicados de melhoramento genético. Dados reais de duas populações de seleção recorrente de Coffea canephora, avaliados em dois ambientes e genotipados pela tecnologia de genotipagem por sequenciamento (GBS, do inglês Genotyping-by-Sequencing) foram considerados para o estudo da relação entre genótipo-fenótipo. Em termos de modelagem estatística, duas classes de modelos foram considerados: i) Modelos mistos, baseados no cálculo da matriz de parentesco realizado como medida de (co)variância genética entre indivíduos (modelo GBLUP); e ii) Modelos de associação multilocos, no qual milhares de marcadores moleculares são modelados simultaneamente e os efeitos estimados dos marcadores são somados, a fim de computar o mérito genético dos indivíduos. Ambas estratégias foram descritas em capítulos separados no formato de artigo científico. O capítulo intitulado \"A mixed model to multiplicative harvest-location trial applied to genomic prediction in Coffea canephora\" abordou uma expansão do modelo GBLUP de modo a contemplar efeitos de interações entre Genótipo × Colheita e Genótipo × Local. Para tanto, apropriadas estruturas de variância e covariância para modelagem da heterogeneidade e correlação dos efeitos genéticos e residuais foram testadas. O modelo proposto, denominado de MET.GBLUP, apresentou melhor qualidade de ajuste e capacidade preditiva, quando comparado com outros métodos. O capítulo em sequência, intitulado de \"Comparison of statistical methods and reliability of genomic prediction in Coffea canephora population\" investigou a capacidade preditiva de diferentes modelos de associação multilocos. A suposição usual de efeitos dos marcadores amostrados de uma distribuição normal foi relaxada, a fim de testar métodos alternativos que pudessem melhor descrever o fenômeno biológico e, consequentemente, resultar em maior capacidade preditiva. Embora os modelos testados sejam conceitualmente distintos, diferenças mínimas nos valores de acurácia de predição foram observadas nos cenários testados. Em termos de demanda computacional, modelos Bayesianos apresentaram maior tempo de análise. Os resultados descritos em ambos os capítulos apoiam o potencial do uso da seleção genômica em programas de melhoramento assistido de café. Em termos práticos, comparado com métodos tradicionais de avaliação fenotípica, é esperado que a implementação desses conceitos em programas de seleção recorrente possam acelerar o ciclo de melhoramento, manter a diversidade genética e, sobretudo, aumentar o ganho genético por unidade de tempo. Café Coffee Genomic selection Linear models Marcadores moleculares Modelos lineares Molecular markers Seleção genômica
6	Predição genômica de híbridos de milho para caracteres de arquitetura oligogênica e sob diferentes parâmetros de penalização e correção de fenótipo / Genomic prediction of maize hybrids for traits with oligogenic architecture and under distinct shrinkage factors and phenotypic correction Galli, Giovanni 29 June 2016 (has links) O alcance de altas produtividades em milho (Zea mays L.) depende do desenvolvimento de híbridos, o principal produto explorado nos programas de melhoramento. O sucesso na obtenção deste tipo de cultivar é conseguido com extensivo cruzamento de linhagens, seguido de avaliações para identificação das combinações de maior potencial. Geralmente, o melhorista tem à sua disponibilidade grande número de linhagens, possibilitando a realização de centenas a milhares de cruzamentos distintos, dos quais apenas uma pequena quantidade pode ser avaliada experimentalmente devido a limitação de tempo e recursos. Com o advento da Seleção Genômica (GS) tornou-se possível predizer o comportamento destes indivíduos não avaliados com base em seu genoma. No decorrer do processo de consolidação da GS várias metodologias foram propostas. A aptidão destas em predizer desempenhos fenotípicos é dependente da sua capacidade de acomodar a arquitetura genética das características e lidar com a multicolinearidade das matrizes genômicas. Neste sentido, métodos baseados em modelos mistos podem apresentar menor eficiência na predição de características oligogênicas devido à não capacidade de representar a distribuição real do efeito dos QTL. Além disso, a regularização das predições na presença de multicolinearidade é realizada por meio de um parâmetro de penalização (λ), o qual pode ser estimado de várias formas e consequentemente modificar a acurácia dos modelos. Além do aprimoramento dos métodos, outro aspecto importante é o procedimento de correção dos dados fenotípicos previamente à GS, o qual não é consenso na comunidade científica. Diante do exposto, este trabalho objetivou: verificar o efeito das formas de obtenção do λ (via REML na GS e pela herdabilidade da característica) e da correção do fenótipo (valor genotípico e média ajustada) na GS e avaliar a eficiência da modelagem diferencial de QTL de maior efeito na capacidade preditiva da metodologia G-BLUP, comparando-a ao LASSO Bayesiano, BayesB e G-BLUP convencional. Para isso foram utilizadas informações de híbridos simples de milho tropical avaliados em cinco locais para produtividade de grãos, altura de planta e espiga no ano de 2015. Os dados genômicos foram obtidos com a plataforma Affymetrix® Axiom® Maize Genotyping Array de 616.201 SNPs. Foram estudados diferentes cenários de GS considerando os fatores supracitados, sendo estes comparados entre si por suas capacidades preditivas e seletivas. Os resultados obtidos indicam que a correção do fenótipo e a forma de estimação de λ afetam a capacidade preditiva. O uso de valores genotípicos como correção dos fenótipos e estimação de λ via REML apresentaram os melhores resultados. Foi também observado que a modelagem de SNPs de maior efeito como fator fixo aumenta discretamente a capacidade preditiva da metodologia G-BLUP para as características oligogênicas avaliadas (altura de planta e espiga), sendo indicado o uso do G-BLUP convencional. Complementarmente, observou-se que a GS apresentou modesta eficiência na seleção de híbridos superiores sob intensidades moderadas. Entretanto, a sua alta capacidade de selecionar sob baixa intensidade pode ser amplamente explorada nos programas de melhoramento de milho visando a seleção precoce direta. / The achievement of high yield in maize (Zea mays L.) relies on the development of hybrids, which is the main product of breeding programs. The success in obtaining this kind of cultivar is achieved through extensive crossing of inbred lines followed by field trials to identify the combinations with greatest potential. Generally, breeders have a large number of inbred lines on their hands, being able to perform hundreds to thousands of different crosses, of which only a small portion can be experimentally evaluated due to time and resource limitations. Genomic Selection (GS) has made it possible to predict phenotypes of unevaluated individuals based on their genome. Throughout the establishment process of GS many approaches have been proposed. The ability of these approaches at predicting phenotypic performance depends on their capacity of accommodating the genetic architecture of the traits and dealing with the multicollinearity of the genomic matrices. Hence, methods based on mixed model equations may present lower prediction efficiency for oligogenic traits due to their inability of depicting the real distribution of the QTL effects. Moreover, the prediction regularization in the presence of multicollinearity is done by a shrinkage factor (λ), which can be estimated in a number of ways and may affect the accuracy of the models. In addition to the improvement of the models, the correction of the phenotype utilized in the predictions is also important, which is not a consensus among researchers. Based on these facts, this study aimed to assess the effect of estimation of λ (by REML in the GS model and by the heritability of the traits) and the correction of the phenotype (genotypic value and adjusted mean) on the GS. It also targeted to evaluate the effect of differential modeling of major makers on the prediction accuracy of G-BLUP, comparing it to Bayesian LASSO, BayesB and ordinary G-BLUP. To those ends, tropical maize single-crosses evaluated at five sites for grain yield, plant and ear height in 2015 were utilized. The genomic data was obtained with the Affymetrix® Axiom® Maize Genotyping Array of 616,201 SNPs. Distinct GS scenarios were studied considering the aforementioned factors which were compared by their prediction and selection accuracy. The results suggest that the correction of the phenotype and the way of estimation of λ do affect prediction accuracies. The use of genotypic values as the correction of phenotypes and the estimation of λ by REML showed best results. It was also observed that modeling major SNPs as fixed effect factors had little improvement on the prediction accuracy of G-BLUP for the oligogenic traits evaluated (plant and ear height). Thereby, ordinary G-BLUP should be the method of choice to predict these traits. Additionally, it was observed that GS presented modest efficiency for selecting superior hybrids under moderate intensities. However, its high effectiveness at selecting under low intensities might be exploited on maize breeding programs for early direct selection. Arquitetura genética BLUE BLUE BLUP BLUP Capacidade preditiva Genetic architecture Genomic selection Prediction accuracy Seleção genômica
7	Parametric and semi-parametric models for predicting genomic breeding values of complex traits in Nelore cattle / Modelos estatísticos paramétricos e semiparamétricos para a predição de valores genéticos genômicos de características complexas em bovinos da raça Nelore Espigolan, Rafael [UNESP] 23 February 2017 (has links) Submitted by RAFAEL ESPIGOLAN (espigolan@yahoo.com.br) on 2017-03-17T22:04:14Z No. of bitstreams: 1 Tese_Rafael_Espigolan.pdf: 1532864 bytes, checksum: c79ad7471b25137c47529f25762a83a2 (MD5) / Approved for entry into archive by Juliano Benedito Ferreira (julianoferreira@reitoria.unesp.br) on 2017-03-22T12:50:50Z (GMT) No. of bitstreams: 1 espigolan_r_dr_jabo.pdf: 1532864 bytes, checksum: c79ad7471b25137c47529f25762a83a2 (MD5) / Made available in DSpace on 2017-03-22T12:50:50Z (GMT). No. of bitstreams: 1 espigolan_r_dr_jabo.pdf: 1532864 bytes, checksum: c79ad7471b25137c47529f25762a83a2 (MD5) Previous issue date: 2017-02-23 / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / O melhoramento genético animal visa melhorar a produtividade econômica das futuras gerações de espécies domésticas por meio da seleção. A maioria das características de interesse econômico na pecuária é de expressão quantitativa e complexa, isto é, são influenciadas por vários genes e afetadas por fatores ambientais. As análises estatísticas de informações de fenótipo e pedigree permite estimar os valores genéticos dos candidatos à seleção com base no modelo infinitesimal. Uma grande quantidade de dados genômicos está atualmente disponível para a identificação e seleção de indivíduos geneticamente superiores com o potencial de aumentar a acurácia de predição dos valores genéticos e, portanto, a eficiência dos programas de melhoramento genético animal. Vários estudos têm sido conduzidos com o objetivo de identificar metodologias apropriadas para raças e características específicas, o que resultará em estimativas de valores genéticos genômicos (GEBVs) mais acurados. Portanto, o objetivo deste estudo foi verificar a possibilidade de aplicação de modelos semiparamétricos para a seleção genômica e comparar a habilidade de predição com os modelos paramétricos para dados reais (características de carcaça, qualidade da carne, crescimento e reprodutiva) e simulados. As informações fenotípicas e de pedigree utilizadas foram fornecidas por onze fazendas pertencentes a quatro programas de melhoramento genético animal. Para as características de carcaça e qualidade da carne, o banco de dados continha 3.643 registros para área de olho de lombo (REA), 3.619 registros para espessura de gordura (BFT), 3.670 registros para maciez da carne (TEN) e 3.378 observações para peso de carcaça quente (HCW). Um total de 825.364 registros para peso ao sobreano (YW) e 166.398 para idade ao primeiro parto (AFC) foi utilizado para as características de crescimento e reprodutiva. Genótipos de 2.710, 2.656, 2.749, 2.495, 4.455 e 1.760 animais para REA, BFT, TEN, HCW, YW e AFC foram disponibilizados, respectivamente. Após o controle de qualidade, restaram dados de, aproximadamente, 450.000 polimorfismos de base única (SNP). Os modelos de análise utilizados foram BLUP genômico (GBLUP), single-step GBLUP (ssGBLUP), Bayesian LASSO (BL) e as abordagens semiparamétricas Reproducing Kernel Hilbert Spaces (RKHS) e Kernel Averaging (KA). Para cada característica foi realizada uma validação cruzada composta por cinco “folds” e replicada aleatoriamente trinta vezes. Os modelos estatísticos foram comparados em termos do erro do quadrado médio (MSE) e acurácia de predição (ACC). Os valores de ACC variaram de 0,39 a 0,40 (REA), 0,38 a 0,41 (BFT), 0,23 a 0,28 (TEN), 0,33 a 0,35 (HCW), 0,36 a 0,51 (YW) e 0,49 a 0,56 (AFC). Para todas as características, os modelos GBLUP e BL apresentaram acurácias de predição similares. Para REA, BFT e HCW, todos os modelos apresentaram ACC similares, entretanto a regressão RKHS obteve o melhor ajuste comparado ao KA. Para características com maior quantidade de registros fenotípicos comparada ao número de animais genotipados (YW e AFC) o modelo ssGBLUP é indicado. Considerando o desempenho geral, para todas as características estudadas, a regressão RKHS é, particularmente, uma alternativa interessante para a aplicação na seleção genômica, especialmente para características de baixa herdabilidade. No estudo de simulação, genótipos, pedigree e fenótipos para quatro características (A, B, C e D) foram simulados utilizando valores de herdabilidade baseados nos obtidos com os dados reais (0,09, 0,12, 0,36 e 0,39 para cada característica, respectivamente). O genoma simulado consistiu de 735.293 marcadores e 1.000 QTLs distribuídos aleatoriamente por 29 pares de autossomos, com comprimento variando de 40 a 146 centimorgans (cM), totalizando 2.333 cM. Assumiu-se que os QTLs explicavam 100% da variação genética. Considerando as frequências do alelo menor maiores ou iguais a 0,01, um total de 430.000 marcadores foram selecionados aleatoriamente. Os fenótipos foram obtidos pela soma dos resíduos (aleatoriamente amostrados de uma distribuição normal com média igual a zero) aos valores genéticos verdadeiros, e todo o processo de simulação foi replicado 10 vezes. A ACC foi calculada por meio da correlação entre o valor genético genômico estimado e o valor genético verdadeiro, simulados da 12a a 15a geração. A média do desequilíbrio de ligação, medido entre os pares de marcadores adjacentes para todas as características simuladas foi de 0,21 para as gerações recentes (12a, 13a e 14a), e 0,22 para a 15a geração. A ACC para as características simuladas A, B, C e D variou de 0,43 a 0,44, 0,47 a 0,48, 0,80 a 0,82 e 0,72 a 0,73, respectivamente. Diferentes metodologias de seleção genômica implementadas neste estudo mostraram valores similares de acurácia de predição, e o método mais adequado é dependente da característica explorada. Em geral, as regressões RKHS obtiveram melhor desempenho em termos de ACC com menor valor de MSE em comparação com os outros modelos. / Animal breeding aims to improve economic productivity of future generations of domestic species through selection. Most of the traits of economic interest in livestock have a complex and quantitative expression i.e. are influenced by a large number of genes and affected by environmental factors. Statistical analysis of phenotypes and pedigree information allows estimating the breeding values of the selection candidates based on infinitesimal model. A large amount of genomic data is now available for the identification and selection of genetically superior individuals with the potential to increase the accuracy of prediction of genetic values and thus, the efficiency of animal breeding programs. Numerous studies have been conducted in order to identify appropriate methodologies to specific breeds and traits, which will result in more accurate genomic estimated breeding values (GEBVs). Therefore, the objective of this study was to verify the possibility of applying semi-parametric models for genomic selection and to compare their ability of prediction with those of parametric models for real (carcass, meat quality, growth and reproductive traits) and simulated data. The phenotypic and pedigree information used were provided by farms belonging to four animal breeding programs which represent eleven farms. For carcass and meat quality traits, the data set contained 3,643 records for rib eye area (REA), 3,619 records for backfat thickness (BFT), 3,670 records for meat tenderness (TEN) and 3,378 observations for hot carcass weight (HCW). A total of 825,364 records for yearling weight (YW) and 166,398 for age at first calving (AFC) were used as growth and reproductive traits of Nelore cattle. Genotypes of 2,710, 2,656, 2,749, 2,495, 4,455 and 1,760 animals were available for REA, BFT, TEN, HCW, YW and AFC, respectively. After quality control, approximately 450,000 single nucleotide polymorphisms (SNP) remained. Methods of analysis were genomic BLUP (GBLUP), single-step GBLUP (ssGBLUP), Bayesian LASSO (BL) and the semi-parametric approaches Reproducing Kernel Hilbert Spaces (RKHS) regression and Kernel Averaging (KA). A five-fold cross-validation with thirty random replicates was carried out and models were compared in terms of their prediction mean squared error (MSE) and accuracy of prediction (ACC). The ACC ranged from 0.39 to 0.40 (REA), 0.38 to 0.41 (BFT), 0.23 to 0.28 (TEN), 0.33 to 0.35 (HCW), 0.36 to 0.51 (YW) and 0.49 to 0.56 (AFC). For all traits, the GBLUP and BL models showed very similar prediction accuracies. For REA, BFT and HCW, models provided similar prediction accuracies, however RKHS regression had the best fit across traits considering multiple-step models and compared to KA. For traits which have a higher number of animals with phenotypes compared to the number of those with genotypes (YW and AFC), the ssGBLUP is indicated. Judged by overall performance, across all traits, the RKHS regression is particularly appealing for application in genomic selection, especially for low heritability traits. Simulated genotypes, pedigree, and phenotypes for four traits A, B, C and D were obtained using heritabilities based on real data (0.09, 0.12, 0.36 and 0.39 for each trait, respectively). The simulated genome consisted of 735,293 markers and 1,000 QTLs randomly distributed over 29 pairs of autosomes, with length varying from 40 to 146 centimorgans (cM), totaling 2,333 cM. It was assumed that QTLs explained 100% of genetic variance. Considering Minor Allele Frequencies greater or equal to 0.01, a total of 430,000 markers were randomly selected. The phenotypes were generated by adding residuals, randomly drawn from a normal distribution with mean equal to zero, to the true breeding values and all simulation process was replicated 10 times. ACC was quantified using correlations between the predicted genomic breeding value and true breeding values simulated for the generations of 12 to 15. The average linkage disequilibrium, measured between pairs of adjacent markers for all simulated traits was 0.21 for recent generations (12, 13 and 14), and 0.22 for generation 15. The ACC for simulated traits A, B, C and D ranged from 0.43 to 0.44, 0.47 to 0.48, 0.80 to 0.82 and 0.72 to 0.73, respectively. Different genomic selection methodologies implemented in this study showed similar accuracies of prediction, and the optimal method was sometimes trait dependent. In general, RKHS regressions were preferable in terms of ACC and provided smallest MSE estimates compared to other models. / FAPESP: 2014/00779-0 / FAPESP: 2015/13084-3 Acurácia Características e carcaça Regressão RKHS Seleção genômica SNP Accuracy Carcass traits Genomic selection RKHS regression
8	Estudo do desequilíbrio de ligação e estimativa do tamanho efetivo em uma população da raça gir selecionada para crescimento pós-desmama / Linkage disequilibrium and effective size on population of gir zebu breed selected for post-weaning weights Toro Ospina, Alejandra Maria [UNESP] 24 February 2017 (has links) Submitted by ALEJANDRA MARIA TORO OSPINA null (alejita-t_92@hotmail.com) on 2017-03-18T16:50:07Z No. of bitstreams: 1 dissertação_Alejandra_Toro.pdf: 1073618 bytes, checksum: 4de34349c23cb909c3128081fe41cc42 (MD5) / Approved for entry into archive by Juliano Benedito Ferreira (julianoferreira@reitoria.unesp.br) on 2017-03-22T12:59:36Z (GMT) No. of bitstreams: 1 toroospina_am_me_jabo.pdf: 1073618 bytes, checksum: 4de34349c23cb909c3128081fe41cc42 (MD5) / Made available in DSpace on 2017-03-22T12:59:36Z (GMT). No. of bitstreams: 1 toroospina_am_me_jabo.pdf: 1073618 bytes, checksum: 4de34349c23cb909c3128081fe41cc42 (MD5) Previous issue date: 2017-02-24 / O objetivo deste estudo foi estimar o desequilíbrio de ligação (r2) nas distâncias de 25-50kb, 50-100kb, 100-500kb, 0,5-1Mb e o tamanho efetivo (Ne) nas gerações 0, 5, 10, 15, 20 em população da raça Gir selecionada para crescimento pós-desmama. Os animais utilizados no presente estudo foram provenientes do rebanho fechado do Instituto de Zootecnia, Sertãozinho, SP. Foram obtidos os genótipos de 155 animais com o painel BovineDL 33kb e 18 com painel HD imputado onde realizou-se controle de qualidade (CQ) para alelo de menor frequência (MAF) < 0,02 e call rate < 0,1. Depois do CQ permaneceram 27.236 SNPs e 155 animais do painel de 33 kb e 732.962 SNPs e 173 animais do painel HD Imputado. As análises de r2 foram realizadas pelo programa Plink e programa estatístico R Studio e o Ne por meio do DL. Os resultados das distâncias 25-50kb, 50-100kb, 100-500kb e 0,5-1Mb do r2 para o painel 33kb foram iguais a 0,29, 0,25, 0,16 e 0,032 respectivamente, e 0,35, 0,29, 0,18, 0,032 para o painel HD imputado demostrando que o DL permaneceu nas distâncias menores a 100kb, decaindo com o aumento das distâncias. Estes resultados foram maiores aos descritos na literatura para animais zebuínos, sugerindo como causa os segmentos longos de haplótipos que compartilham os animais aparentados. O Ne foi igual a 9, 17, 24, 30 e 30 animais nas gerações 0, 5, 10, 15, 20, observa-se que o Ne é maior na geração 20, com 30 animais, e decai drasticamente a partir da 5 geração com 17 animais, e sendo de 9 animais a última geração, um tamanho pequeno para uma população. Os valores encontrados neste estudo mostram alto DL e baixo Ne, provavelmente pelo sistema de seleção e a estrutura da população da raça Gir avaliada, que apresenta alto nível de endogamia, perda da variabilidade genética, uso intensivo de pequeno número de reprodutores, conduzindo a diminuição da deriva genética da população, ocasionando dificuldades na seleção dos animais. / The aim of this study was to estimate the linkage disequilibrium (r2) at distances of 25-50kb, 50-100kb, 100-500kb, 0,5-1Mb and the effective population size (Ne) in generations 0, 5, 10, 15, 20 in population of the selected Gir for yearling growth. The animals used in this study were from the closed herd Animal Science Institute, Sertãozinho, SP. the genotypes of 155 animals were obtained with BovineDL 33kb and 18 animals of panel HD, where quality control was held (QC) for minor allele frequency (MAF) <0.02 and call rate <0.1. After QC remained 27,236 SNPs and 155 animals to panel 33 kb, 732.962 SNPs and 173 the panel HD imputation. The r2 analyzes were performed by Plink program and R Studio statistical program and Ne through the DL. The results of r2 for distances 25-50kb, 50-100kb, 100-500kb and 0,5-1Mb were equal to 0.29, 0.25, 0.16 and 0.032, respectively, showing that the DL remained in smaller distances 100kb, decreasing with increasing distances. These results were higher than those reported in the literature for Zebu animals, suggesting a cause to long haplotype segments that share the related animals. Ne is equal to 9, 17, 24, 30 and 30 in the generations 0, 5, 10, 15, 20, it is observed that Ne is higher in generation 20 with 30 animals and decays sharply from 5 Generation 17 animals, and with 9 animals the latest generation, small size for a population. The values found in this study to DL and Ne, explain the selection system and the structure of the population of Gir evaluated, which has a high level of inbreeding, loss of genetic variability, intensive small number of players, leading to decreased drift population genetics, causing difficulties in the selection of the next generations. Seleção genômica Haplótipos Deriva genética Endogamia Genomic selection Haplotypes Genetic drift Inbreeding
9	Bridging genomics and quantitative genetics of Eucalyptus: genome-wide prediction and genetic parameter estimation for growth and wood properties using high-density SNP data / Conectando a genômica à genética quantitativa de Eucalyptus: predição genômica e estimação de parâmetros genéticos para crescimento e propriedades de madeira usando alta densidade de SNPs Lima, Bruno Marco de 25 April 2014 (has links) Convergence of quantitative genetics and genomics is becoming the way that fundamental genetics and applied breeding will be carried out in the next decades. This study bridges the quantitative genetics of complex growth and wood properties traits with genomic technologies towards a more innovative approach to tree breeding. Planted forests play a major role to fulfill the growing world demand for wood products and energy. Eucalypts stand out for their high productivity and versatile wood resulting from the advanced breeding programs associated to clonal propagation and modern silviculture. Despite their fast growth, breeding cycles still take several years and wood properties assessment is limited to a sample of trees in the late stages of selection due to the costs involved in wood phenotyping, not exploitingthe range of genetic variation in wood properties. In this study, we examined fifteen traits including growth and wood chemical and physical properties in 1,000 individuals sampled from an elite Eucalyptus breeding population. Near-infrared spectroscopy (NIRS) models were developed and used for high-throughput phenotyping of wood traits.Highdensity data for 29,090 SNPs was used to obtain accurate pedigree-record-free estimates of trait variance components, heritabilities, genetic and phenotypic correlations, based on a realized relationship matrix, comparing them to pedigree-based estimates. To the best of our knowledge, this is the first study to do this in plants. NIRS predictions were accurate for wood chemical traits and wood density, and variably successful for physical traits. Heritabilities were medium for growth (0.34 to 0.44), high for wood chemical traits (0.56 to 0.85) and variable for wood physical traits (0.11 to 0.63). High positive correlations among growth traits and negative between cellulose and lignin content were observed, while correlations between wood chemical and physical traits and between growth and wood quality traits were low although significant. Phenotypes and SNP markers were then used to build genomic predictive models using a marker density higher than any previous genomic selection study in trees (1 SNP/21 kbp). Two models (RR-BLUP and Bayesian LASSO) that differ regarding the assumed distribution of marker effects were used for genomic predictions. Predictions were compared to those obtained by phenotypic BLUP. Predictive abilities very similar by the two models and strongly correlated to the heritabilities. Accurate genomic-enabled predictions were obtained for wood chemical traits related to lignin, wood density and growth, although generally 15 to 25% lower than those achieved by phenotypic BLUP prediction. Nevertheless, genomic predictions yielded a coincidence above 70% in selecting the top 30 trees ranked by phenotypic selection for growth, wood density and S:G ratio, and 60% when tandem selection was applied. The results of this study open opportunities for an increased use of highthroughput NIRS phenotyping and genome-wide SNP genotyping in Eucalyptus breeding, allowing accurate pedigree-record-free estimation of genetic parameters and prediction of genomic breeding values for yet to be phenotyped trees. These applications should become routine in tree breeding programs for the years to come, significantly reducing the length of breeding cycles while optimizing resource allocation and sustainability of the breeding endeavor. / A convergência da genética quantitativa com a genômica está se tornando a maneira pela qual a genética fundamental e aplicada serão conduzidas nas próximas décadas. Este estudo buscou conectar a genética de fenótipos complexos de crescimento e propriedades de madeira às tecnologias genômicas, em uma abordagem inovadora para o melhoramento florestal. Florestas plantadas têm papel fundamental para satisfazer a crescente demanda mundial por produtos madeireiros e energia. O eucalipto,com sua alta produtividade e madeira versátil, é resultado de programas avançados de melhoramento associados à propagação clonal e silvicultura moderna. Apesar de seu rápido crescimento, ciclos de melhoramento ainda levam muitos anos e a avaliação detalhada de propriedades da madeira é limitada a apenas uma amostra das árvores em estágios avançados de seleção, devido aos altos custos de fenotipagem, não explorando assim toda a variação genética disponível. Neste estudo, examinamos quinze caracteres, incluindo crescimento e propriedades químicas e físicas da madeira, em 1000 indivíduos amostrados de uma população elite de melhoramento. Modelos de espectroscopia de infravermelho próximo (NIRS) foram desenvolvidos e utilizados para fenotipagem de alto desempenho de propriedades de madeira. Genotipagem de alta densidade com 29.090 SNPs foi utilizada para obter estimativas acuradas de componentes de variância, herdabilidades e correlações genéticas baseadas em uma matriz de parentesco realizado, ou seja,sem o uso de pedigree. Este é o primeiro estudo de que temos conhecimento a fazer isso em plantas. Predições NIRS foram precisas para caracteres químicos da madeira e densidade, e apresentaram sucesso variável para caracteres físicos. As herdabilidades foram médias para crescimento (0,34 a 0,44), altas para caracteres químicos de madeira (0,56 a 0,85) e variáveis para caracteres físicos da madeira (0,11 a 0,63). Altas correlações positivas entre caracteres de crescimento e negativas entre celulose e lignina foram observadas, enquanto correlações entre caracteres químicos e físicos da madeira foram baixas, porém significativas. Fenótipos e marcadores SNP foram em seguida utilizados na construção de modelos preditivos com a maior densidade de marcadores já utilizada em estudos de seleção genômica em espécies florestais (1 SNP/21 kpb). Dois modelos de predição (RR-BLUP e LASSO Bayesiano)foram usados nas predições genômicas e comparados ao BLUP fenotípico. Os modelos apresentaram capacidades preditivas similares, fortemente correlacionadas às herdabilidades. Predições genômicas precisas foram obtidas para caracteres relacionados à lignina, densidade e crescimento, embora geralmente 15 a 25% menores do que as predições obtidas por BLUP fenotípico. Contudo, predições genômicas alcançaram coincidências acima de 70% na seleção das melhores 30 árvores ranqueadas pela seleção fenotípica para crescimento, densidade e relação S:G, e de 60% quando seleção em tandem foi aplicada. Os resultados deste estudo abrem enormes oportunidades para o uso combinado de fenotipagem NIRS e genotipagem com SNPs no melhoramento do eucalipto, permitindo estimativas acuradas de parâmetros genéticos e a predição de valores genéticos genômicos para plantas jovens ainda não fenotipadas. Estas aplicações deverão se tornar rotineiras nos programas de melhoramento florestal nos próximos anos, reduzindo significativamente a duração dos ciclos de seleção e, consequentemente, otimizando a alocação de recursos e a sustentabilidade do melhoramento. Genomic selection Herdabilidade Heritability Marcador molecular Melhoramento florestal Molecular marker Seleção genômica Tree breeding
10	Métodos de redução de dimensionalidade aplicados na seleção genômica para características de carcaça em suínos / Dimensionality reduction methods applied to genomic selection for carcass traits in pigs Azevedo, Camila Ferreira 26 July 2012 (has links) Made available in DSpace on 2015-03-26T13:32:15Z (GMT). No. of bitstreams: 1 texto completo.pdf: 1216352 bytes, checksum: 3e5fbc09a6f684ddf7dbb4442657ce1f (MD5) Previous issue date: 2012-07-26 / The main contribution of molecular genetics is the direct use of DNA information to identify genetically superior individuals. Under this approach, genome-wide selection (GWS) can be used with this purpose. GWS consists in analyzing of a large number of SNP markers widely distributed in the genome, and due to the fact that the number of markers is much larger than the number of genotyped individuals (high dimensionality) and also to the fact that such markers are highly correlated (multicollinearity). However, the use of methodologies that address the adversities is fundamental to the success of genome wide selection. In view of, the aim of this dissertation was to propose the application of Independent Component Regression (ICR), Principal Component Regression (PCR), Partial Least Squares (PLS) and Random Regression Best Linear Unbiased Predictor, whereas carcass traits in an F2 population of pigs originated from the cross of two males from the naturalized Brazilian breed Piau with 18 females of a commercial line (Large White × Landrace × Pietrain), developed at the University Federal of Viçosa. The specific objectives were, to estimate Genomic Breeding Value (GBV) for each individual and estimate the effects of SNP markers in order to compare methods. The results showed that ICR method is more efficient, since provided most accurate genomic breeding values estimates for most carcass traits. / A principal contribuição da genética molecular no melhoramento animal é a utilização direta das informações de DNA no processo de identificação de animais geneticamente superiores. Sob esse enfoque, a seleção genômica ampla (Genome Wide Selection GWS), a qual consiste na análise de um grande número de marcadores SNPs (Single Nucleotide Polymorphisms) amplamente distribuídos no genoma, foi idealizada. A utilização dessas informações é um desafio, uma vez que o número de marcadores é muito maior que o número de animais genotipados (alta dimensionalidade) e tais marcadores são altamente correlacionados (multicolinearidade). No entanto, o sucesso da seleção genômica ampla deve-se a escolha de metodologias que contemplem essas adversidades. Diante do exposto, o presente trabalho teve por objetivo propor a aplicação dos métodos de regressão via Componentes Independentes (Independent Component Regression ICR), regressão via componentes principais (Principal Component Regression PCR), regressão via Quadrados Mínimos Parciais (Partial Least Squares PLSR) e RR-BLUP, considerando características de carcaça em uma população F2 de suínos proveniente do cruzamento de dois varrões da raça naturalizada brasileira Piau com 18 fêmeas de linhagem comercial (Landrace × Large White × Pietrain), desenvolvida na Universidade Federal de Viçosa. Os objetivos específicos foram estimar Valores Genéticos Genômicos (Genomic Breeding Values GBV) para cada indivíduo avaliado e estimar efeitos de marcadores SNPs, visando a comparação dos métodos. Os resultados indicaram que o método ICR se mostrou mais eficiente, uma vez que este proporcionou maiores valores de acurácia na estimação do GBV para a maioria das características de carcaça. Seleção genômica Dimensionality reduction methods Genomic selection CNPQ::CIENCIAS AGRARIAS

Search results