1 |
Técnicas de aprendizado estatístico aplicadas à seleção entre famílias de cana-de-açúcar / Techniques of statistical learning applied the selecting among families of sugarcaneMoreira, Édimo Fernando Alves 03 October 2017 (has links)
Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2018-04-27T13:16:35Z
No. of bitstreams: 1
texto completo.pdf: 811046 bytes, checksum: 164f565159d1396d2885fdace611d37a (MD5) / Made available in DSpace on 2018-04-27T13:16:35Z (GMT). No. of bitstreams: 1
texto completo.pdf: 811046 bytes, checksum: 164f565159d1396d2885fdace611d37a (MD5)
Previous issue date: 2017-10-03 / Uma das grandes dificuldades dos programas de melhoramento de cana-de-açúcar é a seleção de genótipos nas fases iniciais. O uso de métodos estatísticos que visam a predição com base em informações tomadas a nível de campo pode contribuir para aumentar a probabilidade de identificação de genótipos potencialmente superiores. O objetivo deste trabalho é comparar as técnicas de classificação regressão logística (LR), análise discriminante linear (LDA), análise discriminante quadrática (QDA), K-nearest neighboor (KNN), rede neural artificial (ANN) de única camada intermediária, árvores de decisão com random forests (RF) e máquinas de vetor de suporte (SVM) como alternativas para seleção entre famílias de cana-de-açúcar. Os dados utilizados neste trabalho foram provenientes de 5 experimentos, com 22 famílias cada, no delineamento em blocos casualizados, com 5 repetições. Nestes experimentos foram coletados os caracteres de produção, número de colmos (NC), diâmetro de colmos (DC) e a altura de colmos (AC), bem como a produtividade real, expressa em tonelada de cana por hectare (TCHr). Para o treinamento dos métodos de classificação foram utilizados, como variáveis explicativas, os caracteres indiretos de produção NC, DC e AC. A variável resposta utilizada no treinamento foi a indicadora Y = 0 , se a família não foi selecionada via TCHr, e Y = 1 , caso contrário. Previamente à obtenção das regras de classificação, os valores de NC, DC e AC foram padronizados para média 0 e variância 1. Além disso, visando maior eficiência no treinamento dos modelos, foram produzidos dados sintéticos com base na simulação de valores de NC, DC, AC e TCHr para 1.000 famílias. A simulação foi feita utilizando a estrutura de médias e covariâncias fenotípicas de cada i-ésimo experimento. As análises foram processadas em 5 diferentes cenários de acordo com o experimento utilizado para simulação e treinamento dos dados. Foram ainda considerados dois modelos, um completo, com todos os preditores, NC, DC e AC, e um reduzido, onde foi excluída a variável AC. Para avaliação dos classificadores foram utilizadas a taxa de erro aparente (AER) e a taxa de verdadeiros positivos (TPR). Todas as técnicas apresentam alta concordância com a seleção via TCHr (AER média < 0,14), em ambos os modelos, completo e reduzido. No modelo completo, o melhor desempenho, menor AER média (AER=0,0886) e maior TPR média (TPR=0,9831), foi observado no classificador SVM. No modelo reduzido, os classificadores ANN (AER média=0,0932; TPR média=0,9210), SVM (AER média=0,0977; TPR média=0,9417) e k-nearest neighboor (AER=0,1000, TPR=0,9167) apresentam os melhores resultados. O modelo reduzido pode ser preferido, pois apresenta resultados similares ao completo e tem a vantagem de ser operacionalmente mais simples / One of the great difficulties of breeding programs is the selection of genotypes in the early stages. The use of statistical methods for the prediction based on information taken at the field level can contribute to increase the probability of identifying potentially superior genotypes. The objective of this study is to compare the classification techniques, logistic regression (LR), linear discriminant analysis (LDA), quadratic discriminant analysis (QDA), K-nearest neighboor (KNN), single-layer neural network (ANN), decision trees (DT) with random forests and support vector machines (SVM) as alternatives for selection of sugarcane families. The data used in this study were from five experiments with 22 families each, in randomized block design with 5 repetitions. In these experiments were collected production traits, number of stalks (NS), stalk diameter (SD) and the stalk height (SH) and the real production, expressed in tons of cane per hectare (TCHr). For training of methods were used as explanatory variables the indirect production traits, NS, SD and SH. The output variable used in training was the indicator, Y = 0 , if the family was not selected by real ton cane per hectare, and Y = 1 , if the family has been selected. Prior to obtaining the classification rules, the values of NS, SD and SH were standardized for mean 0 e variance 1. Moreover, aiming at greater efficiency in training of models were produced synthetic data based on simulation values of NS, SD, SH and TCHr for 1,000 families. The simulation was done using the structure of phenotypic mean and covariance of each ith experiment. The analyzes were performed in five different scenarios according to the experiment used for simulation and training data. In addition to the different scenarios they were considered two models, full, with all the explanatory variables and reduced, which was excluded from the variable SH. All the techniques of statistical learning feature high agreement with the selection via TCHr (AER mean < 0.14), in both models, full and reduced. For the full model, the best performance, lower AER mean (AER=0.0886) and higher TPR mean (0.9831), was observed in the classifier SVM. In the reduced model, the ANN (AER mean=0.0932; TPR mean=0.9210), the SVM (AER mean=0.0977; TPR mean=0.9417) and the k-nearest neighboor (AER=0.1000, TPR=0.9167) how the best results. The reduced model may be preferred because it presents similar results to the complete model and has the advantage of being operationally simpler.
|
2 |
Prediction of breeding values in sugarcane using pedigree and genomic information / Predição de valores genéticos em cana-de-açúcar usando informação de pedigree e genômicaCosta, Paulo Mafra de Almeida 17 December 2015 (has links)
Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2016-04-22T11:01:49Z
No. of bitstreams: 1
texto completo.pdf: 3258723 bytes, checksum: 86a5f49b070b6d78e456fa633e53bd18 (MD5) / Made available in DSpace on 2016-04-22T11:01:50Z (GMT). No. of bitstreams: 1
texto completo.pdf: 3258723 bytes, checksum: 86a5f49b070b6d78e456fa633e53bd18 (MD5)
Previous issue date: 2015-12-17 / Fundação de Amparo à Pesquisa do Estado de Minas Gerais / Aplicações recentes da predição genômica na área vegetal têm incentivado o seu uso em melhoramento de plantas. O desenvolvimento de ferramentas genômicas para acelerar o melhoramento de cana-de-açúcar está atrasado em comparação com outras grandes culturas, portanto, estudos empíricos devem ser realizados para avaliar a utilidade desta abordagem para o melhoramento desta importante cultura. Os objetivos desse trabalho foram: i) avaliar a acurácia da predição de quatro caracteres quantitativos de cana-de- açúcar usando informação de marcadores SNPs e ii) comparar acurácias entre predições usando pedigree e informação genômica. Valores genéticos foram preditos em uma população de melhoramento da fase T2 de 514 indivíduos genotipados com 37.024 marcadores SNP. Cinco modelos preditivos foram avaliados: Genomic BLUP (GBLUP), Bayesian LASSO (BL), Bayes A (BA), Bayes B (BB) e Bayesian Ridge Regression (BRR). As acurácias dos métodos foram avaliadas através da correlação entre valores genéticos preditos e observados por meio de validação cruzada. Os métodos apresentaram valores de acurácia muito semelhantes. No entanto, houve diferenças marcantes nas acurácias obtidas entre características. A maior acurácia foi obtida para fibra pelo método BRR (0,57) e a menor foi obtida para toneladas de pol por hectare pelo método Bayes B (0,07). Na comparação da predição utilizando pedigree e informação genômica exibiu valores mais elevados de correlação, bem como desvio padrão inferior, exceto para toneladas de cana por hectare e toneladas de pol por hectare. A informação genômica explicou maior proporção da variância genética em comparação com o pedigree. Acurácias satisfatórias foram obtidos utilizando informação genômica, especialmente para percentual de pol em cana e porcentagem de fibra em bagaço. Assim, sua utilização pode ser um abordagem eficaz para a melhoria das características agronômicas desejáveis em uma cultura poliplóide complexa. / The development of genomic tools for speed up sugarcane breeding has been delayed compared to other major crops, therefore, empirical studies must be conducted to evaluate the usefulness of this approach on this important crop. The objectives of our study were: i) to assess the accuracy of prediction of four quantitative traits using genomic information of SNP markers in a commercial sugarcane breeding population; ii) to compare the accuracy between predictions using pedigree and genomic information. Genetic values were predicted in a second phase trial population of 514 individuals genotyped with 37,024 SNP markers. Five statistical predictive models were evaluated: Genomic BLUP (GBLUP), Bayesian LASSO (BL), Bayes A (BA), Bayes B (BB) and Bayesian Ridge Regression (BRR). Accuracies of the methods were assessed through the correlation between observed and predicted genetic values in a lO-fold cross validation. The methods exhibited very similar accuracy values regarding the trait. Nevertheless, there were marked differences among traits. The highest accuracy was obtained for FB by the BRR method (0.57) and the lowest was obtained for TPH by Bayes B method (0.07). Two models (pedigree - P and pedigree + genomic - P+G) were fitted and used to predict the traits in order to compare the prediction accuracy using pedigree and genomic information. Overall, P+G exhibited higher correlation values, as well as lower standard deviation, except for the traits TSH and TPH. Genomic information explained higher proportion of the genetic variance in comparison to the pedigree. Satisfactory accuracies were obtained by using genomic information, especially for pol percentage in sugarcane and fiber percentage in bagasse. Thus, the use of genomic information could be more efficient per unit of time for improvement of desirable agronomic traits in a complex polyploid crop.
|
3 |
Comportamento de oviposição e desempenho larval de Diatraea saccharalis em genótipos de cana-de-açúcar / Oviposition behavior and Diatraea saccharalis’ larval performance in sugarcane genotypesPimentel, Guilherme Vieira 24 February 2016 (has links)
Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2016-06-01T11:07:43Z
No. of bitstreams: 1
texto completo.pdf: 1438069 bytes, checksum: 3f61827c8e132bc94b33f7590e8c41c4 (MD5) / Made available in DSpace on 2016-06-01T11:07:43Z (GMT). No. of bitstreams: 1
texto completo.pdf: 1438069 bytes, checksum: 3f61827c8e132bc94b33f7590e8c41c4 (MD5)
Previous issue date: 2016-02-24 / Fundação de Amparo à Pesquisa do Estado de Minas Gerais / A implantação de variedades de cana-de-açúcar resistentes à broca-da-cana é uma ferramenta importante para reduzir a perda na produção causada por esta praga chave. Objetivou-se neste estudo, avaliar a preferência de oviposição e o desempenho larval de Diatraea saccharalis em genótipos de cana-de-açúcar, assim como, caracterizar os mecanismos e as causas de resistência a esta praga. Desta forma, pode-se ajudar a selecionar os genótipos a serem utilizadas como genitores em programas de melhoramento de cana-de-açúcar visando à obtenção de variedades resistentes. Os experimentos foram realizados no Centro de Experimentação em Cana-de-açúcar (CECA) da Universidade Federal de Viçosa (UFV). No primeiro capítulo, foi avaliada a preferência de oviposição com e sem chance de escolha da D. saccharalis em oito clones de cana-de-açúcar (IJ76-314, IM76-228, RB825336, RB867515, RB985523, SP80-1842, SP80-3280 e TUC71-7), onde foram avaliadas em todas as parcelas dos dois experimentos a quantidade de ovos, posturas e razão ovos por postura. Após a avaliação dos clones no experimento sem chance de escolha, estes foram utilizados no teste de fertilidade dos ovos. No experimento com chance de escolha também foram avaliadas as características das plantas (largura foliar, leituras SPAD, teor de lignina e a captação de voláteis das plantas) e dos insetos (distribuição das posturas nas plantas). No segundo capítulo, avaliou-se o efeito dos mesmos oito clones na sobrevivência das lagartas recém-eclodidas e a escala de dano visual nas folhas de cana-de-açúcar aos quatro meses de idade. No experimento de desempenho larval no interior dos colmos de cana-de-açúcar, os mesmos clones foram utilizados aos seis meses de idade, onde avaliou em todas as parcelas a porcentagem de sobrevivência larval, índice de infestação, o ganho de peso médio dos insetos, porcentagem de pupação e injúria. Em estudo complementar, no mesmo experimento foram acrescentados 16 clones de cana- de-açúcar, totalizando 24 genótipos avaliados. O clone IM76-228 foi o menos preferido para a oviposição no experimento com chance de escolha, e apresentou maior quantidade de compostos voláteis. Quando avaliado o experimento sem chance de escolha e fertilidade dos ovos não revelaram diferenças significativas entre as variáveis. A D. saccharalis prefere ovipositar no terço apical das folhas de cana-de-açúcar. O IM76-228 e a variedade RB867515 apresentaram as menores porcentagens de sobrevivência das lagartas recém-eclodidas da D. saccharalis, sendo a menor nota dano visual para IM76-228, em folhas de cana-de-açúcar aos quatro meses de idade. O desempenho larval no interior dos colmos de cana-de-açúcar foi menor no clone IM76- 228 tendo apresentado, os menores índices de infestação e injúria. / The introduction of varieties of sugarcane borer resistant sugarcane is an important tool to reduce the loss in production caused by this key pest. The aim of this study was to evaluate the oviposition preference and Diatraea saccharalis’ larval performance in sugarcane genotypes, as well as to characterize the mechanisms and causes of resistance to this pest. In this manner, it can help the selection of the genotypes to be used as genitors in programs of sugarcane breeding in order to obtain resistant varieties. The experiments were performed at the Experience Center in Sugarcane (CECA) from Universidade Federal de Viçosa (UFV). In the first chapter, we evaluated the oviposition preference with and without choice of Diatraea saccharalis in eight sugarcane clones (IJ76-314, IM76-228, RB825336, RB867515, RB985523, SP80-1842, SP80- 3280 and TUC71-7), which were evaluated in all portions of the two experiments the amount of eggs, postures and reason eggs/posture. After evaluation of the clones in the experiment no choice, these were used in the fertility test of eggs. In the experiment with free choice were also evaluated the characteristics of plant (leaf width, SPAD readings, lignin content and uptake of volatile plants) and insects (distribution of positions in plants). In the second chapter, the paper evaluated the effect of the same eight clones survival of the newly hatched larvae and the visual damage level in the leaves of sugar cane with four months-age. Besides, the study dealt with the effect of genotypes on the establishment of the caterpillars inside the stalks at six months age. At the end of the experiment, it was possible to evaluate the percentage of larval survival, rate of infestation, the average weight gain of insects, percentage of pupation and injury. In a complementary study, in the larval development experiment were added 16 clones of sugarcane, totaling 24 genotypes. The clone IM76-228 was the least preferred for oviposition in free choice experiment and had higher amounts of volatility compounds. When evaluated the experiment no choice and fertility of eggs revealed no significant differences between the variables. The Diatraea saccharalis prefer to lay eggs in the apical third of the sugarcane leaves. The IM76-228 and RB867515 variety had the lowest percentages of survival, with the smallest visual damage note to IM76-228 in sugarcane leaves at four months old. Larval performance inside of sugarcane stalks was lower in clone IM76-228 and presented the lowest rates of infestation and injury.
|
Page generated in 0.3122 seconds