1 |
Análise de experimentos em látice quadrado no melhoramento vegetal utilizando modelos mistos / Analysis of experiments in square lattice in plant breeding using mixed modelsPaulenas, Viviane Panariello 05 October 2016 (has links)
Experimentos conduzidos no delineamento látice ou reticulado são bastante comuns no melhoramento genético vegetal em que diversos materiais genéticos são comparados, principalmente nas etapas iniciais do programa, visando explorar com maior intensidade a variabilidade genética disponível. Em situações de restrições espaciais e financeiras estes delineamentos se destacam por permitir a comparação de todas as progênies em teste estando ou não instaladas no mesmo bloco. O objetivo do trabalho foi a avaliação de testes de progênies de milho (Zea mays L.), em diferentes ambientes para o caráter produção de grãos em t.ha-1. Duzentas e cinquenta e seis progênies foram instaladas em 4 estações experimentais do município de Piracicaba em diferentes anos agrícolas. Os dados de produção de grãos obtidos pelos diferentes ambientes foram analisados de forma individual e conjunta, a fim de verificar presença da interação genótipo × ambiente. O delineamento usado foi, portanto, o látice quadrado 16 × 16, com duas repetições em cada local. Duas abordagens experimentais foram confrontadas, considerando a estrutura de blocos incompletos parcialmente balanceados do látice e a outra em que cada repetição do látice foi analisada como se fosse um bloco completo. Uma maneira de se analisar estruturas experimentais como esta é utilizando modelos mistos, por meio da inclusão de fatores de efeito aleatório e, fazendo o uso da máxima verossimilhança restrita (REML) para estimar os componentes de variância associados a tais fatores com um menor viés. Além dos componentes de variância, os EBLUPs (melhores preditores lineares não viesados empíricos) também foram calculados e a partir deles foi verificada a correlação entre os diferentes ambientes, e a porcentagem de progênies selecionadas comparando-se os resultados obtidos pelas duas abordagens do conjunto de dados. Análises estatísticas foram implementadas utilizando o software gratuito R, com o pacote estatístico lme4. / Experiments conducted in the lattice design are quite common in plant breeding in which several genetic materials are compared, especially in the early stages of the program, aiming to explore more intensively the genetic variability available. In situations of space and financial constraints these designs stand out for allowing the comparison of all progenies being tested whether or not installed in the same block. The aim of the study was the evaluation of maize (Zea mays L.) progeny tests in different environments for grain yield in t.ha-1. Two hundred and fifty six progenies were tested in four experimental stations in the city of Piracicaba, in different agricultural years. Grain production data obtained by different environments were analyzed individually and jointly in order to verify the presence of genotype × environment interaction. Therefore, the square lattice design with dimension 16 × 16 was used with two replications in each location. Two experimental approaches were compared, considering the partially balanced incomplete block structure of the lattice and the other in each repetition of the lattice was analyzed as if it were a complete block. One way to analyze experimental structures like this is with the use of mixed models, by adding random effect factors, and by making use of the restricted maximum likelihood (REML) for estimating the variance components associated with such factors with less bias. Besides the variance components, EBLUPs (empirical best linear predictor unbiased) were also calculated and from them was checked the correlation between the different environments, and the percentage of selected progenies comparing the results obtained by the two assembly approaches data. Statistical analyzes were implemented for the open-souce software R, using the statistical package lme4.
|
2 |
Análise de experimentos em látice quadrado no melhoramento vegetal utilizando modelos mistos / Analysis of experiments in square lattice in plant breeding using mixed modelsViviane Panariello Paulenas 05 October 2016 (has links)
Experimentos conduzidos no delineamento látice ou reticulado são bastante comuns no melhoramento genético vegetal em que diversos materiais genéticos são comparados, principalmente nas etapas iniciais do programa, visando explorar com maior intensidade a variabilidade genética disponível. Em situações de restrições espaciais e financeiras estes delineamentos se destacam por permitir a comparação de todas as progênies em teste estando ou não instaladas no mesmo bloco. O objetivo do trabalho foi a avaliação de testes de progênies de milho (Zea mays L.), em diferentes ambientes para o caráter produção de grãos em t.ha-1. Duzentas e cinquenta e seis progênies foram instaladas em 4 estações experimentais do município de Piracicaba em diferentes anos agrícolas. Os dados de produção de grãos obtidos pelos diferentes ambientes foram analisados de forma individual e conjunta, a fim de verificar presença da interação genótipo × ambiente. O delineamento usado foi, portanto, o látice quadrado 16 × 16, com duas repetições em cada local. Duas abordagens experimentais foram confrontadas, considerando a estrutura de blocos incompletos parcialmente balanceados do látice e a outra em que cada repetição do látice foi analisada como se fosse um bloco completo. Uma maneira de se analisar estruturas experimentais como esta é utilizando modelos mistos, por meio da inclusão de fatores de efeito aleatório e, fazendo o uso da máxima verossimilhança restrita (REML) para estimar os componentes de variância associados a tais fatores com um menor viés. Além dos componentes de variância, os EBLUPs (melhores preditores lineares não viesados empíricos) também foram calculados e a partir deles foi verificada a correlação entre os diferentes ambientes, e a porcentagem de progênies selecionadas comparando-se os resultados obtidos pelas duas abordagens do conjunto de dados. Análises estatísticas foram implementadas utilizando o software gratuito R, com o pacote estatístico lme4. / Experiments conducted in the lattice design are quite common in plant breeding in which several genetic materials are compared, especially in the early stages of the program, aiming to explore more intensively the genetic variability available. In situations of space and financial constraints these designs stand out for allowing the comparison of all progenies being tested whether or not installed in the same block. The aim of the study was the evaluation of maize (Zea mays L.) progeny tests in different environments for grain yield in t.ha-1. Two hundred and fifty six progenies were tested in four experimental stations in the city of Piracicaba, in different agricultural years. Grain production data obtained by different environments were analyzed individually and jointly in order to verify the presence of genotype × environment interaction. Therefore, the square lattice design with dimension 16 × 16 was used with two replications in each location. Two experimental approaches were compared, considering the partially balanced incomplete block structure of the lattice and the other in each repetition of the lattice was analyzed as if it were a complete block. One way to analyze experimental structures like this is with the use of mixed models, by adding random effect factors, and by making use of the restricted maximum likelihood (REML) for estimating the variance components associated with such factors with less bias. Besides the variance components, EBLUPs (empirical best linear predictor unbiased) were also calculated and from them was checked the correlation between the different environments, and the percentage of selected progenies comparing the results obtained by the two assembly approaches data. Statistical analyzes were implemented for the open-souce software R, using the statistical package lme4.
|
3 |
Efeito do número de genes na avaliação genética utilizando dados simulados / Effect of number of genes on genetic evaluation using simulated dataAssis, Giselle Mariano Lessa de 14 February 2005 (has links)
Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2017-06-02T19:09:41Z
No. of bitstreams: 1
texto completo.pdf: 372842 bytes, checksum: 12b29825980afde297d6a985988fe93c (MD5) / Made available in DSpace on 2017-06-02T19:09:41Z (GMT). No. of bitstreams: 1
texto completo.pdf: 372842 bytes, checksum: 12b29825980afde297d6a985988fe93c (MD5)
Previous issue date: 2005-02-14 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Foram simulados quatro distintos tipos de populações por meio do programa GENESYS com os objetivos de: verificar a influência do número de genes e do tamanho da população na estimação de componentes de variância e na predição de valores genéticos; verificar a adequabilidade do modelo infinitesimal como pressuposição nas análises genéticas; comparar as metodologias clássica e Bayesiana na análise genética de dados selecionados; e verificar a influência do nível de informação a priori ao utilizar metodologia Bayesiana. Dois processos seletivos foram aplicados por 10 gerações a partir da população-base formada por 120 (população pequena) ou por 2.400 indivíduos com registros (população grande): Seleção ao Acaso e Seleção Fenotípica. Foi considerado que dois diferentes números de genes governavam a característica sob seleção, para cada tamanho de população: 900 ou 10 pares de locos. Para as populações pequenas, foram realizadas 500 repetições de cada processo seletivo e para as populações grandes, 300 repetições. Na análise Bayesiana, três níveis de informação a priori foram considerados: não- informativo, pouco informativo e informativo. Os componentes de variância foram estimados utilizando-se somente a população-base, somente a população da 10a geração após seleção ou todas as populações, desde a população-base até a 10a geração após seleção. Os valores genéticos foram preditos para a população-base e para a 10a geração após seleção, considerando, porém, diferentes conjuntos de dados no processo de predição. A Porcentagem de Erro entre os componentes de variâncias estimados e os reais foi utilizada para comparar as metodologias, assim como as diferentes populações e gerações analisadas. Os valores genéticos, por sua vez, foram comparados por meio do Quadrado Médio do Desvio, da Porcentagem de indivíduos Selecionados em Comum entre os 15% melhores indivíduos e pela Correlação de Ordem entre os valores reais e preditos. Conforme os resultados obtidos, pôde-se concluir que quando a característica é governada por elevado número de genes, os componentes de variância genética aditiva e ambiental são satisfatoriamente estimados em populações selecionadas grandes ou pequenas pelas metodologias usuais, desde que os registros de todos os indivíduos e a matriz completa de parentesco sejam conhecidos. Por outro lado, quando a característica é governada por reduzido número de genes, estimativas menos acuradas do componente de variância genética aditiva são obtidas em populações grandes e, caso as informações de parentescos e registros anteriores sejam desconhecidos, o erro na estimação desse componente aumenta consideravelmente, em populações grandes ou pequenas. Verificou-se também que os valores genéticos são superestimados sob seleção fenotípica quando os registros de todos os indivíduos e a matriz completa de parentesco são incluídos nas análises, independentemente do tamanho da população. A queda na acurácia é ainda mais acentuada quando a característica é governada por reduzido número de genes, sendo a classificação correta dos indivíduos também prejudicada. A inclusão do registro de todos os indivíduos, assim como da matriz de parentesco completa beneficiam a classificação adequada dos indivíduos. Verificou-se também que o modelo infinitesimal não é adequado para ser utilizado como pressuposição nas análises genéticas quando a característica é governada por poucos genes, independentemente do tamanho da população. Ao comparar as metodologias REML e Bayesiana verificou-se que, em geral, essas metodologias produzem resultados bastante semelhantes na estimação dos componentes de variância. Para análises com menor quantidade de dados, no entanto, estimativas mais acuradas são obtidas ao se utilizar priors informativos por meio da análise Bayesiana. Concluiu-se também que a acurácia na predição dos valores genéticos, assim como a classificação dos indivíduos não são alteradas pelo nível de informação a priori das análises Bayesianas, cujos resultados também se assemelham aos da metodologia EBLUP. / Four different population types were simulated using GENESYS program with the following objectives: to verify the influence of the number of genes and the population size on variance component estimation and on breeding values prediction; to verify the infinitesimal model as an appropriate assumption on genetic analyses; to compare the classic and Bayesian methodologies on the genetic analysis of selected data; and to verify the influence of a priori information level in Bayesian methodology. Two selective processes were applied for 10 generations starting from base population formed by 120 (small population) or by 2,400 individuals with records (large population): Random Selection and Phenotypic Selection. It was considered that two different numbers of genes governed the trait under selection, for each population size: 900 or 10 pairs of loci. Five hundred repetitions of each selective process for small populations and three hundred repetitions were accomplished for large populations. On Bayesian analysis, three a priori information levels were considered: no-informative, slightly informative and informative. Variance components were estimated using only base population, only population of the 10 th generation after selection or all of populations, from base population up to 10 th selection generation. Breeding values were predicted for base population and for 10 th selection generation, considering, however, different groups of data on the prediction process. Error Percentage between estimated and real variance components was used to compare the methodologies, as well as the different populations and generations analyzed. Genetic values were compared using Average Square Deviation, Percentage of Common Individuals selected among the 15% better individuals and Rank Correlation among predicted and real values. According to the results, it was concluded that when the trait is xgoverned by high number of genes, the genetic additive and environmental variance component are well estimated by usual methodologies in large or small selected populations, since data of all animals and complete relationship matrix are known. On the other hand, when the trait is governed by reduced number of genes, less accurate estimates of additive genetic variance are obtained in large populations and, when relationship information and previous data are unknown, estimate errors of that component increase considerably, in large or small populations. It was also verified that breeding values are overestimated under phenotypic selection when data of all individuals and complete relationship matrix are included on analyses, independently of population size. Accuracy decrease is more accentuated when the trait is governed by reduced number of genes, being the correct classification of individuals also affected. The inclusion of all data, as well as complete relationship matrix benefit the appropriate classification of individuals. It was also verified that the infinitesimal model is not appropriate to be used as assumption in genetic analyses when the trait is governed by few genes, independently of population size. When comparing REML and Bayesian methodologies, it was verified that, in general, these methodologies produce similar results on variance components estimation. However, when analyses are performed with smaller amount of data, informative priors using Bayesian analysis yields more accurate estimates. Finally, accuracy of breeding values prediction, as well as the rank of individuals are not changed by a priori information level on Bayesian analyses, whose results are also similar to the EBLUP methodology.
|
4 |
Predi??o em modelos de tempo de falha acelerado com efeito aleat?rio para avalia??o de riscos de falha em po?os petrol?ferosCarvalho, Jo?o Batista 28 May 2010 (has links)
Made available in DSpace on 2015-03-03T15:28:31Z (GMT). No. of bitstreams: 1
JoaoBC_DISSERT_partes_autorizadas.pdf: 252147 bytes, checksum: e830f27faffa86c9087da28e43e699fd (MD5)
Previous issue date: 2010-05-28 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / We considered prediction techniques based on models of accelerated failure time with
random e ects for correlated survival data. Besides the bayesian approach through empirical
Bayes estimator, we also discussed about the use of a classical predictor, the Empirical
Best Linear Unbiased Predictor (EBLUP). In order to illustrate the use of these predictors,
we considered applications on a real data set coming from the oil industry. More speci -
cally, the data set involves the mean time between failure of petroleum-well equipments of
the Bacia Potiguar. The goal of this study is to predict the risk/probability of failure in
order to help a preventive maintenance program. The results show that both methods are
suitable to predict future failures, providing good decisions in relation to employment and
economy of resources for preventive maintenance. / Consideramos t?cnicas de predi??o baseadas em modelos de tempo de falha acelerado com efeito aleat?rio para dados de sobreviv?ncia correlacionados. Al?m do enfoque bayesiano atrav?s do Estimador de Bayes Emp?rico, tamb?m discutimos sobre o uso de um m?todo cl?ssico, o Melhor Preditor Linear N?o Viciado Emp?rico (EBLUP), nessa classe de modelos. Para ilustrar a utilidade desses m?todos, fazemos aplica??es a um conjunto de dados reais envolvendo tempos entre falhas de equipamentos de po?os de petr?leo da Bacia Potiguar. Neste contexto, o objetivo ? predizer os riscos/probabilidades de falha com a finalidade de subsidiar programas de manuten??o preventiva. Os resultados obtidos mostram que ambos os m?todos s?o adequados para prever falhas futuras, proporcionando boas decis?es em rela??o ao emprego e economia de recursos para manuten??o preventiva
|
5 |
Implementing SAE Techniques to Predict Global Spectacles NeedsZhang, Yuxue January 2023 (has links)
This study delves into the application of Small Area Estimation (SAE) techniques to enhance the accuracy of predicting global needs for assistive spectacles. By leveraging the power of SAE, the research undertakes a comprehensive exploration, employing arange of predictive models including Linear Regression (LR), Empirical Best Linear Unbiased Prediction (EBLUP), hglm (from R package) with Conditional Autoregressive (CAR), and Generalized Linear Mixed Models (GLMM). At last phase,the global spectacle needs’ prediction includes various essential steps such as random effects simulation, coefficient extraction from GLMM estimates, and log-linear modeling. The investigation develops a multi-faceted approach, incorporating area-level modeling, spatial correlation analysis, and relative standard error, to assess their impact on predictive accuracy. The GLMM consistently displays the lowest Relative Standard Error (RSE) values, almost close to zero, indicating precise but potentially overfit results. Conversely, the hglm with CAR model presents a narrower RSE range, typically below 25%, reflecting greater accuracy; however, it is worth noting that it contains a higher number of outliers. LR illustrates a performance similar to EBLUP, with RSE values reaching around 50% in certain scenarios and displaying slight variations across different contexts. These findings underscore the trade-offs between precision and robustness across these models, especially for finer geographical levels and countries not included in the initial sample.
|
6 |
混合線性模型推測問題之研究洪可音 Unknown Date (has links)
當線性模型中包含隨機效果項時,若將之視為固定效果或直接忽略,往往會造成嚴重的推測偏差,故應以混合線性模型為架構。若模式中只包含一個隨機效果項,則模式中有兩個變異數成份,若包含 個隨機效果項,則模式中有 個變異數成份。本論文主要在介紹至少兩個變異數成份時固定效果及隨機效果線性組合的最佳線性不偏推測量(BLUP),及其推測區間之推導與建立。然而BLUP實為變異數比率的函數,若變異數比率未知,而以最大概似法(Maximum Likelihood Method)或殘差最大概似法(Residual Maximum Likelihood Method)估計出變異數比率,再代入BLUP中,則得到的是經驗最佳線性不偏推測量(EBLUP)。至於推測區間則與EBLUP的均方誤有關,本論文先介紹如何求算其漸近不偏估計量,再介紹EBLUP之推測誤差除以 後,其自由度的估算方法,據以建構推測區間。 / When random effects are contained in the model, if they are treated as fixed effects or ignore, then it may result in serious prediction bias. Instead, mixed linear model is to be considered. If there is one source of random effects, then the model has two variance components, while it has variance components, if the model contains random effects. This study primarily presents the derivation of the best linear unbiased predictor (BLUP) of a linear combination of the fixed and random effects, and then the conduction of the prediction interval when the model contains at least two variance components. However, BLUP is a function of variance ratios. If the variance ratios are unknown, we can replace them by their maximum likelihood estimates or residual maximum likelihood estimates, then we can get empirical best linear unbiased predictor (EBLUP). Because prediction interval is relating to the mean squared error (MSE) of EBLUP, so the study first introduces how to get its approximate unbiased estimator, m<sub>a</sub> , then introduces how to evaluate the degrees of freedom of the ratio of the prediction error for the EBLUP and m<sub>a</sub> <sup>1/2</sup> , in order to use both of them to establish the prediction interval.
|
Page generated in 0.0246 seconds