Global ETD Search

31	A case study in applying generalized linear mixed models to proportion data from poultry feeding experiments Shannon, Carlie January 1900 (has links) Master of Science / Department of Statistics / Leigh Murray / This case study was motivated by the need for effective statistical analysis for a series of poultry feeding experiments conducted in 2006 by Kansas State University researchers in the department of Animal Science. Some of these experiments involved an automated auger feed line system commonly used in commercial broiler houses and continuous, proportion response data. Two of the feed line experiments are considered in this case study to determine if a statistical model using a non-normal response offers a better fit for this data than a model utilizing a normal approximation. The two experiments involve fixed as well as multiple random effects. In this case study, the data from these experiments is analyzed using a linear mixed model and Generalized Linear Mixed Models (GLMM’s) with the SAS Glimmix procedure. Comparisons are made between a linear mixed model and GLMM’s using the beta and binomial responses. Since the response data is not count data a quasi-binomial approximation to the binomial is used to convert continuous proportions to the ratio of successes over total number of trials, N, for a variety of possible N values. Results from these analyses are compared on the basis of point estimates, confidence intervals and confidence interval widths, as well as p-values for tests of fixed effects. The investigation concludes that a GLMM may offer a better fit than models using a normal approximation for this data when sample sizes are small or response values are close to zero. This investigation discovers that these same instances can cause GLMM’s utilizing the beta response to behave poorly in the Glimmix procedure because lack of convergence issues prevent the obtainment of valid results. In such a case, a GLMM using a quasi-binomial response distribution with a high value of N can offer a reasonable and well behaved alternative to the beta distribution. Generalized linear mixed models GLIMMIX Quasi-binomial distribution Beta distribution Statistics (0463)
32	ENVIRONMENTAL HETEROGENEITY EFFECTS ON DIVERSITY AND NITROUS OXIDE EMISSIONS FROM SOIL IN RESTORED PRAIRIE Scott, Drew Austin 01 May 2019 (has links) Ecological theory predicts that high environmental heterogeneity causes high biodiversity. Theory further predicts that more biodiversity results in greater ecosystem functioning. These theoretical predictions were evaluated in three studies using grassland restorations from agriculture. Andropogon gerardii Grassland Mixed models Plant-soil interactions PLFA Salvea azurea
33	Modelos mistos para populações finitas com erros de medida endógenos e exógenos / Finite population mixed models with endogenous and exogenous measurement errors Arenas, German Moreno 02 September 2009 (has links) Consideramos a predição ótima de valores latentes com base em dados sujeitos a erros de medida endógenos e exógenos, obtidos a partir de uma amostra aleatória de uma população finita. Consideramos o modelo misto para populações finitas (MMPF) com erros de medida exógenos e endógenos usando o enfoque proposto por Stanek et al. (2004) e Stanek & Singer (2004), e calculamos o melhor preditor linear não enviesado (BLUP) do valor latente da i-ésima unidade selecionada na amostra. Quando as variâncias endógenas são heterocedásticas, o preditor obtido sob o MMPF é diferente do preditor obtido sob o modelo misto usual, pois a constante de encolhimento depende da média das variâncias individuais. Utilizamos simulação para comparar o preditor obtido sob o modelo misto usual (utilizado conforme a interpretação usual) com o preditor obtido sob o MMPF, mostrando que apesar do primeiro ser enviesado, ele geralmente apresenta erro quadrático médio (EQM) menor (ou ligeiramente maior) do que aquele obtido sob o MMPF. Adicionalmente, mostramos como utilizar dois pacotes de \\emph estatístico (Proc MIXED do SAS e lme(nlme) do R), construídos sob o modelo misto usual, para ajustar corretamente modelos em situações com erros exógenos e endógenos, heterocedásticos ou homocedásticos. / We consider optimal estimation and prediction of latent values based on data subject to endogenous and exogenous measurement errors, obtained via simple random sample from a finite population. We consider a finite population mixed model (FPMM) with endogenous and exogenous measurement errors proposed by Stanek III et al. (2004) and Stanek III & Singer (2004) and obtained the best linear unbiased predictor (BLUP) of the latent value of the i-th unit selected in the sample. When the endogenous variances are heteroscedastic, the predictor obtained under the FPMM is different than the predictor obtained with the usual mixed model, because the shrinkage constant depends on the average of the individual variances. We consider simulation studies to compare the predictor obtained under the usual mixed model (used according to the usual interpretation) with the predictor obtained under the FPMM, and show that the former is biased, but usually presents smaller (or slightly larger) mean squared error (MSE) than the predictor obtained under the FPMM. Additionally, we indicate how two commonly used statistical software packages (SAS\'s Proc MIXED and R\'s lme(nlme) ) may be employed to fit mixed models in situations with heteroscedastic or homoscedastic exogenous and endogenous errors. BLUE BLUE BLUP BLUP Erros de medida Finite population Measurement errors Mixed models Modelos mistos População finita.
34	Análise de dados longitudinais: uma aplicação na avaliação do conforto animal / Longitudinal data analysis: an application in assessing animal comfort Sercundes, Ricardo Klein 28 January 2014 (has links) Em regiões tropicais e subtropicais, a alta intensidade da radiação solar associada aos altos valores de temperatura e umidade proporcionam condições de desconforto dentro dos aviários comerciais, afetando a sanidade e produção dos lotes de frango. Nesse sentido, o presente trabalho propôs-se avaliar dados de conforto animal em aviários construídos em escala reduzida com diferentes tipos de telhas (cerâmica e fibrocimento) e forros (A e B). Modelos lineares mistos foram utilizados objetivando-se o estudo dos índices de conforto \"entalpia específica\" (h) e \"temperatura de globo e umidade\" (ITGU). A obtenção dos modelos envolveu a escolha de efeitos aleatórios, fixos e estruturas de covariância utilizando técnicas gráficas e analíticas. Para selecionar os modelos que melhor se ajustavaram aos dados, foram utilizados testes de razão de verossimilhanças, teste Wald-F e os critérios de informação AIC e BIC, em um método de seleção top-down. Para a variável entalpia específica, não houve diferença entre os tratamentos avaliados, sendo todos representados por uma parábola que apresentou ponto máximo em 50,68 kJ.kg ar seco-1 às 13h 51min. Para a variável ITGU, houve interação entre os fatores testados, sendo a combinação telha de cerâmica e forro B a de melhor desempenho, apresentando máximo em 74,08 às 14h 21min. As análises de diagnóstico confirmaram o bom ajuste dos modelos. Era esperado que os diferentes índices de conforto gerassem conclusões equivalentes, no entanto isso não foi observado. / In tropical and subtropical regions, the high intensity of solar radiation associated with high values of temperature and humidity provide discomfort inside the commercial poultry houses, which affects animal health and production batches. Therefore, this works\'s goal is to analyse data of performance of small-scale poultry houses built with different types of tiles (ceramic and cement) and liners (A and B) in animal comfort. Linear mixed models were used aiming to study two thermal comfort indexes: specific enthalpy (h) and black globe temperature and humidity (GTHI). Model building involved choosing fixed and random effects and covariance structures using graphical and analytical techniques. To select the best model fit, likelihood ratio tests were used, as well as Walf-F tests and the AIC and BIC criteria in a top-down selection method. For the specific enthalpy variable, there was no significant difference among the treatments and all were represented by a single curve which presented a peak at 50.68 kJ.kg of dry air-1 at 13h 51min. For the variable GTHI, there was a significant interaction effect between the factors and the combination of ceramic tile and liner B provided the best performance, with a maximum of 74.08 at 14h 21min. The diagnostic tests confirmed that the models were well fitted. It was expected that the different comfort indexes would generate equivalent conclusions, however this was not observed. Broiler chickens Conforto térmico Ensaios fatoriais Factorial designs Frangos de corte Mixed models Modelos mistos Termal comfort
35	Interpretação da interação genótipos x ambientes em feijão-caupi usando modelos multivariados, mistos e covariáveis ambientais / Interpreting genotype x environment interaction in cowpea using multivariate, mixed models, and environmental covariates Carvalho, Leonardo Castelo Branco 30 April 2015 (has links) Várias metodologias têm sido propostas com o intuito de medir a influência que a interação GxE exerce sobre os mais diversos caracteres de interesse e, dentre essas, as abordagens via modelos mistos utilizando REML/BLUP têm sido mencionadas como vantajosas. Ainda, o uso de informações ambientais pode ser útil para encontrar os fatores que estão por trás da real diferença entre os genótipos. O objetivo do estudo foi avaliar a resposta da produtividade de grãos em feijão-caupi frente às variações espaciais, e as variáveis ambientais mais relevantes para a interação GxE. Foram avaliados 20 genótipos em 47 locais entre os anos de 2010 a 2012 sob delineamento DBC. Após a análise conjunta, os padrões de adaptabilidade dos genótipos foram testados pelas metodologias GGE Biplot e MHPRVG e a estratificação ambiental foi feita via Análise de Fatores sobre a matriz dos efeitos aleatórios GGE. A importância das variáveis ambientais na produtividade foi verificada pela associação entre os efeitos da matriz GGE e cada variável ambiental. Após decomposição SVD, os componentes principais foram plotados em Covariáveis-Biplots. Os efeitos de genótipos e da interação tripla apresentaram elevada significância (p ≤ 0,01 e p ≤ 0,001, respectivamente) indicando forte influência desta última no desempenho dos genótipos avaliados. O modelo fixo GGE Biplot apresentou baixa eficiência, explicando apenas 35% da variação total, sendo os genótipos MNC03-737F-5-1, MNC03-737F-5- 4, MNC03-737F-5-9, BRS Tumucumaque, BRS Cauamé e BRS Guariba considerados os mais estáveis, e MNC03-737F-5-9 e BRS Tumucumaque apontados como amplamente adaptados. Já a estatística MHPRVG destacou os genótipos MNC02-676F-3, MNC03-737F-5-1, MNC03- 737F-5-9, BRS Tumucumaque e BRS Guariba, com adaptação ampla, e MNC02-675F-4-9, MNC02-676F-3 e MNC03-737F-5-9 como especificamente adaptados a alguns ambientes. O ajuste para o modelo aleatório revelou efeitos de genótipos e interações GxE significativos (p ≤ 0,001) e foram obtidas correlações significativas (p ≤ 0,01 e p ≤ 0,001) entre PROD e as variáveis IT, NDP, Ptotal, Tmax, Tmin, Lat, Lon, e Alt. Os genótipos MNC03-737F-5-1, MNC03-737F-5-9, BRS Tumucumaque e BRS Guariba associaram elevada produtividade de grãos à rusticidade, sendo as variáveis \"Temperatura\", \"Insolação\" e \"Precipitação\", bem como \"Latitude\" e \"Altitude\", os mais importantes para a interação GxE. A análise MHPRVG foi adequada para a identificação dos genótipos superiores e o modelo Biplot-Covariável mostrou-se como uma ferramenta útil na identificação das variáveis ambientais importantes para a produtividade de grãos em feijão-caupi. / Several methods have been proposed to measure GxE interaction influence on various traits of interest, and among these, mixed models approaches using REML/BLUP have been mentioned as advantageous. Moreover, the use of environmental information can be useful to find factors that are behind the real difference between genotypes. The aim of this study was to evaluate the response of grain yield in cowpea to spatial variations, and the most important environmental factors for GxE interaction. Twenty genotypes were evaluated at 47 locations between the years 2010 to 2012 under RCB design. After joint analysis, genotypes adaptability patterns were tested by GGE Biplot and MHPRVG methods, and an environmental stratification was performed through factor analysis on the random effects GGE matrix. The impact of environmental factors on yield was verified by the association between the effects of the GGE matrix and environmental variables. After SVD decomposition, the principal components were plotted in Covariables-Biplots. Genotype effects and triple interaction were highly significant (p ≤ 0.01 and p ≤ 0.001, respectively) indicating strong GxE influence on genotypes performance. The fixed model GGE Biplot exhibits low efficiency, explaining only 35% of the total variation, and genotypes MNC03-737F-5-1, MNC03-737F-5-4, MNC03-737F-5-9, BRS Tumucumaque, BRS Cauamé, and BRS Guariba were considered the most stable, and MNC03-737F-5-9 and BRS Tumucumaque identified as widely adapted. MHPRVG method highlighted MNC02-676F-3, MNC03-737F-5-1, MNC03-737F-5-9, BRS Tumucumaque, and BRS Guariba as genotypes with broad adaptation and MNC02-675F-4-9, MNC02-676F-3, and MNC03-737F-5-9 as specifically adapted to certain environments. The fitted random effects model revealed significant genotype effects and GxE interactions (p ≤ 0.001) and significant correlations were obtained (p ≤ 0.01 and p ≤ 0.001) between PROD and IT , NDP, Ptotal, Tmax, Tmin, Lat, Lon, and Alt variables. Genotypes MNC03-737F-5-1, MNC03-737F-5-9, BRS Tumucumaque, and BRS Guariba presented high grain yield associated with rusticity, and environmental factors \"Temperature\", \"Insolation\" and \"Precipitation\", as well as \"Latitude\" and \"Altitude\", were the most important for GxE interaction. MHPRVG analysis was adequate to identify superior genotypes, and Covariate-Biplot model proved to be a useful tool for identifying key environmental factors for grain yield in cowpea. Vigna unguiculata Environmental factors Fatores ambientais GxE interaction Interação GxE Mixed models Modelos mistos Vigna unguiculata
36	Statistical models for genomic selection in Panicum maximum considering allelic dosage / Modelos genéticos-estatísticos para seleção genômica em Panicum maximum com informação de dosagem alélica Lara, Letícia Aparecida de Castro 19 September 2017 (has links) Several species of economic interest are autotetraploid, such as the forage Panicum maximum, which is responsible for high productivity and quality of tropical pastures. The main accessions in nature are autotetraploid apomictic plants, on the other hand, diploid sexual plants may also be found. Although apomixis is advantageous because it fixes hybrid vigor, sexual reproduction is fundamental to allow genetic recombination by crossing among superior genotypes. Thus, genetic breeding consists of crossing apomictic plants with tetraploidized sexual plants. In these crosses, the use of superior sexual parents allows to increase the frequency of favorable alleles in the progeny. Therefore, recurrent selection programs in tetraploid sexual populations are fundamental to P. maximum breeding programs and strategies such as genomic selection can increase the accuracy of selection, allowing shorter breeding cycles and release cultivars in the market in the short term when compared to conventional programs. As P. maximum is a perennial crop, genotypes are evaluated in sucessive harvests. Thus, the study goals are to evaluate nutritional, structural, and yield traits in a sexual tetraploid population of P. maximum, investigating different classes of linear mixed models applied to longitudinal data, as well as to develop genomic selection models which consider tetraploid allelic dosage. This work was split into two chapters. In the first chapter, three classes of models were analyzed: i) Class A consists in modeling the interaction of genotypes and harvests with homogeneous correlations, genotypes were assumed not correlated, and residual effects were assumed homocedastic and not correlated; ii) Class B consists of groups of models in which genetic and residual effects were fitted with different variance and covariance (VCOV) structures and genotypes were not correlated; and iii) Class C is similar to Class B, however genotypes were correlated by an additive relationship matrix based on pedigree values. For all traits, Class C models performed better based on goodness of fit of the models. Therefore, we recommend to incorporate additive relationship matrix besides to model harvests with different levels of correlations over time. In the second chapter, SNP markers, obtained by genotyping-by-sequencing (GBS) technique, were used to develop Bayesian and GBLUP models that consider tetraploid allelic dosage. Bayesian models accuracies did not differ from the accuracy of GBLUP model and, we recommend the latter because it requires less computational time. The accuracy of genomic selection models reinforces the advantage of implementing this strategy in P. maximum breeding programs. / Diversas espécies de interesse econômico são autotetraploides, como a forrageira Panicum maximum, a qual proporciona alta produtividade e qualidade para pastagens tropicais. Os principais acessos na natureza são plantas apomíticas tetraploides, no entanto pode-se encontrar também plantas sexuais diploides. Embora a apomixia seja vantajosa pela facilidade em fixar o vigor híbrido, a reprodução sexual é fundamental por permitir recombinação genética a partir de cruzamentos entre genótipos superiores. Desta forma, o melhoramento nesta espécie consiste em cruzar plantas apomíticas com plantas sexuais tetraploidizadas. A utilização de parentais sexuais superiores nestes cruzamentos permite aumentar a frequência de alelos favoráveis na progênie. Portanto, programas de seleção recorrente intrapopulacional em populações sexuais tetraploides são fundamentais para programas de melhoramento em P. maximum. Além disto, a utilização de estratégias como seleção genômica são promissoras para aumentar os ganhos de seleção, permitindo avançar ciclos de seleção recorrente e lançar cultivares no mercado em menor prazo, quando comparados a programas convencionais. Como P. maximum é uma cultura perene, os genótipos são avaliados em sucessivos cortes. Assim, este estudo tem como finalidade avaliar caracteres de produtividade, estruturais e nutricionais em uma população sexual tetraploide de P. maximum, investigando diferentes classes de modelos lineares mistos aplicados a dados longitudinais, além de desenvolver modelos de seleção genômica que considerem a natureza tetraploide da população. Este trabalho foi dividido em dois capítulos. No primeiro capítulo, três classes de modelos foram analisados: i) Classe A consiste em modelar a interação genótipos por cortes com correlações homogêneas, genótipos não correlacionados entre si e os efeitos residuais são ajustados com homocedasticidade e ausência de correlação; ii) Classe B consiste em grupos de modelos com diferentes estruturas de variância e covariância (VCOV) para efeitos genéticos e residuais e genótipos não correlacionados; iii) Classe C é similar à Classe B, no entanto os genótipos são correlacionados por uma matriz de parentesco aditivo calculado por pedigree. Para todos os caracteres, os modelos da Classe C tiveram melhor ajuste. Portanto, recomenda-se testar matrizes de VCOV que permitam modelar cortes com diferentes níveis de correlações ao longo do tempo bem como incluir informação de parentesco aditivo e, se disponível, matriz de parentesco genômico. No segundo capítulo, marcadores SNPs, obtidos via genotipagem por sequenciamento, foram aplicados em modelos Bayesianos e GBLUP os quais foram desenvolvidos para incorporar informação de dosagem alélica tetraploide. Uma vez que as acurácias dos modelos Bayesianos não diferiram das acurácias do modelo GBLUP com dosagem alélica, recomenda-se o uso do segundo por requerer menos tempo computacional. A acurácia dos modelos preditivos reforça a vantagem em implementar seleção genômica em programas de melhoramento de P. maximum. Autotetraploides Autotetraploids Forage Forrageira Linear mixed models Melhoramento de plantas Modelos lineares mistos Plant breeding Predição Prediction
37	Seleção de modelos lineares mistos utilizando critérios de informação / Mixed linear model selection using information criterion Yamanouchi, Tatiana Kazue 18 August 2017 (has links) O modelo misto é comumente utilizado em dados de medidas repetidas devido a sua flexibilidade de incorporar no modelo a correlação existente entre as observações medidas no mesmo indivíduo e a heterogeneidade de variâncias das observações feitas ao longo do tempo. Este modelo é composto de efeitos fixos, efeitos aleatórios e o erro aleatório e com isso na seleção do modelo misto muitas vezes é necessário selecionar os melhores componentes do modelo misto de tal forma que represente bem os dados. Os critérios de informação são ferramentas muito utilizadas na seleção de modelos, mas não há muitos estudos que indiquem como os critérios de informação se desempenham na seleção dos efeitos fixos, efeitos aleatórios e da estrutura de covariância que compõe o erro aleatório. Diante disso, neste trabalho realizou-se um estudo de simulação para avaliar o desempenho dos critérios de informação AIC, BIC e KIC na seleção dos componentes do modelo misto, medido pela taxa TP (Taxa de verdadeiro positivo). De modo geral, os critérios de informação se desempenharam bem, ou seja, tiveram altos valores de taxa TP em situações em que o tamanho da amostra é maior. Na seleção de efeitos fixos e na seleção da estrutura de covariância, em quase todas as situações, o critério BIC teve um desempenho melhor em relação aos critérios AIC e KIC. Na seleção de efeitos aleatórios nenhum critério teve um bom desempenho, exceto na seleção de efeitos aleatórios em que considera a estrutura de simetria composta, situação em que BIC teve o melhor desempenho. / The mixed model is commonly used in data of repeated measurements because of its flexibility to incorporate in the model the correlation existing between the observations measured in the same individual and the heterogeneity of variances of observations made over time. This model is composed of fixed effects, random effects and random error and with this in the selection of the mixed model it is often necessary to select the best components of the mixed model in such a way that it represents the data well. Information criteria are tools widely used in model selection, but there are not many studies that indicate how information criteria play out in the selection of fixed effects, random effects, and the covariance structure that makes up the random error. In this work, a simulation study was performed to evaluate the performance of the AIC, BIC and KIC information criteria in the selection of the components of the mixed model, measured by the TP (True positive Rate). In general, the information criteria performed well, that is, they had high TP rate in situations where the sample size is larger. In the selection of fixed effects and in the selection of the covariance structure, in almost all situations, the BIC criterion had a better performance in relation to the AIC and KIC criteria. In the selection of random effects no criterion had a good performance, except in the selection of Random effects in which it considers the compound symmetric structure, situation in which BIC had the best performance. Critério de informação Information criterion Mixed models Model selection Modelos mistos Seleção de modelos Simulação Simulation
38	Modelos mistos no mapeamento genético de fatores de risco cardiovascular em famílias brasileiras usando dados de SNPs / Mixed models in genetic mapping of the cardiovascular risk factors in brazilian families using SNPs data Souza, Mirian de 28 May 2012 (has links) O estudo de doenças complexas, tais como hipertensão e glicemia, é de grande importância na área médica, pois essas doenças afetam muitas pessoas no mundo e seu padrão de variação envolve componentes ambientais, genéticos e suas possíveis interações. Para o mapeamento de genes a amostragem do genoma humano é feita por meio de plataformas de marcadores moleculares e, em geral, destacam-se duas classes de marcadores: os do tipo microsatélites e os SNPs (do inglês, Single Nucleotide Polimorphisms). Os dados de famílias são comumente analisados via modelos mistos e marcadores microsatélites de efeitos aleatórios, sendo que os estudos caso-controle com indivíduos não relacionados têm sido vinculados a dados de SNPs. Neste contexto, surge a problemática de como modelar o SNP em dados de famílias, pois o mesmo pode ser modelado como um fator fixo ou aleatório. Com a finalidade de trazer contribuições a esta discussão, um dos objetivos deste trabalho é propor um exercício de simulação e análise de dados genéticos que facilite o ensino e o entendimento de conceitos de genética e do mapeamento de genes modelados a partir de efeitos fixos ou aleatórios utilizando o software R. Além disso, na análise de dados envolvendo mapas densos de SNPs é necessário contornar o problema de múltiplos testes, e a proposta em multiestágios de Aulchenko et al. (2007) é uma alternativa de análise, na qual o efeito do SNP é modelado como um fator fixo e associado a um componente residual. Logo, surge também como desafio deste trabalho, aplicar o modelo em multiestágios para o mapeamento dos genes e discutir suas vantagens e limitações. / The study of complex diseases such as hypertension and glucose is of great importance in the medical field because these diseases affect many people in the world and its pattern of variation involves environmental and genetics components and their possible interactions. For genes mapping the human genome sampling is performed by means of molecular markers platforms, generally including two kinds of markers: the type microsatellite and SNPs (Single Nucleotide Polimorphisms). The family data is commonly analyzed by mixed models and random effects microsatellite markers and the case-control studies with unrelated individuals have been linked to data from SNPs. In this context the question arises of how to model the SNP on family data because it can be modeled as a fixed or random factor. In order to bring contributions to this discussion, one of the objectives of this study is to propose a simulation exercise and analysis of genetic data to facilitate the teaching and understanding of concepts of genetics and gene mapping modeled from fixed or random effects using software R. Furthermore, analysis of data involving dense maps of SNPs is necessary to overcome the problem of multiple tests, and the proposal multistage Aulchenko et al. (2007) is an alternative analysis in which the effect of SNP is modeled as a fixed factor and associated with a residual component. So there is also a challenge of this study to apply the multistage model for the mapping of genes and discuss their advantages and limitations. Dados de família Dados de SNPs Families data Mapeamento genético Mixed models Modelos mistos SNPs data
39	Modelos mistos para populações finitas com erros de medida endógenos e exógenos / Finite population mixed models with endogenous and exogenous measurement errors German Moreno Arenas 02 September 2009 (has links) Consideramos a predição ótima de valores latentes com base em dados sujeitos a erros de medida endógenos e exógenos, obtidos a partir de uma amostra aleatória de uma população finita. Consideramos o modelo misto para populações finitas (MMPF) com erros de medida exógenos e endógenos usando o enfoque proposto por Stanek et al. (2004) e Stanek & Singer (2004), e calculamos o melhor preditor linear não enviesado (BLUP) do valor latente da i-ésima unidade selecionada na amostra. Quando as variâncias endógenas são heterocedásticas, o preditor obtido sob o MMPF é diferente do preditor obtido sob o modelo misto usual, pois a constante de encolhimento depende da média das variâncias individuais. Utilizamos simulação para comparar o preditor obtido sob o modelo misto usual (utilizado conforme a interpretação usual) com o preditor obtido sob o MMPF, mostrando que apesar do primeiro ser enviesado, ele geralmente apresenta erro quadrático médio (EQM) menor (ou ligeiramente maior) do que aquele obtido sob o MMPF. Adicionalmente, mostramos como utilizar dois pacotes de \\emph estatístico (Proc MIXED do SAS e lme(nlme) do R), construídos sob o modelo misto usual, para ajustar corretamente modelos em situações com erros exógenos e endógenos, heterocedásticos ou homocedásticos. / We consider optimal estimation and prediction of latent values based on data subject to endogenous and exogenous measurement errors, obtained via simple random sample from a finite population. We consider a finite population mixed model (FPMM) with endogenous and exogenous measurement errors proposed by Stanek III et al. (2004) and Stanek III & Singer (2004) and obtained the best linear unbiased predictor (BLUP) of the latent value of the i-th unit selected in the sample. When the endogenous variances are heteroscedastic, the predictor obtained under the FPMM is different than the predictor obtained with the usual mixed model, because the shrinkage constant depends on the average of the individual variances. We consider simulation studies to compare the predictor obtained under the usual mixed model (used according to the usual interpretation) with the predictor obtained under the FPMM, and show that the former is biased, but usually presents smaller (or slightly larger) mean squared error (MSE) than the predictor obtained under the FPMM. Additionally, we indicate how two commonly used statistical software packages (SAS\'s Proc MIXED and R\'s lme(nlme) ) may be employed to fit mixed models in situations with heteroscedastic or homoscedastic exogenous and endogenous errors. BLUE BLUP Erros de medida Modelos mistos População finita. BLUE BLUP Finite population Measurement errors Mixed models
40	Métodos de diagnóstico para modelos lineares mistos / Diagnotics methods for linear mixed models. Juvencio Santos Nobre 04 March 2004 (has links) Muitos fenômenos podem ser representados por meio de modelos estatísticos de forma satisfatória. Para validar tais modelos é necessário verificar se as suposições envolvidas estão satisfeitas e se o modelo é sensível a pequenas perturbações; este é o objetivo da análise de diagnóstico. Neste trabalho apresentamos, discutimos e propomos técnicas de diagnóstico em modelos lineares mistos e as ilustramos com um exemplo prático. / Many phenomena can be represented through statistical models in a satisfactory way. To validate such models it is necessary to verify whether the assumptions are satisfied and whether the model is sensitive to small deviations; this constitutes the objective of diagnostic analysis. In this work we present, discuss and propose diagnostic techniques for mixed linear models and illustrate them with a practical example. Alavancagem e influência local. Modelos lineares mistos resíduos Linear mixed models residual and local influence.

Search results