Spelling suggestions: "subject:"dados longitudinais"" "subject:"dados longitudionais""
31 |
Modelos não lineares para dados de contagem longitudinais / Non linear models for count longitudinal dataAraujo, Ana Maria Souza de 16 February 2007 (has links)
Experimentos em que medidas são realizadas repetidamente na mesma unidade experimental são comuns na área agronômica. As técnicas estatísticas utilizadas para análise de dados desses experimentos são chamadas de análises de medidas repetidas, tendo como caso particular o estudo de dados longitudinais, em que uma mesma variável resposta é observada em várias ocasiões no tempo. Além disso, o comportamento longitudinal pode seguir um padrão não linear, o que ocorre com freqüência em estudos de crescimento. Também são comuns experimentos em que a variável resposta refere-se a contagem. Este trabalho abordou a modelagem de dados de contagem, obtidos a partir de experimentos com medidas repetidas ao longo do tempo, em que o comportamento longitudinal da variável resposta é não linear. A distribuição Poisson multivariada, com covariâncias iguais entre as medidas, foi utilizada de forma a considerar a dependência entre os componentes do vetor de observações de medidas repetidas em cada unidade experimental. O modelo proposto por Karlis e Meligkotsidou (2005) foi estendido para dados longitudinais provenientes de experimentos inteiramente casualizados. Modelos para experimentos em blocos casualizados, supondo-se efeitos fixos ou aleatórios para blocos, foram também propostos. A ocorrência de superdispersão foi considerada e modelada através da distribuição Poisson multivariada mista. A estimação dos parâmetros foi realizada através do método de máxima verossimilhança, via algoritmo EM. A metodologia proposta foi aplicada a dados simulados para cada uma das situações estudadas e a um conjunto de dados de um experimento em blocos casualizados em que foram observados o número de folhas de bromélias em seis instantes no tempo. O método mostrou-se eficiente na estimação dos parâmetros para o modelo considerando o delineamento completamente casualizado, inclusive na ocorrência de superdispersão, e delineamento em blocos casualizados com efeito fixo, sem superdispersão e efeito aleatório para blocos. No entanto, a estimação para o modelo que considera efeito fixo para blocos, na presença de superdispersão e para o parâmetro de variância do efeito aleatório para blocos precisa ser aprimorada. / Experiments in which measurements are taken in the same experimental unit are common in agriculture area. The statistical techniques used to analyse data from those experiments are called repeated measurement analysis, and longitudinal study, in which the response variable is observed along the time, is a particular case. The longitudinal behaviour can be non linear, occuring freq¨uently in growth studies. It is also common to have experiments in which the response variable refers to count data. This work approaches the modelling of count data, obtained from experiments with repeated measurements through time, in which the response variable longitudinal behaviour is non linear. The multivariate Poisson distribution, with equal covariances between measurements, was used to consider the dependence between the components of the repeated measurement observation vector in each experimental unit. The Karlis and Meligkotsidou (2005) proposal was extended to longitudinal data obtained from completely randomized. Models for randomized blocks experiments, assuming fixed or random effects for blocks, were also proposed. The occurence of overdispersion was considered and modelled through mixed multivariate Poisson distribution. The parameter estimation was done using maximum likelihood method, via EM algorithm. The methodology was applied to simulated data for all the cases studied and to a data set from a randomized block experiment in which the number of Bromeliads leaves were observed through six instants in time. The method was efficient to estimate the parameters for the completely randomized experiment, including the occurence of overdispersion, and for the randomized blocks experiments assuming fixed effect, with no overdispersion, and random effect for blocks. The estimation for the model that considers fixed effect for block, with overdispersion and for the variance parameters of the random effect for blocks must be improved.
|
32 |
Equação de estimação generalizada e influência local para modelos de regressão beta com medidas repetidas / Generalized estimating equation and local influence to beta regression models with repeated measuresMaria Kelly Venezuela 04 March 2008 (has links)
Utilizando a teoria de função de estimação linear ótima (Crowder, 1987), propomos equações de estimação generalizadas para modelos de regressão beta (Ferrari e Cribari-Neto, 2004) com medidas repetidas. Além disso, apresentamos equações de estimação generalizadas para modelos de regressão simplex baseadas nas propostas de Song e Tan (2000) e Song et al. (2004) e equações de estimação generalizadas para modelos lineares generalizados com medidas repetidas baseadas nas propostas de Artes e Jorgensen (2000) e Liang e Zeger (1986). Todas essas equações de estimação são desenvolvidas sob os enfoques da modelagem da média com homogeneidade da dispersão e da modelagem conjunta da média e da dispersão com intuito de incorporar ao modelo uma possível heterogeneidade da dispersão. Como técnicas de diagnóstico, desenvolvemos uma generalização de algumas medidas de diagnóstico quando abordamos quaisquer equações de estimação definidas tanto para modelagem do parâmetro de posição considerando a homogeneidade do parâmetro de dispersão como para modelagem conjunta dos parâmetros de posição e dispersão. Entre essas medidas, destacamos a proposta da influência local (Cook, 1986) desenvolvida para equações de estimação. Essa medida teve um bom desempenho, em simulações, para destacar corretamente pontos influentes. Por fim, realizamos aplicações a conjuntos de dados reais. / Based on the concept of optimum linear estimating equation (Crowder, 1987), we develop generalized estimating equation (GEE) to analyze longitudinal data considering marginal beta regression models (Ferrari and Cribari-Neto, 2004). The GEEs are also presented to marginal simplex models for longitudinal continuous proportional data proposed by Song and Tan (2000) and Song et al. (2004) and to generalized linear models for longitudinal data based on the proposes of Artes and J$\\phi$rgensen (2000) and Liang and Zeger (1986). All of them are developed focusing the assumption of homogeneous dispersion and with varying dispersion. For the diagnostic techniques, we generalize some diagnostic measures for estimating equations to model the position parameter considering an homogeneous dispersion parameter and for joint modelling of position and dispersion parameters to take in account a possible heterogeneous dispersion. Among these measures, we point out the local influence (Cook, 1986) developed to estimating equations. This measure can correctly show influential observations in simulation study. Finally, the theory is applied to real data sets.
|
33 |
Estimativas de (co) varância genética de pesos do nascimento até a maturidade em rebanhos da raça Nelore usando modelos de regressão aleatória e de características múltiplasBoligon, Arione Augusti [UNESP] 25 February 2008 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:26:07Z (GMT). No. of bitstreams: 0
Previous issue date: 2008-02-25Bitstream added on 2014-06-13T19:33:22Z : No. of bitstreams: 1
boligon_aa_me_jabo.pdf: 786716 bytes, checksum: 55a12f5a16a7a8f8acd0c213b48d9308 (MD5) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / Foram estimados parâmetros genéticos para pesos do nascimento à idade adulta de animais da raça Nelore por meio de análises uni, bi e multicaracterísticas e modelos de regressão aleatória. Os dados utilizados são de animais nascidos de 1975 e 2002, provenientes de 8 fazendas participantes do Programa de Melhoramento Genético da Raça Nelore (PMGRN). Os pesos foram obtidos do nascimento aos 8 anos de idade. Nas análises uni, bi e multicaracterísticas foram utilizados pesos em idades padrão como nascimento, desmama, ano, sobreano e aos 2, 3 e 5 anos de idade. Também foram realizadas análises utilizando o peso mais próximo aos 4,5 anos de idade como indicativo de peso adulto, considerando uma única medida a partir de 2, 3 e 4 anos de idade ou como registros repetidos de pesos a partir dessas mesmas idades. Nas análises de regressão aleatória, foram utilizados pesos de fêmeas do nascimento aos 8 anos de idade, considerando como variáveis independentes polinômios de Legendre da idade na data da pesagem. A variância residual foi modelada por meio de classes variando de 1 a 5. Foram utilizados 8 modelos de coeficientes de regressão aleatória para os efeitos direto e materno de animal, e de ambiente permanente de animal e materno. O modelo multicaracterística, incluindo registros de pesos ao desmame e à seleção é o mais indicado para a avaliação genética de pesos pós-desmama. Em avaliações genéticas para a característica de peso adulto, o emprego de modelos de repetibilidade, considerando pesos a partir de 3 anos de idade, seria o mais adequado em relação à utilização de medida única... / Weight records of Nelore cattle from birth to mature age were analyzed using univariate, bivariate, multivariate and random regression models. Records of Nelore cattle born from 1975 to 2002, from 8 herds participating in the Nelore Cattle Breeding Program (NCBP) were used. The weights were obtained from birth to 8 years of age. Weights at birth, weaning, yearling, 18 months and 2, 3 and 5 years of age were analyzed using univariate, bivariate and multivariate models. Also, as indicative of the mature weight, the weight closest to 4.5 years of age, was analyzed considering only one record or repeated records obtained from 2, 3 and 4 years of age. For random regression models age of cow varied from birth to 8 years. Direct and maternal genetic and, animal and maternal permanent environmental variances were modeled by random regression on Legendre polynomials of age at recording, with order of fit from 3 to 6 and a total of 8 models. Residual variances were modeled by a step function with 1 or 5 classes. The multivariate model including weight records at weaning and at selection age is the most indicated for genetic evaluation of pos-weaning weights. For genetic evaluation of mature weight to use repeated records obtained from 3 years of age is better than only one record per animal. The random regression models were able to model changes of variances with age adequately, with parameter estimates similar to those obtained by multivariate analyses. The model with direct and maternal genetic effects, animal and maternal permanent environmental effects ajusted by quartic, cubic, sixth and cubic polynomials, respectively, and residual variances modeled by 5 classes, was the most adequate to describe the covariance structure of the data...(Complete abstract, click electronic access below)
|
34 |
Persistência da lactação e Influência da estrutura de dados sobre a estimação de parâmetros genéticos para a produção de leite de bovinos da raça HolandesaSousa Júnior, Severino Cavalcante de [UNESP] 24 February 2010 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:33:32Z (GMT). No. of bitstreams: 0
Previous issue date: 2010-02-24Bitstream added on 2014-06-13T18:45:22Z : No. of bitstreams: 1
sousajunior_sc_dr_jabo.pdf: 1454758 bytes, checksum: 5d233cf3c874be7d7b3c671f43249a20 (MD5) / Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) / Para o presente estudo foram utilizadas 3.202 primeiras lactações, de vacas da raça Holandesa pertencentes a quatro fazendas da região Sudeste, registradas semanalmente, com o objetivo de verificar a influência da estrutura de dados de produção de leite no decorrer da lactação, sobre os parâmetros genéticos estimados por modelos de regressão aleatória. Foram testados quatro arquivos contendo estruturas diferentes de dados. O arquivo de controles semanais (CS) contava com 122.842 controles, o arquivo mensal (CM) com 30.883 controles, o bimestral (CB) com 15.837 controles, e por fim, o arquivo de controles trimestrais (CT) continha de 12.702 controles. O modelo utilizado foi o de regressão aleatória, e como aleatórios foram considerados os efeitos genético aditivo e o de ambiente permanente de animal. A ordem das funções de covariância para estes dois efeitos foi de sexta ordem para efeito genético aditivo e de sétima ordem para o efeito de ambiente permanente, com variâncias residuais heterogêneas a estrutura de variâncias residuais foi modelada por meio de uma “step function” O modelo teve como efeito fixo os grupos de contemporâneos (GC) comuns para todos os arquivos de dados. Os GC foram compostos por fazenda, mês e ano do controle,e como co-variável a idade da vaca ao parto (regressão linear e quadrática) e o número de dias em lactação (regressão fixa para a média populacional). Todos os arquivos de dados estudados foram analisados incluindo arquivo de genealogia composto por 4.380 animais com 3202 mães e 228 touros. As estimativas de herdabilidades para produção de leite apresentaram tendências semelhantes entre os arquivos de dados analisados, com maior semelhança entre os bancos CS, CM e CB. As estimativas de herdabilidade para produção de leite no dia do controle (PLDC) do banco CT apresentou pequenas diferenças, em relação aos demais... / To this study the first 1293 Holstein dairy lactation registered weekly were used, having cows belonging to four farms in the Southeast region of Brazil, aiming verify the milk production data structure influence during lactation under genetic parameters estimated by random regression models. Four files with different data structures were tested. The week control files (CS) counted with 122,842 controls; the month files (CM), 30,883 controls; the bimestrial (CB) had 15,837 controls and finally the quarterly (CT) had 12,702 controls. It was used the random regression model and, as random, the genetic additive and the animal permanent environmental effects were considered. The covariance function to these two effects was the sixth grade to the genetic effect additive and the seventh grade to the permanent environmental effect, having heterogeneous residual variances, and the residual variance structure was modeled by a “step function”. The model had as the fixed effect the contemporaneous groups (GC) commons to all data set, GC were compounded by farm, month, and year of control. The co-variable was the cow age at birth (linear and quadratic regression) and the milking days (fixed regression to the population average). All evaluated data files presented genealogy file composed by 4,380 animals having 1,416 mothers and 228 bulls. The estimate of heritability presented tendencies similar among the analyzed data, having the higher similarity CS, CM and CB. The CT presented small differences in the estimate of heritability when compared to the others. The CB data file presented all the analyzed genetic parameters estimative with the same tendency and magnificence of the CS and CM, allowing the milk control in a CB structure, random regression model in genetic evaluations speaking. The genetic values (VG) to partial milking period production were predicted (MRA100, MRA200, MRA300 e MRA90_305) ...(Complete abstract click electronic access below)
|
35 |
Modelos não lineares para dados de contagem longitudinais / Non linear models for count longitudinal dataAna Maria Souza de Araujo 16 February 2007 (has links)
Experimentos em que medidas são realizadas repetidamente na mesma unidade experimental são comuns na área agronômica. As técnicas estatísticas utilizadas para análise de dados desses experimentos são chamadas de análises de medidas repetidas, tendo como caso particular o estudo de dados longitudinais, em que uma mesma variável resposta é observada em várias ocasiões no tempo. Além disso, o comportamento longitudinal pode seguir um padrão não linear, o que ocorre com freqüência em estudos de crescimento. Também são comuns experimentos em que a variável resposta refere-se a contagem. Este trabalho abordou a modelagem de dados de contagem, obtidos a partir de experimentos com medidas repetidas ao longo do tempo, em que o comportamento longitudinal da variável resposta é não linear. A distribuição Poisson multivariada, com covariâncias iguais entre as medidas, foi utilizada de forma a considerar a dependência entre os componentes do vetor de observações de medidas repetidas em cada unidade experimental. O modelo proposto por Karlis e Meligkotsidou (2005) foi estendido para dados longitudinais provenientes de experimentos inteiramente casualizados. Modelos para experimentos em blocos casualizados, supondo-se efeitos fixos ou aleatórios para blocos, foram também propostos. A ocorrência de superdispersão foi considerada e modelada através da distribuição Poisson multivariada mista. A estimação dos parâmetros foi realizada através do método de máxima verossimilhança, via algoritmo EM. A metodologia proposta foi aplicada a dados simulados para cada uma das situações estudadas e a um conjunto de dados de um experimento em blocos casualizados em que foram observados o número de folhas de bromélias em seis instantes no tempo. O método mostrou-se eficiente na estimação dos parâmetros para o modelo considerando o delineamento completamente casualizado, inclusive na ocorrência de superdispersão, e delineamento em blocos casualizados com efeito fixo, sem superdispersão e efeito aleatório para blocos. No entanto, a estimação para o modelo que considera efeito fixo para blocos, na presença de superdispersão e para o parâmetro de variância do efeito aleatório para blocos precisa ser aprimorada. / Experiments in which measurements are taken in the same experimental unit are common in agriculture area. The statistical techniques used to analyse data from those experiments are called repeated measurement analysis, and longitudinal study, in which the response variable is observed along the time, is a particular case. The longitudinal behaviour can be non linear, occuring freq¨uently in growth studies. It is also common to have experiments in which the response variable refers to count data. This work approaches the modelling of count data, obtained from experiments with repeated measurements through time, in which the response variable longitudinal behaviour is non linear. The multivariate Poisson distribution, with equal covariances between measurements, was used to consider the dependence between the components of the repeated measurement observation vector in each experimental unit. The Karlis and Meligkotsidou (2005) proposal was extended to longitudinal data obtained from completely randomized. Models for randomized blocks experiments, assuming fixed or random effects for blocks, were also proposed. The occurence of overdispersion was considered and modelled through mixed multivariate Poisson distribution. The parameter estimation was done using maximum likelihood method, via EM algorithm. The methodology was applied to simulated data for all the cases studied and to a data set from a randomized block experiment in which the number of Bromeliads leaves were observed through six instants in time. The method was efficient to estimate the parameters for the completely randomized experiment, including the occurence of overdispersion, and for the randomized blocks experiments assuming fixed effect, with no overdispersion, and random effect for blocks. The estimation for the model that considers fixed effect for block, with overdispersion and for the variance parameters of the random effect for blocks must be improved.
|
36 |
Modelos lineares generalizados mistos para dados longitudinais. / Generalized linear mixed models in longitudinal data.Silvano Cesar da Costa 13 March 2003 (has links)
Experimentos cujas variaveis respostas s~ ao proporcoes ou contagens, sao muito comuns nas diversas areas do conhecimento, principalmente na area agricola. Na analise desses experimentos, utiliza-se a teoria de modelos lineares generalizados, bastante difundida (McCullagh & Nelder, 1989; Demetrio, 2001), em que as respostas sao independentes. Caso a variancia estimada seja maior do que a esperada, estima-se o parametro de dispersao, incluindo-o no processo de estimaçao dos parametros. Quando a variavel resposta e observada ao longo do tempo, pode haver uma correlacao entre as observacoes e isso tem que ser levado em consideracao na estimacao dos parametros. Uma forma de se trabalhar essa correlacao e aplicando a metodologia de equacoes de estimacao generalizada (EEG), discutida por Liang & Zeger (1986), embora, neste caso, o interesse esteja nas estimativas dos efeitos fixos e a inclusao da matriz de correlacao de trabalho sirva para se obter um melhor ajuste. Uma outra alternativa e a inclusao, no preditor linear, de um efeito latente para captar variabilidades nao consideradas no modelo e que podem in uenciar nos resultados. No presente trabalho, usa-se uma forma combinada de efeito aleatorio e parametro de dispersao, incluidos conjuntamente na estimacao dos parametros. Essa metodologia e aplicada a um conjunto de dados obtidos de um experimento com camu-camu, com objetivo de se avaliarem quais os melhores metodos de enxertia e tipos de porta-enxertos que podem ser utilizados, atraves da proporcao de pegamentos da muda. Varios modelos sao ajustados, desde o modelo em parcelas subdivididas (supondo independencia), ate o modelo em que se considera o parametro de dispersao e efeito aleatorio conjuntamente. Ha evidencias de que o modelo em que se inclui o efeito aleatorio e o parametro de dispersao, conjuntamente, resultam em melhores estimativas dos parametros. Outro conjunto de dados longitudinais, com milho transgenico MON810, em que a variavel resposta e o numero de lagartas (Spodoptera frugiperda), e utilizado. Neste caso, devido ao excesso de respostas zero, emprega-se o modelo de regressao Poisson in acionado de zeros (ZIP), alem do modelo Poisson padrao, em que as observacoes sao consideradas independentes, e do modelo Poisson in acionado de zeros com efeito aleatorio. Os resultados mostram que o efeito aleatorio incluido no preditor foi nao significativo e, assim, o modelo adotado e o modelo de regressao Poisson in acionado de zeros. Os resultados foram obtidos usando-se os procedimentos NLMIXED, GENMOD e GPLOT do SAS - Statistical Analysis System, versao 8.2. / Experiments which response variables are proportions or counts are very common in several research areas, specially in the area of agriculture. The theory of generalized linear models, well difused (McCullagh & Nelder, 1989; Demetrio, 2001), is used for analyzing these experiments where the responses are independent. If the estimated variance is greater than the expected variance, the dispersion parameter is estimated including it on the parameter estimation process. When the response variable is observed over time a correlation among observations might occur and it should be taken into account in the parameter estimation. A way of dealing with this correlation is applying the methodology of generalized estimating equations (GEEs) discussed by Liang & Zeger (1986) although, in this case, the interest is on the estimates of the xed efect being the inclusion of a working correlation matrix useful to obtain more accurate estimates. Another alternative is the inclusion of a latent efect in the linear predictor to explain variabilities not considered in the model that might in uence the results. In this work the random efect and the dispersion parameter are combined and included together in the parameter estimation. Such methodology is applied to a data set obtained from an experiment realized with camu-camu to evaluate, through proportion of grafting well successful of seedling, which kind of grafting and understock are suitable to be used. Several models are fitted, since the split plot model (with independence assumption) up to the model where the dispersion parameter and the random efect are considered together. There is evidence that the model including the random efect and the dispersion parameter together, produce better estimates of the parameters. Another longitudinal data set used here comes from an experiment realized with the MON810 transgenic corn where the response variable is the number of caterpillars (Spodoptera frugiperda). In this case, due to the excessive number of zeros obtained, the zero in ated Poisson regression model (ZIP) is used in addition to the standard Poisson model, where observations are considered independent, and the zero in ated Poisson regression model with random efect. The results show that the random efect included in the linear predictor was not significant and, therefore, the adopted model is the zero in ated Poisson regression model. The results were obtained using the procedures NLMIXED, GENMOD and GPLOT available on SAS - Statistical Analysis System, version 8.2.
|
37 |
Determinants of dropout and repetition rates in Cearà / Determinantes da evasÃo e repetÃncia escolar no CearÃMaità Rimekkà Shirasu 20 January 2014 (has links)
nÃo hà / Tendo em vista os reconhecidos benefÃcios sociais e econÃmicos advindos da educaÃÃo, tanto em nÃvel individual quanto agregado, identificar os fatores que causam os problemas de evasÃo e repetÃncia escolar tem persistido como ponto importante na agenda de pesquisadores, seja de paÃses em desenvolvimento ou desenvolvidos. Nesse sentido, este estudo objetivou identificar os determinantes da evasÃo e da repetÃncia escolar no ensino mÃdio das escolas pÃblicas do CearÃ. Para tanto, foi utilizada a base de dados longitudinal do Sistema de AvaliaÃÃo Permanente da EducaÃÃo BÃsica (SPAECE) de 2008, acompanhada de 2009 a 2011, sobre a qual se construiu um modelo logÃstico multinÃvel que incorpora a natureza hierÃrquica dos dados, subdivididos em nÃveis de alunos e de escolas. Os resultados indicam a importÃncia do Programa Bolsa FamÃlia para a reduÃÃo da probabilidade, tanto para a ocorrÃncia de evasÃo, quanto de repetÃncia escolar. AlÃm disso, dentre os fatores que tÃm a maior influÃncia no aumento das chances de o aluno deixar a escola, estÃo o desinteresse pelos estudos e a persistÃncia de repetÃncia em anos anteriores. Sendo este Ãltimo, junto com o atraso escolar, os principais determinantes da retenÃÃo dos alunos cearenses. Uma vez que essas escolas possuem infraestruturas semelhantes, a intervenÃÃo dos educadores deve estar atrelada à motivaÃÃo dos alunos pelos estudos, atravÃs de medidas pedagÃgicas que os envolvam e os alertem efetivamente sobre os benefÃcios sociais e econÃmicos advindos pela acumulaÃÃo de educaÃÃo a mÃdio e longo prazo, tal como ocorre nos paÃses desenvolvidos. / Considering the overall benefits from education, the dropouts and school failures bring about severe consequences for economic progress and welfare of the population. The purpose of this study was to identify the determinants for the occurrence of such problems in public high schools of the State of CearÃ. For doing this, a longitudinal database of SPAECE of 2008, extended to 2009-2011, is applied to a multilevel logistic model on a hierarchical basis, which is divided in two dimensions: school and students. It is found evidence that factors associated with both the students themselves and their familiesâ status affects significantly the chances for dropouts and school failures. While the cash transfer (Bolsa FamÃlia) to studentâs household is an important mechanism to reduce the probability of dropout and school failure, the lack of students' dedications in school activities and persistency of failures are the main deficiencies for increasing the chances of dropouts from school. Since the sampled schools have similar infrastructure, the intervention of educators must be driven to student motivation in scholar activities, through educational measures that call for their attention and warn them effectively on the social and economic benefits arising from the accumulation of education in the medium and long term, as it occurs in developed countries.
|
38 |
Modelos lineares mistos em dados longitudionais com o uso do pacote ASReml-R / Linear Mixed Models with longitudinal data using ASReml-R packageRenata Alcarde 10 April 2012 (has links)
Grande parte dos experimentos instalados atualmente é planejada para que sejam realizadas observações ao longo do tempo, ou em diferentes profundidades, enfim, tais experimentos geralmente contem um fator longitudinal. Uma maneira de se analisar esse tipo de conjunto de dados é utilizando modelos mistos, por meio da inclusão de fatores de efeito aleatório e, fazendo uso do método da máxima verossimilhança restrita (REML), podem ser estimados os componentes de variância associados a tais fatores com um menor viés. O pacote estatístico ASReml-R, muito eficiente no ajuste de modelos lineares mistos por possuir uma grande variedade de estruturas para as matrizes de variâncias e covariâncias já implementadas, apresenta o inconveniente de nao ter como objetos as matrizes de delineamento X e Z, nem as matrizes de variâncias e covariâncias D e , sendo estas de grande importância para a verificação das pressuposições do modelo. Este trabalho reuniu ferramentas que facilitam e fornecem passos para a construção de modelos baseados na aleatorização, tais como o diagrama de Hasse, o diagrama de aleatorização e a construção de modelos mistos incluindo fatores longitudinais. Sendo o vetor de resíduos condicionais e o vetor de parâmetros de efeitos aleatórios confundidos, ou seja, não independentes, foram obtidos resíduos, denominados na literatura, resíduos com confundimento mínimo e, como proposta deste trabalho foi calculado o EBLUP com confudimento mínimo. Para tanto, foram implementadas funções que, utilizando os objetos de um modelo ajustado com o uso do pacote estatístico ASReml-R, tornam disponíveis as matrizes de interesse e calculam os resíduos com confundimento mínimo e o EBLUP com confundimento m´nimo. Para elucidar as técnicas neste apresentadas e salientar a importância da verificação das pressuposições do modelo adotado, foram considerados dois exemplos contendo fatores longitudinais, sendo o primeiro um experimento simples, visando a comparação da eficiência de diferentes coberturas em instalações avícolas, e o segundo um experimento realizado em três fases, contendo fatores inteiramente confundidos, com o objetivos de avaliar características do papel produzido por diferentes espécies de eucaliptos em diferentes idades. / Currently, most part of the experiments installed is designed to be carried out observations over time or at different depths. These experiments usually have a longitudinal factor. One way of analyzing this data set is by using mixed models through means of inclusion of random effect factors, and it is possible to estimate the variance components associated to such factors with lower bias by using the Restricted maximum likelihood method (REML). The ASRemi-R statistic package, very efficient in fitting mixed linear models because it has a wide variety of structures for the variance - covariance matrices already implemented, presents the disadvantage of having neither the design matricesX and Z, nor the variance - covariance matrices D and , and they are very important to verify the assumption of the model. This paper gathered tools which facilitate and provide steps to build models based on randomization such as the Hasse diagram, randomization diagram and the mixed model formulations including longitudinal factors. Since the conditional residuals and random effect parameters are confounded, that is, not independent, it was calculated residues called in the literature as least confounded residuals and as a proposal of this work, it was calculated the least confound EBLUP. It was implemented functions which using the objects of fitted models with the use of the ASReml-R statistic package becoming available the matrices of interests and calculate the least confounded residuals and the least confounded EBLUP. To elucidate the techniques shown in this paper and highlight the importance of the verification of the adopted models assumptions, it was considered two examples with longitudinal factors. The former example was a simple experiment and the second one conducted in three phases, containing completely confounded factors, with the purpose of evaluating the characteristics of the paper produced by different species of eucalyptus from different ages.
|
39 |
Análise de dados longitudinais em experimentos com cana-de-açúcar / Analysis of longitudinal data in experiments with sugar of caneEdjane Gonçalves de Freitas 25 February 2008 (has links)
Nesse trabalho foi abordada a situação em que observações de produtividade da cana-de-açúcar (TCH) foram tomadas na mesma unidade experimental em diferentes condições de avalições (anos). Foram avaliados os perfis médios de resposta de 48 genótipos de cana-de-açúcar em dois experimentos: Experimento 1 e Experimento 2, durante três e cinco anos respectivamente, ambos com o delineamento de blocos ao acaso. Esse tipo de planejamento produz uma forma de relação entre as observações tomadas na mesma unidade experimental, portanto requer outras suposições, além das usuais, para que análise seja correta e os testes produzam resultados válidos. Para que as inferências sobre as médias de produtividade sejam válidas e seguras é necessário que o modelo da matriz de covariância dos dados seja apropriado. Diante disso, foram avalidos três alterantivas de análise para dados longitudinais (medidas repetidas no tempo ), sendo utilizados portanto, o modelo univariado, conforme o planejamento do tipo \"split-plot on time\", que impõe forte restrição quanto a matriz de variâncias-covariâncias; o modelo multivariado, que utiliza uma matriz de variâncias-covariâncias não-estruturada e o modelo mistos, que possibilita a seleção de uma matriz que melhor representa os dados. Contudo, verificou-se que não houve diferença entre os resultados dos testes para as diferentes metodologias. Porém, é interessante a continuidade do estudo em relação ao modelo misto, pois devido a sua flexibilidade e precisão é possível obter estimativas mais seguras dos componentes de variância e predizer os valores genotípicos, que por fim poderá proporcionar a predição de produção de uma futura colheita para um determinado genótipo. / This work has been dealt with situation in which observations of productivity of sugar of cane (TCH) were taken in the same unit experimental in different condition of assessments (years). The response profiles average of 48 genotypes of sugar of cane were evaluated in two experiments: Experiment 1 and Experiment 2, for three and five years respectively, both with the randomized complete block design. This type of planning produces a form of relationship between the observations made in the same unit experimental therefore requires other assumptions, in addition to the usual, so that analysis is correct and the test results valid. To that inferences on the means of productivity are valid and safe it is necessary that the model of covariance matrix of the data is appropriate. Therefore, were evaluated three alternatives for analysis of longitudinal data (repeated measures over time), the univariate model as the planning of the split-plot on time which imposes strong restrictions on variances - covariances matrix, the multivariate model, which uses a non-structured variances - covariances matrix and mixed model, which they are enable the selection of a matrix that best represents the data. However, it was found that there was no difference between the results of tests for the different methodologies. But it is interesting the continuity of the study in relation to mixed model, because due to its flexibility and accuracy will be possible to obtain more reliable estimates of the variance components and predict the genotypic values, which ultimately could provide a prediction of production of a future harvest for a given genotype.
|
40 |
Uma abordagem para análise de dados com medidas repetidas utilizando modelos lineares mistos / One approach to analyzing data with repeated measures using linear mixed modelsMichele Barbosa 11 September 2009 (has links)
No presente trabalho propôs-se uma abordagem simples visando à escolha de um modelo linear misto a ser ajustado a dados com medidas repetidas. A construção do modelo envolveu a escolha dos efeitos aleatórios, dos efeitos fixos e da estrutura de covariâncias utilizando técnicas gráficas e analíticas. O uso do Teste da Razão de Verossimilhança e dos Critérios de Informação de Akaike - AIC e de Schwarz - BIC pode levar a escolhas diferentes da estrutura de covariâncias, o que pode influenciar os resultados das inferências feitas sobre os parâmetros de efeitos fixos. A abordagem foi aplicada a conjuntos de dados resultantes de estudos agropecuários utilizando o software livre R. Foram feitas comparações dos resultados obtidos de modelos implementados com o proc mixed do SAS e com a função lme() do R, observando as vantagens e restrições destes dois softwares. / In this present work was proposed a simple approach to know how to choose a linear mixed model that can be adjustable to data with repeated measures. The construction of the model involved the choice of random effects, the fixed effects and covariance structure, using graphical and analytical techniques. The use of the Likelihood Ratio Test and the Akaike Information Criteria - AIC and Schwarz - BIC can lead to different choices of the structure of covariance, which may influence the results of inferences made about the parameters of fixed effects. The approach was applied to data sets that was resulted from farming studies using the software R. Comparisons of the results of models implemented were made with the proc mixed of SAS and with the function lme() of R, noting the advantages and limitations of these two softwares.
|
Page generated in 0.0657 seconds