• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 56
  • 1
  • Tagged with
  • 57
  • 57
  • 48
  • 46
  • 39
  • 34
  • 30
  • 25
  • 20
  • 18
  • 16
  • 14
  • 13
  • 12
  • 12
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
41

Modelos para análise de dados discretos longitudinais com superdispersão / Models for analysis of longitudinal discrete data in the presence of overdispersion

Fernanda Bührer Rizzato 08 February 2012 (has links)
Dados longitudinais na forma de contagens e na forma binária são muito comuns, os quais, frequentemente, podem ser analisados por distribuições de Poisson e de Bernoulli, respectivamente, pertencentes à família exponencial. Duas das principais limitações para modelar esse tipo de dados são: (1) a ocorrência de superdispersão, ou seja, quando a variabilidade dos dados não é adequadamente descrita pelos modelos, que muitas vezes apresentam uma relação pré-estabelecida entre a média e a variância, e (2) a correlação existente entre medidas realizadas repetidas vezes na mesma unidade experimental. Uma forma de acomodar a superdispersão é pela utilização das distribuições binomial negativa e beta binomial, ou seja, pela inclusão de um efeito aleatório com distribuição gama quando se considera dados provenientes de contagens e um efeito aleatório com distribuição beta quando se considera dados binários, ambos introduzidos de forma multiplicativa. Para acomodar a correlação entre as medidas realizadas no mesmo indivíduo podem-se incluir efeitos aleat órios com distribuição normal no preditor linear. Esses situações podem ocorrer separada ou simultaneamente. Molenberghs et al. (2010) propuseram modelos que generalizam os modelos lineares generalizados mistos Poisson-normal e Bernoulli-normal, incorporando aos mesmos a superdispersão. Esses modelos foram formulados e ajustados aos dados, usando-se o método da máxima verossimilhança. Entretanto, para um modelo de efeitos aleatórios, é natural pensar em uma abordagem Bayesiana. Neste trabalho, são apresentados modelos Bayesianos hierárquicos para dados longitudinais, na forma de contagens e binários que apresentam superdispersão. A análise Bayesiana hierárquica é baseada no método de Monte Carlo com Cadeias de Markov (MCMC) e para implementação computacional utilizou-se o software WinBUGS. A metodologia para dados na forma de contagens é usada para a análise de dados de um ensaio clínico em pacientes epilépticos e a metodologia para dados binários é usada para a análise de dados de um ensaio clínico para tratamento de dermatite. / Longitudinal count and binary data are very common, which often can be analyzed by Poisson and Bernoulli distributions, respectively, members of the exponential family. Two of the main limitations to model this data are: (1) the occurrence of overdispersion, i.e., the phenomenon whereby variability in the data is not adequately captured by the model, and (2) the accommodation of data hierarchies owing to, for example, repeatedly measuring the outcome on the same subject. One way of accommodating overdispersion is by using the negative-binomial and beta-binomial distributions, in other words, by the inclusion of a random, gamma-distributed eect when considering count data and a random, beta-distributed eect when considering binary data, both introduced by multiplication. To accommodate the correlation between measurements made in the same individual one can include normal random eects in the linear predictor. These situations can occur separately or simultaneously. Molenberghs et al. (2010) proposed models that simultaneously generalizes the generalized linear mixed models Poisson-normal and Bernoulli-normal, incorporating the overdispersion. These models were formulated and tted to the data using maximum likelihood estimation. However, these models lend themselves naturally to a Bayesian approach as well. In this paper, we present Bayesian hierarchical models for longitudinal count and binary data in the presence of overdispersion. A hierarchical Bayesian analysis is based in the Monte Carlo Markov Chain methods (MCMC) and the software WinBUGS is used for the computational implementation. The methodology for count data is used to analyse a dataset from a clinical trial in epileptic patients and the methodology for binary data is used to analyse a dataset from a clinical trial in toenail infection named onychomycosis.
42

Modelos para análise de dados discretos longitudinais com superdispersão / Models for analysis of longitudinal discrete data in the presence of overdispersion

Rizzato, Fernanda Bührer 08 February 2012 (has links)
Dados longitudinais na forma de contagens e na forma binária são muito comuns, os quais, frequentemente, podem ser analisados por distribuições de Poisson e de Bernoulli, respectivamente, pertencentes à família exponencial. Duas das principais limitações para modelar esse tipo de dados são: (1) a ocorrência de superdispersão, ou seja, quando a variabilidade dos dados não é adequadamente descrita pelos modelos, que muitas vezes apresentam uma relação pré-estabelecida entre a média e a variância, e (2) a correlação existente entre medidas realizadas repetidas vezes na mesma unidade experimental. Uma forma de acomodar a superdispersão é pela utilização das distribuições binomial negativa e beta binomial, ou seja, pela inclusão de um efeito aleatório com distribuição gama quando se considera dados provenientes de contagens e um efeito aleatório com distribuição beta quando se considera dados binários, ambos introduzidos de forma multiplicativa. Para acomodar a correlação entre as medidas realizadas no mesmo indivíduo podem-se incluir efeitos aleat órios com distribuição normal no preditor linear. Esses situações podem ocorrer separada ou simultaneamente. Molenberghs et al. (2010) propuseram modelos que generalizam os modelos lineares generalizados mistos Poisson-normal e Bernoulli-normal, incorporando aos mesmos a superdispersão. Esses modelos foram formulados e ajustados aos dados, usando-se o método da máxima verossimilhança. Entretanto, para um modelo de efeitos aleatórios, é natural pensar em uma abordagem Bayesiana. Neste trabalho, são apresentados modelos Bayesianos hierárquicos para dados longitudinais, na forma de contagens e binários que apresentam superdispersão. A análise Bayesiana hierárquica é baseada no método de Monte Carlo com Cadeias de Markov (MCMC) e para implementação computacional utilizou-se o software WinBUGS. A metodologia para dados na forma de contagens é usada para a análise de dados de um ensaio clínico em pacientes epilépticos e a metodologia para dados binários é usada para a análise de dados de um ensaio clínico para tratamento de dermatite. / Longitudinal count and binary data are very common, which often can be analyzed by Poisson and Bernoulli distributions, respectively, members of the exponential family. Two of the main limitations to model this data are: (1) the occurrence of overdispersion, i.e., the phenomenon whereby variability in the data is not adequately captured by the model, and (2) the accommodation of data hierarchies owing to, for example, repeatedly measuring the outcome on the same subject. One way of accommodating overdispersion is by using the negative-binomial and beta-binomial distributions, in other words, by the inclusion of a random, gamma-distributed eect when considering count data and a random, beta-distributed eect when considering binary data, both introduced by multiplication. To accommodate the correlation between measurements made in the same individual one can include normal random eects in the linear predictor. These situations can occur separately or simultaneously. Molenberghs et al. (2010) proposed models that simultaneously generalizes the generalized linear mixed models Poisson-normal and Bernoulli-normal, incorporating the overdispersion. These models were formulated and tted to the data using maximum likelihood estimation. However, these models lend themselves naturally to a Bayesian approach as well. In this paper, we present Bayesian hierarchical models for longitudinal count and binary data in the presence of overdispersion. A hierarchical Bayesian analysis is based in the Monte Carlo Markov Chain methods (MCMC) and the software WinBUGS is used for the computational implementation. The methodology for count data is used to analyse a dataset from a clinical trial in epileptic patients and the methodology for binary data is used to analyse a dataset from a clinical trial in toenail infection named onychomycosis.
43

Modelos lineares mistos em estudos toxicológicos longitudinais / Linear mixed models in longitudinal toxicological studies

Oliveira, Luzia Pedroso de 14 January 2015 (has links)
Os modelos mistos são apropriados na análise de dados longitudinais, agrupados e hierárquicos, permitindo descrever e comparar os perfis médios de respostas, levando em conta a variabilidade e a correlação entre as unidades experimentais de um mesmo grupo e entre os valores observados na mesma unidade experimental ao longo do tempo, assim como a heterogeneidade das variâncias. Esses modelos possibilitam a análise de dados desbalanceados, incompletos ou irregulares com relação ao tempo. Neste trabalho, buscou-se mostrar a flexibilidade dos modelos lineares mistos e a sua importância na análise de dados toxicológicos longitudinais. Os modelos lineares mistos foram utilizados para analisar os efeitos de dose no ganho de peso de ratos adultos machos e fêmeas, em teste de toxicidade por doses repetidas e também os efeitos de fase de gestação e dose nos perfis de pesos de filhotes de ratas tratadas. Foram comparados os modelos lineares mistos de regressão polinomial de grau 3, spline e de regressão por partes, ambos com um único ponto de mudança na idade média de abertura dos olhos dos filhotes, buscando o mais apropriado para descrever o crescimento dos mesmos ao longo do período de amamentação. São apresentados os códigos escritos no SAS/STAT para a análise exploratória dos dados, ajuste, comparação e validação dos modelos. Espera-se que o detalhamento da teoria e das aplicações apresentado contribua para a compreensão, interesse e uso desta metodologia por estatísticos e pesquisadores da área. / Mixed models are appropriate in the analysis of longitudinal, grouped and hierarchical data, allowing describe and compare the average response profiles, taking into account the variability and correlation among the experimental units of the same group and among the values observed over the time in the same experimental unit, as well as the heterogeneity of variances. These models allow the analysis of unbalanced, incomplete or irregular data with respect to time. This work aimed to show the flexibility of linear mixed models and its importance in the analysis of longitudinal toxicological data. Linear mixed models were used to evaluate the effects of doses in the body weight gain of adult male and female Wistar rats, in repeated doses toxicity test and also the effects of pregnancy period and dose in the pups growth of treated dams. It were compared the linear mixed models of third degree polynomial regression, spline and piecewise regression, both with a single point of change in the average time of pups eyes opening, searching for the most appropriate one to describe their growth along the lactation period. The SAS/STAT codes used for exploratory data analysis, comparison and validation of fitted models are presented. It is expected that the detailing of the theory and of the applications presented contribute with the understanding, interest and use of this methodology by statisticians and researchers in the area.
44

Modelos longitudinais de grupos múltiplos multiníveis na teoria da resposta ao item: métodos de estimação e seleção estrutural sob uma perspectiva bayesiana / Longitudinal multiple groups multilevel models in the item response theory : estimation methods and structural selection under a bayesian perspective

Azevedo, Caio Lucidius Naberezny 11 March 2008 (has links)
No presente trabalho propomos uma estrutura bayesiana, através de um esquema de dados aumentados, para analisar modelos longitudinais com grupos mútiplos (MLGMTRI) na Teoria da Resposta ao Item (TRI). Tal estrutura consiste na tríade : modelagem, métodos de estimação e métodos de diagnóstico para a classe de MLGMTRI. Na parte de modelagem, explorou-se as estruturas multivariada e multinível, com o intuito de representar a hierarquia existente em dados longitudinais com grupos múltiplos. Esta abordagem permite considerar várias classes de submodelos como: modelos de grupos múltiplos e modelos longitudinais de um único grupo. Estudamos alguns aspectos positivos e negativos de cada uma das supracitadas abordagens. A modelagem multivariada permite representar de forma direta estruturas de dependência, além de possibilitar que várias delas sejam facilmente incorporadas no processo de estimação. Isso permite considerar, por exemplo, uma matriz não estruturada e assim, obter indícios da forma mais apropriada para a estrutura de dependência. Por outro lado, a modelagem multinível propicia uma interpretação mais direta, obtenção de condicionais completas univariadas, fácil inclusão de informações adicionais, incorporação de fontes de dependência intra e entre unidades amostrais, dentre outras. Com relação aos métodos de estimação, desenvolvemos um procedimento baseado nas simulações de Monte Carlo via cadeias de Markov (MCMC). Mostramos que as distribuições condicionais completas possuem forma analítica conhecida e, além disso, são fáceis de se amostrar. Tal abordagem, apesar de demandar grande esforço computacional, contorna diversos problemas encontrados em outros procedimentos como: limitação no número de grupos envolvidos, quantidade de condições de avaliação, escolha de estruturas de dependência, assimetria dos traços latentes, imputação de dados, dentre outras. Além disso, através da metodologia MCMC, desenvolvemos uma estrutura de seleção de matrizes de covariâncias, através de um esquema de Monte Carlo via Cadeias de Markov de Saltos Reversíveis (RJMCMC). Estudos de simulação indicam que o modelo, o método de estimação e o método de seleção produzem resultados bastante satisfatórios. Também, robustez à escolha de prioris e valores iniciais foi observada. Os métodos de estimação desenvolvidos podem ser estendidos para diversas situações de interesse de um modo bem direto. Algumas das técnicas de diagnóstico estudadas permitem avaliar a qualidade do ajuste do modelo de um modo global. Outras medidas fornecem indícios de violação de suposições específicas, como ausência de normalidade para os traços latentes. Tal metodologia fornece meios concretos de se avaliar a qualidade do instrumento de medida (prova, questionário etc). Finalmente, a análise de um conjunto de dados real, utilizando-se alguns dos modelos abordados no presente trabalho, ilustra o potencial da tríade desenvolvida além de indicar um ganho na utilização dos modelos longitudinais da TRI na análise de ensaios educacionais com medidas repetidas em deterimento a suposição de independência. / In this work we proposed a bayesian framework, by using an augmented data scheme, to analyze longitudinal multiple groups models (LMGMIRT) in the Item Response Theory (IRT). Such framework consists in the following set : modelling, estimation methods and diagnostic tools to the LMGMIRT. Concerning the modelling, we exploited multivariate and multilevel structures in order to represent the hierarchical nature of the longitudinal multiple groupos model. This approach allows to consider several submodels such that: multiple groups and longitudinal one group models. We studied some positive and negative aspects of both above mentioned approches. The multivariate modelling allows to represent, in a straightforward way, many dependence structures. Furthermore it possibilities that many of them can be easily considered in the estimation process. This allows, for example, to consider an unstructured covariance matrix and, then, it allows to obtain information about the most appropritate dependece structure. On the other hand, the multilevel modelling permits to obtain: more straightforward interpretations of the model, the construction of univariate full conditional distributions, an easy way to include auxiliary information, the incorporation of within and between subjects (groups) sources of variability, among others. Concerning the estimation methods, we developed a procedure based on Monte Carlo Markov Chain (MCMC) simulation. We showed that the full conditional distributions are known and easy to sample from. Even though such approach demands a considerable amount of time it circumvents many problems such that: limitation in the number of groups that can be considered, the limitation in the number of instants of observation, the choice of covariance matrices, latent trait asymmetry, data imputation, among others. Furthermore, within the MCMC metodology, we developed a procedure to select covariance matrices, by using the so called Reversible Jump MCMC (RJMCMC). Simulation studies show that the model, the estimation method and the model selection procedure produce reasonable results. Also, the studies indicate that the developed metodology presents robustness concerning prior choice and different initial values choice. It is possible to extent the developed estimation methods to other situations in a straightforward way. Some diagnostics techniques that were studied allow to assess the model fit, in a global sense. Others techniques give directions toward the departing from some specific assumptions as the latent trait normality. Such methodology also provides ways to assess the quality of the test or questionaire used to measure the latent traits. Finally, by analyzing a real data set, using some of the models that were developed, it was possible to verify the potential of the methodology considered in this work. Furthermore, the results of this analysis indicate advantages in using longitudinal IRT models to model educational repeated measurement data instead of to assume independence.
45

Modelagem simultânea de média e dispersão e aplicações na pesquisa agronômica / Joint modeling of mean and dispersion and applications to agricultural research

Vieira, Afrânio Márcio Corrêa 10 February 2009 (has links)
Diversos delineamentos experimentais que são aplicados correntemente tomam como base experimentos agronômicos. Esses dados experimentais são, geralmente, analisados usando-se modelos que consideram uma variância residual constante (ou homogênea), como pressuposto inicial. Entretanto, esta pressuposição mostra-se relativamente forte quando se está diante de situações para as quais fatores ambientais ou externos exercem considerável influência nas medidas experimentais. Neste trabalho, são estudados modelos para a média e a variância, simultaneamente, com a variância estruturada de duas formas: (i) por meio de um preditor linear, que permite incorporar variáveis externas e fatores de ruído e (ii) por meio de efeitos aleatórios, que permitem acomodar tanto o efeito longitudinal quanto o efeito de superdispersão, no caso de medidas binárias repetidas no tempo. A classe de modelos lineares generalizados duplos (MLGD) foi aplicada a um estudo observacional que consistiu em medir a mortalidade de frangos de corte no fim da condição de espera pré-abate. Nesse problema, é forte a evidência de que alguns fatores influenciam a variabilidade, e consequentemente, diminuem a precisão das análises inferenciais. Outro problema agronômico relevante, associado à horticultura, são os experimentos de cultura de tecidos vegetais, em que o número de explantes que regeneram são contados. Como esse tipo de experimento apresenta um grande número de parâmetros a serem estimados, comparado ao tamanho da amostra, os modelos existente podem gerar estimativas questionáveis ou até levar a conclusões erroneas, uma vez esse que são baseados em grandes amostras para se fazer inferência estatística. Foi proposto um modelo linear generalizados duplo, para os dados de proporções, de uma perspectiva Bayesiana, visando a análise estatística sob pequenas amostras e a incorporação do conhecimento especialista no processo de estimação dos parâmetros. Um problema clínico, que envolve dados binários medidos repetidamente no tempo é apresentado e são propostos dois modelos que acomodam o efeito da superdispersão e a dependência longitudinal das medidas, utilizandos-se efeitos aleatórios. Foram obtidos resultados satisfatórios nos três problemas estudados. Os MLGD permitiram identificar os fatores associados à mortalidade das aves de corte, o que permitirá minimizar perdas e habilitar os processos de manejo, transporte e abate aos critérios de bem-estar animal e exigências da comunidade européia. O MLGD Bayesiano permitiu identificar o genótipo associado ao efeito de superdispersão, aumentando a precisão da inferência de seleção de variedades. Dois modelos combinados foram propostos logit-normal-Bernoulli-beta e o probit-normal-Bernoulli-beta, que acomodaram satisfatoriamente a superdispersão e a dependência longitudinal das medidas binárias. Esses resultados reforçam a importância de se modelar a média e a variância conjuntamente, o que aumenta a precisão na pesquisa agronômica, tanto em estudos experimentais quanto em estudos observacionais. / Several experimental designs that are currently applied are based on agricultural experiments. These experimental data are, usually, analised with statistical models that assume constant residual variance (or homogeneous), as basic assumption. However, this assumption shows hard to stand for, when environmental or external factors exert strong influence over the measurements. In this work, we study the joint modelling for the mean and the variance, the latter being structured on two ways: (i) through a linear predictor, which allows the incorporation of external variables and/or noise factors and (ii) by the use of random effects, that accommodate jointly the possible overdispersion effect and the dependence of longitudinal data in the case of binary measusurements taken over time. The class of double generalized linear models (DGLM) was applied to an observational study where the poultry mortality was measured in the preslaughter operations. With this situation, it can be observed that there is a strong influence from some environmental factors over the variability observed, and consequently, this reduces the precision of the inferential analysis. Another relevant agricultural problem, related to horticulture, is the tissue culture experiments, where the number of regenerated explants is counted. Usually, this kind of experiment use a large number of parameters to be estimated, when compared with the sample size. The current frequentist models are based on large samples for statistical inference and, under this experimental condition, can generate unreliable estimates or even lead to erroneous conclusions. A double generalized linear model was proposed to analyse proportion data, under the Bayesian perspective, which can be applied to small samples and can incorporate expert knowledge into the parameter estimation process. One clinical research, that measured binary data repeatedly through the time is presented and two models are proposed to fit the overdispersion effect and the dependence of longitudinal measurements, using random effects. It was obtained satisfactory results under these three problems studied. the DGLM allowed to identify factors associated with the poultry mortality, that will allow to minimize loss and improve the process, since the catching until lairage on slaughterhouse, agreeing with animal welfare criteria and the European community rules. The Bayesian DGLM allowed to identify the genotype associated with the overdispersion effect, increasing the precision on the inference about varieties selection. Two combined models were proposed, a logit-normal- Bernoulli-beta and a probit-normal-Bernoulli-beta, which have both addressed the overdispersion effect and the longitudinal dependence of the binary measurements. These results reinforce the importance to modelling mean and dispersion jointly, as a way to increase the precision of agricultural experimentation, be it on experimental studies or observational studies.
46

"Modelos lineares generalizados para análise de dados com medidas repetidas" / "Generalized linear models for repeated measures regression analysis"

Venezuela, Maria Kelly 04 July 2003 (has links)
Neste trabalho, apresentamos as equações de estimação generalizadas desenvolvidas por Liang e Zeger (1986), sob a ótica da teoria de funções de estimação apresentada por Godambe (1991). Essas equações de estimação são obtidas para os modelos lineares generalizados (MLGs) considerando medidas repetidas. Apresentamos também um processo iterativo para estimação dos parâmetros de regressão, assim como testes de hipóteses para esses parâmetros. Para a análise de resíduos, generalizamos para dados com medidas repetidas algumas técnicas de diagnóstico usuais em MLGs. O gráfico de probabilidade meio-normal com envelope simulado é uma proposta para avaliarmos a adequação do ajuste do modelo. Para a construção desse gráfico, simulamos respostas correlacionadas por meio de algoritmos que descrevemos neste trabalho. Por fim, realizamos aplicações a conjuntos de dados reais. / In this work, we consider the generalized estimation equations developed by Liang and Zeger (1986) focusing the theory of estimating functions presented by Godambe (1991). These estimation equations are an extension of generalized linear models (GLMs) to the analysis of repeated measurements. We present an iterative procedure to estimate the regression parameters as well as hypothesis testing of these parameters. For the residual analysis, we generalize to repeated measurements some diagnostic methods available for GLMs. The half-normal probability plot with a simulated envelope is useful for diagnosing model inadequacy and detecting outliers. To obtain this plot, we consider an algorithm for generating a set of nonnegatively correlated variables having a specified correlation structure. Finally, the theory is applied to real data sets.
47

Modelos não-lineares para dados longitudinais provenientes de experimentos em blocos casualizados abordagem bayesiana / Nonlinear models for longitudinal data from experiments in randomized block design a bayesian framework

Rocha, Everton Batista da 21 January 2011 (has links)
Dados consistindo de medidas repetidas tomadas em um mesmo indivíduo são muito comuns na agricultura e biologia. A modelagem de dados desta natureza usualmente envolve a caracterização da relação entre medidas repetidas e covariáveis. Em muitas aplicações, a relação proposta entre as medidas repetidas tem um comportamento não-linear nos parâmetros desconhecidos de interesse. Por exemplo, em estudo de crescimento de arvores, geralmente o comportamento da variável resposta e melhor descrito por um modelo não-linear nos parâmetros porque estes modelos caracterizam melhor a realidade dos fenômenos biológicos em estudo e porque e possvel uma interpretação biológica dos parâmetros. A presença de medidas repetidas em um indivíduo requer um cuidado particular na caracterização da variac~ao entre medidas dentro de uma mesma unidade experimental e entre unidades. Dados observados na mesma unidade experimental são correlacionados, e é provável que essa correlação decaia ao longo do tempo e que haja variações entre as medidas. Neste trabalho considera-se duas estruturas de covariâncias: erros aleatórios e independentes com media zero e variância 2, esta formulação não incorpora uma possível dependência entre as observações tomadas no mesmo indivíduo, que e comum em estudos longitudinais. Portanto, e importante ter modelos que acomodem a dependência (entre e dentre dos indivíduos) e a heterocedasticidade na sua formulação. Então, considerou-se outra estrutura de covariância, chamada não-estruturada, com a nulidade de permitir que os dados \"contribuam\" na estrutura da matriz de covariâncias. Neste trabalho analisou-se um delineamento em blocos casualizados assumindo um modelo bayesiano hierárquico de três estágios. No primeiro estagio, modelou-se a variação dentro do indivíduo, no segundo estagio a variação entre indivíduos. Este estágio da hierarquia da uma relação explícita entre os parâmetros aleatórios do modelo. No terceiro estagio foi incorporada a incerteza relativa as quantidades desconhecidas no modelo. Para a analise estatística, utilizou-se um conjunto de dados de um experimento conduzido pela Klabin Fabricadora de Papel e Celulose S.A., do Paraná, Brasil, envolvendo duas espécies de eucaliptos e espaçamentos 10 que foram completamente aleatorizados em blocos; em que a variável resposta, definida como o volume solido com casca, foi observada em 16 indivíduos, e quatro indivíduos foram aleatorizados para cada um dos quatro tratamentos. O modelo de Gompertz foi utilizado para representar o crescimento esperado das arvores de eucaliptos. Usando o modelo de Gompertz e possível ter uma interpretação biológica dos parâmetros. Considerando diferentes estruturas de covariância entre as observações, um programa para a analise de dados foi implementado no WinBUGS. / Data consisting of repeated measurements taken on each of a number of individual arise commonly in agricultural and biological applications. Modeling data of this kind usually involves the characterization of the relationship between the measured response and covariate. In many application,the proposed systematic relationship between the measured response is nonlinear in unknown parameters of interest. For example, in growing studies of trees, generally the behavior of the response variable over time is best described by a nonlinear model in the parameters of interest because this model characterizes better the reality of biological phenomenon in study and because is possible to do a biological interpretation of the parameters. The presence of repeated observations on an individual requires particular care in characterizing the random variation among measurements within a given individual and random variation among individuals. Likely the observations made on the same unit are correlated, probability decreasing over time and possible the variances are growth among the serial measurements. In this work we considerer two covariance structure namely: independent random error vectors whose elements are also independent with mean zero and variance 2, but this formulation does not incorporate possible dependence among the observation taken on the same subject neither that in longitudinal studies it is quite common to have the variances varying along the ordered dimension. Therefore, it is important to have models that allow for both dependences (within and between subjects) and also for heteroscedasticity in their formulations. Then we considerer other covariance structure namely: the structure is a non structure which permit that the data set \\tells\"about the covariance structure. In this work we analyzed a randomized block design assuming a three-stage Bayesian hierarchical model. On the rst stage, we model the intra-individual variation, on the second stage, we model the inter-individual variation. This stage of hierarchy gives an explicit relationship between the random parameters. On the third stage, we dene the hyperprior distribution to incorporate the uncertainty about the unknown parameters. For the statistical analysis we used a data set 12 from a experiment conducted at Klabin Fabricadora de Papel e Celulose S.A. from Parana, Brazil, involving two Eucalyptus species and two spacings in a complete randomized design; where the response variable, dened as the solid volume with bark, was evaluated for each of 16 subjects (groups of Eucalyptus trees), and four subjects were randomly assigned to one of four treatments. To represent the expected growing function of the Eucalyptus\'s tree Gompertz nonlinear model was used. Using the Gompertz nonlinear model is possible to a biological interpretation of the parameters. Considering dierent structures covariance within subjects, a program for the analysis of the data set was implemented in WinBUGS.
48

Estimating the longitudinal concordance correlation through fixed effects and variance components of polynomial mixed-effects regression model / Estimando a correlação de concordância longitudinal por meio de efeitos fixos e componentes de variâncias do modelo de regressão polinomial de efeitos mistos

Oliveira, Thiago de Paula 20 April 2018 (has links)
In the post-harvest area, a common approach to quantify the average color of fruits peel over time is the sampling of small number of points generally on its equatorial region using a colorimeter. However, when we use a colorimeter to classify an uneven-colored fruit misclassification may occur because points in the peel region may not be representative of average color of fruit. The main problem when we use this method is to determine the number of points to be sampled as well as the location of these points on the fruit\'s surface. An alternative method to evaluate measure of color is digital image analysis because it covers whole of the object surface, by using a sample of pixels taken from the image. As the colorimeter approach is faster and easier than image analysis, it may not be suitable for assessing the overall mean color of the papaya\'s peel and its performance will depend on the number of measured points and choice of sampled region. In this sense, the comparison between these approach is still necessary because we need to know if a sample on the equatorial region can reproduce a sample over the whole region, and if the colorimeter can compete with a scanner or digital camera in measuring the mean hue of papaya peel over time. Thus, we proposed a longitudinal concordance correlation (LCC) based on polynomial mixed-effects regression model to evaluate the extent of agreement among methods. The results show that ideally image analysis of whole fruit\'s region should be used to compute the mean hue and that the topography and curved surface of papaya fruit did not affect the mean hue obtained by the scanner. Since there are still no packages available to estimate the LCC in the free software environment R, we are developing a package called lcc, which provides functions for estimating the longitudinal concordance correlation (LCC) among methods based on variance components and fixed effects of polynomial mixed-effects model. Additionally, we implemented arguments in this function to estimating the longitudinal Pearson correlation (LPC), as precision measure, and longitudinal bias corrector factor (LA), as accuracy measure. Moreover, these components can be estimated using different structures for variance- covariance matrices of random effects and variance functions to model heteroscedasticity among within-group errors using or not the time as variance covariate. / No setor de pós-colheita é muito comum a utilização de colorímetros para avaliar a cor média da casca de frutos ao longo do tempo. No entanto, muitas vezes as técnicas de amostragem utilizando esse equipamento podem levar a medidas tendenciosas da média amostral. Alternativamente, a utilização de imagens digitais pode levar a um menor viés, uma vez que toda a região da casca do fruto é amostrada de forma sistemática. No entanto, ainda é necessária a comparação de ambas abordagens, pois o colorímetro tem vantagens em relação a facilidade de utilização e menor tempo para realizar a amostragem em cada fruto quando comparado a um scanner de mesa. Assim, no caso de variáveis respostas medidas em uma escala contínua, a reprodutibilidade das medidas tomadas por ambos equipamentos pode ser avaliada por meio do coeficiente de correlação de concordância. Dessa forma, para avaliar o perfil da concordância entre métodos, nós propomos uma correlação de concordância longitudinal (LCC), baseada em um modelo de regressão polinomial com efeitos mistos. Os resultados sugeriram que as técnicas por meio de imagens digitais devem ser utilizadas para a quantificação da tonalidade média de frutos. Adicionalmente, a partir do perfil de concordância estimado notamos que existe um período em que ambos os equipamentos podem ser utilizados. A performance do coeficiente de concordância longitudinal foi avaliada por meio de um estudo de simulação, o qual sugeriu que nossa metodologia é robusta a dados desbalanceados (\"dropout\") e que a probabilidade de convergência é aceitavel para uma amostra de 20 frutos e ideal para amostras a partir de 100 frutos. Uma vez que ainda não existem pacotes disponibilizados no ambiente computacional R para a estimação da correlação de concordância longitudinal, nós estamos desenvolvendo um pacote intitulado lcc, o qual será submetido ao \"Comprehensive R Archive Network\" (CRAN). Nesse pacote nós implementamos procedimentos para estimação da correlação de concordância longitudinal, da correlação de Person longitudinal e de uma medida de acurácia longitudinal. Além disso, nosso pacote foi desenvolvido para dados balanceados e desbalanceados, permitindo modelar a heteroscedasticidade entre erros dentro do grupo usando ou não o tempo como covariável, e, também, permitindo a inclusão de covariáveis no preditor linear para controlar variações sistemáticas na variável resposta.
49

"Modelos lineares generalizados para análise de dados com medidas repetidas" / "Generalized linear models for repeated measures regression analysis"

Maria Kelly Venezuela 04 July 2003 (has links)
Neste trabalho, apresentamos as equações de estimação generalizadas desenvolvidas por Liang e Zeger (1986), sob a ótica da teoria de funções de estimação apresentada por Godambe (1991). Essas equações de estimação são obtidas para os modelos lineares generalizados (MLGs) considerando medidas repetidas. Apresentamos também um processo iterativo para estimação dos parâmetros de regressão, assim como testes de hipóteses para esses parâmetros. Para a análise de resíduos, generalizamos para dados com medidas repetidas algumas técnicas de diagnóstico usuais em MLGs. O gráfico de probabilidade meio-normal com envelope simulado é uma proposta para avaliarmos a adequação do ajuste do modelo. Para a construção desse gráfico, simulamos respostas correlacionadas por meio de algoritmos que descrevemos neste trabalho. Por fim, realizamos aplicações a conjuntos de dados reais. / In this work, we consider the generalized estimation equations developed by Liang and Zeger (1986) focusing the theory of estimating functions presented by Godambe (1991). These estimation equations are an extension of generalized linear models (GLMs) to the analysis of repeated measurements. We present an iterative procedure to estimate the regression parameters as well as hypothesis testing of these parameters. For the residual analysis, we generalize to repeated measurements some diagnostic methods available for GLMs. The half-normal probability plot with a simulated envelope is useful for diagnosing model inadequacy and detecting outliers. To obtain this plot, we consider an algorithm for generating a set of nonnegatively correlated variables having a specified correlation structure. Finally, the theory is applied to real data sets.
50

Modelos longitudinais de grupos múltiplos multiníveis na teoria da resposta ao item: métodos de estimação e seleção estrutural sob uma perspectiva bayesiana / Longitudinal multiple groups multilevel models in the item response theory : estimation methods and structural selection under a bayesian perspective

Caio Lucidius Naberezny Azevedo 11 March 2008 (has links)
No presente trabalho propomos uma estrutura bayesiana, através de um esquema de dados aumentados, para analisar modelos longitudinais com grupos mútiplos (MLGMTRI) na Teoria da Resposta ao Item (TRI). Tal estrutura consiste na tríade : modelagem, métodos de estimação e métodos de diagnóstico para a classe de MLGMTRI. Na parte de modelagem, explorou-se as estruturas multivariada e multinível, com o intuito de representar a hierarquia existente em dados longitudinais com grupos múltiplos. Esta abordagem permite considerar várias classes de submodelos como: modelos de grupos múltiplos e modelos longitudinais de um único grupo. Estudamos alguns aspectos positivos e negativos de cada uma das supracitadas abordagens. A modelagem multivariada permite representar de forma direta estruturas de dependência, além de possibilitar que várias delas sejam facilmente incorporadas no processo de estimação. Isso permite considerar, por exemplo, uma matriz não estruturada e assim, obter indícios da forma mais apropriada para a estrutura de dependência. Por outro lado, a modelagem multinível propicia uma interpretação mais direta, obtenção de condicionais completas univariadas, fácil inclusão de informações adicionais, incorporação de fontes de dependência intra e entre unidades amostrais, dentre outras. Com relação aos métodos de estimação, desenvolvemos um procedimento baseado nas simulações de Monte Carlo via cadeias de Markov (MCMC). Mostramos que as distribuições condicionais completas possuem forma analítica conhecida e, além disso, são fáceis de se amostrar. Tal abordagem, apesar de demandar grande esforço computacional, contorna diversos problemas encontrados em outros procedimentos como: limitação no número de grupos envolvidos, quantidade de condições de avaliação, escolha de estruturas de dependência, assimetria dos traços latentes, imputação de dados, dentre outras. Além disso, através da metodologia MCMC, desenvolvemos uma estrutura de seleção de matrizes de covariâncias, através de um esquema de Monte Carlo via Cadeias de Markov de Saltos Reversíveis (RJMCMC). Estudos de simulação indicam que o modelo, o método de estimação e o método de seleção produzem resultados bastante satisfatórios. Também, robustez à escolha de prioris e valores iniciais foi observada. Os métodos de estimação desenvolvidos podem ser estendidos para diversas situações de interesse de um modo bem direto. Algumas das técnicas de diagnóstico estudadas permitem avaliar a qualidade do ajuste do modelo de um modo global. Outras medidas fornecem indícios de violação de suposições específicas, como ausência de normalidade para os traços latentes. Tal metodologia fornece meios concretos de se avaliar a qualidade do instrumento de medida (prova, questionário etc). Finalmente, a análise de um conjunto de dados real, utilizando-se alguns dos modelos abordados no presente trabalho, ilustra o potencial da tríade desenvolvida além de indicar um ganho na utilização dos modelos longitudinais da TRI na análise de ensaios educacionais com medidas repetidas em deterimento a suposição de independência. / In this work we proposed a bayesian framework, by using an augmented data scheme, to analyze longitudinal multiple groups models (LMGMIRT) in the Item Response Theory (IRT). Such framework consists in the following set : modelling, estimation methods and diagnostic tools to the LMGMIRT. Concerning the modelling, we exploited multivariate and multilevel structures in order to represent the hierarchical nature of the longitudinal multiple groupos model. This approach allows to consider several submodels such that: multiple groups and longitudinal one group models. We studied some positive and negative aspects of both above mentioned approches. The multivariate modelling allows to represent, in a straightforward way, many dependence structures. Furthermore it possibilities that many of them can be easily considered in the estimation process. This allows, for example, to consider an unstructured covariance matrix and, then, it allows to obtain information about the most appropritate dependece structure. On the other hand, the multilevel modelling permits to obtain: more straightforward interpretations of the model, the construction of univariate full conditional distributions, an easy way to include auxiliary information, the incorporation of within and between subjects (groups) sources of variability, among others. Concerning the estimation methods, we developed a procedure based on Monte Carlo Markov Chain (MCMC) simulation. We showed that the full conditional distributions are known and easy to sample from. Even though such approach demands a considerable amount of time it circumvents many problems such that: limitation in the number of groups that can be considered, the limitation in the number of instants of observation, the choice of covariance matrices, latent trait asymmetry, data imputation, among others. Furthermore, within the MCMC metodology, we developed a procedure to select covariance matrices, by using the so called Reversible Jump MCMC (RJMCMC). Simulation studies show that the model, the estimation method and the model selection procedure produce reasonable results. Also, the studies indicate that the developed metodology presents robustness concerning prior choice and different initial values choice. It is possible to extent the developed estimation methods to other situations in a straightforward way. Some diagnostics techniques that were studied allow to assess the model fit, in a global sense. Others techniques give directions toward the departing from some specific assumptions as the latent trait normality. Such methodology also provides ways to assess the quality of the test or questionaire used to measure the latent traits. Finally, by analyzing a real data set, using some of the models that were developed, it was possible to verify the potential of the methodology considered in this work. Furthermore, the results of this analysis indicate advantages in using longitudinal IRT models to model educational repeated measurement data instead of to assume independence.

Page generated in 0.0583 seconds