Made available in DSpace on 2016-06-02T20:04:53Z (GMT). No. of bitstreams: 1
6714.pdf: 1130315 bytes, checksum: 4ce881df9c6c0f6451cae6908855d277 (MD5)
Previous issue date: 2015-01-14 / Financiadora de Estudos e Projetos / We present a class of nonlinear truncated mixed-effects models where the truncation nature of the data is incorporated into the statistical model by assuming that the variable of interest, namely the truncated variable, follows a truncated distribution which, in turn, corresponds to a conditional distribution obtained by restricting the support of a given probability distribution function. The family of nonlinear truncated mixed-effects models for location and scale is constructed based on the perspective of nonlinear generalized mixed-effects models and by assuming that the distribution of response variable belongs to a truncated class of distributions indexed by a location and a scale parameter. The location parameter of the response variable is assumed to be associated with a continuous nonlinear function of covariates and unknown parameters and with unobserved random effects, and the scale parameter of the responses is assumed to be characterized by a continuous function of the covariates and unknown parameters. The proposed truncated nonlinear mixed-effects models are constructed assuming both random truncation limits; however, truncated nonlinear mixed-effects models with fixed known limits are readily obtained as particular cases of these models. For models constructed under the assumption of random truncation limits, the likelihood function of the observed data shall be a function both of the parameters of the truncated distribution of the truncated variable and of the parameters of the distribution of the truncation variables. For the particular case of fixed known truncation limits, the likelihood function of the observed data is a function only of the parameters of the truncated distribution assumed for the variable of interest. The likelihood equation resulting from the proposed truncated nonlinear regression models do not have analytical solutions and thus, under the frequentist inferential perspective, the model parameters are estimated by direct maximization of the log-likelihood using an iterative procedure. We also consider diagnostic analysis to check for model misspecification, outliers and influential observations using standardized residuals, and global and local influence metrics. Under the Bayesian perspective of statistical inference, parameter estimates are computed based on draws from the posterior distribution of parameters obtained using an Markov Chain Monte Carlo procedure. Posterior predictive checks, Bayesian standardized residuals and a Bayesian influence measures are considered to check for model adequacy, outliers and influential observations. As Bayesian model selection criteria, we consider the sum of log -CPO and a Bayesian model selection procedure using a Bayesian mixture model framework. To illustrate the proposed methodology, we analyze soil-water retention, which are used to construct soil-water characteristic curves and which are subject to truncation since soil-water content (the proportion of water in soil samples) is limited by the residual soil-water content and the saturated soil-water content. / Neste trabalho, apresentamos uma classe de modelos não lineares truncados mistos onde a característica de truncamento dos dados é incorporada ao modelo estatístico assumindo-se que a variável de interesse, isto é, a variável truncada, possui uma função de distribuição truncada que, por sua vez, corresponde a uma função de distribuição condicional obtida ao se restringir o suporte de alguma função de distribuição de probabilidade. A família de modelos não lineares truncados mistos para locação e escala é construída sob a perspectiva de modelos não lineares generalizados mistos e considerando uma classe de distribuições indexadas por parâmetros de locação e escala. Assumimos que o parâmetro de locação da variável resposta é associado a uma função não linear contínua de um conjunto de covariáveis e parâmetros desconhecidos e a efeitos aleatórios não observáveis, e que o parâmetro de escala das respostas pode ser caracterizado por uma função contínua das covariáveis e de parâmetros desconhecidos. Os modelos não lineares truncados mistos para locação e escala, aqui apresentados, são construídos supondo limites de truncamento aleatórios, porém, modelos não lineares truncados mistos com limites fixos e conhecidos são prontamente obtidos como casos particulares desses modelos. Nos modelos construídos sob a suposição de limites de truncamentos aleatórios, a função de verossimilhança é escrita em função dos parâmetros da distribuição da variável resposta truncada e dos parâmetros das distribuições das variáveis de truncamento. Para o caso particular de limites fixos e conhecidos, a função de verossimilhança será apenas uma função dos parâmetros da distribuição truncada assumida para a variável resposta de interesse. As equações de verossimilhança dos modelos, aqui propostos, não possuem soluções analíticas e, sob a perspectiva frequentista de inferência estatística, os parâmetros do modelo são estimados pela maximização direta da função de log-verossimilhança via um procedimento iterativo. Consideramos, também, uma análise de diagnóstico para verificar a adequação do modelo, observações discrepantes e/ou influentes, usando resíduos padronizados e medidas de influência global e influência local. Sob a perspectiva Bayesiana de inferência estatística, as estimativas dos parâmetros dos modelos propostos são definidas como as médias a posteriori de amostras obtidas via um algoritmo do tipo cadeia de Markov Monte Carlo das distribuições a posteriori dos parâmetros. Para a análise de diagnóstico Bayesiano do modelo, consideramos métricas de avaliação preditiva a posteriori, resíduos Bayesianos padronizados e a calibração de casos para diagnóstico de influência. Como critérios Bayesianos de seleção de modelos, consideramos a soma de log -CPO e um critério de seleção de modelos baseada na abordagem Bayesiana de mistura de modelos. Para ilustrar a metodologia proposta, analisamos dados de retenção de água em solo, que são usados para construir curvas de retenção de água em solo e que estão sujeitos a truncamento pois as medições de umidade de água (a proporção de água presente em amostras de solos) são limitadas pela umidade residual e pela umidade saturada do solo amostrado.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufscar.br:ufscar/4497 |
Date | 14 January 2015 |
Creators | Paraiba, Carolina Costa Mota |
Contributors | Diniz, Carlos Alberto Ribeiro |
Publisher | Universidade Federal de São Carlos, Programa de Pós-graduação em Estatística, UFSCar, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Format | application/pdf |
Source | reponame:Repositório Institucional da UFSCAR, instname:Universidade Federal de São Carlos, instacron:UFSCAR |
Rights | info:eu-repo/semantics/embargoedAccess |
Page generated in 0.003 seconds