• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 15
  • 8
  • 1
  • Tagged with
  • 24
  • 15
  • 12
  • 6
  • 6
  • 6
  • 5
  • 5
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Modelos paramétricos para séries temporais de contagem / Parametric models for count time series

Milhorança, Igor André 14 May 2014 (has links)
Diversas situações práticas exigem a análise de series temporais de contagem, que podem apresentar tendência, sazonalidade e efeitos de variáveis explicativas. A motivação do nosso trabalho é a análise de internações diárias por doenças respiratórias para pessoas com mais que 65 anos residentes no município de São Paulo. O efeito de variáveis climáticas e concentrações de poluentes foram incluídos nos modelos e foram usadas as funções seno e cosseno com periodicidade de um ano para explicar o padrão sazonal e obter os efeitos das variáveis climáticas e poluentes controlando essa sazonalidade. Outro aspecto a ser considerado é a inclusão da população nas análises de modo que a interpretação dos efeitos seja para as taxas diárias de internações. Diferentes modelos paramétricos foram propostos para as internações. O mais simples é o modelo de regressão linear para o logaritmo das taxas. Foram ajustados os modelos lineares generalizados (MLG) para as internações com função de ligação logaritmo e com a população como offset, por este modelo permitir o uso das distribuições Poisson e Binomial Negativa, usadas para dados de contagem. Devido à heteroscedasticidade extra, foram propostos modelos GAMLSS incluindo variáveis para explicar o desvio padrão. Foram ajustados modelos ARMA e GARMA, por incluírem uma estrutura de correlação serial. O objetivo desse trabalho é comparar as estimativas, os erros padrões, a cobertura dos intervalos de confiança e o erro quadrático médio para o valor predito segundo os vários modelos e a escolha do modelo mais apropriado, que depende da completa análise de resíduos, geralmente omitida na literatura. O modelo GARMA com distribuição Binomial Negativa apresentou melhor ajuste, pois os erros parecem seguir a distribuição proposta e tem baixa autocorrelação, além de ter tido uma boa cobertura pelo intervalo de confiança e um baixo erro quadrático médio. Também foi analisado o efeito da autocorrelação dos dados nas estimativas nos vários modelos baseado em dados simulados. / Many practical situations require the analysis of time series of counts, which may present trend, seasonality and effects of covariates. The motivation of this work is the analysis of daily hospital admissions for respiratory diseases in people over 65 living in the city of São Paulo. The effect of climatic variables and concentrations of pollutants were included in the models and the sine and cosine functions with annual period were included to explain the seasonal pattern and obtain the effects of pollutants and climatic variables partially controlled by this seasonality. Another aspect to be considered is the inclusion of the population in the analys es in order to interpret the effects based on daily hospitalization rates . Different parametric models have been proposed for hospitalizations. The simplest is the linear regression model for the logarithm of the hospitalization rate. The generalized linear models (GLM) were adjusted for daily admissions with logarithmic link function and the population as offset to consider the Poisson and Negative Binomial distributions for counting data. Due to the extra heteroscedasticity, GAMLSS models were proposed including variables to explain the standard error. Moreover, the ARMA and GARMA models were fitted to include the serial correlation structure. The aim of this work is to compare estimates, standard errors, coverage of confidence intervals and mean squared error of predicted value for the various models and choose the most appropriate model, which depends on a complete analysis of residuals, usually omitted in the literature. The GARMA model with Negative Binomial distribution was the best fit since the errors seem to follow the proposed distribution and they have small values of autocorrelation. Besides, this model had low mean squared error and a good coverage of confidence interval. The effect of autocorrelation of data in the estimates was also analyzed in the setting of several models based on simulated data.
2

Modelos paramétricos para séries temporais de contagem / Parametric models for count time series

Igor André Milhorança 14 May 2014 (has links)
Diversas situações práticas exigem a análise de series temporais de contagem, que podem apresentar tendência, sazonalidade e efeitos de variáveis explicativas. A motivação do nosso trabalho é a análise de internações diárias por doenças respiratórias para pessoas com mais que 65 anos residentes no município de São Paulo. O efeito de variáveis climáticas e concentrações de poluentes foram incluídos nos modelos e foram usadas as funções seno e cosseno com periodicidade de um ano para explicar o padrão sazonal e obter os efeitos das variáveis climáticas e poluentes controlando essa sazonalidade. Outro aspecto a ser considerado é a inclusão da população nas análises de modo que a interpretação dos efeitos seja para as taxas diárias de internações. Diferentes modelos paramétricos foram propostos para as internações. O mais simples é o modelo de regressão linear para o logaritmo das taxas. Foram ajustados os modelos lineares generalizados (MLG) para as internações com função de ligação logaritmo e com a população como offset, por este modelo permitir o uso das distribuições Poisson e Binomial Negativa, usadas para dados de contagem. Devido à heteroscedasticidade extra, foram propostos modelos GAMLSS incluindo variáveis para explicar o desvio padrão. Foram ajustados modelos ARMA e GARMA, por incluírem uma estrutura de correlação serial. O objetivo desse trabalho é comparar as estimativas, os erros padrões, a cobertura dos intervalos de confiança e o erro quadrático médio para o valor predito segundo os vários modelos e a escolha do modelo mais apropriado, que depende da completa análise de resíduos, geralmente omitida na literatura. O modelo GARMA com distribuição Binomial Negativa apresentou melhor ajuste, pois os erros parecem seguir a distribuição proposta e tem baixa autocorrelação, além de ter tido uma boa cobertura pelo intervalo de confiança e um baixo erro quadrático médio. Também foi analisado o efeito da autocorrelação dos dados nas estimativas nos vários modelos baseado em dados simulados. / Many practical situations require the analysis of time series of counts, which may present trend, seasonality and effects of covariates. The motivation of this work is the analysis of daily hospital admissions for respiratory diseases in people over 65 living in the city of São Paulo. The effect of climatic variables and concentrations of pollutants were included in the models and the sine and cosine functions with annual period were included to explain the seasonal pattern and obtain the effects of pollutants and climatic variables partially controlled by this seasonality. Another aspect to be considered is the inclusion of the population in the analys es in order to interpret the effects based on daily hospitalization rates . Different parametric models have been proposed for hospitalizations. The simplest is the linear regression model for the logarithm of the hospitalization rate. The generalized linear models (GLM) were adjusted for daily admissions with logarithmic link function and the population as offset to consider the Poisson and Negative Binomial distributions for counting data. Due to the extra heteroscedasticity, GAMLSS models were proposed including variables to explain the standard error. Moreover, the ARMA and GARMA models were fitted to include the serial correlation structure. The aim of this work is to compare estimates, standard errors, coverage of confidence intervals and mean squared error of predicted value for the various models and choose the most appropriate model, which depends on a complete analysis of residuals, usually omitted in the literature. The GARMA model with Negative Binomial distribution was the best fit since the errors seem to follow the proposed distribution and they have small values of autocorrelation. Besides, this model had low mean squared error and a good coverage of confidence interval. The effect of autocorrelation of data in the estimates was also analyzed in the setting of several models based on simulated data.
3

Modelos assimétricos inflacionados de zeros / Zero-inflated asymmetric models

Dias, Mariana Ferreira 28 November 2014 (has links)
A principal motivação desse estudo é a análise da quantidade de sangue recebido em transfusão (padronizada pelo peso) por crianças com problemas hepáticos. Essa quantidade apresenta distribuição assimétrica, além de valores iguais a zero para as crianças que não receberam transfusão. Os modelos lineares generalizados, usuais para variáveis positivas, não permitem a inclusão de zeros. Para os dados positivos, foram ajustados tais modelos com distribuição gama e normal inversa. Também foi considerado o modelo log-normal. A análise de resíduos padronizados indicou heterocedasticidade, e portanto a variabilidade extra foi modelada utilizando a classe de modelos GAMLSS. A terceira abordagem consiste em modelos baseados na mistura de zeros e distribuições para valores positivos, incluídos recentemente na família dos modelos GAMLSS. Estes aliam a distribuição assimétrica para os dados positivos e a probabilidade da ocorrência de zeros. Na análise dos dados de transfusão, observa-se que a distribuição normal inversa apresentou melhor ajuste por acomodar dados com forte assimetria em relação às demais distribuições consideradas. Foram significativos os efeitos das variáveis explicativas Kasai (ocorrência de operação prévia) e PELD (nível de uma medida da gravidade do paciente com 4 níveis) assim como os efeitos de interação sobre a média e variabilidade da quantidade de sangue recebida. A possibilidade de acrescentar efeitos de variáveis explicativas para modelar o parâmetro de dispersão, permite que a variabilidade extra, além de sua dependência da média, seja melhor explicada e melhore o ajuste do modelo. A probabilidade de não receber transfusão depende de modo significativo somente de PELD. A proposta de um só modelo que alia a presença de zeros e diversas distribuições assimétricas facilita o ajuste dos dados e a análise de resíduos. Seus resultados são equivalentes à abordagem em que a ocorrência ou não de transfusão é analisada por meio de modelo logístico independente da modelagem dos dados positivos com distribuições assimétricas. / The main motivation of this study is to analyze the amount of blood transfusions received (by weight) of children with liver problems. This amount shows asymmetric distribution as well as present zero values for children who did not receive transfusions. The usual generalized linear models for positive variables do not allow the inclusion of zeros. For positive data, such models with gamma and inverse normal distributions were fitted in this study. Log-normal distribution was also considered. Analysis of the standardized residuals indicated heterocedasticity and therefore the extra variability was modelled using GAMLSS. The third approach consists of models based on a mixture of zeros and distributions for positive values, also recently included in the family of GAMLSS models. These models combine the asymmetric distribution of positive data and the probability of occurrence of zeros. In the data analysis of transfusion, the inverse normal distribution showed better goodness of fit to allow adjustment of data with greater asymmetry than the other distributions considered. The effects of the explanatory variables Kasai (occurrence of previous operation) and PELD level (a measure of the severity of the patient with 4 levels) and interaction effects on the mean and variability of the amount of blood received were signicant. The inclusion of explanatory variables to model the dispersion parameter, allows to model the extra variability, beyond its dependence on the average, and improves fitness of the model. The probability of not receiving transfusion depends signicantly only PELD. The proposal of a unified model that combines the presence of zeros and several asymmetric distributions greatly facilitates the fitness of the model and the evaluation of fitness. An advantage is the equivalence between this model and a separate logistic model to for the probability of the occurrence of transfusion and a model for the positive skewed data.
4

Modelos assimétricos inflacionados de zeros / Zero-inflated asymmetric models

Mariana Ferreira Dias 28 November 2014 (has links)
A principal motivação desse estudo é a análise da quantidade de sangue recebido em transfusão (padronizada pelo peso) por crianças com problemas hepáticos. Essa quantidade apresenta distribuição assimétrica, além de valores iguais a zero para as crianças que não receberam transfusão. Os modelos lineares generalizados, usuais para variáveis positivas, não permitem a inclusão de zeros. Para os dados positivos, foram ajustados tais modelos com distribuição gama e normal inversa. Também foi considerado o modelo log-normal. A análise de resíduos padronizados indicou heterocedasticidade, e portanto a variabilidade extra foi modelada utilizando a classe de modelos GAMLSS. A terceira abordagem consiste em modelos baseados na mistura de zeros e distribuições para valores positivos, incluídos recentemente na família dos modelos GAMLSS. Estes aliam a distribuição assimétrica para os dados positivos e a probabilidade da ocorrência de zeros. Na análise dos dados de transfusão, observa-se que a distribuição normal inversa apresentou melhor ajuste por acomodar dados com forte assimetria em relação às demais distribuições consideradas. Foram significativos os efeitos das variáveis explicativas Kasai (ocorrência de operação prévia) e PELD (nível de uma medida da gravidade do paciente com 4 níveis) assim como os efeitos de interação sobre a média e variabilidade da quantidade de sangue recebida. A possibilidade de acrescentar efeitos de variáveis explicativas para modelar o parâmetro de dispersão, permite que a variabilidade extra, além de sua dependência da média, seja melhor explicada e melhore o ajuste do modelo. A probabilidade de não receber transfusão depende de modo significativo somente de PELD. A proposta de um só modelo que alia a presença de zeros e diversas distribuições assimétricas facilita o ajuste dos dados e a análise de resíduos. Seus resultados são equivalentes à abordagem em que a ocorrência ou não de transfusão é analisada por meio de modelo logístico independente da modelagem dos dados positivos com distribuições assimétricas. / The main motivation of this study is to analyze the amount of blood transfusions received (by weight) of children with liver problems. This amount shows asymmetric distribution as well as present zero values for children who did not receive transfusions. The usual generalized linear models for positive variables do not allow the inclusion of zeros. For positive data, such models with gamma and inverse normal distributions were fitted in this study. Log-normal distribution was also considered. Analysis of the standardized residuals indicated heterocedasticity and therefore the extra variability was modelled using GAMLSS. The third approach consists of models based on a mixture of zeros and distributions for positive values, also recently included in the family of GAMLSS models. These models combine the asymmetric distribution of positive data and the probability of occurrence of zeros. In the data analysis of transfusion, the inverse normal distribution showed better goodness of fit to allow adjustment of data with greater asymmetry than the other distributions considered. The effects of the explanatory variables Kasai (occurrence of previous operation) and PELD level (a measure of the severity of the patient with 4 levels) and interaction effects on the mean and variability of the amount of blood received were signicant. The inclusion of explanatory variables to model the dispersion parameter, allows to model the extra variability, beyond its dependence on the average, and improves fitness of the model. The probability of not receiving transfusion depends signicantly only PELD. The proposal of a unified model that combines the presence of zeros and several asymmetric distributions greatly facilitates the fitness of the model and the evaluation of fitness. An advantage is the equivalence between this model and a separate logistic model to for the probability of the occurrence of transfusion and a model for the positive skewed data.
5

Extensões do Modelo Potência Normal / Power Normal Model extensions

Siroky, Andressa Nunes 29 March 2019 (has links)
Em análise de dados que apresentam certo grau de assimetria, curtose ou bimodalidade, a suposição de normalidade não é válida, sendo necessários modelos que capturem estas características dos dados. Neste contexto, uma nova classe de distribuições bimodais assimétricas gerada por um mecanismo de mistura é proposta neste trabalho. Algumas propriedades para o caso particular que inclui a distribuição normal como família base desta classe são estudadas e apresentadas, tal caso resulta no chamado Modelo Mistura de Potência Normal (MPN). Dois algoritmos de simulação são desenvolvidos com a finalidade de obter variáveis aleatórias com esta distribuição. A abordagem frequentista é empregada para a inferência dos parâmetros do modelo proposto. São realizados estudos de simulação com o objetivo de avaliar o comportamento das estimativas de máxima verossimilhança dos parâmetros. Adicionalmente, um modelo de regressão para dados bimodais é proposto, utilizando a distribuição MPN como variável resposta nos modelos Generalizados Aditivos para Posição, Escala e Forma, cuja sigla em inglês é GAMLSS. Para este modelo de regressão estudos de simulação também são realizados. Em ambos os casos estudados, o modelo proposto é ilustrado utilizando um conjunto de dados reais referente à pontuação de jogadores na Super Liga Brasileira de Voleibol Masculino 2014/2015. Com relação a este conjunto de dados, o modelo MPN apresenta melhor ajuste quando comparado à modelos já existentes na literatura para dados bimodais. / In analysis of data that present a certain degree of asymmetry, kurtosis or bimodality, the assumption of normality is not valid and models that capture these characteristics of the data are required. In this context, a new class of bimodal asymmetric distributions generated by a mixture mechanism is proposed. Some properties for the particular case that includes the normal distribution as the base family of this class are studied and presented, such case results in the so-called Power Normal Mixture Model. Two simulation algorithms are developed with the purpose of obtaining random variables with this new distribution. The frequentist approach is used to the inference of the model parameters. Simulation studies are carried out with the aim of assessing the behavior of the maximum likelihood estimates of the parameters. In addition, the power normal mixture distribution is introduced as the response variable for the Generalized Additives Models for Location, Scale and Shape (GAMLSS). For this regression model, simulation studies are also performed. In both cases studied, the proposed model is illustrated using a data set on players\' scores in the Male Brazilian Volleyball Superliga 2014/2015. With respect to this dataset, the power normal mixture model presents better fit when compared to models already existing in the literature to bimodal data.
6

New flexible parametric and semiparametric models for survival analysis / Novos modelos flexíveis paramétricos e semi-paramétricos para análise de sobrevivência

Ramires, Thiago Gentil 20 April 2017 (has links)
In this work was proposed a new distributions, called log-sinh Cauchy, with has bimodal shapes and can be used as alternative to the mixture models. Based in the proposed distribution, the following models were proposed: Regression model based in the GAMLSS framework; models with cure rate based in the mixture and promotion time models; semiparametric models, modeling the parameters using penalized splies; semiparametric models, using the penalized splines to model the non-linear effects present in the cure rate. For all proposed models, the computational codes were implemented in the R software, with is available along of the document as well as some brief introduction on how to use them. / Nesse trabalho foi proposto uma nova distribuição, denominada de exponentiated log-sinh Cauchy, a qual possui densidades bimodais e pode ser utilizada como alternativa aos modelos de mistura. Com base na nova distribuição, foram propostos: modelos de regressão baseados nos modelos GAMLSS; modelos com fração de cura baseados em modelos de mistura e tempo de promoção; modelo semi-paramétrico modelando os parâmetros com splines penalizados; modelo semi-paramétrico com fração de cura utilizando splines para modelar efeitos não lineares na proporção de curados. Para todos os modelos propostos, toda parte computacional foi implementada no software R, sendo disponibilizada ao longo do documento assim como breve descrições de uso.
7

Modelo linear parcial generalizado simétrico / Linear Model Partial Generalized Symmetric

Vasconcelos, Julio Cezar Souza 06 February 2017 (has links)
Neste trabalho foi proposto o modelo linear parcial generalizado simétrico, com base nos modelos lineares parciais generalizados e nos modelos lineares simétricos, em que a variável resposta segue uma distribuição que pertence à família de distribuições simétricas, considerando um preditor linear que possui uma parte paramétrica e uma não paramétrica. Algumas distribuições que pertencem a essa classe são as distribuições: Normal, t-Student, Exponencial potência, Slash e Hiperbólica, dentre outras. Uma breve revisão dos conceitos utilizados ao longo do trabalho foram apresentados, a saber: análise residual, influência local, parâmetro de suavização, spline, spline cúbico, spline cúbico natural e algoritmo backfitting, dentre outros. Além disso, é apresentada uma breve teoria dos modelos GAMLSS (modelos aditivos generalizados para posição, escala e forma). Os modelos foram ajustados utilizando o pacote gamlss disponível no software livre R. A seleção de modelos foi baseada no critério de Akaike (AIC). Finalmente, uma aplicação é apresentada com base em um conjunto de dados reais da área financeira do Chile. / In this work we propose the symmetric generalized partial linear model, based on the generalized partial linear models and symmetric linear models, that is, the response variable follows a distribution that belongs to the symmetric distribution family, considering a linear predictor that has a parametric and a non-parametric component. Some distributions that belong to this class are distributions: Normal, t-Student, Power Exponential, Slash and Hyperbolic among others. A brief review of the concepts used throughout the work was presented, namely: residual analysis, local influence, smoothing parameter, spline, cubic spline, natural cubic spline and backfitting algorithm, among others. In addition, a brief theory of GAMLSS models is presented (generalized additive models for position, scale and shape). The models were adjusted using the package gamlss available in the free R software. The model selection was based on the Akaike criterion (AIC). Finally, an application is presented based on a set of real data from Chile\'s financial area.
8

Uso dos métodos clássico e bayesiano para os modelos não-lineares heterocedásticos simétricos / Use of the classical and bayesian methods for nonlinear heterocedastic symmetric models

Macêra, Márcia Aparecida Centanin 21 June 2011 (has links)
Os modelos normais de regressão têm sido utilizados durante muitos anos para a análise de dados. Mesmo nos casos em que a normalidade não podia ser suposta, tentava-se algum tipo de transformação com o intuito de alcançar a normalidade procurada. No entanto, na prática, essas suposições sobre normalidade e linearidade nem sempre são satisfeitas. Como alternativas à técnica clássica, foram desenvolvidas novas classes de modelos de regressão. Nesse contexto, focamos a classe de modelos em que a distribuição assumida para a variável resposta pertence à classe de distribuições simétricas. O objetivo geral desse trabalho é a modelagem desta classe no contexto bayesiano, em particular a modelagem da classe de modelos não-lineares heterocedásticos simétricos. Vale ressaltar que esse trabalho tem ligação com duas linhas de pesquisa, a saber: a inferência estatística abordando aspectos da teoria assintótica e a inferência bayesiana considerando aspectos de modelagem e critérios de seleção de modelos baseados em métodos de simulação de Monte Carlo em Cadeia de Markov (MCMC). Uma primeira etapa consiste em apresentar a classe dos modelos não-lineares heterocedásticos simétricos bem como a inferência clássica dos parâmetros desses modelos. Posteriormente, propomos uma abordagem bayesiana para esses modelos, cujo objetivo é mostrar sua viabilidade e comparar a inferência bayesiana dos parâmetros estimados via métodos MCMC com a inferência clássica das estimativas obtidas por meio da ferramenta GAMLSS. Além disso, utilizamos o método bayesiano de análise de influência caso a caso baseado na divergência de Kullback-Leibler para detectar observações influentes nos dados. A implementação computacional foi desenvolvida no software R e para detalhes dos programas pode ser consultado aos autores do trabalho / The normal regression models have been used for many years for data analysis. Even in cases where normality could not be assumed, was trying to be some kind of transformation in order to achieve the normality sought. However, in practice, these assumptions about normality and linearity are not always satisfied. As alternatives to classical technique new classes of regression models were developed. In this context, we focus on the class of models in which the distribution assumed for the response variable belongs to the symmetric distributions class. The aim of this work is the modeling of this class in the bayesian context, in particular the modeling of the nonlinear models heteroscedastic symmetric class. Note that this work is connected with two research lines, the statistical inference addressing aspects of asymptotic theory and the bayesian inference considering aspects of modeling and criteria for models selection based on simulation methods Monte Carlo Markov Chain (MCMC). A first step is to present the nonlinear models heteroscedastic symmetric class as well as the classic inference of parameters of these models. Subsequently, we propose a bayesian approach to these models, whose objective is to show their feasibility and compare the estimated parameters bayesian inference by MCMC methods with the classical inference of the estimates obtained by GAMLSS tool. In addition, we use the bayesian method of influence analysis on a case based on the Kullback-Leibler divergence for detecting influential observations in the data. The computational implementation was developed in the software R and programs details can be found at the studys authors
9

Modelo linear parcial generalizado simétrico / Linear Model Partial Generalized Symmetric

Julio Cezar Souza Vasconcelos 06 February 2017 (has links)
Neste trabalho foi proposto o modelo linear parcial generalizado simétrico, com base nos modelos lineares parciais generalizados e nos modelos lineares simétricos, em que a variável resposta segue uma distribuição que pertence à família de distribuições simétricas, considerando um preditor linear que possui uma parte paramétrica e uma não paramétrica. Algumas distribuições que pertencem a essa classe são as distribuições: Normal, t-Student, Exponencial potência, Slash e Hiperbólica, dentre outras. Uma breve revisão dos conceitos utilizados ao longo do trabalho foram apresentados, a saber: análise residual, influência local, parâmetro de suavização, spline, spline cúbico, spline cúbico natural e algoritmo backfitting, dentre outros. Além disso, é apresentada uma breve teoria dos modelos GAMLSS (modelos aditivos generalizados para posição, escala e forma). Os modelos foram ajustados utilizando o pacote gamlss disponível no software livre R. A seleção de modelos foi baseada no critério de Akaike (AIC). Finalmente, uma aplicação é apresentada com base em um conjunto de dados reais da área financeira do Chile. / In this work we propose the symmetric generalized partial linear model, based on the generalized partial linear models and symmetric linear models, that is, the response variable follows a distribution that belongs to the symmetric distribution family, considering a linear predictor that has a parametric and a non-parametric component. Some distributions that belong to this class are distributions: Normal, t-Student, Power Exponential, Slash and Hyperbolic among others. A brief review of the concepts used throughout the work was presented, namely: residual analysis, local influence, smoothing parameter, spline, cubic spline, natural cubic spline and backfitting algorithm, among others. In addition, a brief theory of GAMLSS models is presented (generalized additive models for position, scale and shape). The models were adjusted using the package gamlss available in the free R software. The model selection was based on the Akaike criterion (AIC). Finally, an application is presented based on a set of real data from Chile\'s financial area.
10

Uso dos métodos clássico e bayesiano para os modelos não-lineares heterocedásticos simétricos / Use of the classical and bayesian methods for nonlinear heterocedastic symmetric models

Márcia Aparecida Centanin Macêra 21 June 2011 (has links)
Os modelos normais de regressão têm sido utilizados durante muitos anos para a análise de dados. Mesmo nos casos em que a normalidade não podia ser suposta, tentava-se algum tipo de transformação com o intuito de alcançar a normalidade procurada. No entanto, na prática, essas suposições sobre normalidade e linearidade nem sempre são satisfeitas. Como alternativas à técnica clássica, foram desenvolvidas novas classes de modelos de regressão. Nesse contexto, focamos a classe de modelos em que a distribuição assumida para a variável resposta pertence à classe de distribuições simétricas. O objetivo geral desse trabalho é a modelagem desta classe no contexto bayesiano, em particular a modelagem da classe de modelos não-lineares heterocedásticos simétricos. Vale ressaltar que esse trabalho tem ligação com duas linhas de pesquisa, a saber: a inferência estatística abordando aspectos da teoria assintótica e a inferência bayesiana considerando aspectos de modelagem e critérios de seleção de modelos baseados em métodos de simulação de Monte Carlo em Cadeia de Markov (MCMC). Uma primeira etapa consiste em apresentar a classe dos modelos não-lineares heterocedásticos simétricos bem como a inferência clássica dos parâmetros desses modelos. Posteriormente, propomos uma abordagem bayesiana para esses modelos, cujo objetivo é mostrar sua viabilidade e comparar a inferência bayesiana dos parâmetros estimados via métodos MCMC com a inferência clássica das estimativas obtidas por meio da ferramenta GAMLSS. Além disso, utilizamos o método bayesiano de análise de influência caso a caso baseado na divergência de Kullback-Leibler para detectar observações influentes nos dados. A implementação computacional foi desenvolvida no software R e para detalhes dos programas pode ser consultado aos autores do trabalho / The normal regression models have been used for many years for data analysis. Even in cases where normality could not be assumed, was trying to be some kind of transformation in order to achieve the normality sought. However, in practice, these assumptions about normality and linearity are not always satisfied. As alternatives to classical technique new classes of regression models were developed. In this context, we focus on the class of models in which the distribution assumed for the response variable belongs to the symmetric distributions class. The aim of this work is the modeling of this class in the bayesian context, in particular the modeling of the nonlinear models heteroscedastic symmetric class. Note that this work is connected with two research lines, the statistical inference addressing aspects of asymptotic theory and the bayesian inference considering aspects of modeling and criteria for models selection based on simulation methods Monte Carlo Markov Chain (MCMC). A first step is to present the nonlinear models heteroscedastic symmetric class as well as the classic inference of parameters of these models. Subsequently, we propose a bayesian approach to these models, whose objective is to show their feasibility and compare the estimated parameters bayesian inference by MCMC methods with the classical inference of the estimates obtained by GAMLSS tool. In addition, we use the bayesian method of influence analysis on a case based on the Kullback-Leibler divergence for detecting influential observations in the data. The computational implementation was developed in the software R and programs details can be found at the studys authors

Page generated in 0.0144 seconds