Global ETD Search

1	Modelagem e Inferência em Regressão Beta Mariano Bayer, Fábio 31 January 2011 (has links) Made available in DSpace on 2014-06-12T18:01:37Z (GMT). No. of bitstreams: 2 arquivo6698_1.pdf: 1066555 bytes, checksum: db4d02aef759ceeda67e4d16ca74b282 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Esta tese aborda aspectos de modelagem e inferência em regressão beta, mais especificamente melhoramentos do teste de razão da verossimilhanças e proposição e investigação de critérios de seleção de modelos. O modelo de regressão beta foi proposto por Ferrari e Cribari-Neto [2004. Beta regression for modeling rates and proportions. J. Appl. Statist. 31, 799 815] para modelar variáveis contínuas no intervalo (0;1), como taxas e proporções. No primeiro capítulo, abordamos o problema de inferência em pequenas amostras. Focamos no melhoramento do teste da razão de verossimilhanças. Consideramos correções de segunda ordem para a estatística da razão de verossimilhanças em regressão beta em duas abordagens. Determinamos, por meio de uma abordagem matricial, o fator de correção de Bartlett e também uma correção de Bartlett Bootstrap. Comparamos os testes baseados nas estatísticas corrigidas com o teste da razão de verossimilhanças usual e com o teste que utiliza o ajuste de Skovgaard, que já está proposto na literatura. Os resultados numéricos evidenciam que as correções de Bartlett são mais acuradas do que a estatística não corrigida e do que o ajuste de Skovgaard. No segundo e terceiro capítulos, expandimos o modelo de regressão beta proposto por Ferrari e Cribari-Neto, considerando um modelo que assume que o parâmetro de dispersão, assim como o parâmetro de média, varia ao longo das observações e pode ser modelado por meio de uma estrutura de regressão. Com isso, surge o problema da seleção de variáveis, tanto para a estrutura da média quanto para a da dispersão. Esse assunto é tratado em dois capítulos independentes e auto-contidos, porém, ambos relacionados. No Capítulo 2 propomos critérios de seleção para modelos com dispersão variável e investigamos, por meio de simulação de Monte Carlo, os desempenhos destes e de outros critérios de seleção em amostras de tamanho finito. Percebemos que o processo de seleção conjunta de regressores para a média e para a dispersão não é uma boa prática e propomos um esquema de seleção em duas etapas. A seleção de modelos com o esquema proposto, além de requerer um menor custo computacional, apresentou melhor desempenho do que o método usual de seleção. Dentre os critérios investigados encontra-se o critério de informação de Akaike (AIC). O AIC é, sem dúvida, o critério mais conhecido e aplicado em diferentes classes de modelos. Baseados no AIC diversos critérios têm sido propostos, dentre eles o SIC, o HQ e o AICc. Com o objetivo de estimar o valor esperado da log-verossimilhança, que é uma medida de discrepância entre o modelo verdadeiro e o modelo candidato estimado, Akaike obtém o AIC como uma correção assintótica para a log-verossimilhança esperada. No entanto, em pequenas amostras, ou quando o número de parâmetros do modelo é grande relativamente ao tamanho amostral, o AIC se torna viesado e tende a selecionar modelos com alta dimensionalidade. Ao considerarmos uma estrutura de regressão também para o parâmetro de dispersão introduzimos um maior número de parâmetros a serem estimados no modelo. Isso pode diminuir o desempenho dos critérios de seleção quando o tamanho amostral é pequeno ou moderado. Para contornar esse problema propomos no Capítulo 3 novos critérios de seleção para serem usados em pequenas amostras, denominados bootstrap likelihood quasi-CV (BQCV) e sua modificação 632QCV. Comparamos os desempenhos dos critérios propostos, do AIC e de suas diversas variações que utilizam log-verossimilhança bootstrap por meio de um extensivo estudo de simulação. Os resultados numéricos evidenciam o bom desempenho dos critérios propostos AIC Ajustes para pequenas amostras Bootstrap Correção de Bartlett Critérios de seleção de modelos Dispersão variável Regressão beta Teste da razão de verossimilhanças
2	Contributions to the analysis of dispersed count data / Contribuições à análise de dados de contagem Ribeiro Junior, Eduardo Elias 18 February 2019 (has links) In many agricultural and biological contexts, the response variable is a nonnegative integer value which we wish to explain or analyze in terms of a set of covariates. Unlike the Gaussian linear model, the response variable is discrete with a distribution that places probability mass at natural numbers only. The Poisson regression is the standard model for count data. However, assumptions of this model forces the equality between mean and variance, which may be implausible in many applications. Motivated by experimental data sets, this work intended to develop more realistic methods for the analysis of count data. We proposed a novel parametrization of the COM-Poisson distribution and explored the regression models based on it. We extended the model to allow the dispersion, as well as the mean, depending on covariates. A set of count statistical models, namely COM-Poisson, Gamma-count, discrete Weibull, generalized Poisson, double Poisson and Poisson-Tweedie, was reviewed and compared, considering the dispersion, zero-inflation, and heavy tail indexes, together with the results of data analyzes. The computational routines developed in this dissertation were organized in two R packages available on GitHub. / Em diversos estudos agrícolas e biológicos, a variável resposta é um número inteiro não negativo que desejamos explicar ou analisar em termos de um conjunto de covariáveis. Diferentemente do modelo linear Gaussiano, a variável resposta é discreta com distribuição de probabilidade definida apenas em valores do conjunto dos naturais. O modelo Poisson é o modelo padrão para dados em forma de contagens. No entanto, as suposições desse modelo forçam que a média seja igual a variância, o que pode ser implausível em muitas aplicações. Motivado por conjuntos de dados experimentais, este trabalho teve como objetivo desenvolver métodos mais realistas para a análise de contagens. Foi proposta uma nova reparametrização da distribuição COM-Poisson e explorados modelos de regressão baseados nessa distribuição. Uma extensão desse modelo para permitir que a dispersão, assim como a média, dependa de covariáveis, foi proposta. Um conjunto de modelos para contagens, nomeadamente COM-Poisson, Gamma-count, Weibull discreto, Poisson generalizado, duplo Poisson e Poisson-Tweedie, foi revisado e comparado, considerando os índices de dispersão, inflação de zero e cauda pesada, juntamente com os resultados de análises de dados. As rotinas computacionais desenvolvidas nesta dissertação foram organizadas em dois pacotes R disponíveis no GitHub. Count data Dados de contagens Discrete probability models Dispersão variável Inferência baseada em verossimilhança Likelihood-based inference Modelos probabilísticos discretos Overdispersion Subdispersão Superdipersão Underdispersion Varying dispersion

Search results

Modelagem e Inferência em Regressão Beta

Contributions to the analysis of dispersed count data / Contribuições à análise de dados de contagem