Spelling suggestions: "subject:"análise dde regressão"" "subject:"análise dee regressão""
1 |
Metodos de diagnostico em regressão linear e sua extensão para o caso de mais de uma observação influente simultaneamenteNakamura, Paulo Hideo 30 July 1986 (has links)
Orientador : Jose Norberto W. Dachs / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação / Made available in DSpace on 2018-07-17T13:05:31Z (GMT). No. of bitstreams: 1
Nakamura_PauloHideo_M.pdf: 2985963 bytes, checksum: 55df21aedf312729944cf9bd5e3c509d (MD5)
Previous issue date: 1986 / Resumo: Em regressão linear, têm sido intensamente discutidas técnicas de diagnóstico que permitam detectar pontos que exercem forte influência no ajuste. Neste trabalho, estão descritas as medidas de diagnóstico comumente utilizados para quantificar a influência de pontos ou subconjunto de pontos. A identificação de pontos que sejam influentes individualmente é feita, sem grandes dificuldades, analisando as medidas de diagnóstico para cada observação. Um aspecto muito importante do problema é a identificação de mais de uma observação que, conjuntamente, sejam influentes e os problemas em detectar tais subconjuntos são discutidos. É apresentado um método gráfico proposto por Denby e Mallows para análise de resíduos, baseado em métodos robustos de ajuste. É desenvolvido um método gráfico, semelhante ao de Denby e Mallows, usando e adaptando uma conjetura de Huber, para deteção exploratória de subconjuntos de pontos influentes. Estes gráficos, denominados gráficos de diagnóstico, foram construídos para vários conjuntos de dados e se mostraram eficazes na identificação de subconjuntos. Após a deteção, pode-se usar o D de Cook múltiplo para uma análise formal / Abstract: In linear regression analysis several diagnostic technics have been extensively discussed. These technics are aimed at detecting points that may have a strong influence on the fitted model. In this work are discussed the most commonly used of these technics with enfasys on the methodology for detection of one or more points that may be simultaneously influential. The identification of Individual points that may be influential is done without major dificulties using diagnostic measures that are evaluated for each observation. A very important aspect of the problem emerges when the attempt is made to identify sets of several points that are simultaneously influential. A graphical method, proposed by Denby and Mallows for the analysis of residuals, based on robust methods of fitting is presented. With the use and adaptation or a conjecture of Huber a new graphical method, similar to the one of Denby and Mallows, is proposed for the exploratory detection of sets of potentially influential points. These dlagnostic plots were then computed and are present for several sets of data showing a very good potential in the detection of sets of influential points. After detection, Cook's multiple D, or other alternative technics can be use for more formal analysis / Mestrado / Mestre em Estatística
|
2 |
Teste de razão de verossimilhanças Bootstrap e técnicas de diagnóstico em modelos em séries de potências não-lineares generalizadosFORERO, Sébastien Lozano 25 June 2015 (has links)
Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-02-16T17:11:02Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
SébastienLozano_Mestrad.pdf: 855650 bytes, checksum: c3ce2f2482d9450aef7d2e6264b3f0e3 (MD5) / Made available in DSpace on 2016-02-16T17:11:02Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
SébastienLozano_Mestrad.pdf: 855650 bytes, checksum: c3ce2f2482d9450aef7d2e6264b3f0e3 (MD5)
Previous issue date: 2015-06-25 / FACEPE / Os Modelos em Série de Potência não-Lineares Generalizados (MSPNLGs), introduzidos
em Cordeiro et al. (2009), são apresentados como uma alternativa para a análise de regressão
de dados de contagem, generalizando os modelos tradicionais, como o Consul, Poisson
generalizada, binomial negativa generalizada, entre outros. Nesta dissertação, versões modificadas
(via Bartlett (1937) e Rocke (1989)) das estatísticas da razão de verosimilhanças e
razão de verossimilhanças bootstrap, respectivamente, são apresentadas para testes de hipóteses
nesta classe de modelos. Simulações de Monte Carlo mostram que os testes baseados nas
versões modificadas das estatísticas da razão de verossimilhanças e razão de verossimilhanças
bootstrap exibem melhores desempenhos em amostras finitas, superando os testes originais
(sem correção). Além disso, técnicas de diagnóstico são propostas para os MSPNLGs, a saber:
resíduos, alavancagem generalizada, influência global, e influência local. Finalmente, um
conjunto de dados reais é utilizando para avaliar as metodologias desenvolvidas tanto em
técnicas de diagnóstico como em aperfeiçoamento de testes. / The Power Series Generalized nonlinear Models (PSGNLMs), introduced in Cordeiro et al.
(2009), are presented as a prominent option to deal with counting regression models, generalizing
well known models as the Consul, the generalized Poisson and the generalized negative
binomial, among others. In this work, modified versions (via Bartlett (1937) and Rocke (1989))
of the likelihood ratio and bootstrap likelihood ratio test statistics, respectively, are presented
for hypothesis testing in this class of models. Monte Carlo simulations show that tests
based on modified versions of the likelihood test statistic exhibit better performance in finite
samples, exceeding the original tests (uncorrected). Furthermore, diagnostic techniques are
proposed for the MSPNLGs, namely: residuals, generalized leverage, global influence, and
local influence. Finally, a real data set is used in order to assess the developed techniques in
both areas, influence diagnostic and hypothesis testing.
|
3 |
Regressão simplex não linear: inferência e diagnósticoSILVA, Alisson de Oliveira 25 February 2015 (has links)
Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-02-19T18:18:56Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Alisson de Oliveira Silva.pdf: 1538683 bytes, checksum: e382c50b9af1c32b274b080f54fc0d61 (MD5) / Made available in DSpace on 2016-02-19T18:18:56Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Alisson de Oliveira Silva.pdf: 1538683 bytes, checksum: e382c50b9af1c32b274b080f54fc0d61 (MD5)
Previous issue date: 2015-02-25 / CMPQ / Em diversas situações práticas, sejam experimentais ou observacionais, há o interesse
em investigar como um conjunto de variáveis se relaciona com percentagens, taxas ou razões.
Dados restritos ao intervalo contínuo (0,1), em geral, exibem assimetria e possuem um padrão
específico de heteroscedasticidade, tornando o modelo normal linear inadequado. Nesse sentido,
uma classe de modelos de regressão beta foi proposta por Ferrari e Cribari–Neto (2004), em que
a média da variável resposta está relacionada com um preditor linear, através de uma função de
ligação, e o preditor linear envolve covariáveis e parâmetros desconhecidos. Uma alternativa
competitiva à distribuição beta é o modelo simplex proposto por Barndorff–Nielsen e Jorgensen
(1991). A distribuição simplex faz parte dos modelos de dispersão definidos por Jorgensen (1997)
que estendem os modelos lineares generalizados. Nesta dissertação, propomos uma extensão
do modelo de regressão simplex (Miyashiro, 2008), em que tanto a média da variável resposta
quanto o parâmetro de precisão estão relacionados às covariáveis por meio de preditores não
lineares. Apresentamos expressões em forma fechada para o vetor escore, matriz de informação
de Fisher e sua inversa. Desenvolvemos técnicas de diagnósticos para o modelo de regressão
simplex não linear baseadas no método de influência local (Cook, 1986), sob cinco esquemas
de perturbação. Além disso, propomos um resíduo para o modelo através do processo iterativo
escore de Fisher, e obtemos uma expressão matricial para a alavanca generalizada com base na
definição geral apresentada por Wei et al. (1998). Aplicações a dados reais e dados simulados
são apresentadas para ilustrar a teoria desenvolvida. / In many practical situations, whether experimental or observational, there is interest
in investigating how a set of variables relates to percentages, rates or fractions. Restricted
data to continuous interval (0.1), in general, exhibit asymmetry and have a specific pattern
of heteroscedasticity, making the normal linear model inappropriate. In this sense, a class of
beta regression models was proposed by Ferrari and Cribari–Neto (2004), in which the mean
response is related to a linear predictor through a link function, and the linear predictor includes
regressors and regression parameters. A useful alternative to the beta distribution is the simplex
model proposed by Barndorff–Nielsen and Jorgensen (1991). Simplex distribution is part of the
dispersion models defined by Jorgensen (1997) that extend generalized linear models. In this
paper, we propose an extension of the simplex regression model (Miyashiro, 2008), in which
both the mean response as the precision are related to covariates via non-linear predictors. We
provide closed-form expressions for the score function, for Fisher’s information matrix and its
inverse. Some diagnostic measures are introduced. We propose a new residual obtained using
Fisher’s scoring iterative scheme for the estimation of the parameters that index the regression
non-linear predictor to the mean response and numerically evaluate its behaviour. We also derive
the appropriate matrices for assessing local influence on the parameter estimates under diferent
perturbation schemes and provide closed-form to generalized leverage matrix proposed by Wei,
Hu and Fung (1998). Finally, applications using real and simulated data are presented and
discussed.
|
4 |
Teste de diagnóstico baseado em influência local aplicado ao modelo de regressão simplexSILVA, Fernanda Clotilde da 12 February 2016 (has links)
Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-07-08T18:52:48Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
dissertacao_final_branco.pdf: 2067159 bytes, checksum: 55486dfa00398f45d021d144db2756a2 (MD5) / Made available in DSpace on 2016-07-08T18:52:48Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
dissertacao_final_branco.pdf: 2067159 bytes, checksum: 55486dfa00398f45d021d144db2756a2 (MD5)
Previous issue date: 2016-02-12 / CAPES / O estudo de dados contínuos no intervalo (0; 1) vem crescendo bastante nesses últimos
anos. Na literatura destaca-se o modelo de regressão beta, proposto por Ferrari e Cribari-
Neto (2004), como um dos principais modelos para analisar esses tipos dados. No entanto,
para situações em que o ajuste do modelo beta não se torna adequado, surge uma contraproposta,
o uso do modelo de regressão simplex, apresentado por Song e Tan (2000), que
consiste em supor que a variável resposta possui uma distribuição simplex. Essa distribui
ção é derivada da distribuição Gaussiana inversa generalizada, e foi desenvolvida por
Barndor -Nielsen e Jørgensen (1991), sendo bastante estudada por Song e Tan (2000) e
Song et al. (2004), que apresentaram várias propriedades importantes dessa distribuição.
Entretanto, é possível haver casos em que o ajuste do modelo simplex também não seja
adequado, sendo assim, esse trabalho consiste em desenvolver um teste de diagnóstico
proposto, originalmente, por Zhu e Zhang (2004) para esse modelo. A construção do
teste é baseado no método de in uência local. Por meio de simulações de Monte Carlo
avaliamos o desempenho do teste, observando o tamanho e o poder em diversas situações.
Trabalhamos com os quantis empíricos da distribuição da estatística de teste, obtidos
via método bootstrap paramétrico. Finalmente, realizamos algumas aplicações do teste,
com dados reais e comparamos os resultados obtidos usando esse teste com os resultados
segundo outros métodos de diagnóstico, bastante conhecidos na literatura. / The study of continuous data in interval (0,1) has grown much in recent years, in literature
stands out the beta regression model, proposed by Ferrari and Cribari-Neto (2004), as one
of the models to analyze these data. The simplex regression model proposed by Song and
Tang (2000) based on simplex distribution is another option to modelling data on unit
interval. This distribution was developed by Barndor -Nielsen and Jørgensen (1991) and
was derived from the generalized inverse Gaussian distribution. Song and Tang (2000)
and Song et al. (2004) presented several important properties of this distribution. This
work consist in develop a diagnostic test originally proposed by Zhu and Zhang (2004) for
this model. The construction of the test is based on the local in uence method (Cook,
1986). We also propose a new test, based on bootstrap empirical distribution of the
original test statistic. The tests performance were evaluated based on size and/or power.
Finally, were performed some applications using real data and the results of bootstrap
test were compared with results obtained by other diagnostic methods well known in the
literature.
|
5 |
Bimodal Birnbaum-Saunders statistical modelingFONSECA, Rodney Vasconcelos 10 February 2017 (has links)
Submitted by Alice Araujo (alice.caraujo@ufpe.br) on 2018-05-07T20:51:11Z
No. of bitstreams: 1
DISSERTAÇÃO Rodney Vasconcelos Fonseca.pdf: 1724044 bytes, checksum: f051298f5271df8e920d0d7ac622e02a (MD5) / Made available in DSpace on 2018-05-07T20:51:12Z (GMT). No. of bitstreams: 1
DISSERTAÇÃO Rodney Vasconcelos Fonseca.pdf: 1724044 bytes, checksum: f051298f5271df8e920d0d7ac622e02a (MD5)
Previous issue date: 2017-02-10 / CNPQ / A distribuição Birnbaum-Saunders tem sido amplamente estudada na literatura, sendo utilizada para analisar diferentes tipos de dados, como tempo de vida de materias sujeitos à fadiga e quantidades referentes a poluição atmosférica, por exemplo. Essa distribuição foi estendida para modelos mais gerais por diversos autores. Essa dissertação é composta de dois capítulos principais e independentes. No primeiro trabalho, investigamos problemas relacionados com estimação por máxima verossimilhança em uma extensão bimodal da distribuição Birnbaum-Saunders. Propomos um esquema de penalização que, quando aplicado à função de log-verossimilhança, reduz bastante a frequência de falhas de convergência. Inferência através de testes de hipóteses baseada na função de log-verossimilhança penalizada é investigada. No segundo ensaio, desenvolvemos um modelo de regressão Birnbaum-Saunders bimodal. Discutimos sobre inferências por estimação pontual, estimação intervalar e testes de hipóteses. Também propomos dois resíduos e desenvolvemos análise de influência local. Intervalos de predição baseados em reamostragem bootstrap também são apresentados e diferentes critérios de seleção de modelos para o modelo proposto são discutidos. Adicionalmente, apresentamos resultados de simulação de Monte Carlo e algumas aplicações empíricas. / The Birnbaum-Saunders distribution has been widely studied in the literature, being used to analyze different kind of data, like the lifetime of objects being exposed to fatigue activity and quantities corresponding to air pollution, for example. It was also extended to more general settings by several authors. This dissertation is composed of two main and independent chap-ters. In the first work, we investigate problems related to maximum likelihood estimation in a bimodal extension of the Birnbaum-Saunders distribution. We propose a penalization scheme that, when applied to the log-likelihood function, greatly reduces the frequency of convergence failures. Hypothesis testing inference based on the penalized log-likelihood function is inves-tigated. In the second essay, we develop a bimodal Birnbaum-Saunders regression model. We discuss point estimation, interval estimation and hypothesis testing inference. We also pro-pose two residuals and develop local influence analyses. Bootstrap-based prediction intervals are also presented and different model selection criteria for the proposed model are discussed. Additionally, we present results from Monte Carlo simulations and from some empirical applications.
|
6 |
Nonnested hypothesis testing inference in regression models for rates and proportionsLEAL ALTURO, Olivia Lizeth 16 February 2017 (has links)
Submitted by Alice Araujo (alice.caraujo@ufpe.br) on 2018-05-07T21:17:28Z
No. of bitstreams: 1
DISSERTAÇÃO Olivia Lizeth Leal Alturo.pdf: 2450256 bytes, checksum: 8d29b676eaffcb3c5bc1b78a8611b9f8 (MD5) / Made available in DSpace on 2018-05-07T21:17:28Z (GMT). No. of bitstreams: 1
DISSERTAÇÃO Olivia Lizeth Leal Alturo.pdf: 2450256 bytes, checksum: 8d29b676eaffcb3c5bc1b78a8611b9f8 (MD5)
Previous issue date: 2017-02-16 / Existem diferentes modelos de regressão que podem ser usados para modelar taxas, proporções e outras variáveis respostas que assumem valores no intervalo unitário padrão, (0,1). Quando só uma classe de modelos de regressão é considerada, a seleção do modelos pode ser baseada nos testes de hipóteses usuais. O objetivo da presente dissertação é apresentar e avaliar numericamente os desempenhos em amostras imitas de testes que podem ser usados quando há dois ou mais modelos que são plausíveis, são não-encaixados e pertencem a classes de modelos de regressão distintas. Os modelos competidores podem diferir nos regressores que utilizam, nas funções de ligação e/ou na distribuição assumida para a variável resposta. Através de simulações de Monte Cario nós estimamos as taxas de rejeição nulas e não-nulas dos testes sob diversos cenários. Avaliamos também o desempenho de um procedimento de seleção de modelos. Os resultados mostram que os testes podem ser bastante úteis na escolha do melhor modelo de regressão quando a variável resposta assume valores no intervalo unitário padrão. / There are several different regression models that can be used with rates, proportions and other continuous responses that assume values in the standard unit interval, (0,1). When only one class of models is considered, model selection can be based on standard hypothesis testing inference. In this dissertation, we develop tests that can be used when the practitioner has at his/her disposal more than one plausible model, the competing models are nonnested and possibly belong to different classes of models. The competing models can differ in the regressors they use, in the link functions and even in the response distribution. The finite sample performances of the proposed tests are numerically eval-uated. We evaluate both the null and nonnull behavior of the tests using Monte Cario simulations. The results show that the tests can be quite useful for selecting the best regression model when the response assumes values in the standard unit interval.
|
7 |
Modelos não lineares parciais generalizados superdispersadosARAÚJO, Yuri Alves de 20 February 2017 (has links)
Submitted by Alice Araujo (alice.caraujo@ufpe.br) on 2018-05-07T22:34:45Z
No. of bitstreams: 1
DISSERTAÇÃO Yuri Alves de Araújo.pdf: 758815 bytes, checksum: d5dcd9d661e8145ae2ace6d8e4d10444 (MD5) / Made available in DSpace on 2018-05-07T22:34:45Z (GMT). No. of bitstreams: 1
DISSERTAÇÃO Yuri Alves de Araújo.pdf: 758815 bytes, checksum: d5dcd9d661e8145ae2ace6d8e4d10444 (MD5)
Previous issue date: 2017-02-20 / CAPES / Os modelos de regressão são amplamente utilizados quando desejamos avaliar o comportamento de uma ou mais características de interesse (variáveis respostas), em função de outras características observadas (variáveis explicativas). No entanto, os modelos usuais em geral são bastante restritivos e, naturalmente, ocorre uma busca por modelos cada vez mais flexíveis. Neste contexto, Dey et al. (1997) propõem uma classe de modelos lineares generalizados superdispersados, os quais tem a capacidade de controlar a vari-abilidade modelando também sua dispersão de forma independente de sua média. Por outro lado, classes de modelos semiparamétricos estão cada vez mais relevantes na literatura, visto que estes apresentam grande flexibilidade na relação entre a variável resposta e suas correspondentes variáveis explicativas. Nesta dissertação estendemos a classe de modelos superdispersados propostos por Dey et al. (1997) para o âmbito semiparamétrico, ao considerar que a média e a dispersão da variável resposta dependem de componentes paramétricos não lineares e de componentes não paramétricos. Propomos um processo de estimação conjunto dos parâmetros do modelo, e adicionalmente, um critério para a seleção dos parâmetros associados à suavidade das funções não paramétricas. Desenvolvemos técnicas de diagnóstico baseadas em medidas de alavancagem, análise de resíduos e influência local. Na análise de influência local, foram considerados três esquemas de perturbação: perturbação na variável resposta, perturbação nos preditores e ponderação de casos. Por fim, foram realizadas implementações computacionais das técnicas de diagnóstico com o auxilio do software R, as quais são relacionadas com propostas de aplicações práticas envolvendo análise de dados reais. / Regression models are widely used when we want to evaluate the behavior of one or more characteristics of interest (response variables), according to other observed charac-teristics (explanatory variables). However, usual models are so restrictive and, naturally, a search for models is becoming increasingly flexible. In this context, Dey et al. (1997) proposed a class of overdispersed generalized linear models, which has the capacity to controls variability the also modeling a dispersion independently of the mean. On the other hand, are increasingly relevant in literature, since they have great flexibility in the rela-tionship between the response variable and their corresponding explanatory variables. In this work, we extend to the class of models proposed by Dey et al. (1997) for semiparame-tric context, considering that the mean and the dispersion for response variable depend on nonlinear parametric components and nonparametric components. We propose the joint parameter estimation process, and in addition, a selection criteria for the smooth param-eters associated with nonparametric functions. We develop diagnostic techniques based on leverage measures, residuals analisys and local influence under different perturbation schemes. Finally, applications to real data are presented.
|
8 |
Modelos de regressão sob mistura de escala normal: um enfoque não paramétrico para a variável de misturaMATOS JÚNIOR, Francisco Jucelino 23 February 2017 (has links)
Submitted by Alice Araujo (alice.caraujo@ufpe.br) on 2018-05-07T23:10:11Z
No. of bitstreams: 1
DISSERTAÇÃO Francisco Jucelino Matos Júnior.pdf: 980212 bytes, checksum: 3dadbbaf0fdfb58f20bf3335dee9a4a1 (MD5) / Made available in DSpace on 2018-05-07T23:10:11Z (GMT). No. of bitstreams: 1
DISSERTAÇÃO Francisco Jucelino Matos Júnior.pdf: 980212 bytes, checksum: 3dadbbaf0fdfb58f20bf3335dee9a4a1 (MD5)
Previous issue date: 2017-02-23 / CNPQ / Martin e Han (2016) propuseram o modelo de regressão linear (MRL-MEN), utilizando o algoritmo Predicte Recursive (PR) para estimar a distribuição da variável aleatória de mistura, considerando o parâmetro de escala conhecido e igual a um. Nesta dissertação estendemos o trabalho desenvolvido por Martin e Han (2016) propondo o modelo de regressão não linear (MRL-MEN) cujo erro tem distribuição de mistura de escala normal (MEN) não especificando uma distribuição para a variável de mistura. A principal motivação em trabalhar com a subclasse de distribuições MEN, é que esta permite trabalhar com distribuições com caudas mais pesadas, uma vez que os estimadores de máxima verossimilhança dos parâmetros do modelo são menos sensíveis a observações atípicas. Especificamente, desenvolvemos um processo para estimar os parâmetros no MRNL-MEN, considerando o parâmetro de escala conhecido e igual a um. Além disso, baseado em duas abordagens apresentadas em Efron (1979) e Louis (1982), estimamos a matriz de variâncias e covariâncias para os estimadores do modelo abordado. Por meio de estudos de simulação, avaliamos empiricamente as propriedades assintóticas dos estimadores em vários cenários, como por exemplo, as estimativas dos parâmetros na presença de observações atípicas e analisamos um conjunto de dados reais por meio da metodologia desenvolvida. / Martin and Han (2016) proposed the linear regression model (LRM-SMN), using the Predictive Recursive (PR) algorithm to estimate the distribution of the mixing random variable, considering a scale parameter known and equal to one. In this present work, we extend the work developed by Martin and Han (2016) proposing the nonlinear regression model (NLRM-SMN) with a distribution error of a normal scale (SMN) not specifying a distribution for a mixture variable. The main motivation for working with the subclass of SMN, is that it allows practitioners to work with heavy tailed distributions, where maximum likelihood estimators of the model parameters are less sensitive to atypical observations. Specficaly, we developed a new estimation process to estimate the parameters in NLRM-SMN, considering known and equal to one. In addition, based on two approaches given in Efron (1979) and Louis (1982) we estimated the covariance matrix of the estimators of the model addressed. Through simulation studies, we evaluated empir-ically the asymptotic properties of the estimators in different scenarios, for example, the parameters estimates in the presence of outliers and analyzed a real data set through the developed methodology.
|
9 |
Inferência bootstrap em modelos de regressão betaLIMA, Fábio Pereira 23 February 2017 (has links)
Submitted by Alice Araujo (alice.caraujo@ufpe.br) on 2018-05-10T17:06:07Z
No. of bitstreams: 1
TESE Fabio Pereira Lima.pdf: 5026433 bytes, checksum: 608a6a35ae31e2257e95cb554d5c8f3f (MD5) / Made available in DSpace on 2018-05-10T17:06:08Z (GMT). No. of bitstreams: 1
TESE Fabio Pereira Lima.pdf: 5026433 bytes, checksum: 608a6a35ae31e2257e95cb554d5c8f3f (MD5)
Previous issue date: 2017-02-23 / CAPES / O método bootstrap, introduzido por Efron (1979), tornou-se uma importante ferramenta estatística para contornar problemas inferenciais em pequenas amostras ou quando a teoria assintótica é intratável, podendo ser utilizado, por exemplo, na construção de intervalos de confiança, para realizar correção de viés de estimadores e para realizar testes de hipóteses. Quando se trata da classe de modelos de regressão beta proposta em Ferrari e Cribari- Neto (2004), utilizada na modelagem de variáveis contínuas no intervalo (0,1), o método tem um importante papel na construção de intervalos de predição e na realização de testes de hipóteses. A presente tese tem como objetivo abordar os principais métodos bootstrap utilizados para realizar inferências sobre os parâmetros dessa classe de modelos, avaliando os desempenhos das principais variantes de tal método. Para tanto, inicialmente são expostas adaptações do método bootstrap tendo como objetivo a realização de testes de hipóteses encaixadas e não encaixadas. Nesse cenário, propomos uma versão bootstrap duplo rápido para os testes com o objetivo de obter maior precisão nos resultados sem alto custo computacional. Adicionalmente, um estudo sobre a construção de intervalos de predição em modelos de regressão beta é realizado. Levando em conta os métodos percentil e BCa adaptados em Espinheira et al. (2014), propomos uma adaptação do método t-bootstrap e as versões bootstrap duplo do mesmo e do método percentil. O desempenho de cada método é então avaliado na busca de determinar a melhor abordagem para cada situação. / Introduced by Efron (1979), the bootstrap became an important statistical tool, being used to overcome inference problems on small samples or when the asymptotic theory is intractable. The method can be used, for example, for constructing conhdence intervals, for performing bias correction of estimators and for carrying out hypothesis testing inference. In the beta regression model, proposed by Ferrari and Cribari-Neto (2004) which is used to model continuous variables in (0,1), the bootstrap method plays an important role in the construction of prediction intervals and hypothesis testing. This thesis deals with the use of bootstrap methods for perfoming statistical inference in beta regression models. We present adaptations of the bootstrap method for perfoming nested and nonnested hypothesis testing inference. Next, we propose fast double bootstrap variants of the tests in order to achieve more accurate inferences without the high computational cost required by the Standard double bootstrap. Additionally, a study of prediction intervals in the class of beta regression models is performed. We introduce f-bootstrap prediction interval and the double bootstrap versions of the percentil and f-bootstrap prediction intervals. The performance of each method is then evaluated in the quest to determine the best approach for each situation.
|
10 |
Essays on nonnormal regression modelingLUCENA, Sadraque Eneas de Figueiredo 10 February 2017 (has links)
Submitted by Alice Araujo (alice.caraujo@ufpe.br) on 2018-05-10T18:15:32Z
No. of bitstreams: 1
TESE Sadraque Eneas de Figueiredo Lucena.pdf: 1630044 bytes, checksum: d0b4d058618d8bbaa03e3e85a1c5a94a (MD5) / Made available in DSpace on 2018-05-10T18:15:32Z (GMT). No. of bitstreams: 1
TESE Sadraque Eneas de Figueiredo Lucena.pdf: 1630044 bytes, checksum: d0b4d058618d8bbaa03e3e85a1c5a94a (MD5)
Previous issue date: 2017-02-10 / CAPES / Na modelagem de dados por meio de regressão, há uma ampla variedade modelos que podem ser ajustados para avaliar a relação entre a variável resposta e os regressores. Em algumas situações, a modelagem pode envolver dois ou mais modelos com ajustes semelhantes, embora com especificações distintas. Quando nenhum dos modelos ajustados pode ser obtido por meio de restrições paramétricas impostas aos outros modelos, dizemos que eles são não-encaixados. Dois possíveis métodos para selecionar o mais adequado entre modelos lineares não-encaixados são os testes J e MJ. Nesta tese é apresentada uma adaptação desses testes para a classe de modelos denominada generalized additive models for location, scale and shape (GAMLSS). Evidências obtidas a partir de simulações de Monte Carlo em pequenas amostras e uma aplicação são reportadas. Também é apresentada uma abordagem paramétrica para o modelo de regressão simplex aumentado. Este modelo pode ser ajustado nos casos em que a variável resposta assume valores nos intervalos [0,1), (0,1] ou [0,1]. Aqui o modelo é chamado de modelo de regressão simplex inflacionado em zero e/ou um. Inferência, medidas de diagnóstico e uma aplicação também são apresentados. / In regression analysis a wide range of techniques can be used to investigate the relation-ship between the response and the regressors. In some situations, two or more competing models may fit the data equally well. When none of them can be obtained from the others by imposing parametric restrictions, we say the models are nonnested. In order to choose between competing nonnested linear regression models, one can use the J and MJ tests. In this PhD thesis we present an adaptation of such tests to nonnested models in the class of generalized additive models for location, scale and shape (GAMLSS). Monte Carlo evidence on the finite sample behaviour of the proposed tests and an application are reported. We also develop a frequentist approach to the augmented simplex regression model proposed by Bandyopadhyay, Galvis and Lachos [Bandyopadhyay, D., Galvis, D. M. & Lachos, V. H. (2014), ‘Augmented mixed models for clustered proportion data’, Statistical Methods in Medical Research (In Press)]. It can be used when the response assumes values in [0,1), (0,1] or [0,1] and we call it zero and/or one inflated simplex regression model. Inference, diagnostics measures and an application are also reported.
|
Page generated in 0.0885 seconds