• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 6
  • Tagged with
  • 6
  • 6
  • 6
  • 6
  • 6
  • 6
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Influência local com procura \"forward\" em modelos de regressão linear / Local influence with forward search in linear regression models

Bustamante, Juan Pablo Mamani 25 February 2015 (has links)
A identificação de observações influentes e/ou aberrantes de um conjunto de dados é conhecida como uma parte das análises de diagnóstico. Esta técnica de diagnóstico têm como uma das finalidades verificar a robustez de um modelo estatístico, pois a não identificação dos dados influentes pode afetar a análise ou obter resultados incorretos. As metodologias comumente utilizadas para o diagnóstico de observações influentes em modelos de regressão são métodos de influência global (Belsey et al., 1980). Cook (1986) introduziu um método geral para avaliar a influência local de pequenas perturbações no modelo estatístico ou nos dados, usando diferentes tipos de perturbações. Como complemento às técnicas de detecção de observações discrepantes, é proposto o método procura \\forward\", por Atkinson e Riani (2000), que é uma metodologia para detectar observações atípicas mascaradas. Neste trabalho, propomos o uso da influência local com procura \"forward\" na obtenção de observações mascaradas influentes considerando modelos de regressão linear. / The identification of influential and/or atypical observations in a data set is known as a part of the diagnostic analysis. One of the purposes of the diagnostic analysis is to verify the robustness of a statistical model, as the non-identification of influential observations can affect the analysis or may cause the obtainment of incorrect results. The most commonly used methodology for the diagnostic of influential observations in regression models are the global influence (Belsey et al., 1980). Cook (1986) introduced a general method to evaluate the local influence of small perturbations in the statistical model or in the data set using different perturbation schemes. As a complement to the techniques of detection atypical observations, it is proposed the forward search procedure by Atkinson e Riani (2000), which is a methodology to detect the masked atypical observations in a data set. In this work we propose the use of the local influence approach together with the forward search to obtain the masked influential observations in linear regression models.
2

Influência local com procura \"forward\" em modelos de regressão linear / Local influence with forward search in linear regression models

Juan Pablo Mamani Bustamante 25 February 2015 (has links)
A identificação de observações influentes e/ou aberrantes de um conjunto de dados é conhecida como uma parte das análises de diagnóstico. Esta técnica de diagnóstico têm como uma das finalidades verificar a robustez de um modelo estatístico, pois a não identificação dos dados influentes pode afetar a análise ou obter resultados incorretos. As metodologias comumente utilizadas para o diagnóstico de observações influentes em modelos de regressão são métodos de influência global (Belsey et al., 1980). Cook (1986) introduziu um método geral para avaliar a influência local de pequenas perturbações no modelo estatístico ou nos dados, usando diferentes tipos de perturbações. Como complemento às técnicas de detecção de observações discrepantes, é proposto o método procura \\forward\", por Atkinson e Riani (2000), que é uma metodologia para detectar observações atípicas mascaradas. Neste trabalho, propomos o uso da influência local com procura \"forward\" na obtenção de observações mascaradas influentes considerando modelos de regressão linear. / The identification of influential and/or atypical observations in a data set is known as a part of the diagnostic analysis. One of the purposes of the diagnostic analysis is to verify the robustness of a statistical model, as the non-identification of influential observations can affect the analysis or may cause the obtainment of incorrect results. The most commonly used methodology for the diagnostic of influential observations in regression models are the global influence (Belsey et al., 1980). Cook (1986) introduced a general method to evaluate the local influence of small perturbations in the statistical model or in the data set using different perturbation schemes. As a complement to the techniques of detection atypical observations, it is proposed the forward search procedure by Atkinson e Riani (2000), which is a methodology to detect the masked atypical observations in a data set. In this work we propose the use of the local influence approach together with the forward search to obtain the masked influential observations in linear regression models.
3

Modelos de regressão beta inflacionados / Inflated beta regression models

Ospina Martinez, Raydonal 04 April 2008 (has links)
Nos últimos anos têm sido desenvolvidos modelos de regressão beta, que têm uma variedade de aplicações práticas como, por exemplo, a modelagem de taxas, razões ou proporções. No entanto, é comum que dados na forma de proporções apresentem zeros e/ou uns, o que não permite admitir que os dados provêm de uma distribuição contínua. Nesta tese, são propostas, distribuições de mistura entre uma distribuição beta e uma distribuição de Bernoulli, degenerada em zero e degenerada em um para modelar dados observados nos intervalos [0, 1], [0, 1) e (0, 1], respectivamente. As distribuições propostas são inflacionadas no sentido de que a massa de probabilidade em zero e/ou um excede o que é permitido pela distribuição beta. Propriedades dessas distribuições são estudadas, métodos de estimação por máxima verossimilhança e momentos condicionais são comparados. Aplicações a vários conjuntos de dados reais são examinadas. Desenvolvemos também modelos de regressão beta inflacionados assumindo que a distribuição da variável resposta é beta inflacionada. Estudamos estimação por máxima verossimilhança. Derivamos expressões em forma fechada para o vetor escore, a matriz de informação de Fisher e sua inversa. Discutimos estimação intervalar para diferentes quantidades populacionais (parâmetros de regressão, parâmetro de precisão) e testes de hipóteses assintóticos. Derivamos expressões para o viés de segunda ordem dos estimadores de máxima verossimilhança dos parâmetros, possibilitando a obtenção de estimadores corrigidos que são mais precisos que os não corrigidos em amostras finitas. Finalmente, desenvolvemos técnicas de diagnóstico para os modelos de regressão beta inflacionados, sendo adotado o método de influência local baseado na curvatura normal conforme. Ilustramos a teoria desenvolvida em um conjuntos de dados reais. / The last years have seen new developments in the theory of beta regression models, which are useful for modelling random variables that assume values in the standard unit interval such as proportions, rates and fractions. In many situations, the dependent variable contains zeros and/or ones. In such cases, continuous distributions are not suitable for modeling this kind of data. In this thesis we propose mixed continuous-discrete distributions to model data observed on the intervals [0, 1],[0, 1) and (0, 1]. The proposed distributions are inflated beta distributions in the sense that the probability mass at 0 and/or 1 exceeds what is expected for the beta distribution. Properties of the inflated beta distributions are given. Estimation based on maximum likelihood and conditional moments is discussed and compared. Empirical applications using real data set are provided. Further, we develop inflated beta regression models in which the underlying assumption is that the response follows an inflated beta law. Estimation is performed by maximum likelihood. We provide closed-form expressions for the score function, Fishers information matrix and its inverse. Interval estimation for different population quantities (such as regression parameters, precision parameter, mean response) is discussed and tests of hypotheses on the regression parameters can be performed using asymptotic tests. We also derive the second order biases of the maximum likelihood estimators and use them to define bias-adjusted estimators. The numerical results show that bias reduction can be effective in finite samples. We also develop a set of diagnostic techniques that can be employed to identify departures from the postulated model and influential observations. To that end, we adopt the local influence approach based in the conformal normal curvature. Finally, we consider empirical examples to illustrate the theory developed.
4

"Análise de um modelo de regressão com erros nas variáveis multivariado com intercepto nulo" / "Analysis on a multivariate null-intercept errors-in-variables regression model"

Russo, Cibele Maria 19 June 2006 (has links)
Para analisar características de interesse a respeito de um conjunto de dados reais da área de Odontologia apresentado em Hadgu & Koch (1999), ajustaremos um modelo de regressão linear multivariado com erros nas variáveis com intercepto nulo. Este conjunto de dados é caracterizado por medições de placa bacteriana em três grupos de voluntários, antes e após utilizar dois líquidos de bochecho experimentais e um líquido de bochecho controle, com medições (sujeitas a erros de medição) no início do estudo, após três e seis meses de utilização dos líquidos. Neste caso, uma possível estrutura de dependência entre as medições feitas em um mesmo indivíduo deve ser incorporada ao modelo e, além disto, temos duas variáveis resposta para cada indivíduo. Após a apresentação do modelo estatístico, iremos obter estimativas de máxima verossimilhança dos parâmetros utilizando o algoritmo iterativo EM e testaremos as hipóteses de interesse utilizando testes assintóticos de Wald, razão de verossimilhanças e score. Como neste caso não existe um teste ótimo, faremos um estudo de simulação para verificar o comportamento das três estatísticas de teste em relação a diferentes tamanhos amostrais e diferentes valores de parâmetros. Finalmente, faremos um estudo de diagnóstico buscando identificar possíveis pontos influentes no modelo, considerando o enfoque de influência local proposto por Cook (1986) e a medida de curvatura normal conformal desenvolvida por Poon & Poon (1999). / To analyze some characteristics of interest in a real odontological data set presented in Hadgu & Koch (1999), we propose the use of a multivariate null intercept errors-in-variables regression model. This data set is composed by measurements of dental plaque index (with measurement errors), which were measured in volunteers who were randomized to two experimental mouth rinses (A and B) or a control mouth rinse. The measurements were taken in each individual, before and after the use of the respective mouth rinses, in the beginning of the study, after three months from the baseline and after six months from the baseline. In this case, a possible structure of dependency between the measurements taken within the same individual must be incorporated in the model. After presenting the statistical model, we obtain the maximum likelihood estimates of the parameters using the numerical algorithm EM, and we test the hypotheses of interest considering asymptotic tests (Wald, likelihood ratio and score). Also, a simulation study to verify the behavior of these three test statistics is presented, considering diferent sample sizes and diferent values for the parameters. Finally, we make a diagnostic study to identify possible influential observations in the model, considering the local influence approach proposed by Cook (1986) and the conformal normal curvature proposed by Poon & Poon (1999).
5

Modelos de regressão beta inflacionados / Inflated beta regression models

Raydonal Ospina Martinez 04 April 2008 (has links)
Nos últimos anos têm sido desenvolvidos modelos de regressão beta, que têm uma variedade de aplicações práticas como, por exemplo, a modelagem de taxas, razões ou proporções. No entanto, é comum que dados na forma de proporções apresentem zeros e/ou uns, o que não permite admitir que os dados provêm de uma distribuição contínua. Nesta tese, são propostas, distribuições de mistura entre uma distribuição beta e uma distribuição de Bernoulli, degenerada em zero e degenerada em um para modelar dados observados nos intervalos [0, 1], [0, 1) e (0, 1], respectivamente. As distribuições propostas são inflacionadas no sentido de que a massa de probabilidade em zero e/ou um excede o que é permitido pela distribuição beta. Propriedades dessas distribuições são estudadas, métodos de estimação por máxima verossimilhança e momentos condicionais são comparados. Aplicações a vários conjuntos de dados reais são examinadas. Desenvolvemos também modelos de regressão beta inflacionados assumindo que a distribuição da variável resposta é beta inflacionada. Estudamos estimação por máxima verossimilhança. Derivamos expressões em forma fechada para o vetor escore, a matriz de informação de Fisher e sua inversa. Discutimos estimação intervalar para diferentes quantidades populacionais (parâmetros de regressão, parâmetro de precisão) e testes de hipóteses assintóticos. Derivamos expressões para o viés de segunda ordem dos estimadores de máxima verossimilhança dos parâmetros, possibilitando a obtenção de estimadores corrigidos que são mais precisos que os não corrigidos em amostras finitas. Finalmente, desenvolvemos técnicas de diagnóstico para os modelos de regressão beta inflacionados, sendo adotado o método de influência local baseado na curvatura normal conforme. Ilustramos a teoria desenvolvida em um conjuntos de dados reais. / The last years have seen new developments in the theory of beta regression models, which are useful for modelling random variables that assume values in the standard unit interval such as proportions, rates and fractions. In many situations, the dependent variable contains zeros and/or ones. In such cases, continuous distributions are not suitable for modeling this kind of data. In this thesis we propose mixed continuous-discrete distributions to model data observed on the intervals [0, 1],[0, 1) and (0, 1]. The proposed distributions are inflated beta distributions in the sense that the probability mass at 0 and/or 1 exceeds what is expected for the beta distribution. Properties of the inflated beta distributions are given. Estimation based on maximum likelihood and conditional moments is discussed and compared. Empirical applications using real data set are provided. Further, we develop inflated beta regression models in which the underlying assumption is that the response follows an inflated beta law. Estimation is performed by maximum likelihood. We provide closed-form expressions for the score function, Fishers information matrix and its inverse. Interval estimation for different population quantities (such as regression parameters, precision parameter, mean response) is discussed and tests of hypotheses on the regression parameters can be performed using asymptotic tests. We also derive the second order biases of the maximum likelihood estimators and use them to define bias-adjusted estimators. The numerical results show that bias reduction can be effective in finite samples. We also develop a set of diagnostic techniques that can be employed to identify departures from the postulated model and influential observations. To that end, we adopt the local influence approach based in the conformal normal curvature. Finally, we consider empirical examples to illustrate the theory developed.
6

"Análise de um modelo de regressão com erros nas variáveis multivariado com intercepto nulo" / "Analysis on a multivariate null-intercept errors-in-variables regression model"

Cibele Maria Russo 19 June 2006 (has links)
Para analisar características de interesse a respeito de um conjunto de dados reais da área de Odontologia apresentado em Hadgu & Koch (1999), ajustaremos um modelo de regressão linear multivariado com erros nas variáveis com intercepto nulo. Este conjunto de dados é caracterizado por medições de placa bacteriana em três grupos de voluntários, antes e após utilizar dois líquidos de bochecho experimentais e um líquido de bochecho controle, com medições (sujeitas a erros de medição) no início do estudo, após três e seis meses de utilização dos líquidos. Neste caso, uma possível estrutura de dependência entre as medições feitas em um mesmo indivíduo deve ser incorporada ao modelo e, além disto, temos duas variáveis resposta para cada indivíduo. Após a apresentação do modelo estatístico, iremos obter estimativas de máxima verossimilhança dos parâmetros utilizando o algoritmo iterativo EM e testaremos as hipóteses de interesse utilizando testes assintóticos de Wald, razão de verossimilhanças e score. Como neste caso não existe um teste ótimo, faremos um estudo de simulação para verificar o comportamento das três estatísticas de teste em relação a diferentes tamanhos amostrais e diferentes valores de parâmetros. Finalmente, faremos um estudo de diagnóstico buscando identificar possíveis pontos influentes no modelo, considerando o enfoque de influência local proposto por Cook (1986) e a medida de curvatura normal conformal desenvolvida por Poon & Poon (1999). / To analyze some characteristics of interest in a real odontological data set presented in Hadgu & Koch (1999), we propose the use of a multivariate null intercept errors-in-variables regression model. This data set is composed by measurements of dental plaque index (with measurement errors), which were measured in volunteers who were randomized to two experimental mouth rinses (A and B) or a control mouth rinse. The measurements were taken in each individual, before and after the use of the respective mouth rinses, in the beginning of the study, after three months from the baseline and after six months from the baseline. In this case, a possible structure of dependency between the measurements taken within the same individual must be incorporated in the model. After presenting the statistical model, we obtain the maximum likelihood estimates of the parameters using the numerical algorithm EM, and we test the hypotheses of interest considering asymptotic tests (Wald, likelihood ratio and score). Also, a simulation study to verify the behavior of these three test statistics is presented, considering diferent sample sizes and diferent values for the parameters. Finally, we make a diagnostic study to identify possible influential observations in the model, considering the local influence approach proposed by Cook (1986) and the conformal normal curvature proposed by Poon & Poon (1999).

Page generated in 0.0601 seconds