Global ETD Search

21	The new class of Kummer beta generalized distributions: theory and applications / A nova classe de distribuições Kummer beta generalizada: teoria e aplicações Rodrigo Rossetto Pescim 06 December 2013 (has links) In this study, a new class of generalized distributions was developed, based on the Kummer beta distribution (NG; KOTZ, 1995), which contains as particular cases the exponentiated and beta generators of distributions. The main feature of the new family of distributions is to provide greater flexibility to the extremes of the density function and therefore, it becomes suitable for analyzing data sets with high degree of asymmetry and kurtosis. Also, two new distributions belonging to the new class of distributions, based on the Birnbaum-Saunders and generalized gamma distributions, that has as main characteristic the hazard function which assumes different forms (unimodal, bathtub shape, increase, decrease) were studied. In all studies, general mathematical properties such as ordinary and incomplete moments, generating function, mean deviations, reliability, entropies, order statistics and their moments were discussed. The estimation of parameters is approached by the method of maximum likelihood and Bayesian analysis and the observed information matrix is derived. It is also considered the likelihood ratio statistics and formal goodness-of-fit tests to compare all the proposed distributions with some of its sub-models and non-nested models. The developed results for all studies were applied to six real data sets. / Neste trabalho, foi proposta uma nova classe de distribuições generalizadas, baseada na distribuição Kummer beta (NG; KOTZ, 1995), que contém como casos particulares os geradores exponencializado e beta de distribuições. A principal característica da nova família de distribuições é fornecer grande flexibilidade para as extremidades da função densidade e portanto, ela torna-se adequada para a análise de conjuntos de dados com alto grau de assimetria e curtose. Também foram estudadas duas novas distribuições que pertencem à nova família de distribuições, baseadas nas distribuições Birnbaum-Saunders e gama generalizada, que possuem função de taxas de falhas que assumem diferentes formas (unimodal, forma de banheira, crescente e decrescente). Em todas as pesquisas, propriedades matemáticas gerais como momentos ordinários e incompletos, função geradora, desvios médio, confiabilidade, entropias, estatísticas de ordem e seus momentos foram discutidas. A estimação dos parâmetros é abordada pelo método da máxima verossimilhança e pela análise bayesiana e a matriz de informação observada foi derivada. Considerou-se, também, a estatística de razão de verossimilhanças e testes formais de qualidade de ajuste para comparar todas as distribuições propostas com alguns de seus submodelos e modelos não encaixados. Os resultados desenvolvidos foram aplicados a seis conjuntos de dados. Análise Bayesiana Distribuição Birnbaum-Saunders Distribuição gama Distribuição normal Matriz de informação observada Razão de verossimilhança Bayeasian analysis Birnbaum-Saunders distribution Gamma distribution Likelihood ratio Normal distribution Observed information matrix
22	Pressuposto da normalidade multivariada para o teste de razão de verossimilhança entre dois grupos de caracteres de mamoneira / Assumption of multivariate normality for the likelihood ratio test between two groups of characters of castor beans Brum, Betânia 29 February 2012 (has links) Conselho Nacional de Desenvolvimento Científico e Tecnológico / The likelihood ratio test for independence between two groups of variables allows us to identify whether there is a dependency relationship between two groups of variables, ie, if the covariance between the two groups are zero. This test assumes normality multivariate data, which limits its application, in many studies of agronomic area, times when you need use, for example, the canonical correlation analysis. The objective of this study is to evaluate the type I error and power of the likelihood ratio test (LRT) for independence between two groups of variables in different scenarios, consisting of combinations of: sample sizes 16, 40 number of combinations of two variables groups, and nine degrees of correlation between variables in matrices (for power); multivariate normal distribution under normal and contaminated, as well as compare the different scenarios, two formulas for calculating the test statistic. Thus, were evaluated the effect of 640 and 5760 scenarios on rates of type I error and power, respectively, in each one of probability distributions and formulas. The assessment of performance of LRT was performed through computational simulation by Monte Carlo method, using 2000 simulations in each of the scenarios generated. In multivariate normal situation: when the number of variables is large (p = 24), the LRT for independence between two groups of variables, controls the type I error rates and has high power in sample sizes greater than 100 and 500, with use of formulas for small and large samples, respectively; and, for sample sizes small (n = 25, 30 and 50), the test presents good performance, provided that, the number of variables does not exceed to 12; and, the formula chosen, whether for small samples. Under contaminated multivariate normal distribution, the LRT for independence between two groups of variables have high values of power, but is not robust, because it has high rates of type I error in any scenario evaluated. / O teste de razão de verossimilhança para a independência entre dois grupos de variáveis permite identificar se há ou não relação de dependência entre dois grupos de variáveis, ou seja, se as covariâncias entre os dois grupos são nulas. Esse teste pressupõe normalidade multivariada dos dados, o que limita sua aplicação, em muitos estudos da área agronômica, em que se necessita utilizar, por exemplo, a análise de correlação canônica. O objetivo deste trabalho é avaliar o erro tipo I e o poder do teste de razão de verossimilhança (TRV) para independência entre dois grupos de variáveis em diversos cenários, constituídos pelas combinações de: 16 tamanhos de amostra; 40 combinações de número de variáveis dos dois grupos; e, nove graus de correlação entre as variáveis (para o poder); sob distribuição normal multivariada e distribuição normal multivariada contaminada, bem como, comparar, nos diferentes cenários, duas fórmulas para cálculo da estatística do teste. Dessa forma, foram avaliados o efeito de 640 e 5760 cenários sobre as taxas de erro tipo I e poder, respectivamente, em cada uma das distribuições de probabilidade e fórmulas. A avaliação do desempenho do TRV foi realizada por meio de simulação computacional pelo método Monte Carlo, utilizando-se 2000 simulações em cada um dos cenários gerados. Em situação de normalidade multivariada: quando o número de variáveis é grande (p= 24), o TRV para a independência entre dois grupos de variáveis, controla as taxas de erro tipo I e apresentou poder elevado, em tamanhos de amostra superiores a 100 e 500, com uso das fórmulas para pequenas e grandes amostras, respectivamente; e, para tamanhos amostrais pequenos (n= 25, 30 e 50), o teste apresenta bom desempenho, desde que, o número de variáveis não exceda a 12; e, a fórmula escolhida, seja para pequenas amostras. Sob distribuição normal multivariada contaminada, o TRV para a independência entre dois grupos de variáveis possui elevados valores de poder, mas não é robusto, pois apresenta elevadas taxas de erro tipo I, em qualquer cenário avaliado. Erro tipo I Poder do teste Type I error rate Power of the test Contaminated multivariate normal CNPQ::CIENCIAS AGRARIAS::AGRONOMIA
23	Mathematical properties of some generalized gamma models Lima, Maria do Carmo Soares 14 January 2015 (has links) Submitted by Matheus Alves Bulhoes (matheus.bulhoes@ufpe.br) on 2015-05-04T13:15:32Z No. of bitstreams: 2 Tese_CD.pdf: 4309163 bytes, checksum: 7d9dcde53e41be12f3faefa599e821db (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-05-04T13:15:32Z (GMT). No. of bitstreams: 2 Tese_CD.pdf: 4309163 bytes, checksum: 7d9dcde53e41be12f3faefa599e821db (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2015-01-14 / CAPES / Modelagem e análise de tempos de vida são aspectos importantes do trabalho estatístico, em uma ampla variedade de áreas científicas e tecnológicas. Estudamos algumas propriedades matemáticas de uma família recente chamada gama-G [Zografos and Balakrishnan (2009) and Risti´c and Balakrishnan (2012)], denotada aqui por GG, em que G é chamada distribuição baseline. Escolhemos, como baselines, cinco distribuições amplamente conhecidas: Birnbaum- Saunders, Normal, Lindley, Nadarajah-Haghighi e uma extensão da Weibull. A mais recente, Nadarajah-Haghighi, foi estudada por Nadarajah e Haghighi (2011), que desenvolveram algumas propriedades interessantes. Demonstramos que as funções densidades das distribuições propostas podem ser expressas como combinação linear de funções densidades das respectivas exponencializadas-G. Para uma baseline arbitrária com cdf G(x), uma variável aleatória é dita ter distribuição exponencializada-G, com parâmetro a > 0, digamos X expG(a), se sua pdf e cdf são ha(x) = aGa1(x)g(x) and Ha(x) = Ga(x), respectivamente. As propriedades de algumas exponecializadas têm sido estudadas por muitos autores, veja Mudholkar e Srivastava (1993) e Mudholkar et al. (1995) para Weibull exponencializada (exp-W), Gupta et al. (1998) para Pareto exponencializada, Gupta and Kundu (2001) para exponencial exponencializada (exp-E) e Nadarajah e Gupta (2007) para gama exponencializada (exp-G). Mais recentimente, Cordeiro et al. (2011a) investigaram algumas propriedades matemáticas para a distribuição gama generalizada exponencializada (exp-GG). Além disso, várias de suas propriedades estruturais são derivadas, incluindo expressões explícitas para os momentos, as funções quantílica e geratriz de momentos, desvios médios e dois tipos de entropia. Também investigamos as estatísticas de ordem e de seus momentos. Técnicas de máxima verossimilhança são usadas para ajustar os novos modelos e para mostrar a sua potencialidade. Desvios médios Distribuição Birnbaum-Saunders Distribuição ExtendedWeibull Distribuição Gamma-G Distribuição Lindley Distribuição Nadarajah-Haghighi Distribuição Normal Estimação por máxima verossimilhança Função quantílica
24	Diagnóstico de influência em modelos com erros na variável skew-normal/independente / Influence of diagnostic in models with errors in variable skew-normal/independent Carvalho, Rignaldo Rodrigues 17 August 2018 (has links) Orientadores: Victor Hugo Lachos Dávila, Filidor Edilfonso Vilca Labra / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica / Made available in DSpace on 2018-08-17T09:37:18Z (GMT). No. of bitstreams: 1 Carvalho_RignaldoRodrigues_M.pdf: 1849605 bytes, checksum: 07ea5638a2dbfa2227f9a949d4723bbf (MD5) Previous issue date: 2010 / Resumo: O modelo de medição de Barnett é frequentemente usado para comparar vários instrumentos de medição. é comum assumir que os termos aleatórios têm uma distribuição normal. Entretanto, tal suposição faz a inferência vulnerável a observações atípicas por outro lado distribuições de misturas de escala skew-normal tem sido uma interessante alternativa para produzir estimativas robustas tendo a elegância e simplicidade da teoria da máxima verossimilhança. Nós usamos resultados de Lachos et al. (2008) para obter a estimação dos parâmetros via máxima verossimilhança, baseada no algoritmo EM, o qual rende expressões de forma fechada para as equações no passo M. Em seguida desenvolvemos o método de influência local de Zhu e Lee (2001) para avaliar os aspectos de estimação dos parâmetros sob alguns esquemas de perturbação. Os resultados obtidos são aplicados a conjuntos de dados bastante estudados na literatura, ilustrando a utilidade da metodologia proposta / Abstract: The Barnett measurement model is frequently used to comparing several measuring devices. It is common to assume that the random terms have a normal distribution. However, such assumption makes the inference vulnerable to outlying observations whereas scale mixtures of skew-normal distributions have been an interesting alternative to produce robust estimates keeping the elegancy and simplicity of the maximum likelihood theory. We used results in Lachos et al. (2008) for obtaining parameter estimation via maximum likelihood, based on the EM-algorithm, which yields closed form expressions for the equations in the M-step. Then we developed the local influence method to assessing the robustness aspects of these parameter estimates under some usual perturbation schemes. Results obtained for one real data set are reported, illustrating the usefulness of the proposed methodology / Mestrado / Métodos Estatísticos / Mestre em Estatística Algoritmos de esperança-maximização Distribuição normal assimétrica Influência local (Estatística) Misturas de escala (Estatística) Mahalanobis, Distância de Expectation-maximization algorithms Skew-normal distributions Local influence (Statistics) Scale mixtures Mahalanobis distance
25	Misturas finitas de misturas de escala skew-normal / Mixtures modelling using scale mixtures of skew-normal distribution Basso, Rodrigo Marreiro 03 December 2009 (has links) Orientador: Victor Hugo Lachos Davila / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-13T07:03:11Z (GMT). No. of bitstreams: 1 Basso_RodrigoMarreiro_M.pdf: 3130269 bytes, checksum: 85e95beb812a4ec069f39f8b9c79681a (MD5) Previous issue date: 2009 / Resumo: Nesse trabalho será considerada uma classe flexível de modelos usando misturas finitas de distribuições da classe de misturas de escala skew-normal. O algoritmo EM é empregado para se obter estimativas de máxima verossimilhança de maneira iterativa, sendo discutido com maior ênfase para misturas de distribuições skew-normal, skew-t, skew-slash e skew-normal contaminada. Também será apresentado um método geral para aproximar a matrix de covariância assintótica das estimativas de máxima verossimilhança. Resultados obtidos da análise de quatro conjuntos de dados reais ilustram a aplicabilidade da metodologia proposta / Abstract: In this work we consider a flexible class of models using finite mixtures of multivariate scale mixtures of skew-normal distributions. An EM-type algorithm is employed for iteratively computing maximum likelihood estimates and this is discussed with emphasis on finite mixtures of skew-normal, skew-t, skew-slash and skew-contaminated normal distributions. A general information-based method for approximating the asymptotic covariance matrix of the maximum likelihood estimates is also presented. Results obtained from the analysis of four real data sets are reported illustrating the usefulness of the proposed methodology / Mestrado / Mestre em Estatística Algoritmos de esperança-maximização Distribuição (Probabilidades) Misturas finitas Distribuição normal assimétrica Misturas de escala (Estatística) Expectation-maximization algorithms Distribution (Probability) Finite mixtures Skew-normal distribution Scale mixtures
26	Aplicações estatísticas na área industrial / Statistical applications in the industrial area Gecirlei Francisco da Silva 10 June 2009 (has links) Apresentamos algumas aplicações de ferramentas estatísticas que são comumente utilizadas na melhoria da qualidade de processos industriais. Inicialmente, desenvolveu-se procedimentos para testar a competência de laboratórios que participam de programas de ensaios de proficiência. Em situações onde os laboratórios medem várias vezes no mesmo ponto, utilizou-se o modelo de erros de medição, proposto por Jaech [39](1985). Além disso, a inferência sobre os parâmetros de tendência aditiva foi generalizada para a classe de distribuições elípticas. A competência dos laboratórios é avaliada pelo teste da razão de verossimilhança generalizada, do qual, obtemos a distribuição exata para a estatística proposta. Em situações onde os laboratórios medem várias vezes em vários pontos e a variável em análise apresenta variações naturais, utilizou-se o modelo com erro nas variáveis. Diante disso, vamos estender o modelo estrutural definido em Barnett [13] (1969) para o modelo ultra-estrutural com réplicas. Neste caso, vamos avaliar não somente a tendência aditiva, mas também, a tendência multiplicativa, ou seja, avaliar a linearidade das medições. As estimativas dos parâmetros foram obtidas via procedimento do algorítmo EM, com isso, desenvolvemos os teste de Wald, razão de verossimilhança e escore para avaliar a competência dos laboratórios. Nos dois modelos propostos, generalizamos o erro normalizado (En) sugerido pelo Guia 43 [37] para testar a competência dos laboratórios participantes de programas de ensaio de proficiência. Apresentamos também, um procedimento para calcular índices de performance para processos univariados e multivariados. Nestes casos, consideramos que a distribuição dos dados segue uma distribuição Normal assimétrica. Além disso, apresentamos uma análise de simulação onde concluímos que a presença de assimetria nos dados pode causar interpretações erradas sobre o processo, quando a distribuição assumida para os dados é a Normal / We present some applications of statistical tools that are used in the improvement of the quality of industrial processes. Initially, we develop procedures to test the ability of laboratories that participate of programs of proficiency test. In situations where the laboratories measure several times in the same point, we use the model of errors of measurement, considered for Jaech [39](1985). Moreover, the inference on the parameters additive bias was generalized for the class of elliptical distributions. The ability of the laboratories is evaluated by the generalized likelihood ratio test, of which, we get the accurate distribution for the statistics proposal. In situations where the laboratories measure some times in some points and the variable in analysis presents natural variations, uses the model with error in the variable. With this, we go to extend the model structural defined in Barnett [13] (1969) for the ultrastructural model with replicate. In this case, we go to not only evaluate the bias additive, but also, the bias multiplicative, that is, to evaluate the linearity of the measurements. The estimates of the parameters had been gotten by the procedure of the EM algorithm, with this, develop of Wald, likelihood ratio and score test to evaluate the ability of the laboratories. In the two considered models, we generalize the normalized error (En) suggested for Guide 43 [37] to test the ability of the participant laboratories of programs of proficiency test. We also present, a procedure to calculate index of performance for univariate and multivariate processes. In these cases, we consider that the distribution of the data follows a skew Normal distribution. Moreover, we present a simulation analysis where we conclude that the presence of asymmetry in the data can cause interpretations missed on the process, when the distribution assumed for the data is the Normal Análise da capacidade de processos Comparações interlaboratoriais Distribuição normal assimétrica Distribuições elípticas Ensaios de proficiência Analysis of the capacity of process Elliptical distributions Interlaboratorial comparisons Skew normal distributions Test of proficiency
27	Distribuição de probabilidade e dimensionamento amostral para tamanho de partícula em gramíneas forrageiras / Probability distribution and sample dimension for particle size in forage grasses Claudia Fernanda Navarette López 16 January 2009 (has links) O objetivo deste trabalho foi identificar a distribuição de probabilidade da variável tamanho de partícula em gramíneas forrageiras e fazer um dimensionamento amostral. Para isto foi realizada uma analise exploratória dos dados obtidos de um experimento planejado em blocos casualizados, a cada sub-amostra do conjunto de dados foram ajustadas as distribuições normal, gama, beta e Weibull. Foram realizados os testes de aderência não paramétricos de Kolmogorov-Smirnov, Lilliefos, Cramer-von Mises e Anderson-Darling para avaliar o ajuste as distribuições. A estimativa do valor do logaritmo da função de máxima verossimilhança e indicativo da distribuição que melhor descreveu o conjunto de dados, assim como os critérios de informação de Akaike (AIC) e de informação bayesiano (BIC). Foram feitas simulações a partir dos parâmetros obtidos e feitos os testes não paramétricos para avaliar o ajuste com diferentes tamanhos de amostras. Encontrou-se que os dados n~ao seguem a distribuição normal, pois há assimetria nos histogramas melhor descritos pelas distribuições beta e Weibull. Os testes mostraram que as distribuições gama, beta e Weibull ajustam-se melhor aos dados porem pelo maior valor do logaritmo da função de verossimilhança, assim como pelos valores AIC e BIC, o melhor ajuste foi dado pela distribuição Weibull. As simulações mostraram que com os tamanhos n de 2 e 4 com 10 repetições cada, as distribuições gama e Weibull apresentaram bom ajuste aos dados, a proporção que o n cresce a distribuição dos dados tende a normalidade. O dimensionamento dado pela Amostra Aleatória Simples (ASA), mostrou que o tamanho 6 de amostra e suficiente, para descrever a distribuição de probabilidade do tamanho de partícula em gramíneas forrageiras / The purpose of this study was to identify the probability distribution of variable particle size in forages grasses and to do a sample dimension. For this was carried out an exploratory analysis of the data obtained from the experiment planned in randomized blocks. Each sample of the overall data was adjusted to Normal, Gama, Beta and Weibull distributions. Tests of adhesion not parametric of Kolmogorov-Smirnov, Lilliefos, Cramer-von Mises and Anderson-Darling were conducted to indicate the adjustment at the distributions. The estimate of the value of the logarithm of function of maximum likelihood is indicative of distribution that better describes the data set, as well as information criteria of Akaike (AIC) and Bayesian information (BIC). Simulations from parameters obtained were made and tests not parametric to assess the t with dierent sizes of samples were made too. It was found that data are not normal, because have asymmetry in the histograms, better described by Beta and Weibull distributions. Tests showed that Gamma, Beta and Weibull distributions, have a ts better for the data; for the highest value in the logarithm of the likelihood function as well as smaller AIC and BIC, best t was forWeibull distribution. Simulations showed that with 2 and 4 sizes (n), with 10 repeat each one, the Gama and Weibull distributions showed good t to data, as the proportion in which n grows, distribution of data tends to normality. Dimensioning by simple random sample (ASA), showed that 6 is a sucient sample size to describe probability distribution for particle size in forage grasses. Distribuição de frequência Distribuição normal Distribuições (probabilidade) Função beta Função gama Gramíneas forrageiras Verossimilhança. Beta Function Distribution of frequency Forage grasses Gama Function Likelihood.
28	Melhoramento do resíduo de Wald em modelos lineares generalizados / Improvement of Wald residual in generalized linear models Mariana Ragassi Urbano 18 December 2008 (has links) A teoria dos modelos lineares generalizados é muito utilizada na estatística, para a modelagem de observações provenientes da distribuição Normal, mas, principalmente, na modelagem de observações cuja distribuição pertença à família exponencial de distribuições. Alguns exemplos são as distribuições binomial, gama, normal inversa, dentre outras. Ajustado um modelo, para vericar a adequação do ajuste, são aplicadas técnicas de diagnósticos e feita uma análise de resíduos. As propriedades dos resíduos para modelos lineares generalizados não são muito conhecidas e resultados assintóticos são o único recurso. Este trabalho teve como objetivo estudar as propriedades assintóticas do resíduo de Wald, e realizar correções para que sua distribuição se aproxime de uma distribuição normal padrão. Uma aplicação das correções para o resíduo de Wald foi feita para cinco conjuntos de dados. Em dois conjuntos, a variável resposta apresentava-se na forma de contagem, e para a modelagem utilizou-se a distribuição de Poisson. Dois outros conjuntos são provenientes de delineamentos experimentais inteiramente casualizados, com variável resposta contínua e para a modelagem utilizou-se a distribuição normal, e para o último conjunto, o interesse era modelar a proporção, e utilizou-se a distribuição binomial. Um estudo de simulação foi conduzido, utilizando-se o método de Monte Carlo, e concluiu-se, que com as correções realizadas no resíduo de Wald, houve uma melhora signicativa em sua distribuição, sendo que a versão melhorada do resíduo tem distribuição que aproxima mais de uma distribuição normal padrão. / The theory of generalized linear models is very used in statistics, not only for modeling data normally distributed, but in the modeling of data whose distribution belongs to the exponential family of distributions. Some examples are binomial, gamma and inverse Gaussian distribution, among others. After tting a model in order to check the adequacy of tting, diagnostic techniques are used. The properties of residuals in generalized linear models are not well known, and asymptotic results are the only recourse. This work aims to study the asymptotic properties of Wald residual, and to obtain corrections to make the distribution of the modied residuals closer to standard normal. An application of the corrections for Wald residuals was done to ve datasets. In two datasets the response variables were counts, and to model, was used the Poisson distribution. Other two datasets are provided from a completely randomized design with a continuous response, and to model, was used the normal distribution, and, in the last dataset the interest was to model the proportion and the binomial distribution was used. A Monte Carlo simulation, was performed showing that the distribution of the corrected Wald residuals, is more close to the standard normal distribution. Distribuição normal Método de Monte Carlo Modelos lineares generalizados Generalized linear models Normal distribution Monte Carlo method.
29	Modelos da teoria de resposta ao item assimétricos de grupos múltiplos para respostas politômicas nominais e ordinais sob um enfoque bayesiano / Skew item response theory models for multiple groups and for nominal and ordinal polytomous responses under a Bayesian framework Ferreira, Eduardo Vargas, 1987- 24 August 2018 (has links) Orientador: Caio Lucidius Naberezny Azevedo / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-24T12:51:18Z (GMT). No. of bitstreams: 1 Ferreira_EduardoVargas_M.pdf: 8131052 bytes, checksum: f344cd1f11e8d818f3aac90f48396cbc (MD5) Previous issue date: 2014 / Resumo: No presente trabalho propõem-se novos modelos da Teoria de Resposta ao Item para respostas politômicas nominais e ordinais (graduais), via dados aumentados, para grupos múltiplos. Para a modelagem das distribuições dos traços latentes de cada grupo, considera-se normais assimétricas centradas. Tal abordagem, além de acomodar a característica de assimetria aos dados, ajuda a garantir a identificabilidade dos modelos estudados, a qual é tratada tanto sob a ótica frequentista quanto bayesiana. Com relação aos métodos de estimação, desenvolveu-se procedimentos bayesianos através de algoritmos de Monte Carlo via cadeias de Markov (MCMC), utilizando o algoritmo de Gibbs (DAGS), com a verossimilhança aumentada (dados aumentados) e Metropolis-Hastings, considerando a verossimilhança original. As implementações computacionais foram escritas em linguagem C++, integradas ao ambiente computacional, gráfico e estatístico R, viabilizando rotinas gratuitas, de código aberto e alta velocidade no processamento, essenciais à difusão de tais metodologias. Para a seleção de modelos, utilizou-se o critério de informação deviance (DIC), os valores esperados do critério de informação de Akaike (EAIC) e o critério de informação bayesiano (EBIC). Em relação à verificação da qualidade do ajuste de modelos, explorou-se a checagem preditiva a posteriori, que fornece meios concretos de se avaliar a qualidade do instrumento de medida (prova, questionário etc), qualidade do ajuste do modelo de um modo global, além de indícios de violações de suposições específicas. Estudos de simulação, considerando diversas situações de interesse prático, indicam que os modelos e métodos de estimação produzem resultados bastante satisfatórios, com superioridade dos modelos assimétricos com relação ao simétrico (o qual assume simetria das distribuições das variáveis latentes). A análise de um conjunto de dados reais, referente à primeira fase do vestibular da UNICAMP de 2013, ilustra o potencial da tríade: modelagem, métodos de estimação e ferramentas de diagnósticos, desenvolvida neste trabalho / Abstract: In this work, we propose new Item Response Theory models for nominal and ordinal (gradual) polytomous responses through augmented data schemes considering multiple groups. For the distribution of the latent traits of each group, we consider a skew-normal distribution under the centered parametrization. This approach will allow for accommodating a possible skewness of the latent trait distribution, but is also helpful to ensure the identifiability of the models, which is studied under frequentist and Bayesian paradigms. Concerning estimation methods, we developed Bayesian methods through Markov chain Monte Carlo (MCMC) algorithms by using the Gibbs algorithm (DAGS), with augmented likelihood (augmented data) and Metropolis-Hastings algorithms, considering the original likelihood. The computational environment was written in the C++ language and integrated with the R program (a statistical computational and graphical environment), allowing for free, open source and high-speed routines which, in turn, are essential to the dissemination of the developed methodologies. In terms of model selection, we considered the deviance information criterion (DIC), the expected Akaike information criterion (EAIC) and expected Bayesian information criterion (EBIC). Regarding model-fit assessment tools, we explore the posterior predictive model- checking which allows for assessing the quality of measurement, instruments (tests, questionnaires, and others), the model fit in a global sense, besides providing directions toward violations of specific assumptions. Simulation studies, considering different situations of practical interest, indicate that the models and estimation methods produced reasonable results, with outperformance of skew models when compared to symmetric ones (which assumes symmetry of the latent trait distribution). Analysis of a data set which corresponds to the first phase of the 2013 written examination of UNICAMP (State University of Campinas), illustrates the potential of the following triad: modelling; estimation methods; and diagnostic tools developed in this work. / Mestrado / Estatistica / Mestre em Estatística Teoria da resposta ao item Modelos politômicos Inferência bayesiana Distribuição normal assimétrica Métodos MCMC (Estatística) Item Response Theory Polytomous models Bayesian inference Skew-normal distribution MCMC algorithms
30	Modelos para dados censurados sob a classe de distribuições misturas de escala skew-normal / Censored regression models under the class of scale mixture of skew-normal distributions Massuia, Monique Bettio, 1989- 03 June 2015 (has links) Orientador: Víctor Hugo Lachos Dávila / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-26T19:55:07Z (GMT). No. of bitstreams: 1 Massuia_MoniqueBettio_M.pdf: 2926597 bytes, checksum: 2a1154c0a61b13f369e8390159fc4c3e (MD5) Previous issue date: 2015 / Resumo: Este trabalho tem como objetivo principal apresentar os modelos de regressão lineares com respostas censuradas sob a classe de distribuições de mistura de escala skew-normal (SMSN), visando generalizar o clássico modelo Tobit ao oferecer alternativas mais robustas à distribuição Normal. Um estudo de inferência clássico é desenvolvido para os modelos em questão sob dois casos especiais desta família de distribuições, a Normal e a t de Student, utilizando o algoritmo EM para obter as estimativas de máxima verossimilhança dos parâmetros dos modelos e desenvolvendo métodos de diagnóstico de influência global e local com base na metodologia proposta por Cook (1986) e Poom & Poon (1999). Sob o enfoque Bayesiano, o modelo de regressão para respostas censuradas é estudado sob alguns casos especiais da classe SMSN, como a Normal, a t de Student, a skew-Normal, a skew-t e a skew-Slash. Neste caso, o amostrador de Gibbs é a principal ferramenta utilizada para a inferência sobre os parâmetros do modelo. Apresentamos também alguns estudos de simulação para avaliar a metodologia desenvolvida que, por fim, é aplicada em dois conjuntos de dados reais. Os pacotes SMNCensReg, CensRegMod e BayesCR para o software R dão suporte computacional aos desenvolvimentos deste trabalho / Abstract: This work aims to present the linear regression model with censored response variable under the class of scale mixture of skew-normal distributions (SMSN), generalizing the well known Tobit model as providing a more robust alternative to the normal distribution. A study based on classic inference is developed to investigate these censored models under two special cases of this family of distributions, Normal and t-Student, using the EM algorithm for obtaining maximum likelihood estimates and developing methods of diagnostic based on global and local influence as suggested by Cook (1986) and Poom & Poon (1999). Under a Bayesian approach, the censored regression model was studied under some special cases of SMSN class, such as Normal, t-Student, skew-Normal, skew-t and skew-Slash. In these cases, the Gibbs sampler was the main tool used to make inference about the model parameters. We also present some simulation studies for evaluating the developed methodologies that, finally, are applied on two real data sets. The packages SMNCensReg, CensRegMod and BayesCR implemented for the software R give computational support to this work / Mestrado / Estatistica / Mestra em Estatística Modelos lineares (Estatistica) Análise de regressão Distribuição normal assimétrica Algoritmos de esperança-maximização Linear models (Statistics) Regression analysis Skew-normal distributions Expectation-maximization algorithms

Search results