Spelling suggestions: "subject:"truncada"" "subject:"truncado""
1 |
Modelos de mistura para dados com distribuições Poisson truncadas no zero / Mixture models for data with zero truncated Poisson distributionsGigante, Andressa do Carmo 22 September 2017 (has links)
Modelo de mistura de distribuições tem sido utilizado desde longa data, mas ganhou maior atenção recentemente devido ao desenvolvimento de métodos de estimação mais eficientes. Nesta dissertação, o modelo de mistura foi utilizado como uma forma de agrupar ou segmentar dados para as distribuições Poisson e Poisson truncada no zero. Para solucionar o problema do truncamento foram estudadas duas abordagens. Na primeira, foi considerado o truncamento em cada componente da mistura, ou seja, a distribuição Poisson truncada no zero. E, alternativamente, o truncamento na resultante do modelo de mistura utilizando a distribuição Poisson usual. As estimativas dos parâmetros de interesse do modelo de mistura foram calculadas via metodologia de máxima verossimilhança, sendo necessária a utilização de um método iterativo. Dado isso, implementamos o algoritmo EM para estimar os parâmetros do modelo de mistura para as duas abordagens em estudo. Para analisar a performance dos algoritmos construídos elaboramos um estudo de simulação em que apresentaram estimativas próximas dos verdadeiros valores dos parâmetros de interesse. Aplicamos os algoritmos à uma base de dados real de uma determinada loja eletrônica e para determinar a escolha do melhor modelo utilizamos os critérios de seleção de modelos AIC e BIC. O truncamento no zero indica afetar mais a metodologia na qual aplicamos o truncamento em cada componente da mistura, tornando algumas estimativas para a distribuição Poisson truncada no zero com viés forte. Ao passo que, na abordagem em que empregamos o truncamento no zero diretamente no modelo as estimativas apontaram menor viés. / Mixture models has been used since long but just recently attracted more attention for the estimations methods development more efficient. In this dissertation, we consider the mixture model like a method for clustering or segmentation data with the Poisson and Poisson zero truncated distributions. About the zero truncation problem we have two emplacements. The first, consider the zero truncation in the mixture component, that is, we used the Poisson zero truncated distribution. And, alternatively, we do the zero truncation in the mixture model applying the usual Poisson. We estimated parameters of interest for the mixture model through maximum likelihood estimation method in which we need an iterative method. In this way, we implemented the EM algorithm for the estimation of interested parameters. We apply the algorithm in one real data base about one determined electronic store and towards determine the better model we use the criterion selection AIC and BIC. The zero truncation appear affect more the method which we truncated in the component mixture, return some estimates with strong bias. In the other hand, when we truncated the zero directly in the model the estimates pointed less bias.
|
2 |
Modelos de mistura para dados com distribuições Poisson truncadas no zero / Mixture models for data with zero truncated Poisson distributionsAndressa do Carmo Gigante 22 September 2017 (has links)
Modelo de mistura de distribuições tem sido utilizado desde longa data, mas ganhou maior atenção recentemente devido ao desenvolvimento de métodos de estimação mais eficientes. Nesta dissertação, o modelo de mistura foi utilizado como uma forma de agrupar ou segmentar dados para as distribuições Poisson e Poisson truncada no zero. Para solucionar o problema do truncamento foram estudadas duas abordagens. Na primeira, foi considerado o truncamento em cada componente da mistura, ou seja, a distribuição Poisson truncada no zero. E, alternativamente, o truncamento na resultante do modelo de mistura utilizando a distribuição Poisson usual. As estimativas dos parâmetros de interesse do modelo de mistura foram calculadas via metodologia de máxima verossimilhança, sendo necessária a utilização de um método iterativo. Dado isso, implementamos o algoritmo EM para estimar os parâmetros do modelo de mistura para as duas abordagens em estudo. Para analisar a performance dos algoritmos construídos elaboramos um estudo de simulação em que apresentaram estimativas próximas dos verdadeiros valores dos parâmetros de interesse. Aplicamos os algoritmos à uma base de dados real de uma determinada loja eletrônica e para determinar a escolha do melhor modelo utilizamos os critérios de seleção de modelos AIC e BIC. O truncamento no zero indica afetar mais a metodologia na qual aplicamos o truncamento em cada componente da mistura, tornando algumas estimativas para a distribuição Poisson truncada no zero com viés forte. Ao passo que, na abordagem em que empregamos o truncamento no zero diretamente no modelo as estimativas apontaram menor viés. / Mixture models has been used since long but just recently attracted more attention for the estimations methods development more efficient. In this dissertation, we consider the mixture model like a method for clustering or segmentation data with the Poisson and Poisson zero truncated distributions. About the zero truncation problem we have two emplacements. The first, consider the zero truncation in the mixture component, that is, we used the Poisson zero truncated distribution. And, alternatively, we do the zero truncation in the mixture model applying the usual Poisson. We estimated parameters of interest for the mixture model through maximum likelihood estimation method in which we need an iterative method. In this way, we implemented the EM algorithm for the estimation of interested parameters. We apply the algorithm in one real data base about one determined electronic store and towards determine the better model we use the criterion selection AIC and BIC. The zero truncation appear affect more the method which we truncated in the component mixture, return some estimates with strong bias. In the other hand, when we truncated the zero directly in the model the estimates pointed less bias.
|
3 |
[pt] COMPARAÇÃO DE MÉTODOS DE MICRO-DADOS E DE TRIÂNGULO RUN-OFF PARA PREVISÃO DA QUANTIDADE IBNR / [en] COMPARISON OF METHODS OF MICRO-DATA AND RUN-OFF TRIANGLE FOR PREDICTION AMOUNT OF IBNR19 May 2014 (has links)
[pt] A reserva IBNR é uma reserva de suma importância para as seguradoras. Seu cálculo tem sido realizado por métodos, em sua grande maioria, determinísticos, tradicionalmente aplicados a informações de sinistros agrupadas num formato particular intitulado triangulo de run-off. Esta forma de cálculo foi muito usada por décadas por sua simplicidade e pela limitação da capacidade de processamento computacional existente. Hoje, com o grande avanço dessa capacidade, não haveria necessidade de deixar de investigar informações relevantes que podem ser perdidas com agrupamento dos dados. Muitas são as deficiências dos métodos tradicionais apontadas na literatura e o uso de informação detalhada tem sido apontado por alguns artigos como a fonte para superação dessas deficiências. Outra busca constante nas metodologias propostas para cálculo da IBNR é pela obtenção de boas medidas de precisão das estimativas obtidas por eles. Neste ponto, sobre o uso de dados detalhados, há a expectativa de obtenção de medidas de precisão mais justas, já que se tem mais dados. Inspirada em alguns artigos já divulgados com propostas
para modelagem desses dados não agrupados esta dissertação propõe um novo modelo, avaliando sua capacidade de predição e ganho de conhecimento a respeito do processo de ocorrência e aviso de sinistros frente ao que se pode obter a partir dos métodos tradicionais aplicados à dados de quantidade para obtenção da quantidade de sinistros IBNR e sua distribuição. / [en] The IBNR reserve is a reserve of paramount importance for insurers. Its calculation has been accomplished by methods, mostly, deterministic, traditionally applied to claims grouped information in a particular format
called run-off triangle . This method of calculation was very adequate for decades because of its simplicity and the limited computational processing capacity existing in the past. Today, with the breakthrough of this capacity, no waiver to investigating relevant information that may be lost with grouping data would be need. Many flaws of the traditional methods has been mentioned in the literature and the use of detailed information has been pointed as a form of overcoming these deficiencies. Another frequent aim in methodologies proposed for the calculation of IBNR is get a good measure of the accuracy of the estimates obtained by them and that is another expectation about the use of detailed data, since if you got more data you could get better measures. Inspired by some articles already published with proposals for modeling such not grouped data, this dissertation proposes a new model and evaluate its predictive ability and gain of knowledge about the process of occurrence and notice of the claim against that one can get from the traditional methods applied to data of amount of claims for obtain the amount of IBNR claims and their distribution.
|
4 |
Modelos não lineares truncados mistos para locação e escalaParaiba, Carolina Costa Mota 14 January 2015 (has links)
Made available in DSpace on 2016-06-02T20:04:53Z (GMT). No. of bitstreams: 1
6714.pdf: 1130315 bytes, checksum: 4ce881df9c6c0f6451cae6908855d277 (MD5)
Previous issue date: 2015-01-14 / Financiadora de Estudos e Projetos / We present a class of nonlinear truncated mixed-effects models where the truncation nature of the data is incorporated into the statistical model by assuming that the variable of interest, namely the truncated variable, follows a truncated distribution which, in turn, corresponds to a conditional distribution obtained by restricting the support of a given probability distribution function. The family of nonlinear truncated mixed-effects models for location and scale is constructed based on the perspective of nonlinear generalized mixed-effects models and by assuming that the distribution of response variable belongs to a truncated class of distributions indexed by a location and a scale parameter. The location parameter of the response variable is assumed to be associated with a continuous nonlinear function of covariates and unknown parameters and with unobserved random effects, and the scale parameter of the responses is assumed to be characterized by a continuous function of the covariates and unknown parameters. The proposed truncated nonlinear mixed-effects models are constructed assuming both random truncation limits; however, truncated nonlinear mixed-effects models with fixed known limits are readily obtained as particular cases of these models. For models constructed under the assumption of random truncation limits, the likelihood function of the observed data shall be a function both of the parameters of the truncated distribution of the truncated variable and of the parameters of the distribution of the truncation variables. For the particular case of fixed known truncation limits, the likelihood function of the observed data is a function only of the parameters of the truncated distribution assumed for the variable of interest. The likelihood equation resulting from the proposed truncated nonlinear regression models do not have analytical solutions and thus, under the frequentist inferential perspective, the model parameters are estimated by direct maximization of the log-likelihood using an iterative procedure. We also consider diagnostic analysis to check for model misspecification, outliers and influential observations using standardized residuals, and global and local influence metrics. Under the Bayesian perspective of statistical inference, parameter estimates are computed based on draws from the posterior distribution of parameters obtained using an Markov Chain Monte Carlo procedure. Posterior predictive checks, Bayesian standardized residuals and a Bayesian influence measures are considered to check for model adequacy, outliers and influential observations. As Bayesian model selection criteria, we consider the sum of log -CPO and a Bayesian model selection procedure using a Bayesian mixture model framework. To illustrate the proposed methodology, we analyze soil-water retention, which are used to construct soil-water characteristic curves and which are subject to truncation since soil-water content (the proportion of water in soil samples) is limited by the residual soil-water content and the saturated soil-water content. / Neste trabalho, apresentamos uma classe de modelos não lineares truncados mistos onde a característica de truncamento dos dados é incorporada ao modelo estatístico assumindo-se que a variável de interesse, isto é, a variável truncada, possui uma função de distribuição truncada que, por sua vez, corresponde a uma função de distribuição condicional obtida ao se restringir o suporte de alguma função de distribuição de probabilidade. A família de modelos não lineares truncados mistos para locação e escala é construída sob a perspectiva de modelos não lineares generalizados mistos e considerando uma classe de distribuições indexadas por parâmetros de locação e escala. Assumimos que o parâmetro de locação da variável resposta é associado a uma função não linear contínua de um conjunto de covariáveis e parâmetros desconhecidos e a efeitos aleatórios não observáveis, e que o parâmetro de escala das respostas pode ser caracterizado por uma função contínua das covariáveis e de parâmetros desconhecidos. Os modelos não lineares truncados mistos para locação e escala, aqui apresentados, são construídos supondo limites de truncamento aleatórios, porém, modelos não lineares truncados mistos com limites fixos e conhecidos são prontamente obtidos como casos particulares desses modelos. Nos modelos construídos sob a suposição de limites de truncamentos aleatórios, a função de verossimilhança é escrita em função dos parâmetros da distribuição da variável resposta truncada e dos parâmetros das distribuições das variáveis de truncamento. Para o caso particular de limites fixos e conhecidos, a função de verossimilhança será apenas uma função dos parâmetros da distribuição truncada assumida para a variável resposta de interesse. As equações de verossimilhança dos modelos, aqui propostos, não possuem soluções analíticas e, sob a perspectiva frequentista de inferência estatística, os parâmetros do modelo são estimados pela maximização direta da função de log-verossimilhança via um procedimento iterativo. Consideramos, também, uma análise de diagnóstico para verificar a adequação do modelo, observações discrepantes e/ou influentes, usando resíduos padronizados e medidas de influência global e influência local. Sob a perspectiva Bayesiana de inferência estatística, as estimativas dos parâmetros dos modelos propostos são definidas como as médias a posteriori de amostras obtidas via um algoritmo do tipo cadeia de Markov Monte Carlo das distribuições a posteriori dos parâmetros. Para a análise de diagnóstico Bayesiano do modelo, consideramos métricas de avaliação preditiva a posteriori, resíduos Bayesianos padronizados e a calibração de casos para diagnóstico de influência. Como critérios Bayesianos de seleção de modelos, consideramos a soma de log -CPO e um critério de seleção de modelos baseada na abordagem Bayesiana de mistura de modelos. Para ilustrar a metodologia proposta, analisamos dados de retenção de água em solo, que são usados para construir curvas de retenção de água em solo e que estão sujeitos a truncamento pois as medições de umidade de água (a proporção de água presente em amostras de solos) são limitadas pela umidade residual e pela umidade saturada do solo amostrado.
|
5 |
Estimação clássica e bayesiana para relação espécieárea com distribuições truncadas no zeroArrabal, Claude Thiago 23 March 2012 (has links)
Made available in DSpace on 2016-06-02T20:06:07Z (GMT). No. of bitstreams: 1
4453.pdf: 2980949 bytes, checksum: a5e49490266d2a0b649d487d8bf298d5 (MD5)
Previous issue date: 2012-03-23 / Financiadora de Estudos e Projetos / In ecology, understanding the species-area relationship (SARs) are extremely important to determine species diversity. SARs are fundamental to assess the impact due to the destruction of natural habitats, creation of biodiversity maps, to determine the minimum area to preserve. In this study, the number of species is observed in different area sizes. These studies are referred in the literature through nonlinear models without assuming any distribution for the data. In this situation, it only makes sense to consider areas in which the counts of species are greater than zero. As the dependent variable is a count data, we assume that this variable comes from a known distribution for discrete data positive. In this paper, we used the zero truncated Poisson distribution (ZTP) and zero truncated Negative Binomial (ZTNB) to represent the probability distribution of the random variable species diversity number. To describe the relationship between species diversity and habitat, we consider nonlinear models with asymptotic behavior: Exponencial Negativo, Weibull, Logístico, Chapman-Richards, Gompertz e Beta. In this paper, we take a Bayesian approach to fit models. With the purpose of obtain the conditional distributions, we propose the use of latent variables to implement the Gibbs sampler. Introducing a comparative study through simulated data and will consider an application to a real data set. / Em ecologia, a compreensão da relação espécie-área (SARs) é de extrema importância para a determinação da diversidade de espécies e avaliar o impacto devido à destruição de habitats naturais. Neste estudo, observa-se o número de espécies em diferentes tamanhos de área. Estes estudos são abordados na literatura através de modelos não lineares sem assumir alguma distribuição para os dados. Nesta situação, só faz sentido considerar áreas nas quais as contagens das espécies são maiores do que zero. Como a variável dependente é um dado de contagem, assumiremos que esta variável provém de alguma distribuição conhecida para dados discretos positivos. Neste trabalho, utilizamos as distribuições de Poisson zero-truncada (PZT) e Binomial Negativa zero-truncada (BNZT) para representar a distribuição do número de espécies. Para descrever a relação espécie-área, consideramos os modelos não lineares com comportamento assintótico: Exponencial Negativo, Weibull, Logístico, Chapman-Richards, Gompertz e Beta. Neste trabalho os modelos foram ajustados através do método de verossimilhança, sendo proposto uma abordagem Bayesiana com a utilização de variáveis latentes auxiliares para a implementação do Amostrador de Gibbs.
|
Page generated in 0.0758 seconds