Spelling suggestions: "subject:"algoritmo Em"" "subject:"lgoritmo Em""
21 |
Modelos de sobreviv?ncia com fra??o de cura e omiss?o nas covari?veisFonseca, Renata Santana 06 March 2009 (has links)
Made available in DSpace on 2014-12-17T15:26:37Z (GMT). No. of bitstreams: 1
RenataSF.pdf: 443214 bytes, checksum: 93598adf420b7d48eb5b8b2c6e619c38 (MD5)
Previous issue date: 2009-03-06 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / In this work we study the survival cure rate model proposed by Yakovlev (1993) that are considered in a competing risk setting. Covariates are introduced for modeling the cure rate and we allow some covariates to have missing values. We consider only the cases by which the missing covariates are categorical and implement the EM algorithm via the method of weights for maximum likelihood estimation. We present a Monte Carlo simulation experiment to compare the properties of the estimators based on this method with those estimators under the complete case scenario. We also evaluate, in this experiment, the impact in the parameter estimates when we increase the proportion of immune and censored individuals among the not immune one. We demonstrate the proposed methodology with a real data set involving the time until the graduation for the undergraduate course of Statistics of the Universidade Federal do Rio Grande do Norte / Neste trabalho estudamos o modelo de sobreviv^encia com fra??o de cura proposto por Yakovlev et al. (1993) que possui uma estrutura de riscos competitivos. Covari?veis s?o introduzidas para modelar o n?mero m?dio de riscos e permitimos que algumas destas covari?veis apresentem omiss?o. Consideramos apenas os casos em que as covari?veis omissas s?o categ?ricas e as estimativas dos par?metros s?o obtidas atrav?s do algoritmo EM ponderado. Apresentamos uma s?rie de simula??es para confrontar as estimativas obtidas atrav?s deste m?todo com as obtidas quando se exclui do banco de dados as observa??es que apresentam omiss?o, conhecida como an?lise de casos completos.
Avaliamos tamb?m atrav?s de simula??es, o impacto na estimativa dos par?metros quando aumenta-se o percentual de curados e de censura entre indiv?duos n?o curados. Um conjunto de dados reais referentes ao tempo at? a conclus?o do curso de estat?stica
na Universidade Federal do Rio Grande do Norte ? utilizado para ilustrar o m?todo.
|
22 |
Multivariate skew-normal/independent distributions: properties and inference / Multivariate skew-normal/independent distributions: properties and inferenceLachos, Victor H., Labra, Filidor V. 25 September 2017 (has links)
Liu (1996) discussed a class of robust normal/independent distributions which contains a group of thick-tailed cases. In this article, we develop a skewed version of these distributions in the multivariate setting, and we call them multivariate skew normal/independent distributions. We derive several useful properties for them. The main virtue of the members of this family is that they are easy to simulate and lend themselves to an EM-type algorithm for maximum likelihood estimation. For two multivariate models of practical interest, the EM-type algorithm has been discussed with emphasis on the skew-t, the skew-slash, and the contaminated skew-normal distributions. Results obtained from simulated and two real data sets are also reported. / Liu (1996) discute una clase de distribuciones robustas a las que apela como normal/independiente, y que contiene un grupo de distribuciones de colas pesadas. En este artículo desarrollamos una versión asimétrica de tales distribuciones en un escenario multivariado, a las que llamaremos distruciones normales asimétricas independientes multivariadas. Para tales distribuciones derivamos algunas propiedades. La principal virtud de los miembros de esta familia es que son fáciles de simular y se prestan a un algoritmo de tipo EM para realizar estimaciones de máxima verosimilitud de sus parámetros. Para dos modelos multivariados de interés práctico se discute el algoritmo EM con énfasis en las distribuciones t-asimétrica, slash asimétrica y normal asimétrica contaminada. Los resultados obtenidos a partir de simulaciones y de dos conjuntos de datos reales son reportados.
|
23 |
Distribuição slash multivariada aplicada a dados agrícolas / Multivariate slash distribution applied to agricultural dataFagundes, Regiane Slongo 17 January 2017 (has links)
Submitted by Neusa Fagundes (neusa.fagundes@unioeste.br) on 2017-09-25T18:57:03Z
No. of bitstreams: 1
Regiane_Fagundes2017.pdf: 6331934 bytes, checksum: faab7007f3c7c2e91c6bf26bc30fea8e (MD5) / Made available in DSpace on 2017-09-25T18:57:03Z (GMT). No. of bitstreams: 1
Regiane_Fagundes2017.pdf: 6331934 bytes, checksum: faab7007f3c7c2e91c6bf26bc30fea8e (MD5)
Previous issue date: 2017-01-17 / Fundação Araucária de Apoio ao Desenvolvimento Científico e Tecnológico do Estado do Paraná (FA) / This study aimed at a discussing problems of multivariate statistical inference and linear spatial modeling when observations are from a continuous, symmetric population, with multivariate slash distribution. Firstly, a reparametrization of slash distribution was performed, assuming the existence of the finite second moment. Thus, some iterant properties were shown. Analytical expressions were tested for the score function and Fisher information matrix of reparameterized distribution. An approach to estimate some parameters by maximum likelihood was considered based at the EM (Expectation-Maximization) algorithm. Linear hypothesis tests have been described regarding the means vector and the covariance matrix using statistics such as C(α), likelihood ratio, Wald, and score. Studies of simulation were carried out to evaluate the efficiency of the statistical tests and EM algorithm. Data related to the agricultural area illustrated the methodology developed, and the hypothesis tests for equality of means, sphericity and equicorrelation were also applied. A slash linear spatial model, with and without the use of covariates, was proposed. Were Discussed the global and local influence diagnostic analysis in order to evaluate the influence of observations on the process of parameters’estimation. The curvatures required for the local influence procedure and based on the slash
model were derived, in which the perturbation scheme has been chosen properly and related to the different perturbation schemes. Spatial variability maps of chemical attributes of soil and yield were generated by kriging with external drift. Finally results of simulations and applications indicated that the slash distribution is a robust alternative when the data present high kurtosis. / O objetivo deste trabalho foi discutir problemas de inferência estatística multivariada e
de modelagem espacial quando as observações são provenientes de uma população
contínua, simétrica, com distribuição slash multivariada. Inicialmente, foi realizada uma
reparametrização da distribuição slash supondo existência do segundo momento finito,
sendo apresentadas algumas propriedades recorrentes. Provaram-se expressões analíticas
para a função escore e matriz de informação de Fisher da distribuição reparametrizada.
Abordou-se um enfoque para a estimação dos parâmetros por máxima verossimilhança
considerando um algoritmo do tipo EM (Esperança-Maximização). Descreveu-se a prova de
hipóteses lineares sob o vetor de médias e matriz de covariância com o uso das estatísticas
C(α), razão de verossimilhança, Wald e score. Estudos de simulação foram realizados
para avaliar a eficiência dos testes estatísticos e do algoritmo EM. Dados relacionados à
área agrícola ilustraram a metodologia desenvolvida, sendo aplicado sobre os mesmos os
testes de igualdade de médias, esfericidade e equicorrelação. Como ilustração da aplicação
da distribuição slash multivariada na área de modelagem estatística, o modelo espacial
linear slash, com e sem o uso de covariáveis, foi discutido e proposto. Com o intuito de
avaliar a influência das observações no processo de estimação dos parâmetros, discussões
relacionadas à análise de diagnóstico, global e local, foram apresentadas. Derivaram-se as
curvaturas requeridas no procedimento de influência local para o modelo slash, adequando o
esquema de perturbação a distribuição e considerando diferentes esquemas de perturbação.
Mapas de variabilidade espacial de atributos químicos do solo e produtividade foram gerados
utilizando krigagem com drift externo. Os resultados das simulações e aplicações indicaram
que a distribuição slash é uma alternativa robusta quando os dados apresentam alta curtose.
|
24 |
"Uma aplicação industrial de regressão binária com erros na variável explicativa" / "An industrial application of binary regression with errors-in-variable explanatory"Daniel Fernando de Favari 22 June 2006 (has links)
Neste trabalho, aplicamos um modelo de regressão binária com erros de medição na variável explicativa para analisar sistemas de medição do tipo atributo. Para isto, utilizamos o modelo logístico com erros na variável, para o qual obtemos as estimativas de máxima verossimilhança via o algoritmo EM e a matriz de informação de Fisher observada. Além disso, fizemos um estudo de simulação para compararmos o método analítico e os modelos logístico sem erros na variável (ingênuo) e logístico com erros na variável. Finalmente, aplicamos nossa metodologia para avaliarmos um sistema de medição passa/não passa da maior montadora de motores Diesel (MWM International). / In this work, we apply a study of binary regression model with errors-in-variable to analyze attributive measurement systems. For this, we use the logistic model with errors-in-variable to obtain parameter estimates of maximum likelihood through EM algorithm and the observed Fisher information matrix. In addition we do a simulation study to compare analytic method and the logistic model with and without measurement errors-in-variable. Finally, we apply our methodology to evaluate a attributive measurement system for the largest Diesel motor company of the world (MWM International).
|
25 |
Análise dos resultados de ensaios de proficiência via modelos de regressão com variável explicativa aleatória / Analysis of proficiency tests results via regression models with random explanatory variableAline Othon Montanari 21 June 2004 (has links)
Em um programa de ensaio de prociência (EP) conduzido pelo Grupo de Motores, um grupo de onze laboratórios da área de temperatura realizaram medições em cinco pontos da escala de um termopar. Neste trabalho, propomos um modelo de regressão com variável explicativa X (aleatória) representando o termopar padrão que denominaremos por artefato e a variável dependente Y representando as medições dos laboratórios. O procedimento para a realização da comparação é simples, ambos termopares são colocados no forno e as diferenças entre as medições são registradas. Para a análise dos dados, vamos trabalhar com a diferença entre a diferença das medições do equipamento do laboratório e o artefato, e o valor de referência (que é determinado por 2 laboratórios que pertencem a Rede Brasileira de Calibração (RBC)). O erro de medição tem variância determinada por calibração, isto é, conhecida. Assim, vamos encontrar aproximações para as estimativas de máxima verossimilhança para os parâmetros do modelo via algoritmo EM. Além disso, propomos uma estratégia para avaliar a consistência dos laboratórios participantes do programa de EP / In a program of proficiency assay, a group of eleven laboratories of the temperature area had carried through measurements in ¯ve points on the scale of the thermopair. In this work, we propose a regression model with a random explanatory variable representing the temperature measured by the standard thermopair, which will be called device. The procedure for the comparison accomplishment is as follows. The device and the laboratory\'s thermopair to be tested are placed in the oven and the difererences between the measurements are registered. For the analysis of the data, the response variable is the diference between those diference and the reference value, which is determined by two laboratories that belong to the Brazilian Net of Calibration (RBC). The measurement error has variance determined by calibration which is known. Therefore, we ¯and the maximum likelihood estimates for the parameters of the model via EM algorithm. We consider a strategy to establish the consistency of the participant laboratories of the program of proficiency assay
|
26 |
[pt] COMPARAÇÃO DE MÉTODOS DE MICRO-DADOS E DE TRIÂNGULO RUN-OFF PARA PREVISÃO DA QUANTIDADE IBNR / [en] COMPARISON OF METHODS OF MICRO-DATA AND RUN-OFF TRIANGLE FOR PREDICTION AMOUNT OF IBNR19 May 2014 (has links)
[pt] A reserva IBNR é uma reserva de suma importância para as seguradoras. Seu cálculo tem sido realizado por métodos, em sua grande maioria, determinísticos, tradicionalmente aplicados a informações de sinistros agrupadas num formato particular intitulado triangulo de run-off. Esta forma de cálculo foi muito usada por décadas por sua simplicidade e pela limitação da capacidade de processamento computacional existente. Hoje, com o grande avanço dessa capacidade, não haveria necessidade de deixar de investigar informações relevantes que podem ser perdidas com agrupamento dos dados. Muitas são as deficiências dos métodos tradicionais apontadas na literatura e o uso de informação detalhada tem sido apontado por alguns artigos como a fonte para superação dessas deficiências. Outra busca constante nas metodologias propostas para cálculo da IBNR é pela obtenção de boas medidas de precisão das estimativas obtidas por eles. Neste ponto, sobre o uso de dados detalhados, há a expectativa de obtenção de medidas de precisão mais justas, já que se tem mais dados. Inspirada em alguns artigos já divulgados com propostas
para modelagem desses dados não agrupados esta dissertação propõe um novo modelo, avaliando sua capacidade de predição e ganho de conhecimento a respeito do processo de ocorrência e aviso de sinistros frente ao que se pode obter a partir dos métodos tradicionais aplicados à dados de quantidade para obtenção da quantidade de sinistros IBNR e sua distribuição. / [en] The IBNR reserve is a reserve of paramount importance for insurers. Its calculation has been accomplished by methods, mostly, deterministic, traditionally applied to claims grouped information in a particular format
called run-off triangle . This method of calculation was very adequate for decades because of its simplicity and the limited computational processing capacity existing in the past. Today, with the breakthrough of this capacity, no waiver to investigating relevant information that may be lost with grouping data would be need. Many flaws of the traditional methods has been mentioned in the literature and the use of detailed information has been pointed as a form of overcoming these deficiencies. Another frequent aim in methodologies proposed for the calculation of IBNR is get a good measure of the accuracy of the estimates obtained by them and that is another expectation about the use of detailed data, since if you got more data you could get better measures. Inspired by some articles already published with proposals for modeling such not grouped data, this dissertation proposes a new model and evaluate its predictive ability and gain of knowledge about the process of occurrence and notice of the claim against that one can get from the traditional methods applied to data of amount of claims for obtain the amount of IBNR claims and their distribution.
|
27 |
Calibração linear assimétrica / Asymmetric Linear CalibrationFigueiredo, Cléber da Costa 27 February 2009 (has links)
A presente tese aborda aspectos teóricos e aplicados da estimação dos parâmetros do modelo de calibração linear com erros distribuídos conforme a distribuição normal-assimétrica (Azzalini, 1985) e t-normal-assimétrica (Gómez, Venegas e Bolfarine, 2007). Aplicando um modelo assimétrico, não é necessário transformar as variáveis a fim de obter erros simétricos. A estimação dos parâmetros e das variâncias dos estimadores do modelo de calibração foram estudadas através da visão freqüentista e bayesiana, desenvolvendo algoritmos tipo EM e amostradores de Gibbs, respectivamente. Um dos pontos relevantes do trabalho, na óptica freqüentista, é a apresentação de uma reparametrização para evitar a singularidade da matriz de informação de Fisher sob o modelo de calibração normal-assimétrico na vizinhança de lambda = 0. Outro interessante aspecto é que a reparametrização não modifica o parâmetro de interesse. Já na óptica bayesiana, o ponto forte do trabalho está no desenvolvimento de medidas para verificar a qualidade do ajuste e que levam em consideração a assimetria do conjunto de dados. São propostas duas medidas para medir a qualidade do ajuste: o ADIC (Asymmetric Deviance Information Criterion) e o EDIC (Evident Deviance Information Criterion), que são extensões da ideia de Spiegelhalter et al. (2002) que propôs o DIC ordinário que só deve ser usado em modelos simétricos. / This thesis focuses on theoretical and applied estimation aspects of the linear calibration model with skew-normal (Azzalini, 1985) and skew-t-normal (Gómez, Venegas e Bolfarine, 2007) error distributions. Applying the asymmetrical distributed error methodology, it is not necessary to transform the variables in order to have symmetrical errors. The frequentist and the Bayesian solution are presented. The parameter estimation and its variance estimation were studied using the EM algorithm and the Gibbs sampler, respectively, in each approach. The main point, in the frequentist approach, is the presentation of a new parameterization to avoid singularity of the information matrix under the skew-normal calibration model in a neighborhood of lambda = 0. Another interesting aspect is that the reparameterization developed to make the information matrix nonsingular, when the skewness parameter is near to zero, leaves the parameter of interest unchanged. The main point, in the Bayesian framework, is the presentation of two measures of goodness-of-fit: ADIC (Asymmetric Deviance Information Criterion) and EDIC (Evident Deviance Information Criterion ). They are natural extensions of the ordinary DIC developed by Spiegelhalter et al. (2002).
|
28 |
Calibração linear assimétrica / Asymmetric Linear CalibrationCléber da Costa Figueiredo 27 February 2009 (has links)
A presente tese aborda aspectos teóricos e aplicados da estimação dos parâmetros do modelo de calibração linear com erros distribuídos conforme a distribuição normal-assimétrica (Azzalini, 1985) e t-normal-assimétrica (Gómez, Venegas e Bolfarine, 2007). Aplicando um modelo assimétrico, não é necessário transformar as variáveis a fim de obter erros simétricos. A estimação dos parâmetros e das variâncias dos estimadores do modelo de calibração foram estudadas através da visão freqüentista e bayesiana, desenvolvendo algoritmos tipo EM e amostradores de Gibbs, respectivamente. Um dos pontos relevantes do trabalho, na óptica freqüentista, é a apresentação de uma reparametrização para evitar a singularidade da matriz de informação de Fisher sob o modelo de calibração normal-assimétrico na vizinhança de lambda = 0. Outro interessante aspecto é que a reparametrização não modifica o parâmetro de interesse. Já na óptica bayesiana, o ponto forte do trabalho está no desenvolvimento de medidas para verificar a qualidade do ajuste e que levam em consideração a assimetria do conjunto de dados. São propostas duas medidas para medir a qualidade do ajuste: o ADIC (Asymmetric Deviance Information Criterion) e o EDIC (Evident Deviance Information Criterion), que são extensões da ideia de Spiegelhalter et al. (2002) que propôs o DIC ordinário que só deve ser usado em modelos simétricos. / This thesis focuses on theoretical and applied estimation aspects of the linear calibration model with skew-normal (Azzalini, 1985) and skew-t-normal (Gómez, Venegas e Bolfarine, 2007) error distributions. Applying the asymmetrical distributed error methodology, it is not necessary to transform the variables in order to have symmetrical errors. The frequentist and the Bayesian solution are presented. The parameter estimation and its variance estimation were studied using the EM algorithm and the Gibbs sampler, respectively, in each approach. The main point, in the frequentist approach, is the presentation of a new parameterization to avoid singularity of the information matrix under the skew-normal calibration model in a neighborhood of lambda = 0. Another interesting aspect is that the reparameterization developed to make the information matrix nonsingular, when the skewness parameter is near to zero, leaves the parameter of interest unchanged. The main point, in the Bayesian framework, is the presentation of two measures of goodness-of-fit: ADIC (Asymmetric Deviance Information Criterion) and EDIC (Evident Deviance Information Criterion ). They are natural extensions of the ordinary DIC developed by Spiegelhalter et al. (2002).
|
29 |
Métodos de agrupamento na análise de dados de expressão gênicaRodrigues, Fabiene Silva 16 February 2009 (has links)
Made available in DSpace on 2016-06-02T20:06:03Z (GMT). No. of bitstreams: 1
2596.pdf: 1631367 bytes, checksum: 90f2d842a935f1dd50bf587a33f6a2cb (MD5)
Previous issue date: 2009-02-16 / The clustering techniques have frequently been used in literature to the analyse data in several fields of application. The main objective of this work is to study such techniques. There is a large number of clustering techniques in literature. In this work we concentrate on Self Organizing Map (SOM), k-means, k-medoids and Expectation- Maximization (EM) algorithms. These algorithms are applied to gene expression data. The analisys of gene expression, among other possibilities, identifies which genes are differently expressed in synthesis of proteins associated to normal and sick tissues. The purpose is to do a comparing of these metods, sticking out advantages and disadvantages of such. The metods were tested for simulation and after we apply them to a real data set. / As técnicas de agrupamento (clustering) vêm sendo utilizadas com freqüência na literatura para a solução de vários problemas de aplicações práticas em diversas áreas do conhecimento. O principal objetivo deste trabalho é estudar tais técnicas. Mais especificamente, estudamos os algoritmos Self Organizing Map (SOM), k-means, k-medoids, Expectation-Maximization (EM). Estes algoritmos foram aplicados a dados de expressão gênica. A análise de expressão gênica visa, entre outras possibilidades, a identificação de quais genes estão diferentemente expressos na sintetização de proteínas associados a tecidos normais e doentes. O objetivo deste trabalho é comparar estes métodos no que se refere à eficiência dos mesmos na identificação de grupos de elementos similares, ressaltando vantagens e desvantagens de cada um. Os métodos foram testados por simulação e depois aplicamos as metodologias a um conjunto de dados reais.
|
30 |
Inferência em distribuições discretas bivariadasChire, Verônica Amparo Quispe 26 November 2013 (has links)
Made available in DSpace on 2016-06-02T20:06:09Z (GMT). No. of bitstreams: 1
5618.pdf: 988258 bytes, checksum: 1ce6234a919d1f5b4a4d4fd7482d543c (MD5)
Previous issue date: 2013-11-26 / Financiadora de Estudos e Projetos / The analysis of bivariate data can be found in several areas of knowledge, when the data of interest are obtained in a paired way and present correlation between counts. In this work the Holgate bivariate Poisson, bivariate generalized Poisson and bivariate zero-inflated Poisson models are presented, which are useful to the modeling of bivariate count data correlated. Illustrative applications are presented for these models and the comparison between them is made by using criteria of model selection AIC and BIC, as well as the asymptotic likelihood ratio test. Particularly, we propose a Bayesian approach to the Holgate bivariate Poisson and bivariate zero-inflated Poisson models, based in the Gibbs sampling algorithm with data augmentation. / A análise de dados bivariados pode ser encontrada nas mais diversas áreas do conhecimento, quando os dados de interesse são obtidos de forma pareada e apresentam correlação entre as contagens. Neste trabalho são apresentados os modelos Poisson bivariado de Holgate, Poisson generalizado bivariado e Poisson bivariado inflacionado de zeros, os quais são úteis na modelagem de dados de contagem bivariados correlacionados. Aplicações ilustrativas serão apresentadas para estes modelos e a comparação entre eles será realizada pelos critérios de seleção de modelos AIC e BIC, assim como pelo teste da razão de verossimilhança assintótico. Particularmente, propomos uma abordagem Bayesiana para os modelos Poisson bivariado de Holgate e Poisson Inflacionado de zeros, baseada no algoritmo Gibbs sampling com dados ampliados.
|
Page generated in 0.0526 seconds