A simulação de dados que seguem distribuição de Poisson é essencial em muitas aplicações reais de várias áreas, tais como saúde, marketing, ciências agronômicas, entre outras em que os dados são contagens multivariadas. Métodos de simulação atuais sofrem de limitações computacionais e restrições à estrutura de correlação e, portanto, são raramente usados. Neste trabalho propôs-se uma modificação do método NORTA para gerar dados com distribuição Poisson multivariada a partir de uma distribuição normal multivariada com matriz de correlações e vetor de médias pré estabelecidos. Como as distribuições Normal multivariada e univariada e a distribuição Poisson univariada já estão implementadas em softwares estatísticos, inclusive no R, implementou-se algumas linhas de código. Mostrou-se que o método funciona bem e é altamente preciso na geração de dados multivariados com distribuição marginais de Poisson, para diferentes estruturas de correlações (negativas e positivas e variando os valores) e para altos e baixos valores de médias. Mostrou-se as vantagens práticas da simulação de dados de Poisson multivariada sobre a normal multivariada na detecção da taxa de falsos alertas de super populações de percevejos, evidenciando que simulações inadequadas podem levar a excesso de falsos alertas. Uma vez que os dados seguem distribuição Poisson multivariada, a taxa de falsos alertas pode ser maior do que a imaginada. Essa taxa pode ser estimada por um modelo ajustado. A mesma técnica pode ser aplicada em diversos problemas de várias áreas do conhecimento. / The simulation data that follow a Poisson distribution is essential in many real applications in various areas such as healthcare, marketing, agronomic sciences, among others that the data are multivariate counts. Current simulation methods suffer from limitations and constraints on computing correlation structure and are therefore seldom used. This paper proposed a modification of the NORTA method for generating data with multivariate Poisson distribution from a multivariate normal distribution with correlation matrix and vector of predetermined average. As the multivariate and univariate Normal distribution and univariate Poisson distribution are already implemented in statistical software, including R, was implemented just a few lines of code. It was shown that the method works well and is highly accurate in generating multivariate data with marginal Poisson distribution structures for different correlations (negative and positive values) and for high and low ?. Proved the practical benefits of the simulation data on the multivariate Poisson multivariate normal in the detection of super bugs populations, inadequate simulations can lead to excessive false alerts. Once the data are multivariate Poisson distribution, the rate of false alarms can be greater than the imagined. This rate can be estimated by an adjusted model. The same technique can be applied to many problems in various fields of knowledge.
Identifer | oai:union.ndltd.org:IBICT/oai:teses.usp.br:tde-06052014-165527 |
Date | 07 March 2014 |
Creators | Raphael Antonio Prado Dias |
Contributors | Carlos Tadeu dos Santos Dias, Lúcio Borges de Araújo, José Silvio Govone, Cesar Goncalves de Lima, Sonia Maria de Stefano Piedade |
Publisher | Universidade de São Paulo, Agronomia (Estatística e Experimentação Agronômica), USP, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Source | reponame:Biblioteca Digital de Teses e Dissertações da USP, instname:Universidade de São Paulo, instacron:USP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0024 seconds