81 |
Analysis of clustered longitudinal count data /Gao, Dexiang. January 2007 (has links)
Thesis (Ph.D. in Analytic Health Sciences, Department of Preventive Medicine and Biometrics) -- University of Colorado Denver, 2007. / Typescript. Includes bibliographical references (leaves 75-77). Free to UCD affiliates. Online version available via ProQuest Digital Dissertations;
|
82 |
Modelagem estatística para a determinação de resultados de dados esportivos.Suzuki, Adriano Kamimura 27 June 2007 (has links)
Made available in DSpace on 2016-06-02T20:05:59Z (GMT). No. of bitstreams: 1
DissAKS.pdf: 566811 bytes, checksum: b01be331b665ab0824c5ab32218e4354 (MD5)
Previous issue date: 2007-06-27 / Financiadora de Estudos e Projetos / The basic result of a soccer game is the final scoreboard, which can be seen as a
bivariate random vector. Theoretically and based on existent literature we can argue that
the number of marked gols by a team in a game obeys a (univariate) Poisson distribution.
Thus, the Bivariate Poisson distributions are studied, in special for the class "of Holgate"
(1964).
Using as information the recent results of the teams, whose confrontation we want to
model, several methods were used for parameters estimation of the Bivariate Poisson class
"of Holgate". The idea is to use procedures that supply the probabilities of occurrence of
placares, so that thus the probability of the occurrence of a certain result (team home´s
victory, draw or defeat) can be calculated properly.
The parameters of Bivariate Poisson distribution "of Holgate" are assumed to have a
dependence factors, such as attack, defense and field, that possibly explain the numbers
of goals. / O resultado básico de uma partida de futebol é o seu placar …nal, que pode ser visto
como um vetor aleatório bivariado. Teoricamente e baseando-se na literatura existente
podemos argumentar que o número de gols marcados por um time em uma dada partida
obedeça a uma distribuição (univariada) de Poisson. Assim, são estudadas as distribuições
de Poisson Bivariadas, com destaque para a classe "de Holgate" (1964).
Utilizando como informações os resultados recentes dos times, cujo confronto se queira
modelar, foram utilizados vários métodos para a estimação de parâmetros da densidade da
classe Poisson Bivariada "de Holgate". A idéia é considerar procedimentos que forneçam
as probabilidades de ocorrência de placares, para que assim a probabilidade da ocorrência
de um determinado resultado (vitória do time mandante, empate ou derrota) possa ser
obtido.
Os parâmetros da distribuição de Poisson Bivariada "de Holgate" são assumidos terem
dependência de fatores, tais como ataque, defesa e campo, que possivelmente explicam os
números de gols feitos.
|
83 |
Modelos não lineares para dados de contagem longitudinais / Non linear models for count longitudinal dataAna Maria Souza de Araujo 16 February 2007 (has links)
Experimentos em que medidas são realizadas repetidamente na mesma unidade experimental são comuns na área agronômica. As técnicas estatísticas utilizadas para análise de dados desses experimentos são chamadas de análises de medidas repetidas, tendo como caso particular o estudo de dados longitudinais, em que uma mesma variável resposta é observada em várias ocasiões no tempo. Além disso, o comportamento longitudinal pode seguir um padrão não linear, o que ocorre com freqüência em estudos de crescimento. Também são comuns experimentos em que a variável resposta refere-se a contagem. Este trabalho abordou a modelagem de dados de contagem, obtidos a partir de experimentos com medidas repetidas ao longo do tempo, em que o comportamento longitudinal da variável resposta é não linear. A distribuição Poisson multivariada, com covariâncias iguais entre as medidas, foi utilizada de forma a considerar a dependência entre os componentes do vetor de observações de medidas repetidas em cada unidade experimental. O modelo proposto por Karlis e Meligkotsidou (2005) foi estendido para dados longitudinais provenientes de experimentos inteiramente casualizados. Modelos para experimentos em blocos casualizados, supondo-se efeitos fixos ou aleatórios para blocos, foram também propostos. A ocorrência de superdispersão foi considerada e modelada através da distribuição Poisson multivariada mista. A estimação dos parâmetros foi realizada através do método de máxima verossimilhança, via algoritmo EM. A metodologia proposta foi aplicada a dados simulados para cada uma das situações estudadas e a um conjunto de dados de um experimento em blocos casualizados em que foram observados o número de folhas de bromélias em seis instantes no tempo. O método mostrou-se eficiente na estimação dos parâmetros para o modelo considerando o delineamento completamente casualizado, inclusive na ocorrência de superdispersão, e delineamento em blocos casualizados com efeito fixo, sem superdispersão e efeito aleatório para blocos. No entanto, a estimação para o modelo que considera efeito fixo para blocos, na presença de superdispersão e para o parâmetro de variância do efeito aleatório para blocos precisa ser aprimorada. / Experiments in which measurements are taken in the same experimental unit are common in agriculture area. The statistical techniques used to analyse data from those experiments are called repeated measurement analysis, and longitudinal study, in which the response variable is observed along the time, is a particular case. The longitudinal behaviour can be non linear, occuring freq¨uently in growth studies. It is also common to have experiments in which the response variable refers to count data. This work approaches the modelling of count data, obtained from experiments with repeated measurements through time, in which the response variable longitudinal behaviour is non linear. The multivariate Poisson distribution, with equal covariances between measurements, was used to consider the dependence between the components of the repeated measurement observation vector in each experimental unit. The Karlis and Meligkotsidou (2005) proposal was extended to longitudinal data obtained from completely randomized. Models for randomized blocks experiments, assuming fixed or random effects for blocks, were also proposed. The occurence of overdispersion was considered and modelled through mixed multivariate Poisson distribution. The parameter estimation was done using maximum likelihood method, via EM algorithm. The methodology was applied to simulated data for all the cases studied and to a data set from a randomized block experiment in which the number of Bromeliads leaves were observed through six instants in time. The method was efficient to estimate the parameters for the completely randomized experiment, including the occurence of overdispersion, and for the randomized blocks experiments assuming fixed effect, with no overdispersion, and random effect for blocks. The estimation for the model that considers fixed effect for block, with overdispersion and for the variance parameters of the random effect for blocks must be improved.
|
84 |
Distribuição espacial e amostragem sequencial de Stegasta bosquella (Chambers, 1875) (Lepidoptera: Gelechiidae) e Enneothrips Flavens Moulton, 1941 (Thysanoptera: Thripidae), em amendoim de porte rasteiro / Spatial distribution and sequential sampling Stegasta Bosquella (Chambers, 1875) (Lepidoptera: Gelechiidae) and Tripes do Prateamento, Enneothrips Flavens Moulton (Thysanoptera: Thripidae), in the peanut cropBoiça Neto, Arlindo Leal [UNESP] 21 October 2016 (has links)
Submitted by ARLINDO LEAL BOIÇA NETO null (arlindoboica@gmail.com) on 2016-11-10T18:24:40Z
No. of bitstreams: 1
Dissertacao_final (CORRIGIDA) com certificado de aprovação.pdf: 2125977 bytes, checksum: 3df4ff312236d23618c3631b2161a7d3 (MD5) / Approved for entry into archive by LUIZA DE MENEZES ROMANETTO null (luizaromanetto@hotmail.com) on 2016-11-16T15:54:24Z (GMT) No. of bitstreams: 1
boica neto_al_dr_jabo.pdf: 2125977 bytes, checksum: 3df4ff312236d23618c3631b2161a7d3 (MD5) / Made available in DSpace on 2016-11-16T15:54:24Z (GMT). No. of bitstreams: 1
boica neto_al_dr_jabo.pdf: 2125977 bytes, checksum: 3df4ff312236d23618c3631b2161a7d3 (MD5)
Previous issue date: 2016-10-21 / O amendoim é cultivado em vários estados no Brasil sendo São Paulo o maior produtor, seguido da Bahia e Mato Grosso. Semeadas em épocas diferentes conforme a região do cultivo, a área cultivada do amendoim na safra de 2014/15 no Brasil abrangeu uma área de 107,4 mil hectares, com uma produção média de 3140 kg ha⁻¹. Duas pragas destacam-se pela importância nessa cultura, sendo a lagarta-do-pescoço-vermelho, Stegasta bosquella (Chambers, 1875) (Lepidoptera: Gelechiidae) e o tripes-do-prateamento, Enneothrips flavens Moulton, 1941 (Thysanoptera: Thripidae) por causarem elevados prejuízos econômicos ao agricultor. Na literatura, poucas informações são relatadas de amostragens de pragas no amendoinzeiro. Assim, associando-se esse fato a importância das duas pragas na cultura do amendoim, se fez necessário um estudo por meio de modelos probabilísticos para avaliar as suas distribuições espaciais e amostragens sequenciais, gerando assim futuras informações aos agricultores para o manejo integrado de pragas nessa cultura. Os experimentos foram conduzidos nos anos de 2013/2014 e 2014/2015, em Jaboticabal – SP, utilizando uma área de 1,08 ha, subdividida em 100 parcelas iguais de 108 m² (10,0 x 10,8 m). Em cada parcela foram avaliadas cinco plantas ao acaso, considerando a presença ou não de insetos de S. bosquella e E. flavens. Pelos dados, observaram-se uma distribuição agregada ou moderadamente agregada de E. flavens e uma distribuição aleatória de S. bosquella; o modelo de distribuição que melhor se ajustou para E. flavens foi a binomial negativa e para lagartas de S. bosquella o modelo de distribuição de Poisson. Estes resultados permitiram a elaboração de planos de amostragem sequencial, na qual, tripes e lagartas apresentam duas retas: uma superior (S1 = 6,3072 + 1,0680 N), (S1 = 3,2134 + 0,3274 N), a partir da qual recomenda-se o controle; e outra inferior (S0 = -6,3072 + 1,0680 N), (S0 = -3,2134 + 0,3274 N), na qual, controle não é recomendado, respectivamente. Pelos resultados analisados, é possível verificar que a amostragem sequencial é eficiente na indicação ou não do controle de E. flavens e S. bosquella na cultura do amendoim. / The Peanuts are grown in several states in Brazil and São Paulo is the largest producer, followed by Bahia and Mato Grosso. Sown at different times as the growing region, the cultivated peanut area in 2014/15 crop in Brazil covered an area of 107,400 hectares, with an average production of 3140 kg ha⁻¹. Two pests stand out the importance that culture, and the red-necked peanut worm, Stegasta bosquella (Chambers, 1875) (Lepidoptera: Gelechiidae) and silvering thrips, Enneothrips flavens Moulton, 1941 (Thysanoptera: Thripidae) to cause high economic losses to the farmer. In the literature, little information is reported samplings pest in groundnut. Thus, associating this fact the importance of the two pests in peanut crop, a study using probabilistic models to assess their spatial and sequential sampling distributions made necessary, thus generating further information to farmers for the integrated pest management that culture. The experiments were conducted in the years 2013/2014 and 2014/2015, in Jaboticabal - SP, using an area of 1,08 ha, divided into 100 equal installments of 108 m² (10,0 x 10,8 m). In each plot were evaluated 5 randomly plants considering the presence or absence of E. flavens insects and S. bosquella. From the data, they observed an aggregate or aggregate distribution moderately E. flavens and a random distribution S. bosquella; the distribution model best fit for E. flavens was the negative binomial and larvae of S. bosquella the Poisson distribution model. These results allowed the development of sequential sampling plans in which, thrips and caterpillars have two lines: an upper (S1 = 6.3072 + 1.0680 N), (S1 = 3.2134 + 0.3274 N), the from which it is recommended to control; and bottom (S0 = -6.3072 + 1.0680 N) (S0 = -3.2134 + 0.3274 N), in which control is not recommended, respectively. The results analyzed, you can see that the sequential sampling is efficient in indicating whether or not the control E. flavens and S. bosquella the peanut crop.
|
85 |
Otimização sob restrições probabilísticas: teoria e aplicaçõesAraújo, Julyana Kelly Tavares de 30 December 2012 (has links)
Made available in DSpace on 2015-05-08T14:53:29Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 1355369 bytes, checksum: 9c8287916a30feac7e9a3d355e472d28 (MD5)
Previous issue date: 2012-12-30 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / This Project brings a Chance Constrained Programming substantial approaching (CCP). This kind of optimization is used to pattern uncertainties and became useful to all kind of knowledge areas. The project main idea was to show CCP s theories and beyond this to present some applications on Engineering and Public Politics areas. It is noteworthy to say that this tool is pretty important for the production systems because of its uncertainties process. So after showing the theory whose purpose is to comprehend the Chance Constrained Programming, this subject commits itself to apply such technique in Emergency Medical Care Production Services (SAMU) in João Pessoa using the proposed model from Beraldi et al. (2004). This application was really useful to define the necessary ambulances to supply João Pessoa s city as well as the local they must be. However, to understand this technique and also work with it it s necessary a previous knowledge of Statistics, Applied Mathematics and Computing. Therefore, this work emphasizes the continuous and discreet random variables, as well as the probabilistic functions and concepts. In Applied Mathematics, this work brings a Linear Optimization, Facility Location and log concave functions. Concerning to computing, it was used MATLAB R007, Google Maps and CPLEX to provide the model. The great benefit of using CCP is that it offers possible solutions to the person who chooses between them, according to the reality. / Este trabalho apresenta uma abordagem de Otimização Probabilística (OP). Esse tipo de Otimização é utilizada para modelar incertezas e se tornou útil em diversas áreas do conhecimento. O objetivo principal deste trabalho foi apresentar a teoria de OP e, além disso, expor algumas aplicações nas áreas de Engenharia e Políticas Públicas. Vale ressaltar que tal ferramenta é muito interessante para Sistemas de Produção por existir incertezas inerentes ao processo. Assim, depois de apresentada tal teoria, com o intuito de melhor compreender a melhor a ferramenta de OP, este trabalho, se propôs a aplicar tal técnica no Sistema de Produção dos Serviços de Atendimento Médico de Urgência (SAMU) da cidade João Pessoa usando o Modelo proposto por Beraldi et al.(2004). A aplicação serviu para definir a quantidade de ambulâncias necessárias para atender a demanda de João Pessoa, assim como os possíveis locais que as mesmas devem estar posicionadas. No entanto, para entender melhor sobre essa técnica e trabalhar com a mesma, é necessário um conhecimento prévio de Estatística, Matemática Aplicada e Computação. Portanto, este trabalho aborda as variáveis aleatórias discretas e contínuas, bem como conceitos de Funções de Probabilidade. Na parte da Matemática Aplicada, este trabalho aborda conceitos de Otimização Linear, Facility Location e funções log. côncavas. Quanto à computação foi utilizado MATLAB R007,Google Maps e CPLEX para realizar a aplicação do Modelo. A grande vantagem da utilização de OP é que a mesma oferece soluções viáveis cujo tomador de decisão tem a opção de escolher qual a melhor solução de acordo com sua realidade.
|
86 |
Modelos lineares generalizados mistos para dados longitudinais. / Generalized linear mixed models in longitudinal data.Silvano Cesar da Costa 13 March 2003 (has links)
Experimentos cujas variaveis respostas s~ ao proporcoes ou contagens, sao muito comuns nas diversas areas do conhecimento, principalmente na area agricola. Na analise desses experimentos, utiliza-se a teoria de modelos lineares generalizados, bastante difundida (McCullagh & Nelder, 1989; Demetrio, 2001), em que as respostas sao independentes. Caso a variancia estimada seja maior do que a esperada, estima-se o parametro de dispersao, incluindo-o no processo de estimaçao dos parametros. Quando a variavel resposta e observada ao longo do tempo, pode haver uma correlacao entre as observacoes e isso tem que ser levado em consideracao na estimacao dos parametros. Uma forma de se trabalhar essa correlacao e aplicando a metodologia de equacoes de estimacao generalizada (EEG), discutida por Liang & Zeger (1986), embora, neste caso, o interesse esteja nas estimativas dos efeitos fixos e a inclusao da matriz de correlacao de trabalho sirva para se obter um melhor ajuste. Uma outra alternativa e a inclusao, no preditor linear, de um efeito latente para captar variabilidades nao consideradas no modelo e que podem in uenciar nos resultados. No presente trabalho, usa-se uma forma combinada de efeito aleatorio e parametro de dispersao, incluidos conjuntamente na estimacao dos parametros. Essa metodologia e aplicada a um conjunto de dados obtidos de um experimento com camu-camu, com objetivo de se avaliarem quais os melhores metodos de enxertia e tipos de porta-enxertos que podem ser utilizados, atraves da proporcao de pegamentos da muda. Varios modelos sao ajustados, desde o modelo em parcelas subdivididas (supondo independencia), ate o modelo em que se considera o parametro de dispersao e efeito aleatorio conjuntamente. Ha evidencias de que o modelo em que se inclui o efeito aleatorio e o parametro de dispersao, conjuntamente, resultam em melhores estimativas dos parametros. Outro conjunto de dados longitudinais, com milho transgenico MON810, em que a variavel resposta e o numero de lagartas (Spodoptera frugiperda), e utilizado. Neste caso, devido ao excesso de respostas zero, emprega-se o modelo de regressao Poisson in acionado de zeros (ZIP), alem do modelo Poisson padrao, em que as observacoes sao consideradas independentes, e do modelo Poisson in acionado de zeros com efeito aleatorio. Os resultados mostram que o efeito aleatorio incluido no preditor foi nao significativo e, assim, o modelo adotado e o modelo de regressao Poisson in acionado de zeros. Os resultados foram obtidos usando-se os procedimentos NLMIXED, GENMOD e GPLOT do SAS - Statistical Analysis System, versao 8.2. / Experiments which response variables are proportions or counts are very common in several research areas, specially in the area of agriculture. The theory of generalized linear models, well difused (McCullagh & Nelder, 1989; Demetrio, 2001), is used for analyzing these experiments where the responses are independent. If the estimated variance is greater than the expected variance, the dispersion parameter is estimated including it on the parameter estimation process. When the response variable is observed over time a correlation among observations might occur and it should be taken into account in the parameter estimation. A way of dealing with this correlation is applying the methodology of generalized estimating equations (GEEs) discussed by Liang & Zeger (1986) although, in this case, the interest is on the estimates of the xed efect being the inclusion of a working correlation matrix useful to obtain more accurate estimates. Another alternative is the inclusion of a latent efect in the linear predictor to explain variabilities not considered in the model that might in uence the results. In this work the random efect and the dispersion parameter are combined and included together in the parameter estimation. Such methodology is applied to a data set obtained from an experiment realized with camu-camu to evaluate, through proportion of grafting well successful of seedling, which kind of grafting and understock are suitable to be used. Several models are fitted, since the split plot model (with independence assumption) up to the model where the dispersion parameter and the random efect are considered together. There is evidence that the model including the random efect and the dispersion parameter together, produce better estimates of the parameters. Another longitudinal data set used here comes from an experiment realized with the MON810 transgenic corn where the response variable is the number of caterpillars (Spodoptera frugiperda). In this case, due to the excessive number of zeros obtained, the zero in ated Poisson regression model (ZIP) is used in addition to the standard Poisson model, where observations are considered independent, and the zero in ated Poisson regression model with random efect. The results show that the random efect included in the linear predictor was not significant and, therefore, the adopted model is the zero in ated Poisson regression model. The results were obtained using the procedures NLMIXED, GENMOD and GPLOT available on SAS - Statistical Analysis System, version 8.2.
|
87 |
Modelos para análise de dados discretos longitudinais com superdispersão / Models for analysis of longitudinal discrete data in the presence of overdispersionFernanda Bührer Rizzato 08 February 2012 (has links)
Dados longitudinais na forma de contagens e na forma binária são muito comuns, os quais, frequentemente, podem ser analisados por distribuições de Poisson e de Bernoulli, respectivamente, pertencentes à família exponencial. Duas das principais limitações para modelar esse tipo de dados são: (1) a ocorrência de superdispersão, ou seja, quando a variabilidade dos dados não é adequadamente descrita pelos modelos, que muitas vezes apresentam uma relação pré-estabelecida entre a média e a variância, e (2) a correlação existente entre medidas realizadas repetidas vezes na mesma unidade experimental. Uma forma de acomodar a superdispersão é pela utilização das distribuições binomial negativa e beta binomial, ou seja, pela inclusão de um efeito aleatório com distribuição gama quando se considera dados provenientes de contagens e um efeito aleatório com distribuição beta quando se considera dados binários, ambos introduzidos de forma multiplicativa. Para acomodar a correlação entre as medidas realizadas no mesmo indivíduo podem-se incluir efeitos aleat órios com distribuição normal no preditor linear. Esses situações podem ocorrer separada ou simultaneamente. Molenberghs et al. (2010) propuseram modelos que generalizam os modelos lineares generalizados mistos Poisson-normal e Bernoulli-normal, incorporando aos mesmos a superdispersão. Esses modelos foram formulados e ajustados aos dados, usando-se o método da máxima verossimilhança. Entretanto, para um modelo de efeitos aleatórios, é natural pensar em uma abordagem Bayesiana. Neste trabalho, são apresentados modelos Bayesianos hierárquicos para dados longitudinais, na forma de contagens e binários que apresentam superdispersão. A análise Bayesiana hierárquica é baseada no método de Monte Carlo com Cadeias de Markov (MCMC) e para implementação computacional utilizou-se o software WinBUGS. A metodologia para dados na forma de contagens é usada para a análise de dados de um ensaio clínico em pacientes epilépticos e a metodologia para dados binários é usada para a análise de dados de um ensaio clínico para tratamento de dermatite. / Longitudinal count and binary data are very common, which often can be analyzed by Poisson and Bernoulli distributions, respectively, members of the exponential family. Two of the main limitations to model this data are: (1) the occurrence of overdispersion, i.e., the phenomenon whereby variability in the data is not adequately captured by the model, and (2) the accommodation of data hierarchies owing to, for example, repeatedly measuring the outcome on the same subject. One way of accommodating overdispersion is by using the negative-binomial and beta-binomial distributions, in other words, by the inclusion of a random, gamma-distributed eect when considering count data and a random, beta-distributed eect when considering binary data, both introduced by multiplication. To accommodate the correlation between measurements made in the same individual one can include normal random eects in the linear predictor. These situations can occur separately or simultaneously. Molenberghs et al. (2010) proposed models that simultaneously generalizes the generalized linear mixed models Poisson-normal and Bernoulli-normal, incorporating the overdispersion. These models were formulated and tted to the data using maximum likelihood estimation. However, these models lend themselves naturally to a Bayesian approach as well. In this paper, we present Bayesian hierarchical models for longitudinal count and binary data in the presence of overdispersion. A hierarchical Bayesian analysis is based in the Monte Carlo Markov Chain methods (MCMC) and the software WinBUGS is used for the computational implementation. The methodology for count data is used to analyse a dataset from a clinical trial in epileptic patients and the methodology for binary data is used to analyse a dataset from a clinical trial in toenail infection named onychomycosis.
|
88 |
Aspectos estatísticos da amostragem de água de lastro / Statistical aspects of ballast water samplingEliardo Guimarães da Costa 01 March 2013 (has links)
A água de lastro de navios é um dos principais agentes dispersivos de organismos nocivos à saúde humana e ao meio ambiente e normas internacionais exigem que a concentração desses organismos no tanque seja menor que um valor previamente especificado. Por limitações de tempo e custo, esse controle requer o uso de amostragem. Sob a hipótese de que a concentração desses organismos no tanque é homogênea, vários autores têm utilizado a distribuição Poisson para a tomada de decisão com base num teste de hipóteses. Como essa proposta é pouco realista, estendemos os resultados para casos em que a concentração de organismos no tanque é heterogênea utilizando estratificação, processos de Poisson não-homogêneos ou assumindo que ela obedece a uma distribuição Gama, que induz uma distribuição Binomial Negativa para o número de organismos amostrados. Além disso, propomos uma nova abordagem para o problema por meio de técnicas de estimação baseadas na distribuição Binomial Negativa. Para fins de aplicação, implementamos rotinas computacionais no software R / Ballast water is a leading dispersing agent of harmful organisms to human health and to the environment and international standards require that the concentration of these organisms in the tank must be less than a prespecified value. Because of time and cost limitations, this inspection requires the use of sampling. Under the assumption of an homogeneous organism concentration in the tank, several authors have used the Poisson distribution for decision making based on hypothesis testing. Since this proposal is unrealistic, we extend the results for cases in which the organism concentration in the tank is heterogeneous, using stratification, nonhomogeneous Poisson processes or assuming that it follows a Gamma distribution, which induces a Negative Binomial distribution for the number of sampled organisms. Furthermore, we propose a novel approach to the problem through estimation techniques based on the Negative Binomial distribution. For practical applications, we implemented computational routines using the R software
|
89 |
Abordagem clássica e bayesiana para os modelos de séries temporais da família GARMA com aplicações para dados de contagem / Classical and bayesian approach for time series models of the family GARMA with applications to count dataAdriana Strieder Philippsen 31 March 2011 (has links)
Nesta dissertação estudou-se o modelo GARMA para modelar séries temporais de dados de contagem com as distribuições condicionais de Poisson, binomial e binomial negativa. A principal finalidade foi analisar no contexto clássico e bayesiano, o desempenho e a qualidade do ajuste dos modelos de interesse, bem como o desempenho dos percentis de cobertura dos intervalos de confiança dos parâmetros para os modelos adotados. Para atingir tal finalidade considerou-se a análise dos estimadores pontuais bayesianos e foram analisados intervalos de credibilidade. Neste estudo é proposta uma distribuição a priori conjugada para os parâmetros dos modelos e busca-se a distribuição a posteriori, a qual associada a certas funções de perda permite encontrar estimativas bayesianas para os parâmetros. Na abordagem clássica foram calculados estimadores de máxima verossimilhança, usandose o método de score de Fisher e verificou-se por meio de simulação a consistência dos mesmos. Com os estudos desenvolvidos pode-se observar que, tanto a inferência clássica quanto a inferência bayesiana para os parâmetros dos modelos em questão, apresentou boas propriedades analisadas por meio das propriedades dos estimadores pontuais. A última etapa do trabalho consiste na análise de um conjunto de dados reais, sendo uma série real correspondente ao número de internações por causa da dengue em Campina Grande. Estes resultados mostram que tanto o estudo clássico, quanto o bayesiano, são capazes de descrever bem o comportamento da série / In this work, it was studied the GARMA model to model time series count data with Poisson, binomial and negative binomial discrete conditional distributions. The main goal is to analyze, in the bayesian and classic context, the performance and the quality of fit of the corresponding models, as well as the coverage percentages performance to these models. To achieve this purpose we considered the analysis of Bayesian estimators and credible intervals were analyzed. To the Bayesian study it was proposed a priori distribution joined to the models parameters and sought a posteriori distribution, which one associate with to certain loss functions allows finding out Bayesian estimates to the parameters. In the classical approach, it was calculated the maximum likelihood estimators using the method of Fisher scoring, whose interest was to verify, by simulation, the consistence. With the studies developed we can notice that, both classical and inference Bayesian inference for the parameters of those models, presented good properties analysed through the properties of the punctual estimators. The last stage of the work consisted of the analysis of one real data set, being a real serie corresponding to the admission number because of dengue in the city of Campina Grande. These results show that both the classic and the Bayesian studies are able to describe well the behavior of the serie
|
90 |
Modelos para análise de dados discretos longitudinais com superdispersão / Models for analysis of longitudinal discrete data in the presence of overdispersionRizzato, Fernanda Bührer 08 February 2012 (has links)
Dados longitudinais na forma de contagens e na forma binária são muito comuns, os quais, frequentemente, podem ser analisados por distribuições de Poisson e de Bernoulli, respectivamente, pertencentes à família exponencial. Duas das principais limitações para modelar esse tipo de dados são: (1) a ocorrência de superdispersão, ou seja, quando a variabilidade dos dados não é adequadamente descrita pelos modelos, que muitas vezes apresentam uma relação pré-estabelecida entre a média e a variância, e (2) a correlação existente entre medidas realizadas repetidas vezes na mesma unidade experimental. Uma forma de acomodar a superdispersão é pela utilização das distribuições binomial negativa e beta binomial, ou seja, pela inclusão de um efeito aleatório com distribuição gama quando se considera dados provenientes de contagens e um efeito aleatório com distribuição beta quando se considera dados binários, ambos introduzidos de forma multiplicativa. Para acomodar a correlação entre as medidas realizadas no mesmo indivíduo podem-se incluir efeitos aleat órios com distribuição normal no preditor linear. Esses situações podem ocorrer separada ou simultaneamente. Molenberghs et al. (2010) propuseram modelos que generalizam os modelos lineares generalizados mistos Poisson-normal e Bernoulli-normal, incorporando aos mesmos a superdispersão. Esses modelos foram formulados e ajustados aos dados, usando-se o método da máxima verossimilhança. Entretanto, para um modelo de efeitos aleatórios, é natural pensar em uma abordagem Bayesiana. Neste trabalho, são apresentados modelos Bayesianos hierárquicos para dados longitudinais, na forma de contagens e binários que apresentam superdispersão. A análise Bayesiana hierárquica é baseada no método de Monte Carlo com Cadeias de Markov (MCMC) e para implementação computacional utilizou-se o software WinBUGS. A metodologia para dados na forma de contagens é usada para a análise de dados de um ensaio clínico em pacientes epilépticos e a metodologia para dados binários é usada para a análise de dados de um ensaio clínico para tratamento de dermatite. / Longitudinal count and binary data are very common, which often can be analyzed by Poisson and Bernoulli distributions, respectively, members of the exponential family. Two of the main limitations to model this data are: (1) the occurrence of overdispersion, i.e., the phenomenon whereby variability in the data is not adequately captured by the model, and (2) the accommodation of data hierarchies owing to, for example, repeatedly measuring the outcome on the same subject. One way of accommodating overdispersion is by using the negative-binomial and beta-binomial distributions, in other words, by the inclusion of a random, gamma-distributed eect when considering count data and a random, beta-distributed eect when considering binary data, both introduced by multiplication. To accommodate the correlation between measurements made in the same individual one can include normal random eects in the linear predictor. These situations can occur separately or simultaneously. Molenberghs et al. (2010) proposed models that simultaneously generalizes the generalized linear mixed models Poisson-normal and Bernoulli-normal, incorporating the overdispersion. These models were formulated and tted to the data using maximum likelihood estimation. However, these models lend themselves naturally to a Bayesian approach as well. In this paper, we present Bayesian hierarchical models for longitudinal count and binary data in the presence of overdispersion. A hierarchical Bayesian analysis is based in the Monte Carlo Markov Chain methods (MCMC) and the software WinBUGS is used for the computational implementation. The methodology for count data is used to analyse a dataset from a clinical trial in epileptic patients and the methodology for binary data is used to analyse a dataset from a clinical trial in toenail infection named onychomycosis.
|
Page generated in 0.0796 seconds