Spelling suggestions: "subject:"dados dde contagem"" "subject:"dados dde montagem""
11 |
Utilização de técnicas bayesianas em modelos de regressão de Poisson para dados de contagem longitudinais e dados de contagem com medidas repetidas apresentando excesso de zerosTsuchiya, Nilton 09 June 2008 (has links)
Made available in DSpace on 2016-06-02T20:06:01Z (GMT). No. of bitstreams: 1
1963.pdf: 520432 bytes, checksum: 9c5f5395dcc0f7d0faca9268007ed41f (MD5)
Previous issue date: 2008-06-09 / Financiadora de Estudos e Projetos / In medical and biological researches we often .nd count data. For longitudinal count data, usual Poisson regression models, assuming independence among observations, are not applicable because of the correlation of these measures. This work presents hierarchical Bayesian models considering random e¤ects to analyze longitudinal count data. A Normal and a Gamma distribution are considered to these e¤ects besides the mixture of Normal distributions. We also present zero in.ated Poisson (ZIP) regression models for repeated measures. Markov Chain Monte Carlo (MCMC) is used to estimate the parameters. Keywords: Longitudinal Count Data; Poisson Regression Model; Zero In.ated Model; Hierarchical Model; Bayesian Analysis; MCMC Methods. / Nas pesquisas médicas e biológicas é comum encontrar dados de contagem. Por exem- plo, as variáveis podem ser dadas pelo número de hospitalizações para cada paciente em unidades básicas de saúde. Para dados de contagem longitudinais, o uso de modelos de regressão de Poisson usuais, que assumem independência entre as observações, não é satis- fatório, visto que as observações de um mesmo indivíduo são usualmente correlacionadas. Assim, efeitos aleatórios são considerados para capturar a possível correlação destas ob- servações além de superdispersão associada a outros fatores. Neste trabalho são uti- lizados modelos Bayesianos hierárquicos considerando diferentes distribuições aos efeitos aleatórios para analisar tais tipos de dados. Aos efeitos aleatórios é atribuída uma dis- tribuição normal, uma mistura de distribuições normais ou uma distribuição gama. Tam- bém são apresentados modelos de regressão de Poisson para dados com medidas repetidas apresentando excesso de zeros. Técnicas de simulação estocástica MCMC (Monte Carlo em Cadeias de Markov) são utilizadas para inferência e, em particular, para estimação dos parâmetros de interesse. Além disso, dados reais são considerados para ilustrar as metodologias propostas.
|
12 |
Modelos estatísticos para mapeamento de QTL associados a dados de contagem / Statistical models for QTL mapping associated to counting dataKaren Pallotta Tunin Kamogawa 15 May 2009 (has links)
Este estudo teve por objetivo analisar e comparar metodologias estatísticas para fins de mapeamento de QTL associados à resistência a ectoparasitas em bovinos. Os animais, submetidos à infestação artificial, foram periodicamente avaliados por contagens, como número de carrapatos. Estes dados se caracterizam como medidas repetidas e, via de regra, não atendem ou atendem parcialmente as exigências usuais da análise, para mapeamento de QTL, dentre elas a de apresentar distribuição normal e independência dos erros. Ainda não está bem definido qual seria a melhor estratégia para analisar dados com o perfil descrito. Algumas alternativas seriam transformações de dados que permitam o uso dos programas já disponíveis, ou o desenvolvimento de programas que utilizem outras distribuições como Poisson ou Poisson inflada de zeros (ZIP). Esta proposta está inserida na parceria entre EMBRAPA - Gado de Leite e a ESALQ/USP, para desenvolvimento do projeto de mapeamento de QTL em bovinos mestiços (Gir x Holandês), para várias características incluindo a resistência a parasitas. Foram utilizados 263 animais F2, genotipados com 5 marcadores moleculares no cromossomo 23, na tentativa de mapear QTL para característica de resistência a carrapatos. Dados coletados naquela população F2 e dados simulados em diferentes cenários, serão a base para a comparação de estratégias de análise e mapeamento de QTL. Os modelos de mapeamento clássico, assim como a utilização de transformações dos dados originais foram comparados a modelos de regressão Poisson e modelo ZIP. Os modelos Poisson e ZIP apresentaram os melhores resultados quando trabalhamos com dados de contagem inflacionados de zeros, porém em outros cenários a transformação dos dados originais se mostrou igualmente eficiente. Dependendo do propósito do mapeamento (seja ele localizar ou estimar o efeito), cada modelo possui suas vantagens e suas limitações. Assim, sempre é recomendável uma prévia análise descritiva dos dados para que o melhor modelo seja utilizado. / This study has as main objective to analyze and compare statistical approaches to QTL mapping for parasites resistance in bovines. The animals, under artificial infestation, were periodically evaluated by counting, as ticks count. These data are characterized as repeated measures and, usually, dont follow or partially follow the usual requirements for the analysis, for QTL mapping, that is to present normal distribution and error independence. It is not clear yet which will be the best strategy to analyze this kind of data. Some alternatives could be data transformation that allows the use of software available on the web, or the development of specific programs that use other types of distribution like Poisson or Zero Inflated Poisson (ZIP).This work is an association between EMBRAPA Gado de Leite and ESALQ/USP, to the development of the QTL mapping project for crossbred bovines (Gyr x Holstein), for different characteristics including the parasite resistance. Were used 263 animals F2, genotyped for 5 molecular markers on the chromosome 23, aiming to map QTL for characteristics of parasite resistance. Data collected on this F2 population and simulated data in different scenarios will be the base for the strategies of the QTL mapping approaches comparison. The classical mapping models and the use of data transformation of the original data were compared to Poisson regression and ZIP models. The Poisson and ZIP models presented the best results when working with zero inflated count data however in some other scenarios the data transformation showed similar efficiency. Depending on the purpose of the mapping (this meaning locate or estimate the QTL effect) each model has its vantages and its limitations. This way, it is always advisable to make a previous descriptive analysis of the data to better choose the model.
|
13 |
Modelos série de potência zero-modificado para séries temporais com dados de contagem / Zero-modified power series models for time series with counting dataShirozono, Aimée 10 May 2019 (has links)
O objetivo deste trabalho é propor os modelos Zero Modificados com distribuição na família Série de Potência (ZMPS) para séries temporais com dados de contagem. O modelo ZMPS possui um amplo portfólio de distribuições para dados de contagem em que, com uma função de ligação apropriada, podemos escrever os modelos de regressão usando as distribuições ZMPS de forma semelhante ao que é feito com os modelos lineares generalizados. Em seguida, utilizamos a ideia dos modelos Generalizados Autorregressivos e de Médias Móveis (GARMA) para finalmente propor os modelos Série de Potência Zero-Modificado para Séries Temporais com dados de contagem. / The goal of this work is to propose the Zero-Modified models with Power Series distribution (ZMPS) for time series with counting data. The ZMPS model have a huge portfolio of count data distributions wherein, with an appropriate link function, we can write the regression models using the ZMPS distributions similar to what is done with generalized linear models. Then, we can use the idea of the Generalized Autoregressive and Moving Average (GARMA) models to propose the Zero-Modified Power Series models for Time Series with counting data.
|
14 |
Modelos semiparamétricos com resposta binomial negativa / Semiparametric models with negative binomial responseOki, Fabio Hideto 14 May 2015 (has links)
O objetivo principal deste trabalho é discutir estimação e diagnóstico em modelos semiparamétricos com resposta binomial negativa, mais especificamente, modelos de regressão com resposta binomial negativa em que uma das variáveis explicativas contínuas é modelada de forma não paramétrica. Iniciamos o trabalho com um exemplo ilustrativo e fazemos uma breve revisão dos modelos paramétricos com resposta binomial negativa. Em seguida, introduzimos os modelos semiparamétricos com resposta binomial negativa e discutimos alguns aspectos de estimação, inferência e seleção de modelos. Dedicamos um capítulo a procedimentos de diagnóstico, tais como desenvolvimento de medidas de alavanca e de influência sob os aspectos de deleção de pontos e influência local, além de abordar a análise de resíduos. Reanalizamos o exemplo ilustrativo sob o enfoque semiparamétrico e apresentamos algumas conclusões. / The aim of this work is to discuss some aspects on estimation and diagnostics in negative binomial regression models which an explanatory continuous variable is modeled nonparametrically. First, an illustrative example is presented and analyzed under parametric negative binomial regression models. The proposed models are then introduced and some aspects on estimations, inference and model selection are presented. Particular emphasis is given on the development of diagnostic procedures, such as leverage measures, Cook distances, local influence approach and residuals. The motivated example is reanalyzed under the semiparametric viewpoint and some conclusions are given.
|
15 |
Modelos não lineares para dados de contagem longitudinais / Non linear models for count longitudinal dataAraujo, Ana Maria Souza de 16 February 2007 (has links)
Experimentos em que medidas são realizadas repetidamente na mesma unidade experimental são comuns na área agronômica. As técnicas estatísticas utilizadas para análise de dados desses experimentos são chamadas de análises de medidas repetidas, tendo como caso particular o estudo de dados longitudinais, em que uma mesma variável resposta é observada em várias ocasiões no tempo. Além disso, o comportamento longitudinal pode seguir um padrão não linear, o que ocorre com freqüência em estudos de crescimento. Também são comuns experimentos em que a variável resposta refere-se a contagem. Este trabalho abordou a modelagem de dados de contagem, obtidos a partir de experimentos com medidas repetidas ao longo do tempo, em que o comportamento longitudinal da variável resposta é não linear. A distribuição Poisson multivariada, com covariâncias iguais entre as medidas, foi utilizada de forma a considerar a dependência entre os componentes do vetor de observações de medidas repetidas em cada unidade experimental. O modelo proposto por Karlis e Meligkotsidou (2005) foi estendido para dados longitudinais provenientes de experimentos inteiramente casualizados. Modelos para experimentos em blocos casualizados, supondo-se efeitos fixos ou aleatórios para blocos, foram também propostos. A ocorrência de superdispersão foi considerada e modelada através da distribuição Poisson multivariada mista. A estimação dos parâmetros foi realizada através do método de máxima verossimilhança, via algoritmo EM. A metodologia proposta foi aplicada a dados simulados para cada uma das situações estudadas e a um conjunto de dados de um experimento em blocos casualizados em que foram observados o número de folhas de bromélias em seis instantes no tempo. O método mostrou-se eficiente na estimação dos parâmetros para o modelo considerando o delineamento completamente casualizado, inclusive na ocorrência de superdispersão, e delineamento em blocos casualizados com efeito fixo, sem superdispersão e efeito aleatório para blocos. No entanto, a estimação para o modelo que considera efeito fixo para blocos, na presença de superdispersão e para o parâmetro de variância do efeito aleatório para blocos precisa ser aprimorada. / Experiments in which measurements are taken in the same experimental unit are common in agriculture area. The statistical techniques used to analyse data from those experiments are called repeated measurement analysis, and longitudinal study, in which the response variable is observed along the time, is a particular case. The longitudinal behaviour can be non linear, occuring freq¨uently in growth studies. It is also common to have experiments in which the response variable refers to count data. This work approaches the modelling of count data, obtained from experiments with repeated measurements through time, in which the response variable longitudinal behaviour is non linear. The multivariate Poisson distribution, with equal covariances between measurements, was used to consider the dependence between the components of the repeated measurement observation vector in each experimental unit. The Karlis and Meligkotsidou (2005) proposal was extended to longitudinal data obtained from completely randomized. Models for randomized blocks experiments, assuming fixed or random effects for blocks, were also proposed. The occurence of overdispersion was considered and modelled through mixed multivariate Poisson distribution. The parameter estimation was done using maximum likelihood method, via EM algorithm. The methodology was applied to simulated data for all the cases studied and to a data set from a randomized block experiment in which the number of Bromeliads leaves were observed through six instants in time. The method was efficient to estimate the parameters for the completely randomized experiment, including the occurence of overdispersion, and for the randomized blocks experiments assuming fixed effect, with no overdispersion, and random effect for blocks. The estimation for the model that considers fixed effect for block, with overdispersion and for the variance parameters of the random effect for blocks must be improved.
|
16 |
Modelos semiparamétricos com resposta binomial negativa / Semiparametric models with negative binomial responseFabio Hideto Oki 14 May 2015 (has links)
O objetivo principal deste trabalho é discutir estimação e diagnóstico em modelos semiparamétricos com resposta binomial negativa, mais especificamente, modelos de regressão com resposta binomial negativa em que uma das variáveis explicativas contínuas é modelada de forma não paramétrica. Iniciamos o trabalho com um exemplo ilustrativo e fazemos uma breve revisão dos modelos paramétricos com resposta binomial negativa. Em seguida, introduzimos os modelos semiparamétricos com resposta binomial negativa e discutimos alguns aspectos de estimação, inferência e seleção de modelos. Dedicamos um capítulo a procedimentos de diagnóstico, tais como desenvolvimento de medidas de alavanca e de influência sob os aspectos de deleção de pontos e influência local, além de abordar a análise de resíduos. Reanalizamos o exemplo ilustrativo sob o enfoque semiparamétrico e apresentamos algumas conclusões. / The aim of this work is to discuss some aspects on estimation and diagnostics in negative binomial regression models which an explanatory continuous variable is modeled nonparametrically. First, an illustrative example is presented and analyzed under parametric negative binomial regression models. The proposed models are then introduced and some aspects on estimations, inference and model selection are presented. Particular emphasis is given on the development of diagnostic procedures, such as leverage measures, Cook distances, local influence approach and residuals. The motivated example is reanalyzed under the semiparametric viewpoint and some conclusions are given.
|
17 |
[en] SOCCER CHAMPIONSHIP PROBABILITS ESTIMATION / [pt] ESTIMAÇÃO DE PROBABILIDADES EM CAMPEONATOS DE FUTEBOLEDUARDO LIMA CAMPOS 26 October 2001 (has links)
[pt] Neste trabalho, apresentamos uma metodologia para obter
probabilidades de classificação e rebaixamento de equipes
em campeonatos de futebol. A metodologia consiste
basicamente em quatro etapas. Na primeira etapa, ajustamos
modelos de séries temporais para dados de contagem a séries
de gols a favor e sofridos pelas equipes em partidas
sucessivas do campeonato, utilizando variáveis explicativas
para considerar o efeito do mando de campo, da participação
de determinados jogadores e de mudanças de técnico.
Alguns problemas referentes à construção de intervalos de
confiança e testes de hipóteses para os hiperparâmetros dos
modelos foram solucionados via bootstrap.
Na segunda etapa, obtivemos as distribuições de
probabilidade associadas aos resultados das partidas
futuras do campeonato, utilizando o Princípio da Máxima
Entropia para combinar as distribuições preditivas dos
modelos ajustados. Na terceira etapa, utilizamos as
distribuições dos resultados das partidas futuras para
simular cenários para o campeonato e, na quarta e última
etapa, estimamos as probabilidades de classificação e
rebaixamento das equipes, pela freqüência relativa da
ocorrência destes eventos em um grande número de cenários
gerados. A metodologia foi aplicada no Campeonato
Brasileiro/1999 e na Copa João Havelange/2000. / [en] In this thesis, we develop a methodology to obtain the
probabilities of qualifying and relegating of teams, in
soccer championships. The methodology consists of four steps.
In the first step, we fit time series models to the series
of number of goals scored in soccer matches. We account for
the effects of playing at home, soccer players and changes
of coaches, by introducing explanatory variables.
Confidence intervals and hipothesis tests are obtained by
bootstrap. In the second step, we get probability
distributions of the future matches results, by combining
preditive distributions of the fitted models via the
Maximum Entropy Principle. In the third step, we use the
distributions of the matches results to generate
simulation sceneries for the champhionship. In the forth
and last step, we finally estimate the probabilities of
qualifying and relegating of the teams, through the
relative frequencies of these events, in a great number of
sceneries generated. The empirical work was carried out
using data from Brazilian Champhionship/1999 and João
Havelange Cup/2000.
|
18 |
Modelos não lineares para dados de contagem longitudinais / Non linear models for count longitudinal dataAna Maria Souza de Araujo 16 February 2007 (has links)
Experimentos em que medidas são realizadas repetidamente na mesma unidade experimental são comuns na área agronômica. As técnicas estatísticas utilizadas para análise de dados desses experimentos são chamadas de análises de medidas repetidas, tendo como caso particular o estudo de dados longitudinais, em que uma mesma variável resposta é observada em várias ocasiões no tempo. Além disso, o comportamento longitudinal pode seguir um padrão não linear, o que ocorre com freqüência em estudos de crescimento. Também são comuns experimentos em que a variável resposta refere-se a contagem. Este trabalho abordou a modelagem de dados de contagem, obtidos a partir de experimentos com medidas repetidas ao longo do tempo, em que o comportamento longitudinal da variável resposta é não linear. A distribuição Poisson multivariada, com covariâncias iguais entre as medidas, foi utilizada de forma a considerar a dependência entre os componentes do vetor de observações de medidas repetidas em cada unidade experimental. O modelo proposto por Karlis e Meligkotsidou (2005) foi estendido para dados longitudinais provenientes de experimentos inteiramente casualizados. Modelos para experimentos em blocos casualizados, supondo-se efeitos fixos ou aleatórios para blocos, foram também propostos. A ocorrência de superdispersão foi considerada e modelada através da distribuição Poisson multivariada mista. A estimação dos parâmetros foi realizada através do método de máxima verossimilhança, via algoritmo EM. A metodologia proposta foi aplicada a dados simulados para cada uma das situações estudadas e a um conjunto de dados de um experimento em blocos casualizados em que foram observados o número de folhas de bromélias em seis instantes no tempo. O método mostrou-se eficiente na estimação dos parâmetros para o modelo considerando o delineamento completamente casualizado, inclusive na ocorrência de superdispersão, e delineamento em blocos casualizados com efeito fixo, sem superdispersão e efeito aleatório para blocos. No entanto, a estimação para o modelo que considera efeito fixo para blocos, na presença de superdispersão e para o parâmetro de variância do efeito aleatório para blocos precisa ser aprimorada. / Experiments in which measurements are taken in the same experimental unit are common in agriculture area. The statistical techniques used to analyse data from those experiments are called repeated measurement analysis, and longitudinal study, in which the response variable is observed along the time, is a particular case. The longitudinal behaviour can be non linear, occuring freq¨uently in growth studies. It is also common to have experiments in which the response variable refers to count data. This work approaches the modelling of count data, obtained from experiments with repeated measurements through time, in which the response variable longitudinal behaviour is non linear. The multivariate Poisson distribution, with equal covariances between measurements, was used to consider the dependence between the components of the repeated measurement observation vector in each experimental unit. The Karlis and Meligkotsidou (2005) proposal was extended to longitudinal data obtained from completely randomized. Models for randomized blocks experiments, assuming fixed or random effects for blocks, were also proposed. The occurence of overdispersion was considered and modelled through mixed multivariate Poisson distribution. The parameter estimation was done using maximum likelihood method, via EM algorithm. The methodology was applied to simulated data for all the cases studied and to a data set from a randomized block experiment in which the number of Bromeliads leaves were observed through six instants in time. The method was efficient to estimate the parameters for the completely randomized experiment, including the occurence of overdispersion, and for the randomized blocks experiments assuming fixed effect, with no overdispersion, and random effect for blocks. The estimation for the model that considers fixed effect for block, with overdispersion and for the variance parameters of the random effect for blocks must be improved.
|
19 |
Modelagem para Dados Longitudinais de ContagemTRINDADE, Daniele de Brito 02 1900 (has links)
Submitted by Etelvina Domingos (etelvina.domingos@ufpe.br) on 2015-03-12T19:28:53Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Daniele de Brito Trindade.pdf: 1575283 bytes, checksum: 7c79e6ffbd150b8169bb357d1a252353 (MD5) / Made available in DSpace on 2015-03-12T19:28:53Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Daniele de Brito Trindade.pdf: 1575283 bytes, checksum: 7c79e6ffbd150b8169bb357d1a252353 (MD5)
Previous issue date: 2014-02 / CAPES / A modelagem para dados de contagem é bastante utilizada em diversas áreas do
conhecimento, como nas ciências biológicas, educação e saúde pública. O modelo
comumente utilizado para analisar dados de contagem é o modelo Poisson. Contudo,
quando os dados apresentam superdispersão o modelo Poisson não é mais indicado.
Existem extensões do modelo Poisson que podem ser usados nesta situação, como o
modelo Poisson in acionado de zeros (ZIP, em inglês). Porém, neste trabalho, é considerado
o modelo Binomial Negativo, que é adequado para esta situação, além de
ser um modelo simples e bastante conhecido. Uma suposição do modelo de regressão
tradicional é a independência entre as observações. Contudo, quando as unidades
amostrais são medidas repetidamente ao longo do tempo, os estudos longitudinais
permite a veri cação das taxas de mudança que ocorrem ao longo do tempo e os
fatores que podem motivar tal variação. Estes estudos são de particular interesse
quando o objetivo é avaliar variações globais ou individuais da resposta ao longo
do tempo. Este tipo de estudo considera a correlação entre as respostas dentro das
unidades amostrais e a ordenação cronológica das respostas. Duas abordagens de
regressão comumente utilizadas para analisar dados longitudinais são os modelos
condicionais e os marginais. O modelo condicional assume a existência de efeitos
aleatórios que descrevem o comportamento de um indivíduo especí co, sendo este
modelo também chamado de multinível. No modelo marginal a variável resposta é
modelada independentemente da correlação existente entre as medidas de cada unidade
amostral (denotada por correlação intra-indivíduo), modelando a expectativa
marginal como uma função das variáveis explicativas. Neste trabalho as duas abordagens
foram aplicadas à análise de dados de contagem longitudinais. Estudos de
simulação foram realizados para avaliar a performance dos estimadores provenientes
destas metodologias. Aplicações com bases de dados reais são apresentadas.
|
20 |
Ensaio em economia da saúde: análise da demanda no mercado de saúde suplementar utilizando um modelo econométrico de dados de contagemHeck, Joaquim 31 August 2012 (has links)
Submitted by Joaquim Heck (jheck@embrioconsult.com.br) on 2012-09-26T17:54:24Z
No. of bitstreams: 1
PDF_MPFE_2010_Dissertacao_Joaquim_Heck_2012_08_31.pdf: 1254577 bytes, checksum: 286251ccfbb405513a08d5b0d097a172 (MD5) / Approved for entry into archive by Suzinei Teles Garcia Garcia (suzinei.garcia@fgv.br) on 2012-09-26T18:01:33Z (GMT) No. of bitstreams: 1
PDF_MPFE_2010_Dissertacao_Joaquim_Heck_2012_08_31.pdf: 1254577 bytes, checksum: 286251ccfbb405513a08d5b0d097a172 (MD5) / Made available in DSpace on 2012-09-26T18:09:46Z (GMT). No. of bitstreams: 1
PDF_MPFE_2010_Dissertacao_Joaquim_Heck_2012_08_31.pdf: 1254577 bytes, checksum: 286251ccfbb405513a08d5b0d097a172 (MD5)
Previous issue date: 2012-08-31 / This thesis discusses aspects of the demand for healthcare in the Brazilian private health sector. We use econometric analysis of count data models to establish which monetary and non-monetary parameters may influence the demand of healthcare. Finally, we verify if there is any informational asymmetry effect such as moral hazard in the determination of the demand for a case-study involving medical speciality visits. / Este ensaio apresenta um estudo sobre a demanda por serviço de saúde no mercado de saúde suplementar utilizando, através de uma análise econométrica, modelos de regressão de dados de contagem para verificar os fatores monetários e não monetários que podem influenciar a quantidade demandada por este serviço, e determinar se há risco moral na determinação desta demanda, no caso de um modelo de visitas médicas de especialidade.
|
Page generated in 0.0828 seconds