Spelling suggestions: "subject:"modelos inflacionada"" "subject:"modelos inflacionários""
1 |
Modelos assimétricos inflacionados de zeros / Zero-inflated asymmetric modelsDias, Mariana Ferreira 28 November 2014 (has links)
A principal motivação desse estudo é a análise da quantidade de sangue recebido em transfusão (padronizada pelo peso) por crianças com problemas hepáticos. Essa quantidade apresenta distribuição assimétrica, além de valores iguais a zero para as crianças que não receberam transfusão. Os modelos lineares generalizados, usuais para variáveis positivas, não permitem a inclusão de zeros. Para os dados positivos, foram ajustados tais modelos com distribuição gama e normal inversa. Também foi considerado o modelo log-normal. A análise de resíduos padronizados indicou heterocedasticidade, e portanto a variabilidade extra foi modelada utilizando a classe de modelos GAMLSS. A terceira abordagem consiste em modelos baseados na mistura de zeros e distribuições para valores positivos, incluídos recentemente na família dos modelos GAMLSS. Estes aliam a distribuição assimétrica para os dados positivos e a probabilidade da ocorrência de zeros. Na análise dos dados de transfusão, observa-se que a distribuição normal inversa apresentou melhor ajuste por acomodar dados com forte assimetria em relação às demais distribuições consideradas. Foram significativos os efeitos das variáveis explicativas Kasai (ocorrência de operação prévia) e PELD (nível de uma medida da gravidade do paciente com 4 níveis) assim como os efeitos de interação sobre a média e variabilidade da quantidade de sangue recebida. A possibilidade de acrescentar efeitos de variáveis explicativas para modelar o parâmetro de dispersão, permite que a variabilidade extra, além de sua dependência da média, seja melhor explicada e melhore o ajuste do modelo. A probabilidade de não receber transfusão depende de modo significativo somente de PELD. A proposta de um só modelo que alia a presença de zeros e diversas distribuições assimétricas facilita o ajuste dos dados e a análise de resíduos. Seus resultados são equivalentes à abordagem em que a ocorrência ou não de transfusão é analisada por meio de modelo logístico independente da modelagem dos dados positivos com distribuições assimétricas. / The main motivation of this study is to analyze the amount of blood transfusions received (by weight) of children with liver problems. This amount shows asymmetric distribution as well as present zero values for children who did not receive transfusions. The usual generalized linear models for positive variables do not allow the inclusion of zeros. For positive data, such models with gamma and inverse normal distributions were fitted in this study. Log-normal distribution was also considered. Analysis of the standardized residuals indicated heterocedasticity and therefore the extra variability was modelled using GAMLSS. The third approach consists of models based on a mixture of zeros and distributions for positive values, also recently included in the family of GAMLSS models. These models combine the asymmetric distribution of positive data and the probability of occurrence of zeros. In the data analysis of transfusion, the inverse normal distribution showed better goodness of fit to allow adjustment of data with greater asymmetry than the other distributions considered. The effects of the explanatory variables Kasai (occurrence of previous operation) and PELD level (a measure of the severity of the patient with 4 levels) and interaction effects on the mean and variability of the amount of blood received were signicant. The inclusion of explanatory variables to model the dispersion parameter, allows to model the extra variability, beyond its dependence on the average, and improves fitness of the model. The probability of not receiving transfusion depends signicantly only PELD. The proposal of a unified model that combines the presence of zeros and several asymmetric distributions greatly facilitates the fitness of the model and the evaluation of fitness. An advantage is the equivalence between this model and a separate logistic model to for the probability of the occurrence of transfusion and a model for the positive skewed data.
|
2 |
Modelos assimétricos inflacionados de zeros / Zero-inflated asymmetric modelsMariana Ferreira Dias 28 November 2014 (has links)
A principal motivação desse estudo é a análise da quantidade de sangue recebido em transfusão (padronizada pelo peso) por crianças com problemas hepáticos. Essa quantidade apresenta distribuição assimétrica, além de valores iguais a zero para as crianças que não receberam transfusão. Os modelos lineares generalizados, usuais para variáveis positivas, não permitem a inclusão de zeros. Para os dados positivos, foram ajustados tais modelos com distribuição gama e normal inversa. Também foi considerado o modelo log-normal. A análise de resíduos padronizados indicou heterocedasticidade, e portanto a variabilidade extra foi modelada utilizando a classe de modelos GAMLSS. A terceira abordagem consiste em modelos baseados na mistura de zeros e distribuições para valores positivos, incluídos recentemente na família dos modelos GAMLSS. Estes aliam a distribuição assimétrica para os dados positivos e a probabilidade da ocorrência de zeros. Na análise dos dados de transfusão, observa-se que a distribuição normal inversa apresentou melhor ajuste por acomodar dados com forte assimetria em relação às demais distribuições consideradas. Foram significativos os efeitos das variáveis explicativas Kasai (ocorrência de operação prévia) e PELD (nível de uma medida da gravidade do paciente com 4 níveis) assim como os efeitos de interação sobre a média e variabilidade da quantidade de sangue recebida. A possibilidade de acrescentar efeitos de variáveis explicativas para modelar o parâmetro de dispersão, permite que a variabilidade extra, além de sua dependência da média, seja melhor explicada e melhore o ajuste do modelo. A probabilidade de não receber transfusão depende de modo significativo somente de PELD. A proposta de um só modelo que alia a presença de zeros e diversas distribuições assimétricas facilita o ajuste dos dados e a análise de resíduos. Seus resultados são equivalentes à abordagem em que a ocorrência ou não de transfusão é analisada por meio de modelo logístico independente da modelagem dos dados positivos com distribuições assimétricas. / The main motivation of this study is to analyze the amount of blood transfusions received (by weight) of children with liver problems. This amount shows asymmetric distribution as well as present zero values for children who did not receive transfusions. The usual generalized linear models for positive variables do not allow the inclusion of zeros. For positive data, such models with gamma and inverse normal distributions were fitted in this study. Log-normal distribution was also considered. Analysis of the standardized residuals indicated heterocedasticity and therefore the extra variability was modelled using GAMLSS. The third approach consists of models based on a mixture of zeros and distributions for positive values, also recently included in the family of GAMLSS models. These models combine the asymmetric distribution of positive data and the probability of occurrence of zeros. In the data analysis of transfusion, the inverse normal distribution showed better goodness of fit to allow adjustment of data with greater asymmetry than the other distributions considered. The effects of the explanatory variables Kasai (occurrence of previous operation) and PELD level (a measure of the severity of the patient with 4 levels) and interaction effects on the mean and variability of the amount of blood received were signicant. The inclusion of explanatory variables to model the dispersion parameter, allows to model the extra variability, beyond its dependence on the average, and improves fitness of the model. The probability of not receiving transfusion depends signicantly only PELD. The proposal of a unified model that combines the presence of zeros and several asymmetric distributions greatly facilitates the fitness of the model and the evaluation of fitness. An advantage is the equivalence between this model and a separate logistic model to for the probability of the occurrence of transfusion and a model for the positive skewed data.
|
3 |
Modelos para dados de Contagem : um estudo sobre o número de ovos do mosquito Aedes aegypti.Nagamine, Camila Macedo Lima 22 July 2007 (has links)
Made available in DSpace on 2016-06-02T20:05:59Z (GMT). No. of bitstreams: 1
DissCMLN.pdf: 11627851 bytes, checksum: 40cb68e8fa183a86835c193d08d4a6ac (MD5)
Previous issue date: 2007-07-22 / Financiadora de Estudos e Projetos / In this work we considered four types of models for count data: the
Poisson model, the Negative Binomial Model and variations of these
models for count inflated of zeros (ZIP and ZINB).
Information on the number of put eggs for the mosquito aedes in the
city of São José of Rio Preto, SP, was analyzed through models for counting
data. The number of eggs of the mosquito aedes is studied firstly without the
covariable and through some tests, it was verified that models zero inflated
(ZIP and ZINB) are more adapted to analyze the data under study.
The ZIP model was shown inadequate, due to overdispersion generated
by the variability of the data. The ZINB model, was shown more flexible to
the data as it is shown graphically. / Neste trabalho são considerados quatro tipos de modelos para dados
de contagens: o Modelo Poisson, o Modelo Binomial Negativo
e variações destes modelos para contagens inflacionadas de
zeros (ZIP e ZINB).
Informações do número de ovos postos pelo mosquito Aedes aegypti na
cidade de São José do Rio Preto, SP, foram analisadas neste trabalho através
de modelos para dados de contagens. O número de ovos do mosquito Aedes
aegypti é primeiramente estudado sem o uso de covariáveis e através de alguns
testes, foi verificado que modelos inflacionados de zeros (ZIP e ZINB)
são mais adequados para analisar os dados em questão.
O modelo ZIP mostrou-se inadequado, devido à superdispersão gerada
pela variabilidade dos dados. Nesse caso, o modelo ZINB, mostrou-se mais
flexível ao conjunto de dados como é mostrado graficamente e em seguida
foi modelado para três períodos distintos, considerando a variável resposta
número de ovos do mosquisto Aedes aegypti .
|
4 |
Utilização de técnicas bayesianas em modelos de regressão de Poisson para dados de contagem longitudinais e dados de contagem com medidas repetidas apresentando excesso de zerosTsuchiya, Nilton 09 June 2008 (has links)
Made available in DSpace on 2016-06-02T20:06:01Z (GMT). No. of bitstreams: 1
1963.pdf: 520432 bytes, checksum: 9c5f5395dcc0f7d0faca9268007ed41f (MD5)
Previous issue date: 2008-06-09 / Financiadora de Estudos e Projetos / In medical and biological researches we often .nd count data. For longitudinal count data, usual Poisson regression models, assuming independence among observations, are not applicable because of the correlation of these measures. This work presents hierarchical Bayesian models considering random e¤ects to analyze longitudinal count data. A Normal and a Gamma distribution are considered to these e¤ects besides the mixture of Normal distributions. We also present zero in.ated Poisson (ZIP) regression models for repeated measures. Markov Chain Monte Carlo (MCMC) is used to estimate the parameters. Keywords: Longitudinal Count Data; Poisson Regression Model; Zero In.ated Model; Hierarchical Model; Bayesian Analysis; MCMC Methods. / Nas pesquisas médicas e biológicas é comum encontrar dados de contagem. Por exem- plo, as variáveis podem ser dadas pelo número de hospitalizações para cada paciente em unidades básicas de saúde. Para dados de contagem longitudinais, o uso de modelos de regressão de Poisson usuais, que assumem independência entre as observações, não é satis- fatório, visto que as observações de um mesmo indivíduo são usualmente correlacionadas. Assim, efeitos aleatórios são considerados para capturar a possível correlação destas ob- servações além de superdispersão associada a outros fatores. Neste trabalho são uti- lizados modelos Bayesianos hierárquicos considerando diferentes distribuições aos efeitos aleatórios para analisar tais tipos de dados. Aos efeitos aleatórios é atribuída uma dis- tribuição normal, uma mistura de distribuições normais ou uma distribuição gama. Tam- bém são apresentados modelos de regressão de Poisson para dados com medidas repetidas apresentando excesso de zeros. Técnicas de simulação estocástica MCMC (Monte Carlo em Cadeias de Markov) são utilizadas para inferência e, em particular, para estimação dos parâmetros de interesse. Além disso, dados reais são considerados para ilustrar as metodologias propostas.
|
5 |
Engraulis anchoita (Clupeiformes: Engraulidae) eggs and larvae in the Southeastern Brazilian Bight: new perspectives from a historical data set (1974 - 2010) / Engraulis anchoita (Clupeiformes: Engraulidae) ovos e larvas na Plataforma Continental Sudeste do Brasil: novas perspectivas a partir de um conjunto de dados históricos (1974 - 2010)Favero, Jana Menegassi Del 23 August 2016 (has links)
The main objective of this dissertation was to evaluate long-term fluctuations in the distribution and abundance of Engraulis anchoita eggs and larvae in the Southeastern Brazilian Bight (SBB). Engraulis anchoita is a fish species that is ecologically and economically important. We analyzed samples and abiotic data from eighteen oceanographic cruises conducted during austral late spring and early summer from 1974 to 2010. Two different stocks were detected in the SBB based on egg size, with the predominant stock in the area having smaller eggs than the stock in the region further south. Using indicative kriging, we identified occasional (e.g. Florianópolis - 27°S and off Santos Bay) and avoided (e.g. off São Sebastião Island and off Cananéia-Iguape Coastal System) spawning sites. Through zero-inflated models, spatial factors (different areas and the local depth) were related to the probability of sampling false zeros and temporal and oceanographic conditions (different years and temperature) with egg and larvae abundance. We also described faster and more accurate methodology to identify E. anchoita eggs, and compared the mesh-size efficiency to sample eggs and analyzed how egg size varied seasonally. Our results may support future studies and may assist a future fishery management of E. anchoita, a species not yet exploited in the SBB. / O principal objetivo dessa tese foi analisar as flutuações de longo-prazo na distribuição e abundância de ovos e larvas de Engraulias anchoita, uma espécie de peixe de importância econômica e ecológica, na Plataforma Continental Sudeste do Brasil (PCSE). Nós analisamos amostras e dados abióticos de dezoito cruzeiros oceanográficos realizados durante o fim da primavera e o começo do verão de 1974 a 2010. Dois estoques distintos foram identificados com base no tamanho dos ovos, um predominante e com menor tamanho e outro de maior tamanho ao sul da PCSE. Através de \"krigagem\" indicativa, foram identificadas áreas de desova ocasional (como ao norte de Florianópolis e a área ao largo da baía de Santos) e áreas em que a desova foi evitada (como em frente à Ilha de São Sebastião e ao Sistema Costeiro Cananéia-Iguape). Usando modelos inflacionados de zeros, os fatores espaciais (diferentes áreas e profundidades amostradas) foram relacionados com a probabilidade de se amostrar falso zero, enquanto os fatores temporais e oceanográficos (diferentes anos e temperatura) foram relacionados com a abundância de ovos e larvas. Apresentamos também uma metodologia mais rápida e mais eficiente para identificar os ovos de E. anchoita, comparamos as amostragens realizadas com duas malhagens diferentes e analisamos variações sazonais do tamanho dos ovos capturados. Assim, nossos resultados poderão auxiliar estudos futuros e também no manejo pesqueiro da espécie em questão, ainda não explorada comercialmente na área de estudo.
|
6 |
Engraulis anchoita (Clupeiformes: Engraulidae) eggs and larvae in the Southeastern Brazilian Bight: new perspectives from a historical data set (1974 - 2010) / Engraulis anchoita (Clupeiformes: Engraulidae) ovos e larvas na Plataforma Continental Sudeste do Brasil: novas perspectivas a partir de um conjunto de dados históricos (1974 - 2010)Jana Menegassi Del Favero 23 August 2016 (has links)
The main objective of this dissertation was to evaluate long-term fluctuations in the distribution and abundance of Engraulis anchoita eggs and larvae in the Southeastern Brazilian Bight (SBB). Engraulis anchoita is a fish species that is ecologically and economically important. We analyzed samples and abiotic data from eighteen oceanographic cruises conducted during austral late spring and early summer from 1974 to 2010. Two different stocks were detected in the SBB based on egg size, with the predominant stock in the area having smaller eggs than the stock in the region further south. Using indicative kriging, we identified occasional (e.g. Florianópolis - 27°S and off Santos Bay) and avoided (e.g. off São Sebastião Island and off Cananéia-Iguape Coastal System) spawning sites. Through zero-inflated models, spatial factors (different areas and the local depth) were related to the probability of sampling false zeros and temporal and oceanographic conditions (different years and temperature) with egg and larvae abundance. We also described faster and more accurate methodology to identify E. anchoita eggs, and compared the mesh-size efficiency to sample eggs and analyzed how egg size varied seasonally. Our results may support future studies and may assist a future fishery management of E. anchoita, a species not yet exploited in the SBB. / O principal objetivo dessa tese foi analisar as flutuações de longo-prazo na distribuição e abundância de ovos e larvas de Engraulias anchoita, uma espécie de peixe de importância econômica e ecológica, na Plataforma Continental Sudeste do Brasil (PCSE). Nós analisamos amostras e dados abióticos de dezoito cruzeiros oceanográficos realizados durante o fim da primavera e o começo do verão de 1974 a 2010. Dois estoques distintos foram identificados com base no tamanho dos ovos, um predominante e com menor tamanho e outro de maior tamanho ao sul da PCSE. Através de \"krigagem\" indicativa, foram identificadas áreas de desova ocasional (como ao norte de Florianópolis e a área ao largo da baía de Santos) e áreas em que a desova foi evitada (como em frente à Ilha de São Sebastião e ao Sistema Costeiro Cananéia-Iguape). Usando modelos inflacionados de zeros, os fatores espaciais (diferentes áreas e profundidades amostradas) foram relacionados com a probabilidade de se amostrar falso zero, enquanto os fatores temporais e oceanográficos (diferentes anos e temperatura) foram relacionados com a abundância de ovos e larvas. Apresentamos também uma metodologia mais rápida e mais eficiente para identificar os ovos de E. anchoita, comparamos as amostragens realizadas com duas malhagens diferentes e analisamos variações sazonais do tamanho dos ovos capturados. Assim, nossos resultados poderão auxiliar estudos futuros e também no manejo pesqueiro da espécie em questão, ainda não explorada comercialmente na área de estudo.
|
7 |
Modelos de regressão beta inflacionados truncados / The truncated inflated beta regressionPereira, Gustavo Henrique de Araujo 24 May 2012 (has links)
Os modelos de regressão beta e beta inflacionados conseguem ajustar adequadamente grande parte das variáveis do tipo proporção. No entanto, esses modelos não são úteis quando a variável resposta não pode assumir valores no intervalo (0,c) e assume o valor c com probabilidade positiva. Variáveis relacionadas a algum tipo de pagamento limitado entre dois valores, quando estudadas em relação ao seu valor máximo, possuem essas características. Para ajustar essas variáveis, introduzimos a distribuição beta inflacionada truncada (BIZUT), que é uma mistura de uma distribuição beta com suporte no intervalo (c,1) e uma distribuição trinomial que assume os valores zero, um e c. Propomos ainda um modelo de regressão para as situações em que a variável resposta tem distribuição BIZUT. Admitimos que todos os parâmetros da distribuição podem variar em função de variáveis preditoras. Além disso, o modelo permite que o parâmetro conhecido c varie entre as unidades populacionais. Para esse modelo são desenvolvidos diversos aspectos inferenciais, são obtidos resultados para as situações em que c é variável e são conduzidos estudos de simulação de Monte Carlo. Além disso, discutimos análise de resíduos, desenvolvemos análise de influência local e realizamos uma aplicação a dados reais de cartão de crédito. / The beta regression model or the inflated beta regression model may be a reasonable choice to fit a proportion in most situations. However, they do not fit well variables that do not assume values in the open interval (0,c), 0 < c < 1 and assume the c value with positive probability. Variables related to a kind of double bounded payment amount when studied as a proportion of the maximum payment amount have this feature. For these variables, we introduce the truncated inflated beta distribution (TBEINF). This proposed distribution is a mixture of the beta distribution bounded in the open interval (c,1) and a trinomial distribution that assumes the values zero, one and c. This work also proposes a regression model where the response variable is TBEINF distributed. The model allows all the unknown parameters of the conditional distribution of the response variable to be modeled as functions of explanatory variables. Moreover, the model allows nonconstant known parameter c across population units. For this model, some inferential aspects are developed, some results when c is not constant are obtained and Monte Carlo simulation studies are performed. In addition, residual and local influence analysis are discussed and an application to credit card data is presented.
|
8 |
Modelos de regressão beta inflacionados truncados / The truncated inflated beta regressionGustavo Henrique de Araujo Pereira 24 May 2012 (has links)
Os modelos de regressão beta e beta inflacionados conseguem ajustar adequadamente grande parte das variáveis do tipo proporção. No entanto, esses modelos não são úteis quando a variável resposta não pode assumir valores no intervalo (0,c) e assume o valor c com probabilidade positiva. Variáveis relacionadas a algum tipo de pagamento limitado entre dois valores, quando estudadas em relação ao seu valor máximo, possuem essas características. Para ajustar essas variáveis, introduzimos a distribuição beta inflacionada truncada (BIZUT), que é uma mistura de uma distribuição beta com suporte no intervalo (c,1) e uma distribuição trinomial que assume os valores zero, um e c. Propomos ainda um modelo de regressão para as situações em que a variável resposta tem distribuição BIZUT. Admitimos que todos os parâmetros da distribuição podem variar em função de variáveis preditoras. Além disso, o modelo permite que o parâmetro conhecido c varie entre as unidades populacionais. Para esse modelo são desenvolvidos diversos aspectos inferenciais, são obtidos resultados para as situações em que c é variável e são conduzidos estudos de simulação de Monte Carlo. Além disso, discutimos análise de resíduos, desenvolvemos análise de influência local e realizamos uma aplicação a dados reais de cartão de crédito. / The beta regression model or the inflated beta regression model may be a reasonable choice to fit a proportion in most situations. However, they do not fit well variables that do not assume values in the open interval (0,c), 0 < c < 1 and assume the c value with positive probability. Variables related to a kind of double bounded payment amount when studied as a proportion of the maximum payment amount have this feature. For these variables, we introduce the truncated inflated beta distribution (TBEINF). This proposed distribution is a mixture of the beta distribution bounded in the open interval (c,1) and a trinomial distribution that assumes the values zero, one and c. This work also proposes a regression model where the response variable is TBEINF distributed. The model allows all the unknown parameters of the conditional distribution of the response variable to be modeled as functions of explanatory variables. Moreover, the model allows nonconstant known parameter c across population units. For this model, some inferential aspects are developed, some results when c is not constant are obtained and Monte Carlo simulation studies are performed. In addition, residual and local influence analysis are discussed and an application to credit card data is presented.
|
9 |
Modelo destrutivo com variável terminal em experimentos quimiopreventivos de tumores em animaisZavaleta, Katherine Elizabeth Coaguila 12 April 2012 (has links)
Made available in DSpace on 2016-06-02T20:06:07Z (GMT). No. of bitstreams: 1
4375.pdf: 903031 bytes, checksum: 03118f406867a5d7be3cbc63571d4a2b (MD5)
Previous issue date: 2012-04-12 / Financiadora de Estudos e Projetos / The chemical induction of carcinogens in chemopreventive animal experiments is becoming increasingly frequent in biological research. The purpose of these biological experiments is to evaluate the effect of a particular treatment on the rate of tumors incidence in animals. In this work, the number of promoted tumors per animal will be parametrically modeled following the suggestions given by Kokoska (1987) and Freedman et al. (1993). The study of these chemopreventive experiments will be presented in the context of the destructive model proposed by Rodrigues et al. (2010) with terminal variable that allows or censures the experiment at time of the animal death. Since the data analyzed in this field are subject to excess of zeros (Freedman et al. (1993)), we propose for the number of promoted tumors a negative binomial distribution (NB), a zero-inflated Poisson distribution (ZIP), and a zero-inflated Negative Binomial distribution (ZINB). The selection of these models will be made through the likelihood ratio test and the AIC, BIC criteria. The estimation of its parameters will be obtained by using the method of maximum likelihood, and further simulation studies will also be realized. As a future proposition to finalize this project, it is suggested the Bayesian methodology as an alternative to the method of maximum likelihood via the EM algorithm. / A indução química de substâncias cancerígenas em experimentos quimiopreventivos em animais é cada vez mais frequente em pesquisas biológicas. O objetivo destes experimentos biológicos é avaliar o efeito de um determinado tratamento na taxa de incidência de tumores em animais. Neste trabalho o número de tumores promovidos por animal será modelado parametricamente seguindo as sugestões dadas por Kokoska (1987) e por Freedman et al. (1993). O estudo desses experimentos quimiopreventivos será apresentado no contexto do modelo destrutivo proposto por Rodrigues et al. (2010) com variável terminal que condiciona ou censura o experimento no instante de morte do animal. Os dados analisados possuem uma grande quantidade de zeros, portanto será proposto para o número de tumores promovidos as seguintes distribuições: binomial negativa, a distribuição de Poisson com zeros inflacionados e a distribuição binomial negativa com zeros inflacionados. A seleção destes modelos será feita através do teste da razão de verossimilhança e os critérios AIC, BIC. As estimativas dos respectivos parâmetros serão obtidas utilizando o método de máxima verossimilhança e serão feitos estudos de simulação. Para continuar este projeto, a proposta futura é utilizar a metodologia Bayesiana como alternativa ao método de máxima verossimilhança via algoritmo EM.
|
Page generated in 0.0776 seconds