Spelling suggestions: "subject:"estatisticamente.""
281 |
Modelos de sobrevivência bivariados baseados na cópula FGM : uma abordagem bayesianaSuzuki, Adriano Kamimura 07 February 2012 (has links)
Made available in DSpace on 2016-06-02T20:04:51Z (GMT). No. of bitstreams: 1
4292.pdf: 1258858 bytes, checksum: c7d8d771d500d5ab8d54fbaae144001b (MD5)
Previous issue date: 2012-02-07 / Financiadora de Estudos e Projetos / In this work we present a Bayesian analysis for bivariate survival data in the presence of a covariate and censored observations. We propose a bivariate distribution for the bivariate survival times based on the Farlie-Gumbel-Morgenstern (FGM) copula to model data with weak dependence. Some survival models with and without cure rate have been assumed for the marginal distributions. For inferential purpose a Bayesian approach via Markov Chain Monte Carlo (MCMC) was considered. Further, some discussions on model selection criteria are given and comparisons with other copula models were performed. To detect influential observations in the data we consider a Bayesian case deletion influence diagnostics based on the -divergence. The OpenBUGS and R systems were used to simulate samples of the posterior distribution. Numerical illustrations are presented considering artificial and real data sets. / Neste trabalho apresentamos uma análise bayesiana para dados de sobrevivência bivariados na presença de covariáveis e observações censuradas. Propomos uma distribuição bivariada para os tempos de sobrevivência baseada na cópula de Farlie- Gumbel-Morgenstern (FGM) para modelar dados com fraca dependência. Alguns modelos de sobrevivência com e sem fração de cura foram assumidos para as distribuições marginais. Para fins inferenciais foi considerada uma abordagem bayesiana usando métodos Monte Carlo em Cadeias de Markov (MCMC). Além disso, algumas discussões sobre os critérios de seleção de modelos são apresentadas e comparações com outras cópulas foram realizadas. A fim de detectar observações influentes nos dados analisados foi utilizado o método bayesiano de análise de influência caso a caso baseado na divergência. Os sistemas OpenBUGS e R foram utilizados para simular amostras da distribuição a posteriori de interesse. Ilustrações numéricas são apresentadas considerando conjunto de dados artificiais e reais.
|
282 |
Novos modelos de sobrevivência com fração de cura baseados no processo da carcinogêneseBorges, Patrick 03 May 2012 (has links)
Made available in DSpace on 2016-06-02T20:04:52Z (GMT). No. of bitstreams: 1
4552.pdf: 1449121 bytes, checksum: 5d02e70bde72ea9ef3c257c80ceed1dc (MD5)
Previous issue date: 2012-05-03 / Financiadora de Estudos e Projetos / In this dissertation we propose new models for survival with cure fraction to describe the biological mechanism of the event of interest (cancer) in studies of carcinogenesis in the presence of competing causes latent independent or correlated. The formulation of new models is based on stochastic modeling of the occurrence of tumors through three stages: initiation of a tumor not detectable, promotion and progression of the tumor to a detectable cancer. These models allow a simple pattern of the dynamics of tumor growth, and incorporate into the analysis features of the stage of tumor progression that is not possible in most survival models with cure fraction commonly used. For the proposed models, the inferential process was discussed in terms of classical and Bayesian point of view. Simulations studies were conducted in order to analyze the asymptotical properties of the classical estimation procedure. Real data applications demonstrate of use of the models. / Neste trabalho propomos modelos de sobrevivência com fração de cura para descrever o mecanismo biológico da ocorrência do evento de interesse (câncer) em estudos da carcinogênese na presença de causas competitivas latentes independentes ou correlacionadas. A formulação dos novos modelos é baseada na modelagem estocástica da ocorrência dos tumores através de três estágios: iniciação de um tumor não detectável, promoção e a progressão do tumor até um câncer detectável. Estes modelos permitem um padrão simples da dinâmica de crescimento do tumor, além de incorporarem características do estágio de progressão do tumor, que não é possível na maioria dos modelos de sobrevivência com fração de cura comumente utilizados. Para os modelos propostos, discutimos o processo inferencial do ponto de vista clássico e bayesiano. Estudos de simulações foram feitos com o objetivo de analisar as propriedades assintóticas do processo de estimação clássico. Aplicações a conjuntos de dados reais mostraram a aplicabilidade dos modelos.
|
283 |
Uma família de modelos de regressão com a distribuição original da variável respostaPaula, Marcelo de 05 April 2013 (has links)
Made available in DSpace on 2016-06-02T20:04:52Z (GMT). No. of bitstreams: 1
5021.pdf: 1591649 bytes, checksum: 6798e65e3b572fcfe760f083f660ff50 (MD5)
Previous issue date: 2013-04-05 / Financiadora de Estudos e Projetos / We know that statistic modeling by regression had a stronger impulse since generalized linear models (GLMs) development in 70 decade beginning of the XX century, proposed by Nelder e Wedderburn (1972). GLMs theory can be interpret like a traditional linear regression model generalization, where outcomes don't need necessary to assume a normal distribution, that is, any distribution belong to exponential distributions family. In binary logistic regression case, however, in many practice situations the outcomes response is originally from a discrete or continuous distribution, that is, the outcomes response has an original distribution that is not Bernoulli distribution and, although, because some purpose this variable was later dicothomized by an arbitrary cut of point C. In this work we propose a regression models family with original outcomes information, whose probability distribution or density function probability belong to exponential family. We present the models construction and development to each class, incorporating the original distribution outcomes response information. The proposed models are an extension of Suissa (1991) and Suissa and Blais (1995) works which present methods of estimating the risk of an event de_ned in a sample subspace of a continuous outcome variable. Simulation studies are presented in order to illustrate the performance of the developed methodology. For original normal outcomes we considered logistic, exponential, geometric, Poisson and lognormal models. For original exponential outcomes we considered logistic, normal, geometric, Poisson and lognormal models. In contribution to Suissa and Blais (1995) works we attribute two discrete outcomes for binary model, geometric and Poisson, and we also considered a normal distributions with multiplicative heteroscedastic structures continuous outcomes. In supplement we also propose the binary model with inated power series distributions outcomes considering a sample subspace of a zero inated geometric outcomes. We do several artificial data studies comparing the model of original distribution information regression model with usual regression model. Simulation studies are presented in order to illustrate the performance of the developed methodology. A real data set is analyzed by using the proposed models. Assuming a correct speci_ed distribution, the incorporation of this information about outcome response in the model produces more eficient likelihood estimates. / É sabido que a área de modelagem estatística por regressão sofreu um grande impulso desde o desenvolvimento dos modelos lineares generalizados (MLGs) no início da década de 70 do Século XX, propostos por Nelder e Wedderburn (1972). A teoria dos MLGs pode ser interpretada como uma generalização do modelo de regressão linear tradicional, em que a variável resposta não precisa necessariamente assumir a distribuição normal, e sim, qualquer distribuição pertencente à família exponencial de distribuições. Em algumas situações, porém, a distribuição da variável resposta Se originalmente fruto de uma outra distribuição discreta ou contínua, ou seja, a variável resposta tem uma distribuição original que não Se a usualmente considerada. Um exemplo desta situação Se a dicotomização de uma variável discreta ou contínua por meio de um ponto de corte arbitrário. Além disso, a variável resposta pode estar relacionada, de alguma forma, com uma outra variável de interesse. Nesse trabalho propomos uma família de modelos de regressão com a informação da variável resposta original, cuja distribuição de probabilidades ou função densidade de probabilidade pertence à família exponencial. O modelo de regressão logística com resposta normal e log-normal desenvolvido por Suissa e Blais (1995) Se apresentado como caso particular dos modelos de regressão com resposta de origem. Para a resposta de origem normal consideramos os modelos logístico, exponencial, geométrico, Poisson e log-normal. Para a resposta de origem exponencial consideramos os modelos logístico, normal, geométrico, Poisson e log-normal. Em contribuição ao trabalho de Suissa e Blais atribuímos duas respostas discretas ao modelo logístico, geométrico e de Poisson, e também consideramos uma resposta contínua normal com estrutura heteroscedástica. Adicionalmente, propomos também o modelo logístico com resposta pertencente à classe de distribuições séries de potências inflacionadas considerando o caso particular da resposta geométrica zero inflacionada. Realizamos vários estudos com dados artificiais comparando o modelo de regressão proposto com a informação da distribuição de origem e o modelo de regressão usual. Dois conjuntos de dados reais também são considerados. Assumindo uma distribuição corretamente especificada, o modelo produz estimativas de máxima verossimilhança mais eficientes e estimativas intervalares mais precisas para os coeficientes de regressão.
|
284 |
Algoritmo ejeção-absorção metropolizado para segmentação de imagensCalixto, Alexandre Pitangui 19 December 2014 (has links)
Made available in DSpace on 2016-06-02T20:04:53Z (GMT). No. of bitstreams: 1
6510.pdf: 2213423 bytes, checksum: 0c9b206a1b5f88772031ed160e9691b3 (MD5)
Previous issue date: 2014-12-19 / Financiadora de Estudos e Projetos / We proposed a new split-merge MCMC algorithm for image segmentation. We describe how an image can be subdivided into multiple disjoint regions, with each region having an associated latent indicator variable. The latent indicator variables are modeled with a prior Gibbs distribution governed by a spatial regularization parameter. Regions with same label define a component. Pixels within a component are distributed according to a Gaussian distribution. We treat the spatial regularization parameter and the number of components K as unknown. To estimate K, the spatial regularization parameter and the component parameters we propose the Metropolised split-merge (MSM) algorithm. The MSM comprises two type of moves. The first one, is a data-driven split-merge move. These movements change the number of components K in the neighborhood K _ 1 and are accepted according to Metropolis-Hastings acceptance probability. After a split-merge step, the component parameters, the spatial regularization parameter and latent allocation variables are updated conditional on K by using the Gibbs sampling, the Metropolis- Hastings and Swendsen-Wang algorithm, respectively. The main advantage of the proposed algorithm is that it is easy to implement and the acceptance probability for split-merge movements depends only of the observed data. The performance of the proposed algorithm is verified using artificial datasets as well as real datasets. / Nesta tese, modelamos uma imagem através de uma grade regular retangular e assumimos que esta grade é dividida em múltiplas regiões disjuntas de pixels. Quando duas ou mais regiões apresentam a mesma característica, a união dessas regiões forma um conjunto chamado de componente. Associamos a cada pixel da imagem uma variável indicadora não observável que indica a componente a que o pixel pertence. Estas variáveis indicadoras não observáveis são modeladas através da distribuição de probabilidade de Gibbs com parâmetro de regularização espacial _. Assumimos que _ e o número de componentes K são desconhecidos. Para estimação conjunta dos parâmetros de interesse, propomos um algoritmo MCMC denominado de ejeção-absorção metropolizado (EAM). Algumas vantagens do algoritmo proposto são: (i) O algoritmo não necessita da especificação de uma função de transição para realização dos movimentos ejeção e absorção. Ao contrário do algoritmo reversible jump (RJ) que requer a especificação de boas funções de transição para ser computacionalmente eficiente; (ii) Os movimentos ejeção e absorção são desenvolvidos com base nos dados observados e podem ser rapidamente propostos e testados; (iii) Novas componentes são criadas com base em informações provenientes de regiões de observações e os parâmetros das novas componentes são gerados das distribuições a posteriori. Ilustramos o desempenho do algoritmo EAM utilizando conjuntos de dados simulados e reais.
|
285 |
Um novo estimador exponencial por partes da curva de sobrevivência: um estudo comparativo.Moraes, Fabíola Eugênio Arrabaça 31 May 2006 (has links)
Made available in DSpace on 2016-06-02T20:05:58Z (GMT). No. of bitstreams: 1
DissFEAM.pdf: 568946 bytes, checksum: 953e676ad364fe570f94bc6a67fa2f34 (MD5)
Previous issue date: 2006-05-31 / In this work we revise the main basic concepts on survival analysis and reliability.
We present the most known nonparametric estimators of the survival function in the
presence of censured data. Their estimates are calculed and compared in an real data set
on human renal transplants. We point some problems that are not usually considered in
the structure of these estimators. As consequense of such problems we can observe possible
distortions in the estimates the direction of sub or over estimating the main characteristics
of interest. Some alternatives are pointed out for finding lesse vulnerable estimators.
Moreover, we propose a new modified piece wise exponential estimator, pointing out its
properties. / Neste trabalho, revisamos os principais conceitos básicos de análise de sobre-
vivência e confiabilidade, sob a abordagem da inferência clássica. Relacionamos os mais
conhecidos estimadores não paramétricos das funções de sobrevivência, com dados cen-
surados. Suas estimativas são calculadas e comparadas em um exemplo com dados reais de
transplantes renais humanos. Apontamos alguns problemas que, muitas vezes, deixaram
de ser considerados na estruturação destes estimadores. Como conseqüência destes pro-
blemas, citamos possíveis distorções nas estimativas, no sentido de sub ou super estimar as
principais características de interesse, e levantamos as possibilidades de se estar: expondo
a riscos desnecessários pacientes, acompanhados em estudos clínicos, ou submetendo-se
empresas a prejuízos financeiros, em estudos de fidelidade de clientes.
Além disso, propomos um novo estimador modificado do tipo exponencial por
partes, pela mudança que realizamos na taxa de risco acumulada de Kitchin nos subin-
tervalos formados pelos tempos consecutivos das ocorrências dos eventos de interesse.
Finalmente, dentro do conhecimento atualmente disponível, apontamos alternativas na
busca de correções para alguns destes problemas e realçamos a necessidade da elaboração
de estimadores menos vulneráveis a eles.
|
286 |
Modelagem estatística para a determinação de resultados de dados esportivos.Suzuki, Adriano Kamimura 27 June 2007 (has links)
Made available in DSpace on 2016-06-02T20:05:59Z (GMT). No. of bitstreams: 1
DissAKS.pdf: 566811 bytes, checksum: b01be331b665ab0824c5ab32218e4354 (MD5)
Previous issue date: 2007-06-27 / Financiadora de Estudos e Projetos / The basic result of a soccer game is the final scoreboard, which can be seen as a
bivariate random vector. Theoretically and based on existent literature we can argue that
the number of marked gols by a team in a game obeys a (univariate) Poisson distribution.
Thus, the Bivariate Poisson distributions are studied, in special for the class "of Holgate"
(1964).
Using as information the recent results of the teams, whose confrontation we want to
model, several methods were used for parameters estimation of the Bivariate Poisson class
"of Holgate". The idea is to use procedures that supply the probabilities of occurrence of
placares, so that thus the probability of the occurrence of a certain result (team home´s
victory, draw or defeat) can be calculated properly.
The parameters of Bivariate Poisson distribution "of Holgate" are assumed to have a
dependence factors, such as attack, defense and field, that possibly explain the numbers
of goals. / O resultado básico de uma partida de futebol é o seu placar …nal, que pode ser visto
como um vetor aleatório bivariado. Teoricamente e baseando-se na literatura existente
podemos argumentar que o número de gols marcados por um time em uma dada partida
obedeça a uma distribuição (univariada) de Poisson. Assim, são estudadas as distribuições
de Poisson Bivariadas, com destaque para a classe "de Holgate" (1964).
Utilizando como informações os resultados recentes dos times, cujo confronto se queira
modelar, foram utilizados vários métodos para a estimação de parâmetros da densidade da
classe Poisson Bivariada "de Holgate". A idéia é considerar procedimentos que forneçam
as probabilidades de ocorrência de placares, para que assim a probabilidade da ocorrência
de um determinado resultado (vitória do time mandante, empate ou derrota) possa ser
obtido.
Os parâmetros da distribuição de Poisson Bivariada "de Holgate" são assumidos terem
dependência de fatores, tais como ataque, defesa e campo, que possivelmente explicam os
números de gols feitos.
|
287 |
Modelos de sobrevivência de longa-duração : uma abordagem unificadaIritani, Mateus Rodrigues 13 June 2008 (has links)
Made available in DSpace on 2016-06-02T20:06:01Z (GMT). No. of bitstreams: 1
1988.pdf: 463519 bytes, checksum: ca45424706e2fdb08c40f42f1f560364 (MD5)
Previous issue date: 2008-06-13 / Financiadora de Estudos e Projetos / In survival analysis some studies show a meaningful cure rate after treatment followup, so considering standard survival models can not be appropriate. In this work is extended the long-term survival model proposed by Chen, Ibrahim and Sinha (1999) via generating function of a real sequence introduced by Feller (1967). This new formulation is the uni_cation of the long-term survival models proposed by Rodrigues el al. (2008). Also, as in Rodrigues el al. (2008) it is shown that the long-term survival generating function satis_es the proportional hazard property if only if the number of competing causes related to the occurence of a event of interest follows a Poisson distribution. A real data set is considered to illustrate this approach. / Em análise de sobrevivência, determinados estudos caracterizam-se por apresentar uma fração significativa de sobreviventes, ou seja, pacientes em tratamento que não apresentaram o evento de interesse, mesmo após um longo período de acompanhamento. Assim considerar modelos de sobrevivência usuais, que assumem que a função de sobrevivência converge para zero quando a variável tempo tende a infinito, pode não ser adequado. Nesse trabalho é apresentado uma extensão do modelo proposto por Chen, Ibrahim e Sinha (1999), usando a função geradora de uma sequência de números reais introduzida por Feller (1967). Essa extensão possibilitou o desenvolvimento de uma teoria unificada para os modelos de sobrevivência de longa-duração, Rodrigues et al. (2008). Mostra-se que modelos já existentes na literatura são considerados casos particulares da teoria unificada, por exemplo, o modelo de Berkson & Gage (1952). Também tem-se em Rodrigues et al. (2008), que a função geradora de longa-duração satisfaz a propriedade de risco proporcional se, e somente se, o número de causas competitivas relacionadas a ocorrência do evento de interesse segue uma distribuição de Poisson. Como ilutração utiliza-se um conjunto de dados reais.
|
288 |
Modelos de séries temporais com coeficientes variando no tempoSouza, Leandro Teixeira Lopes de 26 February 2009 (has links)
Made available in DSpace on 2016-06-02T20:06:02Z (GMT). No. of bitstreams: 1
2524.pdf: 3173626 bytes, checksum: 444d75f97bd088459e470db31df717a5 (MD5)
Previous issue date: 2009-02-26 / Financiadora de Estudos e Projetos / In this work they are presented extensions of Auto Regressive and Auto Regressive Conditional Heteroscedasticity models with coefficients varying in time. These coefficients have
been used as models for non stationary real time series, specially for financial series. The objective of this work is to present the models and the techniques involved in estimating time-varying coefficients, moreover, it is made an introduction to financial modeling and some suggestions in order to facilitate implementation and use of models with time-varying
coefficients. The simulation studies and the application on real data showed that the models have great potential to be exploited in the analysis of non-stationary series. The suggestions in confidence band and forecasting for the Auto regressive models with time-varying coefficients enable the use of models in financial data and other series that show a non-stationary characteristic. The modified algorithm for estimation of ARCH models varying in time was to increase the rate of convergence. The creation of a method for forecasting for ARCH models require a deeper study, although the algorithm has shown promising results in simulation study,
giving some evidences that it can be applied in real situation.
Finally, the contributions in the creation of functions for a free software that facilitate the use and the analysis of the models studied and the use of the proposed methods. / No presente trabalho são apresentadas extensões dos modelos Auto Regressivo e Auto Regressivo Condicionalmente Heteroscedasticos com coeficientes variando ao longo do tempo. Estes têm sido utilizados como modelos para séries
temporais reais não estacionárias, em especial as séries financeiras. O objetivo desse trabalho é apresentar os modelos e as técnicas envolvidas para estimar esses coeficientes que variam no tempo, além disso, é feito uma
introdução a modelagem financeira e algumas sugestões para facilitar a aplicação e utilização dos modelos com coeficientes variando no tempo. Os estudos de simulação e a aplicação em dados reais mostraram que os modelos têm um grande potencial a ser explorados na análise de séries não estacionárias. As sugestões de banda de confiança e previsão para os modelos Auto Regressivos com coeficientes variando no tempo viabilizam a utilização dos modelos em dados financeiros e outras séries que apresentam uma característica de não estacionariedade. As modificações no algoritmo de estimação dos modelos ARCH variando no tempo foram para aumentar a taxa de convergência. A criação de um método para previsão dos modelos ARCH necessitam de um estudo mais profundo, porém o algoritmo mostrou resultados promissores no estudo de simulação, dando alguns indícios de que pode ser aplicada na prática. Por fim, as contribuições na criação de funções para um software livre que facilitam a utilização e a análise dos modelos estudados bem como a utilização dos métodos propostos.
|
289 |
Modelos de regressão logística clássica, Bayesiana e redes neurais para Credit ScoringMendonça, Tiago Silva 15 February 2008 (has links)
Made available in DSpace on 2016-06-02T20:06:03Z (GMT). No. of bitstreams: 1
2410.pdf: 5430269 bytes, checksum: 6eb0e35f94b3108e492df5a93a5b0c34 (MD5)
Previous issue date: 2008-02-15 / Important advances have been achieved in the granting of credit, however, the problem of identifying good customers for the granting of credit does not provide a definitive solution. Several techniques were presented and are being developed, each presents its characteristics, advantages and disadvantages as to their discrimination power, robustness, ease of implementation and possibility of interpretation. This work presents three techniques for the classification of defaults in models of Credit Score, Classical Logistic Regression, Bayesian Logistic Regression with no prior information and Artificial Neural Networks with a few different architectures. The main objective of the study is to compare the performance of these techniques in the identification of customers default. For this, four metrics were used for comparison of models: predictive capacity, ROC Curve, Statistics of Kolmogorov Smirnov and capacity of hit models. Two data bases were used, an artificial bank and a real bank. The database was constructed artificially based on an article by Breiman that generates the explanatory variables from a multivariate normal distribution and the actual database used is a problem with Credit Score of a financial institution that operates in the retail Brazilian market more than twenty years. / Importantes avanços vêm sendo conquistados na área de concessão de crédito, não obstante, o problema de identificação de bons clientes para a concessão de crédito não apresenta uma solução definitiva. Diversas técnicas foram apresentadas e vêm sendo desenvolvidas, cada uma apresenta suas características, com vantagens e desvantagens no tocante ao seu poder de discriminação, robustez, facilidade de implementação e possibilidade de interpretação. Este trabalho apresenta três técnicas para a classificação de inadimplência em modelos de Credit Score, Regressão Logística Clássica, Regressão Logística Bayesiana com priori não informativa e Redes Neurais Artificiais com algumas diferentes arquiteturas. O objetivo principal do trabalho é comparar o desempenho destas técnicas na identificação de clientes inadimplentes. Para isto, Foram utilizadas quatro métricas para a comparação dos modelos: Capacidade Preditiva, Curva ROC, Estatística de Kolmogorov Smirnov e a Capacidade de Acerto dos modelos. Dois bancos de dados foram utilizados, um banco artificial e um banco real. O banco de dados artificial foi construído baseado em um artigo de Breiman que gera as variáveis explicativas a partir de uma distribuição normal multivariada e o banco de dados real utilizado trata-se de um problema de Credit Score de uma instituição financeira que atua no mercado varejista brasileiro há mais de vinte anos.
|
290 |
Uma nova abordagem para análise de dependência bivariadaMarchi, Vitor Alex Alves de 23 April 2010 (has links)
Made available in DSpace on 2016-06-02T20:06:04Z (GMT). No. of bitstreams: 1
3023.pdf: 2559668 bytes, checksum: 9cf8ca3c2627a6f2d69856b231e8a0a4 (MD5)
Previous issue date: 2010-04-23 / Financiadora de Estudos e Projetos / In this dissertation we describe and implement procedures for nonparametric estimation of copulas and Sibuya function, and also procedures for bivariate analysis of dependence based on the behavior of their contours plot. Besisdes, we describe and implement the chiplot procedure and as well as a procedure for analising bivariate dependence in presence of censoring in the sample. Particularly, we propose a way to use it in a local correlation analysis. The performance of the proposed procedures are illustrated and evaluated in cases of very simple correlation, but also in a more complex correlation schemes. / Nesta dissertação descrevemos e implementamos procedimentos para estimação paramétrica da cópula e da função de Sibuya, e também procedimentos para análise de dependência bivariada, baseados no comportamento das suas curvas de nível. Também, descrevemos e implementamos o procedimento chi-plot e um procedimento para a análise de dependência bivariada com presença de censura na amostra. Particularmente, propomos formas de usá-los em análise de correlação local. O desempenho dos procedimentos propostos são ilustrados e avaliados em casos de estruturas de correlação simples, mas também em esquemas de correlação mais complexa.
|
Page generated in 0.0619 seconds