1 |
Aplicações de estatística em marketingCarvalho, Thiago Daniel 14 December 2007 (has links)
Made available in DSpace on 2016-06-02T20:06:01Z (GMT). No. of bitstreams: 1
2070.pdf: 433337 bytes, checksum: 983c3c44c479fba3f8754777adc4cd64 (MD5)
Previous issue date: 2007-12-14 / In this work, we analyse the use of the statistics in the improvement of some attitudes of a company regarding marketing strategy. We deal with methods which permit the identification of the best costumers and the preferences of those costumers for product/service characteristics, so that a company can relate itself better to its costumers. / Neste trabalho, procuramos análisar como a estatística pode melhorar algumas atitudes de uma empresa com relação a estratégia de marketing. Abordamos métodos os quais permitem identificar os melhores consumidores e a preferência dos mesmos por características de produtos/serviços de forma que a empresa possa se relacionar melhor com seus consumidores.
|
2 |
Modelo de regressão com erros normais assimétricos: uma abordagem bayesianaFreitas, Luiz Antonio de 13 December 2005 (has links)
Made available in DSpace on 2016-06-02T20:06:11Z (GMT). No. of bitstreams: 1
840.pdf: 637562 bytes, checksum: 655616584fbe63191ef8eeeb51966d31 (MD5)
Previous issue date: 2005-12-13 / Financiadora de Estudos e Projetos / The statistical analysis of the continuous data set has been developed in most cases for normal models, specially, in the linear and nom linear models context. In the simple linear regression models, even accepting as reasonable the normal error assumption, usually it can take misleading inferences for the parameter of interest. In the classical literature is supposed that the errors follow the normal distribution with zero mean and unknown variance. In this work, we intend to make the normality as-sumption flexible using a new class of asymmetric distributions. The first class considered was studied by Azzalini [3], which includes the normal distributions as a particular case. The second flexible class was introduced by Ma & Genton [22] and the third one is the extended normal distributions proposed by Arellano-Valle [2]. These two last ones had been enclosed as alternative proposals to the model of Azzalini [3]. With this purpose, inferences procedures based on Bayesian approaches, will be developed to estimate the parameters involved in the simple linear regression models with asymmetrical errors. / A análise estatística para o estudo de dados contínuos tem sido desenvolvida em grande parte combase nomodelo normal, que se destaca sobretudo no contexto de modelos lineares e não lineares. No estudo da regressão linear univariada, mesmo aceitando como razoável a suposição de simetria para os erros, em muitas situações práticas essa suposição de normalidade pode nos levar a inferências pouco apropriadas sobre os parâmetros de interesse. Na literatura clássica é suposto que os erros seguem uma distribuição normal com mé-
dia zero e variância desconhecida. Neste trabalho, pretendemos flexibilizar essa suposição de normalidade, dispondo de novas classes de distribuições assimétricas. A primeira classe considerada é a proposta por Azzalini [3], que inclui a distribuição normal como um caso particular. A segunda é a dos modelos flexíveis de Ma & Genton [22] e a terceira é a classe de distribuições normais assimétricas estendidas, proposta por Arellano-Valle & Azzalini [2]. Estas duas últimas foram incluídas como propostas alternativas ao modelo de Az-zalini [3]. Com esse objetivo, métodos de inferência baseados na abordagem bayesiana, serão desenvolvidos para estimar os parâmetros envolvidos no modelo de regressão linear simples com erros assimétricos.
|
3 |
Desempenho do gráfico de controle CUSUM tabular para o monitoramento da média / The performance of tabular CUSUM control chart for monitoring the meanLara, Rodrigo Luiz Pereira 16 February 2012 (has links)
Made available in DSpace on 2015-03-26T13:32:14Z (GMT). No. of bitstreams: 1
texto completo.pdf: 2818845 bytes, checksum: be3f419fcc4c9f0b3cb6050f150daf3c (MD5)
Previous issue date: 2012-02-16 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / This study aimed to estimate the probabilities of false and true alarms caused by the Cumulative Sum control chart over the i rational subgroups, according to various combinations of size n of subgroup rational, standardized decision interval h* and the tolerance value k*. To study them, were simulated data from a random variable Y, under normal distribution with mean μ0 = 0 and standard deviation 1 s 0 = for a process under statistical control over 50 rational subgroups, for n between 1-16. To this end, 1000 simulations were performed by rational subgroup. Then four out of control processes have been set for the statistical average at all rational subgroup ( μ1 = μ0 +ds 0 ) in which d refers to the displacement of the average in numbers of standard deviations of the process. The probability of false alarm a decreases with the increase, increase and decrease of k*, h* and i respectively, while the probability of true alarm Pd has direct relation to n and i, and inverse relation to h* for the same pre-defined minimum difference between the means μ0 and μ1 considering the choice of k* as being half of that difference in number of standard deviations. Both probabilities of true and false alarms were obtained by the normal and lognormal 3P probability distributions adjusted to the random variable Z(i) + S (i −1)* H . In order to give a power greater than 0.90 and a equal or less than 0.05 or 0.01 were recommended to different combinations of k*, h*, i and n. / O presente trabalho teve por objetivo estimar as probabilidades dos alarmes falsos e verdadeiros provocados pelo gráfico de controle CUSUM tabular ao longo dos i subgrupos racionais, em função de diferentes combinações entre o tamanho n do subgrupo racional, o interval o de decisão padronizado h* e o valor de tolerância k*. Para estudá-los foram simulados dados de uma variável aleatória Y, sob distribuição normal com média μ0 = 0 e desvio-padrão 1 s 0 = para um processo sob controle estatístico para até 50 subgrupos racionais com até 16 repetições. Para tanto, foram realizadas 1000 simulações por subgrupo racional. Em seguida foram estabelecidos outros quatro processos fora de controle estatístico para a média em todos os subgrupos racionais ( μ1 = μ0 +ds 0 ), em que d se refere ao deslocamento da média em número de desvios-padrão do processo. A robabilidade do alarme falso (a ) diminui com os respectivos aumento, aumento e diminuição de k*, h* e i, enquanto a probabilidade do alarme verdadeiro (Pd) possui relação direta com n e i, e inversa com h* para uma mesma diferença mínima pré-definida entre as médias μ1 e μ0 e considerando-se a escolha de k* como sendo a metade desta em número de desvios-padrão. Ambas probabilidades dos alarmes falso e verdadeiro foram obtidas por meio das distribuições de probabilidade normal e lognormal 3P ajustadas à variável aleatória Z(i) + S (i −1) * H . Para conferir um Pd igual ou superior a 0,90 e a igual ou inferior a 0,05 ou 0,01 recomendou-se diferentes combinações de k*, h*, i e n.
|
4 |
Inferência bayesiana para o tamanho de uma população fechada com erros de registros de dados amostraisOda, Fausto Hideki 12 June 2008 (has links)
Made available in DSpace on 2016-06-02T20:04:50Z (GMT). No. of bitstreams: 1
2000.pdf: 560704 bytes, checksum: dc5176aa7963d595ab53cc7cd4313b33 (MD5)
Previous issue date: 2008-06-12 / Financiadora de Estudos e Projetos / In this dissertation we determine maximum likelihood and bayesian estimates of the size of a closed population, from two lists of data of elements of the population. It has been supposed that the registers of the individual information in the lists are capable of mismatches and, with relation to the bayesian method, the prioris distributions are noninformative and they have maximum enthropy for the parameters. We also present the bayesian model, witch has considered the numbers elements of the two lists as a latent variable. We compare these models through examples with simulated and real data. / Nesta dissertação determinamos estimativas de máxima verossimilhança e bayesianas do tamanho de uma população fechada, a partir de duas listas de dados de elementos da população. Supomos que os registros das informações individuais nas listas são passíveis de erros e, com relação ao método bayesiano, as distribuições a priori adotadas para os parâmetros são não informativas e de máxima entropia. Apresentamos também um o modelo bayesiano, onde consideramos o número de elementos coincidentes nas duas listas como uma variável latente. Comparamos estes três modelos através de exemplos com dados simulados e reais.
|
5 |
Modelo de mistura com número de componentes desconhecido: estimação via método split-mergeSaraiva, Erlandson Ferreira 30 November 2009 (has links)
Made available in DSpace on 2016-06-02T20:04:50Z (GMT). No. of bitstreams: 1
2715.pdf: 5847504 bytes, checksum: 33fc1cbb82d98f376e09b5096d9e726c (MD5)
Previous issue date: 2009-11-30 / Financiadora de Estudos e Projetos / We propose the split-merge MCMC and birth-split-merge MCMC algorithms to analyse mixture models with an unknown number of components. The strategy for splitting is based on data and posterior distribution. Allocation probabilities are calculated based on component parameters which are generated from the posterior distribution given the previously allocated observations. The split-merge proposals are developed to be reversible and are accepted according to Metropolis-Hastings probability. This procedure makes possible a greater change in configuration of latent variables, in a single iteration of algorithms, allow a major exploration of clusters and avoid possible local modes. As an advantage, our approach determines a quick split proposal in contrary to former split procedures which require substantial computational effort. In the birth-split-merge MCMC algorithm, the birth movement is obtained directly from the procedure to update the latent variables and occurs when an observation determine a new cluster. The performance of the method is verified using artificial data sets and two real data sets. The first real data set consist of benchmark data of velocities from distant galaxies diverging from our own while the second is Escherichia Coli bacterium gene expression data. / Propomos uma abordagem bayesiana hierárquica e os algoritmos split-merge MCMC e birth-split-merge MCMC para a estimação conjunta dos parâmetros e do número de componentes de um modelo com mistura de distribuições. A proposta split é baseada nos dados e na distribuição a posteriori dos parâmetros. Nesta proposta, utilizamos probabilidades de alocação que são calculadas de acordo com os parâmetros associados a cada componente, que são gerados da distribuição a posteriori dado as observações previamente alocadas. As propostas split e merge são desenvolvidas para serem reversíveis e são aceitas de acordo com a probabilidade de aceitação de Metropolis-Hastings, para garantir a existência da distribuição estacionária. O algoritmo birth-split-merge apresenta as mesmas propostas split-merge porém este algoritmo permite que ao atualizar uma variável latente, esta seja capaz de determinar o nascimento" (birth) de uma nova componente. Verificamos a performance dos algoritmos propostos utilizando dados artificiais, gerados via simulação, e dois conjuntos de dados reais. O primeiro é o bem conhecido conjunto de dados sobre a velocidade de galáxias e o segundo é um conjunto de dados de expressão gênica. A contribuição teórica presente nesta tese é o desenvolvimento de um pocesso estocástico com base nos movimentos split-merge, que são baseados nos dados. Ou seja, se a amostra é proveniente de uma população composta por k subpopulações, nosso método busca informações sobre as k subpopulações diretamente nos dados observados. Com isso, quando propomos o surgimento de uma nova componente esta sempre tem dados associados, i.e., determina uma partição nos dados observados, e os parâmetros são gerados da distribuição a posteriori, o que não ocorre nos métodos alternativos.
|
6 |
Modelos de sobrevivência na presença de eventos recorrentes e longa duraçãoCobre, Juliana 05 March 2010 (has links)
Made available in DSpace on 2016-06-02T20:04:50Z (GMT). No. of bitstreams: 1
2908.pdf: 926637 bytes, checksum: f4afd93017b2cb0c95459918a00dc65d (MD5)
Previous issue date: 2010-03-05 / Financiadora de Estudos e Projetos / In this thesis it is proposed to analyze recurrent event data, recurrent event data with cure fraction and recurrent event data with censoring and competing causes. For the recurrent event data analysis it is proposed a multiple time scale survival model, which includes several particular cases. For recurrent event data with a cure fraction we consider a multiple time scale survival models embedded on a mixture cure fraction modeling. It is also proposed a general model to survival data in presence of competitive causes. In this case, it is assumed that the number of competitive causes follows a generalized negative binomial distribution. While, for the time of occurrence of each cause, a Weibull and a log-logistic distribution were considered. Simulations studies were conducted for every proposed model in order to analyze the asymptotical properties of the estimation procedures. Both, maximum likelihood and Bayesian approaches were considered for parameter estimation. Real data applications demonstrate de use of the proposed models. / Neste trabalho propomos analisar dados de eventos recorrentes, dados de eventos recorrentes com fração de cura e dados de eventos recorrentes com tempos não observados e causas competitivas, que implicam na possibilidade de cura. Para a análise de dados de evento recorrente propomos um modelo de escala múltipla de tempo, que engloba diversas classes de modelos como casos particulares. Na análise de dados de eventos recorrentes com fração de cura tivemos como base os modelos de escala múltipla de tempo e o modelo de mistura padrão. Também propomos um modelo geral para tratar de dados na presença de causas competitivas. Neste caso, assumimos que o número de causas competitivas segue uma distribuição binomial negativa generalizada e consideramos duas abordagens para o tempo de ocorrência de cada causa, sendo uma delas uma distribuição Weibull e a outra uma distribuição log-logística. Para todos os modelos propostos foram feitos estudos de simulação com o objetivo de analisar as propriedades frequentistas dos processos de estimação. Aplicações a conjuntos de dados reais mostraram a aplicabilidade dos modelos propostos.
|
7 |
Modelo de mistura padrão de longa duração com censura uniforme-exponencialChaves, Josenildo de Souza 25 March 2010 (has links)
Made available in DSpace on 2016-06-02T20:04:51Z (GMT). No. of bitstreams: 1
2932.pdf: 982095 bytes, checksum: ce563edc7be982c4acf4c88ef1c3c32b (MD5)
Previous issue date: 2010-03-25 / Financiadora de Estudos e Projetos / In survival data analysis it is common the occurrence of a large number of individuals to the right. This fact can indicate that, in a fraction of the individuals the event of interest will never happen, in other words, a fraction of individuals of the population is cured or immune. This case is not usually taken into account by the usual survival theory that, in general, considers that the individuals at risk will not achieve cure during the follow-up period. Therefore, the survival models with cure fraction, or long-term survival models, have received a lot of attention in recent years. We consider the exponential distribution for the survival time of individuals at risk and the uniform-exponential distribution for the censoring time. In many situations, it is evident that the censoring mechanism is informative. Lagakos & Williams (1978) proposed a class of models where the acting of the censoring mechanism in the survival time is evaluated and Lagakos (1979) presented several situations in which the assumption of noninformative censoring is violated. The main purpose of this work is to verify the impact of informative uniform-exponential censoring in the survival data analysis under the standard mixture model. / Na análise de dados de sobrevivência é frequente a ocorrência de um grande número de indivíduos censurados à direita. Este fato pode ser a indicação de que para uma fração de indivíduos no estudo o evento de interesse nunca vai ocorrer, ou seja, uma fração de indivíduos da população é de curados ou imunes. Este caso não é admitido pela teoria de sobrevivência usual, que em geral considera que todos os indivíduos em risco não terão cura durante o período de acompanhamento. Por isso, os modelos de sobrevivência com fração de cura, ou de longa duração, têm recebido muita atenção em anos recentes. Utilizamos a distribuição exponencial para o tempo de sobrevivência dos indivíduos em risco e a uniforme-exponencial para o tempo de censura. Em muitas situações é evidente que o mecanismo de censura é informativo. Lagakos & Williams (1978) propuseram uma classe de modelos em que o papel do mecanismo de censura em análise de sobrevivência é avaliado e Lagakos (1979) apresentou várias situações em que a suposição de censura não-informativa é violada. Este trabalho tem como objetivo principal verificar o impacto da censura informativa uniforme-exponencial na análise de dados de sobrevivência sob o modelo de mistura padrão.
|
8 |
Modelo de mistura padrão com tempo de falha exponencial e censura informativaFreitas, Luiz Antonio de 25 June 2010 (has links)
Made available in DSpace on 2016-06-02T20:04:51Z (GMT). No. of bitstreams: 1
3147.pdf: 1261036 bytes, checksum: 5b16b6f20a2eacfa466c5fdb1e546d3a (MD5)
Previous issue date: 2010-06-25 / Financiadora de Estudos e Projetos / In this work we consider the long-term survival model introduced by Berkson & Gage (1952), for modeling survival data of nonhomogeneous populations, where a subpopulation does not present the event of interest, despite a long follow-up period. The cure rate models presented in the literature usually are developed under the assumption that censorship is noninformative. In the usual survival models Lawless (1982) considers that the variable of censoring is informative if its density function and its distribution function involve some parameter of interest. We propose a new definition of informative censoring in a similar way. This de_nition is extended for the unified long-term survival models (Rodrigues et al., 2009). Moreover, we verify, with simulated data, the impact caused by informative censoring in the coverage probabilities and in the lengths of asymptotic confidence intervals of the parameters of interest. A Bayesian approach with Jeffreys prior is also proposed. An example with real data is analysed. / Neste trabalho consideramos o modelo de sobrevivência de longa duração introduzido por Berkson & Gage (1952), que serve para modelar dados de populações não homogêneas, em que parte da população não apresenta o evento de interesse mesmo após um longo período de observação. Os modelos com fração de cura apresentados na literatura são usualmente desenvolvidos sob a suposição de censura não informativa. Sob o modelo usual de sobrevivência, Lawless (1982) considera que a variável de censura _e informativa se suas funções de densidade e de distribuição acumulada envolvem algum parâmetro de interesse. Neste trabalho enunciamos uma nova definição de censura informativa, que _e similar _a de Lawless (1982). Esta definição é extendida para o modelo unificado de longa duração proposto por (Rodrigues et al., 2009). Também verificamos, com uso de dados simulados, o impacto da censura informativa na cobertura e no comprimento dos intervalos assintóticos dos parâmetros de interesse. Uma abordagem bayesiana com distribuições a priori de Jeffreys é proposta. Um exemplo com dados reais é analisado.
|
9 |
Modelos de regressão binomial correlacionadaPires, Rubiane Maria 18 May 2012 (has links)
Made available in DSpace on 2016-06-02T20:04:51Z (GMT). No. of bitstreams: 1
4475.pdf: 1244079 bytes, checksum: 3217620ac6ab16457a5ab67a737b433c (MD5)
Previous issue date: 2012-05-18 / Financiadora de Estudos e Projetos / In this thesis, a class of correlated binomial regression models is proposed. The model is based on the generalized binomial distribution proposed by Luceño (1995) and Luceño & Ceballos (1995). The regression structure is modeled by using four different link functions and the dependence between the Bernoulli trials is modeled by using three different correlation structures. A data augmentation scheme is used in order to overcome the complexity of the mixture likelihood. Frequentist and Bayesian approaches are used in the model fitting process. A diagnostics analysis is provided in order to check the underlying model assumptions and to identify the presence of outliers and/or influential observations. Simulation studies are presented to illustrate the performance of the developed methodology. A real data set is analyzed by using the proposed models. Also the correlated binomial regression models is extended to include measurement error in a predictor. This new class of models is called additive normal structure correlated binomial regression models. The inference process also includes a data augmentation scheme to overcome the complexity of the mixture likelihood. / Nesta tese é proposta uma classe de modelos de regressão binomial correlacionada baseados na distribuição binomial generalizada, proposta por Luceño (1995) e Luceño & Ceballos (1995). A estrutura de regressão é modelada usando diferentes funções de ligação e a relação de dependência entre os ensaios de Bernoulli é modelada usando diferentes estruturas de correlação. Uma estratégia de dados aumentados é utilizada para contornar a complexidade da função de verossimilhança. As abordagens clássica e Bayesiana são utilizadas no processo de ajuste dos modelos propostos. Análise de diagnóstico é desenvolvida com o objetivo de verificar as suposições iniciais do modelo e identificar a presença de outliers e/ou observações influentes. Estudos de simulação e aplicação em dados reais ilustram as metodologias. Propomos também uma nova classe de modelos de regressão binomial correlacionada, denominados modelos de regressão binomial correlacionada aditivo estrutural normal, que envolvem a presença de uma covariável com erro de medida. No processo de estimação para esta nova classe, dados aumentados e aproximação de integral são utilizadas para contornar a complexidade da função de verossimilhança.
|
10 |
Modelo bayesiano de coincidências em processos de listagensReis, Juliana Coutinho dos 03 May 2006 (has links)
Made available in DSpace on 2016-06-02T20:05:58Z (GMT). No. of bitstreams: 1
DissJCR.pdf: 420621 bytes, checksum: a07860bb2ec0004c2a221933e0f45403 (MD5)
Previous issue date: 2006-05-03 / Financiadora de Estudos e Projetos / In this work we present a bayesian methodology to estimate the number of coincident
individuals of two lists, considering the occurrence of correct and incorrect registers of the
informations registers of each individual present in the lists. We adopt, in this model, three
di¤erent prioris for the number of coincident pairs and study its performance through
simulated data. Due to di¢ culties found in the choice of the hiperparameters of this
model, we present as solution to the this problem a hierarchic bayesian model and verify
its adequateness through the gotten estimates for simulated data. / Nesta dissertação apresentamos uma metodologia bayesiana para estimar o número
de indivíduos coincidentes de duas listas, considerando a ocorrência de registros corretos
e incorretos das informações cadastrais de cada indivíduo presente nas listas. Adotamos
três diferentes prioris para o número de pares coincidentes e estudamos sua performance
através de dados simulados. Devido às dificuldades encontradas na escolha dos valores dos
hiperparâmetros deste modelo, apresentamos como solução a este problema um modelo
bayesiano hierárquico e verificamos sua adequabilidade através das estimativas obtidas
para dados simulados.
|
Page generated in 0.0348 seconds