1 |
[en] USING LINEAR MIXED MODELS ON DATA FROM EXPERIMENTS WITH RESTRICTION IN RANDOMIZATION / [pt] UTILIZAÇÃO DE MODELOS LINEARES MISTOS EM DADOS PROVENIENTES DE EXPERIMENTOS COM RESTRIÇÃO NA ALEATORIZAÇÃOMARCELA COHEN MARTELOTTE 04 October 2010 (has links)
[pt] Esta dissertação trata da aplicação de modelos lineares mistos em dados provenientes de experimentos com restrição na aleatorização. O experimento utilizado neste trabalho teve como finalidade verificar quais eram os fatores de controle do processo de laminação a frio que mais afetavam a espessura do material utilizado na fabricação das latas para bebidas carbonatadas. A partir do experimento, foram obtidos dados para modelar a média e a variância da espessura do material. O objetivo da modelagem era identificar quais fatores faziam com que a espessura média atingisse o valor desejado (0,248 mm). Além disso, era necessário identificar qual a combinação dos níveis desses fatores que produzia a variância mínima na espessura do material. Houve replicações neste experimento, mas estas não foram executadas de forma aleatória, e, além disso, os níveis dos fatores utilizados não foram reinicializados, nas rodadas do experimento. Devido a estas restrições, foram utilizados modelos mistos para o ajuste da média, e da variância, da espessura, uma vez que com tais modelos é possível trabalhar na presença de dados auto-correlacionados e heterocedásticos. Os modelos mostraram uma boa adequação aos dados, indicando que para situações onde existe restrição na aleatorização, a utilização de modelos mistos se mostra apropriada. / [en] This dissertation presents an application of linear mixed models on data from an experiment with restriction in randomization. The experiment used in this study was aimed to verify which were the controlling factors, in the cold-rolling process, that most affected the thickness of the material used in the carbonated beverages market segment. From the experiment, data were obtained to model the mean and variance of the thickness of the material. The goal of modeling was to identify which factors were significant for the thickness reaches the desired value (0.248 mm). Furthermore, it was necessary to identify which combination of levels, of these factors, produced the minimum variance in the thickness of the material. There were replications of this experiment, but these were not performed randomly. In addition, the levels of factors used were not restarted during the trials. Due to these limitations, mixed models were used to adjust the mean and the variance of the thickness. The models showed a good fit to the data, indicating that for situations where there is restriction on randomization, the use of mixed models is suitable.
|
2 |
[en] ANALYSIS OF MEDIA E DISPERSION IN UNREPLICATED FACTORIAL EXPERIMENTS FOR THE OPTIMIZATION OF INDUSTRIAL PROCESSES / [pt] ANÁLISE DA MÉDIA E DISPERSÃO EM EXPERIMENTOS FATORIAIS NÃO REPLICADOS PARA OTIMIZAÇÃO DE PROCESSOS INDUSTRIAISANTONIO FERNANDO DE CASTRO VIEIRA 20 December 2004 (has links)
[pt] Esta tese reúne as técnicas estatísticas indicadas para a
modelagem da média e
da dispersão das características de qualidade de processos
e produtos, em
experimentos fatoriais não replicados, resultando na
definição de um roteiro
integrado e detalhado de análise. A motivação vem de que,
apesar de haver várias
publicações sobre regressão linear clássica, modelos
lineares generalizados (MLG),
transformação da resposta e planejamento de experimentos,
não existe um texto que
reúna e descreva em detalhe todos os aspectos da modelagem
da média e da
dispersão em experimentos fatoriais. Os poucos textos sobre
esse assunto não
descrevem vários aspectos importantes em estudos dessa
natureza, por exemplo,
como são aplicados os testes de significância dos
coeficientes dos MLG, e quais são
as estatísticas e os gráficos indicados para verificar a
adequação do modelo.
Ademais, nada foi encontrado na literatura sobre a
identificação de modelos em
experimentos fatoriais. Todos esses aspectos são detalhados
nessa tese. Uma vez
construído o modelo, é mostrado como usá-lo para obter as
condições ótimas de
operação dos processos e produtos. Além do cumprimento
desse objetivo principal,
a tese traz algumas contribuições adicionais; a saber: a)
aponta limitações em todos
quatro métodos da literatura que se propõem a escolher a
transformação mais
adequada para a resposta. Esses métodos não produziram
resultados satisfatórios
quando houve interações significativas entre os fatores; b)
propõe a utilização de
métodos de transformação da resposta como fonte de
indicação da função de ligação
a ser usada nos modelos lineares generalizados; e c) propõe
a utilização da função
de log-verossimilhança para uma escolha conjunta da
distribuição de probabilidade
e da função de ligação, nos modelos lineares generalizados. / [en] This thesis puts together the statistical techniques
indicated for modelling the
mean and dispersion of quality characteristics of products
and processes via
unreplicated factorial experiments, resulting in the
definition of an integrated and
detailed script for the analysis. It was motivated by the
fact that, although there are
many publications about classic linear regression,
generalized linear models
(GLMs), response transformation and design of experiments,
there is no one text
which put together and describe in detail all the aspects
of the modelling of the
mean and the dispersion in factorial experiments. The few
texts on the subject do
not describe a number of important aspects in studies of
this nature, e.g. how
significance tests for the coefficients in GLMs should be
applied and which are the
statistics and plots indicated for checking model adequacy.
In addition, nothing
was found in the literature about model identification in
factorial experiments. All
these aspects are detailed in this thesis. Once the model
is built, we show how to
use it in order to obtain the optimal operating conditions
for products and
processes. Besides achieving this main objective, the
thesis brings some additional
contributions, namely: a) it points out limitations in all
the four methods in the
literature which have the purpose of selecting the most
adequate transformation of
the response; b) it proposes using response transformation
methods as a source of
indication of the link function to use in GLMs, and c) it
proposes using the loglikelihood
function for the joint choice of the probability
distribution and of the
link function in GLMs.
|
3 |
[en] A BIVARIATE GARMA MODEL WITH CONDITIONAL POISSON DISTRIBUTION / [pt] UM MODELO GARMA BIVARIADO COM DISTRIBUIÇÃO CONDICIONAL DE POISSONPRISCILLA FERREIRA DA SILVA 02 May 2014 (has links)
[pt] Os modelos lineares generalizados auto regressivos com médias móveis (do inglês GARMA), possibilitam a modelagem de séries temporais de dados de contagem com estrutura de correlação similares aos dos modelos ARMA. Neste trabalho é desenvolvida uma extensão multivariada do modelo GARMA, considerando a especificação de um modelo Poisson bivariado a partir da distribuição de Kocherlakota e Kocherlakota (1992), a qual será denominada de modelo Poisson BGARMA. O modelo proposto é adequado para séries de contagens estacionárias, sendo possível, através de funções de ligação apropriadas, introduzir deterministicamente o efeito de sazonalidade e de tendência. A investigação das propriedades usuais dos estimadores de máxima verossimilhança (viés, eficiência e distribuição) foi realizada através de simulações de Monte Carlo. Com o objetivo de comparar o desempenho e a aderência do modelo proposto, este foi aplicado a dois pares de séries reais bivariadas de dados de contagem. O primeiro par de séries apresenta as contagens mensais de óbitos neonatais para duas faixas de dias de vida. O segundo par de séries refere-se a contagens de acidentes de automóveis diários em dois períodos: vespertino e noturno. Os resultados do modelo proposto, quando comparados com aqueles obtidos através do ajuste de um modelo Gaussiano bivariado Vector Autoregressive (VAR), indicam que o modelo Poisson BGARMA é capaz de capturar de forma adequada as variações de pares de séries de dados de contagem e de realizar previsões com erros aceitáveis, além de produzir previsões probabilísticas para as séries. / [en] Generalized autoregressive linear models with moving average (GARMA) allow the modeling of discrete time series with correlation structure similar to those of ARMA’s models. In this work we developed
an extension of a univariate Poisson GARMA model by considerating the specification of a bivariate Poisson model through the distribution presented on Kocherlakota and Kocherlakota (1992), which will be called
Poisson BGARMA model. The proposed model not only is suitable for stationary discrete series, but also allows us to take into consideration the effect of seasonality and trend. The investigation of the usual properties of the maximum likelihood estimators (bias, efficiency and distribution) was performed using Monte Carlo simulations. Aiming to compare the performance and compliance of the proposed model, it was applied to two pairs of series of bivariate count data. The first pair is the monthly counts of neonatal deaths to two lanes of days. The second pair refers to counts of daily car accidents in two distinct periods: afternoon and evening. The results of our model when compared with those obtained by fitting a bivariate Vector Autoregressive Gaussian model (VAR) indicates that the Poisson BGARMA model is able to proper capture the variability of bivariate vectors of real time series of count data, producing forecasts with acceptable errors and allowing one to obtain probability forecasts.
|
4 |
[en] MODELING THE IMPROVEMENT OF MORTALITY RATES ON LIFE TABLES CONSTRUCTION / [pt] TÉCNICAS DE MODELAGEM DO IMPROVEMENT PARA CONSTRUÇÃO DE TÁBUAS GERACIONAISRAQUEL RODRIGUES SANTOS 06 March 2008 (has links)
[pt] Melhorias da mortalidade vêm sendo observadas em
praticamente todo o
mundo desde o início do século XX e impactam diretamente o
resultado dos
cálculos atuariais. A incorporação das tendências futuras
da mortalidade no
cálculo atuarial é possível através do uso de tábuas de
mortalidade geracionais,
que fornecem probabilidades de morte baseadas não só na
idade x do indivíduo,
como também no tempo t. O estudo aborda técnicas para
projeção da mortalidade
e consequente determinação dos fatores de improvement,
utilizados para tornar
uma tábua de mortalidade na forma geracional. As
metodologias Lee-Carter e
modelos lineares generalizados são utilizadas para
construir previsões de
mortalidade com base na experiência de mortalidade da
população da Inglaterra e
País de Gales da última metado do século passado. / [en] By the beginning of the 20th century, improvement on
mortality started
rising in many countries and this has a direct impact on
the results of actuarial
calculus. The trend of mortality can be incorporated into
actuarial calculus
through the use of generation mortality tables, that
consider not only the age x of
the individual but also the time t. This study explores
techniques to project the
mortality and the improvement factors used to turn a
mortality table into a
generational one. The methodologies of Lee-Carter and
generalized linear models
were used to forecast mortality by using the England and
Wales mortality
experience of the past half century.
|
5 |
[en] PERSISTENCY ANALYSIS OF PARTICIPANTS OF PENSION PLANS / [pt] ANÁLISE DE PERSISTÊNCIA DE PARTICIPANTES EM PLANOS DE PREVIDÊNCIAROBERTA DE SOUZA CHUN 26 November 2007 (has links)
[pt] O tema central deste trabalho é apresentar modelos de
persistência. As
probabilidades de persistência na carteira de um produto de
determinada empresa
de seguros e previdência serão estudadas de forma agregada,
de tal forma que se
torna possível a elaboração de outros estudos, como por
exemplo, de análise de
lucratividade, mesmo com poucos dados, o que inviabiliza a
elaboração de tábuas
de múltiplos decrementos. Serão avaliadas as possíveis
causas de saídas de acordo
com as características do plano. O desenvolvimento dos
modelos tomam por base
dados em forma de triângulo, técnica normalmente utilizada
para cálculo de
provisões de seguros. / [en] The objective of this work is to present persistency
models. The
probabilities of remaining in a Insurance and Pension
company portfolio will be
studied in a aggregate way, in this way it is possible to
develop another results
such as profitability, even though, there is poor data,
what turns impossible to
build multiple decrement tables. The possible lapses causes
will be evaluated
according to the plan. The models development is based on
triangular data, this
technique is usual on claims reserving.
|
6 |
[en] ESSAYS ON SHORT-TERM LOAD FORECASTING / [pt] ENSAIOS EM PREVISÃO DE CARGA A CURTO PRAZOLACIR JORGE SOARES 26 January 2004 (has links)
[pt] A previsão de carga é considerada uma poderosa ferramenta
no controle e planejamento de sistemas elétricos. Um grande
número de pesquisadores têm sugerido, recentemente,
diversas técnicas para previsão de carga a curto prazo.
Este trabalho estuda a aplicabilidade de modelos lineares.
O trabalho pretende ser uma base para uma aplicação real de
previsão. Os modelos foram desenvolvidos e testados com
dados reais de carga de uma empresa de eletricidade situada
no sudeste de Brasil. Todos os modelos são propostos para
dados secionais, isto é, a série de carga de cada hora é
estudada separadamte como uma série única. Esta abordagem
evita a modelagem de padrões intra-dia (perfil da carga)
complexos apresentados pela série de carga, que variam
durante os dias da semana e nas estações. Três modelos são
estudados, primeiro um modelo um modelo SARIMA ajustado por
variáveis binárias DASARIMA, adotado como modelo de
referência, o segundo um modelo em duas etapas que
considera a existência de componentes determinísticos para
modelar a tendência, a sazonalidade e os efeitos do
calendário, denominado modelo autorregressivo sazonal em
dois níveis - TLSAR; e o último um modelo de de memória
longa generalizada ajustado por variáveis binárias - DAGLM.
Os resultados dos ensaios mostraram que os modelos horários
são bem apropriados para uma aplicação de previsão. Os
erros de previsão, das duas últimas abordagens, são menores
que os do modelo de referência, DASARIMA. O trabalho sugere
que este tipo de modelos horários devem ser testados mais
completamente a fim de fornecer uma opinião final sobre sua
aplicabilidade. / [en] Load forecasting has been considered a powerful tool in
managing and planning power systems. Several tecniques have
been recently suggested for short-term load forecasting by
a large number of researchers. This work studies the
applicability of linear models in the area is intended to
be a basis for a real forecasting application. The models
were developed and tested on the real load data of a
utility company located in the southeast of Brazil. All
models are proposed for sectional data, that is, each
hour's load is studied separately as a single series. This
approach avoids modeling the intricate intra-day pattern
(load profile) displayed by the load, wich varies
throughout days of the week and seasons. Three models are
studied, the first one a Dummy-Adjusted Seasonal Integrated
Autoregressive Moving Average model - DASARIMA, acting as a
benchmark, the second a two-step modeling that makes use of
deterministic components to model trend, seasonality and
calendar effects, called Two-Level Seasonal Autoregressive
model - TLSAR; and the last one a Dummy-Adjusted
Generalized Long Memory model - DAGLM. The test results
showed that the hourly models are well suitable for
forecasting application. The forecasting errors of the last
two approaches were smaller than those of the DASARIMA
benchmark. The work suggests that this kind of hourly
models should be implemented in a through on-line testing
in order to provide a final opinion on its applicability.
|
7 |
[en] APPLYING RISK CLASSIFICATION METHOD IN CAR INSURANCE MARKET / [pt] MÉTODO DE CLASSIFICAÇÃO DE RISCO APLICADO AO MERCADO DE SEGUROS DE AUTOMÓVEISWILSON LINS MORGADO 14 February 2005 (has links)
[pt] A estimação do risco em seguros de automóveis representa um
difícil
problema de regressão. As dificuldades vão desde a
utilização de um grande
número de variáveis discretas como explicativas, até a
distribuição particular dos
ruídos e uma quantidade expressiva de categorias com
valores nulos e valores
discrepantes.
Supondo que os problemas de estimação estejam relacionados
com a
classificação do risco adotada pelo mercado, este trabalho
propõe um método de
classificação alternativo. O método desenvolvido foi
baseado na técnica de análise
fatorial, e no algoritmo de agrupamento de dados denominado
fuzzy clustering
system.
Para avaliar a eficiência do método em solucionar os
problemas de
estimação, optou-se por utilizar o erro resultante da
aplicação de modelos lineares
generalizados. Ao final, o erro de estimação obtido diante
da classificação
proposta, foi comparado ao obtido diante da classificação
usual de mercado. / [en] The estimation of car insurance risk rate represents a
difficult regression
problem. One of the difficulties of this problem is the use
of a number of discrete
independent variables and a specific error distribution
that presents an expressive
number of null and outlier values.
Assuming that these estimation problems are related to the
risk
classification adopted by the insurance companies, this
work proposes an
alternative classification method. This method is based on
factorial analysis
techniques and on the algorithm known as Fuzzy Clustering
System.
To evaluate the efficiency of this method in solving the
problems identified,
the risk was estimated using generalized linear models. The
errors from each
model were obtained and compared between classifications.
|
8 |
[en] IDENTIFICATION MECHANISMS OF SPURIOUS DIVISIONS IN THRESHOLD AUTOREGRESSIVE MODELS / [pt] MECANISMOS DE IDENTIFICAÇÃO DE DIVISÕES ESPÚRIAS EM MODELOS DE REGRESSÃO COM LIMIARESANGELO SERGIO MILFONT PEREIRA 10 December 2002 (has links)
[pt] O objetivo desta dissertação é propor um mecanismo de
testes para a avaliação dos resultados obtidos em uma
modelagem TS-TARX.A principal motivação é encontrar uma
solução para um problema comum na modelagem TS-TARX : os
modelos espúrios que são gerados durante o processo de
divisão do espaço das variáveis independentes.O modelo é
uma heurística baseada em análise de árvore de regressão,
como discutido por Brieman -3, 1984-. O modelo proposto
para a análise de séries temporais é chamado TARX -
Threshold Autoregressive with eXternal variables-. A idéia
central é encontrar limiares que separem regimes que podem
ser explicados através de modelos lineares. Este processo é
um algoritmo que preserva o método de regressão por
mínimos quadrados recursivo -MQR-. Combinando a árvore de
decisão com a técnica de regressão -MQR-, o modelo se
tornou o TS-TARX -Tree Structured - Threshold
AutoRegression with external variables-.Será estendido aqui
o trabalho iniciado por Aranha em -1, 2001-. Onde a partir
de uma base de dados conhecida, um algoritmo eficiente gera
uma árvore de decisão por meio de regras, e as equações de
regressão estimadas para cada um dos regimes encontrados.
Este procedimento pode gerar alguns modelos espúrios ou por
construção,devido a divisão binária da árvore, ou pelo fato
de não existir neste momento uma metodologia de comparação
dos modelos resultantes.Será proposta uma metodologia
através de sucessivos testes de Chow -5, 1960- que
identificará modelos espúrios e reduzirá a quantidade de
regimes encontrados, e consequentemente de parâmetros a
estimar. A complexidade do modelo final gerado é reduzida a
partir da identificação de redundâncias, sem perder o poder
preditivo dos modelos TS-TARX .O trabalho conclui com
exemplos ilustrativos e algumas aplicações em bases de
dados sintéticas, e casos reais que auxiliarão o
entendimento. / [en] The goal of this dissertation is to propose a test
mechanism to evaluate the results obtained from the TS-TARX
modeling procedure.The main motivation is to find a
solution to a usual problem related to TS-TARX modeling:
spurious models are generated in the process of dividing
the space state of the independent variables.The model is a
heuristics based on regression tree analysis, as discussed
by Brieman -3, 1984-. The model used to estimate the
parameters of the time series is a TARX -Threshold
Autoregressive with eXternal variables-.The main idea is to
find thresholds that split the independent variable space
into regimes which can be described by a local linear
model. In this process, the recursive least square
regression model is preserved. From the combination of
regression tree analysis and recursive least square
regression techniques, the model becomes TS-TARX -Tree
Structured - Threshold Autoregression with eXternal
variables-.The works initiated by Aranha in -1, 2001- will
be extended. In his works, from a given data base, one
efficient algorithm generates a decision tree based on
splitting rules, and the corresponding regression equations
for each one of the regimes found.Spurious models may be
generated either from its building procedure, or from the
fact that a procedure to compare the resulting models had
not been proposed.To fill this gap, a methodology will be
proposed. In accordance with the statistical
tests proposed by Chow in -5, 196-, a series of consecutive
tests will be performed.The Chow tests will provide the
tools to identify spurious models and to reduce the
number of regimes found. The complexity of the final model,
and the number of parameters to estimate are therefore
reduced by the identification and elimination of
redundancies, without bringing risks to the TS-TARX model
predictive power.This work is concluded with illustrative
examples and some applications to real data that will help
the readers understanding.
|
9 |
[pt] EXPERIMENTOS COM MISTURA: UMA APLICAÇÃO COM RESPOSTAS NÃO-NORMAIS / [en] MIXTURE EXPERIMENTS: AN APPLICATION WITH NONNORMAL RESPONSESLUIZ HENRIQUE ABREU DAL BELLO 03 January 2006 (has links)
[pt] Esta dissertação, além de apresentar uma abordagem de um
caso prático
real, fez reunir as técnicas estatísticas necessárias ao
trato de experimentos
envolvendo misturas. Foi visto que as metodologias
adotadas em Projeto de
Experimentos devem ser adaptadas para possibilitar o trato
de problemas com
misturas, já que há a necessidade de considerar a
restrição básica desse tipo de
experimento, o qual amarra a soma das proporções dos
componentes, que deve ser
sempre igual a 1, ou seja, 100%. O experimento do misto de
retardo, objeto
principal e motivador dessa dissertação, é um experimento
com mistura, em que
as proporções de todos os três componentes possuem
restrições superiores e
inferiores simultaneamente. Com essas restrições, o espaço
fatorial restrito fica
bem distorcido em relação ao simplex, havendo, portanto, a
necessidade de
geração de um design D-ótimo. Como houve a indicação de
que a variância da
resposta não é constante, no caso do misto de retardo,
recorreu-se aos Modelos
Lineares Generalizados, especificamente ao método da Quase-
Verossimilhança.
De posse do modelo adequado, pôde-se então determinar a
proporção dos
componentes do misto de retardo, tendo em vista o
atendimento da especificação
de projeto. / [en] This dissertation presents a real pactical case, and
besides, it puts together
the statistical techniques for the treatment of Mixture
Experiments. It was
presented, that the Design of Experiments techniques must
be adapted in order to
make possible the treatment of problems with mixtures,
because the basic
constraint in this type of experiment must be taken into
account, that is, the sum
of the proportions of all mixture components must be equal
to 1 or 100%. The
delay compound experiment, the main and motivating object
in this dissertation,
is a mixture experiment with simultaneous constraints in
the proportions of all its
three components. With these constraints, it is possible
to observe a distortion in
the restricted factorial design space in comparison to the
simplex one. Therefore,
it was necessary to generate a D-optimal design. When
there was an indication
that the response variance is not constant, in the case of
the delay compound, the
Generalized Linear Models, specifically the Quasi-
Likelihood method was used to
fit an adequate model. With the adequate model, it was
possible to find the
proportion of each component of the delay compound in
order to attend the design
specification.
|
Page generated in 0.04 seconds