1 |
[en] A SUGGESTION FOR THE STRUCTURE IDENTIFICATION OF LINEAR AND NON LINEAR TIME SERIES BY THE USE OF NON PARAMETRIC REGRESSION / [pt] UMA SUGESTÃO PARA IDENTIFICAÇÃO DA ESTRUTURA DE SÉRIES TEMPORAIS, LINEARES E NÃO LINEARES, UTILIZANDO REGRESSÃO NÃO PARAMÉTRICAROSANE MARIA KIRCHNER 10 February 2005 (has links)
[pt] Esta pesquisa fundamenta-se na elaboração de uma
metodologia para identificação da estrutura de séries
temporais lineares e não lineares, baseada na estimação não
paramétrica e semi-paramétrica de curvas em modelos do tipo
Yt=E(Yt|Xt) +e, onde Xt=(Yt-1, Yt-2,...,Yt-d). Um modelo de
regressão linear paramétrico tradicional assume que a forma
da função E(Yt|Xt) é linear. O processo de estimação é
global, isto é, caso a suposição seja, por exemplo, a de
uma função linear, então a mesma reta é usada ao longo do
domínio da covariável. Entretanto, tal abordagem pode ser
inadequada em muitos casos. Já a abordagem não paramétrica,
permite maior flexibilidade na possível forma da função
desconhecida, sendo que ela pode ser estimada através de
funções núcleo local. Desse modo, somente pontos na
vizinhança local do ponto xt , onde se deseja estimar
E(Yt|Xt=xt), influenciarão nessa estimativa. Isto é,
através de estimadores núcleo, a função desconhecida será
estimada através de uma regressão local, em que as
observações mais próximas do ponto onde se deseja estimar a
curva receberão um peso maior e as mais afastadas, um peso
menor. Para estimação da função desconhecida, o parâmetro
de suavização h (janela) foi escolhido automaticamente com
base na amostra via minimização de resíduos, usando o
critério de validação cruzada. Além desse critério,
utilizamos intencionalmente valores fixos para o parâmetro
h, que foram 0.1, 0.5, 0.8 e 1. Após a estimação da função
desconhecida, calculamos o coeficiente de determinação para
verificar a dependência de cada defasagem. Na metodologia
proposta, verificamos que a função de dependência da
defasagem (FDD) e a função de dependência parcial da
defasagem (FDPD), fornecem boas aproximações no caso linear
da função de autocorrelação (FAC) e da função de
autocorrelação parcial (FACP), respectivamente, as quais
são utilizadas na análise clássica de séries lineares. A
representação gráfica também é muito semelhante àquelas
usadas para FAC e FACP. Para a função de dependência
parcial da defasagem (FDPD), necessitamos estimar funções
multivariadas. Nesse caso, utilizamos um modelo aditivo,
cuja estimação é feita através do método backfitting
(Hastie e Tibshirani-1990). Para a construção dos
intervalos de confiança, foi utilizada a técnica Bootstrap.
Conduzimos o estudo de forma a avaliar e comparar a
metodologia proposta com metodologias já existentes. As
séries utilizadas para esta análise foram geradas de acordo
com modelos lineares e não lineares. Para cada um dos
modelos foi gerada uma série de 100 ou mais observações.
Além dessas, também foi exemplificada com o estudo da
estrutura de duas séries de demanda de energia elétrica,
uma do DEMEI- Departamento Municipal de Energia de Ijuí,
Rio Grande do Sul e outra de uma concessionária da região
Centro-Oeste. Utilizamos como terceiro exemplo uma série
econômica de ações da Petrobrás. / [en] This paper suggests an approach for the identification of
the structure of inear and non-linear time series through
non-parametric estimation of the unknown curves in models
of the type Y)=E(Yt|Xt =xt) +e , where Xt=(Yt-1,Yt-2,...,Yt-
d). A traditional nonlinear parametric model assumes that
the form of the function E(Yt,Xt) is known. The estimation
process is global, that is, under the assumption of a
linear function for instance, then the same line is used
along the domain of the covariate. Such an approach may be
inadequate in many cases, though. On the other hand,
nonparametric regression estimation, allows more
flexibility in the possible form of the unknown function,
since the function itself can be estimated through a local
kernel regression. By doing so, only points in the local
neighborhood of the point Xt, where E(Yt|Xt =xt) is to be
estimated, will influence this estimate. In other words,
with kernel estimators, the unknown function will be
estimated by local regression, where the nearest
observations to the point where the curve is to be
estimated will receive more weight and the farthest ones, a
less weight. For the estimation of the unknown function, the
smoothing parameter h (window) was chosen automatically
based on the sample through minimization of residuals,
using the criterion of cross-validation. After the
estimation of the unknown function, the determination
coefficient is calculated in order to verify the dependence
of each lag. Under the proposed methodology, it was
verified that the Lag Dependence Function (LDF) and the
Partial Lag Dependence Function (PLDF) provide good
approximations in the linear case to the function of
autocorrelation (ACF) and partial function of
autocorrelation (PACF) respectively, used in classical
analysis of linear time series. The graphic representation
is also very similar to those used in ACF and PACF.
For the Partial Lag Dependence Function (PLDF) it becomes
necessary to estimate multivariable functions. In this
case, an additive model was used, whose estimate is
computed through the backfitting method, according to
Hastie and Tibshirani (1990). For the construction of
confidence intervals, the bootstrap technique was used.
The research was conducted to evaluate and compare the
proposed methodology to traditional ones. The simulated
time series were generated according to linear and nonlinear
models. A series of one hundred observations was generated
for each model. The approach was illustrated with the study
of the structure of two time series of electricity demand
of DEMEI- the city department of energy of Ijui, Rio Grande
do Sul, Brazil and another of a concessionary of the Centro-
Oeste region. We used as third example an economical series
of Petrobras.
|
Page generated in 0.0373 seconds