Spelling suggestions: "subject:"nonnested model selection"" "subject:"noninfested model selection""
1 |
Detection of long-range dependence : applications in climatology and hydrologyRust, Henning January 2007 (has links)
It is desirable to reduce the potential threats that result from the
variability of nature, such as droughts or heat waves that lead to
food shortage, or the other extreme, floods that lead to severe
damage. To prevent such catastrophic events, it is necessary to
understand, and to be capable of characterising, nature's variability.
Typically one aims to describe the underlying dynamics of geophysical
records with differential equations. There are, however, situations
where this does not support the objectives, or is not feasible, e.g.,
when little is known about the system, or it is too complex for the
model parameters to be identified. In such situations it is beneficial
to regard certain influences as random, and describe them with
stochastic processes. In this thesis I focus on such a description
with linear stochastic processes of the FARIMA type and concentrate on
the detection of long-range dependence. Long-range dependent processes
show an algebraic (i.e. slow) decay of the autocorrelation
function. Detection of the latter is important with respect to,
e.g. trend tests and uncertainty analysis.
Aiming to provide a reliable and powerful strategy for the detection
of long-range dependence, I suggest a way of addressing the problem
which is somewhat different from standard approaches. Commonly used
methods are based either on investigating the asymptotic behaviour
(e.g., log-periodogram regression), or on finding a suitable
potentially long-range dependent model (e.g., FARIMA[p,d,q]) and test
the fractional difference parameter d for compatibility with
zero. Here, I suggest to rephrase the problem as a model selection
task, i.e.comparing the most suitable long-range dependent and the
most suitable short-range dependent model. Approaching the task this
way requires a) a suitable class of long-range and short-range
dependent models along with suitable means for parameter estimation
and b) a reliable model selection strategy, capable of discriminating
also non-nested models. With the flexible FARIMA model class together
with the Whittle estimator the first requirement is
fulfilled. Standard model selection strategies, e.g., the
likelihood-ratio test, is for a comparison of non-nested models
frequently not powerful enough. Thus, I suggest to extend this
strategy with a simulation based model selection approach suitable for
such a direct comparison. The approach follows the procedure of
a statistical test, with the likelihood-ratio as the test
statistic. Its distribution is obtained via simulations using the two
models under consideration. For two simple models and different
parameter values, I investigate the reliability of p-value and power
estimates obtained from the simulated distributions. The result turned
out to be dependent on the model parameters. However, in many cases
the estimates allow an adequate model selection to be established.
An important feature of this approach is that it immediately reveals
the ability or inability to discriminate between the two models under
consideration.
Two applications, a trend detection problem in temperature records and
an uncertainty analysis for flood return level estimation, accentuate the
importance of having reliable methods at hand for the detection of
long-range dependence. In the case of trend detection, falsely
concluding long-range dependence implies an underestimation of a trend
and possibly leads to a delay of measures needed to take in order to
counteract the trend. Ignoring long-range dependence, although
present, leads to an underestimation of confidence intervals and thus
to an unjustified belief in safety, as it is the case for the
return level uncertainty analysis. A reliable detection of long-range
dependence is thus highly relevant in practical applications.
Examples related to extreme value analysis are not limited to
hydrological applications. The increased uncertainty of return level
estimates is a potentially problem for all records from autocorrelated
processes, an interesting examples in this respect is the assessment
of the maximum strength of wind gusts, which is important for
designing wind turbines. The detection of long-range dependence is
also a relevant problem in the exploration of financial market
volatility. With rephrasing the detection problem as a model
selection task and suggesting refined methods for model comparison,
this thesis contributes to the discussion on and development of
methods for the detection of long-range dependence. / Die potentiellen Gefahren und Auswirkungen der natürlicher
Klimavariabilitäten zu reduzieren ist ein wünschenswertes Ziel. Solche
Gefahren sind etwa Dürren und Hitzewellen, die zu Wasserknappheit
führen oder, das andere Extrem, Überflutungen, die einen erheblichen
Schaden an der Infrastruktur nach sich ziehen können. Um solche
katastrophalen Ereignisse zu vermeiden, ist es notwendig die Dynamik
der Natur zu verstehen und beschreiben zu können.
Typischerweise wird versucht die Dynamik geophysikalischer Datenreihen
mit Differentialgleichungssystemen zu
beschreiben. Es gibt allerdings Situationen in denen dieses Vorgehen
nicht zielführend oder technisch nicht möglich ist. Dieses sind
Situationen in denen wenig Wissen über das System vorliegt oder es zu
komplex ist um die Modellparameter zu identifizieren.
Hier ist es sinnvoll einige Einflüsse als zufällig zu
betrachten und mit Hilfe stochastischer Prozesse zu modellieren.
In dieser Arbeit wird eine solche Beschreibung mit linearen
stochastischen Prozessen der FARIMA-Klasse angestrebt. Besonderer
Fokus liegt auf der Detektion von langreichweitigen
Korrelationen. Langreichweitig korrelierte Prozesse sind solche mit
einer algebraisch, d.h. langsam, abfallenden
Autokorrelationsfunktion. Eine verläßliche Erkennung dieser Prozesse
ist relevant für Trenddetektion und Unsicherheitsanalysen.
Um eine verläßliche Strategie für die Detektion
langreichweitig korrelierter Prozesse zur Verfügung zu stellen, wird
in der Arbeit ein anderer als der Standardweg vorgeschlagen.
Gewöhnlich werden Methoden eingesetzt, die das
asymptotische Verhalten untersuchen, z.B. Regression im Periodogramm.
Oder aber es wird versucht ein passendes potentiell langreichweitig
korreliertes Modell zu finden, z.B. aus der FARIMA Klasse, und den
geschätzten fraktionalen Differenzierungsparameter d auf Verträglichkeit
mit dem trivialen Wert Null zu testen. In der Arbeit wird
vorgeschlagen das Problem der Detektion langreichweitiger
Korrelationen als Modellselektionsproblem umzuformulieren, d.h. das
beste kurzreichweitig und das beste langreichweitig
korrelierte Modell zu vergleichen. Diese Herangehensweise erfordert a)
eine geeignete Klasse von lang- und kurzreichweitig korrelierten
Prozessen und b) eine verläßliche Modellselektionsstrategie, auch für
nichtgenestete Modelle. Mit der flexiblen FARIMA-Klasse und dem
Whittleschen Ansatz zur Parameterschätzung ist die erste
Voraussetzung erfüllt. Hingegen sind standard Ansätze zur
Modellselektion, wie z.B. der Likelihood-Ratio-Test, für
nichtgenestete Modelle oft nicht trennscharf genug. Es wird daher
vorgeschlagen diese Strategie mit einem simulationsbasierten Ansatz zu
ergänzen, der insbesondere für die direkte Diskriminierung
nichtgenesteter Modelle geeignet ist. Der Ansatz folgt
einem statistischen Test mit dem Quotienten der Likelihood
als Teststatistik. Ihre Verteilung wird über
Simulationen mit den beiden zu unterscheidenden Modellen
ermittelt. Für zwei einfache Modelle und verschiedene Parameterwerte
wird die Verläßlichkeit der Schätzungen für p-Wert und Power
untersucht. Das Ergebnis hängt von den Modellparametern ab. Es konnte
jedoch in vielen Fällen eine adäquate Modellselektion etabliert
werden. Ein wichtige Eigenschaft dieser Strategie ist, dass
unmittelbar offengelegt wird, wie gut sich die betrachteten Modelle
unterscheiden lassen.
Zwei Anwendungen, die Trenddetektion in Temperaturzeitreihen und die
Unsicherheitsanalyse für Bemessungshochwasser, betonen den Bedarf an
verläßlichen Methoden für die Detektion langreichweitiger
Korrelationen. Im Falle der Trenddetektion führt ein fälschlicherweise
gezogener Schluß auf langreichweitige Korrelationen zu einer
Unterschätzung eines Trends, was wiederum zu einer möglicherweise
verzögerten Einleitung von Maßnahmen führt, die diesem entgegenwirken
sollen. Im Fall von Abflußzeitreihen führt die Nichtbeachtung von
vorliegenden langreichweitigen Korrelationen zu einer Unterschätzung
der Unsicherheit von Bemessungsgrößen. Eine verläßliche Detektion von
langreichweitig Korrelierten Prozesse ist somit von hoher Bedeutung in
der praktischen Zeitreihenanalyse. Beispiele mit Bezug zu extremem
Ereignissen beschränken sich nicht nur auf die Hochwasseranalyse. Eine
erhöhte Unsicherheit in der Bestimmung von extremen Ereignissen ist
ein potentielles Problem von allen autokorrelierten Prozessen. Ein
weiteres interessantes Beispiel ist hier die Abschätzung von maximalen
Windstärken in Böen, welche bei der Konstruktion von Windrädern eine
Rolle spielt. Mit der Umformulierung des Detektionsproblems als
Modellselektionsfrage und mit der Bereitstellung geeigneter
Modellselektionsstrategie trägt diese Arbeit zur Diskussion und
Entwicklung von Methoden im Bereich der Detektion von
langreichweitigen Korrelationen bei.
|
Page generated in 0.1285 seconds