1 |
Statistinių įrankių, pagrįstų pokyčių statistika, paketo kūrimas / Creation of statistical tools pack based on increment ratio statisticMockus, Robertas 29 September 2008 (has links)
Šiame magistro darbe nagrinėjama IR statistika bei FARIMA ir AR duomenų generavimo algoritmai. Darbe pateikta programinė IR statistikos skaičiavimo bei FARIMA ir AR duomenų generavimo algoritmų realizacija. Visi algoritmai visapusiškai ištestuoti bei jiems sukurta vartotojo sąsaja. IR statistika dar nėra pilnai įrodyta, todėl šis darbas galės būti naudojamas tolimesniems IR statistikos tyrimams. / IR statistics, FARIMA and AR data production algorithms are analyzed in this master’s degree study. I present IR statistics calculating, FARIMA and AR data production algorithms software realization. All algorithms are universally tested and has user interface. IR statistics is not fully proven, that’s why this study could be used in further IR statistics researches.
|
2 |
Detection of long-range dependence : applications in climatology and hydrologyRust, Henning January 2007 (has links)
It is desirable to reduce the potential threats that result from the
variability of nature, such as droughts or heat waves that lead to
food shortage, or the other extreme, floods that lead to severe
damage. To prevent such catastrophic events, it is necessary to
understand, and to be capable of characterising, nature's variability.
Typically one aims to describe the underlying dynamics of geophysical
records with differential equations. There are, however, situations
where this does not support the objectives, or is not feasible, e.g.,
when little is known about the system, or it is too complex for the
model parameters to be identified. In such situations it is beneficial
to regard certain influences as random, and describe them with
stochastic processes. In this thesis I focus on such a description
with linear stochastic processes of the FARIMA type and concentrate on
the detection of long-range dependence. Long-range dependent processes
show an algebraic (i.e. slow) decay of the autocorrelation
function. Detection of the latter is important with respect to,
e.g. trend tests and uncertainty analysis.
Aiming to provide a reliable and powerful strategy for the detection
of long-range dependence, I suggest a way of addressing the problem
which is somewhat different from standard approaches. Commonly used
methods are based either on investigating the asymptotic behaviour
(e.g., log-periodogram regression), or on finding a suitable
potentially long-range dependent model (e.g., FARIMA[p,d,q]) and test
the fractional difference parameter d for compatibility with
zero. Here, I suggest to rephrase the problem as a model selection
task, i.e.comparing the most suitable long-range dependent and the
most suitable short-range dependent model. Approaching the task this
way requires a) a suitable class of long-range and short-range
dependent models along with suitable means for parameter estimation
and b) a reliable model selection strategy, capable of discriminating
also non-nested models. With the flexible FARIMA model class together
with the Whittle estimator the first requirement is
fulfilled. Standard model selection strategies, e.g., the
likelihood-ratio test, is for a comparison of non-nested models
frequently not powerful enough. Thus, I suggest to extend this
strategy with a simulation based model selection approach suitable for
such a direct comparison. The approach follows the procedure of
a statistical test, with the likelihood-ratio as the test
statistic. Its distribution is obtained via simulations using the two
models under consideration. For two simple models and different
parameter values, I investigate the reliability of p-value and power
estimates obtained from the simulated distributions. The result turned
out to be dependent on the model parameters. However, in many cases
the estimates allow an adequate model selection to be established.
An important feature of this approach is that it immediately reveals
the ability or inability to discriminate between the two models under
consideration.
Two applications, a trend detection problem in temperature records and
an uncertainty analysis for flood return level estimation, accentuate the
importance of having reliable methods at hand for the detection of
long-range dependence. In the case of trend detection, falsely
concluding long-range dependence implies an underestimation of a trend
and possibly leads to a delay of measures needed to take in order to
counteract the trend. Ignoring long-range dependence, although
present, leads to an underestimation of confidence intervals and thus
to an unjustified belief in safety, as it is the case for the
return level uncertainty analysis. A reliable detection of long-range
dependence is thus highly relevant in practical applications.
Examples related to extreme value analysis are not limited to
hydrological applications. The increased uncertainty of return level
estimates is a potentially problem for all records from autocorrelated
processes, an interesting examples in this respect is the assessment
of the maximum strength of wind gusts, which is important for
designing wind turbines. The detection of long-range dependence is
also a relevant problem in the exploration of financial market
volatility. With rephrasing the detection problem as a model
selection task and suggesting refined methods for model comparison,
this thesis contributes to the discussion on and development of
methods for the detection of long-range dependence. / Die potentiellen Gefahren und Auswirkungen der natürlicher
Klimavariabilitäten zu reduzieren ist ein wünschenswertes Ziel. Solche
Gefahren sind etwa Dürren und Hitzewellen, die zu Wasserknappheit
führen oder, das andere Extrem, Überflutungen, die einen erheblichen
Schaden an der Infrastruktur nach sich ziehen können. Um solche
katastrophalen Ereignisse zu vermeiden, ist es notwendig die Dynamik
der Natur zu verstehen und beschreiben zu können.
Typischerweise wird versucht die Dynamik geophysikalischer Datenreihen
mit Differentialgleichungssystemen zu
beschreiben. Es gibt allerdings Situationen in denen dieses Vorgehen
nicht zielführend oder technisch nicht möglich ist. Dieses sind
Situationen in denen wenig Wissen über das System vorliegt oder es zu
komplex ist um die Modellparameter zu identifizieren.
Hier ist es sinnvoll einige Einflüsse als zufällig zu
betrachten und mit Hilfe stochastischer Prozesse zu modellieren.
In dieser Arbeit wird eine solche Beschreibung mit linearen
stochastischen Prozessen der FARIMA-Klasse angestrebt. Besonderer
Fokus liegt auf der Detektion von langreichweitigen
Korrelationen. Langreichweitig korrelierte Prozesse sind solche mit
einer algebraisch, d.h. langsam, abfallenden
Autokorrelationsfunktion. Eine verläßliche Erkennung dieser Prozesse
ist relevant für Trenddetektion und Unsicherheitsanalysen.
Um eine verläßliche Strategie für die Detektion
langreichweitig korrelierter Prozesse zur Verfügung zu stellen, wird
in der Arbeit ein anderer als der Standardweg vorgeschlagen.
Gewöhnlich werden Methoden eingesetzt, die das
asymptotische Verhalten untersuchen, z.B. Regression im Periodogramm.
Oder aber es wird versucht ein passendes potentiell langreichweitig
korreliertes Modell zu finden, z.B. aus der FARIMA Klasse, und den
geschätzten fraktionalen Differenzierungsparameter d auf Verträglichkeit
mit dem trivialen Wert Null zu testen. In der Arbeit wird
vorgeschlagen das Problem der Detektion langreichweitiger
Korrelationen als Modellselektionsproblem umzuformulieren, d.h. das
beste kurzreichweitig und das beste langreichweitig
korrelierte Modell zu vergleichen. Diese Herangehensweise erfordert a)
eine geeignete Klasse von lang- und kurzreichweitig korrelierten
Prozessen und b) eine verläßliche Modellselektionsstrategie, auch für
nichtgenestete Modelle. Mit der flexiblen FARIMA-Klasse und dem
Whittleschen Ansatz zur Parameterschätzung ist die erste
Voraussetzung erfüllt. Hingegen sind standard Ansätze zur
Modellselektion, wie z.B. der Likelihood-Ratio-Test, für
nichtgenestete Modelle oft nicht trennscharf genug. Es wird daher
vorgeschlagen diese Strategie mit einem simulationsbasierten Ansatz zu
ergänzen, der insbesondere für die direkte Diskriminierung
nichtgenesteter Modelle geeignet ist. Der Ansatz folgt
einem statistischen Test mit dem Quotienten der Likelihood
als Teststatistik. Ihre Verteilung wird über
Simulationen mit den beiden zu unterscheidenden Modellen
ermittelt. Für zwei einfache Modelle und verschiedene Parameterwerte
wird die Verläßlichkeit der Schätzungen für p-Wert und Power
untersucht. Das Ergebnis hängt von den Modellparametern ab. Es konnte
jedoch in vielen Fällen eine adäquate Modellselektion etabliert
werden. Ein wichtige Eigenschaft dieser Strategie ist, dass
unmittelbar offengelegt wird, wie gut sich die betrachteten Modelle
unterscheiden lassen.
Zwei Anwendungen, die Trenddetektion in Temperaturzeitreihen und die
Unsicherheitsanalyse für Bemessungshochwasser, betonen den Bedarf an
verläßlichen Methoden für die Detektion langreichweitiger
Korrelationen. Im Falle der Trenddetektion führt ein fälschlicherweise
gezogener Schluß auf langreichweitige Korrelationen zu einer
Unterschätzung eines Trends, was wiederum zu einer möglicherweise
verzögerten Einleitung von Maßnahmen führt, die diesem entgegenwirken
sollen. Im Fall von Abflußzeitreihen führt die Nichtbeachtung von
vorliegenden langreichweitigen Korrelationen zu einer Unterschätzung
der Unsicherheit von Bemessungsgrößen. Eine verläßliche Detektion von
langreichweitig Korrelierten Prozesse ist somit von hoher Bedeutung in
der praktischen Zeitreihenanalyse. Beispiele mit Bezug zu extremem
Ereignissen beschränken sich nicht nur auf die Hochwasseranalyse. Eine
erhöhte Unsicherheit in der Bestimmung von extremen Ereignissen ist
ein potentielles Problem von allen autokorrelierten Prozessen. Ein
weiteres interessantes Beispiel ist hier die Abschätzung von maximalen
Windstärken in Böen, welche bei der Konstruktion von Windrädern eine
Rolle spielt. Mit der Umformulierung des Detektionsproblems als
Modellselektionsfrage und mit der Bereitstellung geeigneter
Modellselektionsstrategie trägt diese Arbeit zur Diskussion und
Entwicklung von Methoden im Bereich der Detektion von
langreichweitigen Korrelationen bei.
|
3 |
A Study on the Estimation of the Parameter and Goodness of Fit Test for the Self-similar ProcessChiang, Pei-Jung 05 July 2006 (has links)
Recently there have been reports that certain physiological data seem to have the properties of long-range correlation and self-similarity. These two properties can be characterized by a long-range dependent parameter d, as well as a self-similar parameter H. In Peng et al (1995), the alteration of long-range correlations with life-threatening pathologies are studied by analyzing the heart rate data of different groups of subjects. The self-similarity properties of two well-known processes, namely the Fractional Brownian Motion (FBM) and the Fractional ARIMA (FARIMA), are of interest to see if it is suitable to be used to model the heart rate data in order to examine the health conditions of some patients. The Embedded Branching Process (EBP) method for estimating parameter $H$ and a goodness of fit test for examining the self-similarity of a process based on the EBP method are proposed in Jones and Shen (2004). In this work, the performance of the goodness of fit test are examined using simulated data from the FBM and FARIMA processes. A modification of the distribution of the test statistics under null hypothesis is proposed and has been modified to be more appropriate. Some simulation comparisons of different estimation methods of the parameter $H$ for some FARIMA processes are also presented and applied to heart rate data obtained from Kaohsiung Veterans General Hospital.
|
Page generated in 0.0143 seconds