Return to search

Statistical approaches to enhance decision support in time series and causality problems

Prädiktive Modelle sind hilfreiche Mittel zur quantitativen Entscheidungsunterstützung von modernen Unternehmen. Jedoch gibt es in vielen Fällen statistische Probleme in den genutzten Daten, die eine wirkungsvolle Anwendung prädiktiver Modelle zur Entscheidungsunterstützung verhindern. In dieser Doktorarbeit werden solche häufig auftretenden statistischen Probleme analysiert und statistische Methoden werden vorgestellt, mit denen man diese Probleme überwinden und damit prädiktive Modellierung und Entscheidungsunterstützung wirkungsvoll machen kann. Der erste Teil der Arbeit behandelt das Problem von "Concept Drift" in Google Trends Zeitreihen. Die Doktorarbeit bietet eine empirische Analyse des Problems und einen Ansatz um die Daten zu bereinigen. Für den speziellen Anwendungsfall der Tourismusnachfragevorhersage in Deutschland demonstriert die Arbeit empirisch den Nutzen der Bereinigungsmethode. Der zweite Teil der Arbeit setzt sich mit Experimenten und Modellen zur Schätzung von heterogenen Behandlungseffekten von Individuen auseinander. In solchen Anwendungen stellt Rauschen (Noise) in den Daten eine statistische Herausforderung dar, die zu einer hohen benötigten Fallzahl im Experiment und unerwarteten negativen Folgen bei der anschließenden selektiven Vergabe der Behandlung führen kann. Um diese Probleme zu überwinden entwickelt die Arbeit Methoden um Experimente mit einer kleineren Fallzahl durchzuführen, ohne Einbußen in der Qualität der Ergebnisse zu erleiden. Darüber hinaus analysiert die Arbeit die potenziell negativen Folgen von Noise auf die selektive Behandlungsvergabe und schlägt Ideen vor, wie man diese verhindern kann. / Predictive models are useful methods for quantitative decision support in contemporary business. However, often there are statistical problems in the data sets, hindering effective predictive modeling and decision support. This thesis analyzes such frequently occurring statistical problems and provides statistical approaches to overcome them and thereby enable efficient predictive modeling and decision support. The first part of the thesis focuses on concept drift in Google Trends time series data. The thesis provides an empirical analysis of the problem and an approach to sanitize the data. For the specific use case of tourism demand forecasting in Germany, the thesis demonstrates the usefulness of the statistical approach. The second part of the thesis focuses on experiments and models to estimate heterogeneous treatment effects of individuals. In such applications, noise in the data poses a statistical challenge, leading to high requirements in the sample size for randomized experiments and potentially leading to unexpected negative results in the treatment allocation process. To overcome this problem, the thesis proposes methods to conduct experiments with a limited number of individuals, without impairing the decision support. Moreover, the thesis analyzes the potential adverse effects of noise on the treatment allocation process and provides ideas on how to prevent them.

Identiferoai:union.ndltd.org:HUMBOLT/oai:edoc.hu-berlin.de:18452/30624
Date11 November 2024
CreatorsBokelmann, Björn
ContributorsLessmann, Stefan, Greven, Sonja
PublisherHumboldt-Universität zu Berlin
Source SetsHumboldt University of Berlin
LanguageEnglish
Detected LanguageGerman
TypedoctoralThesis, doc-type:doctoralThesis
Formatapplication/pdf
Rightshttp://rightsstatements.org/vocab/InC/1.0/
Relationhttps://doi.org/10.1016/j.tourman.2019.04.015, https://doi.org/10.1016/j.ejor.2023.09.018

Page generated in 0.0027 seconds