• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 3
  • Tagged with
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Flexible Regression for Different Types of Multivariate Functional Data

Volkmann, Alexander 14 October 2024 (has links)
In dieser Dissertation werden neue Regressionsansätze für multivariate longitudinale oder funktionale Daten entwickelt, die eine flexible Modellierung von interessierenden Kovariableneffekten ermöglichen. Die Abhängigkeit innerhalb und zwischen den verschiedenen Zielgrößen wird über latente multivariate Gauss-Prozesse modelliert. Die Regressionsansätze folgen einem zweistufigen Verfahren, in dem in einem vorgelagerten Schritt multivariate funktionale Hauptkomponentenanalysen eingesetzt werden, um sparsame empirische Basen für die Gauss-Prozesse zu konstruieren. Drei verschiedene Regressionsmodelle werden für verschiedene Arten multivariater longitudinaler oder funktionaler Daten entwickelt. Das erste Projekt führt das zweistufige Verfahren für multivariate normalverteilte funktionale Daten ein, die eine gekreutzte oder genestete Datenstruktur aufweisen können. Das Regressionsmodell ist im frequentistischen Rahmenmodell der funktionalen additiven gemischten Modelle eingebettet und wird durch Anwendungen auf Bewegungsdaten und Sprachdaten illustriert. Das zweite Projekt entwickelt ein bayesianisches Regressionsgerüst für multilevel multivariate funktionale Daten, die verschiedenen punktweisen Verteilungen folgen. Das erlaubt es, verschiedene Datentypen, wie etwa binäre, Zähl- oder kontinuierliche funktionale Daten gleichzeitig zu modellieren, was durch eine Anwendung auf Berliner Verkehrsdaten veranschaulicht wird. Das dritte Projekt vereint multivariate longitudinale normalverteilte Daten mit einer Ereigniszeit-Zielgröße in einem gemeinsamen bayesianischen Modellierungsansatz. Solche Modelle werden oft im medizinischen Bereich verwendet, beispielsweise wenn der Fokus der Analyse auf der Schätzung der Assoziation zwischen longitudinalen Messungen von Biomarkern und dem Überleben von Patienten mit chronischen Lebererkrankung liegt. / In this thesis, novel regression approaches for multivariate longitudinal or functional data are developed, which allow to flexibly model the covariate effects of interest. The dependency within and between the different outcomes is modeled using latent multivariate Gaussian processes. The regression approaches adopt a two-step procedure where, in a preliminary step, multivariate functional principal component analyses are employed to generate parsimonious empirical bases for the Gaussian processes. Three different regression models are developed for different types of longitudinal or multivariate functional data. The first project establishes the two-step procedure for multivariate Gaussian functional data which can exhibit a crossed or nested multilevel structure. The regression model is embedded in the frequentist functional additive mixed model framework and is demonstrated by applications in movement data and speech production data. The second project develops a Bayesian regression framework for multilevel multivariate functional data that follow different pointwise distributions. This allows to simultaneously model data of different types such as binary, count, or continuous functional data, which is illustrated by an application to Berlin traffic data. The third project combines multivariate longitudinal Gaussian data with a time-to-event outcome in a Bayesian joint modelling approach. Such models are often used in medical contexts where the main point of interest lies in estimating the association between longitudinal measurements of biomarkers and e.g. the survival of patients as in the presented application to a chronic liver disease. All projects are accompanied by simulation studies to assess the estimation accuracy and the models' limitations.
2

Statistical approaches to enhance decision support in time series and causality problems

Bokelmann, Björn 11 November 2024 (has links)
Prädiktive Modelle sind hilfreiche Mittel zur quantitativen Entscheidungsunterstützung von modernen Unternehmen. Jedoch gibt es in vielen Fällen statistische Probleme in den genutzten Daten, die eine wirkungsvolle Anwendung prädiktiver Modelle zur Entscheidungsunterstützung verhindern. In dieser Doktorarbeit werden solche häufig auftretenden statistischen Probleme analysiert und statistische Methoden werden vorgestellt, mit denen man diese Probleme überwinden und damit prädiktive Modellierung und Entscheidungsunterstützung wirkungsvoll machen kann. Der erste Teil der Arbeit behandelt das Problem von "Concept Drift" in Google Trends Zeitreihen. Die Doktorarbeit bietet eine empirische Analyse des Problems und einen Ansatz um die Daten zu bereinigen. Für den speziellen Anwendungsfall der Tourismusnachfragevorhersage in Deutschland demonstriert die Arbeit empirisch den Nutzen der Bereinigungsmethode. Der zweite Teil der Arbeit setzt sich mit Experimenten und Modellen zur Schätzung von heterogenen Behandlungseffekten von Individuen auseinander. In solchen Anwendungen stellt Rauschen (Noise) in den Daten eine statistische Herausforderung dar, die zu einer hohen benötigten Fallzahl im Experiment und unerwarteten negativen Folgen bei der anschließenden selektiven Vergabe der Behandlung führen kann. Um diese Probleme zu überwinden entwickelt die Arbeit Methoden um Experimente mit einer kleineren Fallzahl durchzuführen, ohne Einbußen in der Qualität der Ergebnisse zu erleiden. Darüber hinaus analysiert die Arbeit die potenziell negativen Folgen von Noise auf die selektive Behandlungsvergabe und schlägt Ideen vor, wie man diese verhindern kann. / Predictive models are useful methods for quantitative decision support in contemporary business. However, often there are statistical problems in the data sets, hindering effective predictive modeling and decision support. This thesis analyzes such frequently occurring statistical problems and provides statistical approaches to overcome them and thereby enable efficient predictive modeling and decision support. The first part of the thesis focuses on concept drift in Google Trends time series data. The thesis provides an empirical analysis of the problem and an approach to sanitize the data. For the specific use case of tourism demand forecasting in Germany, the thesis demonstrates the usefulness of the statistical approach. The second part of the thesis focuses on experiments and models to estimate heterogeneous treatment effects of individuals. In such applications, noise in the data poses a statistical challenge, leading to high requirements in the sample size for randomized experiments and potentially leading to unexpected negative results in the treatment allocation process. To overcome this problem, the thesis proposes methods to conduct experiments with a limited number of individuals, without impairing the decision support. Moreover, the thesis analyzes the potential adverse effects of noise on the treatment allocation process and provides ideas on how to prevent them.
3

Tail behaviour analysis and robust regression meets modern methodologies

Wang, Bingling 11 March 2024 (has links)
Diese Arbeit stellt Modelle und Methoden vor, die für robuste Statistiken und ihre Anwendungen in verschiedenen Bereichen entwickelt wurden. Kapitel 2 stellt einen neuartigen Partitionierungs-Clustering-Algorithmus vor, der auf Expectiles basiert. Der Algorithmus bildet Cluster, die sich an das Endverhalten der Clusterverteilungen anpassen und sie dadurch robuster machen. Das Kapitel stellt feste Tau-Clustering- und adaptive Tau-Clustering-Schemata und ihre Anwendungen im Kryptowährungsmarkt und in der Bildsegmentierung vor. In Kapitel 3 wird ein faktorerweitertes dynamisches Modell vorgeschlagen, um das Tail-Verhalten hochdimensionaler Zeitreihen zu analysieren. Dieses Modell extrahiert latente Faktoren, die durch Extremereignisse verursacht werden, und untersucht ihre Wechselwirkung mit makroökonomischen Variablen mithilfe des VAR-Modells. Diese Methodik ermöglicht Impuls-Antwort-Analysen, Out-of-Sample-Vorhersagen und die Untersuchung von Netzwerkeffekten. Die empirische Studie stellt den signifikanten Einfluss von durch finanzielle Extremereignisse bedingten Faktoren auf makroökonomische Variablen während verschiedener Wirtschaftsperioden dar. Kapitel 4 ist eine Pilotanalyse zu Non Fungible Tokens (NFTs), insbesondere CryptoPunks. Der Autor untersucht die Clusterbildung zwischen digitalen Assets mithilfe verschiedener Visualisierungstechniken. Die durch CNN- und UMAP-Regression identifizierten Cluster werden mit Preisen und Merkmalen von CryptoPunks in Verbindung gebracht. Kapitel 5 stellt die Konstruktion eines Preisindex namens Digital Art Index (DAI) für den NFT-Kunstmarkt vor. Der Index wird mithilfe hedonischer Regression in Kombination mit robusten Schätzern für die Top-10-Liquid-NFT-Kunstsammlungen erstellt. Es schlägt innovative Verfahren vor, nämlich Huberisierung und DCS-t-Filterung, um abweichende Preisbeobachtungen zu verarbeiten und einen robusten Index zu erstellen. Darüber hinaus werden Preisdeterminanten des NFT-Marktes analysiert. / This thesis provides models and methodologies developed on robust statistics and their applications in various domains. Chapter 2 presents a novel partitioning clustering algorithm based on expectiles. The algorithm forms clusters that adapt to the tail behavior of the cluster distributions, making them more robust. The chapter introduces fixed tau-clustering and adaptive tau-clustering schemes and their applications in crypto-currency market and image segmentation. In Chapter 3 a factor augmented dynamic model is proposed to analyse tail behavior of high-dimensional time series. This model extracts latent factors driven by tail events and examines their interaction with macroeconomic variables using VAR model. This methodology enables impulse-response analysis, out-of-sample predictions, and the study of network effects. The empirical study presents significant impact of financial tail event driven factors on macroeconomic variables during different economic periods. Chapter 4 is a pilot analysis on Non Fungible Tokens (NFTs) specifically CryptoPunks. The author investigates clustering among digital assets using various visualization techniques. The clusters identified through regression CNN and UMAP are associated with prices and traits of CryptoPunks. Chapter 5 introduces the construction of a price index called the Digital Art Index (DAI) for the NFT art market. The index is created using hedonic regression combined with robust estimators on the top 10 liquid NFT art collections. It proposes innovative procedures, namely Huberization and DCS-t filtering, to handle outlying price observations and create a robust index. Furthermore, it analyzes price determinants of the NFT market.

Page generated in 0.0233 seconds