1 |
From Deep Mixture Models towards Distributional Regression - Exploring Complex Multivariate DataKock, Lucas 04 June 2024 (has links)
Diese Dissertation stellt drei sich ergänzende Fortschritte in der statistischen Modellierung multivariater Daten vor und behandelt Herausforderungen im Bereich des modellbasierten Clusterings für hochdimensionale Daten, der Analyse longitudinaler Daten sowie der multivariaten Verteilungsregression. Der erste Forschungszweig konzentriert sich auf tiefe Gaußsche Mischmodelle, eine leistungsfähige Erweiterung herkömmlicher Gaußscher Mischmodelle. Wir erforschen Bayessche Inferenz mit Sparsamkeitsprioris zur Regularisierung der Schätzung tiefer Mischmodelle und stellen ein innovatives tiefes Mischmodell von Faktormodellen vor, das in der Lage ist, hochdimensionale Probleme zu bewältigen. Der zweite Forschungsstrang erweitert tiefe Mischmodelle von Clustering zu Regression. Unter Verwendung des tiefen Mischmodells von Faktormodellen als Prior für Zufallseffekte stellen wir einen innovativen Ansatz vor: tiefe Mischmodelle von linearen gemischten Modellen, der lineare gemischte Modelle so erweitert, dass er den Komplexitäten longitudinaler Daten mit vielen Beobachtungen pro Subjekt und komplexen zeitlichen Trends gerecht wird. Dieser Forschungszweig überwindet Beschränkungen gegenwärtiger Modelle und präsentiert eine anpassungsfähige Lösung für hochdimensionale Szenarien. Der dritte Forschungszweig setzt sich mit der Herausforderung auseinander, wahrhaft multivariate Verteilungen im Kontext von Generalisierten Additiven Modellen für Ort, Skala und Form zu modellieren. Wir präsentieren einen innovativen Ansatz, der Copula-Regression nutzt, um die Abhängigkeitsstruktur mittels einer Gauß-Copula zu modellieren. Dies ermöglicht die gemeinsame Modellierung hochdimensionaler Vektoren mit flexiblen marginalen Verteilungen. Hier erleichtert bayessche Inferenz die effiziente Schätzung des stark parametrisierten Modells und führt zu einem äußerst flexiblen Ansatz im Vergleich zu bestehenden Modellen. / This thesis introduces three complementary advancements in statistical modeling for multivariate data, addressing challenges in model-based clustering for high-dimensional data, longitudinal data analysis, and multivariate distributional regression. The first research strand focuses on deep Gaussian mixture models, a powerful extension of ordinary Gaussian mixture models. We explore the application of Bayesian inference with sparsity priors to regularize the estimation of deep mixtures, presenting a novel Bayesian deep mixtures of factor analyzers model capable of handling high-dimensional problems. The inclusion of sparsity-inducing priors in the model contributes to improved clustering results. A scalable natural gradient variational inference algorithm is developed to enhance computational efficiency. The second research strand extends deep mixture models from clustering towards regression. Leveraging the deep mixtures of factor analyzers model as a prior for random effects, we introduce a novel framework, deep mixtures of linear mixed models that extends mixtures of linear mixed models to accommodate the complexities of longitudinal data with many observations per subject and intricate temporal trends. We describe an efficient variational inference approach. This research addresses the limitations of current models and provides a flexible solution for high-dimensional settings.
The third research strand tackles the challenge of modeling truly multivariate distributions in the context of Generalized Additive Models for Location, Scale, and Shape. We propose a novel approach utilizing copula regression to model the dependence structure through a Gaussian copula, allowing for joint modeling of high-dimensional response vectors with flexible marginal distributions. Here, Bayesian inference facilitates efficient estimation of the highly parameterized model, introducing a highly flexible and complementary approach to existing models.
|
2 |
Europa zählt / Das Statistische Amt der Europäischen Gemeinschaften und die Europäisierung der Sozialstatistik (1950-1975)Lammers, Anne 24 March 2022 (has links)
Die vorliegende Arbeit untersucht die Europäisierung der Statistik im Rahmen der Europäischen Gemeinschaft für Kohle und Stahl (EGKS), der Europäischen Wirtschaftsgemeinschaft (EWG) sowie der Europäischen Gemeinschaften (EG) seit den 1950ern bis in die 1970er-Jahre hinein. Die Genese und Entwicklung statistischer Verfahrensweisen im supranationalen Rahmen lässt sich jedoch nicht ohne den vorgelagerten und sie begleitenden Prozess des internationalen statistischen Vergleichs verstehen. Denn seit dem Zweiten Weltkrieg setzten auch die internationalen Organisationen verstärkt auf regionale statistische Vergleiche, wobei Europa hier eine zentrale Rolle einnahm. Von den in diesen Institutionen gemachten Erfahrungen profitierten die Europäischen Gemeinschaften einerseits, versuchten sich jedoch auch stets von ihnen abzugrenzen. Mit Blick auf die International Labour Organization (ILO), der Economic Commission for Europe (ECE) sowie der Organization for Economic Co-Operation and Development (OECD) analysiert die Arbeit folglich, inwiefern die EG-Institutionen tatsächlich einen statistischen „Sonderweg“ gingen oder ihre Arbeit nicht doch vielmehr in eine Linie mit den internationalen statistischen Vergleichen zu sehen ist. Ausgangspunkt aller internationalen und europäischen statistischen Harmonisierungsvorhaben waren unterdessen die nationalen statistischen Ämter (NSÄ). Wie die EG-Institutionen mit ihnen in langwierige Aushandlungsprozesse gingen, wird vor allem mit Blick auf Deutschland als Fallbeispiel analysiert. Mit dieser Herangehensweise verfolgt die Arbeit gleichzeitig das Anliegen, die Statistiken auf ihre Funktion als Sinnproduzenten zu befragen und macht diesen Ansatz somit für die Geschichte der europäischen Integration fruchtbar. Die Darstellungen gehen damit über eine reine Institutionengeschichte deutlich hinaus. Methodisch verfolgt die Arbeit einen akteurszentrierten Institutionalismus, der kulturgeschichtlich und diskursanalytisch ergänzt wird. / This paper examines the europeanization of statistics within the framework of the European Coal and Steel Community (ECSC), the European Economic Community (EEC), and the European Communities (EC) from the 1950s to the 1970s. However, the genesis and development of statistical practices in the supranational framework cannot be understood without the preceding and accompanying process of international statistical comparison. After all, since World War II, international organizations have also increasingly relied on regional statistical comparisons, with Europe playing a central role here. On the one hand, the European Communities profited from the experience gained in these institutions, but on the other hand, they always tried to distinguish themselves from them. With a view to the International Labour Organization (ILO), the Economic Commission for Europe (ECE) and the Organization for Economic Co-Operation and Development (OECD), the thesis analyzes to what extent the EC institutions actually took a statistical "special path" or whether their work should rather be seen in line with international statistical comparisons. Meanwhile, the starting point for all international and European statistical harmonization projects was the national statistical institutes (NSIs). How the EC institutions entered into protracted negotiation processes with them is analyzed with Germany in particular as a case study. With this approach, the work pursues the concern of questioning statistics with regard to their function as producers of meaning and thus makes this approach fruitful for the history of European integration. Thus, the analysis clearly goes beyond a mere institutional history. Methodologically, the work follows an actor-centered institutionalism, which is complemented by cultural history and discourse analysis.
|
3 |
High Dimensional Financial Engineering: Dependence Modeling and Sequential SurveillanceXu, Yafei 07 February 2018 (has links)
Diese Dissertation konzentriert sich auf das hochdimensionale Financial Engineering, insbesondere in der Dependenzmodellierung und der sequentiellen Überwachung.
Im Bereich der Dependenzmodellierung wird eine Einführung hochdimensionaler Kopula vorgestellt, die sich auf den Stand der Forschung in Kopula konzentriert.
Eine komplexere Anwendung im Financial Engineering, bei der eine hochdimensionale Kopula verwendet wird, konzentriert sich auf die Bepreisung von Portfolio-ähnlichen Kreditderivaten, d. h. CDX-Tranchen (Credit Default Swap Index). In diesem Teil wird die konvexe Kombination von Kopulas in der CDX-Tranche mit Komponenten aus der elliptischen Kopula-Familie (Gaussian und Student-t), archimedischer Kopula-Familie (Frank, Gumbel, Clayton und Joe) und hierarchischer archimedischer Kopula-Familie vorgeschlagen.
Im Abschnitt über finanzielle Überwachung konzentriert sich das Kapitel auf die Überwachung von hochdimensionalen Portfolios (in den Dimensionen 5, 29 und 90) durch die Entwicklung eines nichtparametrischen multivariaten statistischen Prozesssteuerungsdiagramms, d.h. eines Energietest-basierten Kontrolldiagramms (ETCC).
Um die weitere Forschung und Praxis der nichtparametrischen multivariaten statistischen Prozesskontrolle zu unterstützen, die in dieser Dissertation entwickelt wurde, wird ein R-Paket "EnergyOnlineCPM" entwickelt. Dieses Paket wurde im Moment akzeptiert und veröffentlicht im Comprehensive R Archive Network (CRAN), welches das erste Paket ist, das die Verschiebung von Mittelwert und Kovarianz online überwachen kann. / This dissertation focuses on the high dimensional financial engineering, especially in dependence modeling and sequential surveillance.
In aspect of dependence modeling, an introduction of high dimensional copula concentrating on state-of-the-art research in copula is presented.
A more complex application in financial engineering using high dimensional copula is concentrated on the pricing of the portfolio-like credit derivative, i.e. credit default swap index (CDX) tranches. In this part, the convex combination of copulas is proposed in CDX tranche pricing with components stemming from elliptical copula family (Gaussian and Student-t), Archimedean copula family (Frank, Gumbel, Clayton and Joe) and hierarchical Archimedean copula family used in some publications.
In financial surveillance part, the chapter focuses on the monitoring of high dimensional portfolios (in 5, 29 and 90 dimensions) by development of a nonparametric multivariate statistical process control chart, i.e. energy test based control chart (ETCC).
In order to support the further research and practice of nonparametric multivariate statistical process control chart devised in this dissertation, an R package "EnergyOnlineCPM" is developed. At moment, this package has been accepted and published in the Comprehensive R Archive Network (CRAN), which is the first package that can online monitor the shift in mean and covariance jointly.
|
Page generated in 0.0185 seconds