Return to search

A machine learning perspective on repeated measures

Wiederholte Messungen mehrerer Individuen sind von entscheidender Bedeutung für die Psychologie. Beispiele sind längsschnittliche Paneldaten und Elektroenzephalografie-Daten (EEG-Daten). In dieser Arbeit entwickle ich für jede dieser beiden Datenarten neue Analyseansätze, denen Methoden des maschinellen Lernens zu Grunde liegen. Für Paneldaten entwickle ich Gauß-Prozess-Panelmodellierung (GPPM), die auf der flexiblen Bayesschen Methode der Gauß-Prozess-Regression basiert. Der Vergleich von GPPM mit längsschnittlicher Strukturgleichungsmodellierung (lSEM), welche die meisten herkömmlichen Panelmodellierungsmethoden als Sonderfälle enthält, zeigt, dass lSEM wiederum als Sonderfall von GPPM aufgefasst werden kann. Im Gegensatz zu lSEM eignet sich GPPM gut zur zeitkontinuierlichen Modellierung, kann eine größere Menge von Modellen beschreiben, und beinhaltet einen einfachen Ansatz zur Generierung personenspezifischer Vorhersagen. Ich zeige, dass die implementierte GPPM-Darstellung gegenüber bestehender SEM Software eine bis zu neunfach beschleunigte Parameterschätzung erlaubt. Für EEG-Daten entwickle ich einen personenspezifischen Modellierungsansatz zur Identifizierung und Quantifizierung von Unterschieden zwischen Personen, die in konventionellen EEG-Analyseverfahren ignoriert werden. Im Rahmen dieses Ansatzes wird aus einer großen Menge hypothetischer Kandidatenmodelle das beste Modell für jede Person ausgewählt. Zur Modellauswahl wird ein Verfahren aus dem Bereich des maschinellen Lernens genutzt. Ich zeig ich, wie die Modelle sowohl auf der Personen- als auch auf der Gruppenebene interpretiert werden können. Ich validiere den vorgeschlagenen Ansatz anhand von Daten zur Arbeitsgedächtnisleistung. Die Ergebnisse verdeutlichen, dass die erhaltenen personenspezifischen Modelle eine genauere Beschreibung des Zusammenhangs von Verhalten und Hirnaktivität ermöglichen als konventionelle, nicht personenspezifische EEG-Analyseverfahren. / Repeated measures obtained from multiple individuals are of crucial importance for developmental research. Examples of repeated measures obtained from multiple individuals include longitudinal panel and electroencephalography (EEG) data. In this thesis, I develop a novel analysis approach based on machine learning methods for each of these two data modalities. For longitudinal panel data, I develop Gaussian process panel modeling (GPPM), which is based on the flexible Bayesian approach of Gaussian process regression. The comparison of GPPM with longitudinal structural equation modeling (SEM), which contains most conventional panel modeling approaches as special cases, reveals that GPPM in turn encompasses longitudinal SEM as a special case. In contrast to longitudinal SEM, GPPM is well suited for continuous-time modeling, can express a larger set of models, and includes a straightforward approach to obtain person-specific predictions. The comparison between the developed GPPM toolbox and existing SEM software reveals that the GPPM representation of popular longitudinal SEMs decreases the amount of time needed for parameter estimation up to ninefold. For EEG data, I develop an approach to derive person-specific models for the identification and quantification of between-person differences in EEG responses that are ignored by conventional EEG analysis methods. The approach relies on a framework that selects the best model for each person based on a large set of hypothesized candidate models using a model selection approach from machine learning. I show how the obtained models can be interpreted on the individual as well as on the group level. I validate the proposed approach on a working memory data set. The results demonstrate that the obtained person-specific models provide a more accurate description of the link between behavior and EEG data than the conventional nonspecific EEG analysis approach.

Identiferoai:union.ndltd.org:HUMBOLT/oai:edoc.hu-berlin.de:18452/18293
Date09 November 2016
CreatorsKarch, Julian
ContributorsVoelkle, Manuel C., Boker, Steven M., Polk, Thad
PublisherHumboldt-Universität zu Berlin, Lebenswissenschaftliche Fakultät
Source SetsHumboldt University of Berlin
LanguageEnglish
Detected LanguageEnglish
TypedoctoralThesis, doc-type:doctoralThesis
Formatapplication/pdf
RightsNamensnennung - Keine kommerzielle Nutzung - Keine Bearbeitung, http://creativecommons.org/licenses/by-nc-nd/3.0/de/

Page generated in 0.0021 seconds