Return to search

Supervised classification for human movement data : A comparative study of functional and traditional methods / En jämförelse av övervakade klassificeringsmetoder för mänskligt rörelsedata : Funktionella mot diskreta tillvägagångssätt

Functional data analysis (FDA) has a growing importance in statistics, especially in disciplines like biomechanics, where it is common to observe data over time. The objective of this thesis is to employ FDA techniques and compare the classification performance of supervised classification models utilizing functional data with the same models using a discrete summary measurement (max-values) as input. The classification revolves around predicting whether individuals, who underwent anterior cruciate ligament (ACL) reconstruction surgery, have a limb symmetry index higher or lower than 90% based on their observed movements during squat and step-down exercises executed, on average, nine months prior. Expanding the knowledge of the rehabilitation process after ACL injuries is not only interesting for affected individuals but can also improve the utilization of medical resources and reduce societal costs.  The data comes from two occasions where 15 individuals who underwent ACL surgery performed the specified exercises. A total of 72 functional variables related to joint angles and moments, along with five additional univariate variables (e.g., the time elapsed between surgery and the first test occasion), were considered as potential predictors. Following an initial variable selection process using permutation tests, 14 variables were used separately in three different classification models: support vector machine (SVM), k-nearest neighbors (KNN), and naïve Bayes (NB). The classification performance was evaluated by the correct classification rate by leave-one-out cross-validation.  The results showed that, when considering the variable that yielded the highest accuracy for each specific method, models utilizing functional data generally outperformed their counterparts using max-values. With functional data, SVM achieved an accuracy of 100%, KNN 93%, and NB 80%. The accuracy using max-values as input was 87%, 87%, and 80% for the SVM, KNN, and NB, respectively. / Funktionell dataanalys (FDA) spelar en alltmer betydande roll inom statistik, särskilt i områden som biomekanik där det är vanligt att observera data över tid. Syftet med denna studie är att tillämpa FDA-metoder för att jämföra klassificeringsresultat för olika klassificeringsmodeller när det nyttjar funktionellt data kontra när maxvärden används som indata. Klassificeringen innebär prediktion av huruvida individer som genomgått operation av främre korsbandet (ACL) har ett symmetriindex högre eller lägre än 90% baserat på deras observerade rörelser under knäböj och nedstegsövningar utförda, i genomsnitt, nio månader tidigare. Genom att utvidga kunskapen om rehabiliteringsprocessen efter ACL-skador kan effektiviteten av medicinska resurser samt rehabiliteringen för den enskilda individen förbättras.  Datamaterialet kommer från två tillfällen där 15 personer som genomgått ACL-rekonstruktion utförde olika övningar. Totalt undersöks 72 funktionella variabler relaterade till vinklar och moment tillsammans med fem andra univariata variabler (t.ex. tiden mellan operation och första testtillfället) som potentiella prediktorer. Efter en inledande variabelurvalsprocess med hjälp av permutationstester användes 14 variabler separat i tre olika klassificeringsmodeller: support vector machine (SVM), k-nearest neighbors (KNN) och naive Bayes (NB). Klassificeringsprestationen utvärderades genom andelen korrekt klassificerade observationer vid korsvalidering där en observation exkluderades åt gången.  Resultaten visade, när man beaktade den variabel som gav högst korrekt klassificeringsgrad för varje specifik metod, att modellerna som nyttjade funktionellt data i allmänhet överträffade sina motsvarigheter med maxvärden som indata. Med funktionellt data uppnådde SVM en korrekt klassificeringsgrad på 100%, KNN 93% och NB uppvisade 80% korrekt klassificering. Klassificeringsgraden för de klassificeringsmodellerna med maxvärden som indata var 87%, 87% och 80% för SVM, KNN respektive NB.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:umu-210051
Date January 2023
CreatorsLindvall, Markus
PublisherUmeå universitet, Statistik
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageEnglish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0019 seconds