Return to search

Unsupervised Clustering of Behavior Data From a Parking Application : A Heuristic and Deep Learning Approach / Oövervakad klustring av beteendedata från en parkeringsapplikation : En heuristisk och djupinlärningsmetod

This report aims to present a project in the field of unsupervised clustering on human behavior in a parking application. With increasing opportunities to collect and store data, the demands to utilize the data in meaningful ways also increase. The purpose of this work is to explore common behaviors within the app and what those reveal about its usage. Transforming event based data into user sessions was the first step. The next step was to establish how to measure the similarity between sequences. This was achieved using two different approaches. One approach based on a combination of string metrics and heuristics. The other approach creates array representations of the sessions using an autoencoder. With these two ways of representing the similarity between sessions, we utilize clustering algorithms to assign labels to all sessions. Due to the unknown attributes of the data set, the versatile clustering algorithm HDBSCAN was employed on both representations of the session separately. The clusters produced by HDBSCAN were compared to those produced by simple partitioning algorithms. The noisy nature of human behavior allowed HDBSCAN to create better clusters with distinct behaviors in comparison to the simpler partitioning algorithms. Without a ground truth to rely on, evaluating the models proved to be a difficult part of the project. We utilized both quantitative metrics, as well as qualitative methods for evaluation. In conclusion, our work provides a new way of evaluating user behavior. It brings new insights into different ways the customer achieves their goals within the app. And finally it lays ground for connecting user behavior with transaction data. / Denna rapport syftar till att presentera ett projekt inom oövervakat klustrande av mänskligt beteende i en parkeringsapplikation. Med ökande möjligheter att samla in och lagra data ökar också kraven på att använda informationen på meningsfulla sätt. Syftet med detta arbete är att undersöka vanligt förekommande beteenden inom applikationen och vad dessa avslöjar om användningen. Första steget var att omvandla händelsesbaserad data till användarsessioner. Nästa steg var att etablera hur man mäter likheten mellan sekvenser. Detta uppnåddes genom att använda två olika metoder. Första metoden var baserad på en kombination av strängmått och heuristik. Den andra metoden skapade vektorreprestation av sessionerna med hjälp av en autokodare. Med dessa två sätt att representera likheten mellan sessioner användes klustringsalgoritmer för att tilldela etiketter till alla sessioner. På grund av de okända attributen hos datasetet applicerades den mångsidiga klustringsalgoritmen HDBSCAN för båda representationer av sessionerna. Klustren som skapades från HDBSCAN jämfördes med de kluster som skapades med hjälp av enkla partitioneringsalgoritmer. Bruset som mänskligt beteende medför gjorde att HDBSCAN kunde skapa bättre kluster med tydliga beteenden jämfört med de simpla partitionsalgoritmerna. Utan en grundläggande sanning att utgå ifrån visade sig utvärderingen av modellerna vara en svår del av projektet. Vi använde både kvantitativa mätvärden och kvalitativa metoder för utvärderingen. Sammanfattningsvis resulterade vårt arbete i ett nytt sätt att utvärdera användarbeteende. Vidare skapades nya insikter kring de olika sätt som användare navigerar applikationen för att uträtta olika ärenden. Slutligen lägger arbetet grunden för att koppla samman användarbeteende med transaktionsdata i framtida projekt.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:umu-210486
Date January 2023
CreatorsMagnell, Edvard, Nordling, Joakim
PublisherUmeå universitet, Institutionen för matematik och matematisk statistik
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0023 seconds