Return to search

Maximizing Recommendation System Accuracy In E-Commerce for Clothing And Accessories for Children / Maximera precisionen för rekommendationssystem inom e-handel för barnkläder

The industry of electronic commerce (e-commerce) constitutes a great part of the yearly retail consumption in Sweden. Looking at recent years, it has been seen that a rapidly growing sector within the mentioned field is the clothing industry for clothes and accessories for children and newborns. To get an overview of the items and help customers to find what they are looking for, many web stores have a system called a Recommendation System. The mechanics behind this service can look rather different depending on the method used. However, their unified goal is to provide a list of recommended items of interest to the customer.  A branch within this field is the Session Based Recommendation System (SBRS). These are models which are designed to work with the trace of products, called a session, that a user currently has visited on the web store. Based on that information they then formulate an output of recommended items. The SBRS models have been especially popularized since the majority of customers browse in an anonymous behavior, which means that they due to time efficiency often neglect the possibility of creating or logging into any personal web store account. This however limits the accessible information that a system can make use of to shape its item list.  It can be seen that the number of articles exploring SBRS within the fashion branch of clothing and accessories for children is very limited. This thesis is made to fill that gap. After a thorough literature study, three models were found to be of certain interest, the Short-Term Attention/Memory Priority (STAMP) model, Long Short-Term Memory (LSTM) model, and Gated Recurrent Unit (GRU) model. Further, the LSTM model is included as it is the collaborative company, BabyShop Group AB's current used method.  The results of this thesis show that the GRU model is a promising method, managing to predict the next item for a customer more consistently than any other of the evaluated models. Furthermore, it can also be seen that what embeddings the models use to represent the products plays a significant role in the learning and evaluation of the used data set.  Moreover, a benchmark model included in this thesis also shows the importance of filtering the data set of sessions. It can be seen that a majority of customers visit already-seen products, logged happenings most likely due to refreshing web pages or similar actions. This causes the session data set to be characterized by repeated items. For future work, it would therefore indeed be interesting to see how this data set can be filtered in a different way. To see how that affects the outcome of the used metrics in this thesis. / Industrin för elektronisk handel (e-handel) utgör en stor del av den årliga konsumtionen av återförsäljning i Sverige. Bara genom att följa de senaste åren har det kunnat ses att en snabbt växande sektor inom det nämnda området är den som berör kläder och accessoarer för barn.  För att kunna ge en överblick och hjälpa kunder att finna vad de söker använder många webbutiker ett system som kallas rekommendationssystem. Hur dessa system faktiskt fungerar kan se väldigt olika ut. Men deras gemensamma mål är att i slutändan kunna ge en lista av rekommenderade produkter till kunden. En gren inom detta område är sessionsbaserade rekommendationssystem. Detta är modeller som är designade för att arbeta med själva spåret av besökta produkter, de som en kund har varit inne på under sin nuvarande vistelse på webbutiken. Baserat på denna information formuleras sedan en lista av rekommenderade produkter till besökaren. Dessa typer av modeller har blivit särskilt populära då många kunder gillar att shoppa anonymt. Vilket i denna kontext betyder att de gärna slipper att behöva logga in på något personligt konto på webbutiken, där särskild information kan sparas. Men detta betyder också att mängden tillgängliga data minskas för rekommendationssystemet.  Antalet forskningsartiklar som utforskar sessionsbaserade rekommendationssystem för e-handel inom barnmode är väldigt begränsad. Denna avhandling är därför gjord med syftet att försöka fylla detta tomrum. En genomgående litteraturstudie visade att tre modeller var av särskilt intresse, nämligen Short-Term Attention/Memory Priority (STAMP), Gated Recurrent Unit (GRU) och Long Short Term Memory (LSTM) modellen. Den sistnämnda är inkluderad då detta är den nuvarande modellen som används av företaget som denna avhandling har gjorts i samarbete med, BabyShop Group AB.  Resultaten i denna avhandling kan påvisa att GRU är en mycket lovande modell som lyckades förutbestämma nästkommande produkt i en sessionskedja bäst. Utöver detta kan det också ses att embedding-vektorerna som används för att representera produkterna för modellerna spelar en avgörande roll. Speciellt för deras lärande och evaluering av data.  Förutom det påvisade en av riktvärdesmodellerna som användes i denna avhandling den viktiga innebörden av att filtrera sessionsdata. Det kan nämligen urskiljas i den data som erhölls från företaget att många kunder återbesöker en stor del av redan besökta produkter. Detta åstadkommas troligen av att kunderna uppdaterar sidan de är på, eller utför någon annan liknande handling. Det här gör att en stor del av den sessionsdata som används i denna avhandling innehåller många upprepade produkter i de givna sessionskedjorna. Som framtida arbete vore det därför intressant att utforska olika filtreringsmetoder som kan appliceras på den givna datamängden. Detta för att se hur en mera filtrerad datamängd påverkar slutresultatet av de använda mätmetoderna i denna avhandling.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-325971
Date January 2022
CreatorsRenström, Niklas
PublisherKTH, Matematik (Avd.)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-SCI-GRU ; 2022:358

Page generated in 0.0032 seconds