This thesis report describes an attempt to build a recommender system for recommending sporting goods in an e-commerce setting, using the customer purchase history as the input dataset. Two input datasets were considered, the item purchases dataset and the item-category dataset. Both the datasets are implicit, that is not explicitly rated by the customer. The data is also very sparse that very few users have purchased more than a handful of the items featured in the dataset. The report describes a method for dealing with both the implicit datasets as well as addressing the problem of sparsity. The report introduces SVD (Single Value Decomposition) with matrix factorization as a implementation for recommendation systems. Specifically implementations in the Apache Mahout machine learning framework. / Denna rapport beskriver ett tillvägagångssätt för att med kundernas köphistorik bygga ett rekommendationssystem för rekommendation av sportprodukter på en e-handelsplats. Två olika datamängder behandlas, köphistorik per produkt och kund, samt köpfrekvensen per produktkategori per kund i köphistoriken. Båda är implicita datamängder, vilket betyder att kunderna inte har explicit uttryckt en åsikt för eller emot produkten, utan implicit uttrycker preferens genom sitt köp. Datan är även mycket gles, vilket betyder att den enskilda kunden generellt bara köpt en liten del av den totala mängden av sålda varor. Rapporten behandlar en metod som behandlar både den implicita karaktären av data och gleshets problemet. Rapporten introducerar SVD (Single Value Decomposition) med matrisfaktorisering som en metod för att implementera rekommendationssystem. Specifikt implementerat med hjälp av maskininlärningsbiblioteket Apache Mahout.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-169711 |
Date | January 2015 |
Creators | Flodman, Mikael |
Publisher | KTH, Skolan för datavetenskap och kommunikation (CSC) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | English |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0024 seconds