Return to search

Predicting Customer Conversion using Supervised Machine Learning / Prediktering av Kundkonvertering med hjälp av Övervakad Maskininlärning

The growth of e-commerce has been evident over the past years and for companies like Klarna that provides payment solutions, focusing on the purchase experience is more important than ever. With that goal in mind, more companies are using machine learning methods and tools to make predictions and forecast future outcomes, giving them a competitive advantage on the market. This thesis aims to apply supervised machine learning techniques to predict customer conversion, i.e. predict if a customer with a started shopping session will complete the purchase. The purpose of the project is to also determine which supervised learning algorithm performs the best when predicting customer conversion, with regards to a set of model evaluation metrics. The classical classification method Logistic Regression was tested, as well as the machine learning methods Support vector Machine, Random forest and XGBoost. The metrics used to evaluate the model performances were Precision, Recall, F1- and AUC-scores. Furthermore, the SHapley Additive exPlanations approach was implemented for feature importance and for interpreting tree-based models. The results showed that it is in fact possible to predict customer conversion using machine learning. All models yielded good performance and the difference in performance was relatively small. XGBoost performed slightly better than the rest of the models. / Tillväxten av e-handel har varit tydlig de senaste åren och för företag som Klarna, som erbjuder betalningslösningar, är det viktigare än någonsin förr att lägga stor fokus på kundernas köpupplevelse. Som hjälp använder allt fler företag maskininlärnings- metoder och verktyg för att prediktera och göra framtidsprognoser, något som gör dem konkurrenskraftiga på marknader. Syftet med detta examensarbete är att tillämpa övervakad maskininlärning för att prediktera kundkonvertering, med andra ord prediktera om en kund som påbörjat en shoppingsession kommer att slutföra beställningen. Syftet med projektet är även att avgöra vilken övervakad inlärningsalgoritm som presterar bäst vid predikteringen, med avseende på en uppsättning av valideringsmått. Den klassiska klassificeringsmetoden Logistisk Regression testades, så väl som maskininlärnings metoderna Stödvektormaskin, Random Forest och XGBoost. För att validera modellerna användes Precision, Recall, F1- och AUC-scores. Dessutom implementerades metoden SHapley Additive exPlanations för att företaget enklare ska förstå vikten av de olika variablerna och tolka de trädbaserade modellerna. Resultaten visade att det går att prediktera kundkonvertering med hjälp av maskininlärning. Alla modeller påvisade bra resultat och skillnaden i prestation var relativt liten. XGBoost presterade lite bättre än resterande modeller.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-335491
Date January 2021
CreatorsAboud, Stephanie
PublisherKTH, Matematisk statistik
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-SCI-GRU ; 2021:389

Page generated in 0.0142 seconds