This thesis explores and evaluates the forecasting application of the machine learning method Gradient Boosting Decision Trees. This method is used to forecast the demand of the online grocery market with a 7-day time horizon. The thesis was conducted in collaboration with the online grocery company Mathem. The model is applied and evaluated on three different periods representing the spring, summer and fall. The main evaluation metric is the mean absolute percentage error (MAPE), and clear differences were found depending on the predictability of the period. Apart from the model and its application to demand forecasting, the related risk was investigated. This was done by studying the Value-at-Risk and Expected Shortfall associated with discrepancies between the forecasted and actual values over the three periods. The most important conclusion of the case study at Mathem is that overestimation in the forecast is more costly in terms of monetary value than underestimating. It is also found that this is highly dependent on the cost structure of the company's operation and could therefore vary between companies. Thus, the study has contributed to understanding the applications of machine learning models in forecasting processes as well as the risks related to over/underestimating the demand of the online grocery market. / I denna uppsats utforskas och utvärderas maskininlärningsmetoden Gradient Boosting Decision Trees och dess tillämpningsområde inom prognostisering. Metoden används för att prognostisera efterfrågan på onlinehandel av dagligvaror med en 7 dagars tidshorisont. Uppsatsen gjordes i samarbete med företaget Mathem som är aktiva inom denna sektor. Modellen appliceras och utvärderas på tre olika tidsperioder som representerar våren, sommaren och hösten. Modellen själv utvärderas med avseende på måttet mean absolute percentage error (MAPE) och tydliga skillnader mellan tidsperioderna observerades relaterat till variansen i datan. Förutom modellen och dess applikation på prognostisering av efterfrågan utforskades även de relaterade riskerna. Detta genomfördes genom att studera riskmåtten Value-at-Risk och Expected Shortfall baserade på differensen mellan de prognostiserade och de faktiska värdena under dessa tre tidsperioder. Den viktiga slutsatsen som kunde dras från uppsatsen i samband med Mathem var att det, i monetära termer, är dyrare att prognostisera för högt än för lågt. En ytterligare slutsats som kan dras är att den monetära risken är mycket beroende av kostnadsstrukturen hos företaget och skulle därför kunna variera mellan olika företag. Således har denna uppsats bidragit till förståelse för användandet av maskininlärning för prognostisering samt riskerna kopplade till över- och underskattning av efterfrågan i marknaden för dagligvaruhandel online.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-314025 |
Date | January 2022 |
Creators | Franzén, Filip, Nord, Karl Axel |
Publisher | KTH, Matematik (Avd.) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | English |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-SCI-GRU ; 2022:105 |
Page generated in 0.0176 seconds