Companies in the spare part industry can implement a variety of different pricing techniques, which have traditionally been done through personnel know-how and industry conventions. One such technique is the use of price indices to track sales performance. This thesis investigates if machine learning or time series analysis can predict revenue using price and price indices in a data-driven manner which can potentially validate current pricing strategies or serve as a basis for sales teams pricing decisions. Price indices used were the Fisher Index and the Törnqvist Index. The data came from a spare parts supplier and consisted of daily transactions. Two target variables were tested: revenue as a continuous and categorical variable. The continuous target variable represented revenue the following day, while the categorical variable represented either an increase or decrease the following day. Models tested were OLS, XGBoost, ARIMAX and LSTM for the continuous case and Logistic Regression and XGBoost in the categorical case on several different feature sets. In the continuous case, ARIMAX outperformed the other models, but the best model was produced by the feature set not containing any indices. In the categorical case on a feature set containing price indices, XGBoost yielded an accuracy of 68% in classifying revenue increases or decreases. This study suggest that price indices contain some information about whether a revenue movement is going to happen, but not the magnitude of it. / Företag som säljer reservdelar kan implementera olika prissättningsstrategier. Dessa har traditionellt baserats på personalkunnande och branschkonventioner. En strategi som tillämpas är prisindex för att följa upp försäljning. Detta examensarbete undersöker om maskininlärning eller tidsserier kan prediktera omsättning med hjälp av pris- och prisindex på ett datadrivet sätt som kan potentiellt validera nuvarande strategier eller agera underlag för prissättningsbeslut. Prisindex som användes var Fisherindex och Törnqvistindex. Datan kom från en reservdelsleverantör och bestod av dagliga transaktioner. Två beroende variabler testades: omsättning som en kontinuerlig och omsättning som kategorisk variabel. Den kontinuerliga variabeln representerade omsättning nästa dag, medan den kategoriska variabeln representerade utfallet ökning eller minskning av omsättning nästa dag. Modellerna som tränades var OLS, XGBoost, ARIMAX och LSTM i det kontinuerliga fallet och Logistisk Regression och XGBoost i det kategoriska fallet. De tränades på flera uppsättningar av oberoende variabler. I det kontinuerliga fallet presterade ARIMAX bäst, men den bästa modellen tränades på en uppsättning oberoende variabler som inte innehöll några index. I det kategoriska fallet gav XGBoost en noggrannhet på 68% vid klassificering av omsättningsökningar eller minskningar. Detta på en uppsättning oberoende variabler som innehöll prisindex. Resultaten antyder att prisindex innehåller viss information om huruvida en omsättningsrörelse kommer att ske, men inte storleken på den.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-311955 |
Date | January 2021 |
Creators | Ivinskiy, Valery, Olsson, Kevin |
Publisher | KTH, Matematisk statistik |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | English |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-SCI-GRU ; 2021:195 |
Page generated in 0.003 seconds