In a unique opportunity to examine rare appraisal data from the commercial real estate sector, the accuracy of three machine learning algorithms is compared in the task of appraising commercial real estate. The algorithms; random forests, support vector regression and artificial neural networks, are tested in research about residential real estate, but the area of commercial real estate has remained relatively unexplored due to corporate secrecy. The mean absolute percentage error of the trained models range from 44% to 24% and is held as a baseline. The best performing baseline model, Random forests, was then made more sophisticated in order to evaluate how much performance could increase. It was found that the introduction of Gradient boosting reduced the aforementioned error from 24% to 20%. In comparison, the average human expert appraiser performs at an average error of 12%. The conclusion is that more work is needed in order to compete with human expert appraisers - and that this is a feasible task considering some of the inherent issues within the used data could be resolved with much manual labor. / Med hjälp av en unik datamängd från den kommersiella fastighetssektorn utvärderas prestandan hos tre maskininlärningsalgoritmer i uppgiften att värdera kommersiella fastigheter. Dessa algoritmer; slumpmässig skog, stödvektormaskin samt artificiella neurala nätverk, förekommer ofta inom forskning vid värdering av privata boenden, men på grund av datasekretess inom företagsvärlden är det kommersiella fastighetsområdet idag relativt outforskat. Den genomsnittliga procentuella felmarginalen för de tränade modellerna ligger inom intervallet 44% till 24% och detta hålls som en baslinje för prestandan. Den bäst presterande modellen, slumpmässig skog, görs sedan mer sofistikerad i syfte att utforska hur mycket prestandan kan öka. Det konstateras att en implementering av så kallat Gradient boosting sänker den tidigare nämnda felmarginalen från 24% till 20%. Jämförelsevis presterar den genomsnittliga mänskliga värderaren vid en felmarginal omkring 12%. Slutsatsen är att mer arbete krävs för att konkurrera med mänskliga värderare - och att detta bedöms vara genomförbart med tanke på att vissa underliggande problem i den använda datamängden kan lösas med en stor mängd manuellt arbete.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-235284 |
Date | January 2018 |
Creators | Dellstad, Michael |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2018:524 |
Page generated in 0.0021 seconds