Return to search

Comparative Analysis of Machine Learning Methods for Predicting Property Prices and Sale Velocities in the Real Estate Industry / Jämförande analys av maskininlärningsmetoder för att förutsäga fastighetspriser och försäljningshastigheter inom fastighetsbranschen

The real estate industry is one of the largest industries in the world and using data-driven decision-making has been shown to increase companies’ profitability. A technique to apply data-driven decision-making is machine learning. Within the real estate industry, predicting property selling prices and sale velocities (the duration a property remains on the market) are crucial factors of interest. Knowing the selling price and the sale velocity can motivate businesses to alter their plans in an effort to increase their profitability. The research conducted in this thesis employs a comparative approach to evaluate the performance of various machine learning methods in predicting both the selling price and the sale velocity of properties. The machine learning methods this study investigated are random forest, decision tree, K-nearest neighbor, support vector regression, and multilayer perceptron. After pre-processing, the data set used comprises 560,000 distinct data points from the Swedish housing market. The data set has a wide geographic scope, covering almost the entire country of Sweden. The data set was subjected to both normalization and standardization techniques in order to determine how they affected the machine learning methods. The results demonstrate that random forest oEutperforms the other machine learning methods in predicting property selling prices. However, the assessed machine learning methods encountered difficulties in predicting the sale velocity. The best-performing machine learning method for sale velocity is random forest. Notably, SVR demonstrates a lower MAE for sale velocity, but performs worse in the R² metric. / Fastighetsbranschen är en av de största industrierna i världen och att använda datadrivet beslutsfattande har visat sig öka företags lönsamhet. En teknik för att tillämpa datadrivet beslutsfattande är maskininlärning. Inom fastighetsbranschen är förutsägelser av fastigheters försäljningspriser och försäljningshastigheter viktiga faktorer av intresse. Kunskap om försäljningspriset och försäljningshastigheten kan motivera företag att ändra sina planer i syfte att öka lönsamheten. I den forskning som bedrivs i denna avhandling används en jämförande metod för att utvärdera olika maskininlärningsmetoders prestanda när det gäller att förutsäga både försäljningspriset och försäljningshastigheten för fastigheter. De metoder för maskininlärning som undersökts i denna studie är random forest, decision tree, K-nearest neighbor, support vector regression och multilayer perceptron. Efter förbehandling består den använda datamängden av 560 000 distinkta datapunkter från den svenska bostadsmarknaden. Datamängden har en stor geografisk räckvidd och täcker nästan hela Sverige. Datamängden utsattes för både normaliserings- och standardiseringstekniker för att avgöra hur de påverkade maskininlärningsmetoderna. Resultaten visar att random forest överträffar de andra maskininlärningsmetoderna när det gäller att förutsäga försäljningspriser på fastigheter. De utvärderade maskininlärningsmetoderna stötte dock på svårigheter när det gällde att förutsäga försäljningshastigheten. Den bäst presterande maskininlärningsmetoden för försäljningshastighet är random forest. I synnerhet visar SVR en lägre MAE för försäljningshastighet, men presterar sämre i R² måttet.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-332399
Date January 2023
CreatorsEren, Lucas
PublisherKTH, Skolan för elektroteknik och datavetenskap (EECS)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2023:514

Page generated in 0.0023 seconds