This thesis tackles the problem of accurately pricing apartments in large Swedish cities using geospatial data. The aim is to determine if geospatial data and population statistics can be used in conjunction with direct apartment data to accurately price apartments in large cities. There has previously been little research in this domain due to a lack of available data in many countries. In Sweden, apartment transaction data is public which enabled this thesis to be performed. We apply and compare a multiple linear regression, a multi-layer perceptron and a random forest to appraise apartments in six of the largest cities in Sweden. To perform the appraisals, geospatial data and population statistics were gathered in the areas surrounding the apartments. Five of the six cities were used to train and test the models, whereas one city was only used for testing. The two best performing models, the multi-layer perceptron and random forest achieved a mean absolute percentage error of 8.68% and 8.76% respectively within cities they were previously trained within and a mean absolute percentage error of 22.62% and 20.6% respectively on apartment in the test city dataset. In conclusion this thesis suggests that with the use of this data, multi-layer perceptrons and random forests are useful for appraising apartments in different cities, however that more data is probably needed to appraise apartments in cities previously unseen by the models. / Detta masterarbete tar upp problemet med att korrekt prissätta lägenheter i stora svenska städer med hjälp av geospatiala data. Syftet är att avgöra om geospatiala data och befolkningsstatistik kan användas tillsammans med direkt lägenhetsdata för att korrekt prissätta lägenheter i storstäder. Det har tidigare utförts lite forskning inom detta område på grund av brist på tillgängliga data i många länder. I Sverige är uppgifter om lägenhetstransaktioner offentliga vilket gjorde att denna avhandling kunde utföras. Vi tillämpar och jämför en multipel linjär regression, en flerskiktsperceptron och en slumpmässig skog för att värdera lägenheter i sex av de största städerna i Sverige. För att göra värderingarna samlades geospatiala data och befolkningsstatistik i de områden som omger lägenheterna. Fem av de sex städerna användes för att träna och testa modellerna, medan en stad endast användes för testning. De två bäst presterande modellerna, flerskiktsperceptronen och slumpmässig skog uppnådde ett genomsnittligt absolut procentfel på 8,68% respektive 8,76% inom städer som de tidigare var tränade inom och ett genomsnittligt absolut procentfel på 22,62% respektive 20,6% på lägenheter i teststadens dataset. Sammanfattningsvis tyder detta verk på att med hjälp av dessa data är flerskiktsperceptroner och slumpmässiga skogar användbara för att värdera lägenheter i olika städer, men att mer data förmodligen behövs för att värdera lägenheter i städer som modellerna tidigare inte har tränats på.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-305646 |
Date | January 2021 |
Creators | Segerhammar, Fredrik |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2021:765 |
Page generated in 0.0027 seconds