Return to search

Analysis and Use of Telemetry Data for Car Insurance Premiums / Analys och Användning av Telemetridata för Bilförsäkringspremier

Paydrive is a pioneer in the Swedish auto insurance market. Being able to influence your insurancepremium through your driving is a concept that is still in its early stages. Throughout this thesis,an attempt to consolidate the vast amounts of data gathered while driving with neural networkshas been made, together with comparisons to the currently existing generalized linear models. Inthe end, a full analysis of the data yielded four distinct groupings of customer behavior but becauseof how the data is structured the results from the modeling became sub-optimal. Insurance datais typically very skewed and zero-heavy due to the absence of accidents. The original researchquestion is whether it is possible to use two neural networks, calculating the probability of anaccident, r, and the size of a potential claim, s respectively. These two factors could be multipliedto determine a final insurance premium as c = r · s. Using statistical standards and tools such as the Gini-coefficient, R2 values, MSE, and MAE themodels were evaluated both individually and pairwise. However, previous research in the fieldshows there haven’t been big enough advancements in this area yet. This thesis comes to the sameconclusion that due to the volatile nature of neural networks and the skewness of the data, it isincredibly difficult to get good results. Future work in the field could result in fairer prices forcustomers on their insurance premiums. / Paydrive är pionjärer i den Svenska fordonsförsäkringsmarknaden. Att kunna påverka hur mycketdu betalar genom din körstil är ett koncept som ännu är i sin barndom. Genom denna avhan-dling har ett försök att konsolidera de enorma mängderna insamlad data med neurala nätverkgjorts, tillsammans med en jämförelse mot de redan existerande generaliserade linjära modellerna.Fyra distinkta kundgrupperingar kunde hittas i datan efter en fullskalig analys men på grund avhur datan är strukturerad producerades endast icke-optimala modeller. Försäkringsdata är alltidväldigt noll-fylld och skev mot noll då kunder oftast inte råkar ut för olyckor. Den ursprungligaforskningsfrågan är huruvida det är möjligt att med hjälp av två, neurala nätverk, beräkna sanno-likheten för en olycka, r, och storleken av en skada, s. Dessa två faktorer kan sedan multiplicerasihop för att best ̈amma en slutgiltig försäkringspremie som c = r · s. Genom statistiska standarder och verktyg som Gini-koefficienten, R2 värden, MSE och MAEutvärderades modellerna individuellt och parvis. Dessvärre visar våra resultat vad föregåendeforskning redan visat på, det saknas resurser och verktyg för att effektivt kombinera neuralanätverk med telemetrisk data. Framtida arbete inom området kan komma att leda till rättvisarepriser för kunder vad gäller försäkringspremier.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-340428
Date January 2023
CreatorsBerg Wahlström, Max, Hagelberg, Anton
PublisherKTH, Matematisk statistik
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-SCI-GRU ; 2023:388

Page generated in 0.0025 seconds