Return to search

Machine Learning and Telematics for Risk Assessment in Auto Insurance

Pricing models for car insurance traditionally use variables related to the policyholder and the insured vehicle (e.g. car brand and driver age) to determine the premium. This can lead to situations where policyholders belonging to a group that is seen as carrying a higher risk for accidents wrongfully get a higher premium, even if the higher risk might not necessarily apply on a per- individual basis. Telematics data offers an opportunity to look at driving behavior during individual trips, enabling a pricing model that can be customized to each policyholder. While these additional variables can be used in a generalized linear model (GLM) similar to the traditional pricing models, machine learning methods can possibly unravel non-linear connections between the variables. Using telematics data, we build a gradient boosting model (GBM) and a neural network (NN) to predict the claim frequency of policyholders on a monthly basis. We find that both GBMs and NNs offer predictive power that can be generalized to data that has not been used in the training of the models. The results of the study also show that telematics data play a considerable role in the model predictions, and that the frequency and distance of trips are important factors in determining the risk using these models. / Prissättningsmodeller för bilförsäkringar använder traditionellt variabler relaterade till försäkringstagaren och det försäkrade fordonet (t.ex. bilmärke och förarålder) för att bestämma försäkringspremien. Detta kan leda till situationer där försäkringstagare som tillhör en grupp som anses bära på en högre risk för olyckor får en felaktigt hög premie, även om den högre risken inte nödvändigtvis gäller på en individbasis. Telematikdata erbjuder en möjlighet att titta på körbeteende under individuella resor, vilket möjliggör en prissättningsmodell som kan anpassas till varje enskild försäkringstagare. Ä ven om dessa variabler kan användas i en linjär modell liknande de traditionella prissättningsmodellerna kan användandet av maskininlärningsmetoder möjligen avslöja icke-linjära samband mellan variablerna. Med hjälp av telematikdata bygger vi en modell baserad på gradient boosting (GBM) och ett neuralt nätverk (NN) för att förutsäga frekvensen av olyckor för försäkringstagare på månadsbasis. Vi kommer fram till att båda modeller har en prediktiv förmåga som går att generalisera till data som inte har använts vid träningen av modellerna. Resultaten av studien visar även att telematikdata spelar en betydande roll i modellernas prediktioner, samt att frekvensen och sträckan av resor är viktiga faktorer vid bedömningen av risken med hjälp av dessa modeller.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-281534
Date January 2020
CreatorsEkström, Frithiof, Chen, Anton
PublisherKTH, Skolan för elektroteknik och datavetenskap (EECS)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2020:517

Page generated in 0.0022 seconds