Return to search

From Data to Decision: : Using Logistic Regression to Determine Creditworthiness / Från Data till Beslut: : Användning av Logistik Regression för att Avgöra Kreditvärdighet

The development of scorecards for customer credit rating is a well-established field in the financial sector. The aim of this project, conducted in collaboration with a Swedish credit institute, was to develop a statistical model for predicting customer performance. In addition to conducting a model, the project also sought to identify the set of consumer characteristics with high predictive capability and how these characteristics differ when predicting performance early versus late in the loan term. To achieve this goal, a dataset containing approximately 15,000 unique loan applications approved between July 2020 and July 2022 was acquired from the credit institute, and logistic regression models were applied for different time periods ranging from 6 to 21 months. However, the models demonstrated better results than a random model but also showed difficulties in predicting creditworthiness. Possible factors contributing to the model's performance are discussed in the project, along with suggestions for potential improvements. Further research is encouraged in this area to achieve better prediction accuracy. / Utvecklingen av modeller för att bedöma kunders kreditvärdighet är en väletablerad del av finanssektorn. Som en del av ett samarbete med ett svenskt kreditinstitut var målet med detta projekt att skapa en statistisk modell som kunde predicera kunders betalningsförmåga. Utöver att skapa en modell syftar projektet också till att identifiera de egenskaper hos låntagare som har hög prediktionsförmåga samt hur dessa prediktionsvariabler skiljer sig för att förutse betalningsförmågan tidigt respektive sent in i löptiden. För att undersöka detta erhölls en datamängd innehållande cirka 15 000 unika låneansökningar som godkändes mellan juli 2020 och juli 2022 från kreditinstitutet, och logistiska regressionsmodeller tillämpades med kundernas status mellan 6 och 21 månader in av löptiden som målvariabler. Modellerna visade bättre resultat än en slumpmässig modell men visade också på stora svårigheter att förutsäga kreditvärdigheten. Möjliga faktorer som bidrar till modellernas träffssäkerhet diskuteras i projektet, tillsammans med förslag på potentiella förbättringar och ytterligare forskning uppmuntras inom detta område för att uppnå bättre modeller.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-342928
Date January 2023
CreatorsNorling, Joel, Abdu, Sami
PublisherKTH, Matematisk statistik
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-SCI-GRU ; 2023:248

Page generated in 0.0023 seconds