With the increasing use of big data and automatization, financial data extraction is of growing importance in the financial industry. The thesis examines how an extraction system can be developed for extracting relevant data for credit rating analysis. The system is designed to collect financial reports, extract relevant information, and identify failed extractions. Prerequisites were identified by conducting a qualitative literature study, as well as holding meetings with employees at a credit rating analysis company to align the system’s functionality with the company’s processes. The results showed that an automatic extraction can be implemented. The system was trained through a manual review process, resulting in an increase in performance. Following the training, the system was able to identify and extract all target data correctly. However, in some reports, certain target data was missing and these were treated as failures by the system. In summary, a system that extracts all existing target data was implemented. / Med den ökande användningen av big data och automatisering blir utvinning av finansiella data allt viktigare inom finansbranschen. Uppsatsen undersöker hur ett extraktionssystem kan utvecklas för extraktion av relevant data för kreditvärderingsanalys. Systemet är utformat för att samla in finansiella rapporter, extrahera relevant information och identifiera misslyckade extraktioner. Förutsättningar identifierades genom att genomföra en kvalitativ litteraturstudie samt att hålla möten med anställda på ett företag som utför kreditvärderingsanalyser för att anpassa systemets funktionalitet efter företagets processer. Resultaten visade att en automatisk extraktion kan implementeras. Systemet tränades genom en manuell granskningsprocess, vilket resulterade i en ökad prestanda. Efter träningen kunde systemet identifiera och extrahera all måldata korrekt. Dock saknades viss måldata i vissa rapporter, och dessa behandlades som misslyckanden av systemet. Sammanfattningsvis implementerades ett system som extraherar all befintlig måldata.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-329337 |
Date | January 2023 |
Creators | Minasyan, Robert, Erlandsson, Pim |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | English |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2023:237 |
Page generated in 0.0047 seconds