In the banking world trades of securities are finalized every day, on behalf of the banks themselves or of their clients. When the trades have been booked by the front office the confirmations sent by the counterparty have to be checked and connected to the correct trade by hand, posing the question whether this process could not be automated using machine learning techniques. There is no straightforward solution to this problem since the confirmations differ between counterparties, and can contain different enriched information or even be in different formats. This thesis addresses the problem of matching trades with their corresponding confirmations via deep learning methods. A model is trained using contrastive learning methods on generated pairs of trades and confirmations, with the goal of matching the pairs in the latent space by using nearest neighbor classification. Accuracy is measured by dividing the correctly classified samples by the total number of samples in a testing batch. The model achieves an accuracy as high as 97.8% over 100 trade-confirmation samples with a 30-dimensional latent space, and it is shown that similar contrastive methods can indeed be used in order to solve this problem. / Banker handlar varje dag med värdpapper av olika slag, antingen för sin egen vinning eller för sina kunders. När en affär har blivit beslutad mellan två parter så bokförs denna i bägge parternas interna system. En konfirmation kommer sedan skickas från den andra parten som manuellt måste paras ihop med affären vilket väcker frågan om huruvida detta inte kan automatiseras med hjälp av maskininlärning. Det finns inte en uppenbar lösning på detta problemet då konfirmationsmeddelandena kan skiljer sig åt mellan olika parter och kan innehålla olika tillagd information eller till och med vara i olika format. En model tränas genom att använda kontrast-inlärning på genererade par av affärer och konfirmationer av affärer för att kunna para ihop paren i det latenta rummet genom att se vilka grannar som ligger närmast. Nogrannheten mäts genom att dela antalet korrekt klassificerade exempel med det totala antalet par i en grupp test-par. Modellen uppnår en noggrannhet så hög som 97.8% på 100 affärs-konfirmationspar med ett 30-dimensionellt latent rum, och det visas att kontrast-inlärning kan användas för att lösa problemet. Det är dock svårt att säga mycket om hur väl modellen kan generalisera de inlärda kunskaperna eftersom träningsdatan behövde genereras och därför saknar en del av komplexiteten av ett äkte data set.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-328240 |
Date | January 2023 |
Creators | Hector, Markus |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2023:131 |
Page generated in 0.0101 seconds