Various forms of fraud have substantially impacted our lives and caused considerable losses to some people. To reduce these losses, many researchers have devoted themselves to the study of fraud detection. After the development of fraud detection from expert-driven to data-driven systems, the scalability and accuracy of fraud detection have been improved considerably. However, most existing fraud detection methods focus on the feature extraction and classification of a certain transaction, ignoring the temporal and spatial long-term information from accounts. In this work, we propose to address these limitations by employing a lightweight memory network (LiMNet), which is a deep neural network that captures causal relations between temporal interactions. We evaluate our approach on two data sets, the Ether-Fraud dataset, and the Elliptic dataset. The former is a brand new dataset collected from Etherscan with data mining, and the latter is published by the homonymous company. As a set of raw collected data never used before, the Ether-Fraud dataset had some issues, such as huge variation among values and incomplete information. Therefore we have processed Ether-Fraud with data supplementation and normalization, which has solved these problems. A series of experiments were designed based on our analysis of the model and helped us to find the best hyper-parameter setting. Then, we compared the performance of the model with other baselines, and the results showed that Lightweight Memory Network (LiMNet) outperformed traditional algorithms on the Ether-Fraud dataset but was not good as the graph-based method on the Elliptic dataset. Finally, we summarized the experience of applying the model to fraud detection, the strengths and weaknesses of the model, and future directions for improvement. / Olika former av bedrägerier har haft en betydande inverkan på våra liv och har orsakat stora förluster för vissa människor. För att minska dessa förluster har många forskare ägnat sig åt att studera upptäckt av bedrägerier. Efter utvecklingen av bedrägeriutredningen från expertdrivna till datadrivna system har skalbarheten och noggrannheten förbättrats avsevärt. De flesta av de befintliga metoderna för upptäckt av bedrägerier fokuserar dock på utvinning av funktioner och klassificering av en viss transaktion och ignorerar den temporala och spatiala långsiktiga informationen från konton. I det här arbetet föreslår vi att vi tar itu med dessa begränsningar genom att använda ett lättviktigt minnesnätverk (LiMNet), som är ett djupt neuralt nätverk som fångar kausala relationer mellan temporala interaktioner. Vi utvärderar vårt tillvägagångssätt på två datamängder, datamängden Ether-Fraud och Elliptic-datamängden. Det förstnämnda är ett helt nytt dataset som samlats in från Etherscan med hjälp av datautvinning, och det sistnämnda är publicerat av det homonyma företaget. Eftersom det rörde sig om råa insamlade data som aldrig använts tidigare hade Ether-Fraud-datasetet vissa problem, t.ex. en stor variation mellan värdena och ofullständig information. Därför har vi bearbetat Ether-Fraud med datatillägg och normalisering, vilket har löst dessa problem. En serie experiment utformades utifrån vår analys av modellen och hjälpte oss att hitta den bästa inställningen av hyperparametrar. Sedan jämförde vi modellens prestanda med andra baslinjer, resultaten visade att LiMNet överträffade traditionella algoritmer på datasetet Ether-Fraud men var inte lika bra som den grafbaserade metoden på datasetet Elliptic. Slutligen sammanfattade vi erfarenheterna av att tillämpa modellen på bedrägeridetektion, modellens styrkor och svagheter samt framtida riktningar för förbättringar.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-321923 |
Date | January 2022 |
Creators | Cui, Zhexin |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2022:773 |
Page generated in 0.0262 seconds