Submitted by Jhonata Ramos (jhonata.emerick@gmail.com) on 2015-09-18T16:47:09Z
No. of bitstreams: 1
dissertacao_final.pdf: 820128 bytes, checksum: b7fc5ca71a3debaf99da902b518ff748 (MD5) / Approved for entry into archive by Renata de Souza Nascimento (renata.souza@fgv.br) on 2015-09-18T17:17:43Z (GMT) No. of bitstreams: 1
dissertacao_final.pdf: 820128 bytes, checksum: b7fc5ca71a3debaf99da902b518ff748 (MD5) / Made available in DSpace on 2015-09-18T21:34:00Z (GMT). No. of bitstreams: 1
dissertacao_final.pdf: 820128 bytes, checksum: b7fc5ca71a3debaf99da902b518ff748 (MD5)
Previous issue date: 2015-08-21 / For fraud detection models are used to identify whether a transaction is legitimate or fraudulent based on registration and transactional information. The proposal on technical study presented in this thesis consists in the Bayesian Networks (BN); their results were compared to logistic regression technique (RL), widely used by the market. Bayesian classifiers were evaluated, with the Naive Bayes structure. The structures of Bayesian networks were obtained from actual data, provided by a financial institution. The database was divided into samples development and validation by cross validation ten partitions. Naive Bayes classifiers were chosen due to the simplicity and efficiency. The model performance was evaluated taking into account the confusion matrix and the area under the ROC curve. The analyzes of performance models revealed slightly higher than the logistic regression compared to bayesian classifiers. Logistic regression was chosen as the most appropriate model for performed better in predicting fraudulent operations, compared to the confusion matrix. Based on area under the ROC curve, logistic regression demonstrated greater ability to discriminate the operations being classified correctly, those that are not. / Modelos para detecção de fraude são utilizados para identificar se uma transação é legítima ou fraudulenta com base em informações cadastrais e transacionais. A técnica proposta no estudo apresentado, nesta dissertação, consiste na de Redes Bayesianas (RB); seus resultados foram comparados à técnica de Regressão Logística (RL), amplamente utilizada pelo mercado. As Redes Bayesianas avaliadas foram os classificadores bayesianos, com a estrutura Naive Bayes. As estruturas das redes bayesianas foram obtidas a partir de dados reais, fornecidos por uma instituição financeira. A base de dados foi separada em amostras de desenvolvimento e validação por cross validation com dez partições. Naive Bayes foram os classificadores escolhidos devido à simplicidade e a sua eficiência. O desempenho do modelo foi avaliado levando-se em conta a matriz de confusão e a área abaixo da curva ROC. As análises dos modelos revelaram desempenho, levemente, superior da regressão logística quando comparado aos classificadores bayesianos. A regressão logística foi escolhida como modelo mais adequado por ter apresentado melhor desempenho na previsão das operações fraudulentas, em relação à matriz de confusão. Baseada na área abaixo da curva ROC, a regressão logística demonstrou maior habilidade em discriminar as operações que estão sendo classificadas corretamente, daquelas que não estão.
Identifer | oai:union.ndltd.org:IBICT/oai:bibliotecadigital.fgv.br:10438/14062 |
Date | 21 August 2015 |
Creators | Ramos, Jhonata Emerick |
Contributors | Ruilova Terán, Juan Carlos, Cipparrone, Flávio Almeida de Magalhães, Escolas::EESP, Pinto, Afonso de Campos |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional do FGV, instname:Fundação Getulio Vargas, instacron:FGV |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0018 seconds