Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2018. / Um banco brasileiro disponibilizou a abertura de conta bancária por meio de um aplicativo móvel, o que geralmente exige muito pouca informação do usuário. Essa falta de dados prejudica os atuais modelos preditivos aplicados na seleção de clientes para campanhas de marketing. Com o intuito de atenuar isso, este trabalho investiga o uso da Mineração de Dados a fim de criar um modelo preditivo capaz de identificar a renda desses clientes. Para tanto, como treinamento, usa os dados de um grupo de clientes, os quais, de forma semelhante, utilizam o aplicativo móvel do banco. Todavia, abriram suas contas indo às agências, local onde comprovaram suas rendas. Os dados utilizados incluem informações cadastrais, demográficas e características dos smartphones dos clientes. O processo CRISP-DM foi aplicado para comparar várias abordagens, tais como: Regressão Logística, Random Forest, Redes Neurais Artificiais, Gradient Boosting Machine e Hillclimbing Ensemble Selection with Bootstrap Sampling. Os resultados mostraram que o Gradient Boosting Machine obteve o melhor resultado com Acurácia de 92 % e F-Measure de 62 %. / Digital bank accounts require little information from customers to enable simple banking services, and the absence of income data hampers a focused targeting of customers for additional products/services. This study presents a comparison of predictive models to identify a customer’s income bracket, by mining digital account data. The information available to build the models includes customers’ registered data, demographics, house prices, and smartphone features. The models are applied to a set of customers with regular accounts, who have income data and features similar to those with digital accounts. The models’ performances are compared to the model currently in use in a private bank. Several approaches were used, in a CRISP-DM process: Logistic Regression, Random Forest, Artificial Neural Networks, Gradient Boosting Machine, and Hill-Climbing Ensemble with Bootstrap Sampling. Experimental results indicate the Gradient Boosting Machine model achieved the best results, with a 92% Accuracy and a 62% F-Measure.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/33918 |
Date | 29 June 2018 |
Creators | Mourão, Roberto Nunes |
Contributors | Ramos, Guilherme Novaes |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB |
Rights | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data., info:eu-repo/semantics/openAccess |
Page generated in 0.002 seconds