Predição do bom e do mau pagador no Programa Minha Casa, Minha Vida

Dissertação (mestrado)—Universidade de Brasília, Faculdade de Administração, Economia, Contabilidade e Gestão Pública, Programa de Pós-Graduação em Administração, 2016. / Submitted by Camila Duarte (camiladias@bce.unb.br) on 2017-01-24T17:31:54Z
No. of bitstreams: 1
2016_JoséRômulodeCastroVieira.pdf: 2255741 bytes, checksum: 57c6f2f4036147b5ad153870340ed2e6 (MD5) / Rejected by Ruthléa Nascimento(ruthleanascimento@bce.unb.br), reason: Altere o título por favor? Você colocou tudo em mínuscula, mas há nomes próprios nele e, conforme a língua portuguesa, devem começar com letra maiúscula. Altere também a formatação do abstract, as palavras estão sem espaçamento. Obrigada! on 2017-02-13T18:04:19Z (GMT) / Submitted by Camila Duarte (camiladias@bce.unb.br) on 2017-02-14T15:22:37Z
No. of bitstreams: 1
2016_JoséRômulodeCastroVieira.pdf: 2255741 bytes, checksum: 57c6f2f4036147b5ad153870340ed2e6 (MD5) / Approved for entry into archive by Ruthléa Nascimento(ruthleanascimento@bce.unb.br) on 2017-02-15T17:31:18Z (GMT) No. of bitstreams: 1
2016_JoséRômulodeCastroVieira.pdf: 2255741 bytes, checksum: 57c6f2f4036147b5ad153870340ed2e6 (MD5) / Made available in DSpace on 2017-02-15T17:31:18Z (GMT). No. of bitstreams: 1
2016_JoséRômulodeCastroVieira.pdf: 2255741 bytes, checksum: 57c6f2f4036147b5ad153870340ed2e6 (MD5) / Este trabalho tem como objetivo principal implementar diferentes modelos de previsão da inadimplência,a partir de métodos de creditscoring e técnicas computacionais com algoritmos deMachine Learning (Análise discriminante, regressão logística, DecisionTree, Random Forest,BootstrapAggregating e AdaptiveBoosting) e comparar a adequação dos modelos de previsão da inadimplência que melhor identifiquem o bom e o mau pagador no Programa Minha Casa, Minha Vida. Para avaliar a adequação dos modelos de Machine Learning, foram realizados três testes com a obtenção dos índices Area Under ROC Curve (AUROC), Kolmogorov–Smirnov (KS) eBRIER Score com o intuito de validar os modelos em diferentes intervalos de tempo para variável dependente default (30, 60, 90, 120 dias), validar os modelos, considerando um número menor de observações (300.000) e validar os modelos sem o uso de variáveis discriminatórias (gênero,idade e estado civil). Verifica-se que a capacidade de predição dos modelos melhorou, à medida que o número de dias de atrasos utilizados para definir a variável default, aumentava. Os melhores resultados foram obtidos com Bootstrap Aggregating (Bagging), Random Forest (RF) e Adaptive Boosting (AdaBoost). Observa-se um impacto negativo considerável nos resultados quando utilizado um número menor de observações. Verificou-se também que a retirada de variáveis discriminatórias dos modelos preserva o poder discriminatório do sistema de classificação de riscode crédito. Aplicando o algoritmo Bagging no Programa Minha Casa, Minha Vida (PMCMV) a taxa de inadimplência que é de 11,80% poderia ser reduzida para 2,95%. Logo, 197.905 mil contratos inadimplentes deixariam de existir no PMCMV resultando em uma redução nas perdas com inadimplência de aproximadamente R$ 9,8 bilhões. / The main objective of this work is to implement different models of forecasting of default, from credit scoring methods and computational techniques with Machine Learning algorithms (discriminant analysis, logistic regression, decision tree, random forest, bootstrap aggregating and adaptive boosting) and compare The adequacy of the default models that best identify the good and the bad payer in the "Programa Minha Casa, Minha Vida"(PMCMV). In order to evaluate the suitability of the Machine Learning models, three tests were carried out to obtain the Area Under ROC curve (AUROC), Kolmogorov-Smirnov (KS) and BRIER Score indices with the aim of validating the models at different time intervals for variable (30, 60, 90, 120 days), validate the models, considering a smaller number of observations (300,000) and validate the models without the use of discriminatory variables (gender, age and marital status). It is verified that the prediction capacity of the models improved, as the number of days of delays used to define the default variable increased. The best results were obtained with bootstrap aggregating (Bagging), random forest (RF) and adaptive boosting (AdaBoost). A considerable negative impact on results is observed when a smaller number of observations are used. It was also found that the removal of discriminatory variables from the models preserves the discriminatory power of the credit risk classification system. Applying the Bagging algorithm in the "Programa Minha Casa, Minha Vida"(PMCMV) program, the default rate of 11.80% could be reduced to 2.95%. Therefore, 197,905 thousand defaulted contracts would cease to exist in the PMCMV resulting in a reduction in losses with delinquencies of approximately 9.8 billion of real.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/22581
Date08 December 2016
CreatorsVieira, José Rômulo de Castro
ContributorsKimura, Herbert
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB
RightsA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data., info:eu-repo/semantics/openAccess

Page generated in 0.0076 seconds