Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas
Departamento de Ciência da Computação, Mestrado Profissional em Computação Aplicada, 2015. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2016-01-26T12:19:36Z
No. of bitstreams: 1
2015_RicardoSilvaCarvalho.pdf: 12764754 bytes, checksum: 6912c187f6b4d6ea2b4520b7651675e7 (MD5) / Approved for entry into archive by Patrícia Nunes da Silva(patricia@bce.unb.br) on 2016-01-26T15:13:56Z (GMT) No. of bitstreams: 1
2015_RicardoSilvaCarvalho.pdf: 12764754 bytes, checksum: 6912c187f6b4d6ea2b4520b7651675e7 (MD5) / Made available in DSpace on 2016-01-26T15:13:56Z (GMT). No. of bitstreams: 1
2015_RicardoSilvaCarvalho.pdf: 12764754 bytes, checksum: 6912c187f6b4d6ea2b4520b7651675e7 (MD5) / A Controladoria-Geral da União (CGU), por meio da Diretoria de Pesquisas e Informa ções Estratégicas (DIE), articula ações de produção de informações estratégicas, investigando possíveis irregularidades cometidas por servidores públicos federais. Com quantitativo reduzido de analistas e inúmeras responsabilidades, a DIE necessita de métodos automatizados aplicáveis a grande volume de dados para aferir corruptibilidade de servidores, buscando assim priorização de trabalho e atuação e caz baseando-se em aspectos
de corrupção. Este trabalho apresenta a aplicação de mineração de dados para gerar modelos preditivos para avaliar risco de corrupção de servidores públicos federais, usando várias bases de dados a que a CGU tem acesso. O processo CRISP-DM é a referência para as fases da mineração de dados. Inicialmente, o conhecimento dos analistas especialistas em combate à corrupção da DIE é aplicado nas diversas bases de dados disponíveis para extração de informações possivelmente úteis na indicação de corruptibilidade. Os dados levantados são analisados e preparados com o uso de diversas técnicas, como discretização e análise de correlação, para, em seguida, passarem por um processo de seleção. Métodos de regressão como Adaptive Lasso e Regressão Ridge são aplicados objetivando a criação de modelos preditivos. O modelo de avaliação de risco de corrupção de servidores públicos federais construído ao nal do trabalho obteve resultados satisfatórios de aproximadamente 85% de sensibilidade, 81% de precisão e 83% de acurácia assim como resultados positivos em testes estatísticos corroborando a validade do modelo com nível de con ança de 95%. Em seguida, as regras geradas pelo modelo nal foram analisadas, adicionando-se o estudo de casos pontuais, de modo a subsidiar a descoberta do conhecimento obtido com o processo de mineração de dados. Com a avaliação de risco de corrupção a partir de modelos preditivos, possibilitouse: uso mais e ciente e e caz de recursos e pessoal da CGU; um impacto nacional; e fortalecimento do controle prévio. O direcionamento de esforços de auditoria e scalização a partir de índices de corruptibilidade sustenta a priorização efetiva de trabalho da CGU. Atinge-se todos os estados do país analisando em larga escala o nível de corrupção dos mais de um milhão de servidores públicos federais, gerando impacto em âmbito nacional. Finalmente, todos os pólos regionais da CGU são apoiados com uma atuação de controle prévio, fortalecendo o combate à corrupção. / The Brazilian O ce of the Comptroller General (CGU), through the Department of
Research and Strategic Information (DIE), articulates activities of strategic information production, investigating possible irregularities by federal civil servants. With a reduced quantitative of analysts and numerous responsibilities, DIE needs automated methods applicable to large volumes of data to assess civil servants' corruptibility, seeking then
work prioritization and e ective action based on aspects of corruption. This work presents a data mining application to generate predictive models to assess
risk of corruption of federal civil servants, using various databases that CGU has access to. The CRISP-DM process is the reference to the phases of the data mining. Initially, the knowledge of DIE's analysts with expertise in ghting corruption is applied in the various databases available to extract potentially useful information in corruptibility
indication. The data collected is analyzed and prepared using various techniques,
such as correlation analysis and discretization, to then pass through a selection process. Regression methods like Adaptive Lasso and Ridge Regression are applied towards the creation of predictive models. The model to assess risk of corruption of civil servants built at the end of the work obtained satisfactory results of approximately 85% sensitivity, 81% precision and 83%
accuracy as well as positive results in statistical tests con rming the relevance of the model with a con dence level of 95%. Then, the rules generated by the nal model were analyzed, aside with the study of individual cases, in order to support the knowledge discovery through the data mining process. The assessment of risk of corruption with predictive models allows: more e cient and e ective use of CGU's resources; a national impact; and strengthening of previous control.
The targeting of audit and control e orts from corruptibility indicators sustains e ective prioritization of the work of CGU. Every state in the country is reached by analyzing in large scale the level of corruption of the more than one million federal civil servants, generating impact nationwide. Finally, all regional centers of CGU are backed with prior control activities, strengthening the ght against corruption.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/19361 |
Date | 21 September 2015 |
Creators | Carvalho, Ricardo Silva |
Contributors | Pianto, Donald Matthew, Carvalho, Rommel Novaes |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB |
Rights | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data., info:eu-repo/semantics/openAccess |
Page generated in 0.0025 seconds