Dissertação (mestrado)—Universidade de Brasília, Programa de Pós-Graduação em Informática, Brasília, 2011. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2012-04-30T15:28:14Z
No. of bitstreams: 1
2011_RafaelMarconiRamos.pdf: 2007231 bytes, checksum: 23d42fc7a881bec60f049721e3e346b1 (MD5) / Approved for entry into archive by Elzi Bittencourt(elzi@bce.unb.br) on 2012-05-01T13:24:20Z (GMT) No. of bitstreams: 1
2011_RafaelMarconiRamos.pdf: 2007231 bytes, checksum: 23d42fc7a881bec60f049721e3e346b1 (MD5) / Made available in DSpace on 2012-05-01T13:24:20Z (GMT). No. of bitstreams: 1
2011_RafaelMarconiRamos.pdf: 2007231 bytes, checksum: 23d42fc7a881bec60f049721e3e346b1 (MD5) / O Ministério do Desenvolvimento Agrário – MDA, através da Secretaria de Agricultura Familiar – SEAF, possui estrutura e metodologia para acompanhamento dos agricultores familiares assistidos por programas governamentais como o PRONAF. A safra esperada pode ser segurada por
meio de um agente financeiro (banco) com carteira agrícola. Quando um agricultor acredita que teve perdas na safra, recorre ao banco solicitando pagamento de seguro agrícola. O banco então emite um Comunicado de Ocorrência de Perda – COP para o Banco Central. Em geral eles são pagos sem averiguação. Se o agricultor alegou perdas e solicitou o pagamento do seguro agrícola, no laudo emitido após a colheita, constará a informação da emissão de COP. Essa pesquisa propõe um método automático que viabilize analisar um maior número de COP, contribuindo para minimizar os custos do pagamento de COP indevidas, sem ser necessário ampliar os atuais recursos
humanos disponíveis na SEAF. O método proposto é baseado na construção de modelos com técnica de inteligência artificial para inferir se há evidências de que pode ocorrer COP, a partir dos
dados dos laudos obtidos pelo MDA para as safras de agricultura familiar dos anos de 2006 a 2010, totalizando 11.743 registros. Com a aplicação de técnicas estatísticas foram selecionados 19
atributos dentre os 311 atributos coletados por meio dos laudos. A partir desses 19 atributos foram construídas regras de associação e classificadores para COP. As regras de associação foram obtidas
com o algoritmo “Apriori” e os modelos de classificação foram baseados na construção de classificadores probabilísticos (Naive Bayes e árvore de inferência condicional), árvore de decisão
(C4.5) e máquina de vetores de suporte (SVM). Os classificadores construídos foram considerados isoladamente e em comitês, constituídos multiclassificadores com as técnicas de votação, boosting e bagging. Foram propostas novas abordagens para construção de multiclassificadores baseados em disjunção, ponderação pelos índices de desempenho e cascata. Todos os classificadores foram avaliados com as métricas de sensibilidade, especificidade, acurácia e F-measure, além da análise
de curva ROC. Os resultados obtidos dão suporte experimental para se concluir que os multiclassificadores propostos – disjunção, ponderação e cascata – apresentam melhor desempenho para esse tipo de problema do que os obtidos com a abordagem tradicional, tendo alcançado o índice de 0,944 para AUC. ______________________________________________________________________________ ABSTRACT / The Ministry of Agrarian Development in Brazil (MDA), through the Secretariat for Family Agriculture (SEAF), has structure and methodology to monitor family farmers through the government program known as National Program for the Strengthening of Family Agriculture
(PRONAF). The SEAF is responsible by PRONAF. The expected crop can be insured by a commercial bank with agricultural portfolio. When a farmer believes that has a loss of crop, he can
request the bank the payment of the crop insurance. The bank issues a Communication of Occurrence of Losses - COP to the Central Bank of Brazil. If the farmer claimed losses and sought payment of the crop insurance, the technical report issued after the harvest, contains the information
of COP. This research proposes an automatic method that allows the analyses of a larger number of occurrences of COP, contributing to minimize the costs of undue payment of COPs, without the
need to expand the current technical staff of SEAF. The proposed method is based on building models which uses artificial intelligence techniques in order to conclude if there are enough
evidence that COPs can occurs. Those models are built based on data extracted from technical reports about the family farm harvests in the years from 2006 to 2010. The results obtained in this
research were based on 11,743 of these technical reports available in the MDA. With the application of statistical analysis the 19 attributes more relevant, among the 311 attributes available, were identified. Based on the 19 more relevant attributes, association rules and classifiers were built to identify the possibility of occurrence of COP. The association rules were obtained with the Apriori algorithm and the models for classification were built with probabilistic classifiers (Naive
Bayes), decision tree (C4.5), and Support Vector Machine (SVM). The classifiers were considered alone and in committees. A classifier formed by a committee of classifiers was called multi-
classifier. The last one used the techniques of vote, boosting and bagging. New proposals have been made for the construction of multi-classifiers based on disjunction of simple classifiers, the weighting of individual performance indicators, and on making a cascade of a set of simple classifiers. Both the classifiers and the multi-classifiers were evaluated with the metrics of
sensitivity, specificity, accuracy, F-measure, and analysis of ROC curve. The results achieved provide experimental support for concluding that our multi-classifiers proposed have had better performance on this task than those obtained with the traditional approach. The better performance
index achieved by our best multi-classifier was 0.944 for AUC.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/10355 |
Date | 28 June 2011 |
Creators | Ramos, Rafael Marconi |
Contributors | Ladeira, Marcelo |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.003 seconds