Return to search

Comitê de classificadores em bases de dados transacionais desbalanceadas com seleção de características baseada em padrões minerados

Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-05-30T14:42:33Z
No. of bitstreams: 1
camilamariacampos.pdf: 929528 bytes, checksum: ebea02fc47981edfa166a24d9c1d7be2 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-05-30T15:36:24Z (GMT) No. of bitstreams: 1
camilamariacampos.pdf: 929528 bytes, checksum: ebea02fc47981edfa166a24d9c1d7be2 (MD5) / Made available in DSpace on 2017-05-30T15:36:24Z (GMT). No. of bitstreams: 1
camilamariacampos.pdf: 929528 bytes, checksum: ebea02fc47981edfa166a24d9c1d7be2 (MD5)
Previous issue date: 2016-01-29 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Os resultados dos problemas de classificação por regras de associação sofrem grande
influência da estrutura dos dados que estão sendo utilizados. Uma dificuldade na área é a
resolução de problemas de classificação quando se trata de bases de dados desbalanceadas.
Assim, o presente trabalho apresenta um estudo sobre desbalanceamento em bases de
dados transacionais, abordando os principais métodos utilizados na resolução do problema
de desbalanceamento.
Além disso, no que tange ao desbalanceamento, este trabalho propõe um modelo para
realizar o balanceamento entre classes, sendo realizados experimentos com diferentes mé-
todos de balanceamento e métodos ensemble, baseados em comitê de classificadores. Tais
experimentos foram realizados em bases transacionais e não transacionais com o intuito
de validar o modelo proposto e melhorar a predição do algoritmo de classificação por
regras de associação. Bases de dados não transacionais também foram utilizadas nos ex
perimentos, com o objetivo de verificar o comportamento do modelo proposto em tais
bases.
Outro fator importante no processo de classificação é a dimensão da base de dados que,
quando muito grande, pode comprometer o desempenho dos classificadores. Neste traba
lho, também é proposto um modelo de seleção de características baseado na classificação
por regras de associação. Para validar o modelo proposto, também foram realizados ex-
perimentos aplicando diferentes métodos de seleção nas bases de dados. Os resultados da
classificação obtidos utilizando as bases contendo as características selecionadas pelos me-
todos, foram comparados para validar o modelo proposto, tais resultados apresentaram-se
satisfatórios em relação aos demais métodos de seleção. / The results of Classification Based on Associations Rules (CBA) are greatly influenced
by the used data structure. A difficulty in this area is solving classification problems
when it comes to unbalanced databases. Thus, this paper presents a study of unbalance
in transactional and non-transactional databases, addressing the main methods used to
solve the unbalance problem.
In addition, with respect to the unbalance problem, this paper proposes a model
to reach the balance between classes, conducting experiments with different methods
of balancing and ensemble methods based on classifiers committee. These experiments
were performed in transactional and non-transactional databases, in order to validate the
proposed model and improve Classification Based on Associations Rules prediction.
Another important factor in the classification process is database dimensionality, be
cause when too large, it can compromise the classifiers performance. In this work, it is
also proposed a feature selection model based on the rules of CBA. Aiming to validate this
model, experiments were also performed applying different features selection methods in
the databases.The classification results obtained using the bases containing the features
selected by the methods were compared to validate the proposed model, these results were
satisfactory in comparison with other methods of selection.

Identiferoai:union.ndltd.org:IBICT/oai:hermes.cpd.ufjf.br:ufjf/4766
Date29 January 2016
CreatorsCampos, Camila Maria
ContributorsBorges, Carlos Cristiano Hasenclever, Menezes, Victor Ströele de Andrade, Bernardino, Heder Soares, Pitangui, Cristiano Grijó
PublisherUniversidade Federal de Juiz de Fora (UFJF), Programa de Pós-graduação em Ciência da Computação, UFJF, Brasil, ICE – Instituto de Ciências Exatas
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFJF, instname:Universidade Federal de Juiz de Fora, instacron:UFJF
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.003 seconds