Global ETD Search

Return to search

Uma abordagem baseada em classiﬁcadores de larga margem para geração de dados artiﬁciais em bases desbalanceadas

Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-10-23T16:35:51Z
No. of bitstreams: 1
marceloladeiramarques.pdf: 721811 bytes, checksum: 747d74835ffaa88383924f9f6783667b (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-11-09T13:52:02Z (GMT) No. of bitstreams: 1
marceloladeiramarques.pdf: 721811 bytes, checksum: 747d74835ffaa88383924f9f6783667b (MD5) / Made available in DSpace on 2017-11-09T13:52:02Z (GMT). No. of bitstreams: 1
marceloladeiramarques.pdf: 721811 bytes, checksum: 747d74835ffaa88383924f9f6783667b (MD5)
Previous issue date: 2017-09-01 / O presente trabalho tem como proposta o desenvolvimento de uma abordagem capaz de melhorar os resultados obtidos por algoritmos de classificação quando aplicados em bases desbalanceadas. O método, denominado Algoritmo de Balanceamento Sintético In-cremental (Incremental Synthetic Balancing Algorithm – ISBA), realiza um procedimento iterativo baseado em classificadores de larga margem, visando gerar amostras sintéticas com o intuito de reduzir o nível de desbalanceamento. No processo são utilizados vetores suporte como referência para a geração das novas instâncias, permitindo posicioná-las em regiões com uma maior representatividade. Além disso, a estratégia permite que as novas amostras ultrapassem os limites das amostras utilizadas como referência para sua geração, o que possibilita uma extrapolação dos limites da classe minoritária, objetivando, assim, alcançar um maior reconhecimento dessa classe de interesse. São apresentados experimentos comparativos com demais técnicas, entre elas o Synthetic Minority Over-sampling Technique (SMOTE), os quais fornecem fortes evidências da aplicabilidade da abordagem proposta. / In this work we propose the development of an approach capable of improving the
results obtained by classiﬁcation algorithms when applied to unbalanced datasets. The
method, called Incremental Synthetic Balancing Algorithm (ISBA), performs an iterative
procedure based on large margin classiﬁers, aiming to generate synthetic samples in order
to reduce the level of unbalance. In the process, we use the support vectors as reference
for the generation of new instances, allowing them to be positioned in regions with greater
representativeness. Furthermore, the strategy allows the new samples to exceed the limits
of the samples used as reference for their generation, which allows an extrapolation of
the limits of the minority class, in order to achieve greater recognition of this class of
interest. We present comparative experiments with other techniques, among them the
Synthetic Minority Over-sampling Technique (SMOTE), which provide strong evidence
of the applicability of the proposed approach.

https://repositorio.ufjf.br/jspui/handle/ufjf/5906

CNPQ::CIENCIAS EXATAS E DA TERRA

Aprendizado desbalanceado

Classiﬁcadores de larga margem

Reamostragem

Geração de dados artiﬁciais

Unbalanced learning

Large margin classiﬁers

Oversampling

Synthetic sample generation

Identifer	oai:union.ndltd.org:IBICT/oai:hermes.cpd.ufjf.br:ufjf/5906
Date	01 September 2017
Creators	Marques, Marcelo Ladeira
Contributors	Borges, Carlos Cristiano Hasenclever, Villela, Saulo Moraes, Fonseca Neto, Raul, Braga, Antônio de Pádua
Publisher	Universidade Federal de Juiz de Fora (UFJF), Programa de Pós-graduação em Ciência da Computação, UFJF, Brasil, ICE – Instituto de Ciências Exatas
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	English
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Source	reponame:Repositório Institucional da UFJF, instname:Universidade Federal de Juiz de Fora, instacron:UFJF
Rights	info:eu-repo/semantics/openAccess

Page generated in 0.0028 seconds

Uma abordagem baseada em classiﬁcadores de larga margem para geração de dados artiﬁciais em bases desbalanceadas

Description

Links & Downloads

Tags

Additional Fields