Return to search

Desenvolvimento de técnicas de seleção de atributos no contexto da classificação hierárquica monorrótulo.

Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. / Submitted by Marise Leite (marise_mg@yahoo.com.br) on 2016-03-21T15:04:55Z
No. of bitstreams: 2
license_rdf: 23748 bytes, checksum: b92763cfc0af52c7c868455edfaf3266 (MD5)
DISSERTAÇÃO_DesenvolvimentoTécnicasSeleção.pdf: 1727478 bytes, checksum: ed2ee4abaae76a146068a3c08700af4e (MD5) / Approved for entry into archive by Gracilene Carvalho (gracilene@sisbin.ufop.br) on 2016-03-22T13:57:02Z (GMT) No. of bitstreams: 2
license_rdf: 23748 bytes, checksum: b92763cfc0af52c7c868455edfaf3266 (MD5)
DISSERTAÇÃO_DesenvolvimentoTécnicasSeleção.pdf: 1727478 bytes, checksum: ed2ee4abaae76a146068a3c08700af4e (MD5) / Made available in DSpace on 2016-03-22T13:57:02Z (GMT). No. of bitstreams: 2
license_rdf: 23748 bytes, checksum: b92763cfc0af52c7c868455edfaf3266 (MD5)
DISSERTAÇÃO_DesenvolvimentoTécnicasSeleção.pdf: 1727478 bytes, checksum: ed2ee4abaae76a146068a3c08700af4e (MD5)
Previous issue date: 2015 / A seleção de atributos, tradicionalmente adotada como uma etapa de pré-processamento dos dados, tem como objetivo principal identificar os atributos relevantes para a tarefa de classificação. No entanto, para o cenário de classificação hierárquica, onde as classes a serem preditas estão estruturadas de acordo com uma hierarquia, poucos trabalhos na literatura apresentam propostas de técnicas de seleção de atributos. Mais especificamente,
para problemas de classificação hierárquica monorrótulo, não foram encontradas na literatura técnicas de seleção de atributos que possam ser utilizadas em conjunto com classificadores hierárquicos globais, ou seja, classificadores que são treinados levando-se em consideração toda a hierarquia de classes de uma só vez.
Desse modo, neste trabalho propomos uma adaptação da medida Incerteza Simétrica (Symmetrical Uncertainty { SU) para permitir que ela possa ser utilizada em técnicas de
seleção de atributos para problemas de classificação hierárquica monorrótulo que usam
classificadores hierárquicos globais. Posteriormente, utilizamos essa adaptação proposta,
denominada Incerteza Simétrica Hierárquica (Hierarchical Symmetrical Uncertainty
{ SUH), em duas técnicas distintas de seleção de atributos: uma que faz uso da
abordagem Filtro e outra que segue uma abordagem Híbrida (Filtro e Wrapper). A
técnica que implementa a abordagem Híbrida corresponde a uma heurística que utiliza o
classificador hierárquico Global-Model Naive Bayes (GMNB) para avaliar os subconjuntos
de atributos.
A partir das duas técnicas de seleção de atributos propostas neste trabalho, pudemos
verificar a adequação da adaptação da medida SU para o cenário hierárquico. Além disso, o método heurístico proposto, nomeado como Hybrid Feature Selection for Hierarchical
Classification (HFS4HC), apresentou resultados bastante promissores para o contexto
da classificação hierárquica monorrótulo. ____________________________________________________________________________________________________________________ / ABSTRACT: Feature selection, usually adopted as a preprocessing step, aims at identifying as much relevant features as possible with the goal of improving classification accuracy. However,
for hierarchical classification scenario, where the classes to be predicted are arranged in a hierarchy, there are few studies in literature that address feature selection techniques. More specifically, for hierarchical single-label classification problems, to the best of our knowledge, there is no work in the literature that addresses feature selection in conjunction with global hierarchical classifiers.
Thus, in this work we propose an adaptation of the measure Symmetrical Uncertainty (SU) to allow it to be used in feature selection techniques for hierarchical single label classification problems using global hierarchical classifiers. Thereafter, we used this adaptation proposal called Hierarchical Symmetrical Uncertainty (SUH) in two distinct techniques for feature selection: one makes use of the filter approach and another follows a hybrid approach (filter and wrapper). The technique that implements a hybrid approach corresponds to a heuristic that uses the hierarchical classifier Global-Model Naive Bayes (GMNB) for assessing the feature subsets.
From the two feature selection techniques proposed in this work, we could verify the appropriateness of the measure SU tailored to hierarchical context. Besides, the proposed heuristic method, called Hybrid Feature Selection for Hierarchical Classification (HFS4HC), presented promising results for the context of hierarchical single label classification.

Identiferoai:union.ndltd.org:IBICT/oai:localhost:123456789/6341
Date January 2015
CreatorsDias, Thieres Nardy
ContributorsMerschmann, Luiz Henrique de Campos
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFOP, instname:Universidade Federal de Ouro Preto, instacron:UFOP
RightsAutorização concedida ao Repositório Institucional da UFOP pelo autor, 18/03/2016, com as seguintes condições: disponível sob Licença Creative Commons 4.0, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante., info:eu-repo/semantics/openAccess

Page generated in 0.0099 seconds