Return to search

Sobre o processo de seleção de subconjuntos de atributos - as abordagens filtro e wrapper.

Made available in DSpace on 2016-06-02T19:06:20Z (GMT). No. of bitstreams: 1
DissDMS.pdf: 4319162 bytes, checksum: 520f8924dcc0b2471665008a2ea3ec5a (MD5)
Previous issue date: 2005-04-28 / Universidade Federal de Sao Carlos / Inductive machine learning methods learn the expression of the concept from a
training set. Training sets are, generally, composed by instances described by attributevalue
pairs and an associated class. The attribute set used for describing the training
instances has a strong impact on the induced concepts.
In a machine learning environment, attribute subset selection techniques aim at the
identification of the attributes which effectively contribute for establishing the class of
an instance. These techniques can be characterized as wrappers (if they are associated
with a specific machine learning method) or filter and many of them work in
conjunction with a search method (there are also embedded feature selection methods,
not very representative).
This work approaches the attribute subset selection problem by investigating the
performance of two families of wrappers the NN (Nearest Neighbor) and DistAl
families and three filter families Relief, Focus and LVF. The many members of the
NN family (as well as of the DistAl family) differ among themselves with relation to the
search method they use.
The work presents and discusses the experiments conducted in many knowledge
domains and their results allow a comparative evaluation (as far as accuracy and
dimensionality are concerned) among the members of the families. / Métodos indutivos de aprendizado de máquina aprendem a expressão do conceito a
partir de um conjunto de treinamento. Conjuntos de treinamento são, na maioria das
vezes, compostos por instâncias descritas por pares atributo-valor e uma classe
associada. O conjunto de atributos usado para descrever as instâncias de treinamento
tem um forte impacto na expressão induzida do conceito.
As técnicas para a seleção de subconjuntos de atributos no contexto de aprendizado
de máquina objetivam identificar os atributos que efetivamente contribuem para a
caracterização da classe de uma instância. Essas técnicas podem ser caracterizadas
como do tipo wrapper (se estão associadas a um método específico de aprendizado de
máquina) ou filtro e muitas delas funcionam articuladas a um método de busca (há ainda
o tipo integrado, pouco representativo).
Este trabalho aborda o problema de seleção de subconjuntos de atributos por meio
da investigação do desempenho de duas famílias de wrappers a família NN (Neareast
Neighbor) e a DistAl e de três famílias de filtros Relief, Focus e LVF. Os vários
integrantes da família NN (bem como da família DistAl) diferem entre si com relação
ao método de busca utilizado.
O trabalho apresenta e discute os experimentos realizados em vários domínios de
conhecimento e seus resultados permitem uma avaliação comparativa de desempenho
(precisão e dimensionalidade) dos elementos das várias famílias avaliadas.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufscar.br:ufscar/594
Date28 April 2005
CreatorsSantoro, Daniel Monegatto
ContributorsNicoletti, Maria do Carmo
PublisherUniversidade Federal de São Carlos, Programa de Pós-graduação em Ciência da Computação, UFSCar, BR
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Repositório Institucional da UFSCAR, instname:Universidade Federal de São Carlos, instacron:UFSCAR
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0017 seconds