Return to search

Similaridade de algoritmos em cenários sensíveis a custo

Submitted by Irene Nascimento (irene.kessia@ufpe.br) on 2016-09-06T17:26:12Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertação Mestrado- Carlos Eduardo Castor de Melo.pdf: 2325318 bytes, checksum: 1a456db1f76d03f35cc83b12a6026b6b (MD5) / Made available in DSpace on 2016-09-06T17:26:12Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertação Mestrado- Carlos Eduardo Castor de Melo.pdf: 2325318 bytes, checksum: 1a456db1f76d03f35cc83b12a6026b6b (MD5)
Previous issue date: 2015-08-27 / FACEPE / análise da similaridade entre algoritmos de aprendizagem de máquina é um importante
aspecto na área de Meta-Aprendizado, onde informações obtidas a partir de processos de
aprendizagem conhecidos podem ser utilizadas para guiar a seleção de algoritmos para tratar
novos problemas apresentados. Essa similaridade é geralmente calculada através de métricas
globais de desempenho, que omitem informações importantes para o melhor entendimento do
comportamento dos algoritmos. Também existem abordagens onde é verificado o desempenho
individualmente em cada instância do problema. Ambas as abordagens não consideram os
custos associados a cada classe do problema, negligenciando informações que podem ser muito
importantes em vários contextos de aprendizado.
Nesse trabalho são apresentadas métricas para a avaliação do desempenho de algoritmos
em cenários sensíveis a custo. Cada cenário é descrito a partir de um método para escolha de
limiar para a construção de um classificador a partir de um modelo aprendido. Baseado nos
valores de desempenho em cada instância, é proposta uma forma de avaliar a similaridade entre
os algoritmos tanto em nível de problema como em nível global.
Os experimentos realizados para ilustrar as métricas apresentadas neste trabalho foram
realizados em um estudo de Meta-Aprendizado utilizando 19 algoritmos para a classificação das
instâncias de 152 problemas. As medidas de similaridades foram utilizadas para a criação de
agrupamentos hierárquicos.
Os agrupamentos criados mostram como o comportamento entre os algoritmos diversifica
de acordo com o cenário de custo a ser tratado. / The analysis of the similarity between machine learning algorithms is an important aspect
of Meta-Learning, where knowledge gathered from known learning processes can be used to
guide the selection of algorithms to tackle new learning problems presented. This similarity is
usually calculated through global performance metrics that omit important information about the
algorithm behavior. There are also approaches where the performance is verified individually on
each instance of a problem. Both these approaches do not consider the costs associated with each
problem class, hence they neglect information that can be very important in different learning
contexts.
In this study, metrics are presented to evaluate the performance of algorithms in cost
sensitive scenarios. Each scenario is described by a threshold choice method, used to build
a crisp classifier from a learned model. Based on the performance values for each problem
instance, it is proposed a method to measure the similarity between the algorithms in a local
level (for each problem) and in a global level (across all problems observed).
The experiments used to illustrate the metrics presented in this paper were performed in
a Meta-Learning study using 19 algorithms for the classification of the instances of 152 learning
problems. The similarity measures were used to create hierarchical clusters.
The clusters created show how the behavior of the algorithms diversifies according to the
cost scenario to be treated.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/17808
Date27 August 2015
CreatorsMELO, Carlos Eduardo Castor de
Contributorshttp://lattes.cnpq.br/2984888073123287, PRUDÊNCIO, Ricardo Bastos Cavalcante
PublisherUniversidade Federal de Pernambuco, Programa de Pos Graduacao em Ciencia da Computacao, UFPE, Brasil
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
RightsAttribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess

Page generated in 0.0154 seconds