Return to search

Algoritmo evolutivo multi-objetivo em tabelas para seleção de variáveis em classificação multivariada / Multi-objective evolutionary algorithm on tables for variable selection in multivariate classification

Submitted by Luanna Matias (lua_matias@yahoo.com.br) on 2015-04-01T14:19:27Z
No. of bitstreams: 2
Dissertação - Lucas de Almeida Ribeiro - 2014.pdf: 6237054 bytes, checksum: 085446421b01a7e7b9174daf3da9b192 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Luanna Matias (lua_matias@yahoo.com.br) on 2015-04-01T15:19:35Z (GMT) No. of bitstreams: 2
Dissertação - Lucas de Almeida Ribeiro - 2014.pdf: 6237054 bytes, checksum: 085446421b01a7e7b9174daf3da9b192 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2015-04-01T15:19:35Z (GMT). No. of bitstreams: 2
Dissertação - Lucas de Almeida Ribeiro - 2014.pdf: 6237054 bytes, checksum: 085446421b01a7e7b9174daf3da9b192 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Previous issue date: 2014-10-29 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This work proposes the use of multi-objective evolutionary algorithm on tables (AEMT)
for variable selection in classification problems, using linear discriminant analysis. The
proposed algorithm aims to find minimal subsets of the original variables, robust classifiers
that model without significant loss in classification ability. The results of the classifiers
modeled by the solutions found by this algorithm are compared in this work to
those found by mono-objective formulations (such as PLS, APS and own implementations
of a Simple Genetic Algorithm) and multi-objective formulations (such as the simple
genetic algorithm multi -objective - MULTI-GA - and the NSGA II). As a case study,
the algorithm was applied in the selection of spectral variables for classification by linear
discriminant analysis (LDA) of samples of biodiesel / diesel. The results showed that the
evolutionary formulations are solutions with a smaller number of variables (on average)
and a better error rate (average) and compared to the PLS APS. The formulation of the
AEMT proposal with the fitness functions: medium risk classification, number of selected
variables and number of correlated variables in the model, found solutions with a lower
average errors found by the NSGA II and the MULTI-GA, and also a smaller number of
variables compared to the multi-GA. Regarding the sensitivity to noise the solution found
by AEMT was less sensitive than other formulations compared, showing that the AEMT
is more robust classifiers. Finally shows the separation regions of classes, based on the
dispersion of samples, depending on the selected one of the solutions AEMT, it is noted
that it is possible to determine variables of regions split from the selected variables. / Este trabalho propõe o uso do algoritmo evolutivo multi-objetivo em tabelas (AEMT)
para a seleção de variáveis em problemas de classificação, por meio de análise discriminante
linear. O algoritmo proposto busca encontrar subconjuntos mínimos, das variáveis
originais, que modelem classificadores robustos, sem perda significativa na capacidade
de classificação. Os resultados dos classificadores modelados pelas soluções encontradas
por este algoritmo são comparadas, neste trabalho, às encontradas por formulações
mono-objetivo (como o PLS, o APS e implementações próprias de um Algoritmo Genético
Simples) e formulações multi-objetivos (como algoritmo genético multi-objetivo
simples - MULTI-GA - e o NSGA II). Como estudo de caso, o algoritmo foi aplicado na
seleção de variáveis espectrais, para a classificação por análise discriminante linear (LDA
- Linear Discriminant Analysis), de amostras de biodiesel/diesel. Os resultados obtidos
mostraram que as formulações evolutivas encontram soluções com um menor número de
variáveis (em média) e uma melhor taxa de erros (média) se comparadas ao PLS e o APS.
A formulação do AEMT proposta com as funções de aptidão: risco médio de classificação,
número de variáveis selecionadas e quantidade de variáveis correlacionadas presentes no
modelo, encontrou soluções com uma média de erros inferior as encontradas pelo NSGA
II e pelo MULTI-GA, e também uma menor quantidade de variáveis se comparado ao
MULTI-GA. Em relação à sensibilidade a ruídos a solução encontrada pelo AEMT se
mostrou menos sensível que as outras formulações comparadas, mostrando assim que o
AEMT encontra classificadores mais robustos. Por fim, são apresentadas as regiões de
separação das classes, com base na dispersão das amostras, em função das variáveis selecionadas
por uma das soluções do AEMT, nota-se que é possível determinar regiões de
separação a partir das variáveis selecionadas.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.bc.ufg.br:tede/4405
Date29 October 2014
CreatorsRibeiro, Lucas de Almeida
ContributorsSoares, Anderson da Silva, Soares, Anderson da Silva, Coelho, Clarimar José, Federson, Fernando Marques
PublisherUniversidade Federal de Goiás, Programa de Pós-graduação em Ciência da Computação (INF), UFG, Brasil, Instituto de Informática - INF (RG)
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UFG, instname:Universidade Federal de Goiás, instacron:UFG
Rightshttp://creativecommons.org/licenses/by-nc-nd/4.0/, info:eu-repo/semantics/openAccess
Relation-3303550325223384799, 600, 600, 600, 600, -7712266734633644768, 1231144342511031835, 2075167498588264571

Page generated in 0.0028 seconds