Global ETD Search

Return to search

Um algoritmo evolutivo para indu??o de ?rvores de regress?o robusto a valores ausentes

Made available in DSpace on 2015-04-14T14:50:16Z (GMT). No. of bitstreams: 1
461465.pdf: 5428729 bytes, checksum: d0627f774922501baa685975c40465f5 (MD5)
Previous issue date: 2014-08-22 / A common concern in many fields of knowledge involves problems of low quality data, such as noise and missing data. In the machine learning area, for example, missing data has generated serious problems in the knowledge extraction process, hiding important information about the dataset, skewing results and affecting the accuracy of the induced models. In order to deal with these problems, much has been discussed in the literature about missing values treatment strategies, either by preprocessing tasks or by the implementation of robust algorithms to missing data. In this thesis, we introduce a new evolutionary algorithm for induction of regression trees, including multiple strategies in its evolutionary cycle for dealing with missing data. Aiming to make a comparative analysis, we evaluated six traditional regression algorithms over 10 public datasets artificially modified to present different levels of missing data. Results from the experimental analysis show that the proposed solution presents a good trade-off between model interpretability and predictive performance, especially for datasets with more than 40% of missing data. / Uma preocupa??o comum em muitas ?reas do conhecimento envolve problemas de baixa qualidade de dados, tais como ru?dos e dados ausentes. Na ?rea de aprendizado de m?quina, por exemplo, dados ausentes t?m gerado s?rios problemas no processo de extra??o de conhecimento, ocultando importantes informa??es sobre o dataset, enviesando resultados e afetando o desempenho preditivo dos modelos induzidos. Para lidar com esse problema, muito tem se discutido na literatura sobre estrat?gias de tratamento, seja por pr?-processamento ou por meio do desenvolvimento de algoritmos robustos a dados ausentes. Neste trabalho, prop?e-se um novo algoritmo evolutivo para indu??o de ?rvores de regress?o, agregando em seu ciclo evolutivo m?ltiplas estrat?gias para lidar com dados ausentes. Com o objetivo de fazer uma an?lise comparativa, foram avaliados 6 tradicionais algoritmos de regress?o, considerando para tanto, 10 datasets artificialmente modificados para manterem diferentes n?veis de dados ausentes. Resultados da an?lise experimental mostram que a solu??o proposta apresenta uma boa rela??o custo-benef?cio entre compreensibilidade dos modelos e desempenho preditivo, especialmente para as bases de dados com mais de 40% de dados ausentes.

http://tede2.pucrs.br/tede2/handle/tede/5266

INFORM?TICA

APRENDIZAGEM DE M?QUINA

ALGORITMOS (PROGRAMA??O)

Identifer	oai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/5266
Date	22 August 2014
Creators	Blomberg, Luciano Costa
Contributors	Ruiz, Duncan Dubugras Alcoba
Publisher	Pontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, BR, Faculdade de Inform?ca
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	Portuguese
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Format	application/pdf
Source	reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS
Rights	info:eu-repo/semantics/openAccess
Relation	1974996533081274470, 500, 600, 1946639708616176246

Page generated in 0.002 seconds

Um algoritmo evolutivo para indu??o de ?rvores de regress?o robusto a valores ausentes

Description

Links & Downloads

Tags

Additional Fields