Data Mining refere-se ao processo de análise de dados e à aplicação de algoritmos que, mediante limitações de eficiência computacional aceitáveis, são capazes de produzir uma relação particular de padrões a partir de grandes massas de dados [Fayyad, 19964 A utilização desse processo em problemas do mundo real consiste na classificação dos dados, sejam eles categóricos ou contínuos. Problemas envolvendo dados categóricos são comumente denominados de problemas de classificação, enquanto que os dados contínuos são denominados de/problemas de regressão. Problemas do mundo real consistem geralmente de problemas de regressão. Dessa forma, cresce o interesse em utilizar o processo Data Mining para extrair padrões de problemas de regressão. Além da extração, esses padrões devem ser posteriormente analisados segundo algumas medidas de avaliação de conhecimento para determinar se o padrão é preciso, compreensível ou de interesse ao usuário. Para explorar esse processo de avaliação do conhecimento em problemas de regressão, são realizados, neste trabalho, experimentos com conjuntos de diferentes domínios e características utilizando o ambiente RREvaluation O RREvaluation tem a finalidade de apoiar os usuários do processo Data Mining na análise do conhecimento extraído de problemas de regressão. O ambiente RREvaluation aqui proposto permite a utilização de diversas formas de avaliação da precisão utilizando as medidas MSE, MAD e NMSE. A compreensibilidade através da identificação do número de condições da regra e da função matemática envolvida, assim como algumas medidas de interessabilidade como GanhoMAD, LC e Q. / This process is used in real-world problems to classify data, whether it is categorical data or continuous data. Problems that involve categorical data are commonly called classification problems, while problems that involve continuous data are called regression problems. Realworld problems generally consist of regression problema Because of this, there is an increasing interest in the use of DM to extract patterns from regression problems. Along with their extraction, these patterns should also be analyzed according to some knowledge evaluation measurements to determine if the pattern is precise, comprehensible or of interest to the user. To explore this knowledge evaluation process in regression problems, experiments are executed on different domains with various characteristics using the RREvaluation environment. RREvaluation has as its main objective to suppoit the users of the DM process in the analysis of the knowledge extracted from regression problems. The proposed environment maltes it possible to use several forms of evaluating precision, using the MSE, MAD and NMSE measures. The comprehensibility can also be evaluated, by identifying the number of conditions in the rule and the mathematical function involved, as well as using some interestingness measures such as MADGain, LC and Q.
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-01032018-165127 |
Date | 05 October 2000 |
Creators | Nagai, Walter Aoiama |
Contributors | Rezende, Solange Oliveira |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | Portuguese |
Type | Dissertação de Mestrado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.002 seconds