Return to search

Visualização de dados como ferramenta de classificação em sistemas de bases de dados para Data Mining / Using data visualization to perform classification tasks in database management systems

A automação das atividades em diversas áreas, tais como negócios, engenharia, medicina, ciência e governo, vêm aumentando a cada dia, e com isso, cresce o volume de dados armazenados nas bases de dados. É interessante usar esses dados além dos objetivos originais das operações de pura armazenagem e busca do empreendimento inicial. Em outras palavras, é desejável extrair informações úteis, não previstas inicialmente, agregando valor ao empreendimento. Embora os gerenciadores de bases de dados forneçam ferramentas básicas para recuperação de dados em transações padrão em grandes quantidades de dados, analisar grandes volumes de dados em formato numérico ou textual, especialmente em espaços de altas dimensões, não é fácil para o ser humano. Por outro lado, o ser humano tem uma capacidade de absorver e entender informação representada de forma gráfica muito rapidamente. Dessa forma, este trabalho visa o desenvolvimento de uma nova técnica para construção visual de classificadores de dados em atividades de Data Mining, utilizando essa reconhecidamente elevada capacidade humana de análise de dados representados em formato gráfico como fator que auxilia o treinamento do classificador. Este trabalho estende a ferramenta FastMapDB, que em sua versão original permitia apenas a visualização de dados e não possibilitava ao usuário interferir no processo de visualização, para permitir, não apenas essa visualização de dados, mas também, a seleção visual dos objetos mapeados e a delimitação de regiões de objetos na visualização. Com isso, a ferramenta passa a permitir a recuperação dos dados presentes na base de dados que o usuário considerar interessantes a partir da visualização, e provê à ferramenta recursos de classificação de novos objetos segundo regras visuais que o usuário possa definir no espaço mapeado de visualização. A proposta deste trabalho é inédita no sentido de aplicar técnicas de visualização como fator de treinamento do classificador. As ferramentas atuais apenas mostram resultados já elaborados pelo sistema, e a continuação do processo é sempre solicitada, ou decidida manualmente, pelo usuário. Nosso sistema, ao contrário, realimenta a interpretação que o usuário pode fazer a respeito dos dados, e permite que os passos de análise seguintes utilizem automaticamente esse resultado. / The automation of the activities in several areas, sueh as business, engineering, medicine, science and government, are increasing everyday, pressing, the volume of data stored in the databases to grow exponentially. It is interesting to make use of these data beyond the original objectives of the enterprise. Moreover, it is desirable to extract useful information not previously foreseen, aggregating value to the enterprise. Although the database management systems supply basic tools to data recovery and analysis through the standard transactions in large amounts of data, analyzing these data in numerical or textual format, especially in spaces of high dimensions, is an overwhelming job to human beings. On the other hand, human being has a great capacity to quickly absorb and understand information represented of graphical form. As classification is one of the most common analysis tasks, this work aims at the development of a new technique for the visual construction of classifiers, using this high human capacity to analyze data represented in graphical format as factor to guide the training of the classifier. This work extends the FastMapDB tool, that in its original version allowed only the visualization of data and it did not make possible the user to interfere in the visualization process, to allow not only this visualization of data, but also, the reverse identification of mapped objects and the delimitation of object regions in the visualization. This makes it possible to recover the data present in the database that the user consider interesting from the visualization, and providing to the tool visual resources for classification of the new objects according to rules that the user can define in the mapped space of visualization. The proposal of this work is new in regarding to apply visualization techniques as a factor to train the classifier. Existing tools are restricted to show results already discovered by the system. Our system, in contrast, takes advantages from the interpretation obtained from the user will through its interaction with the visualizations presented, and allows that subsequent data analysis tasks automatically use these results.

Identiferoai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-02062015-090709
Date09 August 2002
CreatorsBotelho, Elisângela
ContributorsTraina Junior, Caetano
PublisherBiblioteca Digitais de Teses e Dissertações da USP
Source SetsUniversidade de São Paulo
LanguagePortuguese
Detected LanguagePortuguese
TypeDissertação de Mestrado
Formatapplication/pdf
RightsLiberar o conteúdo para acesso público.

Page generated in 0.0028 seconds