Global ETD Search

Return to search

Abordagens evolutivas para agrupamento relacional de dados / Evolutionary approaches to relational data clustering

O agrupamento de dados é uma técnica fundamental em aplicações de diversos campos do mercado e da ciência, como, por exemplo, no comércio, na biologia, na psiquiatria, na astronomia e na mineração da Web. Ocorre que em um subconjunto desses campos, como engenharia industrial, ciências sociais, engenharia sísmica e recuperação de documentos, as bases de dados são usualmente descritas apenas pelas proximidades entre os objetos (denominadas bases de dados relacionais). Mesmo em aplicações nas quais os dados não são naturalmente relacionais, o uso de bases relacionais permite que os dados em si sejam mantidos sob sigilo, o que pode ser de grande valia para bancos ou corretoras, por exemplo. Nesta dissertação é apresentada uma revisão de algoritmos de agrupamento de dados que lidam com bases de dados relacionais, com foco em algoritmos que produzem partições rígidas (hard ou crisp) dos dados. Particular ênfase é dada aos algoritmos evolutivos, que têm se mostrado capazes de resolver problemas de agrupamento de dados com relativa acurácia e de forma computacionalmente eficiente. Nesse contexto, propõe-se nesta dissertação um novo algoritmo evolutivo de agrupamento capaz de operar sobre dados relacionais e também capaz de estimar automaticamente o número de grupos nos dados (usualmente desconhecido em aplicações práticas). É demonstrado empiricamente que esse novo algoritmo pode superar métodos tradicionais da literatura em termos de eficiência computacional e acurácia / Data clustering is a fundamental technique for applications in several fields of science and marketing, as commerce, biology, psychiatry, astronomy, and Web mining. However, in a subset of these fields, such as industrial engineering, social sciences, earthquake engineering, and retrieval of documents, datasets are usually described only by proximities between their objects (called relational datasets). Even in applications where the data are not naturally relational, the use of relational datasets preserves the datas secrecy, which can be of great value to banks or brokers, for instance. This dissertation presents a review of data clustering algorithms which deals with relational datasets, with a focus on algorithms that produce hard or crisp partitions of data. Particular emphasis is given to evolutionary algorithms, which have proved of being able to solve problems of data clustering accurately and efficiently. In this context, we propose a new evolutionary algorithm for clustering able to operate on relational datasets and also able to automatically estimate the number of clusters (which is usually unknown in practical applications). It is empirically shown that this new algorithm can overcome traditional methods described in the literature in terms of computational efficiency and accuracy

http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08042010-150736/

Abordagens evolutivas

Agrupamento de dados relacionais

Estimação do número de grupos

Estimation of the number of clusters

Evolutionary approaches

Relational data clustering

Identifer	oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-08042010-150736
Date	22 February 2010
Creators	Horta, Danilo
Contributors	Campello, Ricardo José Gabrielli Barreto
Publisher	Biblioteca Digitais de Teses e Dissertações da USP
Source Sets	Universidade de São Paulo
Language	Portuguese
Detected Language	Portuguese
Type	Dissertação de Mestrado
Format	application/pdf
Rights	Liberar o conteúdo para acesso público.

Page generated in 0.002 seconds

Abordagens evolutivas para agrupamento relacional de dados / Evolutionary approaches to relational data clustering

Description

Links & Downloads

Tags

Additional Fields