Return to search

[en] DATA CLUSTERING: ANALYSIS OF METHODS AND DEVELOPMENT OF APPLICATION FOR CLUSTER ANALYSIS / [pt] AGRUPAMENTOS DE DADOS: AVALIAÇÃO DE MÉTODOS E DESENVOLVIMENTO DE APLICATIVO PARA ANÁLISE DE GRUPOS

[pt] A enorme massa de dados que é gerada pelas diversas
empresas diariamente
pode conter informações importantes que não são fáceis de
serem extraídas. Com
isso advém a necessidade de analisá-los automaticamente,
de forma adequada,
extraindo informação útil que pode agregar algum tipo de
conhecimento. Uma das
formas de se analisar os dados automaticamente é através
da análise de
agrupamentos. Ela procura encontrar grupos de dados
semelhantes entre si. As
técnicas de análise de agrupamentos revelam como os dados
estão estruturados e
resultam em um melhor entendimento sobre o negócio. Existe
ainda hoje uma
escassez de ferramentas para esse fim. Em um problema real
de agrupamento de
dados convém analisar os dados através da utilização de
diferentes métodos, a fim
de buscar aquele que melhor se adapte ao problema. Porém,
as ferramentas
existentes hoje em dia não são integradas, onde cada
ferramenta possui um
subconjunto dos métodos existentes de agrupamento. Dessa
forma o usuário fica
limitado à utilização de uma ferramenta específica ou é
obrigado a conhecer
diversas ferramentas diferentes, de forma a melhor
analisar os dados de sua
empresa. Esta dissertação apresenta uma revisão detalhada
de todo o processo de
análise de agrupamentos e o desenvolvimento de um
aplicativo que visa não
apenas a atender as deficiências presentes na maioria das
ferramentas com esse
fim, mas também a auxiliar, de forma mais completa, todo o
processo de análise
dos grupos. O aplicativo desenvolvido é de fácil
utilização e permite que a ele
sejam incorporados outros métodos eventualmente
desenvolvidos pelo usuário. O
aplicativo foi avaliado em três estudos de casos, os quais
visam demonstrar a
facilidade de uso do aplicativo, assim como avaliar as
vantagens do uso de
métodos de natureza fuzzy em uma base de dados real. / [en] The enormous data mass that is daily generated by several
companies can
contain critical information that might not be easily
retrieved, considering that the
amount of data is generally huge and/or the target
information might be spread
through different data bases. Taking that into
consideration, it might be necessary
to properly analyze the data in an automatic way, so
useful and valuable
information can be extracted. One way of automatically
analyzing data is through
cluster analysis. This type of analysis searches for
related similar data. These
clusters settle a data structure model and with proper
analysis can reveal important
information. The techniques used in cluster analysis
disclose how data is
structured and allow a better knowledge of the business.
Still today there is a lack
of tools for this purpose. On a real situation with a data
cluster problem it is wise
to analyze the data through different methods, so we can
find the one that better
fits the problem. However, today the existing tools are
not integrated, and each
tool has a subgroup of existing cluster methods. This way
the user stays limited to
use only one specific tool or is forced to be aware of a
number of different tools,
so he would be able to better analyze the company data.
This study presents a
detailed review of the whole group analysis process and
develops an application
that not only suggests how to cover the currently lack of
tools for this purpose, but
also to help the complete cluster analysis process in a
more extended way. The
application developed is user friendly and allows other
methods developed by
users to be incorporated. The application has been
evaluated into three case
studies with the purpose of demonstrating its user
friendly, as well as evaluating
the advantages of using fuzzy methods on a true data base.

Identiferoai:union.ndltd.org:puc-rio.br/oai:MAXWELL.puc-rio.br:7975
Date23 March 2006
CreatorsMARCOS NEVES DO VALE
ContributorsRICARDO TANSCHEIT, MARLEY MARIA BERNARDES REBUZZI VELLASCO
PublisherMAXWELL
Source SetsPUC Rio
LanguagePortuguese
Detected LanguagePortuguese
TypeTEXTO

Page generated in 0.0099 seconds