Global ETD Search

Return to search

Métodos robustos em análise de agrupamento para dados simbólicos

Made available in DSpace on 2014-06-12T16:00:00Z (GMT). No. of bitstreams: 2
arquivo5813_1.pdf: 1242512 bytes, checksum: 898cc02cecdade8681b49f419621a5ce (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2011 / Faculdade de Amparo à Ciência e Tecnologia do Estado de Pernambuco / Análise de agrupamento (cluster analysis) visa organizar um conjunto de itens em grupos
tal que os itens em um dado grupo têm alto grau de similaridade, enquanto itens pertencentes
a grupos diferentes têm um alto grau de dissimilaridade. Técnicas de análise
de agrupamento podem ser divididas em hierárquicas e de particionamento. Métodos
hierárquicos formam seqüências de partições dos dados de entrada gerando assim hierarquias
completas, enquanto métodos de particionamento procuram obter uma simples
partição dos dados de entrada em um número fixo de grupos. Em geral esses métodos
são divididos em dois grupos de paradigmas: rígido (hard) e difuso/nebuloso (fuzzy).
Os algoritmos rígidos associam um item a apenas um grupo, enquanto os algoritmos
difusos/nebulosos associam um item a todos os grupos através de um grau de pertinência
do item em cada grupo. Os algoritmos de agrupamento baseados em medoid são
conhecidos por serem menos sensíveis na presença de observações aberrantes/ruídos.
Adicionalmente, esses algoritmos são mais flexíveis uma vez que a entrada de dados
é uma matriz de dissimilaridade. A fim de modelar variabilidade e/ou incerteza inerente
aos dados, variáveis podem assumir conjuntos de categorias ou intervalos, possivelmente
até mesmo com freqüências ou pesos. A análise de dados simbólicos (Symbolic
Data Analysis) é um domínio relacionado com análise multivariada, reconhecimento
de padrão e inteligência artificial para tratar com conjuntos de dados simbólicos descritos
por intervalos, distribuição de peso (probabilidade) ou conjuntos de categorias.
Esta dissertação apresenta métodos de agrupamento rígidos e difusos/nebulosos baseados
em medoid para conjuntos de dados simbólicos. Diferentes funções de distâncias
padronizadas para dados simbólicos são também investigadas. Para avaliar os métodos
aplicados a dados simbólicos, foram realizados experimentos com conjuntos de dados
intervalares artificiais contendo observações aberrantes e conjuntos de dados simbólicos
reais mistos. Os resultados da medida de qualidade adotada demonstraram que em geral
os métodos baseados em medoid obtiveram um desempenho satisfatório em relação a
outros métodos de particionamento existentes na literatura de dados simbólicos

Análise de Agrupamento

Análise de Dados Simbólicos

Dados Simbólicos Mistos

Identifer	oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/2657
Date	31 January 2011
Creators	Cristina de Assis, Elaine
Contributors	Maria Cardoso Rodrigues de Souza, Renata
Publisher	Universidade Federal de Pernambuco
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	Portuguese
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Source	reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
Rights	info:eu-repo/semantics/openAccess

Page generated in 0.0019 seconds

Métodos robustos em análise de agrupamento para dados simbólicos

Description

Links & Downloads

Tags

Additional Fields