Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-09T13:28:57Z
No. of bitstreams: 2
BrunoAlmeidaPimentel.pdf: 2629725 bytes, checksum: 3c61892a3e135f9ca4c87c3fa5a73068 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-09T13:28:57Z (GMT). No. of bitstreams: 2
BrunoAlmeidaPimentel.pdf: 2629725 bytes, checksum: 3c61892a3e135f9ca4c87c3fa5a73068 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-02-25 / CNPq / Este trabalho relata sobre os diferentes métodos de agrupamento presentes na literatura atual
e introduz métodos de agrupamento baseado na abordagem possibilística para dados intervalares.
Tem como objetivo estender os métodos clássicos de agrupamento possibilístico para
dados intervalares simbólicos. Além disso, é proposto uma nova abordagem possibilística em
que há um grau de pertinência diferente para cada variável e classe. A abordagem possibilística
considera a pertinência como possibilidades dos objetos a classes e a partição resultante dos
dados pode ser entendida como uma partição possibilística. O algoritmo conhecido dessa categoria
é o Possibilístic C-Means (PCM). No PCM, a otimização da função objetivo em alguns
conjuntos de dados pode ajudar a identificar outliers e dados ruidosos. A Análise de Dados
Simbólico (ADS) surgiu para lidar com variáveis simbólicas, que podem ser do tipo intervalos,
histogramas, e até mesmo funções, a fim de considerar a variabilidade e/ou a incerteza
inata aos dados. As técnicas de ADS tornam-se uma poderosa ferramenta quando usadas em
métodos de agrupamentos, o que causa um constante crescimento em pesquisas para o aprimoramento
destas técnicas usadas nos mais variados algoritmos, tais como em K-Means, Support
Vector Machine (SVM) e Kernel. Objetivando avaliar o desempenho dos métodos propostos e
os presentes na literatura, um estudo comparativo destes métodos em relação ao agrupamento
de objetos simbólicos do tipo intervalo é realizado. Foram planejados experimentos com dados
sintéticos, usando o experimento Monte Carlo, e dados reais. O índice corrigido de Rand (CR)
e a taxa de erro global de classificação (OERC) são usados para avaliar os métodos.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/11420 |
Date | 25 February 2013 |
Creators | Pimentel, Bruno Almeida |
Contributors | Souza, Renata Maria C. R. de |
Publisher | Universidade Federal de Pernambuco |
Source Sets | IBICT Brazilian ETDs |
Language | Breton |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Source | reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE |
Rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess |
Page generated in 0.0053 seconds