DAMASCENO, Filipe Francisco Rocha. Uma Melhoria no Algoritmo K-médias utilizando o Estimador de James-Stein. 63 f. 2015. Dissertação (Mestrado em Ciência da Computação)-Universidade Federal do Ceará, Fortaleza, 2015. / Submitted by Jairo Viana (jairo@ufc.br) on 2017-01-10T20:15:30Z
No. of bitstreams: 1
2015_dis_ffrdamasceno.pdf: 966516 bytes, checksum: b1c373b2bf5b4b9a4e77e52d1f6a643c (MD5) / Approved for entry into archive by Jairo Viana (jairo@ufc.br) on 2017-01-10T20:15:44Z (GMT) No. of bitstreams: 1
2015_dis_ffrdamasceno.pdf: 966516 bytes, checksum: b1c373b2bf5b4b9a4e77e52d1f6a643c (MD5) / Made available in DSpace on 2017-01-10T20:15:44Z (GMT). No. of bitstreams: 1
2015_dis_ffrdamasceno.pdf: 966516 bytes, checksum: b1c373b2bf5b4b9a4e77e52d1f6a643c (MD5)
Previous issue date: 2016 / The clustering task constitutes one of the main machine learning problems. Among many proposed methods, k-means stands out by its simplicity and high applicability. It is notorious that k-means performance is directly related to the centroid estimation from data, which is usually obtained from the maximum likelihood estimation (MLE). In previous studies it was proposed an estimator called James-Stein (JS) estimator, being, in average, capable of overcoming MLE for vectors of data with more than 2 dimensions. Also in previous studies it was proposed a variation of k-means applying JS estimator, obtaining improvements due to its better precision when compared to MLE. In this study we propose a variation of the k-means algorithm using the JS estimator. / A tarefa de agrupamento constitui um dos principais problemas de aprendizado de máquina. Dentre os diversos métodos propostos destaca-se o k-médias por sua simplicidade e grande aplicabilidade. É notório que o desempenho do k-médias está relacionado à estimativa dos centroides a partir dos dados e esta, usualmente, é obtida a partir da estimativa de máxima verossimilhança (EMV). Em trabalhos anteriores foi proposto um estimador denominado estimador de James-Stein (JS), sendo este capaz de, em média, superar o EMV para vetores de dados com dimensão maior que 2. Também em trabalhos anteriores foi proposta uma alteração do k-médias aplicando o estimador JS, obtendo melhoras devido à sua maior precisão em relação ao EMV. Neste trabalho propõe-se uma nova variante do algoritmo k-médias utilizando o estimador JS.
Identifer | oai:union.ndltd.org:IBICT/oai:www.repositorio.ufc.br:riufc/21491 |
Date | January 2016 |
Creators | Damasceno, Filipe Francisco Rocha |
Contributors | Gomes, João Paulo Pordeus, Brito, Carlos Eduardo Fisch de |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFC, instname:Universidade Federal do Ceará, instacron:UFC |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.002 seconds