Spelling suggestions: "subject:"agrupamento dde dados semissupervisionado"" "subject:"agrupamento dde dados semisupervisionado""
1 |
Utiliza??o do problema das k-medianas como crit?rio para o agrupamento de dados semi-supervisionadoRandel, Rodrigo Alves 12 December 2016 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-04-03T19:47:15Z
No. of bitstreams: 1
RodrigoAlvesRandel_DISSERT.pdf: 1482786 bytes, checksum: d296cc0bcb0193a4d23da06aacd37afc (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-04-06T20:17:18Z (GMT) No. of bitstreams: 1
RodrigoAlvesRandel_DISSERT.pdf: 1482786 bytes, checksum: d296cc0bcb0193a4d23da06aacd37afc (MD5) / Made available in DSpace on 2017-04-06T20:17:18Z (GMT). No. of bitstreams: 1
RodrigoAlvesRandel_DISSERT.pdf: 1482786 bytes, checksum: d296cc0bcb0193a4d23da06aacd37afc (MD5)
Previous issue date: 2016-12-12 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES) / Agrupamento de dados ? uma poderosa ferramenta para an?lise autom?tica de dados.
Essa t?cnica se prop?e a resolver o seguinte problema: dado um conjunto de entidades,
encontrar subconjuntos, denominados clusters, que s?o homog?neos e/ou bem separados.
O maior desafio do agrupamento de dados ? encontrar um crit?rio que apresente
boa separa??o de dados em grupos homog?neos, e que estes agrupamentos possam trazer
informa??es ?teis ao usu?rio. Para resolver este problema, ? sugerido que o usu?rio possa
fornecer informa??es pr?vias a respeito do conjunto de dados que auxiliem/guiem o processo
de agrupamento. Realizar o agrupamento de dados utilizando essas informa??es
auxiliares ? denominado de agrupamento de dados semi-supervisionado (ADSS). Este
trabalho explora o problema de ADSS utilizando um novo modelo: os dados s?o agrupados
atrav?s da resolu??o do problemas das k-medianas. Resultados mostram que essa
abordagem foi capaz de agrupar os dados de forma eficiente para problemas de ADSS em
diversos dom?nios diferentes. / Clustering is a powerful tool for automated analysis of data. It addresses the following
general problem: given a set of entities, find subsets, or clusters, which are homogeneous
and/or well separated. The biggest challenge of data clustering is to find a criterion to
present good separation of data into homogeneous groups, so that these groups bring
useful information to the user. To solve this problem, it is suggested that the user can
provide a priori information about the data set. Clustering under this assumption is called
semi-supervised clustering. This work explores the semi-supervised clustering problem
using a new model: the data is clustered by solving the k-medians problem. Results shows
that this new approach was able to efficiently cluster the data in many different domains.
|
Page generated in 0.134 seconds