Return to search

Utiliza??o do problema das k-medianas como crit?rio para o agrupamento de dados semi-supervisionado

Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-04-03T19:47:15Z
No. of bitstreams: 1
RodrigoAlvesRandel_DISSERT.pdf: 1482786 bytes, checksum: d296cc0bcb0193a4d23da06aacd37afc (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-04-06T20:17:18Z (GMT) No. of bitstreams: 1
RodrigoAlvesRandel_DISSERT.pdf: 1482786 bytes, checksum: d296cc0bcb0193a4d23da06aacd37afc (MD5) / Made available in DSpace on 2017-04-06T20:17:18Z (GMT). No. of bitstreams: 1
RodrigoAlvesRandel_DISSERT.pdf: 1482786 bytes, checksum: d296cc0bcb0193a4d23da06aacd37afc (MD5)
Previous issue date: 2016-12-12 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES) / Agrupamento de dados ? uma poderosa ferramenta para an?lise autom?tica de dados.
Essa t?cnica se prop?e a resolver o seguinte problema: dado um conjunto de entidades,
encontrar subconjuntos, denominados clusters, que s?o homog?neos e/ou bem separados.
O maior desafio do agrupamento de dados ? encontrar um crit?rio que apresente
boa separa??o de dados em grupos homog?neos, e que estes agrupamentos possam trazer
informa??es ?teis ao usu?rio. Para resolver este problema, ? sugerido que o usu?rio possa
fornecer informa??es pr?vias a respeito do conjunto de dados que auxiliem/guiem o processo
de agrupamento. Realizar o agrupamento de dados utilizando essas informa??es
auxiliares ? denominado de agrupamento de dados semi-supervisionado (ADSS). Este
trabalho explora o problema de ADSS utilizando um novo modelo: os dados s?o agrupados
atrav?s da resolu??o do problemas das k-medianas. Resultados mostram que essa
abordagem foi capaz de agrupar os dados de forma eficiente para problemas de ADSS em
diversos dom?nios diferentes. / Clustering is a powerful tool for automated analysis of data. It addresses the following
general problem: given a set of entities, find subsets, or clusters, which are homogeneous
and/or well separated. The biggest challenge of data clustering is to find a criterion to
present good separation of data into homogeneous groups, so that these groups bring
useful information to the user. To solve this problem, it is suggested that the user can
provide a priori information about the data set. Clustering under this assumption is called
semi-supervised clustering. This work explores the semi-supervised clustering problem
using a new model: the data is clustered by solving the k-medians problem. Results shows
that this new approach was able to efficiently cluster the data in many different domains.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufrn.br:123456789/22569
Date12 December 2016
CreatorsRandel, Rodrigo Alves
Contributors03553729406, http://lattes.cnpq.br/5093210888872414, D?ria Neto, Adri?o Duarte, 10749896434, http://lattes.cnpq.br/1987295209521433, Lavor, Carlile Campos, 37163248334, http://lattes.cnpq.br/2019624495480547, Aloise, Daniel
PublisherPROGRAMA DE P?S-GRADUA??O EM ENGENHARIA EL?TRICA E DE COMPUTA??O, UFRN, Brasil
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFRN, instname:Universidade Federal do Rio Grande do Norte, instacron:UFRN
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds