Global ETD Search

Return to search

Mapas auto-organizáveis com topologioa variante no tempo para categorização em subespaços em dados de alta dimensionalidade e vistas múltiplas

Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2017-04-24T15:04:03Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
mapas-auto-organizaveis2.pdf: 2835656 bytes, checksum: 8836a86bd2cced9353cb25b53383b305 (MD5) / Made available in DSpace on 2017-04-24T15:04:03Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
mapas-auto-organizaveis2.pdf: 2835656 bytes, checksum: 8836a86bd2cced9353cb25b53383b305 (MD5)
Previous issue date: 2016-08-16 / Métodos e algoritmos em aprendizado de máquina não supervisionado têm sido empregados em diversos problemas significativos. Uma explosão na disponibilidade de dados de várias fontes e modalidades está correlacionada com os avanços na obtenção, compressão, armazenamento, transferência e processamento de grandes quantidades de dados complexos com alta dimensionalidade, como imagens digitais, vídeos de vigilância e microarranjos de DNA. O agrupamento se torna difícil devido à crescente dispersão desses dados, bem como a dificuldade crescente em discriminar distâncias entre os pontos de dados. Este trabalho apresenta um algoritmo de agrupamento suave em subespaços baseado em um mapa auto-organizável (SOM) com estrutura variante no tempo, o que significa que o agrupamento dos dados pode ser alcançado sem qualquer conhecimento prévio, tais como o número de categorias ou a topologia dos padrões de entrada, nos quais ambos são determinados durante o processo de treinamento. O modelo também atribui diferentes pesos a diferentes dimensões, o que implica que cada dimensão contribui para o descobrimento dos aglomerados de dados. Para validar o modelo, diversos conjuntos de dados reais foram utilizados, considerando uma diversificada gama de contextos, tais como mineração de dados, expressão genética, agrupamento multivista e problemas de visão computacional. Os resultados são promissores e conseguem lidar com dados reais caracterizados pela alta dimensionalidade. / Unsupervised learning methods have been employed on many significant problems. A blast in
the availability of data from multiple sources and modalities is correlated with advancements in
how to obtain, compress, store, transfer, and process large amounts of complex high-dimensional
data, such as digital images, surveillance videos, and DNA microarrays. Clustering becomes
challenging due to the increasing sparsity of such data, as well as the increasing difficulty in
discriminating distances between data points. This work presents a soft subspace clustering
algorithm based on a self-organizing map (SOM) with time-variant structure, meaning that
clustering data can be achieved without any prior knowledge such as the number of categories or
input data topology, in which both are determined during the training process. The model also
assigns different weights to different dimensions, this implies that every dimension contributes to
uncover clusters. To validate the model, we used a number of real-world data sets, considering a
diverse range of contexts such as data mining, gene expression, multi-view and computer vision
problems. The promising results can handle real-world data characterized by high dimensionality.

https://repositorio.ufpe.br/handle/123456789/18623

Dados em Alta Dimensionalidade

Campo Receptivo Local

Aprendizagem por Relevância

Mapas Auto-Organizáveis

Agrupamento em Subespaços

High-Dimensional Data

Local Receptive Field

Relevance Learning

SelfOrganizing Maps (SOMs)

Subspace Clustering

Identifer	oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/18623
Date	16 August 2016
Creators	ANTONINO, Victor Oliveira
Contributors	http://lattes.cnpq.br/8715023255304328, ARAUJO, Aluizio Fausto Ribeiro
Publisher	Universidade Federal de Pernambuco, Programa de Pos Graduacao em Ciencia da Computacao, UFPE, Brasil
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	Portuguese
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Source	reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
Rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess

Page generated in 0.0027 seconds

Mapas auto-organizáveis com topologioa variante no tempo para categorização em subespaços em dados de alta dimensionalidade e vistas múltiplas

Description

Links & Downloads

Tags

Additional Fields