Spelling suggestions: "subject:"4hupstream dde dados"" "subject:"4hupstream dee dados""
1 |
Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classifica??o de streams de dadosBezerra, Clauber Gomes 24 May 2017 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-11-22T20:38:08Z
No. of bitstreams: 1
ClauberGomesBezerra_TESE.pdf: 7864722 bytes, checksum: 17c21362443f4d25511a0a211d52b805 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-11-23T23:24:44Z (GMT) No. of bitstreams: 1
ClauberGomesBezerra_TESE.pdf: 7864722 bytes, checksum: 17c21362443f4d25511a0a211d52b805 (MD5) / Made available in DSpace on 2017-11-23T23:24:44Z (GMT). No. of bitstreams: 1
ClauberGomesBezerra_TESE.pdf: 7864722 bytes, checksum: 17c21362443f4d25511a0a211d52b805 (MD5)
Previous issue date: 2017-05-24 / Nesta tese apresentamos uma nova abordagem para realizar o agrupamento e a classifica??o
de um conjunto de dados de forma n?o supervisionada. A abordagem proposta
utiliza os conceitos de tipicidade e excentricidade usados pelo algoritmo TEDA na detec??o
de outliers. Para realizar o agrupamento e a classifica??o ? proposto um algoritmo
estat?stico chamado Auto-Cloud. As amostras analisadas pelo Auto-Cloud s?o agrupadas
em unidades chamadas de data clouds, que s?o estruturas que n?o possuem formato ou
limites definidos. O Auto-Cloud permite que cada amostra analisada possa pertencer simultaneamente
a v?rias data clouds. O Auto-Cloud ? um algoritmo aut?nomo e evolutivo,
que n?o necessita de treinamento ou qualquer conhecimento pr?vios sobre o conjunto de
dados analisado. Ele permite a cria??o e a fus?o das data clouds de forma aut?noma,
? medida que as amostras s?o lidas, sem qualquer interven??o humana. As caracter?sticas
do algoritmo fazem com que ele seja indicado para o agrupamento e classifica??o
de streams de dados e para aplica??es que requerem respostas em tempo-real. O Auto-
Cloud tamb?m ? um algoritmo recursivo, o que o torna r?pido e exige pouca quantidade
de mem?ria. J? no processo de classifica??o dos dados, o Auto-Cloud trabalha como um
classificador fuzzy, calculando o grau de pertin?ncia entre a amostra analisada e cada data
cloud criada no processo de agrupamento. A classe a que pertence cada amostra ? determinada
pela data cloud com maior grau de pertin?ncia com rela??o a amostra. Para
validar o m?todo proposto, aplicamos o mesmo em v?rios conjuntos de dados existentes
na literatura sobre o assunto. Al?m disso, o m?todo tamb?m foi validado numa aplica??o
de detec??o e classifica??o de falhas em processos industriais, onde foram utilizados
dados reais, obtidos de uma planta industrial. / In this thesis we propose a new approach to unsupervised data clustering and classification.
The proposed approach is based on typicality and eccentricity concepts. This
concepts are used by recently introduced TEDA algorithm for outlier detection. To perform
data clustering and classification, it is proposed a new statistical algorithm, called
Auto-Cloud. The data samples analyzed by Auto-Cloud are grouped in the form of unities
called data clouds, which are structures without pre-defined shape or boundaries.
Auto-Cloud allows each data sample to belong to multiple data clouds simultaneously.
Auto-Cloud is an autonomous and evolving algorithm, which does not requires previous
training or any prior knowledge about the data set. Auto-Cloud is able to create and merge
data clouds autonomously, as data samples are obtained, without any human interference.
The algorithm is suitable for data clustering and classification of online data streams and
application that require real-time response. Auto-Cloud is also recursive, which makes it
fast and with little computational effort. The data classification process works like a fuzzy
classifier using the degree of membership between the analyzed data sample to each data
cloud created in clustering process. The class to which each data sample belongs is determined
by the cloud with the highest activation with respect to that sample. To validate
the proposed method, we apply it to several existing datasets for data clustering and classification.
Moreover, the method was also used in a fault detection in industrial processes
application. In this case, we use real data obtained from a real world industrial plant.
|
Page generated in 0.0583 seconds