Global ETD Search

1	Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classifica??o de streams de dados Bezerra, Clauber Gomes 24 May 2017 (has links) Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-11-22T20:38:08Z No. of bitstreams: 1 ClauberGomesBezerra_TESE.pdf: 7864722 bytes, checksum: 17c21362443f4d25511a0a211d52b805 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-11-23T23:24:44Z (GMT) No. of bitstreams: 1 ClauberGomesBezerra_TESE.pdf: 7864722 bytes, checksum: 17c21362443f4d25511a0a211d52b805 (MD5) / Made available in DSpace on 2017-11-23T23:24:44Z (GMT). No. of bitstreams: 1 ClauberGomesBezerra_TESE.pdf: 7864722 bytes, checksum: 17c21362443f4d25511a0a211d52b805 (MD5) Previous issue date: 2017-05-24 / Nesta tese apresentamos uma nova abordagem para realizar o agrupamento e a classifica??o de um conjunto de dados de forma n?o supervisionada. A abordagem proposta utiliza os conceitos de tipicidade e excentricidade usados pelo algoritmo TEDA na detec??o de outliers. Para realizar o agrupamento e a classifica??o ? proposto um algoritmo estat?stico chamado Auto-Cloud. As amostras analisadas pelo Auto-Cloud s?o agrupadas em unidades chamadas de data clouds, que s?o estruturas que n?o possuem formato ou limites definidos. O Auto-Cloud permite que cada amostra analisada possa pertencer simultaneamente a v?rias data clouds. O Auto-Cloud ? um algoritmo aut?nomo e evolutivo, que n?o necessita de treinamento ou qualquer conhecimento pr?vios sobre o conjunto de dados analisado. Ele permite a cria??o e a fus?o das data clouds de forma aut?noma, ? medida que as amostras s?o lidas, sem qualquer interven??o humana. As caracter?sticas do algoritmo fazem com que ele seja indicado para o agrupamento e classifica??o de streams de dados e para aplica??es que requerem respostas em tempo-real. O Auto- Cloud tamb?m ? um algoritmo recursivo, o que o torna r?pido e exige pouca quantidade de mem?ria. J? no processo de classifica??o dos dados, o Auto-Cloud trabalha como um classificador fuzzy, calculando o grau de pertin?ncia entre a amostra analisada e cada data cloud criada no processo de agrupamento. A classe a que pertence cada amostra ? determinada pela data cloud com maior grau de pertin?ncia com rela??o a amostra. Para validar o m?todo proposto, aplicamos o mesmo em v?rios conjuntos de dados existentes na literatura sobre o assunto. Al?m disso, o m?todo tamb?m foi validado numa aplica??o de detec??o e classifica??o de falhas em processos industriais, onde foram utilizados dados reais, obtidos de uma planta industrial. / In this thesis we propose a new approach to unsupervised data clustering and classification. The proposed approach is based on typicality and eccentricity concepts. This concepts are used by recently introduced TEDA algorithm for outlier detection. To perform data clustering and classification, it is proposed a new statistical algorithm, called Auto-Cloud. The data samples analyzed by Auto-Cloud are grouped in the form of unities called data clouds, which are structures without pre-defined shape or boundaries. Auto-Cloud allows each data sample to belong to multiple data clouds simultaneously. Auto-Cloud is an autonomous and evolving algorithm, which does not requires previous training or any prior knowledge about the data set. Auto-Cloud is able to create and merge data clouds autonomously, as data samples are obtained, without any human interference. The algorithm is suitable for data clustering and classification of online data streams and application that require real-time response. Auto-Cloud is also recursive, which makes it fast and with little computational effort. The data classification process works like a fuzzy classifier using the degree of membership between the analyzed data sample to each data cloud created in clustering process. The class to which each data sample belongs is determined by the cloud with the highest activation with respect to that sample. To validate the proposed method, we apply it to several existing datasets for data clustering and classification. Moreover, the method was also used in a fault detection in industrial processes application. In this case, we use real data obtained from a real world industrial plant. Detec??o de outliers Agrupamento de dados Classifica??o de dados Stream de dados TEDA Tipicidade Excentricidade Data cloud Auto-Cloud

Search results

Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classifica??o de streams de dados