Deteção de Anomalias é uma área de investigação importante hoje em dia, na qual a intenção é encontrar padrões em dados que não estejam de acordo com o comportamento esperado.As técnicas que têm sido utilizadas nesta área são diversas, baseadas em diferentes assunções sobre como as anomalias se manifestam nos dados e podem ter diferentes resultados (uma pontuação numérica ou uma classificação). Devido a esta heterogeneidade, cada técnica é especializada em características específicas dos dados e pode apenas fornecer uma visão limitada sobre as anomalias que existem num conjunto de dados específico.Ensemble Learning é um processo que tenta incorporar as opiniões de diferentes algoritmos de modo a potenciar uma decisão mais ponderada.Este processo tem sido aplicado com sucesso em problemas de aprendizagem supervisionada e melhorias na performance foram observadas empiricamente.Stacked Generalization é um destes métodos, no qual um algoritmo de aprendizagem é usado para combinar as opiniões de diferentes algoritmos.O objetivo desta tese é o de investigar a aplicação do método Stacked Generalization com as principais técnicas de Deteção de Anomalias e determinar se este método pode conduzir a uma melhor performance.Este método será então avaliado com conjuntos de dados públicos e usados para validação das técnicas na literatura científica de Deteção de Anomalias. / Anomaly Detection is an important research topic nowadays, in which the intention is to find patterns in data that do not not conform to expected behavior. This concept is applicable in a large number of different domains and contexts, such as intrusion detection, fraud detection, medical research and social network analysis.Techniques that have been addressed within this topic are diverse, based on different assumptions about how anomalies manifest themselves within the data and can have different outputs (i.e. a numeric score or a labeled classification).Because of this heterogeneity, every technique is specialized in specific characteristics of the data and may only provide a limited insight on what anomalies exist in a given dataset.Ensemble Learning is process that tries to incorporate the opinions of different learners in order to make a more pondered decision.This process has been successfully applied in the past to supervised learning problems and improvements in performance have been empirically observed.Stacked Generalization is one of these methods, in which a learning algorithm is used to combine the different learners.The intention of this thesis is to research the application of Stacked Generalization to current state-of-the-art Anomaly Detection techniques and determine if this method can lead to a better overall performance.These methods will then be evaluated on well-known publicly available datasets used for benchmarking throughout the literature in Anomaly Detection.
Identifer | oai:union.ndltd.org:up.pt/oai:repositorio-aberto.up.pt:10216/112506 |
Date | 26 June 2018 |
Creators | Miguel Oliveira Sandim |
Contributors | Faculdade de Engenharia |
Source Sets | Universidade do Porto |
Language | English |
Detected Language | English |
Type | Dissertação |
Format | application/pdf |
Rights | openAccess |
Page generated in 0.002 seconds