Global ETD Search

1	Técnica de aprendizado semissupervisionado para detecção de outliers / A semi-supervised technique for outlier detection Zamoner, Fabio Willian 23 January 2014 (has links) Detecção de outliers desempenha um importante papel para descoberta de conhecimento em grandes bases de dados. O estudo é motivado por inúmeras aplicações reais como fraudes de cartões de crédito, detecção de falhas em componentes industriais, intrusão em redes de computadores, aprovação de empréstimos e monitoramento de condições médicas. Um outlier é definido como uma observação que desvia das outras observações em relação a uma medida e exerce considerável influência na análise de dados. Embora existam inúmeras técnicas de aprendizado de máquina para tratar desse problemas, a maioria delas não faz uso de conhecimento prévio sobre os dados. Técnicas de aprendizado semissupervisionado para detecção de outliers são relativamente novas e incluem apenas um pequeno número de rótulos da classe normal para construir um classificador. Recentemente um modelo semissupervisionado baseado em rede foi proposto para classificação de dados empregando um mecanismo de competição e cooperação de partículas. As partículas são responsáveis pela propagação dos rótulos para toda a rede. Neste trabalho, o modelo foi adaptado a fim de detectar outliers através da definição de um escore de outlier baseado na frequência de visitas. O número de visitas recebido por um outlier é significativamente diferente dos demais objetos de mesma classe. Essa abordagem leva a uma maneira não tradicional de tratar os outliers. Avaliações empíricas sobre bases artificiais e reais demonstram que a técnica proposta funciona bem para bases desbalanceadas e atinge precisão comparável às obtidas pelas técnicas tradicionais de detecção de outliers. Além disso, a técnica pode fornecer novas perspectivas sobre como diferenciar objetos, pois considera não somente a distância física, mas também a formação de padrão dos dados / Outloier detection plays an important role for discovering knowledge in large data sets. The study is motivated by plethora of real applications such as credit card frauds, fault detection in industrial components, network instrusion detection, loan application precoessing and medical condition monitoring. An outlier is defined as an observation that deviates from other observations with respect to a measure and exerts a substantial influence on data analysis. Although numerous machine learning techniques have been developed for attacking this problem, most of them work with no prior knowledge of the data. Semi-supervised outlier detection techniques are reçlatively new and include only a few labels of normal class for building a classifier. Recently, a network-based semi-supervised model was proposed for data clasification by employing a mechanism based on particle competiton and cooperation. Such particle competition and cooperaction. Such particles are responsible for label propagation throughout the network. In this work, we adapt this model by defining a new outlier score based on visit frequency counting. The number of visits received by an outlier is significantly different from the remaining objects. This approach leads to an anorthodox way to deal with outliers. Our empirical ecaluations on both real and simulated data sets demonstrate that proposed technique works well with unbalanced data sets and achieves a precision compared to traditional outlier detection techniques. Moreover, the technique might provide new insights into how to differentiate objects because it considers not only the physical distance but also the pattern formation of the data Aprendizado semisupervisionado Detecção de outliers Outlier detection Particle competition and cooperation Semi-supervised learning
2	Técnica de aprendizado semissupervisionado para detecção de outliers / A semi-supervised technique for outlier detection Fabio Willian Zamoner 23 January 2014 (has links) Detecção de outliers desempenha um importante papel para descoberta de conhecimento em grandes bases de dados. O estudo é motivado por inúmeras aplicações reais como fraudes de cartões de crédito, detecção de falhas em componentes industriais, intrusão em redes de computadores, aprovação de empréstimos e monitoramento de condições médicas. Um outlier é definido como uma observação que desvia das outras observações em relação a uma medida e exerce considerável influência na análise de dados. Embora existam inúmeras técnicas de aprendizado de máquina para tratar desse problemas, a maioria delas não faz uso de conhecimento prévio sobre os dados. Técnicas de aprendizado semissupervisionado para detecção de outliers são relativamente novas e incluem apenas um pequeno número de rótulos da classe normal para construir um classificador. Recentemente um modelo semissupervisionado baseado em rede foi proposto para classificação de dados empregando um mecanismo de competição e cooperação de partículas. As partículas são responsáveis pela propagação dos rótulos para toda a rede. Neste trabalho, o modelo foi adaptado a fim de detectar outliers através da definição de um escore de outlier baseado na frequência de visitas. O número de visitas recebido por um outlier é significativamente diferente dos demais objetos de mesma classe. Essa abordagem leva a uma maneira não tradicional de tratar os outliers. Avaliações empíricas sobre bases artificiais e reais demonstram que a técnica proposta funciona bem para bases desbalanceadas e atinge precisão comparável às obtidas pelas técnicas tradicionais de detecção de outliers. Além disso, a técnica pode fornecer novas perspectivas sobre como diferenciar objetos, pois considera não somente a distância física, mas também a formação de padrão dos dados / Outloier detection plays an important role for discovering knowledge in large data sets. The study is motivated by plethora of real applications such as credit card frauds, fault detection in industrial components, network instrusion detection, loan application precoessing and medical condition monitoring. An outlier is defined as an observation that deviates from other observations with respect to a measure and exerts a substantial influence on data analysis. Although numerous machine learning techniques have been developed for attacking this problem, most of them work with no prior knowledge of the data. Semi-supervised outlier detection techniques are reçlatively new and include only a few labels of normal class for building a classifier. Recently, a network-based semi-supervised model was proposed for data clasification by employing a mechanism based on particle competiton and cooperation. Such particle competition and cooperaction. Such particles are responsible for label propagation throughout the network. In this work, we adapt this model by defining a new outlier score based on visit frequency counting. The number of visits received by an outlier is significantly different from the remaining objects. This approach leads to an anorthodox way to deal with outliers. Our empirical ecaluations on both real and simulated data sets demonstrate that proposed technique works well with unbalanced data sets and achieves a precision compared to traditional outlier detection techniques. Moreover, the technique might provide new insights into how to differentiate objects because it considers not only the physical distance but also the pattern formation of the data Aprendizado semisupervisionado Detecção de outliers Outlier detection Particle competition and cooperation Semi-supervised learning
3	Redes com dinâmica espaço-temporal e aplicações computacionais / Networks with spatio temporal dynamics in computer sciences Quiles, Marcos Gonçalves 24 March 2009 (has links) Nas últimas décadas, testemunhou-se um crescente interesse no estudo de sistemas complexos. Tais sistemas são compostos por pelo menos dois componentes fundamentais: elementos dinâmicos individuais e uma estrutura de organização definindo a forma de interação entre estes. Devido a dinâmica de cada elemento e a complexidade de acoplamento, uma grande variedade de fenômenos espaço-temporais podem ser observados. Esta tese tem como objetivo principal explorar o uso da dinâmica espaço-temporal em redes visando a solução de alguns problemas computacionais. Com relação aos mecanismos dinâmicos, a sincronização entre osciladores acoplados, a caminhada aleatória-determinística e a competição entre elementos na rede foram considerados. Referente à parte estrutural da rede, tanto estruturas regulares baseadas em reticulados quanto redes com estruturas mais gerais, denominadas redes complexas, foram abordadas. Este estudo é concretizado com o desenvolvimento de modelos aplicados a dois domínios específicos. O primeiro refere-se à utilização de redes de osciladores acoplados para construção de modelos de atenção visual. Dentre as principais características desses modelos estão: a seleção baseada em objetos, a utilização da sincronização/ dessincronização entre osciladores neurais como forma de organização perceptual, a competição entre objetos para aquisição da atenção. Além disso, ao comparar com outros modelos de seleção de objetos baseados em redes osciladores, um número maior de atributos visuais é utilizado para definir a saliência dos objetos. O segundo domínio está relacionado ao desenvolvimento de modelos para detecção de comunidades em redes complexas. Os dois modelos desenvolvidos, um baseado em competição de partículas e outro baseado em sincronização de osciladores, apresentam alta precisão de detecção e ao mesmo tempo uma baixa complexidade computacional. Além disso, o modelo baseado em competição de partículas não só oferece uma nova técnica de detecção de comunidades, mas também apresenta uma abordagem alternativa para realização de aprendizado competitivo. Os estudos realizados nesta tese mostram que a abordagem unificada de dinâmica e estrutura é uma ferramenta promissora para resolver diversos problemas computacionais / In the last decades, an increasing interest in complex system study has been witnessed. Such systems have at least two integrated fundamental components: individual dynamical elements and an organizational structure which defines the form of interaction among those elements. Due to the dynamics of each element and the coupling complexity, various spatial-temporal phenomena can be observed. The main objective of this thesis is to explore spatial-temporal dynamics in networks for solving some computational problems. Regarding the dynamical mechanisms, the synchronization among coupled oscillators, deterministic-random walk and competition between dynamical elements are taken into consideration. Referring to the organizational structure, both regular network based on lattice and more general network, called complex networks, are studied. The study of coupled dynamical elements is concretized by developing computational models applied to two specific domains. The first refers to the using of coupled neural oscillators for visual attention. The main features of the developed models in this thesis are: object-based visual selection, realization of visual perceptual organization by using synchronization / desynchronization among neural oscillators, competition among objects to achieve attention. Moreover, in comparison to other object-based selection models, more visual attributes are employed to define salience of objects. The second domain is related to the development of computational models applied to community detection in complex networks. Two developed models, one based on particle competition and another based on synchronization of Integrate-Fire oscillators, present high detection rate and at the same time low computational complexity. Moreover, the model based on particle competition not only offers a new community detection technique, but also presents an alternative way to realize artificial competitive learning. The study realized in this thesis shows that the unified scheme of dynamics and structure is a powerful tool to solve various computational problems Atenção visual Community detection Competição de partículas Complex networks Detecção de comunidades Dinâmica espaço-temporal Neural networks Particle competition Redes complexas Redes neurais Sincronização Spatio temporal dynamics Synchronization Visual attention
4	Redes com dinâmica espaço-temporal e aplicações computacionais / Networks with spatio temporal dynamics in computer sciences Marcos Gonçalves Quiles 24 March 2009 (has links) Nas últimas décadas, testemunhou-se um crescente interesse no estudo de sistemas complexos. Tais sistemas são compostos por pelo menos dois componentes fundamentais: elementos dinâmicos individuais e uma estrutura de organização definindo a forma de interação entre estes. Devido a dinâmica de cada elemento e a complexidade de acoplamento, uma grande variedade de fenômenos espaço-temporais podem ser observados. Esta tese tem como objetivo principal explorar o uso da dinâmica espaço-temporal em redes visando a solução de alguns problemas computacionais. Com relação aos mecanismos dinâmicos, a sincronização entre osciladores acoplados, a caminhada aleatória-determinística e a competição entre elementos na rede foram considerados. Referente à parte estrutural da rede, tanto estruturas regulares baseadas em reticulados quanto redes com estruturas mais gerais, denominadas redes complexas, foram abordadas. Este estudo é concretizado com o desenvolvimento de modelos aplicados a dois domínios específicos. O primeiro refere-se à utilização de redes de osciladores acoplados para construção de modelos de atenção visual. Dentre as principais características desses modelos estão: a seleção baseada em objetos, a utilização da sincronização/ dessincronização entre osciladores neurais como forma de organização perceptual, a competição entre objetos para aquisição da atenção. Além disso, ao comparar com outros modelos de seleção de objetos baseados em redes osciladores, um número maior de atributos visuais é utilizado para definir a saliência dos objetos. O segundo domínio está relacionado ao desenvolvimento de modelos para detecção de comunidades em redes complexas. Os dois modelos desenvolvidos, um baseado em competição de partículas e outro baseado em sincronização de osciladores, apresentam alta precisão de detecção e ao mesmo tempo uma baixa complexidade computacional. Além disso, o modelo baseado em competição de partículas não só oferece uma nova técnica de detecção de comunidades, mas também apresenta uma abordagem alternativa para realização de aprendizado competitivo. Os estudos realizados nesta tese mostram que a abordagem unificada de dinâmica e estrutura é uma ferramenta promissora para resolver diversos problemas computacionais / In the last decades, an increasing interest in complex system study has been witnessed. Such systems have at least two integrated fundamental components: individual dynamical elements and an organizational structure which defines the form of interaction among those elements. Due to the dynamics of each element and the coupling complexity, various spatial-temporal phenomena can be observed. The main objective of this thesis is to explore spatial-temporal dynamics in networks for solving some computational problems. Regarding the dynamical mechanisms, the synchronization among coupled oscillators, deterministic-random walk and competition between dynamical elements are taken into consideration. Referring to the organizational structure, both regular network based on lattice and more general network, called complex networks, are studied. The study of coupled dynamical elements is concretized by developing computational models applied to two specific domains. The first refers to the using of coupled neural oscillators for visual attention. The main features of the developed models in this thesis are: object-based visual selection, realization of visual perceptual organization by using synchronization / desynchronization among neural oscillators, competition among objects to achieve attention. Moreover, in comparison to other object-based selection models, more visual attributes are employed to define salience of objects. The second domain is related to the development of computational models applied to community detection in complex networks. Two developed models, one based on particle competition and another based on synchronization of Integrate-Fire oscillators, present high detection rate and at the same time low computational complexity. Moreover, the model based on particle competition not only offers a new community detection technique, but also presents an alternative way to realize artificial competitive learning. The study realized in this thesis shows that the unified scheme of dynamics and structure is a powerful tool to solve various computational problems Atenção visual Competição de partículas Detecção de comunidades Dinâmica espaço-temporal Redes complexas Redes neurais Sincronização Community detection Complex networks Neural networks Particle competition Spatio temporal dynamics Synchronization Visual attention
5	Machine learning in complex networks: modeling, analysis, and applications / Aprendizado de máquina em redes complexas: modelagem, análise e aplicações Silva, Thiago Christiano 13 December 2012 (has links) Machine learning is evidenced as a research area with the main purpose of developing computational methods that are capable of learning with their previously acquired experiences. Although a large amount of machine learning techniques has been proposed and successfully applied in real systems, there are still many challenging issues, which need be addressed. In the last years, an increasing interest in techniques based on complex networks (large-scale graphs with nontrivial connection patterns) has been verified. This emergence is explained by the inherent advantages provided by the complex network representation, which is able to capture the spatial, topological and functional relations of the data. In this work, we investigate the new features and possible advantages offered by complex networks in the machine learning domain. In fact, we do show that the network-based approach really brings interesting features for supervised, semisupervised, and unsupervised learning. Specifically, we reformulate a previously proposed particle competition technique for both unsupervised and semisupervised learning using a stochastic nonlinear dynamical system. Moreover, an analytical analysis is supplied, which enables one to predict the behavior of the proposed technique. In addition to that, data reliability issues are explored in semisupervised learning. Such matter has practical importance and is found to be of little investigation in the literature. With the goal of validating these techniques for solving real problems, simulations on broadly accepted databases are conducted. Still in this work, we propose a hybrid supervised classification technique that combines both low and high orders of learning. The low level term can be implemented by any classification technique, while the high level term is realized by the extraction of features of the underlying network constructed from the input data. Thus, the former classifies the test instances by their physical features, while the latter measures the compliance of the test instances with the pattern formation of the data. Our study shows that the proposed technique not only can realize classification according to the semantic meaning of the data, but also is able to improve the performance of traditional classification techniques. Finally, it is expected that this study will contribute, in a relevant manner, to the machine learning area / Aprendizado de máquina figura-se como uma área de pesquisa que visa a desenvolver métodos computacionais capazes de aprender com a experiência. Embora uma grande quantidade de técnicas de aprendizado de máquina foi proposta e aplicada, com sucesso, em sistemas reais, existem ainda inúmeros problemas desafiantes que necessitam ser explorados. Nos últimos anos, um crescente interesse em técnicas baseadas em redes complexas (grafos de larga escala com padrões de conexão não triviais) foi verificado. Essa emergência é explicada pelas inerentes vantagens que a representação em redes complexas traz, sendo capazes de capturar as relações espaciais, topológicas e funcionais dos dados. Nesta tese, serão investigadas as possíveis vantagens oferecidas por redes complexas quando utilizadas no domínio de aprendizado de máquina. De fato, será mostrado que a abordagem por redes realmente proporciona melhorias nos aprendizados supervisionado, semissupervisionado e não supervisionado. Especificamente, será reformulada uma técnica de competição de partículas para o aprendizado não supervisionado e semissupervisionado por meio da utilização de um sistema dinâmico estocástico não linear. Em complemento, uma análise analítica de tal modelo será desenvolvida, permitindo o entendimento evolucional do modelo no tempo. Além disso, a questão de confiabilidade de dados será investigada no aprendizado semissupervisionado. Tal tópico tem importância prática e é pouco estudado na literatura. Com o objetivo de validar essas técnicas em problemas reais, simulações computacionais em bases de dados consagradas pela literatura serão conduzidas. Ainda nesse trabalho, será proposta uma técnica híbrica de classificação supervisionada que combina tanto o aprendizado de baixo como de alto nível. O termo de baixo nível pode ser implementado por qualquer técnica de classificação tradicional, enquanto que o termo de alto nível é realizado pela extração das características de uma rede construída a partir dos dados de entrada. Nesse contexto, aquele classifica as instâncias de teste segundo qualidades físicas, enquanto que esse estima a conformidade da instância de teste com a formação de padrões dos dados. Os estudos aqui desenvolvidos mostram que o método proposto pode melhorar o desempenho de técnicas tradicionais de classificação, além de permitir uma classificação de acordo com o significado semântico dos dados. Enfim, acredita-se que este estudo possa gerar contribuições relevantes para a área de aprendizado de máquina. Aprendizado competitivo Aprendizado não supervisionado Aprendizado semissupervisionado Caminhadas aleatórias Classificação de dados Classificação em alto nível Competição de partículas Competitive learning Complex networks Data classification Data clustering High level classification Particle competition Random walks Redes complexas Semisupervised learning Supervised learning Unsupervised learning
6	Machine learning in complex networks: modeling, analysis, and applications / Aprendizado de máquina em redes complexas: modelagem, análise e aplicações Thiago Christiano Silva 13 December 2012 (has links) Machine learning is evidenced as a research area with the main purpose of developing computational methods that are capable of learning with their previously acquired experiences. Although a large amount of machine learning techniques has been proposed and successfully applied in real systems, there are still many challenging issues, which need be addressed. In the last years, an increasing interest in techniques based on complex networks (large-scale graphs with nontrivial connection patterns) has been verified. This emergence is explained by the inherent advantages provided by the complex network representation, which is able to capture the spatial, topological and functional relations of the data. In this work, we investigate the new features and possible advantages offered by complex networks in the machine learning domain. In fact, we do show that the network-based approach really brings interesting features for supervised, semisupervised, and unsupervised learning. Specifically, we reformulate a previously proposed particle competition technique for both unsupervised and semisupervised learning using a stochastic nonlinear dynamical system. Moreover, an analytical analysis is supplied, which enables one to predict the behavior of the proposed technique. In addition to that, data reliability issues are explored in semisupervised learning. Such matter has practical importance and is found to be of little investigation in the literature. With the goal of validating these techniques for solving real problems, simulations on broadly accepted databases are conducted. Still in this work, we propose a hybrid supervised classification technique that combines both low and high orders of learning. The low level term can be implemented by any classification technique, while the high level term is realized by the extraction of features of the underlying network constructed from the input data. Thus, the former classifies the test instances by their physical features, while the latter measures the compliance of the test instances with the pattern formation of the data. Our study shows that the proposed technique not only can realize classification according to the semantic meaning of the data, but also is able to improve the performance of traditional classification techniques. Finally, it is expected that this study will contribute, in a relevant manner, to the machine learning area / Aprendizado de máquina figura-se como uma área de pesquisa que visa a desenvolver métodos computacionais capazes de aprender com a experiência. Embora uma grande quantidade de técnicas de aprendizado de máquina foi proposta e aplicada, com sucesso, em sistemas reais, existem ainda inúmeros problemas desafiantes que necessitam ser explorados. Nos últimos anos, um crescente interesse em técnicas baseadas em redes complexas (grafos de larga escala com padrões de conexão não triviais) foi verificado. Essa emergência é explicada pelas inerentes vantagens que a representação em redes complexas traz, sendo capazes de capturar as relações espaciais, topológicas e funcionais dos dados. Nesta tese, serão investigadas as possíveis vantagens oferecidas por redes complexas quando utilizadas no domínio de aprendizado de máquina. De fato, será mostrado que a abordagem por redes realmente proporciona melhorias nos aprendizados supervisionado, semissupervisionado e não supervisionado. Especificamente, será reformulada uma técnica de competição de partículas para o aprendizado não supervisionado e semissupervisionado por meio da utilização de um sistema dinâmico estocástico não linear. Em complemento, uma análise analítica de tal modelo será desenvolvida, permitindo o entendimento evolucional do modelo no tempo. Além disso, a questão de confiabilidade de dados será investigada no aprendizado semissupervisionado. Tal tópico tem importância prática e é pouco estudado na literatura. Com o objetivo de validar essas técnicas em problemas reais, simulações computacionais em bases de dados consagradas pela literatura serão conduzidas. Ainda nesse trabalho, será proposta uma técnica híbrica de classificação supervisionada que combina tanto o aprendizado de baixo como de alto nível. O termo de baixo nível pode ser implementado por qualquer técnica de classificação tradicional, enquanto que o termo de alto nível é realizado pela extração das características de uma rede construída a partir dos dados de entrada. Nesse contexto, aquele classifica as instâncias de teste segundo qualidades físicas, enquanto que esse estima a conformidade da instância de teste com a formação de padrões dos dados. Os estudos aqui desenvolvidos mostram que o método proposto pode melhorar o desempenho de técnicas tradicionais de classificação, além de permitir uma classificação de acordo com o significado semântico dos dados. Enfim, acredita-se que este estudo possa gerar contribuições relevantes para a área de aprendizado de máquina. Aprendizado competitivo Aprendizado não supervisionado Aprendizado semissupervisionado Caminhadas aleatórias Classificação de dados Classificação em alto nível Competição de partículas Redes complexas Competitive learning Complex networks Data classification Data clustering High level classification Particle competition Random walks Semisupervised learning Supervised learning Unsupervised learning

1

Page generated in 0.1003 seconds