Spelling suggestions: "subject:"engenharia eletrônico"" "subject:"enegenharia eletrônico""
491 |
Separação cega de sinais de fala utilizando detectores de voz. / Blind separation of speech signals using voice detectors.Ronaldo Alencar da Rocha 28 January 2014 (has links)
Neste trabalho contemplamos o emprego de detectores de voz como uma etapa de pré- processamento de uma técnica de separação cega de sinais implementada no domínio do tempo, que emprega estatísticas de segunda ordem para a separação de misturas convolutivas e determinadas. Seu algoritmo foi adaptado para realizar a separação tanto em banda cheia quanto em sub-bandas, considerando a presença e a ausência de instantes de silêncio em misturas de sinais de voz. A ideia principal consiste em detectar trechos das misturas que contenham atividade de voz, evitando que o algoritmo de separação seja acionado na ausência de voz, promovendo ganho de desempenho e redução do custo computacional. / In this work we contemplate the use of voice detectors as a preprocessing step of a time-domain blind source separation technique, employing second order statistics in the separation of convolutive and determined mixtures. This algorithm is adapted to perform the separation both in fullband and in subbands, considering the presence and the absence of a moments of silence in mixtures of voice signals. The main idea aims at detect portions of the mixtures containing voice activity, avoiding that the separation algorithm is triggered in the absence of voice, promoting performance improvement and reduced computational cost.
|
492 |
Análise de desempenho dos algoritmos Apriori e Fuzzy Apriori na extração de regras de associação aplicados a um Sistema de Detecção de Intrusos. / Performance analysis of algorithms Apriori and Fuzzy Apriori in association rules mining applied to a System for Intrusion Detection.Ricardo Ferreira Vieira de Castro 20 February 2014 (has links)
A extração de regras de associação (ARM - Association Rule Mining) de dados quantitativos tem sido pesquisa de grande interesse na área de mineração de dados. Com o crescente aumento das bases de dados, há um grande investimento na área de pesquisa na criação de algoritmos para melhorar o desempenho relacionado a quantidade de regras, sua relevância e a performance computacional. O algoritmo APRIORI, tradicionalmente usado na extração de regras de associação, foi criado originalmente para trabalhar com atributos categóricos. Geralmente, para usá-lo com atributos contínuos, ou quantitativos, é necessário transformar os atributos contínuos, discretizando-os e, portanto, criando categorias a partir dos intervalos discretos. Os métodos mais tradicionais de discretização produzem intervalos com fronteiras sharp, que podem subestimar ou superestimar elementos próximos dos limites das partições, e portanto levar a uma representação imprecisa de semântica. Uma maneira de tratar este problema é criar partições soft, com limites suavizados. Neste trabalho é utilizada uma partição fuzzy das variáveis contínuas, que baseia-se na teoria dos conjuntos fuzzy e transforma os atributos quantitativos em partições de termos linguísticos. Os algoritmos de mineração de regras de associação fuzzy (FARM - Fuzzy Association Rule Mining) trabalham com este princípio e, neste trabalho, o algoritmo FUZZYAPRIORI, que pertence a esta categoria, é utilizado. As regras extraídas são expressas em termos linguísticos, o que é mais natural e interpretável pelo raciocício humano. Os algoritmos APRIORI tradicional e FUZZYAPRIORI são comparado, através de classificadores associativos, baseados em regras extraídas por estes algoritmos. Estes classificadores foram aplicados em uma base de dados relativa a registros de conexões TCP/IP que destina-se à criação de um Sistema de Detecção de Intrusos. / The mining of association rules of quantitative data has been of great research interest in the area of data mining. With the increasing size of databases, there is a large investment in research in creating algorithms to improve performance related to the amount of rules, its relevance and computational performance. The APRIORI algorithm, traditionally used in the extraction of association rules, was originally created to work with categorical attributes. In order to use continuous attributes, it is necessary to transform the continuous attributes, through discretization, into categorical attributes, where each categorie corresponds to a discrete interval. The more traditional discretization methods produce intervals with sharp boundaries, which may underestimate or overestimate elements near the boundaries of the partitions, therefore inducing an inaccurate semantical representation. One way to address this problem is to create soft partitions with smoothed boundaries. In this work, a fuzzy partition of continuous variables, which is based on fuzzy set theory is used. The algorithms for mining fuzzy association rules (FARM - Fuzzy Association Rule Mining) work with this principle, and, in this work, the FUZZYAPRIORI algorithm is used. In this dissertation, we compare the traditional APRIORI and the FUZZYAPRIORI, through classification results of associative classifiers based on rules extracted by these algorithms. These classifiers were applied to a database of records relating to TCP / IP connections that aims to create an Intrusion Detection System.
|
493 |
Algoritmos distribuídos para alocação dinâmica de tarefas em enxame de robôs. / Distributed algorithms for dynamic task allocation using swarm of robots.Rafael Mathias de Mendonça 21 February 2014 (has links)
A Inteligência de Enxame foi proposta a partir da observação do comportamento social de espécies de insetos, pássaros e peixes. A ideia central deste comportamento coletivo é executar uma tarefa complexa decompondo-a em tarefas simples, que são facilmente executadas pelos indivíduos do enxame. A realização coordenada destas tarefas simples, respeitando uma proporção pré-definida de execução, permite a realização da tarefa complexa. O problema de alocação de tarefas surge da necessidade de alocar as tarefas aos indivíduos de modo coordenado, permitindo o gerenciamento do enxame. A alocação de tarefas é um processo dinâmico pois precisa ser continuamente ajustado em resposta a alterações no ambiente, na configuração do enxame e/ou no desempenho do mesmo. A robótica de enxame surge deste contexto de cooperação coletiva, ampliada à robôs reais. Nesta abordagem, problemas complexos são resolvidos pela realização de tarefas complexas por enxames de robôs simples, com capacidade de processamento e comunicação limitada. Objetivando obter flexibilidade e confiabilidade, a alocação deve emergir como resultado de um processo distribuído. Com a descentralização do problema e o aumento do número de robôs no enxame, o processo de alocação adquire uma elevada complexidade. Desta forma, o problema de alocação de tarefas pode ser caracterizado como um processo de otimização que aloca as tarefas aos robôs, de modo que a proporção desejada seja atendida no momento em que o processo de otimização encontre a solução desejada. Nesta dissertação, são propostos dois algoritmos que seguem abordagens distintas ao problema de alocação dinâmica de tarefas, sendo uma local e a outra global. O algoritmo para alocação dinâmica de tarefas com abordagem local (ADTL) atualiza a alocação de tarefa de cada robô a partir de uma avaliação determinística do conhecimento atual que este possui sobre as tarefas alocadas aos demais robôs do enxame. O algoritmo para alocação dinâmica de tarefas com abordagem global (ADTG) atualiza a alocação de tarefas do enxame com base no algoritmo de otimização PSO (Particle swarm optimization). No ADTG, cada robô possui uma possível solução para a alocação do enxame que é continuamente atualizada através da troca de informação entre os robôs. As alocações são avaliadas quanto a sua aptidão em atender à proporção-objetivo. Quando é identificada a alocação de maior aptidão no enxame, todos os robôs do enxame são alocados para as tarefas definidas por esta alocação. Os algoritmos propostos foram implementados em enxames com diferentes arranjos de robôs reais demonstrando sua eficiência e eficácia, atestados pelos resultados obtidos. / Swarm Intelligence has been proposed based on the observation of social behavior of insect species, birds and fishes. The main idea of this collective behavior is to perform a complex task decomposing it into many simple tasks, that can be easily performed by individuals of the swarm. Coordinated realization of these simple tasks while adhering to a pre-defined distribution of execution, allows for the achievement of the original complex task. The problem of task allocation arises from the need of assigning tasks to individuals in a coordinated fashion, allowing a good management of the swarm. Task allocation is a dynamic process because it requires a continuous adjustment in response to changes in the environment, the swarm configuration and/or the performance of the swarm. Swarm robotics emerges from this context of collective cooperation applied to swarms of real robots. In this approach, complex problems are solved by performing complex tasks using swarms of simple robots, with a limited processing and communication capabilities. Aiming at achieving flexibility and reliability, the allocation should emerge as a result of a distributed process. With the decentralization of the problem and the increasing number of robots in the swarm, the allocation process acquires a high complexity. Thus, the problem of task allocation can be characterized as an optimization process that assigns tasks to robots, so that the desired proportion is met at the end of the optimization process, find the desired solution. In this dissertation, we propose two algorithms that follow different to the problem of dynamic task allocation approaches: one is local and the other global. The algorithm for dynamic allocation of tasks with a local approach (ADTL) updates the task assignment of each robot based on a deterministic assessment of the current knowledge it has so far about the tasks allocated to the other robots of the swarm. The algorithm for dynamic task allocation with a global approach (ADTG) updates the allocation of tasks based on a swarm optimization process, inspired by PSO (Particle swarm optimization). In ADTG, each robot has a possible solution to the swarm allocation, which is continuously updated through the exchange of information between the robots. The allocations are evaluated for their fitness in meeting the goal proportion. When the allocation of highest fitness in the swarm is identified, all robots of the swarm are allocated to the tasks defined by this allocation. The proposed algorithms were implemented on swarms of different arrangements of real robots demonstrating their efficacy, robustness and efficiency, certified by obtained the results.
|
494 |
Agrupamento espacial em robótica de enxame. / Spatial clustering in swarm robotics.Nicolás Bulla Cruz 15 April 2014 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Os Sistemas Multi-Robôs proporcionam vantagens sobre um robô individual, quando da realização de uma tarefa com maiores velocidade, precisão e tolerância a falhas. Os estudos dos comportamentos sociais na natureza têm permitido desenvolver algoritmos bio-inspirados úteis na área da robótica de enxame. Seguindo instruções simples e repetitivas, grupos de robôs, fisicamente limitados, conseguem solucionar problemas complexos. Quando existem duas ou mais tarefas a serem realizadas e o conjunto de robôs é heterogêneo, é possível agrupá-los de acordo com as funcionalidades neles disponíveis. No caso em que o conjunto de robôs é homogêneo, o agrupamento pode ser realizado considerando a posição relativa do robô em relação a uma tarefa ou acrescentando alguma característica distintiva. Nesta dissertação, é proposta uma técnica de clusterização espacial baseada simplesmente na comunicação local de robôs. Por meio de troca de mensagens entre os robôs vizinhos, esta técnica permite formar grupos de robôs espacialmente próximos sem precisar movimentar os robôs. Baseando-se nos métodos de clusterização de fichas, a técnica proposta emprega a noção de fichas virtuais, que são chamadas de cargas, sendo que uma carga pode ser estática ou dinâmica. Se uma carga é estática permite determinar a classe à qual um robô pertence. Dependendo da quantidade e do peso das cargas disponíveis no sistema, os robôs intercambiam informações até alcançar uma disposição homogênea de cargas. Quando as cargas se tornam estacionárias, é calculada uma densidade que permite guiar aquelas que estão ainda em movimento. Durante as experiências, foi observado visualmente que as cargas com maior peso acabam se agrupando primeiro enquanto aquelas com menor peso continuam se deslocando no enxame, até que estas cargas formem faixas de densidades diferenciadas para cada classe, alcançando assim o objetivo final que é a clusterização dos robôs. / Multi-Robots Systems provide advantages over a single robot when performing a task, achieving a greater speed, higher accuracy and better fault tolerance. The studies of social behavior in nature have allowed to develop bio-inspired algorithms useful in swarm robotics. Following simple and repetitive rules, groups of robots can provide solutions to complex problems. When two or more tasks to be executed by a set of heterogeneous robots, it is possible to cluster the robots according to their intrinsic features. When homogeneous robots are used, the clustering may be achieved by considering the robot relative position regarding the location where the task has to be performed or adding some other distinct feature. In this dissertation, a technique for spatial clustering simply based on local communication between robots is proposed. Through the message exchange between neighboring robots, this technique allows cluster formation without robot movement. Based on the token clustering methods, the proposed technique employs a virtual token, which is called a load. The load allows identifying the class to which a robot belongs. Depending on the amount and weight of the loads available in the system, the robots interchange information to achieve uniform load distribution. When the loads become stationaries, a density is calculated as to guide the remaining loads that are still in motion. As a consequence, the loads of higher weight cluster first and the those of lower weight continue shifting through the swarm, until they start forming different density ranges for each class, thereby achieving the final aim which is robot clustering.
|
495 |
Modelagem Fuzzy para previsão de uma série temporal de energia elétrica. / Fuzzy modeling to forecast a time series electric power.Cesar Machado Pereira 24 February 2015 (has links)
Esta dissertação testa e compara dois tipos de modelagem para previsão de uma
mesma série temporal. Foi observada uma série temporal de distribuição de energia elétrica e,
como estudo de caso, optou-se pela região metropolitana do Estado da Bahia. Foram testadas
as combinações de três variáveis exógenas em cada modelo: a quantidade de clientes ligados
na rede de distribuição de energia elétrica, a temperatura ambiente e a precipitação de chuvas.
O modelo linear de previsão de séries temporais utilizado foi um SARIMAX. A modelagem
de inteligência computacional utilizada para a previsão da série temporal foi um sistema de
Inferência Fuzzy. Na busca de um melhor desempenho, foram feitos testes de quais variáveis
exógenas melhor influenciam no comportamento da energia distribuída em cada modelo.
Segundo a avaliação dos testes, o sistema Fuzzy de previsão foi o que obteve o menor erro.
Porém dentre os menores erros, os resultados dos testes também indicaram diferentes
variáveis exógenas para cada modelo de previsão. / This dissertation tests and compares two types of predicting models to the same time
series. A time series of electricity distribution was observed and, as a case study, were opted
for the metropolitan region of Bahia State. Three exogenous variables were tested in each
model: the number of customers connected to the electricity distribution network, the
temperature and the precipitation of rain. The linear model time series forecasting used was a
SARIMAX. The modelling of computational intelligence used to predict the time series was a
Fuzzy Inference System. For better performance, in each model was tested all the exogenous
variables to fit the influence in the energy distributed. According to the evaluation of the tests,
the Fuzzy forecasting system presented the lowest error. But among the smallest errors, the
results of the tests also indicated different exogenous variables for each forecast model.
|
496 |
Lógica nebulosa aplicada a um sistema de detecção de intrusos em computação em nuvem. / A fuzzy system intrusiondetection for cloud computing.Carolina Yoshico Ji 16 August 2013 (has links)
O objetivo deste trabalho é avaliar os riscos de ocorrências de intrusos em um sistema
de computação em nuvem para sistemas distribuídos utilizando lógica nebulosa. A
computação em nuvem é um tema que vem sendo bastante abordado e vem alavancando
discussões calorosas, tanto na comunidade acadêmica quanto em palestras profissionais.
Embora essa tecnologia esteja ganhando mercado, alguns estudiosos encontram-se céticos
afirmando que ainda é cedo para se tirar conclusões. Isto se deve principalmente por causa de
um fator crítico, que é a segurança dos dados armazenados na nuvem. Para esta dissertação,
foi elaborado um sistema distribuído escrito em Java com a finalidade de controlar um
processo de desenvolvimento colaborativo de software na nuvem, o qual serviu de estudo de
caso para avaliar a abordagem de detecção de intrusos proposta. Este ambiente foi construído
com cinco máquinas (sendo quatro máquinas virtuais e uma máquina real). Foram criados
dois sistemas de inferência nebulosos, para análise de problemas na rede de segurança
implementados em Java, no ambiente distribuído. Foram realizados diversos testes com o
intuito de verificar o funcionamento da aplicação, apresentando um resultado satisfatório
dentro dessa metodologia. / The objective of this study is to evaluate the risk of occurrence of intruders in a system
of cloud computing at distributed systems using fuzzy logic. Cloud computing is a topic that
has been widely discussed and has been leveraging heated discussions, both in academic and
in professional speaking. Although this technology is gaining market share, some academics
are incredulous saying that is too early to draw conclusions. This is mainly because of a
critical factor, which is the security of data stored in the cloud. For this thesis, we designed a
distributed system written in Java, with the purpose of controlling a process of softwares
development in the cloud, wich served as a case study to evaluate the approach proposed
intrusion detection. This environment was build with five machines (being four virtual
machines and one real machine). It was created two fuzzy inference systems for analysis of
problems in network security implemented in Java, in the distributed environment. Several
tests were performed in order to verify the functionality of the application, presenting a
satisfactory outcome within this methodology.
|
497 |
Hardware reconfigurável para geração de música harmonizada utilizando autômatos celulares. / Reconfigurable hardware for music composition using cellular automata.Heloísa Diná Félix Lima Bezerra 29 August 2013 (has links)
Desde os primórdios da humanidade, a descoberta do método de processamento cerebral do som, e consequentemente da música, fazem parte do imaginário humano. Portanto, as pesquisas relacionadas a este processo constituem um dos mais vastos campos de estudos das áreas de ciências. Dentre as inúmeras tentativas para compreensão do processamento biológico do som, o ser humano inventou o processo automático de composição musical, com o intuito de aferir a possibilidade da realização de composições musicais de qualidade sem a imposição sentimental, ou seja, apenas com a utilização das definições e estruturas de música existentes. Este procedimento automático de composição musical, também denominado música aleatória ou música do acaso, tem sido vastamente explorado ao longo dos séculos, já tendo sido utilizado por alguns dos grandes nomes do cenário musical, como por exemplo, Mozart. Os avanços nas áreas de engenharia e computação permitiram a evolução dos métodos utilizados para composição de música aleatória, tornando a aplicação de autômatos celulares uma alternativa viável para determinação da sequência de execução de notas musicais e outros itens utilizados durante a composição deste tipo de música. Esta dissertação propõe uma arquitetura para geração de música harmonizada a partir de intervalos melódicos determinados por autômatos celulares, implementada em hardware reconfigurável do tipo FPGA. A arquitetura proposta possui quatro tipos de autômatos celulares, desenvolvidos através dos modelos de vizinhança unidimensional de Wolfram, vizinhança bidimensional de Neumann, vizinhança bidimensional Moore e vizinhança tridimensional de Neumann, que podem ser combinados de 16 formas diferentes para geração de melodias. Os resultados do processamento realizado pela arquitetura proposta são melodias no formato .mid, compostas através da utilização de dois autômatos celulares, um para escolha das notas e outro para escolha dos instrumentos a serem emulados, de acordo com o protocolo MIDI. Para tal esta arquitetura é formada por três unidades principais, a unidade divisor de frequência, que é responsável pelo sincronismo das tarefas executadas pela arquitetura, a unidade de conjunto de autômatos celulares, que é responsável pelo controle e habilitação dos autômatos celulares, e a unidade máquina MIDI, que é responsável por organizar os resultados de cada iteração corrente dos autômatos celulares e convertê-los conforme a estrutura do protocolo MIDI, gerando-se assim o produto musical. A arquitetura proposta é parametrizável, de modo que a configuração dos dados que influenciam no produto musical gerado, como por exemplo, a definição dos conjuntos de regras para os autômatos celulares habilitados, fica a cargo do usuário, não havendo então limites para as combinações possíveis a serem realizadas na arquitetura. Para validação da funcionalidade e aplicabilidade da arquitetura proposta, alguns dos resultados obtidos foram apresentados e detalhados através do uso de técnicas de obtenção de informação musical. / Since the beginnings of mankind, questions about the method of sound processing in the brain, and hence the music, are part of the human imagination. Therefore, the researches related to this process constitute one of the largest fields of research in science. Among many attempts to understand the biological processing of sound, humans beings invented the automatic musical composition automatic process in order to verify the possibility of producing quality musical compositions, without the human interference, wich means, only by using the definitions and structures of existing pieces of music. This automatic music composition procedure, also known as random music, has been widely exploited over the past centuries, being used by greats musicians like Mozart. The advances in engineering and computing allowed the evolution of random music composition methods, making the application of cellular automata a viable alternative to determine the execution sequence of musical notes, as well as, other items used in this type of composition. This dissertation proposes a hardware architecture for random music composition using cellular automata to determine the melodic intervals order. A prototype has been implemented in FPGA. The proposed hardware architecture has four kind of cellular automata, modeled according to the one-dimensional Wolfram neighborhood, two-dimensional Neumann neighborhood, two-dimensional Moore neighborhood and three-dimensional Neumann neighborhood. These cellular automata can be combined in sixteen different ways for generating melodies. The processing result as conducted by the proposed architecture are melodies in the .mid format, through the use of two cellular automata, one for selecting notes and the others for choosing the instruments to be emulated, in accordance with the MIDI protocol. This hardware is composed by three main units, the frequency divider unit, which is responsible for the synchronizing of the tasks performed by the hardware architecture, the cellular automata set unit, which is responsible for the control and enabling of the cellular automata and the MIDI machine, which is responsible for organizing the iterations of the cellular automata and convert them to the MIDI protocol structure, generating the final musical composition. The proposed hardware architecture is parametrizable, so that the data settings that influence the final product, such as, the rules of the cellular automata, are informed by the user. There are no limits regarding the possible combinations to be performed in the hardware architecture. In order to validate the functionality and applicability of the proposed hardware, some results were presented and detailed through the use of techniques for musical information retrieval.
|
498 |
Síntese de árvores de padrões Fuzzy através de Programação Genética Cartesiana. / Synthesis of Fuzzy pattern trees by Cartesian Genetic Programming.Anderson Rodrigues dos Santos 30 July 2014 (has links)
Esta dissertação apresenta um sistema de indução de classificadores fuzzy. Ao invés
de utilizar a abordagem tradicional de sistemas fuzzy baseados em regras, foi utilizado o
modelo de Árvore de Padrões Fuzzy(APF), que é um modelo hierárquico, com uma estrutura
baseada em árvores que possuem como nós internos operadores lógicos fuzzy e as folhas são
compostas pela associação de termos fuzzy com os atributos de entrada. O classificador foi
obtido sintetizando uma árvore para cada classe, esta árvore será uma descrição lógica da
classe o que permite analisar e interpretar como é feita a classificação. O método de
aprendizado originalmente concebido para a APF foi substituído pela Programação Genética
Cartesiana com o intuito de explorar melhor o espaço de busca. O classificador APF foi
comparado com as Máquinas de Vetores de Suporte, K-Vizinhos mais próximos, florestas
aleatórias e outros métodos Fuzzy-Genéticos em diversas bases de dados do UCI Machine
Learning Repository e observou-se que o classificador APF apresenta resultados
competitivos. Ele também foi comparado com o método de aprendizado original e obteve
resultados comparáveis com árvores mais compactas e com um menor número de avaliações. / This work presents a system for induction of fuzzy classifiers. Instead of the
traditional fuzzy based rules, it was used a model called Fuzzy Pattern Trees (FPT), which is a
hierarchical tree-based model, having as internal nodes, fuzzy logical operators and the leaves
are composed of a combination of fuzzy terms with the input attributes. The classifier was
obtained by creating a tree for each class, this tree will be a logic class description which
allows the interpretation of the results. The learning method originally designed for FPT was
replaced by Cartesian Genetic Programming in order to provide a better exploration of the
search space. The FPT classifier was compared against Support Vector Machines, K Nearest
Neighbour, Random Forests and others Fuzzy-Genetics methods on several datasets from the
UCI Machine Learning Repository and it presented competitive results. It was also compared
with Fuzzy Pattern trees generated by the former learning method and presented comparable
results with smaller trees and a lower number of functions evaluations.
|
499 |
Separação cega de sinais de fala utilizando detectores de voz. / Blind separation of speech signals using voice detectors.Ronaldo Alencar da Rocha 28 January 2014 (has links)
Neste trabalho contemplamos o emprego de detectores de voz como uma etapa de pré- processamento de uma técnica de separação cega de sinais implementada no domínio do tempo, que emprega estatísticas de segunda ordem para a separação de misturas convolutivas e determinadas. Seu algoritmo foi adaptado para realizar a separação tanto em banda cheia quanto em sub-bandas, considerando a presença e a ausência de instantes de silêncio em misturas de sinais de voz. A ideia principal consiste em detectar trechos das misturas que contenham atividade de voz, evitando que o algoritmo de separação seja acionado na ausência de voz, promovendo ganho de desempenho e redução do custo computacional. / In this work we contemplate the use of voice detectors as a preprocessing step of a time-domain blind source separation technique, employing second order statistics in the separation of convolutive and determined mixtures. This algorithm is adapted to perform the separation both in fullband and in subbands, considering the presence and the absence of a moments of silence in mixtures of voice signals. The main idea aims at detect portions of the mixtures containing voice activity, avoiding that the separation algorithm is triggered in the absence of voice, promoting performance improvement and reduced computational cost.
|
500 |
Análise de desempenho dos algoritmos Apriori e Fuzzy Apriori na extração de regras de associação aplicados a um Sistema de Detecção de Intrusos. / Performance analysis of algorithms Apriori and Fuzzy Apriori in association rules mining applied to a System for Intrusion Detection.Ricardo Ferreira Vieira de Castro 20 February 2014 (has links)
A extração de regras de associação (ARM - Association Rule Mining) de dados quantitativos tem sido pesquisa de grande interesse na área de mineração de dados. Com o crescente aumento das bases de dados, há um grande investimento na área de pesquisa na criação de algoritmos para melhorar o desempenho relacionado a quantidade de regras, sua relevância e a performance computacional. O algoritmo APRIORI, tradicionalmente usado na extração de regras de associação, foi criado originalmente para trabalhar com atributos categóricos. Geralmente, para usá-lo com atributos contínuos, ou quantitativos, é necessário transformar os atributos contínuos, discretizando-os e, portanto, criando categorias a partir dos intervalos discretos. Os métodos mais tradicionais de discretização produzem intervalos com fronteiras sharp, que podem subestimar ou superestimar elementos próximos dos limites das partições, e portanto levar a uma representação imprecisa de semântica. Uma maneira de tratar este problema é criar partições soft, com limites suavizados. Neste trabalho é utilizada uma partição fuzzy das variáveis contínuas, que baseia-se na teoria dos conjuntos fuzzy e transforma os atributos quantitativos em partições de termos linguísticos. Os algoritmos de mineração de regras de associação fuzzy (FARM - Fuzzy Association Rule Mining) trabalham com este princípio e, neste trabalho, o algoritmo FUZZYAPRIORI, que pertence a esta categoria, é utilizado. As regras extraídas são expressas em termos linguísticos, o que é mais natural e interpretável pelo raciocício humano. Os algoritmos APRIORI tradicional e FUZZYAPRIORI são comparado, através de classificadores associativos, baseados em regras extraídas por estes algoritmos. Estes classificadores foram aplicados em uma base de dados relativa a registros de conexões TCP/IP que destina-se à criação de um Sistema de Detecção de Intrusos. / The mining of association rules of quantitative data has been of great research interest in the area of data mining. With the increasing size of databases, there is a large investment in research in creating algorithms to improve performance related to the amount of rules, its relevance and computational performance. The APRIORI algorithm, traditionally used in the extraction of association rules, was originally created to work with categorical attributes. In order to use continuous attributes, it is necessary to transform the continuous attributes, through discretization, into categorical attributes, where each categorie corresponds to a discrete interval. The more traditional discretization methods produce intervals with sharp boundaries, which may underestimate or overestimate elements near the boundaries of the partitions, therefore inducing an inaccurate semantical representation. One way to address this problem is to create soft partitions with smoothed boundaries. In this work, a fuzzy partition of continuous variables, which is based on fuzzy set theory is used. The algorithms for mining fuzzy association rules (FARM - Fuzzy Association Rule Mining) work with this principle, and, in this work, the FUZZYAPRIORI algorithm is used. In this dissertation, we compare the traditional APRIORI and the FUZZYAPRIORI, through classification results of associative classifiers based on rules extracted by these algorithms. These classifiers were applied to a database of records relating to TCP / IP connections that aims to create an Intrusion Detection System.
|
Page generated in 0.0921 seconds