191 |
Sistema de geração de energia elétrica para acionamento de cargas embarcadas em máquinas agrícolas / Electric power generation system for drive embedded loads in agricultural machinesRusso, Edison 21 August 2018 (has links)
Orientador: Nelson Luis Cappelli / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola / Made available in DSpace on 2018-08-21T23:27:46Z (GMT). No. of bitstreams: 1
Russo_Edison_D.pdf: 5119506 bytes, checksum: 164ce3ee3d6ecb77b603406874b8bbfd (MD5)
Previous issue date: 2012 / Resumo: A crescente demanda por acionamentos e sistemas elétricos nas máquinas e implementos agrícolas aponta para a necessidade de disponibilização de energia elétrica, em quantidade e qualidade suficientes para o bom funcionamento das mesmas. Neste sentido, a utilização de alternadores veiculares, instalados diretamente nos implementos agrícolas e com acionamento mecânico a partir da tomada de potência, pode apresentar-se como uma alternativa viável, configurando-se no escopo deste trabalho. Na concepção original, esses alternadores possuem um sistema de regulação da tensão de saída gerada, baseado em um controlador do tipo liga-desliga, com o uso de um banco de baterias. A necessidade do uso de baterias, neste tipo de controlador, pode ser um fator restritivo à sua utilização devido à característica sazonal de operação das máquinas e implementos agrícolas. O presente trabalho teve como hipótese analisar a viabilidade técnica de se obter energia elétrica junto a um implemento agrícola, a partir da tomada de potência do trator, por meio de um alternador veicular, sem a necessidade da utilização de baterias e com um sistema de controle da corrente de excitação de campo, que seja capaz de manter a tensão de saída dentro dos limites de operação toleráveis. Para tanto, obteve-se o modelo matemático do alternador utilizado, avaliou-se e simulou-se o sistema original de controle de tensão do tipo liga-desliga, projetou se e simulou-se um sistema de controle fuzzy e implementou-se e testou-se o mesmo em uma bancada de testes. Optou-se pela implementação de um controlador fuzzy com múltiplas entradas (velocidade angular, erro de tensão gerada e corrente de carga) e uma saída (corrente de excitação de campo), o que impossibilita o uso de um sistema de controle PID convencional. Para a implementação do controlador fuzzy foram criadas as variáveis linguísticas e a base de regras a partir do conhecimento especialista. Os resultados obtidos permitem concluir que o sistema de controle fuzzy, quando comparado com o sistema liga desliga, original do alternador, apresenta nitidamente, um incremento de desempenho, com melhor capacidade do mesmo em manter a tensão de saída na faixa de operação, mesmo quando ocorrem variações na corrente de carga e na velocidade angular de acionamento / Abstract: The increasing demand for electrical systems and drives in agricultural machinery and implements points to the need for provision of electricity in sufficient quantity and quality for the smooth functioning of the same. In this sense, the use of vehicle alternators installed directly on agricultural implements and mechanically driven by the tractor's power take-off may represent a viable alternative, integrating the scope of this work. As built, these alternators have an output-voltage regulator system based on an on-off controller and a battery bank. The necessity of batteries in this type of controller can be a limiting factor to its use due the seasonal characteristic operation of the farm machinery and implements. This work had as hypothesis, to analyze the technical viability of obtaining electricity at an agricultural implement from the tractor's power take-off, through a vehicular alternator, without using batteries and with a field-current excitation control system, capable of maintaining the output voltage within the tolerable operation limits. Therefore, it was obtained the mathematical model of the alternator, simulated and evaluated between the original on-off voltage-control systems, a fuzzy control system was designed and simulated and finally implemented in a test bench. It was opted for the implementation of a fuzzy controller with multiple inputs (angular velocity, and voltage error generated load current) and one output (excitation current field), which precludes the use of a conventional PID control system. For the implementation of the fuzzy controller, were created linguistics variables and an expert knowledge base-rule. The results obtained allow concluding that the fuzzy control system, in comparison within on-off system, has a clearly performance increased, and also, improved ability to maintain the output voltage in its operation range in the occurrence of angular speed and load disorder / Doutorado / Maquinas Agricolas / Doutor em Engenharia Agrícola
|
192 |
Evolving granular systems = Sistemas granulares evolutivos / Sistemas granulares evolutivosLeite, Daniel Furtado 21 August 2018 (has links)
Orientador: Fernando Antonio Campos Gomide / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-21T02:35:33Z (GMT). No. of bitstreams: 1
Leite_DanielFurtado_D.pdf: 12632242 bytes, checksum: f537e4a24d7322d87dc0aca9ba758b48 (MD5)
Previous issue date: 2012 / Resumo: Recentemente tem-se observado um crescente interesse em abordagens de modelagem computacional para lidar com fluxos de dados do mundo real. Métodos e algoritmos têm sido propostos para obtenção de conhecimento a partir de conjuntos de dados muito grandes e, a princípio, sem valor aparente. Este trabalho apresenta uma plataforma computacional para modelagem granular evolutiva de fluxos de dados incertos. Sistemas granulares evolutivos abrangem uma variedade de abordagens para modelagem on-line inspiradas na forma com que os humanos lidam com a complexidade. Esses sistemas exploram o fluxo de informação em ambiente dinâmico e extrai disso modelos que podem ser linguisticamente entendidos. Particularmente, a granulação da informação é uma técnica natural para dispensar atenção a detalhes desnecessários e enfatizar transparência, interpretabilidade e escalabilidade de sistemas de informação. Dados incertos (granulares) surgem a partir de percepções ou descrições imprecisas do valor de uma variável. De maneira geral, vários fatores podem afetar a escolha da representação dos dados tal que o objeto representativo reflita o significado do conceito que ele está sendo usado para representar. Neste trabalho são considerados dados numéricos, intervalares e fuzzy; e modelos intervalares, fuzzy e neuro-fuzzy. A aprendizagem de sistemas granulares é baseada em algoritmos incrementais que constroem a estrutura do modelo sem conhecimento anterior sobre o processo e adapta os parâmetros do modelo sempre que necessário. Este paradigma de aprendizagem é particularmente importante uma vez que ele evita a reconstrução e o retreinamento do modelo quando o ambiente muda. Exemplos de aplicação em classificação, aproximação de função, predição de séries temporais e controle usando dados sintéticos e reais ilustram a utilidade das abordagens de modelagem granular propostas. O comportamento de fluxos de dados não-estacionários com mudanças graduais e abruptas de regime é também analisado dentro do paradigma de computação granular evolutiva. Realçamos o papel da computação intervalar, fuzzy e neuro-fuzzy em processar dados incertos e prover soluções aproximadas de alta qualidade e sumário de regras de conjuntos de dados de entrada e saída. As abordagens e o paradigma introduzidos constituem uma extensão natural de sistemas inteligentes evolutivos para processamento de dados numéricos a sistemas granulares evolutivos para processamento de dados granulares / Abstract: In recent years there has been increasing interest in computational modeling approaches to deal with real-world data streams. Methods and algorithms have been proposed to uncover meaningful knowledge from very large (often unbounded) data sets in principle with no apparent value. This thesis introduces a framework for evolving granular modeling of uncertain data streams. Evolving granular systems comprise an array of online modeling approaches inspired by the way in which humans deal with complexity. These systems explore the information flow in dynamic environments and derive from it models that can be linguistically understood. Particularly, information granulation is a natural technique to dispense unnecessary details and emphasize transparency, interpretability and scalability of information systems. Uncertain (granular) data arise from imprecise perception or description of the value of a variable. Broadly stated, various factors can affect one's choice of data representation such that the representing object conveys the meaning of the concept it is being used to represent. Of particular concern to this work are numerical, interval, and fuzzy types of granular data; and interval, fuzzy, and neurofuzzy modeling frameworks. Learning in evolving granular systems is based on incremental algorithms that build model structure from scratch on a per-sample basis and adapt model parameters whenever necessary. This learning paradigm is meaningful once it avoids redesigning and retraining models all along if the system changes. Application examples in classification, function approximation, time-series prediction and control using real and synthetic data illustrate the usefulness of the granular approaches and framework proposed. The behavior of nonstationary data streams with gradual and abrupt regime shifts is also analyzed in the realm of evolving granular computing. We shed light upon the role of interval, fuzzy, and neurofuzzy computing in processing uncertain data and providing high-quality approximate solutions and rule summary of input-output data sets. The approaches and framework introduced constitute a natural extension of evolving intelligent systems over numeric data streams to evolving granular systems over granular data streams / Doutorado / Automação / Doutor em Engenharia Elétrica
|
193 |
Sistemas dinamicos e controladores fuzzy : um estudo da dispersão da morte subita dos citros em São Paulo / Dynamic systems and fuzzy controllers : a study of the dispersion of the Citrus Sudden Death in São PauloPeixoto, Magda da Silva 24 February 2005 (has links)
Orientadores: Laecio Carvalho de Barros, Rodney Carlos Bassanezi / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-04T02:48:57Z (GMT). No. of bitstreams: 1
Peixoto_MagdadaSilva_D.pdf: 4244795 bytes, checksum: 6ed64db20c222bb5bb2e020084610233 (MD5)
Previous issue date: 2005 / Resumo: A Morte Súbita dos Citros é uma doença que afeta e mata laranjeiras doces e as tangerineiras Cmvo e Ponkan enxertadas sobre limoeiros Cmvo e Volkameriano, que representam cerca de 85% dos pomares cítricos de São Paulo e sul do Triângulo Mineiro. Acredita-se que tal doença seja causada por vírus transmitidos por pulgões (vetor) de citros. Para estudar a disseminação da doença propomos um modelo de simulação a partir de autômatos celulares, o qual leva em conta o efeito do vento nas distâncias alcançadas pelo pulgão. Para estabelecer a relação entre espaço percorrido pelo vetor e a intensidade do vento utilizamos um sistema baseado em regras fuzzy. Para estudar a densidade populacional dos pulgões, levamos em conta que eles têm a joaninha como principal predador natural. Estabelecemos uma base de regras fuzzy para modelar a interação pulgões e joaninhas. As trajetórias obtidas no plano de fase são comparadas com as de um modelo determinístico presa-predador do tipo Holling- Tanner e também a um modelo determinístico presa-predador de Lotlm- Volterra. A partir dos resultados obtidos, iniciamos um estudo para investigar alguma política de controle da Morte Súbita dos Citros / Abstract: Citrus Sudden Death is a relatively new disease that has affected and killed sweet oranges grafted on the Rangpur lime. This is a worrying characteristic because the Rangpur lime amounts to 85% of the citrus orchards in São Paulo and the south of "Triângulo Mineiro". It is believed that the disease is caused by a virus transmitted by citrus aphids (vectors). We have adopted the Cellular Automata model to study the advance of the disease, which considers the effect of the wind in the distances reached by the aphids. We have adopted the rule-based fuzzy system to establish the relationship between the space covered by the vector and the intensity of the wind. To study the population density of aphids, we have considered that the ladybug is its main enemy. The trajectories of the phase-plane are compared to those of deterministic predatorprey models of the Holling- Tanner and Lotka- Volterra types. From the obtained results, we have begun a study to investigate some control policies for the Citrus Sudden Death / Doutorado / Matematica Aplicada / Doutor em Matemática Aplicada
|
194 |
Desenvolvimento e implementação de um sistema de controle fuzzy e sua aplicação a um reator de polimerização em batelada de MMAAntunes, Arnaldo Jose Bannwart 22 February 2005 (has links)
Orientadores: Ana Maria Frattini Fileti, João Alexandre Ferreira da Rocha Pereira / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Quimica / Resumo: Não Informado / Made available in DSpace on 2018-08-04T07:25:30Z (GMT). No. of bitstreams: 1
Antunes_ArnaldoJoseBannwart_D.pdf: 3655663 bytes, checksum: adb0d2c9c8215b5c4205125f25e9342c (MD5)
Previous issue date: 2005 / Abstract: The present work is concerned with the design and experimental testing of control system with a fuzzy algorithm for temperature control of a methyl methacrylate (MMA) batch polymerization. Ethyl acetate is used as solvent and benzoyl peroxide is the reaction initiator. According to the literature, this reaction is complex and highly nonlinear, therefore there is some dificulty choosing the most appropriate controller. To verify the system complexity and the influence of the fuzzy control algorithm it is compared to a conventional PID (velocity form) controller. The controller tuning parameters were obtained via open-Ioop experiments. For the conventional PID, the Cohen-Coon method was applied followed by stability analysis. For the fuzzy controller, the open loop results helped to shape the knowledge base, with the determination of the membership functions. This work shows the several alternatives for tuning a fuzzy controller. It can be achieved by modifying the knowledge base or scaling factors. Besides, a digital temperature filter was succesfully used in order to prevent the oscillatory behaviour of the reaction temperature. According to experimental results, the PID-fuzzy was considered more suitable and reliable for this polymerization process control since it outperformed PID velocity form algorithm / Doutorado / Sistemas de Processos Quimicos e Informatica / Doutor em Engenharia Química
|
195 |
A Modeling Approach for Coefficient-Free Oscillometric Blood Pressure EstimationForouzanfar, Mohamad 27 June 2014 (has links)
Oscillometry is the most common measurement method used in automatic blood pressure (BP) monitors. However, most of the oscillometric algorithms are without physiological and theoretical foundation, and rely on empirically derived coefficients for systolic and diastolic pressure evaluation which affects the reliability of the technique. In this thesis, the oscillometric BP estimation problem is addressed using a comprehensive modeling approach, based on which coefficient-free estimation of BP becomes possible. A feature-based neural network approach is developed to find an implicit relationship between BP and the oscillometric waveform (OMW). The modeling approach is then extended by developing a mathematical model for the OMW as a function of the arterial blood pressure, cuff pressure, and cuff-arm-artery system parameters. Based on the developed model, the explicit relationship between the OMW and the systolic and diastolic pressures is found and a new coefficient-free oscillometric BP estimation method using the trust region reflective algorithm is proposed. In order to improve the reliability of BP estimates, the electrocardiogram signal is recorded simultaneously with the OMW, as another independent source of information. The electrocardiogram signal is used to identify the true oscillometric pulses and calculate the pulse transit time (PTT). By combining our developed model of oscillomtery with an existing model of the pulse wave velocity, a new mathematical model is derived for the PTT during the cuff deflation. The derived model is incorporated to study the PTT-cuff pressure dependence, based on which a new coefficient-free BP estimation method is proposed. In order to obtain accurate and robust estimates of BP, the proposed model-based BP estimation method sare fused by computing the weighted arithmetic mean of their estimates. With fusion of the proposed methods, it is observed that the mean absolute error (MAE) in estimation of systolic and diastolic pressures is 4.40 and 3.00 mmHg, respectively, relative to the Food and Drug Administration-approved Omron monitor. In addition, the proposed feature-based neural network was compared with auscultatory measurements by trained observers giving MAE of 6.28 and 5.73 mmHg in estimation of systolic and diastolic pressures, respectively. The proposed models thus show promise toward developing robust BP estimation methods.
|
196 |
Fuzzy logic modelling and management strategy for packet-switched networksScheffer, Marten F. 11 September 2012 (has links)
D.Ing. / Conventional traffic models used for the analysis of packet-switched data are Markovian in nature and are based on assumptions, such as Poissonian arrivals. The introduction of packet oriented networks has resulted in an influx of information highlighting numerous discrepancies from these assumptions. Several studies have shown that traffic patterns from diverse packet-switched networks and services exhibit the presence of properties such as self-similarity, long-range dependencies, slowly decaying variances, "heavy tailed" or power law distributions, and fractal structures. Heavy Tailed distributions decay slower than predicted by conventional exponential assumptions and lead to significant underestimation of network traffic variables. Furthermore, it was shown that the statistical multiplexing of multiple packet-switched sources do not give rise to a more homogenous aggregate, but that properties such as burstiness are conserved. The results of the above mentioned studies have shown that none of the commonly used traffic models and assumptions are able to completely capture the bursty behaviour of packet- and cellbased networks. Artificial Intelligent methods provide the capability to extract the inherent characteristics of a system and include soft decision-making approaches such as Fuzzy Logic. Adaptive methods such as Fuzzy Logic Self-learning algorithms have the potential to solve some of the most pressing problems of traffic Modelling and Management in modern packet-switched networks. This dissertation is concerned with providing alternative solutions to the mentioned problems, in the following three sub-sections; the Description of Heavy Tailed Arrival Distributions, Timeseries Forecasting of bursty Traffic Intensities, and Management related Soft Decision-Making. Although several alternative methods, such as Kalman Filters, Bayesian Distributions, Fractal Analysis and Neural Networks are considered, the main emphasis of this work is on Fuzzy Logic applications.
|
197 |
Análise de modelos mentais baseada em regras nebulosas para tomada de decisão colaborativa / Mental models analysis based on fuzzy rules for collaborative decision-makingGarcia-Nunes, Pedro Ivo, 1988- 24 August 2018 (has links)
Orientadores: Ana Estela Antunes da Silva, Antonio Carlos Zambon / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Tecnologia / Made available in DSpace on 2018-08-24T06:09:22Z (GMT). No. of bitstreams: 1
Garcia-Nunes_PedroIvo_M.pdf: 2562537 bytes, checksum: 108da20ed77cbe9587a585ea453fb49f (MD5)
Previous issue date: 2014 / Resumo: Tomadores de decisão são frequentemente confrontados por fenômenos que envolvem uma grande quantidade de atores e interações pertinentes a problemas cada vez mais complexos e, por isso, difíceis de serem gerenciados. As teorias da racionalidade limitada assumem que o tratamento dessa complexidade se dá pela consideração do conhecimento compartilhado entre um número representativo de diferentes agentes de decisão. A identificação desse tipo de comunidade depende de métodos de análise e comparação das estruturas utilizadas para representar conhecimento. Modelos mentais (MMs) são diagramas de representação, baseados em linguagem natural, que consistem de relações lógicas de causa-efeito utilizadas para descrever os fenômenos. Este trabalho teve por objetivo principal desenvolver e aplicar um método matemático para análise e comparação de modelos mentais, a fim de possibilitar a identificação dos modelos mais adequados ao consenso típico de um processo de tomada de decisão colaborativa. O método foi estruturado a partir de uma base de regras nebulosas que foi automatizada por meio de um sistema inteligente de apoio à decisão (SIAD). O SIAD foi utilizado em um estudo de caso para analisar e comparar os MMs utilizados por universitários para descrever os protestos ocorridos no Brasil entre os meses de junho e julho de 2013. Os resultados indicam os modelos mais representativos no que diz respeito às descrições das causas dessas manifestações, cuja ambiguidade se apresentou como motivo de uma incerteza que despertou o interesse internacional pela investigação acerca do caráter das reivindicações / Abstract: Decision makers are often confronted with phenomena that involve a lot of actors and interactions relevant to complex problems that are difficult to manage. Theories of bounded rationality assume that the treatment of this complexity occurs by the consideration of the shared knowledge among a representative number of different decision-makers. The identification of this type of community depends on methods of analysis and comparison of the structures used to represent knowledge. Mental models (MMs) are diagrams of representation, based on natural language, which consist of logical relations of cause and effect used to describe the phenomena. This study aimed at developing and applying a mathematical method for analyzing and comparing mental models in order to enable the identification of the most suitable models for typical consensus of the collaborative decision making. The method was structured on a base of fuzzy rules that was automated by means of an intelligent decision support system (IDSS). The IDSS was used in a case study to analyze and compare the MMs used by academics to describe the Brazilian protests in June and July 2013. The results indicate the most representative models with regard to the descriptions of the causes of these revolts, which created uncertainty and sparked international interest in research on the nature of the claims / Mestrado / Tecnologia e Inovação / Mestre em Tecnologia
|
198 |
Representação e aquisição de regras em sistemas conexionistasRomariz, Alexandre Ricardo Soares 03 February 1995 (has links)
Orientador: Marcio Luiz de Andrade Netto / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica / Made available in DSpace on 2018-07-19T21:28:22Z (GMT). No. of bitstreams: 1
Romariz_AlexandreRicardoSoares_M.pdf: 5855846 bytes, checksum: 4b7828a3a6355b3204207faea24876f4 (MD5)
Previous issue date: 1995 / Resumo: Este trabalho trata da representação de conhecimento estruturado (na forma de regras) em sistemas conexionistas. Primeiramente, é feito um estudo sobre redes conexionistas modulares, nas quais grupos de neurônios podem ser associados a antecedentes e conseqüências de regras. Em seguida, mostram-se formas pelas quais estas redes são associadas a conceitos de lógica nebulosa, nos chamados sistemas neuronebulosos. Um algoritmo de aquisição incremental é proposto para tais sistemas. Nele, promove-se alteração estrutural e não apenas adaptação de parâmetros da rede. Novas regras vão sendo adicionadas para lidar com padrões ainda não cobertos pelas regras existentes. O erro decorrente da aplicação de uma regra é usado como indicador da função de pertinência da mesma ... Observação: O resumo, na íntegra, poderá ser visualizado no texto completo da tese digital / Abstract: This work addresses the problem of representing structured knowledge (as a set of rules) in connectionist systems. First, modular connectionist networks are studied. In this kind of network, groups of neurons may be associated with rule antecedents or consequents. Next, we show some ways by which these networks are associated with fuzzy logic concepts (neuro-fuzzy systems). An algorithm for incremental rule is proposed for these systems. Strucutural modification as well as parameters adaptation are considered. New rules are added periodically to deal with patterns which are not yet convered by the existing rules. The error that results from the application of each rule is used as an indication for membership function construction ... Note: The complete abstract is available with the full electronic digital thesis or dissertations / Mestrado / Mestre em Engenharia Elétrica
|
199 |
Memórias associativas recorrentes exponenciais fuzzy baseadas em medidas de similaridade / Recurrent exponential fuzzy associative memories based on similarity measures.Souza, Aline Cristina de, 1991- 04 July 2015 (has links)
Orientador: Marcos Eduardo Ribeiro do Valle Mesquita / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-27T12:11:26Z (GMT). No. of bitstreams: 1
Souza_AlineCristinade_M.pdf: 2392301 bytes, checksum: 8b771e0b97302577daaf84624b0c4751 (MD5)
Previous issue date: 2015 / Resumo: Memórias associativas são modelos matemáticos inspirados pela capacidade do cérebro humano de armazenar e recordar informações por meio de associações. Tais modelos são projetados para armazenar um conjunto finito de associações chamado de conjunto das memórias fundamentais. Além disso, espera-se que a memória associativa seja capaz de recuperar uma informação armazenada mesmo a partir de um item incompleto ou ruidoso. As Memórias Associativas Recorrentes Exponenciais Fuzzy (REFAMs, acrônimo do termo em inglês Recurrent Exponential Fuzzy Associative Memories) podem ser efetivamente utilizadas para o armazenamento e recordação de uma família finita de conjuntos fuzzy. Em geral, uma REFAM define recursivamente uma sequência de conjuntos fuzzy obtidos usando médias ponderadas e exponenciais dos valores de medida de similaridade. Experimentos computacionais relacionados à recuperação de imagens em tons de cinza ruidosas mostraram que os novos modelos podem apresentar ótima capacidade absoluta de armazenamento bem como excelente tolerância a ruído / Abstract: Associative memories are mathematical models inspired by the human brain ability to store and recall information by means of associations. Such models are designed for the storage of a finite set of associations called the fundamental memories set. Furthermore, the associative memory is expected to be able to retrieve a stored information even from an incomplete or noisy item. The Recurrent Exponential Fuzzy Associative Memories (REFAMs) can be effectively used for storage and recall of a finite family of fuzzy sets. In general, a REFAM defines recursively a sequence of fuzzy sets obtained using weighted averages and exponentials of similarity measure values. Computational experiments concerning the retrieval of noisy gray-scale images revealed that the novel models may exhibit optimal absolute storage capacity as well as excellent noise tolerance / Mestrado / Matematica Aplicada / Mestra em Matemática Aplicada
|
200 |
[en] HIBRID NEURO-FUZZY-GENETIC SYSTEM FOR AUTOMATIC DATA MINING / [pt] SISTEMA HÍBRIDO NEURO-FUZZY-GENÉTICO PARA MINERAÇÃO AUTOMÁTICA DE DADOSMANOEL ROBERTO AGUIRRE DE ALMEIDA 20 August 2004 (has links)
[pt] Esta dissertação apresenta a proposta e o desenvolvimento
de um sistema
de mineração de dados inteiramente automático. O objetivo
principal é criar um
sistema que seja capaz de realizar a extração de
informações obscuras a partir
de bases de dados complexas, sem exigir a presença de um
especialista técnico
para configurá-lo. O sistema híbrido neuro-fuzzy
hierárquico com
particionamento binário (NFHB) vem apresentando excelentes
resultados em
tarefas de classificação de padrões e previsão, além de
possuir importantes
características não encontradas em outros sistemas
similares, entre elas:
aprendizado automático de sua estrutura; capacidade de
receber um número
maior de entradas abrangendo um maior número de aplicações;
e geração de
regras lingüísticas como produto de seu treinamento.
Entretanto, este modelo
ainda necessita de uma complexa parametrização inicial
antes de seu
treinamento, impedindo que o processo seja automático em
sua totalidade. O
novo modelo proposto busca otimizar a parametrização do
sistema NFHB
utilizando a técnica de coevolução genética, criando assim
um novo sistema de
mineração de dados completamente automático. O trabalho foi
realizado em
quatro partes principais: avaliação de sistemas existentes
utilizados na
mineração de dados; estudo do sistema NFHB e a determinação
de seus
principais parâmetros; desenvolvimento do sistema híbrido
neuro-fuzzy-genético
automático para mineração de dados; e o estudo de casos.
No estudo dos sistemas existentes para mineração de dados
buscou-se
encontrar algum modelo que apresentasse bons resultados e
ainda fosse
passível de automatização. Várias técnicas foram estudadas,
entre elas:
Métodos Estatísticos, Árvores de Decisão, Associação de
Regras, Algoritmos
Genéticos, Redes Neurais Artificiais, Sistemas Fuzzy e
Sistemas Neuro-Fuzzy.
O sistema NFHB foi escolhido como sistema de inferência e
extração de regras
para a realização da mineração de dados. Deste modo, este
modelo foi estudado
e seus parâmetros mais importantes foram determinados. Além
disso, técnicas
de seleção de variáveis de entradas foram investigadas para
servirem como
opções para o modelo. Ao final, foi obtido um conjunto de
parâmetros que deve
ser automaticamente determinado para a completa
configuração deste sistema. Um modelo coevolutivo genético
hierárquico foi criado para realizar com
excelência a tarefa de otimização do sistema NFHB. Desta
forma, foi modelada
uma arquitetura hierárquica de Algoritmos Genéticos (AG s),
onde os mesmos
realizam tarefas de otimização complementares. Nesta etapa,
também foram
determinados os melhores operadores genéticos, a
parametrização dos AG s, a
melhor representação dos cromossomas e as funções de
avaliação. O melhor
conjunto de parâmetros encontrado é utilizado na
configuração do NFHB,
tornando o processo inteiramente automático.
No estudo de casos, vários testes foram realizados em bases
de dados
reais e do tipo benchmark. Para problemas de previsão,
foram utilizadas séries
de carga de energia elétrica de seis empresas: Cerj, Copel,
Eletropaulo, Cemig,
Furnas e Light. Na área de classificação de padrões, foram
utilizadas bases
conhecidas de vários artigos da área como Glass Data, Wine
Data, Bupa Liver
Disorders e Pima Indian Diabetes. Após a realização dos
testes, foi feita uma
comparação com os resultados obtidos por vários algoritmos
e pelo NFHB
original, porém com parâmetros determinados por um
especialista.
Os testes mostraram que o modelo criado obteve resultados
bastante
satisfatórios, pois foi possível, com um processo
completamente automático,
obter taxas de erro semelhantes às obtidas por um
especialista, e em alguns
casos taxas menores. Desta forma, um usuário do sistema,
sem qualquer
conhecimento técnico sobre os modelos utilizados, pode
utilizá-lo para realizar mineração de banco de dados, extraindo informações e até mesmo conhecimento que podem auxiliá-lo em processos de tomada de decisão, o qual é o objetivo final de um processo de Knowledge Data Discovery. / [en] This dissertation presents the proposal and the development
of a totally
automatic data mining system. The main objective is to
create a system that is
capable of extracting obscure information from complex
databases, without
demanding the presence of a technical specialist to
configure it. The Hierarchical
Neuro-Fuzzy Binary Space Partitioning model (NFHB) has
produced excellent
results in pattern classification and time series
forecasting tasks. Additionally, it
provides important features that are not present in other
similar systems, such
as: automatic learning of its structure; ability to deal
with a larger number of input
variables, thus increasing the range of possible
applications; and generation of
linguistic rules as a result of its training process.
However, this model depends on
a complex configuration process before the training is
performed, hindering to
achieve a totally automatic system. The model proposed in
this Dissertation tries
to optimize the NFHB system parameters by using the genetic
coevolution
technique, thus creating a new automatic data mining
system. This work
consisted of four main parts: evaluation of existing
systems used in data mining;
study of the NFHB system and definition of its main
parameters; development of
the automatic hybrid neuro-fuzzy-genetic system for data
mining; and case
studies.
In the study of existing data mining systems, the aim was
to find a suitable
model that could yield good results and still be automated.
Several techniques
have been studied, among them: Statistical methods,
Decision Trees, Rules
Association, Genetic Algorithms, Artificial Neural
Networks, Fuzzy and Neuro-
Fuzzy Systems. The NFHB System was chosen for inference and
rule extraction
in the data mining process. In this way, this model was
carefully studied and its
most important parameters were determined. Moreover, input
variable selection
techniques were investigated, to be used with the proposed
model. Finally, a set
of parameters was defined, which must be determined
automatically for the
complete system configuration.
A hierarchical coevolutive genetic model was created to
execute the
system optimization task with efficiency. Therefore, a
hierarchical architecture of genetic algorithms (GAs) was
created, where the GAs execute complementary
optimization tasks. In this stage, the best genetic
operators, the GAs
configuration, the chromossomes representation, and
evaluation functions were
also determined. The best set of parameters found was used
in the NFHB
configuration, making the process entirely automatic.
In the case studies, various tests were performed with
benchmark
databases. For forecasting problems, six electric load
series were used: Cerj,
Copel, Eletropaulo, Cemig, Furnas and Light. In the pattern
classification area,
some well known databases were used, namely Glass Data,
Wine Data, Bupa
Liver Disorders and Pima Indian Diabetes. After the tests
were carried out, a
comparison was made with known models and with the original
NFHB System,
configured by a specialist.
The tests have demonstrated that the proposed model
generates
satisfactory results, producing, with an automatic process,
similar errors to the
ones obtained with a specialist configuration, and, in some
cases, even better
results can be obtained. Therefore, a user without any
technical knowledge of the
system, can use it to perform data mining, extracting
information and knowledge
that can help him/her in decision taking processes, which
is the final objective of
a Knowledge Data Discovery process.
|
Page generated in 0.0772 seconds