1 |
APRENDIZAGEM POR REFORÇO E PROGRAMACÃO DINÂMICA ADAPTATIVA PARA PROJETO E AVALIAÇÃO DO DESEMPENHO DE ALGORITMOS DLQR EM SISTEMAS MIMO / LEARNING BY STRENGTHENING AND ADAPTIVE DYNAMIC PROGRAMMING FOR DESIGN AND EVALUATION OF PERFORMANCE DLQR ALGORITHMS IN MIMO SYSTEMSLopes, Leandro Rocha 04 April 2011 (has links)
Made available in DSpace on 2016-08-17T14:53:16Z (GMT). No. of bitstreams: 1
Leandro Rocha Lopes.pdf: 1075564 bytes, checksum: 01e184ed6d7c65323c0dfc1515da19a3 (MD5)
Previous issue date: 2011-04-04 / Due to the increasing of technological development and its associated industrial
applications, control design methods to attend high performance requests and reinforcement
learning are been developed, not only, to solve new problems, as well
as, to improve the performance of implemented controllers in the real systems.
The reinforcement learning (RL) and discrete linear quadratic regulator (DLQR)
approaches are connected by adaptive dynamic programming (ADP). This connection
is oriented to the design of optimal controller for multivariable systems
(MIMO). The proposed method for DLQR controllers tuning can been heuristic
guidance for biased variations in weighting matrices of instantenous reward. The
heuristics performance are evaluated in terms of convergence of heuristic dynamic
programming (HDP) and action dependent (AD-HDP) algorithms. The algorithms
and tuning are evaluated by the capability to map the plane-Z in MIMO
dynamic system of third order. / Em decorrência do crescente desenvolvimento tecnológico e das consequentes
aplicações industriais, técnicas de controle de alto desempenho e aprendizado por
reforço estão sendo desenvolvidas não só para solucionar novos problemas, mas
também para melhorar o desempenho de controladores já implementados em sistemas
do mundo real. As abordagens do aprendizado por reforço e do regulador
linear quadrático discreto (DLQR) são conectadas pelos métodos de programação
dinâmica adaptativa. Esta união é orientada para o projeto de controladores
ótimos em sistemas multivariáveis (MIMO). O método proposto para sintonia
de controladores DLQR fornece diretrizes para construção de heurísticas polarizadas
que são aplicadas na seleção das matrizes de ponderação da recompensa
instantânea. Investiga-se o desempenho das heurísticas associadas com a sintonia
de controladores lineares discretos e aspectos de convergência que estão relacionados
com as variações QR nos algoritmos de programação dinâmica heurística
(HDP) e Ação Dependente (ADHDP). Os algoritmos e a sintonia são avaliados
pela capacidade em estabelecer a política de controle ótimo que mapeia o plano-Z
em um sistema dinãmico multivariável de terceira ordem.
|
2 |
MODELOS BASEADOS EM REDES NEURAIS ARTIFICIAIS COM APLICAÇÃO EM CONTROLE INDIRETO DE TEMPERATURA / BASED ON MODELS WITH ARTIFICIAL NEURAL NETWORKS FOR A TEMPERATURE CONTROL INDIRECTSá, Denis Fabrício Sousa de 10 April 2015 (has links)
Made available in DSpace on 2016-08-17T14:52:39Z (GMT). No. of bitstreams: 1
DISSERTACAO_DENIS FABRICIO SOUSA DE SA.pdf: 2409581 bytes, checksum: 4de5274676a1f75ffe2a1f6b46b1388c (MD5)
Previous issue date: 2015-04-10 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The representation of dynamic systems or plants via mathematical models occupies an important position in control system design that allow the performance evaluation of the controller during his development stage.
These models are also used as an alternative to solve the problem of the hardness or impracticability to install sensors that measure the controlled variables, the dynamic systems representations enable non-invasive measurement of these variables. As consequence the designer has an alternative way to perform adaptive and optimal sensorless control for a given process.
In this dissertation is presented a proposal for control systems schemas and algorithms, based on recurrent neural networks (ANN) and Box-Jenkins models, that are dedicated to sensorless or indirect control of dynamic systems. The proposed models and algorithms are associated with the systems identification and recurrent ANN approaches. The algorithms developed for the AAN training are Backpropagation Accelerated and RLS types that are compared with classical methods and strategies to obtain it online parameters of indirect control of system for a thermal plant, where the actuator is Peltier cell.
The performance the parametric models of the plant and adaptive PID digital controllers and linear quadratic regulator (DLQR) that are the main elements of the sensorless temperature control system, are evaluated by means of hybrid simulations, where the algorithms implemented in micro controllers and the plant represented by mathematical models.
The performance results of the proposed sensorless control algorithms are promissory, not only, in terms of the control system performance, but also due to the reexibility to deploy it in other dynamic systems. / A representação de sistemas dinâmicos ou plantas por meio modelos matemáticos ocupa uma posição relevante no projeto de sistemas de controle, permitindo que o projetista avalie o desempenho dos controladores durante a fase de desenvolvimento do projeto. Estes modelos também são utilizados para resolver o problema da dificuldade ou impossibilidade da inserção de sensores em plantas para medição de variáveis controladas, onde os modelos viabilizam a mediação não invasiva destas variáveis, fornecendo uma alternativa para realização do controle indireto adaptativo e ótimo de um dado processo. Nesta dissertação apresenta-se o desenvolvimento de modelos propostos baseados em redes neurais artificiais recorrentes para o controle sensorless ou indireto da planta. Os modelos propostos estão associados com as abordagens de Identificação de Sistemas e de RNA's recorrentes. OS algoritmos desenvolvidos para o treinamento das RNAs são do tipo Backpropagation acelerado e RLS, que são comparados com estratégias e métodos clássicos, para obtenção online dos parâmetros do sistema de controle indireto de uma planta térmica, tendo como atuador uma célula Peltier. Para uns de avaliação de desempenho do sistema de controle indireto da planta, os modelos paramétricos e controladores digitais adaptativos do tipo PID e regulador linear quadrático (DLQR) são avaliados por meio de simulações híbridas, sendo os algoritmos dos controladores implementados em microcontroladores e a planta representada por modelos matemáticos. Os resultados apresentados são promissores, não são sentido do desempenho do sistema de controle, mas também nos custos reduzidos para seu desenvolvimento, operação e flexibilidade de aplicação em outros sistemas dinâmicos.
|
Page generated in 0.0221 seconds