31 |
Métodos Neuronais para a Solução da Equação Algébrica de Riccati e o LQR / Neural methods for the solution of Equation Of algebraic Riccati and LQRSilva, Fabio Nogueira da 20 June 2008 (has links)
Made available in DSpace on 2016-08-17T14:53:01Z (GMT). No. of bitstreams: 1
Fabio Nogueira da Silva.pdf: 1098466 bytes, checksum: a72dcced91748fe6c54f3cab86c19849 (MD5)
Previous issue date: 2008-06-20 / FUNDAÇÃO DE AMPARO À PESQUISA E AO DESENVOLVIMENTO CIENTIFICO E TECNOLÓGICO DO MARANHÃO / We present in this work the results about two neural networks methods to solve
the algebraic Riccati(ARE), what are used in many applications, mainly in the
Linear Quadratic Regulator (LQR), H2 and H1 controls. First is showed the
real symmetric form of the ARE and two methods based on neural computation.
One feedforward neural network (FNN), that de¯nes an error as function of
the ARE and a recurrent neural network (RNN), which converts a constrain
optimization problem, restricted to the state space model, into an unconstrained
convex optimization problem de¯ning an energy as function of the ARE and
Cholesky factor. A proposal to chose the learning parameters of the RNN used
to solve the ARE, by making a surface of the parameters variations, thus we can
tune the neural network for a better performance.
Computational experiments related with the plant matrices perturbations of
the tested systems in order to perform an analysis of the behavior of the presented
methodologies, that are based on homotopies methods, where we chose a good
initial condition and compare the results to the Schur method. Two 6th order
systems were used, a Doubly Fed Induction Generator(DFIG) and an aircraft
plant. The results showed the RNN a good alternative compared with the FNN
and Schur methods. / Apresenta-se nesta dissertação os resultados a respeito de dois métodos neuronais
para a resolução da equação algébrica de Riccati(EAR), que tem varias aplicações,
sendo principalmente usada pelos Regulador Linear Quadrático(LQR), controle
H2 e controle H1. É apresentado a EAR real e simétrica e dois métodos baseados
em uma rede neuronal direta (RND) que tem a função de erro associada a EAR
e uma rede neuronal recorrente (RNR) que converte um problema de otimização
restrita ao modelo de espaço de estados em outro de otimização convexa em
função da EAR e do fator de Cholesky de modo a usufruir das propriedades de
convexidade e condições de otimalidade.
Uma proposta para a escolha dos parâmetros da RNR usada para solucionar
a EAR por meio da geração de superfícies com a variação paramétrica da RNR,
podendo assim melhor sintonizar a rede neuronal para um melhor desempenho.
Experimentos computacionais relacionados a perturbações nos sistemas foram
realizados para analisar o comportamento das metodologias apresentadas, tendo
como base o princípio dos métodos homotópicos, com uma boa condição inicial,
a partir de uma ponto de operação estável e comparamos os resultados com o
método de Schur. Foram usadas as plantas de dois sistemas: uma representando
a dinâmica de uma aeronave e outra de um motor de indução eólico duplamente
alimentado(DFIG), ambos sistemas de 6a ordem. Os resultados mostram que
a RNR é uma boa alternativa se comparado com a RND e com o método de
Schur.
|
32 |
Less conservative conditions for the robust and Gain-Scheduled LQR-state derivative controllers design /Beteto, Marco Antonio Leite January 2019 (has links)
Orientador: Edvaldo Assunção / Resumo: Neste trabalho é proposta a resolução do problema do regulador linear quadrático (Linear Quadratic Regulator - LQR) via desigualdades matriciais lineares (Linear Matrix Inequalities - LMIs) para sistemas lineares e invariantes no tempo sujeitos a incertezas politópicas, bem como para sistemas lineares sujeitos a parâmetros variantes no tempo (Linear Parameter Varying - LPV). O projeto dos controladores é baseado na realimentação derivativa. A escolha da realimentação derivativa se dá devido à sua fácil implementação em certas aplicações como, por exemplo, no controle de vibrações. Os sinais usados na realimentação são aceleração e velocidade, sendo obtidos por meio de acelerômetros. Por meio do método proposto é possível obter condições LMIs para a síntese de controladores que garantam a estabilização do sistema em malha fechada, sendo que os controladores possuem desempenho otimizado. Para a formulação das condições LMIs, uma função de Lyapunov do tipo quadrática é utilizada. Exemplos teóricos e simulações são utilizados como forma de validação dos métodos propostos, além de mostrar que os novos resultados apresentam condições menos conservadoras. Além disso, ao final é apresentada uma implementação prática em um sistema de suspensão ativa, produzida pela Quanser®. / Abstract: The resolution of linear quadratic regulator (LQR) problem via linear matrix inequalities (LMIs) for linear time-invariant systems subject to polytopic uncertainties, as linear systems subjects to linear parameter varying (LPV), is proposed in this work. The controllers' designs are based on the state derivative feedback. The aim to the choice of the state derivative feedback is your easy implementation in a class of mechanical systems, such as in vibration control, for example. The signals used for feedback are acceleration and velocity, it is obtained by means of accelerometers. Through the proposed method it is possible to obtain LMIs conditions for the synthesis of controllers that guarantee the stabilisation of the closed-loop system, being that the controllers have optimised performance. For the LMIs conditions formulations, a Lyapunov function of type quadratic is used. As a form of validation, theoretical examples and simulations are performed, besides to show that the new results are less conservative. Furthermore, a practical implementation in an active suspension system, produced by Quanser®, is performed. / Mestre
|
33 |
Melhorias de estabilidade numérica e custo computacional de aproximadores de funções valor de estado baseados em estimadores RLS para projeto online de sistemas de controle HDP-DLQR / Numerical Stability and Computational Cost Implications of State Value Functions based on RLS Estimators for Online Design of HDP-DLQR control systemsFerreira, Ernesto Franklin Marçal 08 March 2016 (has links)
Submitted by Rosivalda Pereira (mrs.pereira@ufma.br) on 2017-06-23T20:34:27Z
No. of bitstreams: 1
ErnestoFerreira.pdf: 1744167 bytes, checksum: c125c90e5eb2aab2618350567f88cb31 (MD5) / Made available in DSpace on 2017-06-23T20:34:27Z (GMT). No. of bitstreams: 1
ErnestoFerreira.pdf: 1744167 bytes, checksum: c125c90e5eb2aab2618350567f88cb31 (MD5)
Previous issue date: 2016-03-08 / The development and the numerical stability analysis of a new adaptive critic algorithm to approximate the state-value function for online discrete linear quadratic regulator (DLQR) optimal control system design based on heuristic dynamic programming (HDP) are presented in this work. The proposed algorithm makes use of unitary transformations and QR decomposition methods to improve the online learning e-ciency in the critic network through the recursive least-squares (RLS) approach. The developed learning strategy provides computational performance improvements in terms of numerical stability and computational cost which aim at making possible the implementations in real time of optimal control design methodology based upon actor-critic reinforcement learning paradigms. The convergence behavior and numerical stability of the proposed online algorithm, called RLSµ-QR-HDP-DLQR, are evaluated by computational simulations in three Multiple-Input and Multiple-Output (MIMO) models, that represent the automatic pilot of an F-16 aircraft of third order, a fourth order RLC circuit with two input voltages and two controllable voltage levels, and a doubly-fed induction generator with six inputs and six outputs for wind energy conversion systems. / Neste trabalho, apresenta-se o desenvolvimento e a análise da estabilidade numérica de um novo algoritmo crítico adaptativo para aproximar a função valor de estado para o projeto do sistema de controle ótimo online, utilizando o regulador linear quadrático discreto (DLQR), com base em programação dinâmica heurística (HDP). O algoritmo proposto faz uso de transformações unitárias e métodos de decomposição QR para melhorar a e-ciência da aprendizagem online na rede crítica por meio da abordagem dos mínimos quadrados recursivos (RLS). A estratégia de aprendizagem desenvolvida fornece melhorias no desempenho computacional em termos de estabilidade numérica e custo computacional, que visam tornar possíveis as implementações em tempo real da metodologia do projeto de controle ótimo com base em paradigmas de aprendizado por reforço ator-crítico. O comportamento de convergência e estabilidade numérica do algoritmo online proposto, denominado RLSµ-QR-HDP-DLQR, são avaliados por meio de simulações computacionais em três modelos Múltiplas-Entradas e Múltiplas-Saídas (MIMO), que representam o piloto automático de uma aeronave F-16 de terceira ordem, um circuito de quarta ordem RLC com duas tensões de entrada e dois níveis de tensão controláveis, e um gerador de indução duplamente alimentados com seis entradas e seis saídas para sistemas de conversão de energia eólica.
|
34 |
Aprendizagem por Reforço e Programação Dinâmica Aproximada para Controle Ótimo: Uma Abordagem para o Projeto Online do Regulador Linear Quadrático Discreto com Programação Dinâmica Heurística Dependente de Estado e Ação. / Reinforcement and Programming Learning Approximate Dynamics for Optimal Control: An Approach to the Linear Regulator Online Project Discrete Quadratic with Heuristic Dynamic Programming Dependent on State and Action.RÊGO, Patrícia Helena Moraes 24 July 2014 (has links)
Submitted by Maria Aparecida (cidazen@gmail.com) on 2017-08-30T15:33:12Z
No. of bitstreams: 1
Patricia Helena.pdf: 11110405 bytes, checksum: ca1f067231658f897d84b86181dbf1b9 (MD5) / Made available in DSpace on 2017-08-30T15:33:12Z (GMT). No. of bitstreams: 1
Patricia Helena.pdf: 11110405 bytes, checksum: ca1f067231658f897d84b86181dbf1b9 (MD5)
Previous issue date: 2014-07-24 / In this thesis a proposal of an uni ed approach of dynamic programming,
reinforcement learning and function approximation theories aiming at the development of methods and algorithms for design of optimal control systems is
presented. This approach is presented in the approximate dynamic programming
context that allows approximating the optimal feedback solution as to reduce the
computational complexity associated to the conventional dynamic programming
methods for optimal control of multivariable systems. Speci cally, in the state
and action dependent heuristic dynamic programming framework, this proposal
is oriented for the development of online approximated solutions, numerically
stable, of the Riccati-type Hamilton-Jacobi-Bellman equation associated to the
discrete linear quadratic regulator problem which is based on a formulation that
combines value function estimates by means of a RLS (Recursive Least-Squares)
structure, temporal di erences and policy improvements. The development of the
proposed methodologies, in this work, is focused mainly on the UDU T factorization that is inserted in this framework to improve the RLS estimation process of
optimal decision policies of the discrete linear quadratic regulator, by circumventing convergence and numerical stability problems related to the covariance matrix
ill-conditioning of the RLS approach. / Apresenta-se nesta tese uma proposta de uma abordagem uni cada de teorias
de programação dinâmica, aprendizagem por reforço e aproximação de função
que tem por objetivo o desenvolvimento de métodos e algoritmos para projeto
online de sistemas de controle ótimo. Esta abordagem é apresentada no contexto
de programação dinâmica aproximada que permite aproximar a solução de realimentação ótima de modo a reduzir a complexidade computacional associada com
métodos convencionais de programação dinâmica para controle ótimo de sistemas
multivariáveis. Especi camente, no quadro de programação dinâmica heurística e
programação dinâmica heurística dependente de ação, esta proposta é orientada
para o desenvolvimento de soluções aproximadas online, numericamente estáveis,
da equação de Hamilton-Jacobi-Bellman do tipo Riccati associada ao problema
do regulador linear quadrático discreto que tem por base uma formulação que
combina estimativas da função valor por meio de uma estrutura RLS (do inglês
Recursive Least-Squares), diferenças temporais e melhorias de política. O desenvolvimento das metodologias propostas, neste trabalho, tem seu foco principal
voltado para a fatoração UDU T que é inserida neste quadro para melhorar o processo de estimação RLS de políticas de decisão ótimas do regulador linear quadrá-
tico discreto, contornando-se problemas de convergência e estabilidade numérica
relacionados com o mal condicionamento da matriz de covariância da abordagem
RLS.
|
35 |
Controle inteligente LQR neuro-genético para alocação de autoestrutura em sistemas dinâmicos multivariáveisABREU, Ivanildo Silva 30 August 2008 (has links)
Submitted by camilla martins (camillasmmartins@gmail.com) on 2016-12-09T15:11:41Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Tese_ControleInteligenteLQR.pdf: 2310311 bytes, checksum: 11af2680d8c53f2af5c55aa84abe2822 (MD5) / Rejected by Edisangela Bastos (edisangela@ufpa.br), reason: on 2016-12-15T12:03:10Z (GMT) / Submitted by camilla martins (camillasmmartins@gmail.com) on 2016-12-15T13:34:29Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Tese_ControleInteligenteLQR.pdf: 2310311 bytes, checksum: 11af2680d8c53f2af5c55aa84abe2822 (MD5) / Rejected by Edisangela Bastos (edisangela@ufpa.br), reason: on 2016-12-15T14:00:21Z (GMT) / Submitted by camilla martins (camillasmmartins@gmail.com) on 2016-12-15T14:24:22Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Tese_ControleInteligenteLQR.pdf: 2310311 bytes, checksum: 11af2680d8c53f2af5c55aa84abe2822 (MD5) / Approved for entry into archive by Edisangela Bastos (edisangela@ufpa.br) on 2016-12-19T13:20:56Z (GMT) No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Tese_ControleInteligenteLQR.pdf: 2310311 bytes, checksum: 11af2680d8c53f2af5c55aa84abe2822 (MD5) / Made available in DSpace on 2016-12-19T13:20:56Z (GMT). No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Tese_ControleInteligenteLQR.pdf: 2310311 bytes, checksum: 11af2680d8c53f2af5c55aa84abe2822 (MD5)
Previous issue date: 2008-08-30 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Nesta tese é apresentado um modelo neuro-genético, orientado a síntese de controladores
no espaço de estado baseado no projeto do Regulador Linear Quadrático,
para alocação de autoestrutura em sistemas dinâmicos multivariáveis. O modelo
neuro-genético representa uma fusão de um algoritmo genético e uma rede neural
recorrente para realizar a seleção das matrizes de ponderação e resolver a equação
algébrica de Riccati, respectivamente. Um modelo de 6a ordem de uma aeronave,
um modelo de 6a ordem de um gerador de indução duplamente alimentado de uma
planta eólica e um modelo de 4a ordem de um circuito elétrico, são usados para
avaliar a fusão dos paradigmas de inteligência computacional e o desempenho da
metodologia do projeto de controle. O desempenho dos modelos neuro-genéticos
são avaliados por momentos estatísticos de primeira e segunda ordem para o algoritmo
genético, enquanto que a rede neural é avaliada por superfícies da função
energia e da norma do infinito da equação algébrica de Riccati. São feitas comparações
com o método de Schur. / In this thesis is presented a neural-genetic model, oriented to state space controllers
synthesis, based on the Linear Quadratic Regulator design, for eigenstructure
assignment of multivariable dynamic systems. The neural-genetic model represents
a fusion of a genetic algorithm and a recurrent neural network to perform
the weighting matrices selection and the algebraic Riccati equation solution, respectively.
In order to a assess the LQR design, the procedure was applied in
a 6th order aircraft model, 6th order doubly fed induction generator model of a
wind plant and a 4th order electric circuit model which were used to evaluate the
fusion of the computational intelligence paradigms and the control design method
performance.The performance of the neural-genetic models are evaluated by the
first and second statistics moments for the genetic algorithm, whereas the neural
network is evaluated by surfaces of the energy function and of the norm of the
infinity of the algebraic equation of Riccati and the results compared to the results
obtained by using Schur’s Method.
|
36 |
MODELOS BASEADOS EM REDES NEURAIS ARTIFICIAIS COM APLICAÇÃO EM CONTROLE INDIRETO DE TEMPERATURA / BASED ON MODELS WITH ARTIFICIAL NEURAL NETWORKS FOR A TEMPERATURE CONTROL INDIRECTSá, Denis Fabrício Sousa de 10 April 2015 (has links)
Made available in DSpace on 2016-08-17T14:52:39Z (GMT). No. of bitstreams: 1
DISSERTACAO_DENIS FABRICIO SOUSA DE SA.pdf: 2409581 bytes, checksum: 4de5274676a1f75ffe2a1f6b46b1388c (MD5)
Previous issue date: 2015-04-10 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The representation of dynamic systems or plants via mathematical models occupies an important position in control system design that allow the performance evaluation of the controller during his development stage.
These models are also used as an alternative to solve the problem of the hardness or impracticability to install sensors that measure the controlled variables, the dynamic systems representations enable non-invasive measurement of these variables. As consequence the designer has an alternative way to perform adaptive and optimal sensorless control for a given process.
In this dissertation is presented a proposal for control systems schemas and algorithms, based on recurrent neural networks (ANN) and Box-Jenkins models, that are dedicated to sensorless or indirect control of dynamic systems. The proposed models and algorithms are associated with the systems identification and recurrent ANN approaches. The algorithms developed for the AAN training are Backpropagation Accelerated and RLS types that are compared with classical methods and strategies to obtain it online parameters of indirect control of system for a thermal plant, where the actuator is Peltier cell.
The performance the parametric models of the plant and adaptive PID digital controllers and linear quadratic regulator (DLQR) that are the main elements of the sensorless temperature control system, are evaluated by means of hybrid simulations, where the algorithms implemented in micro controllers and the plant represented by mathematical models.
The performance results of the proposed sensorless control algorithms are promissory, not only, in terms of the control system performance, but also due to the reexibility to deploy it in other dynamic systems. / A representação de sistemas dinâmicos ou plantas por meio modelos matemáticos ocupa uma posição relevante no projeto de sistemas de controle, permitindo que o projetista avalie o desempenho dos controladores durante a fase de desenvolvimento do projeto. Estes modelos também são utilizados para resolver o problema da dificuldade ou impossibilidade da inserção de sensores em plantas para medição de variáveis controladas, onde os modelos viabilizam a mediação não invasiva destas variáveis, fornecendo uma alternativa para realização do controle indireto adaptativo e ótimo de um dado processo. Nesta dissertação apresenta-se o desenvolvimento de modelos propostos baseados em redes neurais artificiais recorrentes para o controle sensorless ou indireto da planta. Os modelos propostos estão associados com as abordagens de Identificação de Sistemas e de RNA's recorrentes. OS algoritmos desenvolvidos para o treinamento das RNAs são do tipo Backpropagation acelerado e RLS, que são comparados com estratégias e métodos clássicos, para obtenção online dos parâmetros do sistema de controle indireto de uma planta térmica, tendo como atuador uma célula Peltier. Para uns de avaliação de desempenho do sistema de controle indireto da planta, os modelos paramétricos e controladores digitais adaptativos do tipo PID e regulador linear quadrático (DLQR) são avaliados por meio de simulações híbridas, sendo os algoritmos dos controladores implementados em microcontroladores e a planta representada por modelos matemáticos. Os resultados apresentados são promissores, não são sentido do desempenho do sistema de controle, mas também nos custos reduzidos para seu desenvolvimento, operação e flexibilidade de aplicação em outros sistemas dinâmicos.
|
37 |
Observadores de Estados para Sistemas de Medição Indireta e Controle RLQD-GA / Observers of States for Systems Indirect Measurement and Control RLQD-GACerqueira, Marcio Mendes 05 February 2010 (has links)
Made available in DSpace on 2016-08-17T14:53:08Z (GMT). No. of bitstreams: 1
Marcio Mendes Cerqueira.pdf: 4042726 bytes, checksum: a65c6a7174271eecc553e3a5b0ceb33a (MD5)
Previous issue date: 2010-02-05 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Motivated by the necessity of efficient algorithms, it s presented the development
of a methodology for the design and analysis of state observers in open
and closed loops that are dedicated to monitoring and control of dynamic systems.
The development of observers are based on OE models, description in state
space and Kalman filter. The models are evaluated for temperature control of
a aluminum cube that is inside of a sterilizer oven. In addition to the models
assessment in terms of its ability to represent behavior of plants, these models
also evaluated for the design of discrete linear quadric regulator DLQR that are
tuned by genetic algorithms. The monitoring models are evaluated for open and
closed loops structures that are represented by algorithms in terms of difference
equations, these algorithms are seen as software core for the indirect measurement
systems. / Motivado pela necessidade de algoritmos eficientes, apresenta-se o desenvolvimento
de uma metodologia para projeto e análise de observadores de estado em
malhas aberta e fechada que são dedicados a monitoração e controle de sistemas
dinâmicos. O desenvolvimento dos observadores estão fundamentados em modelos
OE, descrição no espaço de estados e filtro de Kalman. Os modelos são avaliados
para o controle da temperatura de um cubo de alumínio que encontra-se no
interior de uma estufa. Além das avaliações dos modelos em termos de sua habilidade
em representar comportamento de plantas, estes são também avaliados para
o projeto do regulador linear quadrático discreto (RQLD) que são sintonizados
por algoritmos genéticos. Aplicação dos modelos para monitoração é avaliada nas
estruturas das malhas aberta e fechada que são representadas por algoritmos em
da equação à diferença, tendo em vistas o desenvolvimento de núcleos de software
para os sistemas de medição indireta.
|
Page generated in 0.0281 seconds