81 |
Controle fuzzy via alocação de pólos com funções de Lyapunov por partes / Fuzzy pole placement based on piecewise Lyapunov functionsEduardo Stockler Tognetti 31 March 2006 (has links)
O presente trabalho apresenta um método de projeto de controlador com alocação de pólos em sistemas fuzzy utilizando funções de Lyapunov por partes e contínuas no espaço de estado. A idéia principal é utilizar controladores chaveados no espaço de estado para obter uma resposta transitória satisfatória do sistema, obtida pela localização dos pólos. A modelagem fuzzy Takagi-Sugeno é utilizada para representar um sistema não-linear em diversos pontos de linearização através de uma aproximação por vários modelos locais lineares invariantes no tempo. A análise de estabilidade e o projeto de sistemas de controle podem se formulados em termos de desigualdades matriciais lineares (em inglês, linear matrix inequalities (LMIs)), as quais são resolvidas por técnicas de programação convexa. Na análise de estabilidade ou na síntese de um controlador em sistemas fuzzy é necessário resolver um número determinado de LMIs de acordo com o número de modelos locais. Encontrar uma função de Lyapunov comum a todos os modelos locais pode ser inviável, especialmente quando se impõem critérios de desempenho, que aparecem como restrições no contexto de LMIs. A proposta de uma função de Lyapunov por partes objetiva diminuir o conservadorismo na busca de um controlador que leve os pólos de malha fechada à uma região desejada. Resultados de análise e síntese da teoria de sistemas lineares por partes contribuíram para a construção do resultado apresentado. Exemplos com simulação ilustram o método proposto. / This work presents a controller design method for fuzzy dynamic systems based on piecewise Lyapunov functions with constraints on the closed-loop pole location. The main idea is to use switched controllers to locate the poles of the system to obtain a satisfactory transient response. The pole placement strategy allows to specify the performance in terms of the desired time response of the feedback system. The Takagi-Sugeno fuzzy model can approximate the nonlinear system in several linearization points using linear time invariant systems. Thus, a global fuzzy model can be obtained from a fuzzy combination of these linear systems. Stability analysis and design of fuzzy control systems can be efficiently carried out in the context of linear matrix inequalities (LMIs). If the fuzzy system is described by many local models, the resulting set of LMIs may be infeasible. The search for a Lyapunov function in the fuzzy pole placement problem may be easier to be satisfied in a piecewise framework. Some results from piecewise linear systems theory have contributed to the development of the presented technique. Some examples are given to illustrate the proposed method.
|
82 |
Projeto de um controlador Fuzzy Takagi-Sugeno para uma estação de tratamento de esgoto por lodos ativadosOLIVEIRA FILHO, José Haroldo Sena de 24 January 2013 (has links)
Submitted by Cleide Dantas (cleidedantas@ufpa.br) on 2014-03-07T15:37:09Z
No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_ProjetoControladorFuzzy.pdf: 1593015 bytes, checksum: 724013024cfa0539e49ad1f252cc7559 (MD5) / Approved for entry into archive by Ana Rosa Silva (arosa@ufpa.br) on 2014-05-13T17:01:18Z (GMT) No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_ProjetoControladorFuzzy.pdf: 1593015 bytes, checksum: 724013024cfa0539e49ad1f252cc7559 (MD5) / Made available in DSpace on 2014-05-13T17:01:18Z (GMT). No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_ProjetoControladorFuzzy.pdf: 1593015 bytes, checksum: 724013024cfa0539e49ad1f252cc7559 (MD5)
Previous issue date: 2013 / Este trabalho propõe o projeto de um controlador Fuzzy do tipo Takagi-Sugeno em uma estação de tratamento de esgoto por lodos ativados. Este tipo de tratamento ocorre na presença de oxigênio, pois microorganismos aeróbios presentes no licor misto irão proporcionar a remoção tanto da matéria carbonácea quanto nutrientes formados por compostos à base de nitrogênio. O controlador atua via mecanismo de aeração e foi projetado para interpolar os ganhos proporcionais e integrativos de três controladores fixos locais que, por sua vez, foram projetados a partir da linearização de um modelo contínuo de balanço de massa de oxigênio. O controlador auxiliará manter a concentração de oxigênio dissolvido desejável na faixa de operação do processo para que ocorra a nitrificação, reação química de oxiredução que
transforma amônio em nitrito, que é fundamental para o sucesso do processo, e poderá também economizar energia elétrica utilizada pelo mecanismo de aeração. Os ensaios foram realizados via simulação computacional em quatro cenários idealizados comparando o desempenho do controlador fuzzy e o desempenho de um controlador fixo projetado em um ponto de operação diferente do qual se utilizou como valor de referência na planta. Ao aplicar
um degrau no valor de referência estabelecido no cenário de análise, observou-se o tempo de
subida, o tempo de acomodação e o erro em regime. Após os ensaios, observou-se que o
desempenho do controlador fuzzy nos quesitos tempo de subida e tempo de acomodação em
relação ao controlador fixo foi melhor, enquanto nos quesitos sobressinal e erro em regime foi
semelhante. Após as análises, concluiu-se que a estratégia de controle escolhida neste trabalho
é viável, pois de acordo com o valor auferido de oxigênio dissolvido na entrada da planta, o
controlador fuzzy irá interpolar os ganhos proporcionais e integrativos de um controlador fixo
projetado na vizinhança deste valor e assim, atuar de forma bastante satisfatória. / The mean goal of this work is the design of a Takagi-Sugeno fuzzy controller on an activated
sludge wastewater treatment plant. This kind of process requires oxygen and aerobic
microorganisms in the mixed liquor that are necessary to remove the carbonaceous matter and
the nutrients based on nitrogen compounds. The controller acts on the aeration valve engine
and has been designed to interpolate the proportional and integrative gain of three fixes
controllers designed from the linearization of a continuous model of oxygen mass balance.
The controller assists to keep the desirable dissolved oxygen concentration necessary to the
nitrification, an oxi-reduction chemical reaction that transforms ammonia into nitrite and it is
also possible to save electric energy used by the aeration engine. It is imperative the
nitrification occurs for the success of the whole process. The Assays were performed by
computerized simulation in four idealized scenarios analyzing the performances of the fuzzy
controller and the fix controller designed to a different operation point of the set point defined
in the plant. Applying a degree in the set point established in the scenario it was analyzed the
rise time, settling time, overshoot and steady-state error. After the assays, the fuzzy controller
performed better than the fix one at rise time and settling time criteria and equivalent
performance at overshoot and steady-state error. After analysis, it was conclude that the
control strategy chosen in the work is viable, according the dissolved oxygen measure at the
plant entrance, the fuzzy controller interpolate the proportional and integrative gains of a fix
controller designed near this value and thus act quite satisfactory.
|
83 |
Contribution à la synthèse de lois de commande pour les descripteurs de type Takagi-Sugeno incertains et perturbésTahar, Bouarar 08 December 2009 (has links) (PDF)
Les travaux de recherche présentés dans cette thèse portent sur la stabilisation des systèmes descripteurs non linéaires représentés par des multi-modèles flous de type Takagi-Sugeno incertains et/ou perturbés. Dans ce cadre, des approches basées sur une fonction candidate quadratique de Lyapunov ont tout d'abord été développées. Celles-ci permettent la synthèse de lois de commande par la résolution d'un ensemble de contraintes LMIs (Inégalités Linéaires Matricielles). Les résultats de ces premières approches restent toutefois pessimistes vis-à-vis de l'ensemble des solutions accessible au problème de synthèse de lois de commande. Afin de réduire ce conservatisme, de nouvelles approches basées sur une fonction candidate non quadratique de Lyapunov et une loi de commande non PDC (Compensation Parallèle Distribuée) ont été proposées. Une autre source de conservatisme a ensuite été abordée. En effet, l'écriture classique de la dynamique de la boucle fermée introduit des termes croisés entre la commande et le modèle au sein des conditions LMIs à résoudre. L'utilisation de la propriété de redondance des descripteurs a alors permis de pallier cette source de conservatisme. En effet, l'écriture redondante de la dynamique de la boucle fermée permet de découpler les matrices du système à piloter de celles des gains de commande par retour d'état. Tirant parti de cette propriété, des problèmes réputés complexes en terme de formulation LMI ont étés traites tels que la synthèse de lois de commande robustes par retour de sortie dynamique et statique pour les systèmes standard de type Takagi-Sugeno incertains et/ou perturbés.
|
84 |
高木家文書の高度活用における関連文書調査の意義SAITO, Natsuki, 斎藤, 夏来 31 March 2010 (has links)
No description available.
|
85 |
Outils de commande avancés pour les applications automobilesNguyen, Tran Anh Tu 02 December 2013 (has links) (PDF)
Cette thèse est consacrée au développement de techniques de commande avancées pour des classes de systèmes non linéaires en général et pour des applications automobiles en particulier.Pour répondre au besoin du contrôle moteur, la première partie propose des nouveaux résultats théoriques sur la technique de commande non linéaire à base de modèles de type Takagi-Sugeno soumis à la saturation de la commande. La saturation de la commande est traitée en utilisant sa représentation polytopique ou une stratégie anti-windup.La deuxième partie porte sur la commande du système d'air d'un moteur turbocompressé à allumage commandé. Deux approches originales sont proposées. Dans la première, l'outil théorique concernant les modèles Takagi-Sugeno à commutation développé dans la première partie est directement appliqué. La seconde approche est basée sur une commande linéarisante robuste. L'originalité de ces approches multivariables consiste dans sa simplicité de mise en œuvre et son efficacité par rapport à celles qui existent dans la littérature.La dernière partie vise à développer des stratégies pour la gestion énergétique des systèmes électriques d'un véhicule obtenues en se basant sur le Principe du Minimum de Pontryagin. À cet effet, deux approches sont considérées : l'approche hors ligne d'optimisation utilisant les informations du futur concernant les conditions de roulage et l'approche en ligne qui est adaptée de la précédente. Ensuite, ces deux approches sont implémentées et évaluées dans un simulateur avancé.
|
86 |
Uncertainty Modelling And Stability Analysis For 2-way Fuzzy Adaptive SystemsGurkan, Evren 01 January 2003 (has links) (PDF)
A novel fuzzy system named as 2-way fuzzy system is developed by combining
the intuitionistic fuzzy set theory with the fuzzy systems theory. The developed
system is used in modelling and minimizing uncertainty and inconsistency.
Uncertainty is the width of the interval introduced by the independent
assignment of membership and nonmembership functions of the intuitionistic
fuzzy sets / and inconsistency is the violation of the consistency inequality in
this assignment. The uncertainty and inconsistency is reduced through a 2
phase training. An evaluation of the degree of reduction of inconsistency is
carried out at the end of the rst phase of training by forming the shadowed
set patterns of the membership and nonmembership functions. The system is
further trained for a second phase in order to reduce uncertainty.
There are three dierent methods developed for the stability analysis of
fuzzy systems. The rst method is based on the approximating sequences
technique, and the design turns into an optimal control problem. In the sec ond analysis, describing function of a 2-way fuzzy system is evaluated analytically,
and a systematic design approach is developed using describing function
technique. The last analysis technique employs the Lie algebra theory in the
stability analysis of Takagi-Sugeno fuzzy systems. The theoretical results are
simulated on an application system, which is a
exible-joint robot arm system.
|
87 |
Projeto de controladores baseados em LMIs : realimentação derivativa e sistemas chaveados utilizando estrutura variável /Cardim, Rodrigo. January 2009 (has links)
Orientador: Marcelo Carvalho Minhoto Teixeira / Banca: Edvaldo Assunção / Banca: José Paulo Fernandes Garcia / Banca: Aldayr Dantas de Araujo / Banca: Ramon Romankevicius Costa / Resumo: Neste trabalho são apresentados estudos teóricos, projetos de controladores e simulações numéricas de alguns sistemas de controle automáticos, que no decorrer das pesquisas geraram novas contribuições. Primeiramente foi feito um breve estudo sobre os sistemas fuzzy Takagi- Sugeno (TS) e realizadas algumas simulações envolvendo exemplos acadêmicos como o sistema bola-viga e o levitador magnético. Em decorrência desses estudos foi proposto um novo método para o controle de sistemas mecânicos não-lineares, descritos através de modelos fuzzy TS, considerando o acesso somente às derivadas das variáveis de estado da planta, com projeto baseado em desigualdades matriciais lineares, em inglês Linear Matrix Inequalities (LMIs) e estabilidade assegurada através de funções de Lyapunov. Adicionalmente, foram feitos estudos sobre realimentação derivativa, e proposto um novo método para projetar a matriz de realimentação discreta no tempo da derivada do vetor de estado, tal que o sinal de controle obtido seja equivalente a uma dada lei de controle contínua no tempo com realimentação do vetor de estado. O controlador discreto é obtido com base no controlador contínuo, utilizando um método de aproximação, baseado em LMIs. É suposto que a planta é controlável, linear e invariante no tempo, com uma (SI) ou múltiplas (MI) entradas. Este procedimento permite o uso de métodos de projeto bem conhecidos de realimentação das variáveis de estado em sistemas contínuos no tempo, para calcular diretamente os ganhos de realimentação da derivada das variáveis de estado em sistemas discretos no tempo. Os projetos com realimentação derivativa podem ser úteis no controle de sistemas mecânicos, utilizando-se acelerômetros como sensores. Finalizando, um outro assunto abordado neste trabalho e que também trouxe contribuições relevantes... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: In this work, theoretical studies, controller designs and numeric simulations of several automatic control systems that generated new contributions are presented. Firstly, a study on Takagi-Sugeno fuzzy systems modeling, control designs and simulations with practical examples, such as a ball-beam system and a nonlinear magnetic suspension system, are described. With these studies a simple method, based on Linear Matrix Inequalities (LMIs) and Lyapunov functions, for designing a control system using the Takagi-Sugeno fuzzy models in mechanical systems, where the available signals for the control are state-derivative, is proposed. Additionally, new results about state-derivative feedback including a simple method for designing a digital state-derivative feedback gain such that the control law is equivalent to a known and adequate continuous-time state feedback control law with a guaranteed stability are proposed. The digital controller is obtained by the continuous controller, using an approach method, based on LMIs. It is assumed that the plant is a linear controllable, time-invariant, Single-Input (SI) or Multiple-Input (MI) system. This procedure allows the use of well-known continuous-time state feedback design methods to directly design discrete-time state-derivative feedback control systems. The state-derivative feedback can be useful in the vibration control of mechanical systems, where the main sensors are accelerometers. Finally, we have the study with the design of state-feedback Variable Structure Controllers (VSC) for a class of continuous-time switched plants where is assume that the state vector is available for feedback. The design is based on Lyapunov-Metzler (LM) inequalities and also on Strictly Positive Real (SPR) systems stability results. The recent definition of Lyapunov-Metzler-SPR (LMSPR) systems is presented and a new direct application... (Complete abstract click electronic access below) / Doutor
|
88 |
Modelagem de sistemas dinamicos não lineares utilizando sistemas fuzzy, algoritmos geneticos e funções de base ortonormal / Modeling of nonlinear dynamics systems using fuzzy systems, genetic algorithms and orthonormal basis functionsMedeiros, Anderson Vinicius de 23 January 2006 (has links)
Orientadores: Wagner Caradori do Amaral, Ricardo Jose Gabrielli Barreto Campello / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-06T08:36:39Z (GMT). No. of bitstreams: 1
Medeiros_AndersonViniciusde_M.pdf: 896535 bytes, checksum: 48d0d75d38fcbbd0f47f7c49823806f1 (MD5)
Previous issue date: 2006 / Resumo: Esta dissertação apresenta uma metodologia para a geração e otimização de modelos fuzzy Takagi-Sugeno (TS) com Funções de Base Ortonormal (FBO) para sistemas dinâmicos não lineares utilizando um algoritmo genético. Funções de base ortonormal têm sido utilizadas por proporcionarem aos modelos propriedades como ausência de recursão da saída e possibilidade de se alcançar uma razoável capacidade de representação com poucos parâmetros. Modelos fuzzy TS agregam a essas propriedades as características de interpretabilidade e facilidade de representação do conhecimento. Enfim, os algoritmos genéticos se apresentam como um método bem estabelecido na literatura na tarefa de sintonia de parâmetros de modelos fuzzy TS. Diante disso, desenvolveu-se um algoritmo genético para a otimização de duas arquiteturas, o modelo fuzzy TS FBO e sua extensão, o modelo fuzzy TS FBO Generalizado. Foram analisados modelos locais lineares e não lineares nos conseqüentes das regras fuzzy, assim como a diferença entre a estimação local e a global (utilizando o estimador de mínimos quadrados) dos parâmetros desses modelos locais. No algoritmo genético, cada arquitetura contou com uma representação cromossômica específica. Elaborou-se para ambas uma função de fitness baseada no critério de Akaike. Em relação aos operadores de reprodução, no operador de crossover aritmético foi introduzida uma alteração para a manutenção da diversidade da população e no operador de mutação gaussiana adotou-se uma distribuição variável ao longo das gerações e diferenciada para cada gene. Introduziu-se ainda um método de simplificação de soluções através de medidas de similaridade para a primeira arquitetura citada. A metodologia foi avaliada na tarefa de modelagem de dois sistemas dinâmicos não lineares: um processo de polimerização e um levitador magnético / Abstract: This work introduces a methodology for the generation and optimization of Takagi-Sugeno (TS) fuzzy models with Orthonormal Basis Functions (OBF) for nonlinear dynamic systems based on a genetic algorithm. Orthonormal basis functions have been used because they provide models with properties like absence of output feedback and the possibility to reach a reasonable approximation capability with just a few parameters. TS fuzzy models aggregate to these properties the characteristics of interpretability and easiness to knowledge representation in a linguistic manner. Genetic algorithms appear as a well-established method for tuning parameters of TS fuzzy models. In this context, it was developed a genetic algorithm for the optimization of two architectures, the OBF TS fuzzy model and its extension, the Generalized OBF TS fuzzy model. Local linear and nonlinear models in the consequent of the fuzzy rules were analyzed, as well as the difference between local and global estimation (using least squares estimation) of the parameters of these local models. Each architecture had a specific chromosome representation in the genetic algorithm. It was developed a fitness function based on the Akaike information criterion. With respect to the genetic operators, the arithmetic crossover was modified in order to maintain the population diversity and the Gaussian mutation had its distribution varied along the generations and differentiated for each gene. Besides, it was used, in the first architecture presented, a method for simplifying the solutions by using similarity measures. The whole methodology was evaluated in modeling two nonlinear dynamic systems, a polymerization process and a magnetic levitator / Mestrado / Automação / Mestre em Engenharia Elétrica
|
89 |
Commande de robots manipulateurs basée sur le modèle de Takagi-Sugeno : nouvelle approche pour le suivi de trajectoire / Control of robots manipulators based the Takagi-Sugeno model : new approach for tracking controlNguyen, Thi Van Anh 04 October 2019 (has links)
Ce travail présente une nouvelle approche de synthèse de la commande non linéaire en suivi de trajectoire de robots manipulateurs. Malgré la richesse de la littérature dans le domaine, le problème n'a pas encore été traité de manière adéquate : en raison de l'existence inévitable dans les applications pratiques de perturbations et incertitudes telles que les forces de frottement, des perturbations externes ou les variations des paramètres il est difficile d'assurer un suivi de trajectoire de haute précision. Afin de résoudre ce problème, nous proposons tout d'abord une méthode de commande prenant en compte la performance H∞ pour le suivi de trajectoire d'un robot manipulateur. Deuxièmement, nous proposons un nouveau cadre pour la synthèse de lois de commande combinant une action anticipatrice et un retour d'état basée sur une représentation sous forme Takagi-Sugeno descripteur de la dynamique du manipulateur. Un avantage de la représentation choisie est de pouvoir simultanément simplifier le calcul des gains de commande à l'aide de LMI de dimension réduite et de réduire la complexité du correcteur en agissant sur le nombre de règles du modèle de Takagi-Sugeno. Basé sur la théorie de la stabilité de Lyapunov, le réglage du correcteur est formulé comme un problème d'optimisation LMI (inégalité matricielle linéaire). Les résultats obtenus en simulation effectuée avec un modèle de manipulateur série développé dans l'environnement Simscape MultibodyTM de Matlab R démontrent clairement l'efficacité de la méthode proposée en comparaison avec le régulateur PID et la commande CTC (Computed Torque Control). / This work presents a new design approach for trajectory tracking control of robot manipulators. In spite of the rich literature in the field, the problem has not yet been addressed adequately due to the lack of an effective control design. In general, it is difficult to adopt design to achieve high-precision tracking control due to the uncertainties in practical applications, such as friction forces, external disturbances and parameter variations. In order to cope this problem, we propose first control with H∞ performance to reference trajectory tracking control of two degrees of freedom robot. Secondly, we propose a new design framework with parametric uncertainties and unknown disturbances by using the feedback and the feedforward controllers. Using the descriptor Takagi-Sugeno systems, the design goal is to achieve a guaranteed tracking performance while signicantly reducing the numerical complexity of the designed controller through a robust control scheme. Based on Lyapunov stability theory, the control design is formulated as an LMI (linear matrix inequality) optimization problem. Simulation results carried out with a high-fidelity serial manipulator model embedded in the Simscape MultibodyTM environment of MatlabR clearly demonstrate the effectiveness of the proposed method by comparing with PID controller and computed torque controller.
|
90 |
Value Function Estimation in Optimal Control via Takagi-Sugeno Models and Linear ProgrammingDíaz Iza, Henry Paúl 23 March 2020 (has links)
[ES] La presente Tesis emplea técnicas de programación dinámica y aprendizaje por refuerzo para el control de sistemas no lineales en espacios discretos y continuos. Inicialmente se realiza una revisión de los conceptos básicos de programación dinámica y aprendizaje por refuerzo para sistemas con un número finito de estados. Se analiza la extensión de estas técnicas mediante el uso de funciones de aproximación que permiten ampliar su aplicabilidad a sistemas con un gran número de estados o sistemas continuos.
Las contribuciones de la Tesis son:
-Se presenta una metodología que combina identificación y ajuste de la función Q, que incluye la identificación de un modelo Takagi-Sugeno, el cálculo de controladores subóptimos a partir de desigualdades matriciales lineales y el consiguiente ajuste basado en datos de la función Q a través de una optimización monotónica.
-Se propone una metodología para el aprendizaje de controladores utilizando programación dinámica aproximada a través de programación lineal. La metodología hace que ADP-LP funcione en aplicaciones prácticas de control con estados y acciones continuos. La metodología propuesta estima una cota inferior y superior de la función de valor óptima a través de aproximadores funcionales. Se establecen pautas para los datos y la regularización de regresores con el fin de obtener resultados satisfactorios evitando soluciones no acotadas o mal condicionadas.
-Se plantea una metodología bajo el enfoque de programación lineal aplicada a programación dinámica aproximada para obtener una mejor aproximación de la función de valor óptima en una determinada región del espacio de estados. La metodología propone aprender gradualmente una política utilizando datos disponibles sólo en la región de exploración. La exploración incrementa progresivamente la región de aprendizaje hasta obtener una política convergida. / [CA] La present Tesi empra tècniques de programació dinàmica i aprenentatge per reforç per al control de sistemes no lineals en espais discrets i continus. Inicialment es realitza una revisió dels conceptes bàsics de programació dinàmica i aprenentatge per reforç per a sistemes amb un nombre finit d'estats.
S'analitza l'extensió d'aquestes tècniques mitjançant l'ús de funcions d'aproximació que permeten ampliar la seua aplicabilitat a sistemes amb un gran nombre d'estats o sistemes continus.
Les contribucions de la Tesi són:
-Es presenta una metodologia que combina identificació i ajust de la funció Q, que inclou la identificació d'un model Takagi-Sugeno, el càlcul de controladors subòptims a partir de desigualtats matricials lineals i el consegüent ajust basat en dades de la funció Q a través d'una optimització monotónica.
-Es proposa una metodologia per a l'aprenentatge de controladors utilitzant programació dinàmica aproximada a través de programació lineal. La metodologia fa que ADP-LP funcione en aplicacions pràctiques de control amb estats i accions continus. La metodologia proposada estima una cota inferior i superior de la funció de valor òptima a través de aproximadores funcionals. S'estableixen pautes per a les dades i la regularització de regresores amb la finalitat d'obtenir resultats satisfactoris evitant solucions no fitades o mal condicionades.
-Es planteja una metodologia sota l'enfocament de programació lineal aplicada a programació dinàmica aproximada per a obtenir una millor aproximació de la funció de valor òptima en una determinada regió de l'espai d'estats. La metodologia proposa aprendre gradualment una política utilitzant dades disponibles només a la regió d'exploració. L'exploració incrementa progressivament la regió d'aprenentatge fins a obtenir una política convergida. / [EN] The present Thesis employs dynamic programming and reinforcement learning techniques in order to obtain optimal policies for controlling nonlinear systems with discrete and continuous states and actions. Initially, a review of the basic concepts of dynamic programming and reinforcement learning is carried out for systems with a finite number of states. After that, the extension of these techniques to systems with a large number of states or continuous state systems is analysed using approximation functions.
The contributions of the Thesis are:
-A combined identification/Q-function fitting methodology, which involves identification of a Takagi-Sugeno model, computation of (sub)optimal controllers from Linear Matrix Inequalities, and the subsequent data-based fitting of Q-function via monotonic optimisation.
-A methodology for learning controllers using approximate dynamic programming via linear programming is presented. The methodology makes that ADP-LP approach can work in practical control applications with continuous state and input spaces. The proposed methodology estimates a lower bound and upper bound of the optimal value function through functional approximators. Guidelines are provided for data and regressor regularisation in order to obtain satisfactory results avoiding unbounded or ill-conditioned solutions.
-A methodology of approximate dynamic programming via linear programming in order to obtain a better approximation of the optimal value function in a specific region of state space. The methodology proposes to gradually learn a policy using data available only in the exploration region. The exploration progressively increases the learning region until a converged policy is obtained. / This work was supported by the National Department of Higher Education, Science, Technology and Innovation of Ecuador (SENESCYT), and the Spanish ministry of Economy and European Union, grant DPI2016-81002-R (AEI/FEDER,UE). The author also received the grant for a predoctoral stay, Programa de Becas Iberoamérica- Santander Investigación 2018, of the Santander Bank. / Díaz Iza, HP. (2020). Value Function Estimation in Optimal Control via Takagi-Sugeno Models and Linear Programming [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/139135
|
Page generated in 0.0428 seconds