Global ETD Search

91	Um modelo de simulação para otimização da alocação de estações de recarga para ônibus elétricos no transporte público de Curitiba Sebastiani, Mariana Teixeira 28 August 2014 (has links) CAPES / As crescentes preocupações com as questões ambientais têm levado à consideração de alternativas na mobilidade e transporte urbanos. Dentre as opções disponíveis, os ônibus elétricos movidos a bateria têm sido bastante considerados em termos de flexibilidade, sustentabilidade e emissão de poluentes. Estes ônibus possuem um sistema plug-in de recarga (PEV) que permite sua circulação sem a necessidade de alimentação constante por vias exclusivas. Entretanto, devido à necessidade de recarga das baterias, o número e posicionamento das estações de recarga tem papel fundamental na viabilização da operação deste sistema de transporte. Este trabalho apresenta um modelo de simulação de eventos discretos que captura o padrão de movimentação dos ônibus e respectivo consumo de energia. Uma estratégia de otimização que utiliza um algoritmo genético biobjetivo é então associada à simulação (otimização com simulação) para minimizar tanto o número de estações de recarga quanto o tempo extra necessário para recarga dos ônibus. Foram utilizados dados reais de demanda de passageiros, velocidade dos ônibus, distâncias, relevos, entre outros, do sistema de transporte da cidade de Curitiba. Os parâmetros de mobilidade dos ônibus estão baseados em dados reais adquiridos, filtrados e analisados através de um sistema informatizado da empresa que controla o sistema público e urbanização da cidade para um total de seis linhas expressas. O modelo utilizado para o consumo de energia dos ônibus é baseado no cálculo da energia necessária para movimentar um ônibus, levando em conta diferentes carregamentos e forças de resistência ao movimento. Nas paradas que possuem estações de recarga, considera-se recarga rápida da bateria ajustada para os parâmetros típicos de um ônibus elétrico. Os resultados mostram diferentes arranjos para o número de estações de recarga e atrasos nos itinerários programados, assim como os níveis de operação das baterias. / Growing concerns with environmental issues have resulted in considering alternatives for urban mobility and public transportation. Among the available options, battery- powered electric buses have been fairly considered in terms of flexibility, sustainability and emission of pollutants. These buses have a plug-in recharge system (PEV) that allows their driving in exclusive lanes without providing external power. However, recharge of batteries is necessary, and the number and placement of charging stations have a fundamental role in the operation of this transport system. This work presents a discrete event simulation model that captures the pattern of bus dynamics and its corresponding energy consumption. An optimization strategy that utilizes a biobjective genetic algorithm is then associated with the simulation (simulation with optimization) to minimize both the number of charging stations and average extra time needed to recharge batteries. Information for passenger demand, bus speed, distances, road elevations, among others, have been obtained from the Curitiba public transportation system. The parameters of buses’ mobility are based on real data acquired, filtered and analyzed for six express lines from raw data provided by a computational system of a company that controls the public transportation system and urban area of the city. The mathematical model used to compute the power consumption of a bus is based on the energy required to run it, taking into account different loadings and friction forces. Fast battery recharge with typical parameters of an electric bus is considered at bus stops with charging stations. The results show different arrangements for the number of recharge stations and delays in the bus schedule, as well as the corresponding energy levels of batteries. Sistemas de tempo discreto Otimização matemática Algorítmos genéticos Veículos elétricos Energia - Consumo Métodos de simulação Transporte urbano Engenharia elétrica Discrete-time systems Mathematical optimization Genetic algorithms Electric vehicles Energy consumption Simulation methods Urban transportation Electric engineering
92	Um modelo de simulação para otimização da alocação de estações de recarga para ônibus elétricos no transporte público de Curitiba Sebastiani, Mariana Teixeira 28 August 2014 (has links) CAPES / As crescentes preocupações com as questões ambientais têm levado à consideração de alternativas na mobilidade e transporte urbanos. Dentre as opções disponíveis, os ônibus elétricos movidos a bateria têm sido bastante considerados em termos de flexibilidade, sustentabilidade e emissão de poluentes. Estes ônibus possuem um sistema plug-in de recarga (PEV) que permite sua circulação sem a necessidade de alimentação constante por vias exclusivas. Entretanto, devido à necessidade de recarga das baterias, o número e posicionamento das estações de recarga tem papel fundamental na viabilização da operação deste sistema de transporte. Este trabalho apresenta um modelo de simulação de eventos discretos que captura o padrão de movimentação dos ônibus e respectivo consumo de energia. Uma estratégia de otimização que utiliza um algoritmo genético biobjetivo é então associada à simulação (otimização com simulação) para minimizar tanto o número de estações de recarga quanto o tempo extra necessário para recarga dos ônibus. Foram utilizados dados reais de demanda de passageiros, velocidade dos ônibus, distâncias, relevos, entre outros, do sistema de transporte da cidade de Curitiba. Os parâmetros de mobilidade dos ônibus estão baseados em dados reais adquiridos, filtrados e analisados através de um sistema informatizado da empresa que controla o sistema público e urbanização da cidade para um total de seis linhas expressas. O modelo utilizado para o consumo de energia dos ônibus é baseado no cálculo da energia necessária para movimentar um ônibus, levando em conta diferentes carregamentos e forças de resistência ao movimento. Nas paradas que possuem estações de recarga, considera-se recarga rápida da bateria ajustada para os parâmetros típicos de um ônibus elétrico. Os resultados mostram diferentes arranjos para o número de estações de recarga e atrasos nos itinerários programados, assim como os níveis de operação das baterias. / Growing concerns with environmental issues have resulted in considering alternatives for urban mobility and public transportation. Among the available options, battery- powered electric buses have been fairly considered in terms of flexibility, sustainability and emission of pollutants. These buses have a plug-in recharge system (PEV) that allows their driving in exclusive lanes without providing external power. However, recharge of batteries is necessary, and the number and placement of charging stations have a fundamental role in the operation of this transport system. This work presents a discrete event simulation model that captures the pattern of bus dynamics and its corresponding energy consumption. An optimization strategy that utilizes a biobjective genetic algorithm is then associated with the simulation (simulation with optimization) to minimize both the number of charging stations and average extra time needed to recharge batteries. Information for passenger demand, bus speed, distances, road elevations, among others, have been obtained from the Curitiba public transportation system. The parameters of buses’ mobility are based on real data acquired, filtered and analyzed for six express lines from raw data provided by a computational system of a company that controls the public transportation system and urban area of the city. The mathematical model used to compute the power consumption of a bus is based on the energy required to run it, taking into account different loadings and friction forces. Fast battery recharge with typical parameters of an electric bus is considered at bus stops with charging stations. The results show different arrangements for the number of recharge stations and delays in the bus schedule, as well as the corresponding energy levels of batteries. Sistemas de tempo discreto Otimização matemática Algorítmos genéticos Veículos elétricos Energia - Consumo Métodos de simulação Transporte urbano Engenharia elétrica Discrete-time systems Mathematical optimization Genetic algorithms Electric vehicles Energy consumption Simulation methods Urban transportation Electric engineering
93	Caracterização e análise de desempenho dos amplificadores ópticos Raman discretos em sistemas de comunicações ópticas na banda O Taveira, Palmerston Donizzeti 02 August 2006 (has links) Made available in DSpace on 2016-03-15T19:37:40Z (GMT). No. of bitstreams: 1 Palmerston Donizzeti Taveira.pdf: 3709250 bytes, checksum: f7776004371e059d73f0d20c8d735c07 (MD5) Previous issue date: 2006-08-02 / The optical amplifier has improved the optical communication systems because they lead to an increase in transmission capacity of medium and long haul optical systems, with technological advantages over electronic regenerators. The optical amplifier are relatively simple to deploy and can be used in optical links without any troubles regarding signal transmission rate improvement and signal modulation changes, as a consequence of these issues they can substitute the electronic regenerator enhancing security with low operation cost. The CWDM systems multiplex optical wavelength with a low cost in metropolitan networks. It was developed to connect backbone networks to metro core and edge networks with cost saving over DWDM systems but lower transmission capacity. We have developed and characterized in our research a discrete Raman amplifier for operation in O band. We connected the amplifier in a point to point CWDM in order to analyze the gain on the system transmission capacity and the impairments that appears in the system. Working with a eight channel CWDM in O band, modulated with 2.5 Gbit/s, we have demonstrated that we can use a discrete Raman amplifier in single configurations, pre amplifier, booster and line amplifier and shared configuration with booster and pre amplifier to increase the transmission capacity that means, increase the length of the optical link. We have increased in 110% the length of the optical link with a shared configuration of two amplifiers with 10 dB gain for each one. / Os amplificadores ópticos revolucionaram a tecnológica das comunicações ópticas, pois possibilitaram o aumento da capacidade de transmissão dos sistemas ópticos de média e longa distância, com vantagens tecnológicas sobre os regeneradores. Estes dispositivos são relativamente simples de serem desenvolvidos, utilizam poucos componentes e podem ser utilizados nas redes ópticas de forma transparente a taxa de transmissão e modulação do sinal. Substituem assim, com vantagens, os regeneradores eletrônicos, agregando segurança e baixo custo à operação das redes ópticas. Os sistemas CWDM realizam a multiplexação óptica de comprimentos de onda a um baixo custo em redes metropolitanas. São utilizados para conectar as redes de transporte de alta capacidade às redes de acesso, trazendo uma larga vantagem em custo sobre os sistemas DWDM, porém com menor capacidade de transmissão. Nosso trabalho de pesquisa consistiu em desenvolver e caracterizar um amplificador Raman discreto na banda O (1260 a 1360 nm), aplicando este amplificador em um sistema CWDM ponto a ponto com taxa de transmissão de 2.5 Gbit/s por canal e analisando o aumento na capacidade de transmissão e os efeitos que degradam o sinal transmitido. Trabalhando com um sistema CWDM com oito canais na banda O, demonstramos que podemos utilizar um amplificador Raman discreto nas configurações isoladas de pré-amplificador, booster e amplificador de linha e na configuração simultânea de booster e pré-amplificador para aumentar a capacidade de transmissão. Aumentamos o comprimento original do enlace em 110%. amplificador Raman discreto discrete Raman amplifier CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
94	CONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICA / CONVERGENCE OF ESTIMATOR RLS FOR ALGORITHMS OF HEURISTIC DYNAMIC PROGRAMMING Maciel, Allan James Ferreira 28 September 2012 (has links) Made available in DSpace on 2016-08-17T14:53:22Z (GMT). No. of bitstreams: 1 Dissertacao Allan James.pdf: 3170694 bytes, checksum: 054a9e74e81a7c2099800246d0b6c530 (MD5) Previous issue date: 2012-09-28 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The union of methodologies for optimal control and dynamics programming has stimulated the development of algorithms for realization of discrete control systems of the type linear quadratic regulator (DLQR). The methodology is based on reinforcement learning methods based on temporal differences and approximate dynamic programming. The proposed method combines the approach of the value function by method RLS (recursive least squares) and approximate policy iteration schemes heuristic dynamic programming (HDP). The approach is directed to the assessment of convergence of the solution DLQR and the heuristic weighting matrices 􀜳 and 􀜴 of the utility function associated with DLQR. The investigation of convergence properties related to consistency, persistent excitation and polarization of the RLS estimator is performed. The methodology involved in a project achievements online DLQR controllers and is evaluated in a fourth order multivariable dynamic system. / A união das metodologias de controle ótimo e de programação dinâmica tem impulsionado o desenvolvimento de algoritmos para realizações de sistemas de controle discreto do tipo regulador linear quadrático (DLQR). A metodologia utilizada neste trabalho é fundamentada sobre métodos de aprendizagem por reforço baseados em diferenças temporais e programação dinâmica aproximada. O método proposto combina a aproximação da função valor através do método RLS (mínimos quadrados recursivos) e iteração de política aproximada em esquemas de programação dinâmica heurística (HDP). A abordagem é orientada para a avaliação da convergência da solução DLQR e para a sintonia heurística das matrizes de ponderação 􀜳 e 􀜴da função de utilidade associada ao DLQR. É realizada a investigação das propriedades de convergência relacionadas à consistência, excitação persistente e polarização do estimador RLS. A metodologia contempla realizações de projetos de forma online de controladores DLQR e é avaliada em um sistema dinâmico multivariável de quarta ordem. Programação Dinâmica Heurística Controle Multivariável Controle Ótimo Regulador Quadrático Linear Discreto Mínimos Quadrados Recursivos Controle Digital Heuristic Dynamic Programming Multivariable Control Optimal Control Discrete Linear Quadratic Regulator Recursive Least Squares Digital Control
95	Modelo matemático com parâmetros que dependem da discretização: aplicação ao estudo de fenômenos de propagação discreta em meios excitáveis Silva, Pedro André Arroyo 23 April 2018 (has links) Submitted by Renata Lopes (renatasil82@gmail.com) on 2018-07-26T12:29:23Z No. of bitstreams: 1 pedroandrearroyosilva.pdf: 4154699 bytes, checksum: 1875b7d54dd015591fcdd55db287ee37 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2018-09-03T16:20:02Z (GMT) No. of bitstreams: 1 pedroandrearroyosilva.pdf: 4154699 bytes, checksum: 1875b7d54dd015591fcdd55db287ee37 (MD5) / Made available in DSpace on 2018-09-03T16:20:02Z (GMT). No. of bitstreams: 1 pedroandrearroyosilva.pdf: 4154699 bytes, checksum: 1875b7d54dd015591fcdd55db287ee37 (MD5) Previous issue date: 2018-04-23 / A formação de padrões espaço-temporais são observados em processos químicos e bio-lógicos. Apesar dos sistemas bioquímicos serem altamente heterogêneos, aproximações homogenizadas contínuas formadas por equações diferenciais parciais são utilizadas fre-quentemente. Estas aproximações são usualmente justificadas pela diferença de escalas entre as heterogeneidades e o tamanho da característica espacial dos padrões. Em certas condições do meio, por exemplo, quando há um acoplamento fraco entre as células car-díacas, os modelos homogenizados discretos são mais adequados. Entretanto, os modelos discretos são menos manejáveis, por exemplo, na geração de malha para 2D e 3D, se comparado com os modelos contínuos. Aqui estudamos um modelo matemático homoge-nizado contínuo que se aproxima do modelo homogenizado. Este modelo é dado a partir de equações diferencias parciais com um parâmetro que depende da discretização da ma-lha. Dessa maneira nos referimos a este por um modelo matemático com parâmetros que dependem da discretização. Validamos nossa aproximação em um meio excitável genérico que simula três fenômenos em 1D: a propagação do potencial de ação transmembrânico no tecido cardíaco, a propagação do potencial de ação em filamentos de axônios cobertos por bainhas de mielina e a propagação do ativador e inibidor em microemulsões químicas. Para o caso 2D desenvolvemos uma versão da nossa aproximação que reproduz ondas espirais em um meio com acoplamento fraco. / The spatio-temporal patterns formations are observed in chemical and biological pro-cesses. Although biochemical systems are highly heterogeneous, homogenized continuum approaches formed by partial differential equations have been employed frequently. These approaches are usually justified by the difference scales between the characteristic spatial size of the patterns. Under some conditions of the medium, for instance, under weak coupling between cardiac cells, discrete models are more adequate. On the other hand discrete models may be less manageable, for instance, in terms of mesh generation, com-pared to the continuum models. Here we study a mathematical model to approach the discreteness which permits the computer implementation on non-uniform meshes. The model is cast as a partial differential equation but with a parameter that depends on the discretization mesh. Therefore we refer to it as a mathematical model with parameters dependent of discretization. We validate the approach in a generic excitable media that simulates three different phenomena in 1D: the propagation of action potential in car-diac tissue, the propation of the action potentialin filaments of axons wrapped by myelin sheaths, and the propagation of the activator/inhibitor in chemical microemulsions. For the 2D case we develop a version to this approach in microemulsions where it was possible to reproduce spiral waves with weak coupling of the medium. CNPQ::CIENCIAS EXATAS E DA TERRA Meios excitáveis Modelo heterogêneo multiescala Homogenização Modelo homogenizado contínuo Modelo homogenizado discreto Modelo homogenizado quase-contínuo Modelo dependente da discretização Excitable media Heterogeneous multi-scale media Homogenization Continuum model Discrete model Quasicontinuum model Discretization depends of model
96	Um estudo de métodos de Galerkin descontínuo de alta ordem para problemas hiperbólicos / A study of high order discontinuous Galerkin methods for hyperbolic problems Silva, Felipe Augusto Guedes da, 1991- 27 August 2018 (has links) Orientadores: Maicon Ribeiro Correa, Eduardo Cardoso de Abreu / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-27T11:41:21Z (GMT). No. of bitstreams: 1 Silva_FelipeAugustoGuedesda_M.pdf: 1119470 bytes, checksum: eeabeb98750e53492e778b99174c0887 (MD5) Previous issue date: 2015 / Resumo: O foco do presente trabalho consiste no estudo computacional de métodos de Galerkin Descontínuo para aproximação numérica de problemas diferenciais de natureza hiperbólica, com enfoque em esquemas explícitos e no uso de aproximações do tipo Runge-Kutta no tempo para aproximação de problemas lineares e não-lineares. Especificamente, serão exploradas as boas propriedades de estabilidade local, no tempo, dos métodos da classe Runge-Kutta em conjunto com funções de fluxo numérico estáveis e com o uso de limitadores de inclinação, com o objetivo de desenvolver métodos Galerkin Descontínuo de alta ordem capazes de obter uma boa resolução de gradientes abruptos e de soluções descontínuas, sem oscilações espúrias, em problemas hiperbólicos. Uma breve discussão sobre esquemas de volumes finitos centrais de alta ordem é apresentada, onde são introduzidos importantes conceitos a serem utilizados na construção dos métodos de Galerkin Descontínuo. Um conjunto representativo de simulações numéricas de modelos hiperbólicos lineares e não-lineares é apresentado e discutido para avaliar a qualidade das aproximações obtidas em uma comparação direta com outras aproximações precisas de volumes finitos ou com soluções exatas, sempre que possível / Abstract: The focus of this work is the computational study of some Discontinuous Galerkin methods for the numerical approximation of first order hyperbolic differential problems, focusing on explicit schemes with discretization based on Runge-Kutta type methods in time, in problems with linear and nonlinear fluxes. Specifically, the good local stability properties of Runge-Kutta methods are combined with stable numerical flux functions and slope limiters in order to propose new higher-order Discontinuous Galerkin methods that achieve high resolution of abrupt gradients and of discontinuous solutions, without spurious oscillations in numerical solutions. Furthermore, a brief discussion about higher-order finite volume central schemes is presented in order to introduce some important concepts to be used in the construction of the DG methods. A representative set of numerical simulations for linear and nonlinear hyperbolic models is presented and discussed, in order to check the accuracy of the obtained Discontinuous Galerkin solutions by comparing their results with those of existing well-established finite volume numerical methods and exact solutions / Mestrado / Matematica Aplicada / Mestre em Matemática Aplicada Equações diferenciais hiperbólicas Galerkin, Métodos de Runge-Kutta, Fórmulas de Hyperbolic differential equations Galerkin methods Runge-Kutta formulas
97	[en] A STRUCTURED CONTINUATION METHOD FOR PROBLEMS WITH MULTIPLE SOLUTIONS / [pt] UM MÉTODO DE CONTINUAÇÃO ESTRUTURADO PARA PROBLEMAS COM MÚLTIPLAS SOLUÇÕES DIEGO SOARES MONTEIRO DA SILVA 07 December 2021 (has links) [pt] Seja F uma função definida de um espaço de Banach real X para um espaço de Banach real Y e g um ponto pertencente a Y. Descrevemos um algoritmo para calcular as soluções u da equação F de u igual a g. Inicialmente, o algoritmo parte de uma curva c no domínio, a qual é escolhida de modo a interceptar substancialmente o conjunto crítico de F. Calculamos através de métodos de continuação uma componente da imagem inversa de F de c e definimos essa componente de forma abstrata: grafo completamente espelhado. Claramente, os métodos de continuação padrão têm melhores chances de sucesso em diferentes pontos iniciais. Fornecemos argumentos geométricos para a abundância ocasional de soluções e uma busca estruturada dessas. Três exemplos são considerados detalhadamente. O primeiro é uma função do plano no plano, em que podemos validar os resultados com auxílio de um software. O segundo conjunto de exemplos é obtido a partir da discretização de um problema de Sturm-Liouville não linear com um número inesperado de soluções. Por último, calculamos as seis soluções aproximadas de um problema estudado por Solimini. / [en] Let F be a definite function from a real Banach space X to a real Banach space Y and g a point belonging to Y. We describe an algorithm for calculating the solutions u of the equation F of u equal to g. Initially, the algorithm starts from a curve c in the domain, which is chosen so as to substantially intercept the critical set of F. We calculate through continuation methods a component of the inverse image of F of c and define this component in an abstract way: graph completely mirrored. Clearly, standard continuation methods have better chances of success at different starting points. We provide geometric arguments for the occasional abundance of solutions and a structured search for these. Three examples are considered in detail. The first is a function of the plan in the plan, in which we can validate the results with the help of software. The second set of examples is obtained from the discretization of a non-linear Sturm-Liouville problem with an unexpected number of solutions. Finally, we calculate the six approximate solutions of a problem studied by Solimini. [pt] METODOS DE CONTINUACAO [pt] OPERADORES ELIPTICOS SEMILINEARES [pt] METODO DO TIRO DISCRETO [pt] DOBRAS E BIFURCACOES [en] CONTINUATION METHODS [en] SEMI-LINEAR ELLIPTIC OPERATOR [en] STURM-LIOUVILLE NONLINEAR OPERATORS [en] DISCRETE SHOOTING METHOD [en] FOLDS AND BIFURCATIONS
98	Contributions to discrete-time methods for room acoustic simulation Escolano Carrasco, José 24 May 2010 (has links) The sound field distribution in a room is the consequence of the acoustic properties of radiating sources and the position, geometry and absorbing characteristics of the surrounding boundaries in an enclosure (boundary conditions). Despite there existing a consolidated acoustic wave theory, it is very difficult, nearly impossible, to find an analytical expression of the sound variables distribution in a real room, as a function of time and position. This scenario represents as an inhomogeneous boundary value problem, where the complexity of source properties and boundary conditions make that problem extremely hard to solve. Room acoustic simulation, as treated in this thesis, comprises the algebraical approach to solve the wave equation, and the way to define the boundary conditions and source modeling of the scenario under analysis. Numerical methods provide accurate algorithms for this purpose and among the different possibilities, the use of discrete-time methods arises as a suitable solution for solving those partial differential equations, particularized by some specific constrains. Together with the constant growth of computer power, those methods are increasing their suitability for room acoustic simulation. However, there exists an important lack of accuracy in the definition of some of these conditions so far: current frequency-dependent boundary conditions do not comply with any physical model, and directive sources in discrete-time methods have been hardly treated. This thesis discusses about the current state-of-the-art of the boundary conditions and source modeling in discrete-time methods for room acoustic simulation, and it contributes some algorithms to enhance boundary condition formulation, in a locally reacting impedance sense, and source modelling in terms of directive sources under a defined radiation pattern. These algorithms have been particularized to some discrete-time methods such as the Finite Difference Time Domain and the Digital Waveguide Mesh. / Escolano Carrasco, J. (2008). Contributions to discrete-time methods for room acoustic simulation [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/8309 Acústica arquitectónica Impedancia de reacción local Métodos en tiempo discreto Modelo de fuentes sonoras Problema no homogéneo de contorno Simulación acústica de salas TEORIA DE LA SEÑAL Y COMUNICACIONES 220102 - Acústica arquitectónica
99	Melhorias de estabilidade numérica e custo computacional de aproximadores de funções valor de estado baseados em estimadores RLS para projeto online de sistemas de controle HDP-DLQR / Numerical Stability and Computational Cost Implications of State Value Functions based on RLS Estimators for Online Design of HDP-DLQR control systems Ferreira, Ernesto Franklin Marçal 08 March 2016 (has links) Submitted by Rosivalda Pereira (mrs.pereira@ufma.br) on 2017-06-23T20:34:27Z No. of bitstreams: 1 ErnestoFerreira.pdf: 1744167 bytes, checksum: c125c90e5eb2aab2618350567f88cb31 (MD5) / Made available in DSpace on 2017-06-23T20:34:27Z (GMT). No. of bitstreams: 1 ErnestoFerreira.pdf: 1744167 bytes, checksum: c125c90e5eb2aab2618350567f88cb31 (MD5) Previous issue date: 2016-03-08 / The development and the numerical stability analysis of a new adaptive critic algorithm to approximate the state-value function for online discrete linear quadratic regulator (DLQR) optimal control system design based on heuristic dynamic programming (HDP) are presented in this work. The proposed algorithm makes use of unitary transformations and QR decomposition methods to improve the online learning e-ciency in the critic network through the recursive least-squares (RLS) approach. The developed learning strategy provides computational performance improvements in terms of numerical stability and computational cost which aim at making possible the implementations in real time of optimal control design methodology based upon actor-critic reinforcement learning paradigms. The convergence behavior and numerical stability of the proposed online algorithm, called RLSµ-QR-HDP-DLQR, are evaluated by computational simulations in three Multiple-Input and Multiple-Output (MIMO) models, that represent the automatic pilot of an F-16 aircraft of third order, a fourth order RLC circuit with two input voltages and two controllable voltage levels, and a doubly-fed induction generator with six inputs and six outputs for wind energy conversion systems. / Neste trabalho, apresenta-se o desenvolvimento e a análise da estabilidade numérica de um novo algoritmo crítico adaptativo para aproximar a função valor de estado para o projeto do sistema de controle ótimo online, utilizando o regulador linear quadrático discreto (DLQR), com base em programação dinâmica heurística (HDP). O algoritmo proposto faz uso de transformações unitárias e métodos de decomposição QR para melhorar a e-ciência da aprendizagem online na rede crítica por meio da abordagem dos mínimos quadrados recursivos (RLS). A estratégia de aprendizagem desenvolvida fornece melhorias no desempenho computacional em termos de estabilidade numérica e custo computacional, que visam tornar possíveis as implementações em tempo real da metodologia do projeto de controle ótimo com base em paradigmas de aprendizado por reforço ator-crítico. O comportamento de convergência e estabilidade numérica do algoritmo online proposto, denominado RLSµ-QR-HDP-DLQR, são avaliados por meio de simulações computacionais em três modelos Múltiplas-Entradas e Múltiplas-Saídas (MIMO), que representam o piloto automático de uma aeronave F-16 de terceira ordem, um circuito de quarta ordem RLC com duas tensões de entrada e dois níveis de tensão controláveis, e um gerador de indução duplamente alimentados com seis entradas e seis saídas para sistemas de conversão de energia eólica. Programação Dinâmica Aprendizagem por Reforço Programa ção Dinâmica Heurística Controle Multivariável Controle Ótimo Regulador Linear Quadrático Discreto Mínimos Quadrados Recursivos Decomposição QR Dynamic Programming Reinforcement Learning Heuristic Dynamic Programming Multivariable Control Optimal Control Discrete Linear Quadratic Regulator Recursive Least-Squares Engenharia de Software
100	Aprendizagem por Reforço e Programação Dinâmica Aproximada para Controle Ótimo: Uma Abordagem para o Projeto Online do Regulador Linear Quadrático Discreto com Programação Dinâmica Heurística Dependente de Estado e Ação. / Reinforcement and Programming Learning Approximate Dynamics for Optimal Control: An Approach to the Linear Regulator Online Project Discrete Quadratic with Heuristic Dynamic Programming Dependent on State and Action. RÊGO, Patrícia Helena Moraes 24 July 2014 (has links) Submitted by Maria Aparecida (cidazen@gmail.com) on 2017-08-30T15:33:12Z No. of bitstreams: 1 Patricia Helena.pdf: 11110405 bytes, checksum: ca1f067231658f897d84b86181dbf1b9 (MD5) / Made available in DSpace on 2017-08-30T15:33:12Z (GMT). No. of bitstreams: 1 Patricia Helena.pdf: 11110405 bytes, checksum: ca1f067231658f897d84b86181dbf1b9 (MD5) Previous issue date: 2014-07-24 / In this thesis a proposal of an uni ed approach of dynamic programming, reinforcement learning and function approximation theories aiming at the development of methods and algorithms for design of optimal control systems is presented. This approach is presented in the approximate dynamic programming context that allows approximating the optimal feedback solution as to reduce the computational complexity associated to the conventional dynamic programming methods for optimal control of multivariable systems. Speci cally, in the state and action dependent heuristic dynamic programming framework, this proposal is oriented for the development of online approximated solutions, numerically stable, of the Riccati-type Hamilton-Jacobi-Bellman equation associated to the discrete linear quadratic regulator problem which is based on a formulation that combines value function estimates by means of a RLS (Recursive Least-Squares) structure, temporal di erences and policy improvements. The development of the proposed methodologies, in this work, is focused mainly on the UDU T factorization that is inserted in this framework to improve the RLS estimation process of optimal decision policies of the discrete linear quadratic regulator, by circumventing convergence and numerical stability problems related to the covariance matrix ill-conditioning of the RLS approach. / Apresenta-se nesta tese uma proposta de uma abordagem uni cada de teorias de programação dinâmica, aprendizagem por reforço e aproximação de função que tem por objetivo o desenvolvimento de métodos e algoritmos para projeto online de sistemas de controle ótimo. Esta abordagem é apresentada no contexto de programação dinâmica aproximada que permite aproximar a solução de realimentação ótima de modo a reduzir a complexidade computacional associada com métodos convencionais de programação dinâmica para controle ótimo de sistemas multivariáveis. Especi camente, no quadro de programação dinâmica heurística e programação dinâmica heurística dependente de ação, esta proposta é orientada para o desenvolvimento de soluções aproximadas online, numericamente estáveis, da equação de Hamilton-Jacobi-Bellman do tipo Riccati associada ao problema do regulador linear quadrático discreto que tem por base uma formulação que combina estimativas da função valor por meio de uma estrutura RLS (do inglês Recursive Least-Squares), diferenças temporais e melhorias de política. O desenvolvimento das metodologias propostas, neste trabalho, tem seu foco principal voltado para a fatoração UDU T que é inserida neste quadro para melhorar o processo de estimação RLS de políticas de decisão ótimas do regulador linear quadrá- tico discreto, contornando-se problemas de convergência e estabilidade numérica relacionados com o mal condicionamento da matriz de covariância da abordagem RLS.

Search results