• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 6
  • 5
  • Tagged with
  • 11
  • 11
  • 7
  • 7
  • 6
  • 5
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Dynamical optimisation of renewable energy flux in buildings / Optimisation dynamique des flux d'énergie renouvelables dans les bâtiments

Hazyuk, Ion 08 December 2011 (has links)
Dans cette thèse nous proposons des algorithmes de contrôle commande optimaux ayant pour but d’aider au bon choix des systèmes multi sources et leur utilisation optimale dans les bâtiments. L'estimation des charges de chauffage est transformée en un problème de contrôle où le régulateur calcule la charge de chauffage optimale du bâtiment. Le régulateur proposé pour ce but est de type Model Predictive Programming (MPP), qui est obtenu en modifiant l’algorithme de type Model Predictive Control (MPC). Comme le MPP requiert un modèle du bâtiment d'ordre réduit, nous proposons une méthode de modélisation par projection des paramètres sur une structure fixe obtenue à partir des connaissances physiques. Pour le contrôle du système multi sources, nous proposons un système de gestion technique du bâtiment (GTB) qui est divisé en deux : un régulateur de la température du bâtiment et un contrôleur des sources. Pour la régulation thermique on utilise l’algorithme MPC, pour lequel nous proposons une nouvelle fonction de coût, car la fonction classique ne minimise pas la consommation d'énergie. La fonction de coût proposée permet de maintenir le confort thermique avec une consommation d'énergie minimale. Nous la formulons de telle façon qu’elle puisse être optimisée en utilisant la Programmation Linéaire (PL). Pour pouvoir utiliser la PL, nous proposons une linéarisation du modèle, basée sur des connaissances physiques, qui permet d'utiliser le modèle sur toute la plage de fonctionnement. Pour le contrôle des sources, nous proposons une solution qui prend en compte la commande MPC afin d'utiliser les ressources d'énergie plus efficacement. La GTB proposée est évaluée en émulation sur la maison Mozart et comparée avec deux GTB basées sur des régulateurs PID. Les résultats obtenus montrent que la GTB proposée a toujours maintenu le confort thermique dans le bâtiment, a réduit la consommation d'énergie et l'usure des pompes hydrauliques et de la pompe à chaleur. / This thesis proposes methods and solutions to improve the choice and the optimal use of renewable energies in buildings. The heating load assessment is transformed into a control problem where the regulator calculates the optimal heating load of the building. The proposed regulator for this aim is Model Predictive Programming (MPP), which is obtained by modifying Model Predictive Control (MPC). The required information by MPP is a low order building model and data records of the local weather. Therefore, we propose a modelling method in which the detailed model of the building is projected on a reduced order model having its structure obtained from physical knowledge. For the control of the multi source system, we proposed a Building Energy Management System (BEMS) which is divided in two parts: the first for the building temperature control and the second for the source control. For building thermal control we utilize MPC, for which we propose a new cost function because the classical one does not minimize the energy consumption. The proposed cost function permits to maintain the thermal comfort with minimal energy consumption. We formulate this function such that it can be optimized by using Linear Programming (LP) algorithm. To be able to use LP we give a solution to linearization of the building model based on the physical knowledge, which permits to use the model on the entire operating range. For the source control, we propose a solution which takes into account the command given by MPC in order to use the energy resources more effectively. The proposed control system is evaluated and compared with two PID based BEMS, against comfort and energetic criteria. The evaluation is performed in emulation on a reference detached house. The obtained results show that the proposed control system always maintains the thermal comfort in the building, reduces the energy consumption and the wear and tear of the hydraulic and heat pumps from the heating system.
2

Contrôle adaptatif et autoréglage : applications de l'approximation stochastique

Baltcheva, Irina January 2004 (has links)
Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal.
3

Contribution à l’optimisation de la performance énergétique des bâtiments de grande dimension : une approche intégrée diagnostic / commande économique et coopérative à horizon glissant / Contribution to Energy Optimization for Large-scale Buildings : An Integrated approach of diagnosis and economic control with moving horizon

Darure, Tejaswinee 18 October 2017 (has links)
Au cours des deux dernières décennies, la prise de conscience du changement climatique et des conséquences du réchauffement climatique a incité diverses institutions à prendre de nouvelles directives. Ces directives portent principalement sur le contrôle des émissions des gaz à effet de serre, sur l'utilisation des ressources énergétiques non conventionnelles et l'optimisation de la consommation d'énergie dans les systèmes existants. L'Union européenne a proposé de nombreux projets dans le cadre du 7e PCRD pour réaliser jusqu'à 20% d’économies d'énergie d’ici 2020. En particulier, selon la directive sur l'efficacité énergétique, les bâtiments sont majoritairement responsables de 40% des dépenses énergétiques en Europe et de 36% des émissions de CO2 ; c’est la raison pour laquelle un ensemble d’initiatives européennes dans le cadre du 7ième PCRD favorise l'utilisation de technologie intelligente dans les bâtiments et rationalise les règles existantes. Energy IN TIME est l'un des projets axés sur l'élaboration d'une méthode de contrôle basée sur la simulation intelligente de l'énergie qui permettra de réduire la consommation des bâtiments non résidentiels. Ce mémoire de thèse propose plusieurs solutions novatrices pour réaliser les objectifs du projet mandaté à l'Université de Lorraine. Les solutions développées dans le cadre de ce projet devraient être validées sur différents sites européens de démonstration. Une première partie présente l'analyse détaillée de ces sites de démonstration et leurs contraintes respectives. Un cadre général correspondant à la construction type de ces sites a été élaboré pour simuler leur comportement. Ce cadre de construction de référence sert de banc d'essai pour la validation des solutions proposées dans ce travail de thèse. Sur la base de la conception de la structure de construction de référence, nous présentons une formulation de contrôle économique utilisant un modèle de contrôle prédictif minimisant la consommation d'énergie. Ce contrôle optimal possède des propriétés de contrôle conscientes de la maintenance. En outre, comme les bâtiments sont des systèmes complexes, les occurrences de pannes peuvent entraîner une détérioration de l'efficacité énergétique ainsi que du confort thermique pour les occupants à l'intérieur des bâtiments. Pour résoudre ce problème, nous avons élaboré une stratégie de diagnostic des dysfonctionnements et une stratégie de contrôle adaptatif des défauts basé sur le modèle économique ; les résultats en simulation ont été obtenus sur le bâtiment de référence. En outre, l'application des solutions proposées peut permettre de relever des défis ambitieux en particulier dans le cas de bâtiments à grande échelle. Dans la partie finale de cette thèse, nous nous concentrons sur le contrôle économique des bâtiments à grande échelle en formulant une approche novatrice du contrôle prédictif de mode réparti. Cette formule de contrôle distribué présente de nombreux avantages tels que l'atténuation de la propagation des défauts, la flexibilité dans la maintenance du bâtiment et les stratégies simplifiées de contrôle du plug-and-play. Enfin, une attention particulière est accordée au problème d'estimation des mesures dont le nombre est limité sur des bâtiments à grande échelle. Les techniques d'estimation avancées proposées sont basées sur les méthodologies de l'horizon mobile. Leur efficacité est démontrée sur les systèmes de construction de référence / Since the last two decades, there has been a growing awareness about the climate change and global warming that has instigated several Directorate initiatives from various administrations. These initiatives mainly deal with controlling greenhouse gas emissions, use of non-conventional energy resources and optimization of energy consumption in the existing systems. The European Union has proposed numerous projects under FP7 framework to achieve the energy savings up to 20% by the year 2020. Especially, stated by the Energy Efficiency Directive, buildings are majorly responsible for 40% of energy resources in Europe and 36% of CO2 emission. Hence a class of projects in the FP7 framework promotes the use of smart technology in the buildings and the streamline existing rules. Energy IN TIME is one of the projects focused on developing a Smart Energy Simulation Based Control method which will reduce the energy consumption in the operational stage of existing non-residential buildings. Essentially, this thesis proposes several novel solutions to fulfill the project objectives assigned to the University of Lorraine. The developed solutions under this project should be validated on the demonstration sites from various European locations. We design a general benchmark building framework to emulate the behavior of demonstration sites. This benchmark building framework serves as a test bench for the validation of proposed solutions given in this thesis work. Based on the design of benchmark building layout, we present an economic control formulation using model predictive control minimizing the energy consumption. This optimal control has maintenance-aware control properties. Furthermore, as in buildings, fault occurrences may result in deteriorating the energy efficiency as well as the thermal comfort for the occupants inside the buildings. To address this issue, we design a fault diagnosis and fault adaptive control techniques based on the model predictive control and demonstrate the simulation results on the benchmark building. Moreover, the application of these proposed solutions may face great challenges in case of large-scale buildings. Therefore, in the final part of this thesis, we concentrate on the economic control of large-scale buildings by formulating a novel approach of distributed model predictive control. This distributed control formulation holds numerous advantages such as fault propagation mitigation, flexibility in the building maintenance and simplified plug-and-play control strategies, etc... Finally, a particular attention is paid to the estimation problem under limited measurements in large-scale buildings. The suggested advanced estimation techniques are based on the moving horizon methodologies and are demonstrated on the benchmark building systems
4

Contrôle des systèmes rapides non linéaires - Application au moteur à allumage commandé turbocompressé à distribution variable

Colin, Guillaume 12 October 2006 (has links) (PDF)
Le contrôle des moteurs à allumage commandé est devenu capital pour satisfaire la législation sur les émissions polluantes tout en garantissant un bon agrément de conduite et une consommation réduite. <br /><br />Le downsizing, c'est-à-dire la réduction de la cylindrée du moteur, est une des voies prometteuses pour réduire la consommation de carburant et les émissions de CO2 qui en découlent. Combinant plusieurs technologies existantes telles que la turbocompression et la distribution variable, le downsizing est un exemple typique des problèmes rencontrés dans le contrôle des motorisations : systèmes non linéaires avec saturations d'actionneurs ; nombreuses grandeurs physiques importantes non mesurables ; temps de calcul limité ; objectifs du contrôle (consommation, pollution, performance) souvent concurrents.<br /><br />Une démarche de modélisation et de contrôle à base de modèle (par modèle interne et prédictif) pour ces systèmes est alors proposée et appliquée au contrôle de la chaîne d'air du moteur à essence à cylindrée réduite. Des estimateurs, physiques et génériques, sont construits pour la masse d'air dans le cylindre, la masse de gaz brûlés résiduels et la masse d'air balayé de l'admission vers l'échappement. L'architecture complète et générique du contrôle en couple pour le moteur à allumage commandé turbocompressé à déphaseurs d'arbre à cames a été testée en simulation puis expérimentalement (sur moteur et véhicule).<br />Ces essais ont alors montré que de nouvelles possibilités étaient offertes pour diminuer les émissions polluantes et optimiser le rendement du moteur.
5

Gestion optimale de l'énergie dans un procédé multi-source pour le chauffage de bâtiments

Eynard, Julien 01 October 2010 (has links) (PDF)
L'exploitation excessive des ressources énergétiques fossiles pose aujourd'hui des problèmes liés au changement climatique, à leur épuisement et en conséquence à l'augmentation de leur prix. Ces problèmes nécessitent des solutions innovantes, telles que le recours aux énergies renouvelables, afin d'en restreindre l'impact. Les travaux présentés dans ce manuscrit s'attachent à répondre à cette problématique par l'intermédiaire d'une méthodologie d'optimisation énergétique, appliquée au secteur du bâtiment et notamment au poste de chauffage, l'un des plus gros consommateurs d'énergie en France. Cette méthodologie est basée sur la modélisation du procédé de chauffage considéré et d'un moyen de stockage énergétique, ainsi que sur le développement d'outils de contrôle prédictif exploitant la connaissance de perturbations futures. Cette approche a été utilisée pour l'optimisation énergétique d'une chaufferie collective, gérée par la société Cofely GDF-SUEZ et qui alimente en eau chaude, via un réseau de chaleur, un quartier de La Rochelle. Un modèle modulaire de l'installation actuelle, dont le fonctionnement s'appuie sur un mix énergétique renouvelable et non renouvelable, a été développé à partir de mesures réalisées sur le site et de techniques de modélisation de types boite noire, boite grise ou boite blanche, en fonction de la connaissance disponible. La chaufferie ne disposant pas d'un système de stockage, nous avons proposé une modification hydraulique afin d'en intégrer un. Le modèle de ce système a complété le modèle de la chaufferie. Pour la gestion du stockage, deux contrôleurs différents, dont l'un basé sur la commande prédictive optimale et exploitant des prédictions pour anticiper le comportement de la chaufferie, ont été proposés. Ces prédictions sont fournies par un module intégrant une analyse multi-résolution par décomposition en ondelettes et utilisant les réseaux de neurones artificiels. Les résultats obtenus avec le contrôleur prédictif montrent que l'utilisation optimale d'un système de stockage permet d'améliorer de façon très significative le fonctionnement de la chaufferie. La consommation énergétique fossile, le coût de fonctionnement de l'installation, les émissions de CO2 et le taux de couverture de l'énergie fossile sont fortement réduits, tout en améliorant le respect des contraintes techniques de fonctionnement.
6

Un gestionnaire énergétique du bâtiment compatible smartgrid basée sur une commande prédéctive

Lefort, Antoine 02 April 2014 (has links) (PDF)
L'intégration des énergies renouvelables produites par un bâtiment et les réseaux de fourniture, qui sont amenés à proposer des tarifications et des puissances disponibles variables au cours de la journée, entraînent une grande variabilité de la disponibilité de l'énergie. Mais les besoins des utilisateurs ne sont pas forcément en accord avec cette disponibilité. La gestion de l'énergie consiste alors à faire en sorte que les moments de consommation des installations coïncident avec les moments où celle-ci est disponible. Notre objectif a été de proposer une stratégie de commande prédictive, distribuée et hiérarchisée, pour gérer efficacement l'énergie de l'habitat. Les aspects prédictifs de notre approche permettent d'anticiper les besoins et les variations de la tarification énergétique. L'aspect distribué va permettre d'assurer la modularité de la structure de commande, pour pouvoir intégrer différents usages et différentes technologies de manière simple et sans faire exploser la combinatoire du problème d'optimisation résultant.
7

Gestion de l'énergie dans un réseau de capteurs au niveau application / Energy management of a wireless sensor network at application level

Mokrenko, Olesia 20 November 2015 (has links)
L'énergie est une ressource clé dans les réseaux de capteurs sans fil (WSNs), en particulier lorsque les nœuds capteurs sont alimentés par des batteries. Cette thèse s'inscrit dans le contexte de la réduction de la consommation de l'énergie d'un réseau de capteurs au niveau application construite au-dessus de ce réseau, grâce à des stratégies de contrôle, en temps réel et de façon dynamique. La première stratégie de gestion de l'énergie considérée s'appuie sur le contrôle prédictif (MPC). Le choix de MPC est motivé par les objectifs globaux qui sont de réduire la consommation d'énergie de l'ensemble des nœuds capteurs tout en assurant un service donné, nommé mission, pour le réseau de capteurs. En outre, un ensemble de contraintes sur les variables de contrôle binaires et sur les nœuds capteur doit être rempli. La deuxième stratégie de gestion de l'énergie au niveau de l'application utilise une approche de contrôle hybride (HDS). Ce choix est motivé par la nature inhérente du système WSN qui est par essence hybride, en particulier lorsque l'on s'intéresse à la gestion de l'énergie. La nature hybride vient essentiellement de la combinaison de processus physiques continus tels la charge et décharge des batteries des nœuds; tandis que la partie discrète est liée à la modification des modes de fonctionnement et l'état Inaccessible des nœuds. Les stratégies proposées sont évaluées et comparées en simulation sur des différents scenarios réalistes. Elles ont aussi \'et\'e mises en œuvre sur un banc d'essai réel et les résultats obtenus ont été discutés. / Energy is a key resource in Wireless Sensor Networks (WSNs), especially when sensor nodes are powered by batteries. This thesis is investigates how to save energy of the whole WSN, at the application level, thanks to control strategies, in real time and in a dynamic way. The first energy management strategy investigated is based on Model Predictive Control (MPC). The choice of MPC is motivated by the global objectives that are to reduce the energy consumption of the set of sensor nodes while ensuring a given service, named mission, for the sensor network. Moreover, a set of constraints on the binary control variables and on the sensor modes must be fulfilled. The second energy management strategy at the application level is based on a Hybrid Dynamical System (HDS) approach. This choice is motivated by the hybrid inherent nature of the WSN system when energy management is considered. The hybrid nature basically comes from the combination of continuous physical processes, namely, the charge / discharge of the node batteries; while the discrete part is related to the change in the functioning modes and the Unreachable condition of the nodes. The proposed strategies are evaluated and compared in simulation on a realistic test-case. Lastly, they have been implemented on a real test-bench and the results obtained have been discussed.
8

Gestion de l'énergie d'une micro-centrale solaire thermodynamique / Energy management of a solar thermodynamic micro power plant

Rahmani, Mustapha Amine 04 December 2014 (has links)
Cette thèse s'inscrit dans le cadre du projet collaboratif MICROSOL, mené par Schneider Electric, et qui oeuvre pour le développement de micros centrales solaires thermodynamiques destinées à la production d'électricité en sites isolés (non connectés au réseau électrique) en exploitant l'énergie thermique du soleil. Le but de cette thèse étant le développement de lois de commande innovantes et efficaces pour la gestion de l'énergie de deux types de micros centrales solaires thermodynamiques : à base de moteur à cycle de Stirling et à base de machines à Cycle de Rankine Organique (ORC). Dans une première partie, nous considérons une centrale solaire thermodynamique à base de machine à cycle de Stirling hybridée à un supercondensateur comme moyen de stockage d'énergie tampon. Dans ce cadre, nous proposons une première loi de commande validée expérimentalement, associée au système de conversion d'énergie du moteur Stirling, qui dote le système de performances quasi optimales en termes de temps de réponse ce qui permet de réduire la taille du supercondensateur utilisé. Une deuxième loi de commande qui gère explicitement les contraintes du système tout en dotant ce dernier de performances optimales en terme de temps de réponse, est également proposée. Cette dernière loi de commande est en réalité plus qu'un simple contrôleur, elle constitue une méthodologie de contrôle applicable pour une famille de systèmes de conversion de l'énergie.Dans une deuxième partie, nous considérons une centrale solaire thermodynamique à base de machine à cycle de Rankine Organique (ORC) hybridée à un banc de batteries comme moyen de stockage d'énergie tampon. Etant donné que ce système fonctionne à vitesse de rotation fixe pour la génératrice asynchrone qui est connectée à un système de conversion d'énergie commercial, nous proposons une loi de commande prédictive qui agit sur la partie thermodynamique de ce système afin de le faire passer d'un point de fonctionnement à un autre, lors des appels de puissance des charges électriques, le plus rapidement possible (pour réduire le dimensionnement des batteries) tout en respectant les contraintes physiques du système. La loi de commande prédictive développée se base sur un modèle dynamique de la machine ORC identifié expérimentalement grâce à un algorithme d'identification nonlinéaire adéquat. / This Ph.D thesis was prepared in the scope of the MICROSOL project, ledby Schneider Electric, that aims at developing Off-grid solar thermodynamic micro powerplants exploiting the solar thermal energy. The aim of this thesis being the development of innovative and efficient control strategies for the energy management of two kinds of solar thermodynamic micro power plants: based on Stirling engine and based and Organic RankineCycle (ORC) machines.In a first part, we consider the Stirling based solar thermodynamic micro power planthybridized with a supercapacitor as an energy buffer. Within this framework, we propose afirst experimentally validated control strategy, associated to the energy conversion system ofthe Stirling engine, that endows the system with quasi optimal performances in term of settlingtime enabling the size reduction of the supercapacitor. A second control strategy that handlesexplicitly the system constraints while providing the system with optimal performances interm of settling time , is also proposed. This control strategy is in fact more than a simplecontroller, it is a control framework that holds for a family of energy conversion systems.In a second part, we consider the Organic Rankine Cycle (ORC) based thermodynamicmicro power plant hybridized with a battery bank as an energy buffer. Since this system worksat constant speed for the asynchronous generator electrically connected to a commercial energyconversion system, we propose a model predictive controller that acts on the thermodynamicpart of this system to move from an operating point to another, during the load power demandtransients, as fast as possible (to reduce the size of the battery banks) while respecting thephysical system constraints. The developed predictive controller is based upon a dynamicmodel, for the ORC power plant, identified experimentally thanks to an adequate nonlinearidentification algorithm.
9

Contribution au développement d'une mini-pelle tout-électrique : Approche prédictive pour la commande efficace et compliante des actionneurs électromécaniques / Contribution to the development of a full-electric mini-excavator : A predictive Approch to an efficient and compliant control of an electro-mechanical actuator

Gendrin, Martin 30 May 2016 (has links)
Les actionneurs électromécaniques supplantent les solutions d’actionnement hydrauliques concurrentes dans un nombre croissant d’applications industrielles, particulièrement en aéronautique. Ils le doivent à leurs rendements élevés et à une relative simplicité de commande. Fort de ces avantages, cette technologie a été mise en place dans le cadre du projet ELEXC, en vue de remplacer les vérins hydrauliques sur une mini-excavatrice tout-électrique et s’attaquant pour la première fois au secteur du bâtiment et des travaux publics. Cependant, cette intégration s’accompagne de doutes sur la performance et la durabilité de ces actionneurs dans ce cas précis d’utilisation. Pour répondre à ces interrogations, ce manuscrit se focalisera dans un premier volet sur la caractérisation des performances d’une structure spécifique, permise par la mise en place d’un banc de test multi-énergies instrumenté. Cette étude aboutira à la mise en place d’un modèle par lois physiques dont les paramètres auront été identifiés expérimentalement.Deux solutions innovantes vont ensuite être proposées, visant respectivement à réduire les répercussions, notamment énergétiques, de la caractéristique discrète du convertisseur à découpage, et à parer au manque de compliance de l’actionneur tout en conservant ses capacités de creusage. Elles seront toutes deux associées au concept de commande prédictive, mais offriront chacune une spécificité par rapport à l’implémentation standard de ce type de commande tout en conservant ses avantages. La première prendra la forme d’un modulateur fondé sur le principe d’une modulation de largeur d’impulsion vectorielle, dont la séquence sera sélectionnée par un contrôleur prédictif en rapport avec une fonction de coût alliant les ondulations de courant, les pertes par commutation et la tension de mode commun spécifiques aux séquences. La seconde consistera en un contrôleur d’impédance à boucle de position interne, dont les paramètres d’impédance seront variables et définis par un contrôleur prédictif afin de permettre une bonne pénétration dans l’environnement tout en limitant la dynamique et la valeur maximale de l’effort de compression sur la transmission. / Nowadays, the electro-mechanical actuators (EMA) are seen as an alternative to the conventional hydraulic cylinders in a growing number of industrial applications, including the aeronautic sector, thanks to their high efficiency and relatively simple commandability. According to this features, this actuator technology was selected to replace the hydraulic cylinders of the actuation system of a full-electric compact excavator in the ELEXC project. However, some concerns arose from the lack of existing examples with EMA functioning in relatively severe working conditions implying collisions of the actuators with stiff environments. Therefore, this manuscript will first focus on the characterization of the electro-mechanical actuator and of its performances in this specific case of application, enabled by the development of a multi-energy test-rig. Beside the validation of the EMA capacities, a physic law model will be developed, and its parameters tuned according to the experimental results. In a second part of this manuscript, two novel control laws will be proposed, aiming respectively to reduce the negative repercussions of the discrete characteristic of the electrical converter, and to counterpart the lack of natural compliance of the mechanical actuator. They will be both based on the concept of predictive control, but will differ from the conventional implementation of this type of controller. The first proposed topology is a modulator based on a vector Pulse Width Modulation, in which the PWM sequence to be used is defined online by a predictive controller according to a cost function that takes into account the current ripples, the switching losses and the common mode voltages specific to the sequences. Next, a position-based impedance controller, whose impedance parameters are defined online by a predictive controller, is introduced, in order to enable the EMA to penetrate a stiff environment with a relatively low dynamic increase of compression force on the mechanical transmission.
10

Learning neural ordinary differential equations for optimal control

Howe, Nikolaus Harry Reginald 08 1900 (has links)
Ce mémoire rassemble des éléments d'optimisation, d'apprentissage profond et de contrôle optimal afin de répondre aux problématiques d'apprentissage et de planification dans le contexte des systèmes dynamiques en temps continu. Deux approches générales sont explorées. D'abord, une approche basée sur la méthode du maximum de vraisemblance est présentée. Ici, les trajectoires ``d'entrainement'' sont échantillonnées depuis la dynamique réelle, et à partir de celles-ci un modèle de prédiction des états observés est appris. Une fois que l'apprentissage est terminé, le modèle est utilisé pour la planification, en utilisant la dynamique de l'environnement et une fonction de coût pour construire un programme non linéaire, qui est par la suite résolu pour trouver une séquence de contrôle optimal. Ensuite, une approche de bout en bout est proposée, dans laquelle la tâche d'apprentissage de modèle dynamique et celle de planification se déroulent simultanément. Ceci est illustré dans le cadre d'un problème d'apprentissage par imitation, où le modèle est mis à jour en rétropropageant le signal de perte à travers l'algorithme de planification. Grâce au fait que l'entrainement est effectué de bout en bout, cette technique pourrait constituer un sous-module de réseau de neurones de plus grande taille, et pourrait être utilisée pour fournir un biais inductif en faveur des comportements optimaux dans le contexte de systèmes dynamiques en temps continu. Ces méthodes sont toutes les deux conçues pour fonctionner avec des modèles d'équations différentielles ordinaires paramétriques et neuronaux. Également, inspiré par des applications réelles pertinentes, un large recueil de systèmes dynamiques et d'optimiseurs de trajectoire, nommé Myriad, est implémenté; les algorithmes sont testés et comparés sur une variété de domaines de la suite Myriad. / This thesis brings together elements of optimization, deep learning and optimal control to study the challenge of learning and planning in continuous-time dynamical systems. Two general approaches are explored. First, a maximum likelihood approach is presented, in which training trajectories are sampled from the true dynamics, and a model is learned to accurately predict the state observations. After training is completed, the learned model is then used for planning, by using the dynamics and cost function to construct a nonlinear program, which can be solved to find a sequence of optimal controls. Second, a fully end-to-end approach is proposed, in which the tasks of model learning and planning are performed simultaneously. This is demonstrated in an imitation learning setting, in which the model is updated by backpropagating the loss signal through the planning algorithm itself. Importantly, because it can be trained in an end-to-end fashion, this technique can be included as a sub-module of a larger neural network, and used to provide an inductive bias towards behaving optimally in a continuous-time dynamical system. Both the maximum likelihood and end-to-end methods are designed to work with parametric and neural ordinary differential equation models. Inspired by relevant real-world applications, a large repository of dynamical systems and trajectory optimizers, named Myriad, is also implemented. The algorithms are tested and compared on a variety of domains within the Myriad suite.

Page generated in 0.4376 seconds