Spelling suggestions: "subject:"commande linéaire"" "subject:"commande inéaire""
1 |
Caractérisation d'un miroir déformable à ferrofluide à réponse linéaireNaderiyanha, Azadeh 18 April 2018 (has links)
Le concept de miroir déformable à base de liquide magnétique (ferrofluide) a énormément contribué à la technologie des miroirs déformables. Les miroirs déformables à ferrofluide (MDFs) permettent des déformations qui peuvent varier de quelques nanometres jusqu'à quelques millimètres, ce qui est largement supérieur à ce que les miroirs déformables commerciaux peuvent produire. Toutefois, un inconvénient majeur de ces MDFs est leur réponse non linéaire. Une nouvelle technique qui permet de surmonter ce problème est de superposer un champ magnétique constant et uniforme au champ magnétique produit par les action-neurs. Nous avons fabriqué un MDF à 91 actionneurs qui utilise cette nouvelle technique de linéarisation. Les performances obtenues sont comparables à celles des miroirs déformables disponibles commercialement. Les premiers 36 polynômes de Zernikes ont été produits en utilisant ce miroir et, basés sur nos mesures, nous prévoyons des amplitude maximales sur le front d'onde qui peuvent atteindre plus de 70 [mu]m. La combinaison linéaire de polynômes de Zernike, la reproductibilité au fil du temps, ainsi que l'application de ce MDF à compenser les aberrations de l'oeil humain est présentée.
|
2 |
Lévitation d'un palier magnétique hybride homopolaireLemay, Justin January 2014 (has links)
L’utilisation de paliers magnétiques est de plus en plus fréquente étant donné les avantages que cette technologie apporte. En effet, ces derniers permettent de léviter un objet rotatif grâce à un champ magnétique. Un roulement à billes peut être substitué par un palier magnétique. Cette substitution permet de réduire les entretiens, diminuer les pertes par friction et augmenter la durée de vie du système. Des applications nécessitant d’hautes vitesses de rotation et des pertes réduites constituent des situations exemplaires de l’utilisation de cette technologie. Un palier magnétique est une technologie avec de nombreux avantages et certains inconvénients. Par exemple, un palier magnétique hybride est un système naturellement instable et la force d’attraction magnétique est une équation fortement non-linéaire en fonction du courant et de l’entrefer. Ces caractéristiques démontrent qu’une loi de commande est nécessaire afin de stabiliser le palier magnétique. De plus, la loi de commande doit être précise et rapide. Les principales applications d’un palier magnétique incluent une rotation de l’objet en lévitation. Ceci nécessite une erreur en régime permanent nulle et une commande ajustable rapidement afin d’assurer une stabilité en tout temps.
Ce mémoire traite de la validation expérimentale d’une loi de commande linéaire sur un palier magnétique sans rotation jumelant des aimants permanents et des électroaimants. Dans la littérature actuelle, la plupart des études portent sur les paliers magnétiques actifs, c’est-à-dire qui ne comportent que des électroaimants. L’ajout d’aimants permanents diminue la consommation énergétique du palier magnétique mais augmente la complexité de la loi de commande. Le présent mémoire démontre qu’il est possible de stabiliser un palier magnétique hybride homopolaire en utilisant une loi de commande linéaire tel le PID (proportionnel, intégral, dérivé). Cette étude apporte des nouvelles données à la littérature, en validant à l’aide d’un montage expérimental la loi de commande conçue et simulée à partir de MATLAB[indice supérieur MC].
|
3 |
Stratégies de commande pour la navigation autonome d'un drone projectile miniatureDrouot, Adrien 02 December 2013 (has links) (PDF)
De nos jours, l'utilisation des drones miniatures à voilure tournante pour des missions d'observation dans des environnements hostiles est en pleine expansion. Ces appareils, grâce à leurs capacités à combiner le vol de translation avec le vol stationnaire, sont en eff et bien adaptés aux besoins de ces missions. L'étude présentée dans cette thèse concerne un nouveau concept de drone appelé GLMAV (pour Gun Launched Micro Aerial Vehicle), qui consiste à rendre très rapidement opérationnel un véhicule hybride projectile - drone. La di fficulté dans le pilotage de ce type de véhicules est d'assurer de bonnes performances de suivi de trajectoires tout en garantissant une résistance aux perturbations aérodynamiques. Après une étape de modélisation, le cœur de la thèse présente plusieurs stratégies de commande, aussi bien linéaires que non linéaires, permettant la navigation autonome du drone. Plusieurs approches permettant l'estimation et la prise en compte dans la commande des eff orts parasites liés aux phénomènes aérodynamiques sont également détaillées. L'e fficacité de tous les algorithmes de commande est ensuite illustrée par de nombreuses simulations numériques. Du point de vue pratique, une simple loi de commande ne suffi t pas. En eff et, des techniques de filtrage particulières ou des aménagements spécifi ques doivent être utilisés pour reconstruire l'état du drone. Les performances de l'ensemble de la boucle de commande sont d'abord testées en simulation avant l'implantation sur le prototype du GLMAV développé par l'Institut franco-allemand de recherches de Saint-Louis.
|
4 |
Etude et modélisation de stratégies de régulation linéaires découplantes appliquées à un convertisseur multicellulaire parallèleGarreau, Clement 01 June 2018 (has links) (PDF)
Les structures de conversion multi-niveaux parallèles permettent de faire transiter de fortscourants tout en gardant une bonne puissance massique ; celles-ci sont réalisées en parallélisantdes cellules de commutation. Cette parallélisation permet de réduire le courant dans chaquecellule et ainsi de revenir dans des gammes plus standard de composants de puissance. Laparallélisation, en utilisant une commande adaptée, améliore les formes d’onde en sortie duconvertisseur. Ce manuscrit se focalisera sur une structure de conversion multiniveaux parallèlespécifique constituée de bras de hacheur dévolteur en parallèles couplés magnétiquement. Eneffet du fait de la commande entrelacée mise en place, l’ondulation du courant de sortie se voitréduite mais en contrepartie l’utilisation d’inductances séparées sur chaque bras entraine uneaugmentation de l’ondulation des courants de bras, directement liée au nombre de cellules decommutation, en fonction de l’ondulation du courant de sortie. Afin de palier à ce problème cesinductances sont remplacées par un (ou plusieurs) coupleur(s) magnétique(s) qui permet(tent) deréduire l’ondulation de courant dans chaque bras. Cependant dans le but de garantir la nonsaturation ainsi qu’une bonne intégration des coupleurs il est nécessaire de s’assurer del’équilibrage des courants de chaque bras malgré une différence entre les paramètres. Ainsi cemanuscrit s’est axé vers la détermination de différentes méthodes de modélisation découplant lesystème permettant le maintien de l’égale répartition des courants en utilisant des différences derapports cycliques. Ces méthodes de modélisation ont été généralisées afin de réaliser unalgorithme permettant de générer des lois de commande quel que soit le nombre de cellules enparallèle. Dans une dernière partie ces lois de commande ont été testées sur un prototype en lesimplémentant sur FPGA afin de procéder à une vérification expérimentale
|
5 |
Contribution à la commande décentralisée non-linéaire des réseaux électriquesRoosta, Ali-Réza 16 December 2003 (has links) (PDF)
Aujourd'hui, les grands réseaux électriques fonctionnent de plus en plus près de leur limite de stabilité. Les moyens de contrôle classique des réseaux permettent d'assurer leur stabilité dans des conditions de fonctionnement normales. Cependant, compte tenu de la variété des conditions et des schémas d'exploitation, de la sévérité des incidents, les équipements de commande actuellement installés surles réseaux peuvent s'avérer trop limités et insuffisants pour répondre efficacement aux diverses perturbations. L'objectif général de cette thèse est l'étude et la comparaison de méthodologies de synthèse de contrôleurs décentralisés non linéaires qui puissent améliorer la stabilité transitoire des réseaux électriques. La notion de contrôleur décentralisé signifie ici que les grandeurs nécessaires pour élaborer la commande sont disponibles localement, c'est-à-dire à proximité du turbo-générateur à contrôler.Dans une première étape, nous nous sommes fixés l'objectif de développer une méthodologie de commande non-linéaire qui puisse améliorer les amortissements des oscillations transitoires provenant des courts-circuits triphasés se présentant sur la ligne de transmission, dans le contexte d'un système SMIB (une seule machine connectée à un n\oe ud infini). Dans une deuxième étape, nous nous sommes donnés l'objectif de généraliser cette méthodologie de commande non linéaire à un réseau multi-machines interconnecté. Nous nous sommes aussi fixés comme objectif dans ce cadre de tester la démarche proposée pour contrôler l'amortissement des oscillations basse fréquence (0.1-10 (dollar) HZ (dollard) locales et inter-zones.
|
6 |
Stratégies de commande pour la navigation autonome d'un drone projectile miniature / Control Strategies for the Autonomous Navigation of a Gun Launched Micro Aerial VehicleDrouot, Adrien 02 December 2013 (has links)
De nos jours, l'utilisation des drones miniatures à voilure tournante pour des missions d'observation dans des environnements hostiles est en pleine expansion. Ces appareils, grâce à leurs capacités à combiner le vol de translation avec le vol stationnaire, sont en effet bien adaptés aux besoins de ces missions. L'étude présentée dans cette thèse concerne un nouveau concept de drone appelé GLMAV (pour Gun Launched Micro Aerial Vehicle), qui consiste à rendre très rapidement opérationnel un véhicule hybride projectile - drone. La difficulté dans le pilotage de ce type de véhicules est d'assurer de bonnes performances de suivi de trajectoires tout en garantissant une résistance aux perturbations aérodynamiques. Après une étape de modélisation, le coeur de la thèse présente plusieurs stratégies de commande, aussi bien linéaires que non linéaires, permettant la navigation autonome du drone. Plusieurs approches permettant l'estimation et la prise en compte dans la commande des efforts parasites liés aux phénomènes aérodynamiques sont également détaillées. L'efficacité de tous les algorithmes de commande est ensuite illustrée par de nombreuses simulations numériques. Du point de vue pratique, une simple loi de commande ne suffit pas. En effet, des techniques de filtrage particulières ou des aménagements spécifiques doivent être utilisés pour reconstruire l'état du drone. Les performances de l'ensemble de la boucle de commande sont d'abord testées en simulation avant l'implantation sur le prototype du GLMAV développé par l'Institut franco-allemand de recherches de Saint-Louis / Nowadays, the use of rotary-wing MAV for observation missions in hostile environments is constantly growing. These aircrafts, through their ability to perform both translation flights and hover, are indeed well appropriate for these missions. The study presented in this thesis deals with a new MAV concept called GLMAV (for Gun Launched Micro Aerial Vehicle), which consists in getting very quickly up and running a projectile - MAV hybrid vehicle. The difficulty in controlling such vehicles is to ensure good trajectory tracking performances while guaranteeing robustness towards aerodynamic disturbances. After a modelling stage, the heart of the thesis introduces various control strategies, both linear and nonlinear, for the autonomous navigation of the MAV. Several approaches allowing the estimation and the consideration into the control of the parasitic efforts caused by aerodynamic phenomena are also detailed. The effectiveness of the control algorithms is then shown through many numerical simulations. From a practical point of view, having a control law is not enough. Indeed, special filtering techniques or specific equipments have to be used to reconstruct the system state. The performances of the overall control loop are firstly tested in simulation before its implementation on the GLMAV prototype developed by the French-German research Institute of Saint-Louis
|
7 |
Etude et modélisation de stratégies de régulation linéaires découplantes appliquées à un convertisseur multicellulaire parallèle / Study and modelling of decoupling linear regulation strategies applied to a parallel multilevel converterGarreau, Clément 01 June 2018 (has links)
Les structures de conversion multi-niveaux parallèles permettent de faire transiter de fortscourants tout en gardant une bonne puissance massique ; celles-ci sont réalisées en parallélisantdes cellules de commutation. Cette parallélisation permet de réduire le courant dans chaquecellule et ainsi de revenir dans des gammes plus standard de composants de puissance. Laparallélisation, en utilisant une commande adaptée, améliore les formes d’onde en sortie duconvertisseur. Ce manuscrit se focalisera sur une structure de conversion multiniveaux parallèlespécifique constituée de bras de hacheur dévolteur en parallèles couplés magnétiquement. Eneffet du fait de la commande entrelacée mise en place, l’ondulation du courant de sortie se voitréduite mais en contrepartie l’utilisation d’inductances séparées sur chaque bras entraine uneaugmentation de l’ondulation des courants de bras, directement liée au nombre de cellules decommutation, en fonction de l’ondulation du courant de sortie. Afin de palier à ce problème cesinductances sont remplacées par un (ou plusieurs) coupleur(s) magnétique(s) qui permet(tent) deréduire l’ondulation de courant dans chaque bras. Cependant dans le but de garantir la nonsaturation ainsi qu’une bonne intégration des coupleurs il est nécessaire de s’assurer del’équilibrage des courants de chaque bras malgré une différence entre les paramètres. Ainsi cemanuscrit s’est axé vers la détermination de différentes méthodes de modélisation découplant lesystème permettant le maintien de l’égale répartition des courants en utilisant des différences derapports cycliques. Ces méthodes de modélisation ont été généralisées afin de réaliser unalgorithme permettant de générer des lois de commande quel que soit le nombre de cellules enparallèle. Dans une dernière partie ces lois de commande ont été testées sur un prototype en lesimplémentant sur FPGA afin de procéder à une vérification expérimentale / The parallel multilevel converters allow high current with a high power-weight ratio by associatingcommutation cells in parallel. This parallelization reduces the current in each cells and so onpermits to use standard range of components. With an adapted command the quality of the outputwaveforms is improved. This report will focus on a specific structure made off Buck converter withmagnetic coupling. Indeed thanks to the interleaved command, the output current ripple is reducedbut in return using separated inductances on each leg leads an increasing of the leg current ripple,directly linked to the number of leg and the ripple of the output current. In order to avoid thisproblem those inductances are replaced by one or more intercell transformers (ICT) that reducethe ripple of each leg current. However in a way to ensure unsaturated ICTs and good integrationit is necessary to balance the current of each leg despite parameter variation. Thus this report isfocused on modeling uncoupling methods for the system ensuring an equal distribution of thecurrents with duty cycles differences. Those modeling methods were generalized to achieve to analgorithm which generate control law whatever the number of leg. In the last part those controllaws are tested on a test bench by implementing them on a FPGA board to validate experimentallythe results
|
8 |
Modélisation et conduite optimale d'un cycle combiné hybride avec source solaire et stockage / Modeling and control of an hybrid combined cycle with solar power production and storageLeo, Jessica 10 November 2015 (has links)
Cette thèse s'intéresse à la coordination des sous-systèmes d'un nouveau genre de centrale de production d'énergie : un cycle combiné hybride (HCC - Hybrid Combined Cycle). Cette centrale HCC n'existe pas encore mais combine un cycle combiné gaz (CCG), un moyen de production solaire thermodynamique (miroirs cylindro-paraboliques) et un moyen de stockage thermique (stockage indirect de chaleur sensible utilisant deux réservoirs de sels fondus). Comment coordonner ces trois sous-systèmes de manière optimale lors des variations de demande de puissance ou des prix du gaz ?Dans un premier temps, chacun des trois sous-systèmes est étudié de manière indépendante afin d'obtenir, d'une part, un modèle physique permettant de caractériser le comportement dynamique du sous-système considéré et, d'autre part, un contrôle local qui agit en fonction des objectifs de fonctionnement prédéfinis. Un modèle du système complet interconnecté de l'HCC est ensuite obtenu en couplant les modèles des trois sous-systèmes. Enfin, une coordination des différents sous-systèmes est mise en place pour adapter le fonctionnement de chacun, en fonction des objectifs globaux de la centrale HCC complète, en optimisant les consignes de chaque sous-système. Dans ce travail, une coordination de type linéaire quadratique et une coordination de type optimale prédictive sont étudiées. Les résultats obtenus sont bien prometteurs : ils montrent, tout d'abord, que lors d'un appel de puissance, la commande coordonnée permet au système HCC de répondre plus rapidement, en utilisant plus efficacement la partie solaire. De plus, lorsque la demande subit beaucoup de variations, la partie solaire et la partie stockage absorbent toutes ces variations et la Turbine à Combustion (TAC) du CCG est beaucoup moins sollicitée. Lorsqu'il n'y a plus d'irradiation solaire, la partie stockage prend la relève pour continuer à produire de la vapeur solaire, jusqu'à ce que les stocks se vident. Finalement, le stockage permet d'ajuster la production de la TAC en fonction des prix du gaz. / This work concerns the subsystems coordination of a new type of power plant: a Hybrid Combined Cycle (HCC). This HCC plant is not yet build but consists of a Combined Cycle Power Plant (CCPP), a concentrated solar plant (parabolic trough) and a thermal storage system (a molten-salts two-tank indirect sensible thermal storage). How to coordinate these three subsystems optimally during variations in power demand or in gas price?First, each subsystem is studied independently in order to get on one hand a physical model that reproduces the dynamical behavior of the considered subsystem, and on the other hand, a local control that achieves an operation according to pre-specified objectives. Then, a model of the HCC system is obtained by coupling the models of the three defined subsystems.Eventually, a coordination of the subsystems is set up in order to adapt the behavior of each subsystem according to the global objectives for the full HCC system, by optimizing subsystem setpoints. In this study, a linear quadratic coordination and a model predictive coordination are designed. The obtained results are promising: they first show that during a power demand, the coordination allows the global system to quickly respond, using extensively the solar production. Besides, when the power demand undergoes many fluctuations, the solar and storage parts absorb these variations and the gas turbine of the CCPP is much less stressed. In addition, when there is no more solar radiation, the storage part continues producing solar steam, until storage tanks are empty. At last, the storage part allows to adjust the gas turbine production according to the gas prices.
|
9 |
Stratégies de guidage visuel bio-inspirées : application à la stabilisation visuelle d’un micro-drone et à la poursuite de cibles / Strategies for bio-inspired visual guidance : application to control an UAV and to track a targetManecy, Augustin 22 July 2015 (has links)
Les insectes sont capables de prouesses remarquables lorsqu’il s’agit d’éviter des obstacles,voler en environnement perturbé ou poursuivre une cible. Cela laisse penser que leurs capacités de traitement, aussi minimalistes soient-elles, sont parfaitement optimisées pour le vol. A cela s’ajoute des mécanismes raffinés, comme la stabilisation de la vision par rapport au corps, permettant d’améliorer encore plus leurs capacités de vol.Ces travaux de thèse présentent l’élaboration d’un micro drone de type quadrirotor, qui ressemble fortement à un insecte sur le plan perceptif (vibration rétinienne) et reprend des points structurels clés, tels que le découplage mécanique entre le corps et le système visuel. La conception du quadrirotor (de type open-source), son pilotage automatique et son système occulo-moteur sont minutieusement détaillés.Des traitements adaptés permettent, malgré un très faible nombre de pixels (24 pixels seulement), de poursuivre finement du regard une cible en mouvement. A partir de là, nous avons élaboré des stratégies basées sur le pilotage par le regard, pour stabiliser le robot en vol stationnaire, à l’aplomb d’une cible et asservir sa position ; et ce, en se passant d’une partie des capteurs habituellement utilisés en aéronautique tels que les magnétomètres et les accéléromètres. Le quadrirotor décolle, se déplace et atterrit de façon autonome en utilisant seulement ses gyromètres, son système visuel original mimant l’oeil d’un insecte et une mesure de son altitude. Toutes les expérimentations ont été validées dans une arène de vol, équipée de caméras VICON.Enfin, nous décrivons une nouvelle toolbox qui permet d’exécuter en temps réel des modèles Matlab/Simulink sur des calculateurs Linux embarqués de façon complètement automatisée (http://www.gipsalab.fr/projet/RT-MaG/). Cette solution permet d’écrire les modèles, de les simuler, d’élaborer des lois de contrôle pour enfin, piloter en temps réel, le robot sous l’environnement Simulink. Cela réduit considérablement le "time-to-flight" et offre une grande flexibilité (possibilité de superviser l’ensemble des données de vol, de modifier en temps réel les paramètres des contrôleurs, etc.). / Insects, like hoverflies are able of outstanding performances to avoid obstacles, reject disturbances and hover or track a target with great accuracy. These means that fast sensory motor reflexes are at work, even if they are minimalist, they are perfectly optimized for the flapping flight at insect scale. Additional refined mechanisms, like gaze stabilization relative to the body, allow to increase their flight capacity.In this PhD thesis, we present the design of a quadrotor, which is highly similar to an insect in terms of perception (visual system) and implements a bio-inspired gaze control system through the mechanical decoupling between the body and the visual system. The design of the quadrotor (open-source), itspilot and its decoupled eye are thoroughly detailed. New visual processing algorithms make it possible to faithfully track a moving target, in spite of a very limited number of pixels (only 24 pixels). Using this efficient gaze stabilization, we developed new strategies to stabilize the robot above a target and finely control its position relative to the target. These new strategies do not need classical aeronautic sensors like accelerometers and magnetometers. As a result, the quadrotor is able to take off, move and land automatically using only its embedded rate-gyros, its insect-like eye, and an altitude measurement. All these experiments were validated in a flying arena equipped with a VICON system. Finally, we describe a new toolbox, called RT-MaG toolbox, which generate automatically a real-time standalone application for Linux systems from a Matlab/Simulink model (http://www.gipsalab.fr/projet/RT-MaG/). These make it possible to simulate, design control laws and monitor the robot’s flight in real-time using only Matlab/Simulink. As a result, the "time-to-flight" is considerably reduced and the final application is highly reconfigurable (real-time monitoring, parameter tuning, etc.).
|
10 |
Steepest descent as Linear Quadratic RegulationDufort-Labbé, Simon 08 1900 (has links)
Concorder un modèle à certaines observations, voilà qui résume assez bien ce que l’apprentissage machine cherche à accomplir. Ce concept est maintenant omniprésent dans nos vies, entre autre grâce aux percées récentes en apprentissage profond. La stratégie d’optimisation prédominante pour ces deux domaines est la minimisation d’un objectif donné. Et pour cela, la méthode du gradient, méthode de premier-ordre qui modifie les paramètres du modèle à chaque itération, est l’approche dominante. À l’opposé, les méthodes dites de second ordre n’ont jamais réussi à s’imposer en apprentissage profond. Pourtant, elles offrent des avantages reconnus qui soulèvent encore un grand intérêt. D’où l’importance de la méthode du col, qui unifie les méthodes de premier et second ordre sous un même paradigme.
Dans ce mémoire, nous établissons un parralèle direct entre la méthode du col et le domaine du contrôle optimal ; domaine qui cherche à optimiser mathématiquement une séquence de décisions. Et certains des problèmes les mieux compris et étudiés en contrôle optimal sont les commandes linéaires quadratiques. Problèmes pour lesquels on connaît très bien la solution optimale. Plus spécifiquement, nous démontrerons l’équivalence entre une itération de la méthode du col et la résolution d’une Commande Linéaire Quadratique (CLQ).
Cet éclairage nouveau implique une approche unifiée quand vient le temps de déployer nombre d’algorithmes issus de la méthode du col, tel que la méthode du gradient et celle des gradients naturels, sans être limitée à ceux-ci. Approche que nous étendons ensuite aux problèmes à horizon infini, tel que les modèles à équilibre profond. Ce faisant, nous démontrons pour ces problèmes que calculer les gradients via la différentiation implicite revient à employer l’équation de Riccati pour solutionner la CLQ associée à la méthode du gradient. Finalement, notons que l’incorporation d’information sur la courbure du problème revient généralement à rencontrer une inversion matricielle dans la méthode du col. Nous montrons que l’équivalence avec les CLQ permet de contourner cette inversion en utilisant une approximation issue des séries de Neumann. Surprenamment, certaines observations empiriques suggèrent que cette approximation aide aussi à stabiliser le processus d’optimisation quand des méthodes de second-ordre sont impliquées ; en agissant comme un régularisateur adaptif implicite. / Machine learning entails training a model to fit some given observations, and recent advances in the field, particularly in deep learning, have made it omnipresent in our lives. Fitting a model usually requires the minimization of a given objective. When it comes to deep learning, first-order methods like gradient descent have become a default tool for optimization in deep learning. On the other hand, second-order methods did not see widespread use in deep learning. Yet, they hold many promises and are still a very active field of research. An important perspective into both methods is steepest descent, which allows you to encompass first and second-order approaches into the same framework.
In this thesis, we establish an explicit connection between steepest descent and optimal control, a field that tries to optimize sequential decision-making processes. Core to it is the family of problems known as Linear Quadratic Regulation; problems that have been well studied and for which we know optimal solutions. More specifically, we show that performing one iteration of steepest descent is equivalent to solving a Linear Quadratic Regulator (LQR). This perspective gives us a convenient and unified framework for deploying a wide range of steepest descent algorithms, such as gradient descent and natural gradient descent, but certainly not limited to. This framework can also be extended to problems with an infinite horizon, such as deep equilibrium models. Doing so reveals that retrieving the gradient via implicit differentiation is equivalent to recovering it via Riccati’s solution to the LQR associated with gradient descent. Finally, incorporating curvature information into steepest descent usually takes the form of a matrix inversion. However, casting a steepest descent
step as a LQR also hints toward a trick that allows to sidestep this inversion, by leveraging Neumann’s series approximation. Empirical observations provide evidence that this approximation actually helps to stabilize the training process, by acting as an adaptive damping parameter.
|
Page generated in 0.0629 seconds