In this project we aim to apply Robust Reinforce-ment Learning algorithms, presented by Doya and Morimoto [1],[2], to control problems. Specifically, we train an agent to balancea pendulum in the unstable equilibrium, which is the invertedstate.We investigate the performance of controllers based on twodifferent function approximators. One is quadratic, and the othermakes use of a Radial Basis Function neural network. To achieverobustness we will make use of an approach similar toH∞control, which amounts to introducing an adversary in the controlsystem.By changing the mass of the pendulum after training, we aimedto show as in [2] that the supposedly robust controllers couldhandle this disruption better than its non-robust counterparts.This was not the case. We also added a random disturber signalafter training and performed similar tests, but we were againunable to show robustness. / I detta projekt applicerar vi Robust Rein- forcement Learning (RRL) algoritmer, framtagna av Doya och Morimoto [1], [2], på reglerproblem. Målet var att träna en agent att balansera en pendel i det instabila jämviktsläget; det inverterade tillståndet. Vi undersökte prestandan hos regulatorer baserade på två value function approximators. Den ena är kvadratisk och den andra en Radial Basis Function neuralt nätverk. För att skapa robusthet så använder vi en metod som är ekvivalent med H∞ - reglering, som innebär att man introducerar en motståndare i reglersystemet. Genom att ändra pendelns massa efter träning, hoppas vi att som i [2] kunna visa att den förment robusta regulatorn klarar av denna störning bättre än sin icke-robusta mostvarighet. Detta var inte fallet. Vi lade även till en slumpmässig störsignal efter träning och utförde liknande tester, men lyckades inte visa robusthet i detta fall heller. / Kandidatexjobb i elektroteknik 2020, KTH, Stockholm
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-293879 |
Date | January 2020 |
Creators | Grönland, Axel, Eriksson Möllerstedt, Viktor |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | English |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2020:134 |
Page generated in 0.0021 seconds