Quadruped robots offer distinct advantages in navigating challenging terrains due to their flexible and shock-absorbing characteristics. This flexibility allows them to adapt to uneven surfaces, enhancing their maneuverability. In contrast, rigid robots excel in tasks that require speed and precision but are limited in their ability to navigate complex terrains due to their restricted motion range. Another category of robots, known as soft robots, has gained attention for their unique attributes. Soft robots are characterized by their lightweight and cost-effective design, making them appealing for various applications. Recent advancements have made significant strides in practical control strategies for soft quadruped robots, particularly in diverse and unpredictable environments. An emerging approach in enhancing the autonomy of robots is through reinforcement learning. While this approach shows promise in enabling robots to learn and adapt to their surroundings, it necessitates rigorous training and must exhibit robustness in real-world scenarios. Moreover, a significant hurdle lies in bridging the gap between simulations and reality, as models trained in idealized virtual environments often struggle to perform as expected when deployed in the physical world. This thesis aims to address these challenges by optimizing the control of soft quadruped robots using a model-based reinforcement learning approach. The primary goal is to refine the gait control of these robots, taking into account the complexities encountered in real-world environments. The report covers the implementation of model-based reinforcement learning, including simulation setup, reward design, and policy refinement. Results show improved training efficiency and autonomous behavior, confirming the method’s effectiveness in enhancing soft quadruped robot capabilities.It is important to note that this report provides a concise summary of the thesis results due to the word limit imposed by the Department of Machine Design. For a comprehensive understanding of the research and its implications, the complete version is attached separately here. / Fyrbenta robotar är tack vare deras flexibla och stötdämpande egenskaper är väl lämpade att navigera utmanande terräng. Deras struktur möjliggör anpassning till ojämnheter i underlaget och bidrar till att öka deras rörelseförmåga. I kontrast utmärker sig stela robotar som det bästa valet för uppgifter som kräver snabbhet och precision, men deras förmåga att navigera komplex terräng är begränsad av deras rörelseomfång. En annan typ av robot, så kallade mjuka robotar, har nyligen uppmärksammats för sina unika egenskaper. Dessa robotar kännetecknas av en kostnadseffektiv lättviktsdesign, vilket gör dem attraktiva för många olika användningsområden. Nyligen har betydelsefulla framsteg gjorts inom kontroll av mjuka fyrbenta robotar, framför allt vad gäller kontroll i varierade miljöer. En av de huvudsakliga utmaningarna för att öka robotars autonomi är förstärkningsinlärning. Även om denna teknik är lovande för att ge robotar förmågan att lära sig och anpassa sig efter sin omgivning, kräver den omfattande träning samt måste uppvisa robusthet i verkliga scenarion. Ett större hinder är dessutom klyftan mellan simulation och verklighet, då modeller som tränats i ideella simuleringar ofta presterar sämre än väntat i den fysiska världen. Detta examensarbete behandlar dessa utmaningar genom att implementera en modellbaserad förstärkningsinlärningsmetod för kontroll av fyrbenta robotar, med det primära målet att förfina gångkontrollen för dessa robotar med hänsyn till de komplexa beteenden som uppstår i verkliga miljöer. Denna rapport behandlar implementeringen av modellbaserad förstärkningsin lärning samt simulering, belöningsdesign och policyförfining. Resultat visar på en förbättrad inlärningsförmåga och bättre autonomt beteende, vilket gör metoden lämplig för att förbättra prestandan av mjuka fyrbenta robotar. Var god att notera att denna rapport endast ger en nedkortad sammanfattning av forskningen och dess resultat på grund av krav från institutionen för maskinkonstruktion. En fullständig version innehållande mer detaljer kring studien och dess konsekvenser bifogas här.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-339056 |
Date | January 2023 |
Creators | Xuezhi, Niu |
Publisher | KTH, Skolan för industriell teknik och management (ITM) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-ITM-EX ; 2023:598 |
Page generated in 0.0021 seconds