Return to search

Entwickeln eines Reinforcement Learning Agenten zur Realisierung eines Schifffolgemodells

Die Arbeit ist Teil eines aktuellen Forschungsprojekts, bei der ein dynamischer zweidimensionaler Verkehrsflusssimulator zur Beschreibung der Binnenschifffahrt auf einer ca. 220 km langen Strecke auf dem Niederrhein entwickelt werden soll. Ziel dieser Arbeit ist es, ein Schifffolgemodell mithilfe von Deep Learning Ansätzen umzusetzen und mittels geeigneter Beschleunigung ein kollisionsfreies Folgen zu realisieren. Dabei sind die gesetzlichen Randbedingungen (Verkehrsregeln, Mindestabstände) sowie hydrodynamische und physikalische Gesetzmäßigkeiten wie minimale und maximale Beschleunigungen und Geschwindigkeiten zu berücksichtigen.

Nach der Analyse des Systems sowie der notwendigen Parameter, wird ein Modell entworfen und die Modellparameter bestimmt. Unter Berücksichtigung der Modellparameter wird ein Agent ausgewählt und das System in MATLAB implementiert. Die Parameter sind so gestaltet, dass sich damit ein allgemeines Folgemodell ergibt und beispielsweise auch ein Autofolgemodell realisieren lässt.:1 Einleitung
1.1 Ziel der Arbeit
1.2 Aufbau der Arbeit

2 Stand der Technik
2.1 Traditionelle Folgemodelle
2.2 Reinforcement Learning
2.2.1 Modell
2.2.2 State-value function
2.3 Deep Reinforcement Learning
2.3.1 Künstliches neuronales Netz

3 Mathematische Grundlagen
3.1 Künstliche Neuronen
3.1.1 Aktivierungsfunktionen
3.2 Normierung
3.3 Funktionstypen

4 Analyse
4.1 Analyse der Systemfunktionen der Software

5 Modell
5.1 Aufbau
5.2 Approximatoren
5.3 Parameter
5.4 Szenarien

6 Agent
6.1 Auswahl des Agenten
6.2 Twin-Delayed Deterministic Policy Gradient (TD3)

7 Implementierung
7.1 Environment
7.1.1 Rewardfunktion
7.2 Agent
7.2.1 Netzwerkarchitektur
7.2.1.1 Actor-Netzwerk
7.2.1.2 Critic-Netzwerk
7.2.1.3 Rauschprozesse
7.3 Hyperparameter
7.4 Sonstige Parameter

8 Trainingsprozess 45
8.1 Ornstein-Uhlenbeck-Prozess
8.2 Algorithmus

9 Validierung
9.1 Fahrverhalten bei verschiedenen Charakteristika
9.2 Vergleich mit dem Intelligent Driver Model

10 Zusammenfassung und Ausblick

Literaturverzeichnis

Identiferoai:union.ndltd.org:DRESDEN/oai:qucosa:de:qucosa:76701
Date23 November 2021
CreatorsZiebarth, Paul
ContributorsHart, Fabian, Michler, Albrecht, Technische Universität Dresden
Source SetsHochschulschriftenserver (HSSS) der SLUB Dresden
LanguageGerman
Detected LanguageGerman
Typeinfo:eu-repo/semantics/publishedVersion, doc-type:masterThesis, info:eu-repo/semantics/masterThesis, doc-type:Text
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0016 seconds