Global ETD Search

Return to search

Entwickeln eines Reinforcement Learning Agenten zur Realisierung eines Schifffolgemodells

Die Arbeit ist Teil eines aktuellen Forschungsprojekts, bei der ein dynamischer zweidimensionaler Verkehrsflusssimulator zur Beschreibung der Binnenschifffahrt auf einer ca. 220 km langen Strecke auf dem Niederrhein entwickelt werden soll. Ziel dieser Arbeit ist es, ein Schifffolgemodell mithilfe von Deep Learning Ansätzen umzusetzen und mittels geeigneter Beschleunigung ein kollisionsfreies Folgen zu realisieren. Dabei sind die gesetzlichen Randbedingungen (Verkehrsregeln, Mindestabstände) sowie hydrodynamische und physikalische Gesetzmäßigkeiten wie minimale und maximale Beschleunigungen und Geschwindigkeiten zu berücksichtigen.

Nach der Analyse des Systems sowie der notwendigen Parameter, wird ein Modell entworfen und die Modellparameter bestimmt. Unter Berücksichtigung der Modellparameter wird ein Agent ausgewählt und das System in MATLAB implementiert. Die Parameter sind so gestaltet, dass sich damit ein allgemeines Folgemodell ergibt und beispielsweise auch ein Autofolgemodell realisieren lässt.:1 Einleitung
1.1 Ziel der Arbeit
1.2 Aufbau der Arbeit

2 Stand der Technik
2.1 Traditionelle Folgemodelle
2.2 Reinforcement Learning
2.2.1 Modell
2.2.2 State-value function
2.3 Deep Reinforcement Learning
2.3.1 Künstliches neuronales Netz

3 Mathematische Grundlagen
3.1 Künstliche Neuronen
3.1.1 Aktivierungsfunktionen
3.2 Normierung
3.3 Funktionstypen

4 Analyse
4.1 Analyse der Systemfunktionen der Software

5 Modell
5.1 Aufbau
5.2 Approximatoren
5.3 Parameter
5.4 Szenarien

6 Agent
6.1 Auswahl des Agenten
6.2 Twin-Delayed Deterministic Policy Gradient (TD3)

7 Implementierung
7.1 Environment
7.1.1 Rewardfunktion
7.2 Agent
7.2.1 Netzwerkarchitektur
7.2.1.1 Actor-Netzwerk
7.2.1.2 Critic-Netzwerk
7.2.1.3 Rauschprozesse
7.3 Hyperparameter
7.4 Sonstige Parameter

8 Trainingsprozess 45
8.1 Ornstein-Uhlenbeck-Prozess
8.2 Algorithmus

9 Validierung
9.1 Fahrverhalten bei verschiedenen Charakteristika
9.2 Vergleich mit dem Intelligent Driver Model

10 Zusammenfassung und Ausblick

Literaturverzeichnis

info:eu-repo/classification/ddc/380

ddc:380

Identifer	oai:union.ndltd.org:DRESDEN/oai:qucosa:de:qucosa:76701
Date	23 November 2021
Creators	Ziebarth, Paul
Contributors	Hart, Fabian, Michler, Albrecht, Technische Universität Dresden
Source Sets	Hochschulschriftenserver (HSSS) der SLUB Dresden
Language	German
Detected Language	German
Type	info:eu-repo/semantics/publishedVersion, doc-type:masterThesis, info:eu-repo/semantics/masterThesis, doc-type:Text
Rights	info:eu-repo/semantics/openAccess

Page generated in 0.0016 seconds

Entwickeln eines Reinforcement Learning Agenten zur Realisierung eines Schifffolgemodells

Description

Links & Downloads

Tags

Additional Fields