Return to search

Planning Resource Requirements in Rail Freight Facilities by Applying Machine Learning

Diese Dissertation verknüpft eisenbahnbetriebswissenschaftliche Grundlagen mit Methoden aus den Disziplinen Unternehmensforschung (Operations Research) und Maschinelles Lernen. Gegenstand ist die auf den mittelfristigen Zeithorizont bezogene Ressourcenplanung von Knoten des Schienengüterverkehrs, die sogenannte taktische Planung. Diese spielt eine wesentliche Rolle für eine wirtschaftliche und qualitativ hochwertige Betriebsdurchführung.
Knoten des Schienengüterverkehrs stellen neuralgische Punkte in der Transportkette von Waren auf der Schiene dar. Sie dienen der Durchführung einer Vielzahl unterschiedlicher betrieblicher Prozesse zur Sicherstellung eines definierten Outputs an Zügen in Abhängigkeit eines jeweils gegebenen Inputs. Die Bereitstellung eines zu den Betriebsanforderungen passenden Ressourcengerüsts ist Teil der taktischen Planung und hat wesentlichen Einfluss auf die Qualität der Prozesse in den Knoten, im Speziellen, sowie auf die vor- und nachgelagerte Transportdurchführung im Allgemeinen. Die Bemessung des notwendigen Personals, der Betriebsmittel und der Infrastruktur für einen Betriebstag, die sogenannte Ressourcendimensionierung, ist in der Praxis geprägt durch einen erheblichen manuellen Aufwand sowie eine große Abhängigkeit von der Datenqualität. Vor diesem Hintergrund und zur Überwindung dieser Nachteile schlägt diese Dissertation ein neues Verfahren zur Ressourcendimensionierung vor. Exemplarisch wird der Fokus auf die großen Knoten des Einzelwagenverkehrs gelegt, die sogenannten Rangierbahnhöfe. In diesen werden Eingangszüge zerlegt, Güterwagen entsprechend ihrer Ausgangsrichtung sortiert und gesammelt, sowie neue Ausgangszüge gebildet und bereitgestellt.
Nach dem Stand der Technik werden für die Ressourcendimensionierung mehrere Monate bis wenige Wochen vor der Betriebsdurchführung Rangierarbeitspläne erstellt. Diese umfassen einen detaillierten Arbeitsfolgenplan inklusive Terminierung von Prozessen sowie deren Ressourcenbelegung. Die Rangierarbeitspläne bilden die Grundlage für die Ressourcenanforderung. Aufgrund sich ändernder Nebenbedingungen vor dem Betriebstag und dem stochastischen Charakter der Betriebsprozesse sowohl im Netz als auch in den Knoten können die in der taktischen Planung erstellten Rangierarbeitspläne nur begrenzt für die Durchführung verwendet werden. Als Beispiele sollen das Einlegen von Sonderzügen, Unregelmäßigkeiten bei den Transporten und Witterungsauswirkungen angeführt werden. Der betriebene Planungsaufwand begründet sich in den komplexen Zusammenhängen zwischen den Betriebsprozessen und der größtenteils fehlenden EDV-Unterstützung, was eine Ermittlung der Ressourcendimensionierung bisher erschwert. Die Folge ist eine Diskrepanz zwischen der Datenqualität als Eingangsgröße für die Planung und der Präzision des Rangierarbeitsplans als Ausgangsgröße, was als Konsequenz eine Scheingenauigkeit der Planung und unter Umständen eine Über- oder Unterdimensionierung der Ressourcen mit sich bringt. Das zeigt, dass die Planung verkürzt werden muss und neue Hilfsmittel erforderlich sind.
Motiviert durch diese Diskrepanz und den neuen Möglichkeiten, die die Methoden aus den Bereichen des Operations Research und des Maschinellen Lernens bieten, stellt diese Dissertation ein neues Planungsverfahren Parabola bereit. Parabola ermittelt mit geringerem Planungsaufwand und hoher Qualität relevante Kenngrößen für die Ressourcendimensionierung in Knoten des Schienengüterverkehrs. Dies beschleunigt den taktischen Planungsprozess, reduziert Scheingenauigkeiten bei der Ressourcendimensionierung vor der Betriebsdurchführung und orientiert sich daran, wann welche Entscheidungen zuverlässig und genau zu treffen sind. Folglich wird die Detailtiefe der Planung mit der Zuverlässigkeit der Daten in Einklang gebracht. Das in der Dissertation bereitgestellte Planungsverfahren Parabola analysiert eine ausreichend große Anzahl errechneter Rangierarbeitspläne und / oder historischer Betriebsdaten. Das dabei trainierte Regressionsmodell wird anschließend zur Bestimmung des Ressourcengerüsts genutzt.
Die Kalibrierung der Regressionsmodelle erfordert hinreichend viele Rangierarbeitspläne. Für deren Erzeugung wird exemplarisch am Beispiel von Rangierbahnhöfen in dieser Dissertation ein ganzheitliches mathematisches lineares Programm entwickelt, das erstmalig sämtliche für die taktische Planung eines Rangierbahnhofs relevanten Entscheidungsprobleme vom Zugeingang bis zum Zugausgang abbildet. Dieses beinhaltet die Definition der Verknüpfung zwischen Eingangs- und Ausgangszügen, sogenannter Wagenübergänge, sowie die Terminierung sämtlicher Betriebsprozesse mit ihrer Zuweisung zu örtlichen Mitarbeitern, Betriebsmitteln und Infrastruktur. Die bestehenden mathematischen Modelle in der bisherigen Literatur beschränken sich lediglich auf Teile dieses Problems. Es folgt die systematische Erzeugung von Problemstellungen, sogenannten Instanzen, zur Generierung eines repräsentativen Testpools.
Die Instanzen dieses NP-schweren Problems sind für generische, exakte Lösungsverfahren in akzeptabler Zeit nicht zuverlässig lösbar. Daher wird eine maßgeschneiderte Metaheuristik, konkret ein Verfahren der Klasse Adaptive Large Neighborhood Search (ALNS), entwickelt. Diese bewegt sich durch den Lösungsraum, indem schrittweise mittels mehrerer miteinander konkurrierender Subheuristiken eine vorher gefundene Lösung erst zerstört und anschließend wieder repariert wird. Durch unterschiedliche Charakteristika der Subheuristiken und einer statistischen Auswertung ihres jeweiligen Beitrags zum Lösungsfortschritt, gelingt es der ALNS, sich an das Stadium der Lösungssuche und an die jeweilige Problemstruktur anzupassen. Die in dieser Dissertation entwickelte ALNS erzeugt für realistische Instanzen eines Betriebstages Lösungen in hoher Qualität binnen weniger Minuten Rechenzeit.
Basierend auf den erzeugten Rangierarbeitsplänen wurden für die Entwicklung des Planungsverfahrens insgesamt fünf Regressionstechniken getestet, die die Ausgangsgrößen der Pläne – Bedarf an Lokomotiven, Personal und Infrastruktur – prognostizieren. Die vielversprechendsten Ergebnisse werden durch die Methoden Tree Boosting sowie Random Forest erzielt, die in über 90 % der Fälle den Ressourcenbedarf für Personale und Lokomotiven exakt und für Infrastruktur mit einer Toleranz von einem Gleis je Gleisgruppe prognostizieren. Damit ist dieses Regressionsmodell nach ausreichender Kalibrierung entsprechend örtlicher Randbedingungen geeignet, komplexere Planungsverfahren zu ersetzen. Die Regressionsmodelle ermöglichen die Abstrahierung von Mengengerüsten und Leistungsverhalten von Knoten des Schienengüterverkehrs. Daher ist beispielsweise ein konkreter Fahrplan von und zu den Knoten nicht mehr notwendige Voraussetzung für die taktische Planung in Rangierbahnhöfen. Da das Regressionsverfahren aus vielen Rangierarbeitsplänen lernt, verringert sich die Abhängigkeit von einzelnen Instanzen. Durch die Kenntnis von vielen anderen Plänen können robustere Ressourcengerüste prognostiziert werden.
Neben dem in dieser Dissertation ausgearbeiteten Anwendungsfall in der taktischen Planung in Knoten des Schienengüterverkehrs, eröffnet das vorgeschlagene neue Planungsverfahren Parabola eine Vielzahl an weiteren Einsatzfeldern. Die Interpretation des trainierten Regressionsmodells erlaubt das tiefgründige Verständnis des Verhaltens von Knoten des Schienengüterverkehrs. Dies ermöglicht ein besseres Verstehen der Engpässe in diesen Knoten sowie die Identifikation relevanter Treiber der Ressourcendimensionierung. Weiter können diese Modelle bei der Erstellung von netzweiten Leistungsanforderungen Berücksichtigung finden. Mit der in dieser Dissertation erfolgten Bereitstellung von Parabola wird durch Nutzung neuartiger Methoden aus dem Operations Research und Maschinellen Lernen das Instrumentarium der eisenbahnbetriebswissenschaftlichen Verfahren und Modelle sinnvoll erweitert. / This dissertation combines the knowledge of railway operations management with methods from operations research and machine learning. It focuses on rail freight facilities, especially their resource planning at a tactical level. The resource planning plays a crucial role for economical operations at high quality.
The rail freight facilities represent neuralgic points in the transport chain of goods by rail. Their task is to carry out a multitude of different operational processes to ensure a defined output of trains, depending on a given input. Providing resource requirements appropriate to the amount of work has a significant impact on the quality of the processes in the facilities in particular and on the up- and downstream transport performance in general. The correct dimensioning of resource requirements, which include the necessary staff, locomotives, and infrastructure for an operating day, is characterized by a considerable manual effort and a large dependency on the data accuracy. Against this background and to overcome these drawbacks, this dissertation proposes a new method for resource requirements. The focus is on the large facilities of single wagonload traffic, the so-called classification yards, in which inbound trains are disassembled, railcars are classified according to their outbound direction, and new outbound trains are formed.
Nowadays, shunting work plans are created several months to a few weeks before operations. These operating plans comprise a detailed work sequence plan, including process scheduling, and resource allocation. The operating plans form the basis for resource requirements. Due to the changing constraints prior to operations, e.g., the addition of special trains, and the stochastic nature of the operational processes, for instance caused by weather conditions, shunting work plans can only be used for execution to a limited extent. This effort is made for planning due to the complex interdependencies between the operational processes and the predominant lack of IT support, which makes it difficult to determine resource requirements. The result is a discrepancy between the accuracy of the data as an input variable and the precision of the shunting work plan as an output variable. This leads to an illusory precision of the planning and possibly to an oversizing or undersizing of the resources. Hence, planning must be shortened and new tools are required.
Motivated by this discrepancy and the new possibilities offered by methods from the _elds of operations research and machine learning, this dissertation provides a new planning method Parabola. Parabola determines with less planning effort and at high quality relevant parameters for resource requirements in rail freight facilities. This accelerates the planning process, reduces illusory precision before operations are carried out and enables decision-making with sufficient reliability due to the data accuracy. Consequently, the level of detail of the planning is harmonized with the reliability of the data. The planning procedure Parabola involves the analysis of numerous calculated operating plans and / or historical operating data. This trains a regression model that can then be used to determine the resource requirements.
The calibration of the regression models requires many operating plans. For their generation, an integrated mathematical linear program is developed in this dissertation using the example of classification yards; for the first time, one program covers all relevant decision problems of tactical planning in a classification yard, from the train arrival to the train departure. This includes the definition of the connection between inbound and outbound trains, so-called railcar interchanges, as well as the scheduling of all operational processes with their assignment to local staff, locomotives, and infrastructure. All existing mathematical models in the literature are limited to parts of the problem. Thereafter follows a systematic generation of a test pool of problems named instances.
The instances of this NP-hard problem cannot be reliably solved within an acceptable time frame with general-purpose solvers. Therefore, a tailored metaheuristic, namely an adaptive large neighborhood search (ALNS), is developed. It moves through the solution space by first destroying and then repairing a solution stepwise. Several competing subheuristics are available for this purpose. The ALNS combines multiple subheuristics, which have different characteristics and contribute to the solution progress, as determined by statistical evaluation. Consequently, the ALNS successfully adapts to the progress of the solution and to the problem structure. The ALNS, which is developed in this dissertation, generates high-quality solutions for realistic instances of an operating day in a few minutes of computing time.
Based on the generated operating plans, five regression methods predicting the output variables of the operating plans – demand for locomotives, staff, and infrastructure – are tested. The most promising results are achieved by the methods tree boosting and random forest, which predict the resource requirements in over 90% of the cases for staff and locomotives accurately and for infrastructure with a tolerance of one track per bowl. Thus, a regression model can replace the more complex planning procedures after sufficient calibration according to local restrictions. The regression models allow the abstraction of quantity structures and performance behavior. Hence, for example, a dedicated timetable is no longer a prerequisite for tactical planning in classification yards. Since regression methods learn from many operating plans, the dependence on individual instances is reduced. By knowing many other plans, the regression model can predict robust resource requirements.
In addition to the use case in tactical planning in rail freight facilities, the proposed new planning method Parabola opens a multitude of further _elds of application. By interpreting the trained regression model, the behavior of rail freight facilities can be understood in depth. Under certain circumstances, this allows a better understanding of the bottlenecks in these facilities and the relevant drivers of resource dimensioning. Furthermore, these models have potential applications in the design of network-wide performance requirements. By providing Parabola in this dissertation, the toolbox of railroad management science procedures and models is sensibly extended by using novel methods from operations research and machine learning.

Identiferoai:union.ndltd.org:DRESDEN/oai:qucosa:de:qucosa:77299
Date10 January 2022
CreatorsRuf, Moritz
ContributorsKönig, Rainer, Cordeau, Jean-François, Technische Universität Dresden
Source SetsHochschulschriftenserver (HSSS) der SLUB Dresden
LanguageEnglish
Detected LanguageGerman
Typeinfo:eu-repo/semantics/publishedVersion, doc-type:doctoralThesis, info:eu-repo/semantics/doctoralThesis, doc-type:Text
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.003 seconds