Spelling suggestions: "subject:"självkörande låg."" "subject:"självkörande såg.""
1 |
Artificial Intelligence applications for railway signallingSmakic, Benjamin January 2021 (has links)
The main purpose of this Master Thesis is to investigate how front-facing, train-mounted cameras and Computer Vision, a type of Artificial Intelligence (AI), can be used to compensate for GPS inaccuracies. By using footage from track-recording cameras, Computer Vision can be utilized to determine the number of tracks and the track occupancy of the train, which would compensate GPS inaccuracies in the lateral positioning. GPS usage in railway applications is rare, however, an AI-based positioning system would facilitate the usage of GPS for higher capacity and better utilization of current railway infrastructure. This is especially interesting for ERTMS, a European effort to create a standardized signalling system while simultaneously increasing capacity, where potential for an AI-based positioning system can be found in both ERTMS level 2 and level 3. Two Computer Vision models were created, based on two different methods. Images for both models were collected from YouTube videos of train trips recorded with train-mounted cameras. In the first model, the images were labelled according to the number unoccupied adjacent tracks. For example, a left-track occupancy of a double track section would be labelled “01”. The model architecture was based on Convolutional Neural Networks (CNN), a type of AI algorithm specifically developed for image processing, where every pixel in each image was analysed to find patterns corresponding to each label. In the second model, Python software was utilized to manually label every track with bounding boxes. The purpose of the bounding boxes was to demarcate the tracks within the images. Thus, the latter employed strategy did not require the labelling of both the number of tracks and their position. However, it was magnitudes more time consuming. The model was trained using YOLOv3 real-time object detection, a system perfectly fit for real-time track detection. The first model, which was limited to a recognition of up to four tracks, had a 60 % accuracy. The results were adequate considering the unfit method used to train the model and detect tracks. It was not further considered, as the discovery of the second method involving YOLOv3 resulted a more suitable model for the task. The second model was limited to a recognition of up to three tracks due to limited availability of processing power, computer memory, and time. The performance of the second model was evaluated using clips of different track scenarios. In summary, the second model performed well in the following scenarios: · Main-track detection in any environment. · Side-track recognition in simple environments. It performed mediocre in the following scenarios: · Medium-illuminated tunnels. · Tracks seen through windscreens obscured by water droplets. · Side-track detection in complex environments. It performed poorly in the following scenarios: · Low-illuminated tunnels. · Bright tunnel exits. · Side-track detection in snowy conditions. In conclusion, it is possible to create a computer-vision model for track recognition. Although the results presented in this thesis are promising in certain scenarios, the image dataset is far too limited. Only approximately 350 labelled images were available for the model training. To develop a full-scale AI-based positioning system, many more images must be used to fully encapsule all the possible track scenarios. Furthermore, numerous technical specifications must be defined for the development of such a large-scale system, such as camera type (normal, thermal, event-based, lidar etc.), system design, safety analysis, system evaluation strategy etc. Nevertheless, if the development of an AI-based positioning system is successful, it can transition to become a future full-scale railway system of autonomous freight, passenger, and shunting operations. / Syftet med denna Masteruppsats är att undersöka hur hyttmonterade tågkameror tillsammans med datorseende, en typ av Artificiell Intelligens (AI), kan användas för att kompensera bristande GPS-positionering. Genom att använda kameror som kontinuerligt filmar framförvarande räls från tåghytten, kan datorseende utnyttjas för att avgöra antalet spår vid tågets aktuella position, samt vilket spår tåget belägger, och på så sätt kompensera eventuella GPS-felaktigheter i tågets laterala position. Användning av GPS inom järnvägens signalsystem är sällsynt, då tekniken inte är särskilt beprövad i signaltekniska syften. Det skulle emellertid kunna främjas genom att introducera ett AI-baserat signalsystem i syfte att höja järnvägens kapacitet och öka utnyttjandegraden av befintliga banor. I synnerhet när det kommer till utvecklingen av ERTMS kan ett AI-baserat signalsystem vara av intresse, då det finns potentiella tillämpningsområden för både ERTMS level 2 och level 3. Två olika modeller för datorseende utvecklades, baserat på två olika metoder. Bildmaterial för båda modellerna togs från YouTube-klipp innehållande inspelningar från hyttmonterade kameror. För den första modellen kategoriserades bilderna i enlighet med antalet fria intilliggande spår. Exempelvis skulle ett vänster-belagt dubbelspår kategoriseras ”01”. Modellarkitekturen baserades på Convolutional Neural Networks (CNN) en AI-algoritm specialanpassad för bland annat bildanalysering, där alla pixlar i varje bild analyserades i syfte att upptäcka mönster mellan bilderna och dess kategori. I den andra modellen användes Python-programvara för att manuellt kategorisera varje spår med en så kallad avgränsningsruta. Avgränsningsrutorna användes i syfte att urskilja spåren från resterande del av bilderna. Kategorisering i enlighet med antalet fria intilliggande spår krävdes således inte, däremot ökade tidsåtgången för kategorisering markant. Modellen tränades med ”YOLOv3 real-time object detection”, ett verktyg speciellt framtaget för bildanalys i realtid, vilket passade perfekt för spårdetektering i realtid. Den första modellen begränsades till igenkänning av maximalt fyra spår och hade 60 % precision. Resultatet var tillfredsställande med tanke på den olämpliga modell som användes för träning samt detektering av spår. Utvecklingen av denna modell avstannades då ett bättre system för spårdetektering baserat på YOLOv3 upptäcktes. Den andra modellen, baserad på YOLOv3 begränsades till igenkänning av maximalt tre spår, då tillgängligheten av processorkraft, lagringsutrymme och tid var begränsad. Precisionen av denna modell bedömdes med hjälp av korta klipp på olika spårmiljöer. Sammanfattningsvis presterade modellen bra i följande scenarion: · Huvudspårsdetektering i alla typer av miljöer · Sidospårsdetektering i enkla miljöer Modellen presterade mediokert i följande scenarion: · Spårdetektering i halvmörka tunnlar · Vindrutor täckta med vattendroppar · Sidospårsdetektering i avancerade miljöer Modellen presterade mycket dåligt i följande scenarion: · Spårdetektering i mörka tunnlar. · Spårdetektering i ljusa tunnelportaler. · Sidospårsdetektering i snöförhållanden. Ur detta kan slutsatsen dras att det är fullt möjligt att skapa ett signalsystem baserat på datorseende. Fastän de resultat som presenterats i denna masteruppsats tyder på god prestanda i vissa scenarion, kan det inte uteslutas att storleken på det använda bildmaterialet inte är adekvat. Endast cirka 350 kategoriserade bilder användes. För en fullskalig utveckling av ett AI-baserat positioneringssystem måste många fler bilder tas i beaktning, för att säkerställa en inkludering av så många spårmiljöer som möjligt. Dessutom måste åtskilliga tekniska specifikationer definieras, så som kameratyp (vanlig kamera, värmekamera, eventbaserad kamera, Lidar osv.), systemdesign, säkerhetsanalys, systemutvärderingsstrategi osv. Om däremot utvecklingen av ett AI-baserat signalsystem lyckas, kan det vidareutvecklas till ett framtida fullskaligt signalsystem för autonoma passagerar- och godståg samt autonoma rangerlok.
|
Page generated in 0.0683 seconds