Return to search

A Deep Learning Based Approach to Object Recognition from LiDAR Data Along Swedish Railroads / En djupinlärningsbaserad metod för objektigenkänning längs svensk järnväg

Malfunction in the overhead contact line system is a common cause of disturbances in the train traffic in Sweden. Due to the preventive methods being inefficient, the Swedish Transport Administration has stated the need to develop the railroad maintenance services and has identified Artificial Intelligence (AI) as an important tool for this undertaking.  Light Detection and Ranging (LiDAR) is a remote sensing technology that has been gaining popularity in recent years due to its high ranging accuracy and decreasing data acquisition cost. LiDAR is commonly used within the railroad industry and companies such as WSP collects large amount of data through LiDAR measurements every year. There is currently no reliable fully automatic method to process the point cloud data structure. Several studies propose innovative methods based on traditional machine learning to extract railroad system components from point clouds and have been able to do so with good results. However, these methods have limited applicability in real world problems, as they build upon hand-crafted features based on previous knowledge of the data on which they are applied. Deep learning technology may be a better alternative for the task as it does not require the same amount of human interaction for feature engineering and knowledge about the data in advance.  This thesis investigates if contact line poles can be recognized from LiDAR data with the use of the neural network architecture DGCNN. Data from two Swedish railroad lines, Saltsjöbanan and Roslagsbanan, provided by WSP was used. Point labels were predicted through semantic segmentation from which objects were distinguished using the clustering algorithm DBSCAN. The network was trained and validated on Saltsjöbanan using k-fold cross-validation and was later tested on Roslagsbanan to simulate the application of trained models on an unknown dataset. On point level the network achieved an estimated precision of 0.87 and a recall of 0.89 on the data from Saltsjöbanan and an estimated precision of 0.92 and recall of 0.83 on the data from Roslagsbanan. In the object recognition task, the approach achieved an average precision of 0.93 and recall of 0.998 on the data from Saltsjöbanan and on the data from Roslagsbanan, an average precision of 0.96 and a recall of 1 was achieved, indicating that it is possible to apply this method on railroad segments other than the one the network was trained on. Despite not being accurate or reliable enough on point level to be used for thorough inspection of the contact line system, this approach has various applications in terms of object recognition along Swedish railroads. Future research should investigate how adding additional classes beyond contact line poles would affect the results and what changes can be done to the parameters to optimize the performance. A side-by-side comparison with the current methods and traditional machine learning-based methods would be valuable as well. / Fel i kontaktledningssystemet är en vanlig orsak till störningar i tågtrafiken i Sverige. Då dagens metoder för att förebygga dessa fel är ineffektiva har Trafikverket uttryckt behovet av att utveckla underhållsarbetet av den svenska järnvägen och har identifierat artificiell intelligens (AI) som ett viktigt verktyg i det syftet. Light Detection and Ranging (LiDAR) är en fjärranalysteknologi som har blivit allt mer populär med åren tack vare sin höga mätnoggrannheten och allt billigare datainsamling. LiDAR används regelbundet inom järnvägsindustrin och företag som WSP samlar årligen in stora mängder data med denna teknologi. I dagsläget finns det däremot ingen tillräckligt pålitlig automatisk metod för att segmentera och klassificera punktmoln. Ett flertal studier föreslår lösningar baserade på traditionell maskininlärning för att ta ut järnvägskomponenter ur punktmolnsdata. Eftersom dessa metoder bygger på förkunskap och noga utvecklade funktioner för att hitta mönster i datan är de svåra att tillämpa i verkliga problem. Istället kan djupinlärning som inte kräver samma förkunskap eller noggranna matematiska modellering tillämpas. I det här arbetet identifierades kontaktledningsstolpar ur LiDAR data med hjälp av det neurala nätverket DGCNN. Datan som användes var punktmolnsdata från Saltsjöbanan och Roslagsbanan försedd av WSP. Först klassificerades punkter genom semantisk segmentering och från klassificeringen kunde objekt identifierades genom att tillämpa klusteringsalgoritmen DBSCAN. Nätverket tränades med hjälp av korsvalidering på data över Saltsjöbanan och testades därefter på data över Roslagsbanan för att undersöka om tränade modeller kan tillämpas på andra järnvägslinjer. På datan över Saltsjöbanan uppnådde nätverket en estimerad specificitet på 0.87 och sensitivitet på 0.89 på punktnivå. Motsvarande värden på datan över Roslagsbanan låg på 0.92 och 0.83. Metoden för objektigenkänning uppnådde en genomsnittlig specificitet på 0.93 och sensitivitet på 0.998 på datan över Saltsjöbanan och motsvarande värden på datan över Roslagsbanan låg på 0.96 och 1. Resultatet indikerar att metoden går att tillämpa på andra järnvägslinjer utan specifik träning för dessa.  Trots att metoden inte är träffsäker nog på punktnivå för att användas för grundlig besiktning av kontaktledningssystemet kan den användas för objektigenkänning längs svensk järnväg. Framtida forskning bör undersöka hur resultatet påverkas om ytterligare klasser utöver kontaktledningsstolpar används och vilka förändringar bör göras bland parametrarna för att optimera det undersökta tillvägagångssättet. En utförlig jämförelse mot nuvarande metoder och metoder baserade på traditionell maskininlärning skulle dessutom vara av värde.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-315035
Date January 2022
CreatorsMorast, Egil
PublisherKTH, Fastigheter och byggande
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-ABE-MBT ; 22448

Page generated in 0.0028 seconds