I denna uppsatts tittar vi på hur olika machine learning algoritmer presterar när man förutspår förseningar i tågtrafiken. Machine learning metoderna som tas upp i denna rapport är logistic regression, decision tree och neural network. Vi har försökt implementera alla tre ovan nämnda metoderna med data som vi själva har samlat in till vår egen databas med hjälp av Västtrafiks öppna API. En beskrivning på data som har samlats in diskuteras, grundläggande genomgång av de olika metoderna och generell information om vad machine learning är. Metoderna ställs upp mot varandra och dess prestation visas upp med hjälp av AUC poäng samt confusion matrix. / This thesis investigates the performance of predicting train delays with different machine learning algorithms. The machine learning algorithms that are studied and presented in this thesis are logistic regression, decision tree and neural network. We have tried to implement all of the above algorithms with the data that is collected by ourselves into our own database with the help of Västtrafiks open API. A brief description on our data that has been collected is presented, the fundamentals of the algorithms and general information about machine learning is presented. The algorithms are compared to each other and their performance are shown with the help of AUC score and a confusion matrix.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:hh-38062 |
Date | January 2018 |
Creators | Sundemo, John, Rustam, Stanikzai |
Publisher | Högskolan i Halmstad, Högskolan i Halmstad |
Source Sets | DiVA Archive at Upsalla University |
Language | Swedish |
Detected Language | English |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0021 seconds