Return to search

Statistical Modelling of Plug-In Hybrid Fuel Consumption : A study using data science methods on test fleet driving data / Statistisk Modellering av Bränsleförbrukning För Laddhybrider : En studie gjord med hjälp av data science metoder baserat på data från en test flotta

The automotive industry is undertaking major technological steps in an effort to reduce emissions and fight climate change. To reduce the reliability on fossil fuels a lot of research is invested into electric motors (EM) and their applications. One such application is plug-in hybrid electric vehicles (PHEV), in which internal combustion engines (ICE) and EM are used in combination, and take turns to propel the vehicle based on driving conditions. The main optimization problem of PHEV is to decide when to use which motor. If this optimization is done with respect to emissions, the entire electric charge should be used up before the end of the trip. But if the charge is used up too early, latter driving segments for which the optimal choice would have been to use the EM will have to be done using the ICE. To address this optimization problem, we studied the fuel consumption during different driving conditions. These driving conditions are characterized by hundreds of sensors which collect data about the state of the vehicle continuously when driving. From these data, we constructed 150 seconds segments, including e.g. vehicle speed, before new descriptive features were engineered for each segment, e.g. max vehicle speed. By using the characteristics of typical driving conditions specified by the Worldwide Harmonized Light Vehicles Test Cycle (WLTC), segments were labelled as a highway or city road segments. To reduce the dimensions without losing information, principle component analysis was conducted, and a Gaussian mixture model was used to uncover hidden structures in the data. Three machine learning regression models were trained and tested: a linear mixed model, a kernel ridge regression model with linear kernel function, and lastly a kernel ridge regression model with an RBF kernel function. By splitting the data into a training set and a test set the models were evaluated on data which they have not been trained on. The model performance and explanation rate obtained for each model, such as R2, Mean Absolute Error and Mean Squared Error, were compared to find the best model. The study shows that the fuel consumption can be modelled by the sensor data of a PHEV test fleet where 6 features contributes to an explanation ratio of 0.5, thus having highest impact on the fuel consumption. One needs to keep in mind the data were collected during the Covid-19 outbreak where travel patterns were not considered to be normal. No regression model can explain the real world better than what the underlying data does. / Fordonsindustrin vidtar stora tekniska steg för att minska utsläppen och bekämpa klimatförändringar. För att minska tillförlitligheten på fossila bränslen investeras en hel del forskning i elmotorer (EM) och deras tillämpningar. En sådan applikation är laddhybrider (PHEV), där förbränningsmotorer (ICE) och EM används i kombination, och turas om för att driva fordonet baserat på rådande körförhållanden. PHEV: s huvudoptimeringsproblem är att bestämma när man ska använda vilken motor. Om denna optimering görs med avseende på utsläpp bör hela den elektriska laddningen användas innan resan är slut. Men om laddningen används för tidigt måste senare delar av resan, för vilka det optimala valet hade varit att använda EM, göras med ICE. För att ta itu med detta optimeringsproblem, studerade vi bränsleförbrukningen under olika körförhållanden. Dessa körförhållanden kännetecknas av hundratals sensorer som samlar in data om fordonets tillstånd kontinuerligt vid körning. Från dessa data konstruerade vi 150 sekunder segment, inkluderandes exempelvis fordonshastighet, innan nya beskrivande attribut konstruerades för varje segment, exempelvis högsta fordonshastighet. Genom att använda egenskaperna för typiska körförhållanden som specificerats av Worldwide Harmonized Light Vehicles Test Cycle (WLTC), märktes segment som motorvägs- eller stadsvägsegment. För att minska dimensioner på data utan att förlora information, användes principal component analysis och en Gaussian Mixture model för att avslöja dolda strukturer i data. Tre maskininlärnings regressionsmodeller skapades och testades: en linjär blandad modell, en kernel ridge regression modell med linjär kernel funktion och slutligen en en kernel ridge regression modell med RBF kernel funktion. Genom att dela upp informationen i ett tränings set och ett test set utvärderades de tre modellerna på data som de inte har tränats på. För utvärdering och förklaringsgrad av varje modell användes, R2, Mean Absolute Error och Mean Squared Error. Studien visar att bränsleförbrukningen kan modelleras av sensordata för en PHEV-testflotta där 6 stycken attribut har en förklaringsgrad av 0.5 och därmed har störst inflytande på bränsleförbrukningen . Man måste komma ihåg att all data samlades in under Covid-19-utbrottet där resmönster inte ansågs vara normala och att ingen regressionsmodell kan förklara den verkliga världen bättre än vad underliggande data gör.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:umu-172812
Date January 2020
CreatorsMatteusson, Theodor, Persson, Niclas
PublisherUmeå universitet, Institutionen för matematik och matematisk statistik, Umeå universitet, Institutionen för matematik och matematisk statistik
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageEnglish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0026 seconds