Heatwave events as a kind of extreme climate event, have plagued the human race for the past few years. It severely influences people’s life quality, sometimes even leads to some serious diseases. In order to alleviate the possible damages heatwave events can do, some targeted actions are necessary and forecasting heatwaves is one of them. This study focuses on predicting potential heatwave events in Sweden, replying on the correlations between multiple meteorological and surface-related features, with the help of machine learning techniques. The related remote sensing data of 21 features are extracted and implemented with features selection using a correlation heatmap and 16 of them are finally determined to be used for prediction. Five types of classifiers LR, Gaussian NB, KNN, RF and XGBoost are utilized on the training and validation datasets with hyperparameter tuning and threshold tuning methods to choose the model that has the best performance to predict heatwaves using the test dataset. The results show that RF and XGBoost both perform well on the validation set, but XGBoost is more suitable applying on the test set since XGBoost possesses a higher generality. / Värmeböljor som en sorts extrem klimathändelse har plågat mänskligheten under de senaste åren. Det påverkar allvarligt människors livskvalitet, ibland till och med leder till några allvarliga sjukdomar. För att lindra de möjliga skadorna som värmeböljor kan orsaka är några riktade åtgärder nödvändiga och att förutse värmeböljor är en av dem. Denna studie fokuserar på att förutsäga potentiella värmeböljshändelser i Sverige, svara på sambanden mellan flera meteorologiska och ytrelaterade egenskaper, med hjälp av maskininlärningstekniker. De relaterade fjärravkänningsdata för 21 funktioner extraheras och implementeras med funktionsval med hjälp av en korrelationsvärmekarta och 16 av dem bestäms slutligen att användas för förutsägelse. Fem typer av klassificerare LR, Gaussian NB, KNN, RF och XGBoost används på tränings- och valideringsdataseten med hyperparameterjustering och tröskeljusteringsmetoder för att välja den modell som har bäst prestanda för att förutsäga värmeböljor med hjälp av testdatauppsättningen. Resultaten visar att RF och XGBoost båda presterar bra på valideringssetet, men XGBoost är mer lämpligt att applicera på testsetet eftersom XGBoost har en högre generalitet.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-337284 |
Date | January 2023 |
Creators | Li, Zhuoran |
Publisher | KTH, Hållbar utveckling, miljövetenskap och teknik |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-ABE-MBT ; 23529 |
Page generated in 0.0025 seconds