Global ETD Search

1	Improving Visibility Forecasts in Denmark Using Machine Learning Post-processing / Förbättring av siktprognoser i Danmark med hjälp av maskininlärning Thomasson, August January 2023 (has links) Accurate fog prediction is an important task facing forecast centers since low visibility can affect anthropogenic systems, such as aviation. Therefore, this study investigates the use of Machine Learning classification algorithms for post-processing the output of the Danish Meteorological Institute’s operational Numerical Weather Prediction (NWP) model to improve visibility prediction. Two decision tree ensemble methods, XGBoost and Random Forest, were trained on more than 4 years of archived forecast data and visibility observations from 28 locations in Denmark. Observations were classified into eight classes, while models were optimized with resampling and Bayesian optimization. On an independent 15-month period, the Machine Learning methods show an improvement in balanced accuracy, F1-score, and Extremal Dependency Index compared to the NWP and persistence models. XGBoost performs slightly better. However, both methods suffer from an increase in overprediction of the low visibility classes. The models are also discussed regarding usability, coping with model changes and preservation of spatial features. Finally, the study shows how the interpretation of the post-processing models may be included operationally. Future research recommendations include incorporating more variables, using alternative class imbalance methods and further analyzing the models’ implementation and usage. Overall, the study demonstrates the potential of these models to improve visibility point forecasts in an operational setting. / Begränsad sikt kan på olika sätt påverka samhällen och naturen. Till exempel kan dimma störa både flyg- och biltrafiken. Därför är det viktigt att kunna förutspå sikt. Eftersom traditionella prognosmetoder, som numeriska vädermodeller, inte alltid är tillförlitliga för detta ändamål, är det viktigt att utforska alternativa metoder. I den här studien undersöks användningen av maskininlärning för att förbättra numeriska prognoser av sikt. Två olika maskininlärningsalgoritmer användes för att post-processera Danmarks Meteorologiska Instituts numeriska vädermodell och de tränades på siktobservationer från 28 olika platser. Resultaten visar att maskininlärnings-metoderna förbättrar den numeriska vädermodellen, med 10 - 30% beroende på hur man mäter. Dock har algoritmerna en liten tendens att förutspå låg sikt för ofta, och båda är bättre på kustnära platser. Den bäst presterande av de två algoritmerna lyckas identifiera förväntade meteorologiska förhållande i samband med låg sikt. Dessutom presenteras en metod för att förbättra förståelsen av de post-processerade modellerna. Men det finns fortfarande utmaningar med att implementera metoden operationellt. Därför föreslås det att framtida studier bland annat undersöker om algoritmerna presterar bättre med fler väderparametrar, hur de presterar på nyaplatser samt att djupare analys av hur de hanterar updateringar till den numeriska vädermodellen görs. Sammanfattningsvis visar studien att maskininlärning är ett lovande verktyg för att förbättra numeriska prognoser av sikt. visibility forecast fog machine learning numerical weather predicition XGBoost Random Forest siktprognos dimma maskininlärning numerisk vädermodell XGBoost Random Forest Meteorology and Atmospheric Sciences Meteorologi och atmosfärforskning
2	Disinformative and Uncertain Data in Global Hydrology : Challenges for Modelling and Regionalisation / Desinformativa och osäkra data i global hydrologi : Utmaningar för modellering och regionalisering Kauffeldt, Anna January 2014 (has links) Water is essential for human well-being and healthy ecosystems, but population growth and changes in climate and land-use are putting increased stress on water resources in many regions. To ensure water security, knowledge about the spatiotemporal distribution of these resources is of great importance. However, estimates of global water resources are constrained by limitations in availability and quality of data. This thesis explores the quality of both observational and modelled data, gives an overview of models used for large-scale hydrological modelling, and explores the possibilities to deal with the scarcity of data by prediction of flow-duration curves. The evaluation of the quality of observational data for large-scale hydrological modelling was based on both hydrographic data, and model forcing and evaluation data for basins worldwide. The results showed that a GIS polygon dataset outperformed all gridded hydrographic products analysed in terms of representation of basin areas. Through a screening methodology based on the long-term water-balance equation it was shown that as many as 8–43% of the basins analysed displayed inconsistencies between forcing (precipitation and potential evaporation) and evaluation (discharge) data depending on how datasets were combined. These data could prove disinformative in hydrological model inference and analysis. The quality of key hydrological variables from a numerical weather prediction model was assessed by benchmarking against observational datasets and by analysis of the internal land-surface water budgets of several different model setups. Long-term imbalances were found between precipitation and evaporation on the global scale and between precipitation, evaporation and runoff on both cell and basin scales. These imbalances were mainly attributed to the data assimilation system in which soil moisture is used as a nudge factor to improve weather forecasts. Regionalisation, i.e. transfer of information from data-rich areas to data-sparse areas, is a necessity in hydrology because of a lack of observed data in many areas. In this thesis, the possibility to predict flow-duration curves in ungauged basins was explored by testing several different methodologies including machine learning. The results were mixed, with some well predicted curves, but many predicted curves exhibited large biases and several methods resulted in unrealistic curves. / Vatten är en förutsättning för människors och ekosystems hälsa, men befolkningsökning och förändringar av klimat och markanvändning förväntas öka trycket på vattenresurserna i många regioner i världen. För att kunna säkerställa en god tillgång till vatten krävs kunskap om hur dessa resurser varierar i tid och rum. Tillförlitligheten hos skattningar av globala vattenresurser begränsas dock både av begränsad tillgänglighet av och kvalitet hos observerade data. Denna avhandling utforskar kvaliteten av såväl observations- som modellbaserade data, ger en överblick över modeller som används för storskalig hydrologisk modellering och utforskar möjligheterna att förutsäga varaktighetskurvor som ett sätt att hantera bristen på data i många områden. Utvärderingen av observationsbaserade datas kvalitet baserades på hydrografiska data och driv- och utvärderingsdata för storskaliga hydrologiska modeller. Resultaten visade att en uppsättning data över hydrografin baserad på GIS-polygoner representerade avrinningsområdesareorna bättre än alla de som byggde på rutor. En metod baserad på långtidsvattenbalansen identifierade att kombinationen av drivdata (nederbörd och potentiell avdunstning) och utvärderingsdata (vattenföring) var fysiskt orimlig för så många som 8–43 % av de analyserade avrinningsområdena beroende på hur olika datauppsättningar kombinerades. Sådana data kan vara desinformativa för slutsatser som dras av resultat från hydrologiska modeller och analyser. Kvaliteten hos hydrologiskt viktiga variabler från en numerisk väderprognosmodell utvärderades dels genom jämförelser med observationsdata och dels genom analys av landytans vattenbudget för ett flertal olika modellvarianter. Resultaten visade obalanser mellan långtidsvärden av nederbörd och avdunstning i global skala och mellan långtidsvärden av nederbörd, avdunstning och avrinning i både modellrute- och avrinningsområdesskala. Dessa obalanser skulle till stor del kunna förklaras av den data assimilering som görs, i vilken markvattenlagret används som en justeringsfaktor för att förbättra väderprognoserna. Regionalisering, som innebär en överföring av information från områden med god tillgång på mätdata till områden med otillräcklig tillgång, är i många fall nödvändig för hydrologisk analys på grund av att mätdata saknas i många områden. I denna avhandling utforskades möjligheten att förutsäga varaktighetskurvor för avrinningsområden utan vattenföringsdata genom flera metoder inklusive maskininlärning. Resultaten var blandade med en del kurvor som förutsas väl, och andra kurvor som visade stora systematiska avvikelser. Flera metoder resulterade i orealistiska kurvor (ickemonotona eller med negativa värden). Data uncertainty Discharge Disinformative data Evaporation Flow-duration curve Global hydrology Neural networks Numerical weather prediction Precipitation Quality control Regionalisation Ungauged basins Water balance Avdunstning dataosäkerhet desinformativa data global hydrologi kvalitetskontroll nederbörd neurala nät numerisk vädermodell regionalisering varaktighetskurva vattenbalans vattenföring

Search results

Improving Visibility Forecasts in Denmark Using Machine Learning Post-processing / Förbättring av siktprognoser i Danmark med hjälp av maskininlärning

Disinformative and Uncertain Data in Global Hydrology : Challenges for Modelling and Regionalisation / Desinformativa och osäkra data i global hydrologi : Utmaningar för modellering och regionalisering