Return to search

Clustering and Random Forest approach in the classification of hydrometeors measured by the Thies Laser Precipitation Monitor

This article, emerged from a bachelor thesis, focuses on the classification
of hydrometeors measured by the Laser Precipitation Monitor by the Adolf Thies GmbH
& Co. KG. The optical disdrometer can classify measurements of hydrometeor size and
fall velocity spectra concerning the precipitation type. The measurement principle of the
disdrometer is explained, as well as the classifications. For reasons of calculation time,
mostly six main precipitation types are considered (drizzle, rain, snow, ice grains, hail,
mixed). It is the goal to understand the process of a reliable classification and to determine
how these classifications are implemented. Therefore, the precipitation measurements
from the measurement field of the Leipzig Institute for Meteorology from 2021 are
used. An analysis of the spectrum consisting of hydrometeor diameter and fall speed
is investigated. Afterwards, two machine learning methods are applied to the dataset.
The classification of each sample through grouping similar samples using cluster analysis
serves as an unsupervised approach and in particular examines the natural clusters present
in the dataset. Contrasting that the purely statistical, nonphysical, supervised Random
Forest method is applied as well. The comparison of the unsupervised and supervised
approach shows that for the classification the supervised method is more promising. / Dieser Artikel konzentriert sich auf die Klassifizierung von Hydrometeoren,
welche durch den Laser Niederschlags Monitor der Adolf Thies GmbH
& Co. KG gemessen werden. Das optische Disdrometer kann die Messungen von
Fallgeschwindigkeits- und Größenspektren der Niederschlagspartikel eigenständig in
Gruppen der Niederschlagsart einsortieren. Das Messprinzip, sowie die Klassifizierungsmechanismen
werden erklärt. Auf Grund der Rechenzeit werden im Rahmen der folgenden
Untersuchungen hauptsächlich die 6 Hauptniederschlagsarten (Niesel, Regen,
Schnee, Eiskörner, Hagel, Gemischt) unterschieden. Das Ziel der Analyse ist es, den
Prozess einer zuverlässigen Klassifizierung zu verstehen und die Möglichkeiten der
Anwendung abzuschätzen. Dafür werden die Niederschlagsdaten der Wetterwiese des
Leipziger Instituts für Meteorologie aus dem Jahr 2021 verwendet. Nach erster grundlegender
Betrachtung des Datensatzes werden zwei verschiedene Machine Learning Methoden
angewendet. Als unüberwachte Methode dient der Ansatz der Clusteranalyse,
welcher alle Samples über Ähnlichkeitskriterien gruppiert und dadurch die natürliche
Gruppierbarkeit eines Datensatzes aufzeigt. Im Gegensatz dazu steht die rein statistische,
unphysikalische Methode des Random Forest mit überwachtem Lernprozess. Im
Vergleich beider Ansätze zeigt sich, dass ein überwachter Machine Learning Methode
zufriedenstellendere Ergebisse erzeugt als unüberwachte Prozesse.

Identiferoai:union.ndltd.org:DRESDEN/oai:qucosa:de:qucosa:88547
Date08 December 2023
CreatorsTrosits, A., Foth, A., Kalesse-Los, H.
PublisherUniversität Leipzig
Source SetsHochschulschriftenserver (HSSS) der SLUB Dresden
LanguageEnglish
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, doc-type:article, info:eu-repo/semantics/article, doc-type:Text
Rightsinfo:eu-repo/semantics/openAccess
Relationurn:nbn:de:bsz:15-qucosa2-881469, qucosa:88146

Page generated in 0.0026 seconds