Integrating remotely sensed data into forest resource inventories / The impact of model and variable selection on estimates of precision

Die letzten zwanzig Jahre haben gezeigt, dass die Integration luftgestützter Lasertechnologien (Light Detection and Ranging; LiDAR) in die Erfassung von Waldressourcen
dazu beitragen kann, die Genauigkeit von Schätzungen zu erhöhen. Um diese zu ermöglichen, müssen Feldaten mit LiDAR-Daten kombiniert werden. Diverse Techniken
der Modellierung bieten die Möglichkeit, diese Verbindung statistisch zu beschreiben.
Während die Wahl der Methode in der Regel nur geringen Einfluss auf Punktschätzer
hat, liefert sie unterschiedliche Schätzungen der Genauigkeit.
In der vorliegenden Studie wurde der Einfluss verschiedener Modellierungstechniken und
Variablenauswahl auf die Genauigkeit von Schätzungen untersucht. Der Schwerpunkt
der Arbeit liegt hierbei auf LiDAR Anwendungen im Rahmen von Waldinventuren. Die
Methoden der Variablenauswahl, welche in dieser Studie berücksichtigt wurden, waren
das Akaike Informationskriterium (AIC), das korrigierte Akaike Informationskriterium
(AICc), und das bayesianische (oder Schwarz) Informationskriterium. Zudem wurden
Variablen anhand der Konditionsnummer und des Varianzinflationsfaktors ausgewählt.
Weitere Methoden, die in dieser Studie Berücksichtigung fanden, umfassen Ridge Regression, der least absolute shrinkage and selection operator (Lasso), und der Random
Forest Algorithmus. Die Methoden der schrittweisen Variablenauswahl wurden sowohl
im Rahmen der Modell-assistierten als auch der Modell-basierten Inferenz untersucht.
Die übrigen Methoden wurden nur im Rahmen der Modell-assistierten Inferenz untersucht.
In einer umfangreichen Simulationsstudie wurden die Einflüsse der Art der Modellierungsmethode und Art der Variablenauswahl auf die Genauigkeit der Schätzung von
Populationsparametern (oberirdische Biomasse in Megagramm pro Hektar) ermittelt.
Hierzu wurden fünf unterschiedliche Populationen genutzt. Drei künstliche Populationen
wurden simuliert, zwei weitere basierten auf in Kanada und Norwegen erhobenen Waldinveturdaten. Canonical vine copulas wurden genutzt um synthetische Populationen
aus diesen Waldinventurdaten zu generieren. Aus den Populationen wurden wiederholt
einfache Zufallsstichproben gezogen und für jede Stichprobe wurden der Mittelwert und
die Genauigkeit der Mittelwertschätzung geschäzt. Während für das Modell-basierte
Verfahren nur ein Varianzschätzer untersucht wurde, wurden für den Modell-assistierten
Ansatz drei unterschiedliche Schätzer untersucht.
Die Ergebnisse der Simulationsstudie zeigten, dass das einfache Anwenden von schrittweisen Methoden zur Variablenauswahl generell zur Überschätzung der Genauigkeiten
in LiDAR unterstützten Waldinventuren führt. Die verzerrte Schätzung der Genauigkeiten
war vor allem für kleine Stichproben (n = 40 und n = 50) von Bedeutung.
Für
Stichproben von größerem Umfang (n = 400), war die Überschätzung der Genauigkeit
vernachlässigbar. Gute Ergebnisse, im Hinblick auf Deckungsraten und empirischem
Standardfehler, zeigten Ridge Regression, Lasso und der Random Forest Algorithmus.
Aus den Ergebnissen dieser Studie kann abgeleitet werden, dass die zuletzt genannten
Methoden in zukünftige LiDAR unterstützten Waldinventuren Berücksichtigung finden
sollten.

Identiferoai:union.ndltd.org:uni-goettingen.de/oai:ediss.uni-goettingen.de:11858/00-1735-0000-0022-5FE6-3
Date26 May 2014
CreatorsMundhenk, Philip Henrich
ContributorsKleinn, Christoph Prof. Dr.
Source SetsGeorg-August-Universität Göttingen
LanguageEnglish
Detected LanguageGerman
TypedoctoralThesis

Page generated in 0.0047 seconds