Spelling suggestions: "subject:"volunteered geographical information"" "subject:"voluenteered geographical information""
31 |
Konzeption und Entwicklung einer E-Learning-Lektion zur Arbeit mit der Kartenherstellungssoftware OCADGoerlich, Franz 14 December 2011 (has links)
In dieser Bachelorarbeit wird eine Beispiel-E-Learning-Lektion zum Import von GPS Daten in die Kartenherstellungssoftware OCAD erstellt. Dabei liegt im theoretischen Teil der Hauptschwerpunkt auf nutzergenerierten Daten (Volunteered Geographic Infor-mation; kurz: VGI). Nach einer kurzen, allgemeinen Einführung wird auf die Bedeutung der Kartographie im Zusammenhang mit VGI eingegangen.
Der zweite Teil beinhaltet Didaktik mit Schwerpunkt E-Learning. Dazu werden das Goal Based Scenario Modell und das Cognitive Apprenticeship Modell kurz vorgestellt und anschließend das Projekt GITTA mit der enthaltenen ECLASS-Struktur näher erklärt.
Den immer wichtiger werdenden Content Management Systemen (CMS) widmet sich der dritte Theorieteil. Für die Realisierung der zu erstellenden Lektion wird das Open-Source CMS Joomla! ausführlicher erläutert.
Die Implementierung beschreibt die Umsetzung der E-Leraning-Lektion mittels Joomla! und die Nutzung des ECLASS-Modells.
Bevor auf die Vorgehensweise eingegangen wird, enthält der Implementierungsteil die Erstellung eines groben Gesamtkonzeptes für eine komplette E-Leraning-Anwendung zu OCAD mit entsprechenden Erläuterungen.
Anschließend folgen eine Zusammenfassung und ein Ausblick über die Weiterführung der E-Learning-Anwendung.:Zusammenfassung III
Aufgabenstellung IV
Abbildungsverzeichnis V
Tabellenverzeichnis V
Abkürzungsverzeichnis VI
Inhaltsverzeichnis VII
Selbständigkeitserklärung IX
1. Einführung 10
1.1 Ziele 11
1.2 Hintergrund 11
2. Nutzergenerierte Daten 13
2.1 Einführung 13
2.2 Nutzergenerierte Daten in der Kartographie 14
2.3 Nutzergenerierte Daten in OCAD 22
3. Didaktik 26
3.1 Allgemeine Bedeutung 26
3.2 Lernen 26
3.3 Lernprozess 27
3.4 Lernen mit digitalen Medien 28
3.5 E-Learning 28
3.5.1 Was ist E-Learning? 28
3.5.2 E-Learning Modelle 29
3.5.3 Vorteile und Nachteile von E-Learning 32
3.6 Das Projekt GITTA 32
3.6.1 Übersicht 32
3.6.2 Entwicklung von Lernmaterialien 33
3.6.3 ECLASS Modell 34
4. Content Management Systeme 35
4.1 Einführung 35
4.2 Definitionen 36
4.3 Eigenschaften von CMS 37
4.4 Ausblick 38
4.5 Joomla! 4.5.1 Einführung 39
4.5.2 Geschichte 39
4.5.3 Versionen 40
4.5.4 Funktionen 41
4.5.5 Aufbau 42
4.5.6 Auswahlkriterien für CMS 43
5. Implementierung 44
5.1 Motivation 44
5.2 Modellerstellung 46
5.3 Wahl der zur Umsetzung nutzbaren Systeme 48
5.3.1 ECLASS-Modell 48
5.3.2 Joomla! 49
5.4 Umsetzung der Lektion in Joomla! 49
5.4.1 Vorbereitungen 50
5.4.2 Konzeptübertragung 51
6. Zusammenfassung 54
6.1 Zusammenfassung der Praktischen Arbeit 54
6.2 Ausblick 55
Literaturverzeichnis LVI
Literaturquellen LVI
Internetquellen LXII
Anhang LXIV
Anhang 1 - Gegenüberstellung ausgewählter kartographischer Funktionalitäten in Adobe Illustrator und OCAD LXV
Anhang 2 - Abdruck der Beispiel E-Learning Lektion LXVII
|
32 |
The Role of Mobility in the Socio-spatial Segregation Assessment with Social Media DataLiu, Qingsong 20 April 2021 (has links)
No description available.
|
33 |
Coalla : Un modèle pour l'édition collaborative d'un contenu géographique et la gestion de sa cohérence / Coalla : a model for collaborative editing and consistency management of geographic contentBrando Escobar, Carmen 05 April 2013 (has links)
La production et la maintenance de contenus géographiques se fait souvent grâce à la mise en commun de contributions diverses. La mise à jour des données de l'IGN s'appuie ainsi sur l'intégration de données de partenaires ou la prise en compte d'alertes d'évolution du terrain. C'est également le cas des contenus libres produits par des projets communautaires comme OpenStreetMap. Un aspect problématique est la gestion de la qualité d'un contenu géographique collaboratif, particulièrement de leur cohérence afin de permettre que des prises de décision s'appuient dessus. Cette cohérence est liée à l'homogénéité de la représentation de l'espace, ainsi qu'à la préservation d'informations importantes non explicites mais qui peuvent être retrouvées sur les entités décrites grâce à leurs géométries. Ce travail de thèse propose un modèle baptisé Coalla pour l'édition collaborative d'un contenu géographique avec gestion de la cohérence. Ce modèle comporte trois contributions : 1) l'identification et la définition des éléments que doit comporter un vocabulaire formel visant à faciliter la construction d'un contenu géographique collaboratif ; 2) un processus d'aide à la construction à la volée d'un vocabulaire formel à partir de spécifications formelles des bases de données IGN et à des vocabulaires collaboratifs existants, et 3) une stratégie d'évaluation et de réconciliation des contributions afin de les intégrer d'une façon cohérente au contenu central. Notre modèle Coalla a été implémenté dans un prototype / Geographic content production and maintenance is often done through a combination of various contributions. Thus, updating IGN geographic data relies on integrating data from partners or by involving field change alerts. This is also the case of free content produced by community projects such as OpenStreetMap. An important problem is quality management of collaboratively produced geographic content, in particular consistency management. This allows for decision-making which is based on this content. Data consistency depends on how homogenous space representation is. Likewise, it depends on preserving important non-explicit information that can be found on the geometries of the entities described in the content. This Thesis proposes a model baptized Coalla for collaborative editing of geographic content with consistency management. The model has three contributions: 1) identifying and defining elements that should be included in a formal vocabulary to facilitate the construction of collaborative geographic content, 2) user assistance process to help users build on the fly a formal vocabulary extracted from formal IGN databases specifications and existing collaborative vocabularies, and 3) a strategy for evaluating and reconciling user contributions in order to coherently integrate them into the content. Our model Coalla has been implemented in a prototype
|
34 |
應用自願性地理資訊於社區物種調查之研究 / Application of Volunteered Geographic Information in Community-based Species Investigation郭芳妤, Kuo, Fang Yu Unknown Date (has links)
台灣擁有豐富而多樣的自然生態資源,而物種調查將有助於維護物種之多樣性與生態平衡。然而,台灣生物多樣性高且分布廣闊,調查工作往往需耗費龐大的人力、物力、經費與時間成本。故本研究採用自願性地理資訊 (volunteered geographic information, VGI) 的方式,鼓勵社區民眾參與社區之物種調查工作。藉由社區民眾對社區當地的瞭解與使命感,有效且快速地蒐集物種調查資料。望社區民眾可經由親身參與物種調查之工作,更加瞭解及關注社區生態環境之現況,體認生態保育及生物多樣性的重要性,提升環境保育意識。
而近年來隨著行動科技的快速發展,智慧型手機與平板電腦等行動裝置日益普及。為使物種調查之工作更加快速且便利,本研究利用多數智慧型行動裝置所擁有的即時定位、無線網路及照相等功能,建置社區物種調查系統App。該App可作為物種調查之工具,並提供適時適地之物種資訊查詢服務。此外,本研究亦透過物種空間資料庫與網際網路地理資訊系統 (WebGIS) 平台之建置,提供社區物種資料分享、管理與分析等服務。 / Taiwan is abundant in ecological resources, and species investigation will contribute to preserve species diversity and ecological balance. However, due to high biodiversity and wide distribution of species in Taiwan, the traditional investigation works cost a lot of money, time, human and material resources. Therefore, this study uses the concept of volunteered geographic information (VGI) to encourage the public to collect field data and to participate in species investigation for local communities. With local knowledge and enthusiasm about the community, residents are capable of collecting species data more effectively and efficiently. On the other hand, through volunteered participation in species investigation, residents will have better understanding about the current status of ecological environment in the community. Thereby the residents can realize the importance of ecological conservation and biodiversity, and promote their awareness of environmental conservation.
With the rapid development of mobile technology in recent years, mobile devices such as smartphones and tablet computers are gaining popularity. In order to make the investigation of species for communities more quickly and conveniently, this study makes use of the functions of most smart mobile devices such as real-time positioning, wireless networking, and digital camera to build a mobile App system for community-based species investigation. The mobile App system can serve as a tool for species investigation, and it also provides with location-based inquiry services timely and efficiently. In addition, Geographic Information System (GIS) is applied to manage the geodatabase, and a WebGIS platform is built to facilitate data sharing and analysis.
|
35 |
Visualizing Point Density on Geometry Objects: Application in an Urban Area Using Social Media VGIZahtila, Moris, Knura, Martin 22 April 2024 (has links)
Point datasets that relate to highly populated places, such as ones retrieved from social media or volunteered geographic information in general, can often result in dense point clusters when presented on maps. Therefore, it can be useful to visualize the relevant point density information directly on the urban geometry to tackle the problem of point counting and density range identification in highly cluttered areas. One solution is to relate each point to the nearest geometry object. While this is a straightforward approach, its major drawback is that local point clusters could disappear by assigning them to larger objects, e.g., long roads. To address this issue, we introduce two new point density visualization approaches by which points are related to the underlying geometry objects. In this process, we use grid cells and heatmap contour lines to divide roads, squares, and pedestrian zones into subgeometry units. Comparison of our visualization approaches with conventional density visualization methods shows that our approaches provide a more comprehensive insight into the point distribution over space, i.e., over existing urban geometry. / Wenn Punktdatensätze, die sich auf dicht bevölkerte Räume beziehen – beispielsweise räumliche Daten aus Sozialen Medien oder von VGI-Plattformen – auf Karten dargestellt werden, kommt es häufig zu dichten Punktclustern, was Aussagen über die Anzahl der Punkte oder die Intensität der Punktdichte an bestimmten Orten schwierig bis unmöglich macht. Daher kann es nützlich sein, relevante Informationen über die Punktdichte direkt mit Bezug zu urbanen Geometrien zu visualisieren. Eine Lösung besteht darin, jeden Punkt dem nächstgelegenen Geometrieobjekt zuzuordnen. Ein großer Nachteil dieses Ansatzes ist jedoch, dass lokale Punktcluster verschwinden könnten, indem sie größeren Objekten, z. B. langen Straßen, zugewiesen werden. Um dieses Problem zu lösen, werden zwei neue Ansätze zur Visualisierung der Punktdichte eingeführt, bei denen die Punkte mit den urbanen Geometrieobjekten in Beziehung gesetzt werden, lokale räumliche Eigenschaften jedoch erhalten bleiben. Dafür werden Straßen, Plätze und Fußgängerzonen mithilfe von Rasterzellen und Konturlinien von Kerndichteschätzungen in Teilgeometrieeinheiten unterteilt. Der Vergleich dieser Visualisierungsansätze mit herkömmlichen Dichtevisualisierungsmethoden zeigt, dass die vorgestellten Ansätze einen detaillierteren Einblick in die räumliche Punktverteilung mit Bezug zur bestehenden urbanen Geometrie liefern können.
|
36 |
Zur Beziehung von Raum und Inhalt nutzergenerierter geographischer InformationenHahmann, Stefan 21 July 2014 (has links) (PDF)
In the last ten years there has been a significant progress of the World Wide Web, which evolved to become the so-called “Web 2.0”. The most important feature of this new quality of the WWW is the participation of the users in generating contents. This trend facilitates the formation of user communities which collaborate on diverse projects, where they collect and publish information. Prominent examples of such projects are the online-encyclopedia “Wikipedia”, the microblogging-platform “Twitter”, the photo-platform “Flickr” and the database of topographic information “OpenStreetMap”.
User-generated content, which is directly or indirectly geospatially referenced, is of-ten termed more specifically as “volunteered geographic information”. The geospatial reference of this information is constituted either directly by coordinates that are given as meta-information or indirectly through georeferencing of toponyms or addresses that are contained in this information.
Volunteered geographic information is particularly suited for research, as it can be accessed with low or even at no costs at all. Furthermore it reflects a variety of human decisions which are linked to geographic space. In this thesis, the relationship of space and content of volunteered geographic information is investigated from two different perspectives.
The first part of this thesis addresses the question for which share of information there exists a relationship between space and content of the information, such that the information is locatable in geospace. In this context, the assumption that about 80% of all information has a reference to space has been well known within the community of geographic information system users. Since the 1980s it has served as a marketing tool within the whole geoinformation sector, although there has not been any empirical evidence. This thesis contributes to fill this research gap.
For the validation of the ‘80%-hypothesis’ two approaches are presented. The first approach is based on a corpus of information that is as representative as possible for world knowledge. For this purpose the German language edition of Wikipedia has been selected. This corpus is modeled as a network of information where the articles are considered the nodes and the cross references are considered the edges of a directed graph. With the help of this network a graduated definition of geospatial references is possible. It is implemented by computing the distance of each article to its closest article within the network that is assigned with spatial coordinates. Parallel to this, a survey-based approach is developed where participants have the task to assign pieces of information to one of the categories “direct geospatial reference”, “indirect geospatial reference” and “no geospatial reference”. A synthesis of both approaches leads to an empirically justified figure for the “80%-assertion”. The result of the investigation is that for the corpus of Wikipedia 27% of the information may be categorized as directly geospatially referenced and 30% of the information may be categorized as indirectly geospatially referenced.
In the second part of the thesis the question is investigated in how far volunteered geographic information that is produced on mobile devices is related to the locations where it is published. For this purpose, a collection of microblogging-texts produced on mobile devices serve as research corpus. Microblogging-texts are short texts that are published via the World Wide Web. For this type of information the relationship be-tween the content of the information and their position is less obvious than e.g. for topographic information or photo descriptions.
The analysis of microblogging-texts offers new possibilities for market and opinion research, the monitoring of natural events and human activities as well as for decision support in disaster management. The spatial analysis of the texts may add extra value. In fact for some of the applications the spatial analysis is a necessary condition. For this reason, the investigation of the relationship of the published contents with the locations where they are generated is of interest.
Within this thesis, methods are described that support the investigation of this relationship. In the presented approach, classified Points of Interest serve as a model for the environment. For the purpose of the investigation of the correlation between these points and the microblogging-texts, manual classification and natural language processing are used in order to classify these texts according to their relevance in regard to the respective feature classes. Subsequently, it is tested whether the share of relevant texts in the proximity of objects of the tested classes is above average. The results of the investigation show that the strength of the location-content-correlation depends on the tested feature class. While for the feature classes ‘train station’, ‘airport’ and ‘restaurant’ a significant dependency of the share of relevant texts on the distance to the respective objects may be observed, this is not confirmed for objects of other feature classes, such as ‘cinema’ and ‘supermarket’. However, as prior research that describes investigations on small cartographic scale has detected correlations between space and content of microblogging-texts, it can be concluded that the strength of the correlation between space and content of microblogging-texts depends on scale and topic. / Während der vergangenen zehn Jahre vollzog sich eine signifikante Veränderung des World Wide Webs, das sich zum sogenannten „Web 2.0“ entwickelte. Das wesentlichste Merkmal dieser neuen Qualität des WWW ist die Beteiligung der Nutzer bei der Erstellung der Inhalte. Diese Entwicklung fördert das Entstehen von Nutzergemeinschaften, die kollaborativ in unterschiedlichsten Projekten Informationen sammeln und veröffentlichen. Prominente Beispiele für solche Projekte sind die Online-Enzyklopädie „Wikipedia“, die Microblogging-Plattform „Twitter“, die Foto-Plattform „Flickr“ und die Sammlung topographischer Informationen „OpenStreetMap“.
Nutzergenerierte Inhalte, die direkt oder indirekt raumbezogen sind, können spezifischer als „nutzergenerierte geographische Informationen“ bezeichnet werden. Der Raumbezug dieser Informationen entsteht entweder direkt durch die Angabe räumlicher Koordinaten als Metainformationen oder er kann indirekt durch die Georeferenzierung von in den Informationen enthaltenen Toponymen oder Adressen hergestellt werden.
Nutzergenerierte geographische Informationen haben für die Forschung den besonderen Vorteil, dass sie einerseits häufig gänzlich ohne oder nur mit geringen Kosten verfügbar gemacht werden können und andererseits eine Vielzahl von menschlichen Entscheidungen widerspiegeln, die mit dem Raum verknüpft sind. In der vorliegenden Dissertation wird die Beziehung von Raum und Inhalt nutzergenerierter geographischer Informationen aus zwei Perspektiven untersucht.
Im ersten Teil der Arbeit steht die Frage im Vordergrund, für welchen Anteil an Informationen eine Beziehung zwischen Raum und Informationsinhalt in der Art besteht, dass die Informationen im Georaum lokalisierbar sind. In diesem Zusammenhang existiert seit den 1980er Jahren die unter Nutzern von geographischen Informationssystemen weit verbreitete These, dass 80% aller Informationen einen Raumbezug haben. Diese These dient im gesamten Spektrum der Branche als Marketinginstrument, ist jedoch nicht empirisch belegt. Diese Arbeit trägt dazu bei, die bestehende Forschungslücke zu schließen.
Für die Prüfung dieser These, die in der Arbeit als „Raumbezugshypothese“ bezeichnet wird, werden zwei Ansätze vorgestellt. Der erste Ansatz basiert auf der Analyse eines möglichst repräsentativen Informationskorpus, wofür die deutsche Sprachversion der Wikipedia ausgewählt wird. Diese wird als Informationsnetzwerk modelliert, indem deren Artikel als Knoten und deren interne Querverweise als Kanten eines gerichteten Graphen betrachtet werden. Mit Hilfe dieses Netzwerkes ist es möglich eine abgestufte Definition des Raumbezuges von Informationen einzuführen, indem die Entfernung jedes Artikels innerhalb des Netzwerkes zum jeweils nächstgelegenen Artikel, der mit räumlichen Koordinaten gekennzeichnet ist, berechnet wird. Parallel dazu wird ein Befragungsansatz entwickelt, bei dem Probanden die Aufgabe haben, Informationen in die Kategorien „Direkter Raumbezug“, „Indirekter Raumbezug“ und „Kein Raumbezug“ einzuordnen. Die Synthese beider Ansätze führt zu einer empirisch begründeten Zahl für die „Raumbezugsthese“. Das Ergebnis ist, dass für das Untersuchungskorpus Wikipedia 27% der Informationen als direkt raumbezogenen und 30% der Informationen als indirekt raumbezogen kategorisiert werden können.
Im zweiten Teil der Arbeit wird die Forschungsfrage untersucht, inwiefern nutzergenerierte Informationen, die über mobile Geräte erzeugt werden, in Beziehung zu den Orten stehen, an denen sie veröffentlicht werden. Als Forschungskorpus dienen mobil verfasste Microblogging-Texte. Dies sind kurze Texte, die über das WWW veröffentlicht werden. Bei dieser Informationsart liegt im Gegensatz zu beispielsweise topographischen Information oder Fotobeschreibungen die Vermutung eines starken Zusammenhanges zwischen dem Inhalt der Informationen und deren Positionen nicht nahe.
Die Analyse von Microblogging-Texten bietet unter anderem Potential für die Markt- und Meinungsforschung, die Beobachtung von Naturereignissen und menschlichen Aktivitäten sowie die Entscheidungsunterstützung in Katastrophenfällen. Aus der räumlichen Auswertung kann sich dabei ein Mehrwert ergeben, für einen Teil der Anwendungen ist die räumliche Auswertung sogar die notwendige Voraussetzung. Aus diesem Grund ist die Erforschung des Zusammenhanges der veröffentlichten Inhalte mit den Orten, an denen diese entstehen, von Interesse.
In der Arbeit werden eine Methoden vorgestellt, mit deren Hilfe die Untersuchung dieser Korrelation am Beispiel von klassifizierten Points of Interest durchgeführt wird. Zu diesem Zweck werden die Texte mit Hilfe von manueller Klassifikation und maschineller Sprachverarbeitung entsprechend ihrer Relevanz für die getesteten Objektklassen klassifiziert. Anschließend wird geprüft, ob der Anteil der relevanten Texte in der Nähe von Objekten der getesteten Klassen überdurchschnittlich hoch ist. Die Ergebnisse der Untersuchungen zeigen, dass die Stärke der Raum-Inhalt-Korrelation von den getesteten Objektklassen abhängig ist. Während sich beispielsweise bei Bahnhöfen, Flughäfen und Restaurants eine deutliche Abhängigkeit des Anteils der relevanten Texte von der Entfernung zu den betreffenden Objekten zeigt, kann dies für andere Objektklassen, wie z.B. Kino oder Supermarkt nicht bestätigt werden. Da frühere Forschungsarbeiten bei der Analyse im kleinmaßstäbigen Bereich eine Korrelation der Informationsinhalte mit deren Entstehungsorten feststellten, kann geschlussfolgert werden, dass der Zusammenhang zwischen Raum und Inhalt bei Microblogging-Texten sowohl vom Maßstab als auch vom Thema abhängig ist.
|
37 |
應用開放源碼WebGIS於社區資源管理之研究 / Application of open source WebGIS in community resources management單勇恩 Unknown Date (has links)
國內許多社區擁有豐富的自然及人文資源,為了有效促進經濟發展與促使遊客了解社區環境資源,部分組織體系較完整的社區,已陸續展開社區發展規劃工作,鼓勵社區民眾共同參與社區林業經營與環境資源管理等工作。對於社區資源管理方面,如何將社區內各項資源進行有效地規劃與適當地呈現,以及與其他不同社區之間的資源資料整合,皆為當前主要面臨的課題之一。為考量社區的經濟條件限制,本研究利用低成本的開放源碼(Open Source)軟體如Django和QGIS (Quantum GIS),及網路上提供的免費軟體Google Earth,搭配空間資訊科技輔助資料蒐集,建構出社區資源之地理空間資料庫,並建立一套完整的網際網路地理資訊系統WebGIS (Web-based GIS)平台,提供使用者可經由操作網頁方式進行資料分享、管理及分析等服務。並結合MapServer、Google Maps API (Application Programming Interface)、Openlayers API與JavaScript設計動態網頁,讓社區和一般使用者可以透過地圖互動方式與相關地理資料的多樣化呈現以了解社區之各項資源,且促使社區管理者更有效進行資源規劃及提高生態旅遊之效益;同時融入公眾參與地理資訊系統(Public Participation Geographic Information Systems, PPGIS)的理念,鼓勵共同參與資源管理,於網站上加入討論與分享機制,進而擴大居民參與社區資源規劃討論的空間。研究成果顯示,利用GPS軌跡記錄器可於低成本的條件下,幫助環境資源等資料的收集;本研究舉辦數次的教育訓練以及觀察社區居民的學習情形,證實利用WebGIS平台的簡易操作,能促使社區中不同的使用者願意分享各自擁有的資料,發揮自發性地理資訊(Volunteered geographic information, VGI)的精神。且藉由公眾參與的方式,將能獲得更多不同來源的圖資或社區資源相關資料,以強化系統的資料庫內容。此外,透過各種豐富圖資瀏覽與空間分析工具,更有利於社區資源管理與決策分析之應用。 / Many local communities have a wealth of natural and humanistic resources. In order to effectively promote economic development and let more tourists know the environmental resources of the community, some more well-organized communities have launched community development planning to encourage local people to participate in community forestry and environmental resources management work. For community resources management, the most important issue is how to manage and present various community resources effectively, and to integrate resource data collected by different communities. Considering the economic constraint of community, this study used low-cost open source software such as Django and QGIS (Quantum GIS), and free software such as Google Earth, and spatial information technologies to collect data and establish geospatial database of community resources. Moreover, a WebGIS (Web-based GIS) platform was built to provide users with various services including data sharing, management, and analysis. By combining MapServer, Google Maps API (Application Programming Interface), Openlayers API, and JavaScript dynamic web pages, the system let users understand the resources of the community through a diverse display of interactive electronic maps and related geographic information. It also enables the community manager to carry out resource planning more effectively, and promotes benefits of ecotourism. In addition, the system incorporates the concept of PPGIS (Public Participation Geographic Information Systems) by adding functionalities of discussion and information sharing so as to encourage public involvement in resource management, and facilitate residents to participate in the discussion of resource planning. The results show that, GPS tracking devices can assist in collecting community resources data with low cost and high efficiency. By observing the activities of community residents after several training workshops, this research proves that WebGIS platform can facilitate different users of the community to voluntarily share their own data, which conforms to the spirit of VGI (Volunteered geographic information). With public participation, the geodatabase can effectively incorporate more data about the community resources from different sources. Furthermore, the geodatabase and spatial analysis tools will be helpful for decision-making on community resources management.
|
38 |
Zur Beziehung von Raum und Inhalt nutzergenerierter geographischer InformationenHahmann, Stefan 12 June 2014 (has links)
In the last ten years there has been a significant progress of the World Wide Web, which evolved to become the so-called “Web 2.0”. The most important feature of this new quality of the WWW is the participation of the users in generating contents. This trend facilitates the formation of user communities which collaborate on diverse projects, where they collect and publish information. Prominent examples of such projects are the online-encyclopedia “Wikipedia”, the microblogging-platform “Twitter”, the photo-platform “Flickr” and the database of topographic information “OpenStreetMap”.
User-generated content, which is directly or indirectly geospatially referenced, is of-ten termed more specifically as “volunteered geographic information”. The geospatial reference of this information is constituted either directly by coordinates that are given as meta-information or indirectly through georeferencing of toponyms or addresses that are contained in this information.
Volunteered geographic information is particularly suited for research, as it can be accessed with low or even at no costs at all. Furthermore it reflects a variety of human decisions which are linked to geographic space. In this thesis, the relationship of space and content of volunteered geographic information is investigated from two different perspectives.
The first part of this thesis addresses the question for which share of information there exists a relationship between space and content of the information, such that the information is locatable in geospace. In this context, the assumption that about 80% of all information has a reference to space has been well known within the community of geographic information system users. Since the 1980s it has served as a marketing tool within the whole geoinformation sector, although there has not been any empirical evidence. This thesis contributes to fill this research gap.
For the validation of the ‘80%-hypothesis’ two approaches are presented. The first approach is based on a corpus of information that is as representative as possible for world knowledge. For this purpose the German language edition of Wikipedia has been selected. This corpus is modeled as a network of information where the articles are considered the nodes and the cross references are considered the edges of a directed graph. With the help of this network a graduated definition of geospatial references is possible. It is implemented by computing the distance of each article to its closest article within the network that is assigned with spatial coordinates. Parallel to this, a survey-based approach is developed where participants have the task to assign pieces of information to one of the categories “direct geospatial reference”, “indirect geospatial reference” and “no geospatial reference”. A synthesis of both approaches leads to an empirically justified figure for the “80%-assertion”. The result of the investigation is that for the corpus of Wikipedia 27% of the information may be categorized as directly geospatially referenced and 30% of the information may be categorized as indirectly geospatially referenced.
In the second part of the thesis the question is investigated in how far volunteered geographic information that is produced on mobile devices is related to the locations where it is published. For this purpose, a collection of microblogging-texts produced on mobile devices serve as research corpus. Microblogging-texts are short texts that are published via the World Wide Web. For this type of information the relationship be-tween the content of the information and their position is less obvious than e.g. for topographic information or photo descriptions.
The analysis of microblogging-texts offers new possibilities for market and opinion research, the monitoring of natural events and human activities as well as for decision support in disaster management. The spatial analysis of the texts may add extra value. In fact for some of the applications the spatial analysis is a necessary condition. For this reason, the investigation of the relationship of the published contents with the locations where they are generated is of interest.
Within this thesis, methods are described that support the investigation of this relationship. In the presented approach, classified Points of Interest serve as a model for the environment. For the purpose of the investigation of the correlation between these points and the microblogging-texts, manual classification and natural language processing are used in order to classify these texts according to their relevance in regard to the respective feature classes. Subsequently, it is tested whether the share of relevant texts in the proximity of objects of the tested classes is above average. The results of the investigation show that the strength of the location-content-correlation depends on the tested feature class. While for the feature classes ‘train station’, ‘airport’ and ‘restaurant’ a significant dependency of the share of relevant texts on the distance to the respective objects may be observed, this is not confirmed for objects of other feature classes, such as ‘cinema’ and ‘supermarket’. However, as prior research that describes investigations on small cartographic scale has detected correlations between space and content of microblogging-texts, it can be concluded that the strength of the correlation between space and content of microblogging-texts depends on scale and topic.:1 Einleitung 1
1.1 Motivation 1
1.1.1 Bedeutung raumbezogener nutzergenerierter Inhalte für die geographische Informationswissenschaft und die Kartographie 1
1.1.2 Die Raumbezugshypothese 3
1.1.3 Die Korrelation von Ort und Inhalt bei nutzergenerierten Inhalten 4
1.2 Forschungsziele und Forschungsfragen 5
1.2.1 Prüfung der Raumbezugshypothese 5
1.2.2 Untersuchung der Korrelation von Ort und Inhalt von nutzergenerierten Inhalten 6
1.3 Aufbau der Arbeit 7
1.3.1 Die Beziehung zwischen Raum und Inhalt von nutzergenerierten geographischen Informationen 7
1.3.2 Gliederung der Arbeit 7
1.3.3 Verwendete Publikationen 8
2 Forschungsstand 11
2.1 Relevante Begriffe 11
2.1.1 Web 2.0 11
2.1.2 User Generated Content / Nutzergenerierte Inhalte 12
2.1.2.1 Bedeutung und Begriffsherkunft 12
2.1.2.2 Begriffsklärung 12
2.1.2.3 Arten von UGC 13
2.1.2.4 Kritik 14
2.1.2.5 Forschungspotential 14
2.1.3 Raumbezug 14
2.1.3.1 Der Begriff ‚Raumbezug‘ in der Fachliteratur 14
2.1.3.2 Kategorien des Georaumbezuges 16
2.1.4 Georäumlich 16
2.1.5 Geographische Information und Geodaten 17
2.1.5.1 Begriffsklärung 17
2.1.5.2 Points of Interest als Spezialfall 19
2.1.6 Volunteered Geographic Information / Nutzergenerierte geographische Informationen 19
2.1.6.1 Begriffsherkunft und Charakteristika von VGI 19
2.1.6.2 Das Konzept der menschlichen Sensoren 20
2.1.6.3 Kommunikation geographischer Informationen bei VGI 21
2.1.6.4 Der Mehrwert von VGI 21
2.1.6.5 Motive der Beitragenden 22
2.1.6.6 VGI im globalen Kontext 22
2.1.6.7 Erfassung der Informationen: partizipativ vs. opportunistisch 23
2.1.6.8 Formale Definition 23
2.1.6.9 Deutsche Entsprechung des Begriffs 24
2.1.7 Semantik nutzergenerierter geographischer Informationen 25
2.1.7.1 Strukturierte Form 25
2.1.7.2 Unstrukturierte Form 26
2.2 Arten nutzergenerierter geographischer Informationen 26
2.2.1 Topographische Informationen – OpenStreetMap 28
2.2.1.1 Korpusbeschreibung 28
2.2.1.2 Forschungsüberblick 30
2.2.1.3 Raumbezug 32
2.2.2 Enzyklopädische Informationen – Wikipedia 34
2.2.2.1 Korpusbeschreibung 34
2.2.2.2 Forschungsüberblick 35
2.2.2.3 Raumbezug 36
2.2.2.4 Metaeigenschaften von Artikeln der deutschen Wikipedia 37
2.2.3 Microblogging-Texte – Twitter 39
2.2.3.1 Korpusbeschreibung 39
2.2.3.2 Forschungsüberblick 41
2.2.3.3 Raumbezug 42
2.2.4 Bilder und Bildmetainformationen – Flickr, Instagram, Picasa, Panoramio, Geograph 43
2.2.4.1 Korpusbeschreibung 43
2.2.4.2 Forschungsüberblick 45
2.3 Informationen und Netzwerke 46
2.3.1 Beispiele für Netzwerkstrukturen 46
2.3.2 Implikationen vernetzter Informationen für die Raumbezugshypothese 47
2.3.3 Netzwerkeigenschaften der Wikipedia 47
2.4 Geographische Informationen und Kognition 49
2.5 Informationen klassifizieren durch maschinelle Sprachverarbeitung 50
2.5.1 Naive Bayes 51
2.5.2 Maximum Entropy 51
2.5.3 Support Vector Machines 52
3 Methoden und Ergebnisse 53
3.1 Korpusanalytischer Ansatz für die Prüfung der Raumbezugshypothese 53
3.1.1 Netzwerkgrad des Georaumbezuges 53
3.1.2 Datenprozessierung 56
3.1.3 Ergebnisse der NGGR-Berechnung 57
3.1.4 Korrelation zwischen NGGR und den Eigenschaften von Wikipedia-Artikeln 60
3.2 Befragungsansatz für die Prüfung der Raumbezugshypothese 65
3.2.1 Kategorisierungsaufgabe zur Untersuchung des Georaumbezuges 65
3.2.1.1 Material 66
3.2.1.2 Prozedur 66
3.2.1.3 Teilnehmer 67
3.2.2 Hypothesen 68
3.2.3 Daten zur Beteiligung an der Befragung 68
3.2.4 Ergebnisse 70
3.3 Synthese von korpusanalytischem Ansatz und Befragungsansatz für die Prüfung der Raumbezugshypothese 71
3.3.1 Methodik 71
3.3.2 Ergebnisse 72
3.3.3 Einfluss des Faktors Wissen auf die Ergebnisse der Befragung 73
3.3.4 Einfluss des fachlichen Hintergrundes auf die Ergebnisse der Befragung 74
3.3.5 Prädiktion des Anteils raumbezogener Informationen für das gesamte Korpus der deutschen Wikipedia 76
3.4 Klassifikation nutzergenerierter geographischer Informationen hinsichtlich der Korrelation Ort-Inhalt am Beispiel von mobil verfassten Microblogging-Texten 77
3.4.1 Manuelle Textklassifikation 78
3.4.2 Überwachte maschinelle Textklassifikation mit manuell klassifizierten Trainingsdaten 80
3.4.2.1 Vorverarbeitung der Microblogging-Texte 81
3.4.2.2 Evaluation der Ergebnisse der maschinellen Textklassifikation 82
3.4.2.3 Tuning der maschinellen Klassifikation 83
3.4.3 Überwachte maschinelle Textklassifikation mit lexikalischen Trainingsdaten 83
3.4.4 Verwendete Daten 86
3.4.4.1 Aufzeichnung von mobilen Microblogging-Texten mit der Twitter-Streaming-API 86
3.4.4.2 Filterung verwendbarer Microblogging-Texte 87
3.4.4.3 Zeitliche und räumliche Muster der Microblogging-Texte 89
3.4.4.4 Verwendete Points of Interest 91
3.4.5 Ergebnisse 92
3.4.5.1 Manuelle Annotation von Texten 92
3.4.5.2 Überwachte maschinelle Klassifikation von Texten mit manuell klassifizierten Trainingsdaten 95
3.4.5.3 Überwachte maschinelle Klassifikation von Texten mit lexikalischen Trainingsdaten 99
3.5 Bestimmung der Entfernungsabhängigkeit des Anteils von für spezifische Orte relevanten Informationen am Beispiel von mobil verfassten Microblogging-Texten 103
3.5.1 Methodik 103
3.5.2 Ergebnisse 104
4 Diskussion 111
4.1 Methoden zur Prüfung der Raumbezugshypothese am Beispiel des Korpus Wikipedia 111
4.1.1 Wahl des Korpus 111
4.1.2 Abstraktes Konzept und Instanz 112
4.1.3 Korpusanalytischer Ansatz 112
4.1.4 Befragungsansatz 114
4.2 Methoden zur Bestimmung der Korrelation Ort-Inhalt von nutzergenerierten Informationen am Beispiel von mobil erzeugten Microblogging-Texten 115
4.2.1 Manuelle Klassifikation 116
4.2.2 Überwachte maschinelle Klassifikation mit manuell klassifizierten Trainingsdaten 117
4.2.3 Unüberwachte maschinelle Klassifikation mit lexikalischen Trainingsdaten 118
4.2.4 Berechnung der Entfernungsabhängigkeit des Anteils ortsbezogener Texte 119
4.2.5 Points of Interest als Modell für den räumlichen Kontext 120
4.3 Der Begriff ‚Raumbezug‘ im Kontext von nutzergenerierten geographischen Informationen 120
5 Schlussfolgerungen und Forschungsausblick 123
5.1 Beantwortung der Forschungsfragen 123
5.1.1 Zur Überprüfung der Raumbezugshypothese 123
5.1.2 Zur Korrelation von Ort und Inhalt von nutzergenerierten geographischen Informationen 125
5.2 Implikationen der Forschungsergebnisse 128
5.3 Forschungsausblick nutzergenerierte geographische Informationen 130
5.3.1 Qualität von VGI 130
5.3.2 Synthese von VGI mit amtlichen Daten 132
5.3.3 Weitere aktuelle Entwicklungen im Bereich VGI-Forschung 132
6 Literaturverzeichnis 135
7 Anhang 151
Anhang A Dokumentation des „Experiments Geoaumbezug“ 152
Anhang B Ergebnisse der Kategorisierungsaufgabe des „Experiments Georaumbezug“ 157
Anhang C Rückmeldungen der Teilnehmer des „Experiments Georaumbezug“ 163
Anhang D Einfluss der Faktoren fachlicher Hintergrund und Wissen auf die Kategorisierung von Begriffen hinsichtlich ihrer Georäumlichkeit 166
Anhang E Ergebnisse der manuellen Klassifikation der Microblogging-Texte 168
Anhang F Klassifikationsmodelle resultierend aus manuellen und lexikalischen Trainingsdaten 177
Anhang G Forschungsdaten-Anhang 181 / Während der vergangenen zehn Jahre vollzog sich eine signifikante Veränderung des World Wide Webs, das sich zum sogenannten „Web 2.0“ entwickelte. Das wesentlichste Merkmal dieser neuen Qualität des WWW ist die Beteiligung der Nutzer bei der Erstellung der Inhalte. Diese Entwicklung fördert das Entstehen von Nutzergemeinschaften, die kollaborativ in unterschiedlichsten Projekten Informationen sammeln und veröffentlichen. Prominente Beispiele für solche Projekte sind die Online-Enzyklopädie „Wikipedia“, die Microblogging-Plattform „Twitter“, die Foto-Plattform „Flickr“ und die Sammlung topographischer Informationen „OpenStreetMap“.
Nutzergenerierte Inhalte, die direkt oder indirekt raumbezogen sind, können spezifischer als „nutzergenerierte geographische Informationen“ bezeichnet werden. Der Raumbezug dieser Informationen entsteht entweder direkt durch die Angabe räumlicher Koordinaten als Metainformationen oder er kann indirekt durch die Georeferenzierung von in den Informationen enthaltenen Toponymen oder Adressen hergestellt werden.
Nutzergenerierte geographische Informationen haben für die Forschung den besonderen Vorteil, dass sie einerseits häufig gänzlich ohne oder nur mit geringen Kosten verfügbar gemacht werden können und andererseits eine Vielzahl von menschlichen Entscheidungen widerspiegeln, die mit dem Raum verknüpft sind. In der vorliegenden Dissertation wird die Beziehung von Raum und Inhalt nutzergenerierter geographischer Informationen aus zwei Perspektiven untersucht.
Im ersten Teil der Arbeit steht die Frage im Vordergrund, für welchen Anteil an Informationen eine Beziehung zwischen Raum und Informationsinhalt in der Art besteht, dass die Informationen im Georaum lokalisierbar sind. In diesem Zusammenhang existiert seit den 1980er Jahren die unter Nutzern von geographischen Informationssystemen weit verbreitete These, dass 80% aller Informationen einen Raumbezug haben. Diese These dient im gesamten Spektrum der Branche als Marketinginstrument, ist jedoch nicht empirisch belegt. Diese Arbeit trägt dazu bei, die bestehende Forschungslücke zu schließen.
Für die Prüfung dieser These, die in der Arbeit als „Raumbezugshypothese“ bezeichnet wird, werden zwei Ansätze vorgestellt. Der erste Ansatz basiert auf der Analyse eines möglichst repräsentativen Informationskorpus, wofür die deutsche Sprachversion der Wikipedia ausgewählt wird. Diese wird als Informationsnetzwerk modelliert, indem deren Artikel als Knoten und deren interne Querverweise als Kanten eines gerichteten Graphen betrachtet werden. Mit Hilfe dieses Netzwerkes ist es möglich eine abgestufte Definition des Raumbezuges von Informationen einzuführen, indem die Entfernung jedes Artikels innerhalb des Netzwerkes zum jeweils nächstgelegenen Artikel, der mit räumlichen Koordinaten gekennzeichnet ist, berechnet wird. Parallel dazu wird ein Befragungsansatz entwickelt, bei dem Probanden die Aufgabe haben, Informationen in die Kategorien „Direkter Raumbezug“, „Indirekter Raumbezug“ und „Kein Raumbezug“ einzuordnen. Die Synthese beider Ansätze führt zu einer empirisch begründeten Zahl für die „Raumbezugsthese“. Das Ergebnis ist, dass für das Untersuchungskorpus Wikipedia 27% der Informationen als direkt raumbezogenen und 30% der Informationen als indirekt raumbezogen kategorisiert werden können.
Im zweiten Teil der Arbeit wird die Forschungsfrage untersucht, inwiefern nutzergenerierte Informationen, die über mobile Geräte erzeugt werden, in Beziehung zu den Orten stehen, an denen sie veröffentlicht werden. Als Forschungskorpus dienen mobil verfasste Microblogging-Texte. Dies sind kurze Texte, die über das WWW veröffentlicht werden. Bei dieser Informationsart liegt im Gegensatz zu beispielsweise topographischen Information oder Fotobeschreibungen die Vermutung eines starken Zusammenhanges zwischen dem Inhalt der Informationen und deren Positionen nicht nahe.
Die Analyse von Microblogging-Texten bietet unter anderem Potential für die Markt- und Meinungsforschung, die Beobachtung von Naturereignissen und menschlichen Aktivitäten sowie die Entscheidungsunterstützung in Katastrophenfällen. Aus der räumlichen Auswertung kann sich dabei ein Mehrwert ergeben, für einen Teil der Anwendungen ist die räumliche Auswertung sogar die notwendige Voraussetzung. Aus diesem Grund ist die Erforschung des Zusammenhanges der veröffentlichten Inhalte mit den Orten, an denen diese entstehen, von Interesse.
In der Arbeit werden eine Methoden vorgestellt, mit deren Hilfe die Untersuchung dieser Korrelation am Beispiel von klassifizierten Points of Interest durchgeführt wird. Zu diesem Zweck werden die Texte mit Hilfe von manueller Klassifikation und maschineller Sprachverarbeitung entsprechend ihrer Relevanz für die getesteten Objektklassen klassifiziert. Anschließend wird geprüft, ob der Anteil der relevanten Texte in der Nähe von Objekten der getesteten Klassen überdurchschnittlich hoch ist. Die Ergebnisse der Untersuchungen zeigen, dass die Stärke der Raum-Inhalt-Korrelation von den getesteten Objektklassen abhängig ist. Während sich beispielsweise bei Bahnhöfen, Flughäfen und Restaurants eine deutliche Abhängigkeit des Anteils der relevanten Texte von der Entfernung zu den betreffenden Objekten zeigt, kann dies für andere Objektklassen, wie z.B. Kino oder Supermarkt nicht bestätigt werden. Da frühere Forschungsarbeiten bei der Analyse im kleinmaßstäbigen Bereich eine Korrelation der Informationsinhalte mit deren Entstehungsorten feststellten, kann geschlussfolgert werden, dass der Zusammenhang zwischen Raum und Inhalt bei Microblogging-Texten sowohl vom Maßstab als auch vom Thema abhängig ist.:1 Einleitung 1
1.1 Motivation 1
1.1.1 Bedeutung raumbezogener nutzergenerierter Inhalte für die geographische Informationswissenschaft und die Kartographie 1
1.1.2 Die Raumbezugshypothese 3
1.1.3 Die Korrelation von Ort und Inhalt bei nutzergenerierten Inhalten 4
1.2 Forschungsziele und Forschungsfragen 5
1.2.1 Prüfung der Raumbezugshypothese 5
1.2.2 Untersuchung der Korrelation von Ort und Inhalt von nutzergenerierten Inhalten 6
1.3 Aufbau der Arbeit 7
1.3.1 Die Beziehung zwischen Raum und Inhalt von nutzergenerierten geographischen Informationen 7
1.3.2 Gliederung der Arbeit 7
1.3.3 Verwendete Publikationen 8
2 Forschungsstand 11
2.1 Relevante Begriffe 11
2.1.1 Web 2.0 11
2.1.2 User Generated Content / Nutzergenerierte Inhalte 12
2.1.2.1 Bedeutung und Begriffsherkunft 12
2.1.2.2 Begriffsklärung 12
2.1.2.3 Arten von UGC 13
2.1.2.4 Kritik 14
2.1.2.5 Forschungspotential 14
2.1.3 Raumbezug 14
2.1.3.1 Der Begriff ‚Raumbezug‘ in der Fachliteratur 14
2.1.3.2 Kategorien des Georaumbezuges 16
2.1.4 Georäumlich 16
2.1.5 Geographische Information und Geodaten 17
2.1.5.1 Begriffsklärung 17
2.1.5.2 Points of Interest als Spezialfall 19
2.1.6 Volunteered Geographic Information / Nutzergenerierte geographische Informationen 19
2.1.6.1 Begriffsherkunft und Charakteristika von VGI 19
2.1.6.2 Das Konzept der menschlichen Sensoren 20
2.1.6.3 Kommunikation geographischer Informationen bei VGI 21
2.1.6.4 Der Mehrwert von VGI 21
2.1.6.5 Motive der Beitragenden 22
2.1.6.6 VGI im globalen Kontext 22
2.1.6.7 Erfassung der Informationen: partizipativ vs. opportunistisch 23
2.1.6.8 Formale Definition 23
2.1.6.9 Deutsche Entsprechung des Begriffs 24
2.1.7 Semantik nutzergenerierter geographischer Informationen 25
2.1.7.1 Strukturierte Form 25
2.1.7.2 Unstrukturierte Form 26
2.2 Arten nutzergenerierter geographischer Informationen 26
2.2.1 Topographische Informationen – OpenStreetMap 28
2.2.1.1 Korpusbeschreibung 28
2.2.1.2 Forschungsüberblick 30
2.2.1.3 Raumbezug 32
2.2.2 Enzyklopädische Informationen – Wikipedia 34
2.2.2.1 Korpusbeschreibung 34
2.2.2.2 Forschungsüberblick 35
2.2.2.3 Raumbezug 36
2.2.2.4 Metaeigenschaften von Artikeln der deutschen Wikipedia 37
2.2.3 Microblogging-Texte – Twitter 39
2.2.3.1 Korpusbeschreibung 39
2.2.3.2 Forschungsüberblick 41
2.2.3.3 Raumbezug 42
2.2.4 Bilder und Bildmetainformationen – Flickr, Instagram, Picasa, Panoramio, Geograph 43
2.2.4.1 Korpusbeschreibung 43
2.2.4.2 Forschungsüberblick 45
2.3 Informationen und Netzwerke 46
2.3.1 Beispiele für Netzwerkstrukturen 46
2.3.2 Implikationen vernetzter Informationen für die Raumbezugshypothese 47
2.3.3 Netzwerkeigenschaften der Wikipedia 47
2.4 Geographische Informationen und Kognition 49
2.5 Informationen klassifizieren durch maschinelle Sprachverarbeitung 50
2.5.1 Naive Bayes 51
2.5.2 Maximum Entropy 51
2.5.3 Support Vector Machines 52
3 Methoden und Ergebnisse 53
3.1 Korpusanalytischer Ansatz für die Prüfung der Raumbezugshypothese 53
3.1.1 Netzwerkgrad des Georaumbezuges 53
3.1.2 Datenprozessierung 56
3.1.3 Ergebnisse der NGGR-Berechnung 57
3.1.4 Korrelation zwischen NGGR und den Eigenschaften von Wikipedia-Artikeln 60
3.2 Befragungsansatz für die Prüfung der Raumbezugshypothese 65
3.2.1 Kategorisierungsaufgabe zur Untersuchung des Georaumbezuges 65
3.2.1.1 Material 66
3.2.1.2 Prozedur 66
3.2.1.3 Teilnehmer 67
3.2.2 Hypothesen 68
3.2.3 Daten zur Beteiligung an der Befragung 68
3.2.4 Ergebnisse 70
3.3 Synthese von korpusanalytischem Ansatz und Befragungsansatz für die Prüfung der Raumbezugshypothese 71
3.3.1 Methodik 71
3.3.2 Ergebnisse 72
3.3.3 Einfluss des Faktors Wissen auf die Ergebnisse der Befragung 73
3.3.4 Einfluss des fachlichen Hintergrundes auf die Ergebnisse der Befragung 74
3.3.5 Prädiktion des Anteils raumbezogener Informationen für das gesamte Korpus der deutschen Wikipedia 76
3.4 Klassifikation nutzergenerierter geographischer Informationen hinsichtlich der Korrelation Ort-Inhalt am Beispiel von mobil verfassten Microblogging-Texten 77
3.4.1 Manuelle Textklassifikation 78
3.4.2 Überwachte maschinelle Textklassifikation mit manuell klassifizierten Trainingsdaten 80
3.4.2.1 Vorverarbeitung der Microblogging-Texte 81
3.4.2.2 Evaluation der Ergebnisse der maschinellen Textklassifikation 82
3.4.2.3 Tuning der maschinellen Klassifikation 83
3.4.3 Überwachte maschinelle Textklassifikation mit lexikalischen Trainingsdaten 83
3.4.4 Verwendete Daten 86
3.4.4.1 Aufzeichnung von mobilen Microblogging-Texten mit der Twitter-Streaming-API 86
3.4.4.2 Filterung verwendbarer Microblogging-Texte 87
3.4.4.3 Zeitliche und räumliche Muster der Microblogging-Texte 89
3.4.4.4 Verwendete Points of Interest 91
3.4.5 Ergebnisse 92
3.4.5.1 Manuelle Annotation von Texten 92
3.4.5.2 Überwachte maschinelle Klassifikation von Texten mit manuell klassifizierten Trainingsdaten 95
3.4.5.3 Überwachte maschinelle Klassifikation von Texten mit lexikalischen Trainingsdaten 99
3.5 Bestimmung der Entfernungsabhängigkeit des Anteils von für spezifische Orte relevanten Informationen am Beispiel von mobil verfassten Microblogging-Texten 103
3.5.1 Methodik 103
3.5.2 Ergebnisse 104
4 Diskussion 111
4.1 Methoden zur Prüfung der Raumbezugshypothese am Beispiel des Korpus Wikipedia 111
4.1.1 Wahl des Korpus 111
4.1.2 Abstraktes Konzept und Instanz 112
4.1.3 Korpusanalytischer Ansatz 112
4.1.4 Befragungsansatz 114
4.2 Methoden zur Bestimmung der Korrelation Ort-Inhalt von nutzergenerierten Informationen am Beispiel von mobil erzeugten Microblogging-Texten 115
4.2.1 Manuelle Klassifikation 116
4.2.2 Überwachte maschinelle Klassifikation mit manuell klassifizierten Trainingsdaten 117
4.2.3 Unüberwachte maschinelle Klassifikation mit lexikalischen Trainingsdaten 118
4.2.4 Berechnung der Entfernungsabhängigkeit des Anteils ortsbezogener Texte 119
4.2.5 Points of Interest als Modell für den räumlichen Kontext 120
4.3 Der Begriff ‚Raumbezug‘ im Kontext von nutzergenerierten geographischen Informationen 120
5 Schlussfolgerungen und Forschungsausblick 123
5.1 Beantwortung der Forschungsfragen 123
5.1.1 Zur Überprüfung der Raumbezugshypothese 123
5.1.2 Zur Korrelation von Ort und Inhalt von nutzergenerierten geographischen Informationen 125
5.2 Implikationen der Forschungsergebnisse 128
5.3 Forschungsausblick nutzergenerierte geographische Informationen 130
5.3.1 Qualität von VGI 130
5.3.2 Synthese von VGI mit amtlichen Daten 132
5.3.3 Weitere aktuelle Entwicklungen im Bereich VGI-Forschung 132
6 Literaturverzeichnis 135
7 Anhang 151
Anhang A Dokumentation des „Experiments Geoaumbezug“ 152
Anhang B Ergebnisse der Kategorisierungsaufgabe des „Experiments Georaumbezug“ 157
Anhang C Rückmeldungen der Teilnehmer des „Experiments Georaumbezug“ 163
Anhang D Einfluss der Faktoren fachlicher Hintergrund und Wissen auf die Kategorisierung von Begriffen hinsichtlich ihrer Georäumlichkeit 166
Anhang E Ergebnisse der manuellen Klassifikation der Microblogging-Texte 168
Anhang F Klassifikationsmodelle resultierend aus manuellen und lexikalischen Trainingsdaten 177
Anhang G Forschungsdaten-Anhang 181
|
Page generated in 0.1321 seconds