• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 20
  • 11
  • 5
  • 5
  • 4
  • 3
  • 3
  • 2
  • 1
  • 1
  • Tagged with
  • 50
  • 30
  • 30
  • 28
  • 12
  • 11
  • 11
  • 11
  • 10
  • 10
  • 6
  • 6
  • 6
  • 5
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
41

Live Video Exploration - Exploring environments using live video, mobile devices and unacquainted users

Bjelm, Petter, Wibom, Mark January 2015 (has links)
The live video streaming market is, as some research suggests, a difficult one to develop.Comparing it to other media it has the disadvantage of being available during a limitedperiod of time. This thesis explores how mobile devices can be used as an exploratorytool through live video streaming. The opportunity of control in the moment is studiedand examined in this report. This research will suggest a mobile device platform in whichpeople can assist other people exploring new environments around the globe. It also triesto evaluate whether this exploring interaction can occur between unacquainted people andat the same time not be hindered by any language barriers. The motivation behind thissubject is the human need and curiosity of exploring new environments and places.The foundation of the research approach was based on interaction design principles andmethods. This created a chain of methods used with the intent of better understandingwhat is to be considered when designing for live video experiences focusing onenvironments. The process lead to important understandings and key aspects to beconsidered when designing live experiences focusing on environments. The results thatemerged, showed that the most important encouragement is; to be presented with anenvironment that includes novel elements. Furthermore, the results could also concludethat by giving access to directional controls, and some means of expressing appreciation,can help to influence and shape exploration with live video.
42

Att skapa eller att inte skapa User Generated Content : En kvantitativ studie om användares engagemang på digitala plattformar / To create or not to create User Generated Content : A quantitative study of user engagement on digital platforms

Gustav, Eliasson, Assal, Nassab January 2023 (has links)
Den ökade närvaron på digitala plattformar har gett konsumenter möjligheten till ökat inflytande och påverkan längs hela värdekedjan. Genom att konsumera, bidra och skapa innehåll på digitala plattformar är User Generated Content (UGC) ett verktyg för användare att vara delaktiga i värdeskapandeprocessen. Genom teorier som den tjänstedominanta logiken med samskapande av värde som central del, upplevt värde, konsumtion, bidragande och skapande har tre hypoteser utformats. Utformningen gjordes för att mäta och undersöka hur upplevt värde vid konsumtion av UGC i form av funktionellt, socialt och emotionellt värde, påverkar användares tendenser att ytterligare konsumera, bidra och skapa UGC. Hypoteserna undersöktes genom korrelations- och regressionsanalyser med data från en enkätundersökning bestående av 95 respondenter. Resultatet av studien tyder på positiva samband mellan upplevt värde av UGC och ytterligare konsumtion, bidragande och skapande av UGC med undantag från upplevt funktionellt värde i relation till bidragande och skapande. / The increased presence on digital platforms has given consumers the opportunity for more significant influence and impact along the entire value chain. By consuming, contributing, and creating content on digital platforms, User Generated Content (UGC) is a tool for users to be involved in the value-creation process. Through theories such as the service-dominant logic with co-creation of value as a central element, perceived value, consumption, contribution, and creation, three hypotheses have been formulated. The design was made to measure and investigate how perceived value when consuming UGC in terms of functional, social, and emotional value, influences users' tendencies to further consume, contribute and create UGC. The hypotheses were investigated through correlation and regression analyses using data from a survey of 95 respondents. The results of the study suggest positive correlations between the perceived value of UGC and further consumption, contribution, and creation of UGC with the exception of perceived functional value in relation to contribution and creation.
43

電視新聞採用非自採影片之研究 / A study on the use of TPV (Third Party Video) materials by TV news

林佳慧, Lin, Chia Hui Unknown Date (has links)
數位時代社群媒體的應用,大大改寫媒體生態,21世紀初接連發生在北非、中東的抗議活動,Facebook、Twitter等社群媒體更發揮重要傳播作用,甚至成為政治運動的催化劑,國內外各大新聞組織也開始將這些被社交媒體平台大量分享、轉發的用戶生成內容 (UGC, User-generated content)重製後進行傳播,尤其是發生抗爭等社會運動、人為或意外現場等事件,因為時效性的關係,記者不能第一時間趕到,目擊者手機拍攝的影片或現場監視錄影器的畫面,往往成為重要新聞素材。   對於國內外新聞組織尤其是電視台來說,動態影片更同時具有吸引力與新聞說服力,新聞機構如何使用UGC資源,及其日漸普及的趨勢,則同時引發正反兩方意見,除了樂見其協助社會問題發聲,擴展公民參與,甚至打破新聞編輯室權威,讓媒體更加民主化之外;另方面卻也擔心降低新聞標準,尤其截稿時間,更增加電視台新聞記者判斷影片真偽的求證壓力,過度使用也可能造成媒體過度依賴社群媒體資源,瑣碎化的UGC甚至戕害新聞公共領域的發展。   本研究試圖剖析電視新聞使用來自目擊者或網友的第三方影音素材(TPV, third party video)的頻率與原因,研究分成兩步驟,首先選舉一家地面電視台一個月的prime time新聞,作為研究樣本,進行內容分析,以量化研究分析電視新聞如何應用TPV素材,研究樣本數共1825則;同時以質化研究中的深度訪談,訪問該電視台的文字、攝影記者,以及新聞室負責調度的大編輯台主管與編輯共九人,透過量化與質化的研究方法,來探究電視台採用TPV素材的動機、意願、標準與目的。 / The media ecology has been rewritten to a great extent by the application of social media in the digital age. In the 21st century, social media has even become a catalyst of social movements as Facebook and Twitter play an important role in disseminating the news on protests which commonly take place in North Africa and the Middle East. In fact, large news organizations at home and abroad have begun to reproduce and broadcast User-generated contents (UGC) that are greatly shared and forwarded on the social media. This applies especially to incidents such as social movements, including protests, and accidents. The video taken by an eye-witness’ mobile phone or the recording of an on-site surveillance camera has often become important news material due to timeliness of the news and the fact that reporters cannot arrive at the scene on time. According to foreign and domestic news agencies, especially TV stations, video is both appealing and persuasive as news materials. The growing popularity of UGC and the approach to make use of such resources have led the emergence of positive and negative viewpoints. It would be delightful to see the voicing-out of social problems through UGC since it could increase citizen participation. UGC could even lead to a breakthrough from pressroom authority, thus creating a more democratic media. However, UGC could also lower the news standard especially when there’s a deadline to meet. Furthermore, it could pile pressure on news reporters as they try to determine the authenticity of the video. The excessive use of UGC could lead to the media’s over-reliance on social media resources. The fragmentary nature of UGC could also be harmful to the development of news media at the public domain. The study attempted to analyze the purpose behind a TV station’s adoption of eyewitness/netizen-provided third-party video (TPV), as well as its frequency of use. The study was divided into two steps. First, research samples for content analysis were collected through a selection of one month’s worth of news reports that were broadcasted by a terrestrial station at prime time. A total of 1825 samples were studied through quantitative research and analysis with regard to the application of TPV by TV news. At the same time, in order to explore a TV station’s motivation, willingness, standard and the purpose in applying TPV, qualitative research was conducted through an in-depth interview with nine representatives from the TV station. This group included journalists, cameramen, editors and seniors who were responsible for ordering daily news in the Newsrooms.
44

Ο ρόλος του διαφημιστικού περιεχομένου (σχολίων και βαθμολογιών) που δημιουργείται από τους καταναλωτές για την εκτίμηση (πρόβλεψη) της τιμής των δίκλινων δωματίων : Η περίπτωση των ξενοδοχείων της Αθήνας

Τελώνης, Γιώργος 07 May 2015 (has links)
Το Internet επεκτείνεται και οι χρήστες του αυξάνονται με ρυθμούς γεωμετρικής προόδου. Ήδη διαδραματίζει καθοριστικό ρόλο στην ταξιδιωτική βιομηχανία. Και στην πραγματικότητα αποτελεί την κύρια δεξαμενή άντλησης οποιασδήποτε μορφή πληροφόρησης της ταξιδιωτικής βιομηχανίας. Αν και αποτελούν νέες σχετικά έννοιες τα δίκτυα κοινωνικής ενημέρωσης αλλά και το περιεχόμενο (UGC) που παράγεται από τους καταναλωτές κερδίζουν συνεχώς μερίδιο στους ταξιδιωτικούς καταναλωτές και έτσι επηρεάζουν όλο και πιο έντονα τις αποφάσεις τους. Οι αποφάσεις τους αυτές έχουν σαν συνέπεια να αυξάνουν όλο και περισσότερο το μέρος της τουριστικής ζήτησης που μετακινείται προς το ηλεκτρονικό εμπόριο. Αφού εξεταστούν οι επιπτώσεις του UGC, στην ταξιδιωτική βιομηχανία, στην οποία οι μονάδες φιλοξενίας έχουν το μεγαλύτερο μερίδιο αγοράς, η έρευνα αυτή θα εστιαστεί κυρίως στις επιπτώσεις που ήδη έχει επιφέρει, στις ξενοδοχειακές μονάδες του ευρύτερου κέντρου της Αθήνας. Θα εξετάσει διεξοδικά τις συσχετίσεις που επιφέρουν τα reviews των καταναλωτών στον καθορισμό της τιμής των ξενοδοχείων, θα εξετάσει τις συσχετίσεις που μπορούν να έχουν οι παρεχόμενες υπηρεσίες των ξενοδοχείων στην διαμόρφωση των βαθμολογιών των κυριότερων ταξιδιωτικών σελίδων. Θα γίνει μία καταγραφή των κυριοτέρων από αυτές και θα επεξεργαστούν τα στοιχεία- σχόλια που έχουν οι επτά δημοφιλέστερες. Θα ερευνηθούν οι συσχετίσεις των βαθμολογιών με τις κατηγορίες των ξενοδοχείων της Αθήνας, τόσο σε επίπεδο αστέρων όσο και σε επίπεδο μεγέθους. Θα εξετάσει την συμπεριφορά των διάφορων ομάδων που στέλνουν σχόλια στο διαδίκτυο σε σχέση με τι διάφορες κατηγορίες των ξενοδοχείων. Επίσης θα ερευνηθούν οι διαφορές θερινής και χειμερινής τιμής και πως αυτές επηρεάζονται από την αξιολόγηση των ταξιδιωτικών ιστοσελίδων, σε συνδυασμό με τις διάφορες κατηγορίες. Tέλος, θα ερευνηθούν οι συσχετίσεις των βαθμολογιών με τις τιμές και τα κύρια χαρακτηριστικά των ξενοδοχείων (παροχές, απόσταση από μέσα μεταφοράς, απόσταση από κέντρο κλπ.) αλλά και αντίστροφα το κατά πόσο οι τιμές επηρεάζονται και με ποιό πρόσημο και ένταση από τις αξιολογήσεις των ταξιδιωτικών ιστοσελίδων. Η επιρροή τους στην τιμή και επομένως στον ανταγωνισμό, μήπως οδηγεί σε "παραπλανητικά" σχόλια; Ποια η αξιοπιστία τους; Θα μετρηθεί με τεστ αξιοπιστίας όλων των ταξιδιωτικών ιστοσελίδων και θα συγκριθεί με υπάρχοντα επαγγελματικά εμπορικά εργαλεία. Τέλος, θα προσπαθήσει η έρευνα αυτή να βρει εργαλεία τα οποία με απλούς αλλά δόκιμους τρόπους θα προσπαθήσουν να εκτιμήσουν την τιμή που μπορούν να έχουν οι ξενοδοχειακές μονάδες και αν μπορέσουν να ξεπεράσουν τα reliability test, να εξεταστεί η δυνατότητα της εφαρμογής τους σαν ένας εναλλακτικός τρόπος τιμολόγησης, πέρα από τις συνήθεις μεθόδους τιμολόγησης κόστους και ανταγωνισμού. / The Internet expands and users are increasing at a rate of geometric progress. Already plays a key role in the travel industry. And the reality is the main tank pumping any form of information of the travel industry. Although these are new concepts for the networks social media and content (UGC-) produced by consumers are gaining market share in travel consumers and thus affect more and more strongly their decisions. Their decisions have resulted to increase more and more the part of tourist demand that moves toward e-commerce. After examining the effect of the UGC-, in the travel industry, in which the hospitality units have the largest market share, this research will focus mainly on the effects which already has brought ,the hotel units of the larger center of Athens. We will examine in detail the assignments which bring about the reviews of the consumer in determining the price of hotels, will examine the correlations which can have the services of hotels in configuration of scores of major travel pages. There will be a record of the main from them and draw up the data; reviews the seven most popular. We will investigate the correlations of the scores for each of the categories of hotels in Athens, both star and sizes. We will examine the behavior of the various groups to send comments on the internet in relation to what various categories of hotels. It will also investigate the differences between summer and winter price and that those affected by the assessment of travel sites, in conjunction with the various categories.Finally, will investigate the correlations of scores with the values and the main features of the hotel (facilities, distance from transport, distance from center etc. ) and vice versa whether prices are influenced and with what sign and intensity of the evaluations of travel sites. Their influence on price and therefore in competition, that leads to a "misleading" comments? What their credibility? Will be measured with test reliability of all travel sites and will be compared with existing professional commercial tools. Finally, we will try to research this to find tools with simple but trainee ways will try to appreciate the value that may have been the hotel units and if they can overcome the reliability test, to examine the possibility of implementing them as an alternative billing method, apart from the usual methods cost pricing and competition.
45

New Product Introductions, what gets people talking? : Quantitative study on e-Word-of-Mouth & Customer Engagement

Czeszejko, Rafael, Zhang Pettersson, Sophia January 2021 (has links)
The interest of researchers and practitioners in e-Word-of-Mouth has accelerated with the rise of social media platforms. In the last decade it became more apparent that customers are not merely recipients of product and brand information, but also active participants in shaping product and brand perceptions. However, still no comprehensive understanding of customers’ desire to engage in positive and negative e-Word-of-Mouth has been found. Therefore, this study focuses on Customer Engagement in order to provide knowledge on what makes customers engage in e-Word-of-Mouth. We narrow our study to New Product Introductions due to their crucial role in both business success and failure. In order to study this topic, quantitative methodology using big data analysis of around 20 millions tweets in total, with text analysis of around three million items, obtained from Twitter has been applied. The findings indicate that Brand Benefits and Innovativeness Level are two important aspects that impact Attitudinal Engagement which enables Customer Engagement Behavior.
46

Användargenererat innehåll på TikTok och dess påverkan: En kvantitativ undersökning av generation Z's köpintention och köpbeslut

Landberg, Alva, Inge, Emma, Schönning, Felicia January 2023 (has links)
Datum: 2023-05-30 Nivå: Kandidatuppsats i Företagsekonomi, 15 hp  Institution: Akademin för Ekonomi, Samhälle och Teknik, Mälardalens Universitet  Författare: Alva Landberg (96/07/03), Emma Inge (98/02/15), Felicia Schönning (98/11/02)                                                                                 Titel: Användargenererat innehåll på TikTok och dess påverkan; En kvantitativ undersökning av generation Z's köpintention och köpbeslut Handledare: Pejvak Oghazi Nyckelord: Användargenererat innehåll, Attityder, Elektronisk Word of Mouth (eWOM), Generation Z, Köpbeslut, Köpintention, TikTok Forskningsfrågor: (1) Hur påverkar användandet av TikTok generation Z’s köpbeslut? (2) Har användargenererat innehåll på TikTok något samband med generation Z’s köpintention? (3) Hur påverkas generation Z’s köpbeslut av användargenererat innehåll på TikTok? (4) Hur påverkar användandet av TikTok generation Z’s attitydkomponenter; kognitiv, affektiv och beteende? (5) Vilka skillnader finns mellan generation Z och millennials vid användandet av TikTok?   Syfte: Syftet med denna studie är att undersöka ifall användargenererat innehåll på sociala medieplattformen TikTok påverkar generation Z's köpintention och köpbeslut. Metod: Studien är baserad på en kvantitativ forskningsansats där primärdata samlats in i form av en digital enkätundersökning. Datan samlades in med ett resultat av 183 respondenter med ett bortfall på 30, vilket gav 150 validerade svar. Datan analyserades sedan via en korrelationsanalys, Cronbach’s alfa, regressionsanalys och en korstabulering i det statistiska dataprogrammet SPSS. Slutsats: Resultatet visade att användargenererat innehåll på TikTok har ett samband med generation Z’s köpintention och köpbeslut. En ökad användning av TikTok bidrar till att attitydkomponenterna; kognitiv, affektiv, beteende påverkas positivt av rekommendationer från användare på TikTok, vilket bidrar till en ökad köpintention som senare leder till ett köpbeslut. / Date: 2023-05-30 Level: Bachelor thesis in Business Administration, 15 cr Institution: School of Business, Society and Engineering, Mälardalen University Authors: Alva Landberg (96/07/03), Emma Inge (98/02/15), Felicia Schönning (98/11/02)  Title: User-generated content on TikTok and its impact; A quantitative study of generation Z's purchase intention and purchase decision Supervisor: Pejvak Oghazi Keywords: Attitudes, Electronic Word of Mouth (eWOM), Generation Z, Purchase decision, Purchase intention, TikTok, User Generated Content (UGC) Research questions: (1) How does the use of TikTok affect generation Z's purchase decisions? (2) Does user-generated content on TikTok relate to generation Z's purchase intention? (3) How does user-generated content on TikTok influence generation Z’s purchasing decisions? (4) How does using TikTok affect generation Z's attitudinal components; cognitive, affective, and behavioral? (5) What are the differences between generation Z and millennials when using TikTok? Purpose: This study aims to investigate if user-generated content on the social media platform TikTok influences generation Z's purchase intention and purchase decision. Method: This study is based on a quantitative research approach where primary data has been collected through an online survey. The data was collected with a result of 183 respondents with a non-response rate of 30, which gave a total of 150 validated responses. The data were analyzed through a correlation analysis, Cronbach's Alpha, regression analysis and a cross-tabulation in the statistical data program SPSS. Conclusion: The result showed that user-generated content on TikTok has a connection with generation Z's purchase intention and purchase decision. Increased use of TikTok contributes to the attitudinal components; cognitive, affective and behavior is positively affected by recommendations from users on TikTok, which contributes to an increased purchase intention that leads to a purchase decision.
47

La télévision, média de masse ou média individuel ? De la télévision traditionnelle à la e-télévision / Is television a mass media or an individual media? From traditional TV to e-television

Martin, Valérie 16 December 2015 (has links)
La télévision traditionnelle, « voix de la France » est un média de masse. Avec un taux d’équipement des foyers de plus de 98%, un taux d’écoute de plus de 3h50 par jour, un chiffre d’affaires publicitaires de plus de 4 Mrd EUR , et des « contenus rendez-vous » assurant des audiences record, cette télévision trône dans le salon et réunit la famille. Jusque dans les années 1980, elle reste placée sous le contrôle du pouvoir politique.Sous la Présidence de François Mitterrand, la télévision se libéralise. De nouvelles chaînes privées et commerciales financées par l’audience et la publicité apparaissent, tandis que le secteur public reste principalement financé par la redevance audiovisuelle. Dans les années 90, l’arrivée du câble et du satellite, puis de la TNT en 2005, permettent l’accroissement considérable du nombre de nouvelles chaînes et des offres de télévision (abonnements au câble, au satellite, et à Canal + en 1984). Le numérique révolutionne le secteur de la télévision, les technologies et les usages. Le nombre de chaînes continue de s’accroître de façon exponentielle. On voit se développer la production de contenus générés par les consommateurs (UGC), et l’interactivité est favorisée grâce aux réseaux sociaux. L’évolution des équipements changent les habitudes de consommation du petit écran, notamment pour les plus jeunes. L’ordinateur, la tablette, le Smartphone et la télévision connectée permettent de visionner « la télévision comme je veux, où je veux, quand je veux. ». Ainsi la télévision traditionnelle considérée comme un média de masse, tend à s’individualiser, et s’adapte aux goûts et aux envies de chacun. L’écosystème jusqu’à présent hexagonal est littéralement en train d’exploser pour faire face à l’internationalisation des contenus et à des acteurs audiovisuels majoritairement nord-américains. La réglementation devenue obsolète peine à trouver un nouveau cadre juridique à l’échelle française et européenne. Face à l’offre mondialisée, et les nouveaux usages de consommation notamment les usages délinéarisés (télévision de rattrapage, et Vidéo à la demande), la télévision continue néanmoins à fédérer le public autour de grands évènements d’actualité (évènements sportifs, politiques, journal télévisé du 20h…). Les profondes mutations et les changements rapides qui s’opèrent actuellement laissent planer une grande incertitude sur l’avenir de la télévision traditionnelle et faute de pouvoir s’adapter, celle-ci pourrait à plus ou moins long terme disparaitre… / Traditional TV, "Voice of France" is a mass medium. With a home ownership rate of over 98%, a viewing rate of l more than 3.50 hours, advertising revenue of over 4 billion euros , and “contenus Rendez-vous” bringing in record audiences, television rules over the living room, bringing the family together up into the 1980s. It is, however, controlled by the ruling political powers.Under the presidency of François Mitterrand, television was liberalized with the appearance of new private and commercial channels, financed by audiences and advertising, while the public sector continued to be funded by a license fee. In the 90s, the arrival of cable and satellite, followed by TNT in 2005, allowed the amazing increase of a number of new channels and TV services (« subscriptions to cable, satellite and finally Canal + in 1984 )But this evolution continues with the arrival of digital TV, revolutionizing the industry. It increases the number of channels exponentially, expands the production of content generated by consumers, and promotes interactivity through social networks. Technological advances are changing consumer habits with regard to the small screen, especially for young people. The computer, tablet, smartphone and the connected TV let you watch "television as I want, where I want, when I want”. Traditional TV, once considered as a mass media, is now a media that is individualized and that adapts to the tastes and desires of each viewer.The current financial system in France is literally exploding to deal with the internationalization of audiovisual content and players, with most of the content produced in North America.. Obsolete regulations can no longer keep pace with consumer demand in Europe and France. Faced with global supply and new viewing habits (delinearised viewing: replayand video on demand), television still continues to unite the public around major news events (sporting events, political events, the evening news …). The important, rapid changes now occurring in TV content and distribution lead to considerable uncertainty with regard to the future of traditional television, and unless it can adapt, it could more or less disappear in the long term.
48

Vývoj a limity autorskoprávní ochrany v globální informační společnosti / The Evolution and the Limits of the Copyright Protection in the Global Information Society

Andruško, Alena January 2017 (has links)
CHARLES UNIVERSITY IN PRAGUE Faculty of Law Institute of Copyright, Industrial Property Rights and Competition Law DOCTORAL DISSERTATION The Evolution and the Limits of the Copyright Protection in the Global Information Society ABSTRACT Author: Mgr. Alena Andruško Supervisor: Prof. JUDr. Dr. iur. h. c. Jan Kříž, CSc. Field of Study: Civil Law Theoretical Legal Science Year: 2015 ABSTRACT Copyright law is one of the branches of law that has become, with the development of the Internet, the center of interest for different types of stakeholders in the global information society. With the evolution of "Web 2.0", sometimes called the "Participative Web", represented by user-generated content (UGC), and also with the evolution of peer-to-peer (P2P) file sharing and recently cyberlockers, the effectiveness of copyright protection online has become a problem where solutions can be found only with difficulty. Online copyright infringement is a complex phenomenon with a multiplicity of contributing factors. To see and understand these factors one must not only know and understand the territorial and international legal rules governing copyright, but also know and understand the online ecosystem in which copyright infringement takes place, which is impossible without knowing the history, evolution and technical...
49

Zur Beziehung von Raum und Inhalt nutzergenerierter geographischer Informationen

Hahmann, Stefan 21 July 2014 (has links) (PDF)
In the last ten years there has been a significant progress of the World Wide Web, which evolved to become the so-called “Web 2.0”. The most important feature of this new quality of the WWW is the participation of the users in generating contents. This trend facilitates the formation of user communities which collaborate on diverse projects, where they collect and publish information. Prominent examples of such projects are the online-encyclopedia “Wikipedia”, the microblogging-platform “Twitter”, the photo-platform “Flickr” and the database of topographic information “OpenStreetMap”. User-generated content, which is directly or indirectly geospatially referenced, is of-ten termed more specifically as “volunteered geographic information”. The geospatial reference of this information is constituted either directly by coordinates that are given as meta-information or indirectly through georeferencing of toponyms or addresses that are contained in this information. Volunteered geographic information is particularly suited for research, as it can be accessed with low or even at no costs at all. Furthermore it reflects a variety of human decisions which are linked to geographic space. In this thesis, the relationship of space and content of volunteered geographic information is investigated from two different perspectives. The first part of this thesis addresses the question for which share of information there exists a relationship between space and content of the information, such that the information is locatable in geospace. In this context, the assumption that about 80% of all information has a reference to space has been well known within the community of geographic information system users. Since the 1980s it has served as a marketing tool within the whole geoinformation sector, although there has not been any empirical evidence. This thesis contributes to fill this research gap. For the validation of the ‘80%-hypothesis’ two approaches are presented. The first approach is based on a corpus of information that is as representative as possible for world knowledge. For this purpose the German language edition of Wikipedia has been selected. This corpus is modeled as a network of information where the articles are considered the nodes and the cross references are considered the edges of a directed graph. With the help of this network a graduated definition of geospatial references is possible. It is implemented by computing the distance of each article to its closest article within the network that is assigned with spatial coordinates. Parallel to this, a survey-based approach is developed where participants have the task to assign pieces of information to one of the categories “direct geospatial reference”, “indirect geospatial reference” and “no geospatial reference”. A synthesis of both approaches leads to an empirically justified figure for the “80%-assertion”. The result of the investigation is that for the corpus of Wikipedia 27% of the information may be categorized as directly geospatially referenced and 30% of the information may be categorized as indirectly geospatially referenced. In the second part of the thesis the question is investigated in how far volunteered geographic information that is produced on mobile devices is related to the locations where it is published. For this purpose, a collection of microblogging-texts produced on mobile devices serve as research corpus. Microblogging-texts are short texts that are published via the World Wide Web. For this type of information the relationship be-tween the content of the information and their position is less obvious than e.g. for topographic information or photo descriptions. The analysis of microblogging-texts offers new possibilities for market and opinion research, the monitoring of natural events and human activities as well as for decision support in disaster management. The spatial analysis of the texts may add extra value. In fact for some of the applications the spatial analysis is a necessary condition. For this reason, the investigation of the relationship of the published contents with the locations where they are generated is of interest. Within this thesis, methods are described that support the investigation of this relationship. In the presented approach, classified Points of Interest serve as a model for the environment. For the purpose of the investigation of the correlation between these points and the microblogging-texts, manual classification and natural language processing are used in order to classify these texts according to their relevance in regard to the respective feature classes. Subsequently, it is tested whether the share of relevant texts in the proximity of objects of the tested classes is above average. The results of the investigation show that the strength of the location-content-correlation depends on the tested feature class. While for the feature classes ‘train station’, ‘airport’ and ‘restaurant’ a significant dependency of the share of relevant texts on the distance to the respective objects may be observed, this is not confirmed for objects of other feature classes, such as ‘cinema’ and ‘supermarket’. However, as prior research that describes investigations on small cartographic scale has detected correlations between space and content of microblogging-texts, it can be concluded that the strength of the correlation between space and content of microblogging-texts depends on scale and topic. / Während der vergangenen zehn Jahre vollzog sich eine signifikante Veränderung des World Wide Webs, das sich zum sogenannten „Web 2.0“ entwickelte. Das wesentlichste Merkmal dieser neuen Qualität des WWW ist die Beteiligung der Nutzer bei der Erstellung der Inhalte. Diese Entwicklung fördert das Entstehen von Nutzergemeinschaften, die kollaborativ in unterschiedlichsten Projekten Informationen sammeln und veröffentlichen. Prominente Beispiele für solche Projekte sind die Online-Enzyklopädie „Wikipedia“, die Microblogging-Plattform „Twitter“, die Foto-Plattform „Flickr“ und die Sammlung topographischer Informationen „OpenStreetMap“. Nutzergenerierte Inhalte, die direkt oder indirekt raumbezogen sind, können spezifischer als „nutzergenerierte geographische Informationen“ bezeichnet werden. Der Raumbezug dieser Informationen entsteht entweder direkt durch die Angabe räumlicher Koordinaten als Metainformationen oder er kann indirekt durch die Georeferenzierung von in den Informationen enthaltenen Toponymen oder Adressen hergestellt werden. Nutzergenerierte geographische Informationen haben für die Forschung den besonderen Vorteil, dass sie einerseits häufig gänzlich ohne oder nur mit geringen Kosten verfügbar gemacht werden können und andererseits eine Vielzahl von menschlichen Entscheidungen widerspiegeln, die mit dem Raum verknüpft sind. In der vorliegenden Dissertation wird die Beziehung von Raum und Inhalt nutzergenerierter geographischer Informationen aus zwei Perspektiven untersucht. Im ersten Teil der Arbeit steht die Frage im Vordergrund, für welchen Anteil an Informationen eine Beziehung zwischen Raum und Informationsinhalt in der Art besteht, dass die Informationen im Georaum lokalisierbar sind. In diesem Zusammenhang existiert seit den 1980er Jahren die unter Nutzern von geographischen Informationssystemen weit verbreitete These, dass 80% aller Informationen einen Raumbezug haben. Diese These dient im gesamten Spektrum der Branche als Marketinginstrument, ist jedoch nicht empirisch belegt. Diese Arbeit trägt dazu bei, die bestehende Forschungslücke zu schließen. Für die Prüfung dieser These, die in der Arbeit als „Raumbezugshypothese“ bezeichnet wird, werden zwei Ansätze vorgestellt. Der erste Ansatz basiert auf der Analyse eines möglichst repräsentativen Informationskorpus, wofür die deutsche Sprachversion der Wikipedia ausgewählt wird. Diese wird als Informationsnetzwerk modelliert, indem deren Artikel als Knoten und deren interne Querverweise als Kanten eines gerichteten Graphen betrachtet werden. Mit Hilfe dieses Netzwerkes ist es möglich eine abgestufte Definition des Raumbezuges von Informationen einzuführen, indem die Entfernung jedes Artikels innerhalb des Netzwerkes zum jeweils nächstgelegenen Artikel, der mit räumlichen Koordinaten gekennzeichnet ist, berechnet wird. Parallel dazu wird ein Befragungsansatz entwickelt, bei dem Probanden die Aufgabe haben, Informationen in die Kategorien „Direkter Raumbezug“, „Indirekter Raumbezug“ und „Kein Raumbezug“ einzuordnen. Die Synthese beider Ansätze führt zu einer empirisch begründeten Zahl für die „Raumbezugsthese“. Das Ergebnis ist, dass für das Untersuchungskorpus Wikipedia 27% der Informationen als direkt raumbezogenen und 30% der Informationen als indirekt raumbezogen kategorisiert werden können. Im zweiten Teil der Arbeit wird die Forschungsfrage untersucht, inwiefern nutzergenerierte Informationen, die über mobile Geräte erzeugt werden, in Beziehung zu den Orten stehen, an denen sie veröffentlicht werden. Als Forschungskorpus dienen mobil verfasste Microblogging-Texte. Dies sind kurze Texte, die über das WWW veröffentlicht werden. Bei dieser Informationsart liegt im Gegensatz zu beispielsweise topographischen Information oder Fotobeschreibungen die Vermutung eines starken Zusammenhanges zwischen dem Inhalt der Informationen und deren Positionen nicht nahe. Die Analyse von Microblogging-Texten bietet unter anderem Potential für die Markt- und Meinungsforschung, die Beobachtung von Naturereignissen und menschlichen Aktivitäten sowie die Entscheidungsunterstützung in Katastrophenfällen. Aus der räumlichen Auswertung kann sich dabei ein Mehrwert ergeben, für einen Teil der Anwendungen ist die räumliche Auswertung sogar die notwendige Voraussetzung. Aus diesem Grund ist die Erforschung des Zusammenhanges der veröffentlichten Inhalte mit den Orten, an denen diese entstehen, von Interesse. In der Arbeit werden eine Methoden vorgestellt, mit deren Hilfe die Untersuchung dieser Korrelation am Beispiel von klassifizierten Points of Interest durchgeführt wird. Zu diesem Zweck werden die Texte mit Hilfe von manueller Klassifikation und maschineller Sprachverarbeitung entsprechend ihrer Relevanz für die getesteten Objektklassen klassifiziert. Anschließend wird geprüft, ob der Anteil der relevanten Texte in der Nähe von Objekten der getesteten Klassen überdurchschnittlich hoch ist. Die Ergebnisse der Untersuchungen zeigen, dass die Stärke der Raum-Inhalt-Korrelation von den getesteten Objektklassen abhängig ist. Während sich beispielsweise bei Bahnhöfen, Flughäfen und Restaurants eine deutliche Abhängigkeit des Anteils der relevanten Texte von der Entfernung zu den betreffenden Objekten zeigt, kann dies für andere Objektklassen, wie z.B. Kino oder Supermarkt nicht bestätigt werden. Da frühere Forschungsarbeiten bei der Analyse im kleinmaßstäbigen Bereich eine Korrelation der Informationsinhalte mit deren Entstehungsorten feststellten, kann geschlussfolgert werden, dass der Zusammenhang zwischen Raum und Inhalt bei Microblogging-Texten sowohl vom Maßstab als auch vom Thema abhängig ist.
50

Zur Beziehung von Raum und Inhalt nutzergenerierter geographischer Informationen

Hahmann, Stefan 12 June 2014 (has links)
In the last ten years there has been a significant progress of the World Wide Web, which evolved to become the so-called “Web 2.0”. The most important feature of this new quality of the WWW is the participation of the users in generating contents. This trend facilitates the formation of user communities which collaborate on diverse projects, where they collect and publish information. Prominent examples of such projects are the online-encyclopedia “Wikipedia”, the microblogging-platform “Twitter”, the photo-platform “Flickr” and the database of topographic information “OpenStreetMap”. User-generated content, which is directly or indirectly geospatially referenced, is of-ten termed more specifically as “volunteered geographic information”. The geospatial reference of this information is constituted either directly by coordinates that are given as meta-information or indirectly through georeferencing of toponyms or addresses that are contained in this information. Volunteered geographic information is particularly suited for research, as it can be accessed with low or even at no costs at all. Furthermore it reflects a variety of human decisions which are linked to geographic space. In this thesis, the relationship of space and content of volunteered geographic information is investigated from two different perspectives. The first part of this thesis addresses the question for which share of information there exists a relationship between space and content of the information, such that the information is locatable in geospace. In this context, the assumption that about 80% of all information has a reference to space has been well known within the community of geographic information system users. Since the 1980s it has served as a marketing tool within the whole geoinformation sector, although there has not been any empirical evidence. This thesis contributes to fill this research gap. For the validation of the ‘80%-hypothesis’ two approaches are presented. The first approach is based on a corpus of information that is as representative as possible for world knowledge. For this purpose the German language edition of Wikipedia has been selected. This corpus is modeled as a network of information where the articles are considered the nodes and the cross references are considered the edges of a directed graph. With the help of this network a graduated definition of geospatial references is possible. It is implemented by computing the distance of each article to its closest article within the network that is assigned with spatial coordinates. Parallel to this, a survey-based approach is developed where participants have the task to assign pieces of information to one of the categories “direct geospatial reference”, “indirect geospatial reference” and “no geospatial reference”. A synthesis of both approaches leads to an empirically justified figure for the “80%-assertion”. The result of the investigation is that for the corpus of Wikipedia 27% of the information may be categorized as directly geospatially referenced and 30% of the information may be categorized as indirectly geospatially referenced. In the second part of the thesis the question is investigated in how far volunteered geographic information that is produced on mobile devices is related to the locations where it is published. For this purpose, a collection of microblogging-texts produced on mobile devices serve as research corpus. Microblogging-texts are short texts that are published via the World Wide Web. For this type of information the relationship be-tween the content of the information and their position is less obvious than e.g. for topographic information or photo descriptions. The analysis of microblogging-texts offers new possibilities for market and opinion research, the monitoring of natural events and human activities as well as for decision support in disaster management. The spatial analysis of the texts may add extra value. In fact for some of the applications the spatial analysis is a necessary condition. For this reason, the investigation of the relationship of the published contents with the locations where they are generated is of interest. Within this thesis, methods are described that support the investigation of this relationship. In the presented approach, classified Points of Interest serve as a model for the environment. For the purpose of the investigation of the correlation between these points and the microblogging-texts, manual classification and natural language processing are used in order to classify these texts according to their relevance in regard to the respective feature classes. Subsequently, it is tested whether the share of relevant texts in the proximity of objects of the tested classes is above average. The results of the investigation show that the strength of the location-content-correlation depends on the tested feature class. While for the feature classes ‘train station’, ‘airport’ and ‘restaurant’ a significant dependency of the share of relevant texts on the distance to the respective objects may be observed, this is not confirmed for objects of other feature classes, such as ‘cinema’ and ‘supermarket’. However, as prior research that describes investigations on small cartographic scale has detected correlations between space and content of microblogging-texts, it can be concluded that the strength of the correlation between space and content of microblogging-texts depends on scale and topic.:1 Einleitung 1 1.1 Motivation 1 1.1.1 Bedeutung raumbezogener nutzergenerierter Inhalte für die geographische Informationswissenschaft und die Kartographie 1 1.1.2 Die Raumbezugshypothese 3 1.1.3 Die Korrelation von Ort und Inhalt bei nutzergenerierten Inhalten 4 1.2 Forschungsziele und Forschungsfragen 5 1.2.1 Prüfung der Raumbezugshypothese 5 1.2.2 Untersuchung der Korrelation von Ort und Inhalt von nutzergenerierten Inhalten 6 1.3 Aufbau der Arbeit 7 1.3.1 Die Beziehung zwischen Raum und Inhalt von nutzergenerierten geographischen Informationen 7 1.3.2 Gliederung der Arbeit 7 1.3.3 Verwendete Publikationen 8 2 Forschungsstand 11 2.1 Relevante Begriffe 11 2.1.1 Web 2.0 11 2.1.2 User Generated Content / Nutzergenerierte Inhalte 12 2.1.2.1 Bedeutung und Begriffsherkunft 12 2.1.2.2 Begriffsklärung 12 2.1.2.3 Arten von UGC 13 2.1.2.4 Kritik 14 2.1.2.5 Forschungspotential 14 2.1.3 Raumbezug 14 2.1.3.1 Der Begriff ‚Raumbezug‘ in der Fachliteratur 14 2.1.3.2 Kategorien des Georaumbezuges 16 2.1.4 Georäumlich 16 2.1.5 Geographische Information und Geodaten 17 2.1.5.1 Begriffsklärung 17 2.1.5.2 Points of Interest als Spezialfall 19 2.1.6 Volunteered Geographic Information / Nutzergenerierte geographische Informationen 19 2.1.6.1 Begriffsherkunft und Charakteristika von VGI 19 2.1.6.2 Das Konzept der menschlichen Sensoren 20 2.1.6.3 Kommunikation geographischer Informationen bei VGI 21 2.1.6.4 Der Mehrwert von VGI 21 2.1.6.5 Motive der Beitragenden 22 2.1.6.6 VGI im globalen Kontext 22 2.1.6.7 Erfassung der Informationen: partizipativ vs. opportunistisch 23 2.1.6.8 Formale Definition 23 2.1.6.9 Deutsche Entsprechung des Begriffs 24 2.1.7 Semantik nutzergenerierter geographischer Informationen 25 2.1.7.1 Strukturierte Form 25 2.1.7.2 Unstrukturierte Form 26 2.2 Arten nutzergenerierter geographischer Informationen 26 2.2.1 Topographische Informationen – OpenStreetMap 28 2.2.1.1 Korpusbeschreibung 28 2.2.1.2 Forschungsüberblick 30 2.2.1.3 Raumbezug 32 2.2.2 Enzyklopädische Informationen – Wikipedia 34 2.2.2.1 Korpusbeschreibung 34 2.2.2.2 Forschungsüberblick 35 2.2.2.3 Raumbezug 36 2.2.2.4 Metaeigenschaften von Artikeln der deutschen Wikipedia 37 2.2.3 Microblogging-Texte – Twitter 39 2.2.3.1 Korpusbeschreibung 39 2.2.3.2 Forschungsüberblick 41 2.2.3.3 Raumbezug 42 2.2.4 Bilder und Bildmetainformationen – Flickr, Instagram, Picasa, Panoramio, Geograph 43 2.2.4.1 Korpusbeschreibung 43 2.2.4.2 Forschungsüberblick 45 2.3 Informationen und Netzwerke 46 2.3.1 Beispiele für Netzwerkstrukturen 46 2.3.2 Implikationen vernetzter Informationen für die Raumbezugshypothese 47 2.3.3 Netzwerkeigenschaften der Wikipedia 47 2.4 Geographische Informationen und Kognition 49 2.5 Informationen klassifizieren durch maschinelle Sprachverarbeitung 50 2.5.1 Naive Bayes 51 2.5.2 Maximum Entropy 51 2.5.3 Support Vector Machines 52 3 Methoden und Ergebnisse 53 3.1 Korpusanalytischer Ansatz für die Prüfung der Raumbezugshypothese 53 3.1.1 Netzwerkgrad des Georaumbezuges 53 3.1.2 Datenprozessierung 56 3.1.3 Ergebnisse der NGGR-Berechnung 57 3.1.4 Korrelation zwischen NGGR und den Eigenschaften von Wikipedia-Artikeln 60 3.2 Befragungsansatz für die Prüfung der Raumbezugshypothese 65 3.2.1 Kategorisierungsaufgabe zur Untersuchung des Georaumbezuges 65 3.2.1.1 Material 66 3.2.1.2 Prozedur 66 3.2.1.3 Teilnehmer 67 3.2.2 Hypothesen 68 3.2.3 Daten zur Beteiligung an der Befragung 68 3.2.4 Ergebnisse 70 3.3 Synthese von korpusanalytischem Ansatz und Befragungsansatz für die Prüfung der Raumbezugshypothese 71 3.3.1 Methodik 71 3.3.2 Ergebnisse 72 3.3.3 Einfluss des Faktors Wissen auf die Ergebnisse der Befragung 73 3.3.4 Einfluss des fachlichen Hintergrundes auf die Ergebnisse der Befragung 74 3.3.5 Prädiktion des Anteils raumbezogener Informationen für das gesamte Korpus der deutschen Wikipedia 76 3.4 Klassifikation nutzergenerierter geographischer Informationen hinsichtlich der Korrelation Ort-Inhalt am Beispiel von mobil verfassten Microblogging-Texten 77 3.4.1 Manuelle Textklassifikation 78 3.4.2 Überwachte maschinelle Textklassifikation mit manuell klassifizierten Trainingsdaten 80 3.4.2.1 Vorverarbeitung der Microblogging-Texte 81 3.4.2.2 Evaluation der Ergebnisse der maschinellen Textklassifikation 82 3.4.2.3 Tuning der maschinellen Klassifikation 83 3.4.3 Überwachte maschinelle Textklassifikation mit lexikalischen Trainingsdaten 83 3.4.4 Verwendete Daten 86 3.4.4.1 Aufzeichnung von mobilen Microblogging-Texten mit der Twitter-Streaming-API 86 3.4.4.2 Filterung verwendbarer Microblogging-Texte 87 3.4.4.3 Zeitliche und räumliche Muster der Microblogging-Texte 89 3.4.4.4 Verwendete Points of Interest 91 3.4.5 Ergebnisse 92 3.4.5.1 Manuelle Annotation von Texten 92 3.4.5.2 Überwachte maschinelle Klassifikation von Texten mit manuell klassifizierten Trainingsdaten 95 3.4.5.3 Überwachte maschinelle Klassifikation von Texten mit lexikalischen Trainingsdaten 99 3.5 Bestimmung der Entfernungsabhängigkeit des Anteils von für spezifische Orte relevanten Informationen am Beispiel von mobil verfassten Microblogging-Texten 103 3.5.1 Methodik 103 3.5.2 Ergebnisse 104 4 Diskussion 111 4.1 Methoden zur Prüfung der Raumbezugshypothese am Beispiel des Korpus Wikipedia 111 4.1.1 Wahl des Korpus 111 4.1.2 Abstraktes Konzept und Instanz 112 4.1.3 Korpusanalytischer Ansatz 112 4.1.4 Befragungsansatz 114 4.2 Methoden zur Bestimmung der Korrelation Ort-Inhalt von nutzergenerierten Informationen am Beispiel von mobil erzeugten Microblogging-Texten 115 4.2.1 Manuelle Klassifikation 116 4.2.2 Überwachte maschinelle Klassifikation mit manuell klassifizierten Trainingsdaten 117 4.2.3 Unüberwachte maschinelle Klassifikation mit lexikalischen Trainingsdaten 118 4.2.4 Berechnung der Entfernungsabhängigkeit des Anteils ortsbezogener Texte 119 4.2.5 Points of Interest als Modell für den räumlichen Kontext 120 4.3 Der Begriff ‚Raumbezug‘ im Kontext von nutzergenerierten geographischen Informationen 120 5 Schlussfolgerungen und Forschungsausblick 123 5.1 Beantwortung der Forschungsfragen 123 5.1.1 Zur Überprüfung der Raumbezugshypothese 123 5.1.2 Zur Korrelation von Ort und Inhalt von nutzergenerierten geographischen Informationen 125 5.2 Implikationen der Forschungsergebnisse 128 5.3 Forschungsausblick nutzergenerierte geographische Informationen 130 5.3.1 Qualität von VGI 130 5.3.2 Synthese von VGI mit amtlichen Daten 132 5.3.3 Weitere aktuelle Entwicklungen im Bereich VGI-Forschung 132 6 Literaturverzeichnis 135 7 Anhang 151 Anhang A Dokumentation des „Experiments Geoaumbezug“ 152 Anhang B Ergebnisse der Kategorisierungsaufgabe des „Experiments Georaumbezug“ 157 Anhang C Rückmeldungen der Teilnehmer des „Experiments Georaumbezug“ 163 Anhang D Einfluss der Faktoren fachlicher Hintergrund und Wissen auf die Kategorisierung von Begriffen hinsichtlich ihrer Georäumlichkeit 166 Anhang E Ergebnisse der manuellen Klassifikation der Microblogging-Texte 168 Anhang F Klassifikationsmodelle resultierend aus manuellen und lexikalischen Trainingsdaten 177 Anhang G Forschungsdaten-Anhang 181 / Während der vergangenen zehn Jahre vollzog sich eine signifikante Veränderung des World Wide Webs, das sich zum sogenannten „Web 2.0“ entwickelte. Das wesentlichste Merkmal dieser neuen Qualität des WWW ist die Beteiligung der Nutzer bei der Erstellung der Inhalte. Diese Entwicklung fördert das Entstehen von Nutzergemeinschaften, die kollaborativ in unterschiedlichsten Projekten Informationen sammeln und veröffentlichen. Prominente Beispiele für solche Projekte sind die Online-Enzyklopädie „Wikipedia“, die Microblogging-Plattform „Twitter“, die Foto-Plattform „Flickr“ und die Sammlung topographischer Informationen „OpenStreetMap“. Nutzergenerierte Inhalte, die direkt oder indirekt raumbezogen sind, können spezifischer als „nutzergenerierte geographische Informationen“ bezeichnet werden. Der Raumbezug dieser Informationen entsteht entweder direkt durch die Angabe räumlicher Koordinaten als Metainformationen oder er kann indirekt durch die Georeferenzierung von in den Informationen enthaltenen Toponymen oder Adressen hergestellt werden. Nutzergenerierte geographische Informationen haben für die Forschung den besonderen Vorteil, dass sie einerseits häufig gänzlich ohne oder nur mit geringen Kosten verfügbar gemacht werden können und andererseits eine Vielzahl von menschlichen Entscheidungen widerspiegeln, die mit dem Raum verknüpft sind. In der vorliegenden Dissertation wird die Beziehung von Raum und Inhalt nutzergenerierter geographischer Informationen aus zwei Perspektiven untersucht. Im ersten Teil der Arbeit steht die Frage im Vordergrund, für welchen Anteil an Informationen eine Beziehung zwischen Raum und Informationsinhalt in der Art besteht, dass die Informationen im Georaum lokalisierbar sind. In diesem Zusammenhang existiert seit den 1980er Jahren die unter Nutzern von geographischen Informationssystemen weit verbreitete These, dass 80% aller Informationen einen Raumbezug haben. Diese These dient im gesamten Spektrum der Branche als Marketinginstrument, ist jedoch nicht empirisch belegt. Diese Arbeit trägt dazu bei, die bestehende Forschungslücke zu schließen. Für die Prüfung dieser These, die in der Arbeit als „Raumbezugshypothese“ bezeichnet wird, werden zwei Ansätze vorgestellt. Der erste Ansatz basiert auf der Analyse eines möglichst repräsentativen Informationskorpus, wofür die deutsche Sprachversion der Wikipedia ausgewählt wird. Diese wird als Informationsnetzwerk modelliert, indem deren Artikel als Knoten und deren interne Querverweise als Kanten eines gerichteten Graphen betrachtet werden. Mit Hilfe dieses Netzwerkes ist es möglich eine abgestufte Definition des Raumbezuges von Informationen einzuführen, indem die Entfernung jedes Artikels innerhalb des Netzwerkes zum jeweils nächstgelegenen Artikel, der mit räumlichen Koordinaten gekennzeichnet ist, berechnet wird. Parallel dazu wird ein Befragungsansatz entwickelt, bei dem Probanden die Aufgabe haben, Informationen in die Kategorien „Direkter Raumbezug“, „Indirekter Raumbezug“ und „Kein Raumbezug“ einzuordnen. Die Synthese beider Ansätze führt zu einer empirisch begründeten Zahl für die „Raumbezugsthese“. Das Ergebnis ist, dass für das Untersuchungskorpus Wikipedia 27% der Informationen als direkt raumbezogenen und 30% der Informationen als indirekt raumbezogen kategorisiert werden können. Im zweiten Teil der Arbeit wird die Forschungsfrage untersucht, inwiefern nutzergenerierte Informationen, die über mobile Geräte erzeugt werden, in Beziehung zu den Orten stehen, an denen sie veröffentlicht werden. Als Forschungskorpus dienen mobil verfasste Microblogging-Texte. Dies sind kurze Texte, die über das WWW veröffentlicht werden. Bei dieser Informationsart liegt im Gegensatz zu beispielsweise topographischen Information oder Fotobeschreibungen die Vermutung eines starken Zusammenhanges zwischen dem Inhalt der Informationen und deren Positionen nicht nahe. Die Analyse von Microblogging-Texten bietet unter anderem Potential für die Markt- und Meinungsforschung, die Beobachtung von Naturereignissen und menschlichen Aktivitäten sowie die Entscheidungsunterstützung in Katastrophenfällen. Aus der räumlichen Auswertung kann sich dabei ein Mehrwert ergeben, für einen Teil der Anwendungen ist die räumliche Auswertung sogar die notwendige Voraussetzung. Aus diesem Grund ist die Erforschung des Zusammenhanges der veröffentlichten Inhalte mit den Orten, an denen diese entstehen, von Interesse. In der Arbeit werden eine Methoden vorgestellt, mit deren Hilfe die Untersuchung dieser Korrelation am Beispiel von klassifizierten Points of Interest durchgeführt wird. Zu diesem Zweck werden die Texte mit Hilfe von manueller Klassifikation und maschineller Sprachverarbeitung entsprechend ihrer Relevanz für die getesteten Objektklassen klassifiziert. Anschließend wird geprüft, ob der Anteil der relevanten Texte in der Nähe von Objekten der getesteten Klassen überdurchschnittlich hoch ist. Die Ergebnisse der Untersuchungen zeigen, dass die Stärke der Raum-Inhalt-Korrelation von den getesteten Objektklassen abhängig ist. Während sich beispielsweise bei Bahnhöfen, Flughäfen und Restaurants eine deutliche Abhängigkeit des Anteils der relevanten Texte von der Entfernung zu den betreffenden Objekten zeigt, kann dies für andere Objektklassen, wie z.B. Kino oder Supermarkt nicht bestätigt werden. Da frühere Forschungsarbeiten bei der Analyse im kleinmaßstäbigen Bereich eine Korrelation der Informationsinhalte mit deren Entstehungsorten feststellten, kann geschlussfolgert werden, dass der Zusammenhang zwischen Raum und Inhalt bei Microblogging-Texten sowohl vom Maßstab als auch vom Thema abhängig ist.:1 Einleitung 1 1.1 Motivation 1 1.1.1 Bedeutung raumbezogener nutzergenerierter Inhalte für die geographische Informationswissenschaft und die Kartographie 1 1.1.2 Die Raumbezugshypothese 3 1.1.3 Die Korrelation von Ort und Inhalt bei nutzergenerierten Inhalten 4 1.2 Forschungsziele und Forschungsfragen 5 1.2.1 Prüfung der Raumbezugshypothese 5 1.2.2 Untersuchung der Korrelation von Ort und Inhalt von nutzergenerierten Inhalten 6 1.3 Aufbau der Arbeit 7 1.3.1 Die Beziehung zwischen Raum und Inhalt von nutzergenerierten geographischen Informationen 7 1.3.2 Gliederung der Arbeit 7 1.3.3 Verwendete Publikationen 8 2 Forschungsstand 11 2.1 Relevante Begriffe 11 2.1.1 Web 2.0 11 2.1.2 User Generated Content / Nutzergenerierte Inhalte 12 2.1.2.1 Bedeutung und Begriffsherkunft 12 2.1.2.2 Begriffsklärung 12 2.1.2.3 Arten von UGC 13 2.1.2.4 Kritik 14 2.1.2.5 Forschungspotential 14 2.1.3 Raumbezug 14 2.1.3.1 Der Begriff ‚Raumbezug‘ in der Fachliteratur 14 2.1.3.2 Kategorien des Georaumbezuges 16 2.1.4 Georäumlich 16 2.1.5 Geographische Information und Geodaten 17 2.1.5.1 Begriffsklärung 17 2.1.5.2 Points of Interest als Spezialfall 19 2.1.6 Volunteered Geographic Information / Nutzergenerierte geographische Informationen 19 2.1.6.1 Begriffsherkunft und Charakteristika von VGI 19 2.1.6.2 Das Konzept der menschlichen Sensoren 20 2.1.6.3 Kommunikation geographischer Informationen bei VGI 21 2.1.6.4 Der Mehrwert von VGI 21 2.1.6.5 Motive der Beitragenden 22 2.1.6.6 VGI im globalen Kontext 22 2.1.6.7 Erfassung der Informationen: partizipativ vs. opportunistisch 23 2.1.6.8 Formale Definition 23 2.1.6.9 Deutsche Entsprechung des Begriffs 24 2.1.7 Semantik nutzergenerierter geographischer Informationen 25 2.1.7.1 Strukturierte Form 25 2.1.7.2 Unstrukturierte Form 26 2.2 Arten nutzergenerierter geographischer Informationen 26 2.2.1 Topographische Informationen – OpenStreetMap 28 2.2.1.1 Korpusbeschreibung 28 2.2.1.2 Forschungsüberblick 30 2.2.1.3 Raumbezug 32 2.2.2 Enzyklopädische Informationen – Wikipedia 34 2.2.2.1 Korpusbeschreibung 34 2.2.2.2 Forschungsüberblick 35 2.2.2.3 Raumbezug 36 2.2.2.4 Metaeigenschaften von Artikeln der deutschen Wikipedia 37 2.2.3 Microblogging-Texte – Twitter 39 2.2.3.1 Korpusbeschreibung 39 2.2.3.2 Forschungsüberblick 41 2.2.3.3 Raumbezug 42 2.2.4 Bilder und Bildmetainformationen – Flickr, Instagram, Picasa, Panoramio, Geograph 43 2.2.4.1 Korpusbeschreibung 43 2.2.4.2 Forschungsüberblick 45 2.3 Informationen und Netzwerke 46 2.3.1 Beispiele für Netzwerkstrukturen 46 2.3.2 Implikationen vernetzter Informationen für die Raumbezugshypothese 47 2.3.3 Netzwerkeigenschaften der Wikipedia 47 2.4 Geographische Informationen und Kognition 49 2.5 Informationen klassifizieren durch maschinelle Sprachverarbeitung 50 2.5.1 Naive Bayes 51 2.5.2 Maximum Entropy 51 2.5.3 Support Vector Machines 52 3 Methoden und Ergebnisse 53 3.1 Korpusanalytischer Ansatz für die Prüfung der Raumbezugshypothese 53 3.1.1 Netzwerkgrad des Georaumbezuges 53 3.1.2 Datenprozessierung 56 3.1.3 Ergebnisse der NGGR-Berechnung 57 3.1.4 Korrelation zwischen NGGR und den Eigenschaften von Wikipedia-Artikeln 60 3.2 Befragungsansatz für die Prüfung der Raumbezugshypothese 65 3.2.1 Kategorisierungsaufgabe zur Untersuchung des Georaumbezuges 65 3.2.1.1 Material 66 3.2.1.2 Prozedur 66 3.2.1.3 Teilnehmer 67 3.2.2 Hypothesen 68 3.2.3 Daten zur Beteiligung an der Befragung 68 3.2.4 Ergebnisse 70 3.3 Synthese von korpusanalytischem Ansatz und Befragungsansatz für die Prüfung der Raumbezugshypothese 71 3.3.1 Methodik 71 3.3.2 Ergebnisse 72 3.3.3 Einfluss des Faktors Wissen auf die Ergebnisse der Befragung 73 3.3.4 Einfluss des fachlichen Hintergrundes auf die Ergebnisse der Befragung 74 3.3.5 Prädiktion des Anteils raumbezogener Informationen für das gesamte Korpus der deutschen Wikipedia 76 3.4 Klassifikation nutzergenerierter geographischer Informationen hinsichtlich der Korrelation Ort-Inhalt am Beispiel von mobil verfassten Microblogging-Texten 77 3.4.1 Manuelle Textklassifikation 78 3.4.2 Überwachte maschinelle Textklassifikation mit manuell klassifizierten Trainingsdaten 80 3.4.2.1 Vorverarbeitung der Microblogging-Texte 81 3.4.2.2 Evaluation der Ergebnisse der maschinellen Textklassifikation 82 3.4.2.3 Tuning der maschinellen Klassifikation 83 3.4.3 Überwachte maschinelle Textklassifikation mit lexikalischen Trainingsdaten 83 3.4.4 Verwendete Daten 86 3.4.4.1 Aufzeichnung von mobilen Microblogging-Texten mit der Twitter-Streaming-API 86 3.4.4.2 Filterung verwendbarer Microblogging-Texte 87 3.4.4.3 Zeitliche und räumliche Muster der Microblogging-Texte 89 3.4.4.4 Verwendete Points of Interest 91 3.4.5 Ergebnisse 92 3.4.5.1 Manuelle Annotation von Texten 92 3.4.5.2 Überwachte maschinelle Klassifikation von Texten mit manuell klassifizierten Trainingsdaten 95 3.4.5.3 Überwachte maschinelle Klassifikation von Texten mit lexikalischen Trainingsdaten 99 3.5 Bestimmung der Entfernungsabhängigkeit des Anteils von für spezifische Orte relevanten Informationen am Beispiel von mobil verfassten Microblogging-Texten 103 3.5.1 Methodik 103 3.5.2 Ergebnisse 104 4 Diskussion 111 4.1 Methoden zur Prüfung der Raumbezugshypothese am Beispiel des Korpus Wikipedia 111 4.1.1 Wahl des Korpus 111 4.1.2 Abstraktes Konzept und Instanz 112 4.1.3 Korpusanalytischer Ansatz 112 4.1.4 Befragungsansatz 114 4.2 Methoden zur Bestimmung der Korrelation Ort-Inhalt von nutzergenerierten Informationen am Beispiel von mobil erzeugten Microblogging-Texten 115 4.2.1 Manuelle Klassifikation 116 4.2.2 Überwachte maschinelle Klassifikation mit manuell klassifizierten Trainingsdaten 117 4.2.3 Unüberwachte maschinelle Klassifikation mit lexikalischen Trainingsdaten 118 4.2.4 Berechnung der Entfernungsabhängigkeit des Anteils ortsbezogener Texte 119 4.2.5 Points of Interest als Modell für den räumlichen Kontext 120 4.3 Der Begriff ‚Raumbezug‘ im Kontext von nutzergenerierten geographischen Informationen 120 5 Schlussfolgerungen und Forschungsausblick 123 5.1 Beantwortung der Forschungsfragen 123 5.1.1 Zur Überprüfung der Raumbezugshypothese 123 5.1.2 Zur Korrelation von Ort und Inhalt von nutzergenerierten geographischen Informationen 125 5.2 Implikationen der Forschungsergebnisse 128 5.3 Forschungsausblick nutzergenerierte geographische Informationen 130 5.3.1 Qualität von VGI 130 5.3.2 Synthese von VGI mit amtlichen Daten 132 5.3.3 Weitere aktuelle Entwicklungen im Bereich VGI-Forschung 132 6 Literaturverzeichnis 135 7 Anhang 151 Anhang A Dokumentation des „Experiments Geoaumbezug“ 152 Anhang B Ergebnisse der Kategorisierungsaufgabe des „Experiments Georaumbezug“ 157 Anhang C Rückmeldungen der Teilnehmer des „Experiments Georaumbezug“ 163 Anhang D Einfluss der Faktoren fachlicher Hintergrund und Wissen auf die Kategorisierung von Begriffen hinsichtlich ihrer Georäumlichkeit 166 Anhang E Ergebnisse der manuellen Klassifikation der Microblogging-Texte 168 Anhang F Klassifikationsmodelle resultierend aus manuellen und lexikalischen Trainingsdaten 177 Anhang G Forschungsdaten-Anhang 181

Page generated in 0.0281 seconds