Spelling suggestions: "subject:"inhalte"" "subject:"anhalte""
11 |
Neue Musik als Hörhilfe für eine Art der WeltzuwendungWallbaum, Christopher January 2012 (has links)
Die Denkfigur bzw. These des Aufsatzes lässt sich in drei kurzen Sätzen folgendermaßen sagen: (1) Menschen können jedes akustische Ereignis als Musik hören. (2) Denjenigen, die das noch nicht oder nicht jederzeit können, helfen Kompositionen neuer Musik. (3) Musikalisch gebildet bzw. kompetent wären demnach Menschen, wenn sie zum Musik-Hören keine Kompositionen mehr brauchen. Der Text zeigt in Teil 1 anhand von sieben Hörbeispielen (mit Links) verschiedene Arten der Hörhilfe und liefert in Teil 2 künstlerische Beschreibungen und wissenschaftliche Begründungen für die Phänomene, in denen jedes akustische Ereignis als Musik erscheint. Der Text macht die Möglichkeit plausibel, dass der beschriebenen Art der Weltzuwendung das leitende Interesse neuer Musik des 20. Jahrhunderts galt/gilt. / The mental figure or thesis of the paper can be told in three sentences: (1) People can perceive any acoustic event as music. (2) Compositions of experimental music do help those people, who cannot or cannot always perceive that way. (3) Therefore we can call people well educated and competent in music, as soon as they don’t need compositions any more to be able to listen to music. In part 1 the paper gives seven pieces of music (incl. links) as examples for different kinds of hearing aid. Part 2 gives artificial descriptions of and scientific reasons for the musical phenomena, which we perceive in this aesthetic attitude. The paper suggests, that in the end the described way of perceiving was/is the central interest of experimental music of the 20th century.
|
12 |
Detection, Modelling and Visualisation of Georeferenced Emotions from User-Generated Content / Detektion, Modellierung und Visualisierung ortsbezogener Emotionen aus nutzergenerierten InhaltenHauthal, Eva 20 April 2015 (has links) (PDF)
In recent years emotion-related applications like smartphone apps that document and analyse the emotions of the user, have become very popular. But research also can deal with human emotions in a very technology-driven approach. Thus space-related emotions are of interest as well which can be visualised cartographically and can be captured in different ways.
The research project of this dissertation deals with the extraction of georeferenced emotions from the written language in the metadata of Flickr and Panoramio photos, thus from user-generated content, as well as with their modelling and visualisation. Motivation is the integration of an emotional component into location-based services for tourism since only factual information is considered thus far although places have an emotional impact.
The metadata of those user-generated photos contain descriptions of the place that is depicted within the respective picture. The words used have affective connotations which are determined with the help of emotional word lists. The emotion that is associated with the particular word in the word list is described on the basis of the two dimensions ‘valence’ and ‘arousal’. Together with the coordinates of the respective photo, the extracted emotion forms a georeferenced emotion. The algorithm that was developed for the extraction of these emotions applies different approaches from the field of computer linguistics and considers grammatical special cases like the amplification or negation of words.
The algorithm was applied to a dataset of Flickr and Panoramio photos of Dresden (Germany). The results are an emotional characterisation of space which makes it possible to assess and investigate specific features of georeferenced emotions. These features are especially related to the temporal dependence and the temporal reference of emotions on one hand; on the other hand collectively and individually perceived emotions have to be distinguished. As a consequence, a place does not necessarily have to be connected with merely one emotion but possibly also with several. The analysis was carried out with the help of different cartographic visualisations. The temporal occurrence of georeferenced emotions was examined detailed.
Hence the dissertation focuses on fundamental research into the extraction of space-related emotions from georeferenced user-generated content as well as their visualisation. However as an outlook, further research questions and core themes are identified which arose during the investigations. This shows that this subject is far from being exhausted. / In den letzten Jahren sind emotionsbezogene Anwendungen, wie Apps, die die Emotionen des Nutzers dokumentieren und analysieren, sehr populär geworden. Ebenfalls in der Forschung sind Emotionen in einem sehr technologiegetriebenen Ansatz ein Thema. So auch ortsbezogene Emotionen, die sich somit kartographisch darstellen lassen und auf verschiedene Art und Weisen gewonnen werden können.
Das Forschungsvorhaben der Dissertation befasst sich mit der Extraktion von georeferenzierten Emotionen aus geschriebener Sprache unter Verwendung von Metadaten verorteter Flickr- und Panoramio-Fotos, d.h. aus nutzergenerierten Inhalten, sowie deren Modellierung und Visualisierung. Motivation hierfür ist die Einbindung einer emotionalen Komponente in ortsbasierte touristische Dienste, da diese bisher nur faktische Informationen berücksichtigen, obwohl Orte durchaus eine emotionale Wirkung haben.
Die Metadaten dieser nutzergenerierten Inhalte stellen Beschreibungen des auf dem Foto festgehaltenen Ortes dar. Die dafür verwendeten Wörter besitzen affektive Konnotationen, welche mit Hilfe emotionaler Wortlisten ermittelt werden. Die Emotion, die mit dem jeweiligen Wort in der Wortliste assoziiert wird, wird anhand der zwei Dimensionen Valenz und Erregung beschrieben. Die extrahierten Emotionen bilden zusammen mit der geographischen Koordinate des jeweiligen Fotos eine georeferenzierte Emotion. Der zur Extraktion dieser Emotionen entwickelte Algorithmus bringt verschiedene Ansätze aus dem Bereich der Computerlinguistik zum Einsatz und berücksichtigt ebenso grammatikalische Sonderfälle, wie Intensivierung oder Negation von Wörtern.
Der Algorithmus wurde auf einen Datensatz von Flickr- und Panoramio-Fotos von Dresden angewendet. Die Ergebnisse stellen eine emotionale Raumcharakterisierung dar und ermöglichen es, spezifische Eigenschaften verorteter Emotionen festzustellen und zu untersuchen. Diese Eigenschaften beziehen sich sowohl auf die zeitliche Abhängigkeit und den zeitlichen Bezug von Emotionen, als auch darauf, dass zwischen kollektiv und individuell wahrgenommenen Emotionen unterschieden werden muss. Das bedeutet, dass ein Ort nicht nur mit einer Emotion verbunden sein muss, sondern möglicherweise auch mit mehreren. Die Auswertung erfolgte mithilfe verschiedener kartographischer Visualisierungen. Eingehender wurde das zeitliche Auftreten der ortsbezogenen Emotionen untersucht.
Der Fokus der Dissertation liegt somit auf der Grundlagenforschung zur Extraktion verorteter Emotionen aus georeferenzierten nutzergenerierten Inhalten sowie deren Visualisierung. Im Ausblick werden jedoch weitere Fragestellungen und Schwerpunkte genannt, die sich im Laufe der Untersuchungen ergeben haben, womit gezeigt wird, dass dieses Forschungsgebiet bei Weitem noch nicht ausgeschöpft ist.
|
13 |
Community based Question Answer DetectionMuthmann, Klemens 02 July 2014 (has links) (PDF)
Each day, millions of people ask questions and search for answers on the World Wide Web. Due to this, the Internet has grown to a world wide database of questions and answers, accessible to almost everyone. Since this database is so huge, it is hard to find out whether a question has been answered or even asked before. As a consequence, users are asking the same questions again and again, producing a vicious circle of new content which hides the important information.
One platform for questions and answers are Web forums, also known as discussion boards. They present discussions as item streams where each item contains the contribution of one author. These contributions contain questions and answers in human readable form.
People use search engines to search for information on such platforms. However, current search engines are neither optimized to highlight individual questions and answers nor to show which questions are asked often and which ones are already answered.
In order to close this gap, this thesis introduces the \\emph{Effingo} system. The Effingo system is intended to extract forums from around the Web and find question and answer items. It also needs to link equal questions and aggregate associated answers. That way it is possible to find out whether a question has been asked before and whether it has already been answered. Based on these information it is possible to derive the most urgent questions from the system, to determine which ones are new and which ones are discussed and answered frequently. As a result, users are prevented from creating useless discussions, thus reducing the server load and information overload for further searches.
The first research area explored by this thesis is forum data extraction. The results from this area are intended be used to create a database of forum posts as large as possible. Furthermore, it uses question-answer detection in order to find out which forum items are questions and which ones are answers and, finally, topic detection to aggregate questions on the same topic as well as discover duplicate answers. These areas are either extended by Effingo, using forum specific features such as the user graph, forum item relations and forum link structure, or adapted as a means to cope with the specific problems created by user generated content. Such problems arise from poorly written and very short texts as well as from hidden or distributed information.
|
14 |
Inhaltezentrierte Virtuelle GemeinschaftenStreng, Sara, Ahrens, Sophie, Anton, Katharina, Küpper, Axel 29 April 2014 (has links) (PDF)
No description available.
|
15 |
Community based Question Answer DetectionMuthmann, Klemens 10 January 2014 (has links)
Each day, millions of people ask questions and search for answers on the World Wide Web. Due to this, the Internet has grown to a world wide database of questions and answers, accessible to almost everyone. Since this database is so huge, it is hard to find out whether a question has been answered or even asked before. As a consequence, users are asking the same questions again and again, producing a vicious circle of new content which hides the important information.
One platform for questions and answers are Web forums, also known as discussion boards. They present discussions as item streams where each item contains the contribution of one author. These contributions contain questions and answers in human readable form.
People use search engines to search for information on such platforms. However, current search engines are neither optimized to highlight individual questions and answers nor to show which questions are asked often and which ones are already answered.
In order to close this gap, this thesis introduces the \\emph{Effingo} system. The Effingo system is intended to extract forums from around the Web and find question and answer items. It also needs to link equal questions and aggregate associated answers. That way it is possible to find out whether a question has been asked before and whether it has already been answered. Based on these information it is possible to derive the most urgent questions from the system, to determine which ones are new and which ones are discussed and answered frequently. As a result, users are prevented from creating useless discussions, thus reducing the server load and information overload for further searches.
The first research area explored by this thesis is forum data extraction. The results from this area are intended be used to create a database of forum posts as large as possible. Furthermore, it uses question-answer detection in order to find out which forum items are questions and which ones are answers and, finally, topic detection to aggregate questions on the same topic as well as discover duplicate answers. These areas are either extended by Effingo, using forum specific features such as the user graph, forum item relations and forum link structure, or adapted as a means to cope with the specific problems created by user generated content. Such problems arise from poorly written and very short texts as well as from hidden or distributed information.
|
16 |
Extraktion geographischer Entitäten zur Suche nutzergenerierter Inhalte für NachrichtenereignisseKatz, Philipp 22 October 2014 (has links)
Der Einfluss sogenannter nutzergenerierter Inhalte im Web hat in den letzten Jahren stetig zugenommen. Auf Plattformen wie Blogs, sozialen Netzwerken oder Medienportalen werden durch Anwender kontinuierlich Textnachrichten, Bilder oder Videos publiziert. Auch Inhalte, die aktuelle gesellschaftliche Ereignisse, wie beispielsweise den Euromaidan in Kiew dokumentieren, werden durch diese Plattformen verbreitet. Nutzergenerierte Inhalte bieten folglich das Potential, zusätzliche Hintergrundinformationen über Ereignisse direkt vom Ort des Geschehens zu liefern.
Diese Arbeit verfolgt die Vision einer Nachrichtenplattform, die unter Verwendung von Methoden des Information Retrievals und der Informationsextraktion Nachrichtenereignisse erkennt, diese automatisiert mit relevanten nutzergenerierten Inhalten anreichert und dem Leser präsentiert.
Zur Suche nutzergenerierter Inhalte kommen in dieser Arbeit maßgeblich geographische Entitäten, also Ortsbezeichnungen zum Einsatz. Für die Extraktion dieser Entitäten aus gegebenen Nachrichtendokumenten stellt die Arbeit verschiedene neue Methoden vor. Die Entitäten werden genutzt, um zielgerichtete Suchanfragen zu erzeugen. Es wird gezeigt, dass sich eine geounterstützte Suche für das Auffinden nutzergenerierter Inhalte besser eignet als eine konventionelle schlüsselwortbasierte Suche.
|
17 |
Detection, Modelling and Visualisation of Georeferenced Emotions from User-Generated ContentHauthal, Eva 24 February 2015 (has links)
In recent years emotion-related applications like smartphone apps that document and analyse the emotions of the user, have become very popular. But research also can deal with human emotions in a very technology-driven approach. Thus space-related emotions are of interest as well which can be visualised cartographically and can be captured in different ways.
The research project of this dissertation deals with the extraction of georeferenced emotions from the written language in the metadata of Flickr and Panoramio photos, thus from user-generated content, as well as with their modelling and visualisation. Motivation is the integration of an emotional component into location-based services for tourism since only factual information is considered thus far although places have an emotional impact.
The metadata of those user-generated photos contain descriptions of the place that is depicted within the respective picture. The words used have affective connotations which are determined with the help of emotional word lists. The emotion that is associated with the particular word in the word list is described on the basis of the two dimensions ‘valence’ and ‘arousal’. Together with the coordinates of the respective photo, the extracted emotion forms a georeferenced emotion. The algorithm that was developed for the extraction of these emotions applies different approaches from the field of computer linguistics and considers grammatical special cases like the amplification or negation of words.
The algorithm was applied to a dataset of Flickr and Panoramio photos of Dresden (Germany). The results are an emotional characterisation of space which makes it possible to assess and investigate specific features of georeferenced emotions. These features are especially related to the temporal dependence and the temporal reference of emotions on one hand; on the other hand collectively and individually perceived emotions have to be distinguished. As a consequence, a place does not necessarily have to be connected with merely one emotion but possibly also with several. The analysis was carried out with the help of different cartographic visualisations. The temporal occurrence of georeferenced emotions was examined detailed.
Hence the dissertation focuses on fundamental research into the extraction of space-related emotions from georeferenced user-generated content as well as their visualisation. However as an outlook, further research questions and core themes are identified which arose during the investigations. This shows that this subject is far from being exhausted.:Statement of Authorship I
Acknowledgements II
Abstract III
Zusammenfassung V
Table of Contents VII
List of Figures XI
List of Tables XIV
List of Abbreviations XV
1 Introduction 1
1.1 Motivation 1
1.2 Research Questions 3
1.3 Thesis Structure 4
1.4 Underlying Publications 4
2 State of the Art 6
2.1 Emotions 6
2.1.1 Definitions and Terms 6
2.1.2 Emotion Theories 7
2.1.2.1 James-Lange Theory 9
2.1.2.2 Two-Factor Theory 9
2.1.3 Structuring Emotions 9
2.1.3.1 Dimensional Approaches 10
2.1.3.2 Basic Emotions 11
2.1.3.3 Empirical Similarity Categories 12
2.1.4 Acquisition of Emotions 14
2.1.4.1 Verbal Procedures 14
2.1.4.2 Non-Verbal Procedures 14
2.1.5 Relation between Emotions and Places 15
2.1.6 Emotions in Language 17
2.1.7 Affect Analysis and Sentiment Analysis 20
2.2 User-Generated Content 22
2.2.1 Definition and Characterisation 22
2.2.2 Advantages and Disadvantages 23
2.2.3 Tagging 24
2.2.4 Inaccuracies 28
2.2.5 Flickr and Panoramio 29
2.2.5.1 Flickr 30
2.2.5.2 Panoramio 31
2.3 Related Work on Georeferenced Emotions 32
2.3.1 Emotional Data Resulting from Biometric Measurements 33
2.3.1.1 Bio Mapping 33
2.3.1.2 EmBaGIS 34
2.3.1.3 Ein emotionales Kiezportrait 35
2.3.2 Emotional Data Resulting from Empirical Surveys 35
2.3.2.1 EmoMap 35
2.3.2.2 WiMo 36
2.3.2.3 ECDESUP 37
2.3.2.4 Map of World Happiness 38
2.3.2.5 Emotional Study of Yeongsan River Basin 39
2.3.3 Emotional Data Resulting from User-Generated Content 40
2.3.3.1 Emography 40
2.3.3.2 Twittermood 40
2.3.3.3 Tweetbeat 42
2.3.3.4 Beautiful picture of an ugly place 42
2.3.4 Visualisation in the Related Work 43
3 Methods 45
3.1 Approach for Extracting Georeferenced Emotions from the Metadata
of Flickr and Panoramio Photos 45
3.2 Implemented Algorithm 45
3.3 Grammatical Special Cases 47
3.3.1 Degree Words 48
3.3.2 Negation 52
3.3.2.1 Syntactic Negation in English Language 55
3.3.2.2 Syntactic Negation in German Language 57
3.3.3 Modification of Words Affected by Grammatical Special Cases 60
4 Visualisation and Analysis of Extracted Georeferenced Emotions 62
4.1 Data Basis 62
4.2 Density Maps 67
4.3 Inverse Distance Weight 71
4.4 3D Visualisation 73
4.5 Choropleth Mapping 74
4.6 Point Symbols 78
4.7 Impact of Considering Grammatical Special Cases 80
5 Investigation in Temporal Aspects 85
5.1 Annually Occurrence of Emotions 85
5.2 Periodic Events 87
5.3 Single Events 91
5.4 Dependence of Georeferenced Emotions on Different Periods of Time 93
5.4.1 Seasons 95
5.4.2 Months 96
5.4.3 Weekdays 98
5.4.4 Times of Day 99
5.5 Potentials and Limits of Temporal Analyses 99
6 Discussion 100
6.1 Evaluation 100
6.2 Weaknesses and Problems 102
7 Conclusions and Outlook 105
7.1 Answers to the Research Questions 105
7.2 Outlook and Future Work 107
8 Bibliography 112
Appendices XVI / In den letzten Jahren sind emotionsbezogene Anwendungen, wie Apps, die die Emotionen des Nutzers dokumentieren und analysieren, sehr populär geworden. Ebenfalls in der Forschung sind Emotionen in einem sehr technologiegetriebenen Ansatz ein Thema. So auch ortsbezogene Emotionen, die sich somit kartographisch darstellen lassen und auf verschiedene Art und Weisen gewonnen werden können.
Das Forschungsvorhaben der Dissertation befasst sich mit der Extraktion von georeferenzierten Emotionen aus geschriebener Sprache unter Verwendung von Metadaten verorteter Flickr- und Panoramio-Fotos, d.h. aus nutzergenerierten Inhalten, sowie deren Modellierung und Visualisierung. Motivation hierfür ist die Einbindung einer emotionalen Komponente in ortsbasierte touristische Dienste, da diese bisher nur faktische Informationen berücksichtigen, obwohl Orte durchaus eine emotionale Wirkung haben.
Die Metadaten dieser nutzergenerierten Inhalte stellen Beschreibungen des auf dem Foto festgehaltenen Ortes dar. Die dafür verwendeten Wörter besitzen affektive Konnotationen, welche mit Hilfe emotionaler Wortlisten ermittelt werden. Die Emotion, die mit dem jeweiligen Wort in der Wortliste assoziiert wird, wird anhand der zwei Dimensionen Valenz und Erregung beschrieben. Die extrahierten Emotionen bilden zusammen mit der geographischen Koordinate des jeweiligen Fotos eine georeferenzierte Emotion. Der zur Extraktion dieser Emotionen entwickelte Algorithmus bringt verschiedene Ansätze aus dem Bereich der Computerlinguistik zum Einsatz und berücksichtigt ebenso grammatikalische Sonderfälle, wie Intensivierung oder Negation von Wörtern.
Der Algorithmus wurde auf einen Datensatz von Flickr- und Panoramio-Fotos von Dresden angewendet. Die Ergebnisse stellen eine emotionale Raumcharakterisierung dar und ermöglichen es, spezifische Eigenschaften verorteter Emotionen festzustellen und zu untersuchen. Diese Eigenschaften beziehen sich sowohl auf die zeitliche Abhängigkeit und den zeitlichen Bezug von Emotionen, als auch darauf, dass zwischen kollektiv und individuell wahrgenommenen Emotionen unterschieden werden muss. Das bedeutet, dass ein Ort nicht nur mit einer Emotion verbunden sein muss, sondern möglicherweise auch mit mehreren. Die Auswertung erfolgte mithilfe verschiedener kartographischer Visualisierungen. Eingehender wurde das zeitliche Auftreten der ortsbezogenen Emotionen untersucht.
Der Fokus der Dissertation liegt somit auf der Grundlagenforschung zur Extraktion verorteter Emotionen aus georeferenzierten nutzergenerierten Inhalten sowie deren Visualisierung. Im Ausblick werden jedoch weitere Fragestellungen und Schwerpunkte genannt, die sich im Laufe der Untersuchungen ergeben haben, womit gezeigt wird, dass dieses Forschungsgebiet bei Weitem noch nicht ausgeschöpft ist.:Statement of Authorship I
Acknowledgements II
Abstract III
Zusammenfassung V
Table of Contents VII
List of Figures XI
List of Tables XIV
List of Abbreviations XV
1 Introduction 1
1.1 Motivation 1
1.2 Research Questions 3
1.3 Thesis Structure 4
1.4 Underlying Publications 4
2 State of the Art 6
2.1 Emotions 6
2.1.1 Definitions and Terms 6
2.1.2 Emotion Theories 7
2.1.2.1 James-Lange Theory 9
2.1.2.2 Two-Factor Theory 9
2.1.3 Structuring Emotions 9
2.1.3.1 Dimensional Approaches 10
2.1.3.2 Basic Emotions 11
2.1.3.3 Empirical Similarity Categories 12
2.1.4 Acquisition of Emotions 14
2.1.4.1 Verbal Procedures 14
2.1.4.2 Non-Verbal Procedures 14
2.1.5 Relation between Emotions and Places 15
2.1.6 Emotions in Language 17
2.1.7 Affect Analysis and Sentiment Analysis 20
2.2 User-Generated Content 22
2.2.1 Definition and Characterisation 22
2.2.2 Advantages and Disadvantages 23
2.2.3 Tagging 24
2.2.4 Inaccuracies 28
2.2.5 Flickr and Panoramio 29
2.2.5.1 Flickr 30
2.2.5.2 Panoramio 31
2.3 Related Work on Georeferenced Emotions 32
2.3.1 Emotional Data Resulting from Biometric Measurements 33
2.3.1.1 Bio Mapping 33
2.3.1.2 EmBaGIS 34
2.3.1.3 Ein emotionales Kiezportrait 35
2.3.2 Emotional Data Resulting from Empirical Surveys 35
2.3.2.1 EmoMap 35
2.3.2.2 WiMo 36
2.3.2.3 ECDESUP 37
2.3.2.4 Map of World Happiness 38
2.3.2.5 Emotional Study of Yeongsan River Basin 39
2.3.3 Emotional Data Resulting from User-Generated Content 40
2.3.3.1 Emography 40
2.3.3.2 Twittermood 40
2.3.3.3 Tweetbeat 42
2.3.3.4 Beautiful picture of an ugly place 42
2.3.4 Visualisation in the Related Work 43
3 Methods 45
3.1 Approach for Extracting Georeferenced Emotions from the Metadata
of Flickr and Panoramio Photos 45
3.2 Implemented Algorithm 45
3.3 Grammatical Special Cases 47
3.3.1 Degree Words 48
3.3.2 Negation 52
3.3.2.1 Syntactic Negation in English Language 55
3.3.2.2 Syntactic Negation in German Language 57
3.3.3 Modification of Words Affected by Grammatical Special Cases 60
4 Visualisation and Analysis of Extracted Georeferenced Emotions 62
4.1 Data Basis 62
4.2 Density Maps 67
4.3 Inverse Distance Weight 71
4.4 3D Visualisation 73
4.5 Choropleth Mapping 74
4.6 Point Symbols 78
4.7 Impact of Considering Grammatical Special Cases 80
5 Investigation in Temporal Aspects 85
5.1 Annually Occurrence of Emotions 85
5.2 Periodic Events 87
5.3 Single Events 91
5.4 Dependence of Georeferenced Emotions on Different Periods of Time 93
5.4.1 Seasons 95
5.4.2 Months 96
5.4.3 Weekdays 98
5.4.4 Times of Day 99
5.5 Potentials and Limits of Temporal Analyses 99
6 Discussion 100
6.1 Evaluation 100
6.2 Weaknesses and Problems 102
7 Conclusions and Outlook 105
7.1 Answers to the Research Questions 105
7.2 Outlook and Future Work 107
8 Bibliography 112
Appendices XVI
|
18 |
Inhaltezentrierte Virtuelle GemeinschaftenStreng, Sara, Ahrens, Sophie, Anton, Katharina, Küpper, Axel January 2008 (has links)
No description available.
|
19 |
Nationale und regionale Identität von Fernsehprogrammen. Eine Analyse der Programminhalte von ZDF, ORF 2, BR und MDR. / National and Regionale Identity of TV Programmes. A Content Analysis of the TV Channels of ZDF, ORF 2, BR and MDR.Ihle, Holger 13 May 2011 (has links)
No description available.
|
20 |
Zur Beziehung von Raum und Inhalt nutzergenerierter geographischer InformationenHahmann, Stefan 21 July 2014 (has links) (PDF)
In the last ten years there has been a significant progress of the World Wide Web, which evolved to become the so-called “Web 2.0”. The most important feature of this new quality of the WWW is the participation of the users in generating contents. This trend facilitates the formation of user communities which collaborate on diverse projects, where they collect and publish information. Prominent examples of such projects are the online-encyclopedia “Wikipedia”, the microblogging-platform “Twitter”, the photo-platform “Flickr” and the database of topographic information “OpenStreetMap”.
User-generated content, which is directly or indirectly geospatially referenced, is of-ten termed more specifically as “volunteered geographic information”. The geospatial reference of this information is constituted either directly by coordinates that are given as meta-information or indirectly through georeferencing of toponyms or addresses that are contained in this information.
Volunteered geographic information is particularly suited for research, as it can be accessed with low or even at no costs at all. Furthermore it reflects a variety of human decisions which are linked to geographic space. In this thesis, the relationship of space and content of volunteered geographic information is investigated from two different perspectives.
The first part of this thesis addresses the question for which share of information there exists a relationship between space and content of the information, such that the information is locatable in geospace. In this context, the assumption that about 80% of all information has a reference to space has been well known within the community of geographic information system users. Since the 1980s it has served as a marketing tool within the whole geoinformation sector, although there has not been any empirical evidence. This thesis contributes to fill this research gap.
For the validation of the ‘80%-hypothesis’ two approaches are presented. The first approach is based on a corpus of information that is as representative as possible for world knowledge. For this purpose the German language edition of Wikipedia has been selected. This corpus is modeled as a network of information where the articles are considered the nodes and the cross references are considered the edges of a directed graph. With the help of this network a graduated definition of geospatial references is possible. It is implemented by computing the distance of each article to its closest article within the network that is assigned with spatial coordinates. Parallel to this, a survey-based approach is developed where participants have the task to assign pieces of information to one of the categories “direct geospatial reference”, “indirect geospatial reference” and “no geospatial reference”. A synthesis of both approaches leads to an empirically justified figure for the “80%-assertion”. The result of the investigation is that for the corpus of Wikipedia 27% of the information may be categorized as directly geospatially referenced and 30% of the information may be categorized as indirectly geospatially referenced.
In the second part of the thesis the question is investigated in how far volunteered geographic information that is produced on mobile devices is related to the locations where it is published. For this purpose, a collection of microblogging-texts produced on mobile devices serve as research corpus. Microblogging-texts are short texts that are published via the World Wide Web. For this type of information the relationship be-tween the content of the information and their position is less obvious than e.g. for topographic information or photo descriptions.
The analysis of microblogging-texts offers new possibilities for market and opinion research, the monitoring of natural events and human activities as well as for decision support in disaster management. The spatial analysis of the texts may add extra value. In fact for some of the applications the spatial analysis is a necessary condition. For this reason, the investigation of the relationship of the published contents with the locations where they are generated is of interest.
Within this thesis, methods are described that support the investigation of this relationship. In the presented approach, classified Points of Interest serve as a model for the environment. For the purpose of the investigation of the correlation between these points and the microblogging-texts, manual classification and natural language processing are used in order to classify these texts according to their relevance in regard to the respective feature classes. Subsequently, it is tested whether the share of relevant texts in the proximity of objects of the tested classes is above average. The results of the investigation show that the strength of the location-content-correlation depends on the tested feature class. While for the feature classes ‘train station’, ‘airport’ and ‘restaurant’ a significant dependency of the share of relevant texts on the distance to the respective objects may be observed, this is not confirmed for objects of other feature classes, such as ‘cinema’ and ‘supermarket’. However, as prior research that describes investigations on small cartographic scale has detected correlations between space and content of microblogging-texts, it can be concluded that the strength of the correlation between space and content of microblogging-texts depends on scale and topic. / Während der vergangenen zehn Jahre vollzog sich eine signifikante Veränderung des World Wide Webs, das sich zum sogenannten „Web 2.0“ entwickelte. Das wesentlichste Merkmal dieser neuen Qualität des WWW ist die Beteiligung der Nutzer bei der Erstellung der Inhalte. Diese Entwicklung fördert das Entstehen von Nutzergemeinschaften, die kollaborativ in unterschiedlichsten Projekten Informationen sammeln und veröffentlichen. Prominente Beispiele für solche Projekte sind die Online-Enzyklopädie „Wikipedia“, die Microblogging-Plattform „Twitter“, die Foto-Plattform „Flickr“ und die Sammlung topographischer Informationen „OpenStreetMap“.
Nutzergenerierte Inhalte, die direkt oder indirekt raumbezogen sind, können spezifischer als „nutzergenerierte geographische Informationen“ bezeichnet werden. Der Raumbezug dieser Informationen entsteht entweder direkt durch die Angabe räumlicher Koordinaten als Metainformationen oder er kann indirekt durch die Georeferenzierung von in den Informationen enthaltenen Toponymen oder Adressen hergestellt werden.
Nutzergenerierte geographische Informationen haben für die Forschung den besonderen Vorteil, dass sie einerseits häufig gänzlich ohne oder nur mit geringen Kosten verfügbar gemacht werden können und andererseits eine Vielzahl von menschlichen Entscheidungen widerspiegeln, die mit dem Raum verknüpft sind. In der vorliegenden Dissertation wird die Beziehung von Raum und Inhalt nutzergenerierter geographischer Informationen aus zwei Perspektiven untersucht.
Im ersten Teil der Arbeit steht die Frage im Vordergrund, für welchen Anteil an Informationen eine Beziehung zwischen Raum und Informationsinhalt in der Art besteht, dass die Informationen im Georaum lokalisierbar sind. In diesem Zusammenhang existiert seit den 1980er Jahren die unter Nutzern von geographischen Informationssystemen weit verbreitete These, dass 80% aller Informationen einen Raumbezug haben. Diese These dient im gesamten Spektrum der Branche als Marketinginstrument, ist jedoch nicht empirisch belegt. Diese Arbeit trägt dazu bei, die bestehende Forschungslücke zu schließen.
Für die Prüfung dieser These, die in der Arbeit als „Raumbezugshypothese“ bezeichnet wird, werden zwei Ansätze vorgestellt. Der erste Ansatz basiert auf der Analyse eines möglichst repräsentativen Informationskorpus, wofür die deutsche Sprachversion der Wikipedia ausgewählt wird. Diese wird als Informationsnetzwerk modelliert, indem deren Artikel als Knoten und deren interne Querverweise als Kanten eines gerichteten Graphen betrachtet werden. Mit Hilfe dieses Netzwerkes ist es möglich eine abgestufte Definition des Raumbezuges von Informationen einzuführen, indem die Entfernung jedes Artikels innerhalb des Netzwerkes zum jeweils nächstgelegenen Artikel, der mit räumlichen Koordinaten gekennzeichnet ist, berechnet wird. Parallel dazu wird ein Befragungsansatz entwickelt, bei dem Probanden die Aufgabe haben, Informationen in die Kategorien „Direkter Raumbezug“, „Indirekter Raumbezug“ und „Kein Raumbezug“ einzuordnen. Die Synthese beider Ansätze führt zu einer empirisch begründeten Zahl für die „Raumbezugsthese“. Das Ergebnis ist, dass für das Untersuchungskorpus Wikipedia 27% der Informationen als direkt raumbezogenen und 30% der Informationen als indirekt raumbezogen kategorisiert werden können.
Im zweiten Teil der Arbeit wird die Forschungsfrage untersucht, inwiefern nutzergenerierte Informationen, die über mobile Geräte erzeugt werden, in Beziehung zu den Orten stehen, an denen sie veröffentlicht werden. Als Forschungskorpus dienen mobil verfasste Microblogging-Texte. Dies sind kurze Texte, die über das WWW veröffentlicht werden. Bei dieser Informationsart liegt im Gegensatz zu beispielsweise topographischen Information oder Fotobeschreibungen die Vermutung eines starken Zusammenhanges zwischen dem Inhalt der Informationen und deren Positionen nicht nahe.
Die Analyse von Microblogging-Texten bietet unter anderem Potential für die Markt- und Meinungsforschung, die Beobachtung von Naturereignissen und menschlichen Aktivitäten sowie die Entscheidungsunterstützung in Katastrophenfällen. Aus der räumlichen Auswertung kann sich dabei ein Mehrwert ergeben, für einen Teil der Anwendungen ist die räumliche Auswertung sogar die notwendige Voraussetzung. Aus diesem Grund ist die Erforschung des Zusammenhanges der veröffentlichten Inhalte mit den Orten, an denen diese entstehen, von Interesse.
In der Arbeit werden eine Methoden vorgestellt, mit deren Hilfe die Untersuchung dieser Korrelation am Beispiel von klassifizierten Points of Interest durchgeführt wird. Zu diesem Zweck werden die Texte mit Hilfe von manueller Klassifikation und maschineller Sprachverarbeitung entsprechend ihrer Relevanz für die getesteten Objektklassen klassifiziert. Anschließend wird geprüft, ob der Anteil der relevanten Texte in der Nähe von Objekten der getesteten Klassen überdurchschnittlich hoch ist. Die Ergebnisse der Untersuchungen zeigen, dass die Stärke der Raum-Inhalt-Korrelation von den getesteten Objektklassen abhängig ist. Während sich beispielsweise bei Bahnhöfen, Flughäfen und Restaurants eine deutliche Abhängigkeit des Anteils der relevanten Texte von der Entfernung zu den betreffenden Objekten zeigt, kann dies für andere Objektklassen, wie z.B. Kino oder Supermarkt nicht bestätigt werden. Da frühere Forschungsarbeiten bei der Analyse im kleinmaßstäbigen Bereich eine Korrelation der Informationsinhalte mit deren Entstehungsorten feststellten, kann geschlussfolgert werden, dass der Zusammenhang zwischen Raum und Inhalt bei Microblogging-Texten sowohl vom Maßstab als auch vom Thema abhängig ist.
|
Page generated in 0.0395 seconds