Return to search

Nutzen und Benutzen von Text Mining für die Medienanalyse

Einerseits werden bestehende Ergebnisse aus so unterschiedlichen Richtungen wie etwa der empirischen Medienforschung und dem Text Mining zusammengetragen. Es geht dabei um Inhaltsanalyse, von Hand, mit Unterstützung durch Computer, oder völlig automatisch, speziell auch im Hinblick auf die Faktoren wie Zeit, Entwicklung und Veränderung. Die Verdichtung und Zusammenstellung liefert nicht nur einen Überblick aus ungewohnter Perspektive, in diesem Prozess geschieht auch die Synthese von etwas Neuem.

Die Grundthese bleibt dabei immer eine einschließende: So wenig es möglich scheint, dass in Zukunft der Computer Analysen völlig ohne menschliche Interpretation betreiben kann und wird, so wenig werden menschliche Interpretatoren noch ohne die jeweils bestmögliche Unterstützung des Rechners in der Lage sein, komplexe Themen zeitnah umfassend und ohne allzu große subjektive Einflüsse zu bearbeiten – und so wenig werden es sich substantiell wertvolle Analysen noch leisten können, völlig auf derartige Hilfen und Instrumente der Qualitätssicherung zu verzichten.

Daraus ergeben sich unmittelbar Anforderungen: Es ist zu klären, wo die Stärken und Schwächen von menschlichen Analysten und von Computerverfahren liegen. Darauf aufbauend gilt es eine optimale Synthese aus beider Seiten Stärken und unter Minimierung der jeweiligen Schwächen zu erzielen. Praktisches Ziel ist letztlich die Reduktion von Komplexität und die Ermöglichung eines Ausgangs aus dem Zustand des systembedingten „overnewsed but uninformed“-Seins.:Abbildungsverzeichnis v
Tabellenverzeichnis viii
1 einleitung 1
1.1 Sinn einer wissenschaftlichen Arbeit zu Beginn des
21. Jahrhunderts 1
1.2 Verortung der Arbeit in der Ordnung der Wissenschaften
1
1.3 Vor dem Text 2
1.4 Beitrag zu Forschung und Praxis 3
1.5 Anlage und Aufbau der Arbeit 4
2 grundlagen 5
2.1 Textdaten 5
2.1.1 Zeichen 5
2.1.2 Verweise 6
2.1.3 Encoding 6
2.1.4 Umwandlung 7
2.2 Untersuchungsobjekte 7
2.2.1 Begriffe 7
2.2.2 Verteilung 8
2.2.3 Kookkurrenzen 12
2.3 Exkurs: Ein Verteilungsexperiment 12
2.3.1 Setup 12
2.3.2 Einfluss der Samplegröße 14
2.3.3 Einfluss der Korpusgröße 14
2.3.4 Wiederauftauchen von Types und Kookkurrenzen
14
2.4 Zeit 18
2.4.1 Definition 18
2.4.2 Betrachtungsarten 18
2.4.3 Zeitreihenanalyse 18
2.5 Wahrheit und Information 19
3 zugänge zu text 21
3.1 Inhaltsanalyse 21
3.1.1 Geschichte 21
3.1.2 Vorgehen 22
3.1.3 Kritik 23
3.1.4 Mit Computer 23
3.1.5 Medienresonanzanalyse 24
3.1.6 Exkurs: Automatische Analyse von Meinungen
und Einstellungen 25
3.1.7 Ein anderer Zugang zu Text durch Text Mining
26
3.2 Beispiele 27
3.2.1 Nachrichtensuchmaschinen 27
3.2.2 Nachrichtenzusammenfassungen 28
3.2.3 Nachrichtenüberblicke 29
4 die wörter des tages 34
4.1 Einordnung und Ursprung 34
4.1.1 Projekt Deutscher Wortschatz 34
4.1.2 Idee zu „Wörtern des Tages“ 37
4.1.3 Verwandte Ansätze und Arbeiten 38
4.2 Archivierung 39
4.2.1 Zur Funktion von Archiven 40
4.2.2 Rechtliche Rahmenbedingungen 40
4.3 Implementierung 44
4.3.1 Daten und Datenacquise 45
4.3.2 Vorverarbeitung 50
4.3.3 Linguistische Aufbereitung 54
4.3.4 Tägliche Verarbeitung 58
4.3.5 Präsentation 65
4.3.6 Evaluation 70
4.4 Weiterentwicklungen und Perspektiven 71
4.4.1 Anwendungen 71
4.4.2 Mashup 74
4.4.3 Medien- und Trendanalyse 78
5 schluss 84
a weitere beispiele aus der anwendung 85
a.1 Wirtschaft 85
a.2 Papst: Tod und Neuwahl 87
a.3 Weltsicherheitsrat 93
b listings 94
c datenbankschema 110
d wissenschaftlicher werdegang 112
e publikationen 113
literaturverzeichnis 114

Identiferoai:union.ndltd.org:DRESDEN/oai:qucosa:de:qucosa:11106
Date05 November 2010
CreatorsRichter, Matthias
ContributorsHeyer, Gerhard, Eibl, Maximilian, Wolff, Christian, Universität Leipzig
Source SetsHochschulschriftenserver (HSSS) der SLUB Dresden
LanguageGerman
Detected LanguageGerman
Typedoc-type:doctoralThesis, info:eu-repo/semantics/doctoralThesis, doc-type:Text
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.002 seconds