Ziel dieser Arbeit ist es, Kollokationen auf Satzbasis aus dem Wortschatz-Lexikon Leipzig als Datenbasis nehmend, ein Verfahren zu entwickeln, welches die den Satzkollokationen immanenten Beziehungen zwischen den Wörtern erkennen und handhaben kann. Weiterhin ist es Ziel, diese Beziehungen für wortbedeutungsorientierte Klassifikationsverfahren zu erschliessen und deren unmittelbare Anwendung zu demonstrieren, indem Sachgebietszuweisungen über diese Beziehungen weitervererbt werden können. Es wird gezeigt, dass Cluster in den Satzkollokationen mit einer Approximation für die maximale Clustersuche mit rechnerisch geringem Aufwand gefunden werden können, wenn diese als ein Graph mit der seit kurzem untersuchten small-world Eigenschaft betrachtet werden. Es wird daraufhin ein Disambiguierungsverfahren konstruiert, welches Beziehungen zwischen einem Wort und seinen unmittelbar angrenzenden Clustern berechnet, wobei die verschiedenen Cluster den diversen Gebrauchskontexten und damit auch unter anderem den Bedeutungen des Wortes entsprechen. Dieses Disambiguierungsverfahren dient dann als Grundlage für den Entwurf eines Sachgebietsklassifizierungsverfahrens, welches zu einer inhaltlich homogenen Wortgruppe, zum Beispiel einem Sachgebiet, weitere passende Wörter finden kann. Die vorgeschlagenen Verfahren wurden prototypisch implementiert und Beispiele werden auch im Hinblick auf eine Praxisanwendung diskutiert.
Identifer | oai:union.ndltd.org:DRESDEN/oai:qucosa:de:qucosa:16510 |
Date | 20 October 2017 |
Creators | Bordag, Stefan |
Contributors | Universität Leipzig |
Source Sets | Hochschulschriftenserver (HSSS) der SLUB Dresden |
Language | German |
Detected Language | German |
Type | info:eu-repo/semantics/acceptedVersion, doc-type:masterThesis, info:eu-repo/semantics/masterThesis, doc-type:Text |
Rights | info:eu-repo/semantics/openAccess |
Relation | urn:nbn:de:bsz:15-qucosa2-163403, qucosa:16340 |
Page generated in 0.0017 seconds