Return to search

Klassifikation von Dokumenten mit statistischen und regelbasierten Verfahren

Das Ziel dieser Arbeit ist die Entwicklung eines Indexierungssytems zur eindeutigen Klassifikation von Dokumenten anhand einer vorgegebenen Zahl von Klassen. Die Grundlage zum Aufbau des Klassifikationssystems bilden allgemeine Indexierungsysteme für Dokumente. Diese allgemeinen Systeme werden für die Klassifikation modifiziert, um die Verarbeitung der Dokumente zu beschleunigen und die Klassifikationsergebnisse zu präzisieren. Diese optimierten Methoden zur Indexierung sowie der kombinierte Einsatz von statistischen und regelbasierten Verfahren zur Bewertung von Dokumenten bilden die Basis des Klassifikationssystems. Zudem werden spezielle Techniken zur eindeutigen Klassifikation von Dokumenten erarbeitet, wobei besonderes Augenmerk auf die Transparenz des Klassifikationsprozesses für den Benutzer des Systems gelegt wurde. Die positiven Ergebnisse, die erste Tests des Klassifikationssystems am Beispiel von Kundenbriefen eines Versicherungsunternehmens lieferten, rechtfertigen seine Erprobung in der Praxis. Der Vorteil des Systems liegt in der großen Geschwindigkeit für die Verarbeitung von Dokumenten bei gleichzeitig hoher Genauigkeit der erzielten Ergebnisse. Die Möglichkeit zur Erweiterung der Datenbasis für das System verspricht ferner einen wachsenden Umfang von klassifizierbaren Dokumenten.

Identiferoai:union.ndltd.org:DRESDEN/oai:qucosa:de:qucosa:16768
Date16 November 2017
CreatorsSeharsch, Andre‘
ContributorsUniversität Leipzig
Source SetsHochschulschriftenserver (HSSS) der SLUB Dresden
LanguageGerman
Detected LanguageGerman
Typeinfo:eu-repo/semantics/acceptedVersion, doc-type:masterThesis, info:eu-repo/semantics/masterThesis, doc-type:Text
Rightsinfo:eu-repo/semantics/openAccess
Relationurn:nbn:de:bsz:15-qucosa2-163403, qucosa:16340

Page generated in 0.0021 seconds