Darbe aprašomi algoritmai ir metodai automatiniam lietuviškų tekstų klasifikavimui panaudojant semantines duomenų struktūras. Apžvelgti jau žinomi ir naudojami elektroninių dokumentų klasifikavimo metodai, įvertinti jų privalumai ir trūkumai. Pasiūlyti algoritmai lietuviškų žodžių analizei, aprašytos duomenų struktūros (grafai), kurios gali būti naudojamos dokumentų semantiniams vaizdams sudaryti, rasti praktiniai jų sudarymo metodai. Aprašytos eksperimentinės programinės priemonės duomenų analizei bei atvaizdavimui. Darbe pateikiami eksperimentų rezultatai, kurių pagrindu suformuluotos išvados. / This paper defines algorithms and methods for automatic Lithuanian documents classification using semantic structures. Some popular classification methods are reviewed, displaying their strong and weak parts. Basing on this knowledge some original algorithms are proposed. This includes lexical Lithuanian word analysis, document semantic structure generation, automatic category tree generation. Implemented software systems for these methods are described. Multiple experiment results and conclusions are also introduced.
Identifer | oai:union.ndltd.org:LABT_ETD/oai:elaba.lt:LT-eLABa-0001:E.02~2006~D_20140702_194223-30108 |
Date | 02 July 2014 |
Creators | Bogdanovičius, Valentinas |
Contributors | Juozapavičius, Algimantas, Vilnius University |
Publisher | Lithuanian Academic Libraries Network (LABT), Vilnius University |
Source Sets | Lithuanian ETD submission system |
Language | Lithuanian |
Detected Language | Unknown |
Type | Master thesis |
Format | application/pdf |
Source | http://vddb.library.lt/obj/LT-eLABa-0001:E.02~2006~D_20140702_194223-30108 |
Rights | Unrestricted |
Page generated in 0.0016 seconds