Return to search

Dokumentų klasifikavimas semantinių struktūrų pagrindu / Document classification based on semantic structures

Darbe aprašomi algoritmai ir metodai automatiniam lietuviškų tekstų klasifikavimui panaudojant semantines duomenų struktūras. Apžvelgti jau žinomi ir naudojami elektroninių dokumentų klasifikavimo metodai, įvertinti jų privalumai ir trūkumai. Pasiūlyti algoritmai lietuviškų žodžių analizei, aprašytos duomenų struktūros (grafai), kurios gali būti naudojamos dokumentų semantiniams vaizdams sudaryti, rasti praktiniai jų sudarymo metodai. Aprašytos eksperimentinės programinės priemonės duomenų analizei bei atvaizdavimui. Darbe pateikiami eksperimentų rezultatai, kurių pagrindu suformuluotos išvados. / This paper defines algorithms and methods for automatic Lithuanian documents classification using semantic structures. Some popular classification methods are reviewed, displaying their strong and weak parts. Basing on this knowledge some original algorithms are proposed. This includes lexical Lithuanian word analysis, document semantic structure generation, automatic category tree generation. Implemented software systems for these methods are described. Multiple experiment results and conclusions are also introduced.

Identiferoai:union.ndltd.org:LABT_ETD/oai:elaba.lt:LT-eLABa-0001:E.02~2006~D_20140702_194223-30108
Date02 July 2014
CreatorsBogdanovičius, Valentinas
ContributorsJuozapavičius, Algimantas, Vilnius University
PublisherLithuanian Academic Libraries Network (LABT), Vilnius University
Source SetsLithuanian ETD submission system
LanguageLithuanian
Detected LanguageUnknown
TypeMaster thesis
Formatapplication/pdf
Sourcehttp://vddb.library.lt/obj/LT-eLABa-0001:E.02~2006~D_20140702_194223-30108
RightsUnrestricted

Page generated in 0.0019 seconds