The dissertation considers the problem of automatic classification of scientific publications. The problem is addressed by using probabilistic methods of the discriminant analysis. The main goal of the dissertation is to create constructive classification methods that would allow to take into consideration specificity of scientific publication text. The dissertation consists of Introduction, 3 chapters, Conclusions, References, list of author's publications, and one Appendix. The introduction reveals the investigated problem, importance of the thesis and the object of research and describes the purpose and tasks of the paper, research methodology, scientific novelty, the practical significance of results examined in the paper and defended statements. The introduction ends in presenting the author’s publications on the subject of the defended dissertation, offering the material of made presentations in conferences and defining the structure of the dissertation. Chapter 1 presents a detailed mathematical formulation of the considered problem, reviews scientific papers on the subject, and analyses a few popular classification algorithms that in Chapter 3 are compared to the ones proposed in this paper. Chapter 2 develops the probabilistic model for scientific terminology distribution over texts, discusses special cases of the model under specific assumptions on forms of terminology relations, suggests the model identification procedures, and formulates constructive scientific... [to full text] / Disertacijoje nagrinėjamas mokslo publikacijų automatinio klasifikavimo uždavinys. Šis uždavinys sprendžiamas taikant tikimybinius diskriminantinės analizės metodus. Pagrindinis darbo tikslas - sukurti konstruktyvius klasifikavimo metodus, kurie leistų atsižvelgti į mokslo publikacijų tekstų specifiką. Disertaciją sudaro įvadas, trys pagrindiniai skyriai, rezultatų apibendrinimas, naudotos literatūros ir autoriaus publikacijų disertacijos tema sąrašai ir vienas priedas. Įvadiniame skyriuje aptariama tiriamoji problema, darbo aktualumas, aprašomas tyrimų objektas, formuluojamas pagrindinis darbo tikslas bei uždaviniai, aprašoma tyrimų metodika, darbo mokslinis naujumas, pasiektų rezultatų praktinė reikšmė, ginamieji teiginiai. Įvado pabaigoje pristatomos disertacijos tema autoriaus paskelbtos publikacijos ir pranešimai konferencijose bei disertacijos struktūra. Pirmajame skyriuje matematiškai apibrėžtas ir detalizuotas sprendžiamas uždavinys, pateikta analitinė kitų autorių darbų apžvalga. Pasirinkti ir išanalizuoti keli populiarūs klasifikavimo algoritmai, kurie eksperimentinėje darbo dalyje lyginti su autoriaus pasiūlytaisiais. Antrajame skyriuje sudarytas mokslo terminijos pasiskirstymo tekstuose tikimybinis modelis, išskirti atskiri atvejai, galiojant įvestoms prielaidoms apie terminų tarpusavio sąryšių formas, pasiūlytos modelio identifikavimo procedūros bei suformuluoti konstruktyvūs mokslo publikacijų klasifikavimo algoritmai. Trečiajame skyriuje pateikti pagrindiniai... [toliau žr. visą tekstą]
Identifer | oai:union.ndltd.org:LABT_ETD/oai:elaba.lt:LT-eLABa-0001:E.02~2009~D_20091111_133448-63553 |
Date | 11 November 2009 |
Creators | Balys, Vaidas |
Contributors | Rudzkis, Rimantas, Radavičius, Marijus, Dučinskas, Kęstutis, Kubilius, Kęstutis, Leipus, Remigijus, Račkauskas, Alfredas, Saulis, Leonas, Podvezko, Valentinas, Vilnius Gediminas Technical University |
Publisher | Lithuanian Academic Libraries Network (LABT), Vilnius Gediminas Technical University |
Source Sets | Lithuanian ETD submission system |
Language | English |
Detected Language | English |
Type | Doctoral thesis |
Format | application/pdf |
Source | http://vddb.library.lt/obj/LT-eLABa-0001:E.02~2009~D_20091111_133448-63553 |
Rights | Unrestricted |
Page generated in 0.0027 seconds