• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • Tagged with
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Lietuvių kalbos tekstynų saugojimas naudojant reliacines duomenų bazes / Lithuanian language corpus storage using relational database systems

Šadauskas, Marius 15 June 2011 (has links)
Šiame darbe analizuojamos trys egzistuojančios tekstynų sistemos. Lietuvių kalbos tekstyno paieška sukurta su Lucene paieškos sistema, vokiečių tekstyno lietuviškų tekstų paieška sukurta MySQL pagrindu, bei britų nacionalinio tekstyno paieška sukurta su Xaira programine įranga. Plačiau aprašomas šių sistemų indeksavimo ir paieškos veikimas. Taip pat Fedora ir DSpace repozitoriumų sistemos, kurios buvo išbandytos ir palygintos tarpusavyje. Nei viena iš egzistuojančių sistemų neturi galimybės indeksuoti morfologiškai žymėtus tekstynus ir atlikti paiešką juose, todėl pasiūlomas prototipinis tekstyno sistemos sprendimas, kuris leistų tai atlikti. Tekstynai saugomi XML dokumentuose ir yra morfologiškai sužymėti TEI P5 formatu. Prototipinė sistema leidžia atlikti paiešką pagal konkretų žodį, pagal pagrindinę žodžio formą - lemą. Rezultatai pateikiami vartotojui patogia forma – sakiniais. Paieškos rezultatuose yra pateikiami sakiniai su ieškotu žodžiu ir su ieškoto žodžio lema, taip pateikiant daugiau rezultatų. Pasiūlytas prototipinės sistemos modeliui sukurti panaudojus vieną iš reliacinių duomenų bazių sistemų – MySQL, taip pat XPath ir PHP programavimo kalba. / In this Master Thesis has been researched three existing corpus systems. Lithuanian corpus search system, which is created by Lucene search engine. German corpus search system which uses Lithuanian Wikipedia texts as corpus. This system which is created by MySQL. British national corpus search system which is created by Xaira software. All these systems are analyzed and explained how indexing and searching components works. Also two popular repository systems were taken and researched deeply, it’s Fedora and DSpace. None of existing systems had morphological search option, that is why prototype system is created. All texts are stored in XML files which are marked by TEI P5 format. Prototype system allows perform a search by exact word and by main word form called lemma. Results are displayed by sentences. At first system displays sentences of exact word and sentences where same lemma as search word exists. Prototype system is created using MySQL database system also for programming PHP and XPath is used.
2

Lygiagrečių tekstynų kūrimo interaktyvios informacinės sistemos / Interactive information systems for parallel corpus development

Stankevičius, Kęstutis 23 July 2012 (has links)
Šio magistro darbo užduotis – apžvelgti šiuo metu labiausiai naudojamas vartotojo sąsajas, kurios padeda žmogui sąveikauti su kompiuteriais ir kitais įrenginiais bei sąsajų architektūros būdus, kurie palengvina programų kūrimą. Taip pat išanalizuoti šiuo metu plačiausiai naudojamus metodus interneto paslaugoms įgyvendinti, kad būtų rastas sprendimas, kaip interaktyvios informacinės sistemos galėtų bendrauti tarpusavyje be apribojimų reikiamam funkcionalumui gauti pasirenkant geriausią būdą saugoti ir atvaizduoti reikiamus programos duomenis kuo paprastesniu ir lankstesniu būdu. Sukurti lygiagrečių tekstynų prototipą, kuris leistų matyti gautą rezultatą su galimybe kuo lengviau ir greičiau rasti bei koreguoti automatiškai sugeneruotus netikslumus, jei tokie yra, pritaikant sąsają, kuri būtų patogesnė ir reikalautų kuo mažiau darbo pastangų. Pasinaudojant prototipu atlikti tyrimą, kuris parodytų įvesties įrenginių naudojimo tendencijas. Darbą sudaro 8 dalys: įvadas, vartotojo sąsajų apžvalga, vartotojo sąsajos atskyrimas, interneto paslaugų analizė, XML duomenų bazės, vartotojo sąsajos kūrimas, išvados ir literatūros sąrašas. Darbo apimtis – 48 p. teksto be priedų, 25 paveikslai ir 2 lentelės. Atskirai pridedami 2 darbo priedai. / The purpose of this thesis is to review most currently used user interfaces that help people interact with computers and other equipment, and begin exploring new user interface paradigm, which allows humans to interact naturally with the computer. Furthermore, analyze the most widely used methods today for implementing web services, to find a solution how interactive information systems could communicate with each other without any restrictions to gain an overall result choosing the best way to store and display relevant data to the program simpler and more flexible way. Create an interactive parallel corpus development environment prototype for minimizing available errors, if they occur, from the generated parallel translation as easy as possible using as less human labor as possible. Using the prototype, perform a study that will show trends in the use of different interface input devices. The work consists of 8 parts: introduction, overview of user interfaces, user interface separation, web services analysis, XML databases, user interface development, conclusions and references. Thesis consists of: 48 pages of text without appendixes, 25 pictures and 2 tables. Two enclosures of the work are enclosed separately.

Page generated in 0.0246 seconds