Signalų technologijų magistro darbo tema yra aktuali, nes nebepakanka įprastų informacijos įvedimo priemonių. Todėl ieškoti ir apdoroti informaciją, valdyti sudėtingus įrenginius ir programas daug patogiau būtų jei kompiuteriai ir įvairūs įrenginiai suprastų žmogaus kalbą. Pasaulyje panašios sistemos kuriamos jau daugelį metų. Tačiau šiuo metu lietuvių kalbos atpažinimo sistemos yra dar tik kūrimo stadijoje. Darbe nagrinėjamas Lietuvių kalbos žodžių atpažinimas skirstant juos į kategorijas ir naudojant paslėptuosius markovo modelius. Šio tyrimo tikslas – ištirti lietuvių kalbos žodžių skirstymo į kategorijas įtaką atpažinimo tikslumui.Taip pat tiriamas žodžių grupių bei pavienių žodžių atpažinimas. Akustinis modelis sukurtas su HTK paketu, kuris naudojasi paslėptųjų Markovo modelių metodika. Žodžių skirstymas į kategorijas aprašytas Backus-Naur formatu. Eksperimentai bus atliekami ir rezultatai gaunami naudojant, Julius programinės įrangos įrankius bei šio paketo, žodžių kategorijų pagrindu veikiančią, Julian kalbos atpažinimo sistemą. Geriausi rezultatai gauti bandant atpažinti pavienius žodžius suskirstytus į kategorijas. Atpažinimo tikslumas siekia 91 %. Bandant atpažinti žodžių sekas, nesuskirstytas į kategorijas, gautas atpažinimo tikslumas tesiekia 51 %. Microsoft Office Word 2003 meniu valdymo atpažinimo tikslumas siekia 82 %. / The theme of Master project of signal technology is actual, because not enough usual information introduction ways. Therefore information search and processing, complicated devices and programs control would be more handily if computers and devices understood human speech. Similar systems are designing for many years in the world. However Lithuanian speech recognition systems are still developing in nowadays. The thesis treats of isolated Lithuanian words recognition dividing them into category and using Hidden Markov Models. The idea of research is to explore categorization of Lithuanian words influence on the accuracy of recognition. The recognition of single words and word groups is under research too. Acoustic model is constructed by using HTK toolkit which is based on Hidden Markov Models. Categorization of words is described with Backus-Naur form. Experiments are made with Julius software speech recognition system Julian witch performs words category based recognition. Best results are got trying to recognize single words set into categories. The accuracy rate of recognition reaches 91 %. While trying to recognize uncategorized word sequences – the accuracy rate of recognition reaches only 51 %. The accuracy rate of Microsoft Office Word 2003 control menu recognition reaches 82 %.
Identifer | oai:union.ndltd.org:LABT_ETD/oai:elaba.lt:LT-eLABa-0001:E.02~2008~D_20080929_112655-51844 |
Date | 29 September 2008 |
Creators | Braubartas, Ernestas |
Contributors | Daunys, Gintautas, Laurutis, Remigijus, Laurutis, Vincas, Lauruška, Vidas, Dapkus, A., Dervinis, Donatas, Siauliai University |
Publisher | Lithuanian Academic Libraries Network (LABT), Siauliai University |
Source Sets | Lithuanian ETD submission system |
Language | Lithuanian |
Detected Language | English |
Type | Master thesis |
Format | application/pdf |
Source | http://vddb.library.lt/obj/LT-eLABa-0001:E.02~2008~D_20080929_112655-51844 |
Rights | Unrestricted |
Page generated in 0.0019 seconds