• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • 1
  • Tagged with
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Programinė įranga kompiuterio valdymui balsu / Software for computer control by voice

Ringelienė, Živilė 24 September 2008 (has links)
Magistro darbe pristatoma sukurta programa, realizuojanti interneto naršyklės valdymą balsu. Ši programa papildo atskirų žodžių prototipinę atpažinimo sistemą, pagrįstą paslėptaisiais Markovo modeliais (PMM). Šios dvi dalys ir sudaro interneto naršyklės valdymo balsu prototipą, kuris gali atpažinti 71 komandą (vienas arba du žodžiai) lietuvių kalba: 1 komandą, skirtą naršyklės atvėrimui, 54 naršyklės valdymo komandas, 16 komandų, atveriančių konkrečius iš anksto sistemai nurodytus tinklalapius. Darbe aprašytas lietuvių kalbos atskirų žodžių atpažinimo sistemos akustinių modelių, grįstų paslėptaisiais Markovo modeliais, rinkinių eksperimentinis tyrimas. Atsižvelgiant į įvairius atpažinimui turinčius įtakos veiksnius (mokymo duomenų kiekį, mišinio komponenčių skaičių, kalbėtojo lytį, skirtingos techninės įrangos naudojimą atpažinime), buvo sukurti skirtingi balso komandų akustinių modelių rinkiniai. Eksperimentinio tyrimo metu buvo tiriama šių rinkinių panaudojimo atpažinimo sistemoje įtaka sistemos atpažinimo tikslumui. Eksperimentinio tyrimo rezultatai parodė, kad interneto naršyklės valdymo balsu sistemos prototipo atpažinimo tikslumas siekia 98%. Sistema gali būti naudojama kaip vaizdinė priemonė vyresniųjų klasių moksleiviams informacinių technologijų, fizikos, psichologijos, matematikos pamokose. / The thesis presents a prototype of the software (system) for Web browser control by voice. The prototype consists of two parts: the Hidden Markov Models based word recognition system and the program, which implements browser control by voice commands and is integrated in the word recognition system. The prototype is a speaker-independent Lithuanian word (voice commands) recognition system and can recognize 71 voice commands: 1 command is intended to run browser, 54 commands – for browser control, and 16 commands – to open various user predefined websites. Taking into account various factors (amount of training data, number of Gaussian mixture components, gender of speaker, use of different hardware for recognition) which have impact on recognition, different sets of acoustic models of Lithuanian voice commands were created and trained. An experimental investigation of the influence of the sets usage in Lithuanian word recognition system on the word recognition accuracy was performed. The results of the experimental investigation showed that created prototype system achieves 98% word recognition accuracy. The prototype system can be used at secondary school as a visual speech recognition learning tool in the informatics, physics, psychology, and mathematics lessons for the pupils of senior classes.
2

Lietuvių kalbos atpažinimas, panaudojant Julius programinę įrangą / Speech Recognition of Lithuanian Using Julius Software

Braubartas, Ernestas 29 September 2008 (has links)
Signalų technologijų magistro darbo tema yra aktuali, nes nebepakanka įprastų informacijos įvedimo priemonių. Todėl ieškoti ir apdoroti informaciją, valdyti sudėtingus įrenginius ir programas daug patogiau būtų jei kompiuteriai ir įvairūs įrenginiai suprastų žmogaus kalbą. Pasaulyje panašios sistemos kuriamos jau daugelį metų. Tačiau šiuo metu lietuvių kalbos atpažinimo sistemos yra dar tik kūrimo stadijoje. Darbe nagrinėjamas Lietuvių kalbos žodžių atpažinimas skirstant juos į kategorijas ir naudojant paslėptuosius markovo modelius. Šio tyrimo tikslas – ištirti lietuvių kalbos žodžių skirstymo į kategorijas įtaką atpažinimo tikslumui.Taip pat tiriamas žodžių grupių bei pavienių žodžių atpažinimas. Akustinis modelis sukurtas su HTK paketu, kuris naudojasi paslėptųjų Markovo modelių metodika. Žodžių skirstymas į kategorijas aprašytas Backus-Naur formatu. Eksperimentai bus atliekami ir rezultatai gaunami naudojant, Julius programinės įrangos įrankius bei šio paketo, žodžių kategorijų pagrindu veikiančią, Julian kalbos atpažinimo sistemą. Geriausi rezultatai gauti bandant atpažinti pavienius žodžius suskirstytus į kategorijas. Atpažinimo tikslumas siekia 91 %. Bandant atpažinti žodžių sekas, nesuskirstytas į kategorijas, gautas atpažinimo tikslumas tesiekia 51 %. Microsoft Office Word 2003 meniu valdymo atpažinimo tikslumas siekia 82 %. / The theme of Master project of signal technology is actual, because not enough usual information introduction ways. Therefore information search and processing, complicated devices and programs control would be more handily if computers and devices understood human speech. Similar systems are designing for many years in the world. However Lithuanian speech recognition systems are still developing in nowadays. The thesis treats of isolated Lithuanian words recognition dividing them into category and using Hidden Markov Models. The idea of research is to explore categorization of Lithuanian words influence on the accuracy of recognition. The recognition of single words and word groups is under research too. Acoustic model is constructed by using HTK toolkit which is based on Hidden Markov Models. Categorization of words is described with Backus-Naur form. Experiments are made with Julius software speech recognition system Julian witch performs words category based recognition. Best results are got trying to recognize single words set into categories. The accuracy rate of recognition reaches 91 %. While trying to recognize uncategorized word sequences – the accuracy rate of recognition reaches only 51 %. The accuracy rate of Microsoft Office Word 2003 control menu recognition reaches 82 %.
3

Acoustic modelling of Lithuanian speech recognition / Lietuvių šnekos atpažinimo akustinis modeliavimas

Laurinčiukaitė, Sigita 26 June 2008 (has links)
This paper is devoted to an acoustic modelling of Lithuanian speech recognition. Word-, syllable-, contextual syllable-, phoneme- and contextual phoneme-based speech recognition was investigated. Investigations were performed for isolated words and continuous speech. The most popular sub-word units in Lithuanian speech recognition are phonemes and contextual phonemes, and research on other sub-word units is omitted. This paper aims to compare capacity of linguistic sub-word units to model speech and to demonstrate that investigation of sub-word units suggest using alternative sub-word units to phoneme and contextual phoneme. The dissertation proposes a new methodology for acoustic modelling of syllables and phonemes, new sub-word unit – pseudo-syllable; technologies for acoustic modelling of separate sub-word units, including developed schemes, tools and recommendations. Speech corpus of isolated words was prepared and two versions of corpus of continuous speech LRN were developed for experimental research. Investigation of recognition of isolated words and construction of acoustic models for words showed that a size of training set of acoustic models, a content of training set in regard to number of speakers have an influence on speech recognition accuracy. The recommendations for word-based acoustic modelling are given. Investigation of recognition of isolated words and construction of acoustic models for words, syllables and phonemes showed that the best recognition... [to full text] / Darbas „Lietuvių šnekos atpažinimo akustinis modeliavimas“ yra skirtas lietuvių šnekos atpažinimo akustiniam modeliavimui. Darbe buvo tirtas žodžiais, skiemenimis, kontekstiniais skiemenimis, fonemomis ir kontekstinėmis fonemomis grįstas šnekos atpažinimas. Tyrimai atlikti izoliuotiems žodžiams ir ištisinei šnekai. Iki šiol lietuvių šnekos atpažinime populiariausi kalbos vienetai buvo fonema ir kontekstinė fonema, o kitų kalbos vienetų analizė nebuvo atliekama. Šiame darbe siekiama palyginti lingvistinio tipo kalbos vienetų gebėjimą modeliuoti šneką ir parodyti, kad kalbos vienetų analizė siūlo alternatyvius fonemai ir kontekstinei fonemai kalbos vienetus. Darbe pasiūlyta metodika mišriam skiemenų ir fonemų akustiniam modeliavimui, naujas kalbos vienetas – pseudo-skiemuo; technologijos atskirų kalbos vienetų akustiniam modeliavimui (schemos, įrankiai, rekomendacijos). Eksperimentiniams tyrimams atlikti paruoštas izoliuotų žodžių garsynas ir sukurtos dvi ištisinės šnekos garsyno LRN versijos. Ištyrus izoliuotų žodžių atpažinimą, akustinius modelius konstruojant žodžiams, nustatyta, kad modelių mokymo aibės dydis, akustinių modelių mokymo aibės turinys daro įtaką šnekos atpažinimo tikslumui. Pateikiamos rekomendacijos akustiniam modeliavimui žodžių pagrindu. Ištyrus izoliuotų žodžių atpažinimą, akustinius modelius konstruojant žodžiams, skiemenims ir fonemoms, gauti rezultatai 98 ±1,8 % tikslumu siejami su skiemens tipo kalbos vienetais. Dėl skiemenų akustinio modeliavimo... [toliau žr. visą tekstą]

Page generated in 0.1188 seconds