Return to search

Kompiuterio valdymas balsu / Control of computer using voice

Šiame darbe gilinamasi į kompiuterio valdymo lietuvių kalba galimybes, apžvelgiant jau pasaulyje taikomus algoritmus bei pabrėžiant balso technologijų svarbą ateityje. Pagrindinis tikslas yra realizuoti kai kuriuos iš apžvelgtų atpažinimo algoritmų ir imituoti tam tikras valdymo balsu situacijas. Kaip kalbos atpažinimo pagrindas yra naudojamas dinaminės laiko skalės algoritmas (DTW) spektrinės poros (LSP) parametrams. Pagrindinės realizavimo priemonės – Java programavimo kalba, mikrofonas ir WAVE garsiniai failai. Pasiekti rezultatai leidžia teigti, kad įgyvendintas atpažinimo algoritmas gana tiksliai randa tariamus žodžius ir su nedideliu žodynu (iki 20 žodžių) efektyviai vykdo nurodytas komandas. Buvo apžvelgti tiesinės prognozės, spektrinės poros, kvantavimo, dinaminės laiko skalės tempimo ir paslėptų Markovo modelių algoritmai, suprogramuotas lietuvių kalbos atpažinimo algoritmas ir imituotos kompiuterio valdymo situacijos: kalkuliatorius, lango spalvos keitimas ir pelės žymeklio judinimas. Atlikti išsamūs suprogramuoto atpažinimo algoritmo testavimai parodė, kad rezultatų kokybė labai priklauso nuo kompiuterio mikrofono keliamo triukšmo, diktoriaus žodžių tarimo greičio ir pašalinių aplinkos triukšmų. Pagal eksperimentų rezultatus galima teigti, kad ilgesnių žodžių (daugiau negu du skiemenys) atpažinimo tikslumas yra didesnis negu trumpų žodžių (vienas arba du skiemenys). Taip pat pastebėta, kad akustiškai panašūs žodžiai atpažįstami blogiau negu neturintys jokio... [toliau žr. visą tekstą] / Nowadays speech processing should become very important because it is one of the best alternatives of present control means like keyboard and mouse. So this work studies: • The use of speech signal processing. • Various methods and algorithms of speech recognition. • The implementation of Lithuanian speech recognition in this work. • Comparison with other algorithms. • Simulation of voice control. There are described and analyzed these algorithms that are used in speech processing: Dynamic Time Warping [1], Linear Predictive Coding [2], Linear Spectral Pair (or Frequencies) ([2], [3], [8]), Vector Quantization [4], Adaptive Quantization [5] and Hidden Markov Models [9]. In the implementation of Lithuanian speech recognition were used Linear Predictive Coding, Linear Spectral Pair, Vector Quantization and Dynamic Time Warping algorithms, Java programming language, microphone and WAVE format. The speech recognition system were tested with more noisy and less noisy microphones, with various WAVE files recorded in different conditions and with real time speaking. Further for simulation of voice control were modeled three situations: calculator with four operations (sum, subtraction, multiplication and division), changing background colors and moving mouse cursor. To conclude it should be noted that: • Implemented speech recognition algorithm mostly gives around 90% recognition. • The precision of testing depends on microphone and surrounding noise, length and acoustic likeness of... [to full text]

Identiferoai:union.ndltd.org:LABT_ETD/oai:elaba.lt:LT-eLABa-0001:E.02~2007~D_20090908_193959-14851
Date08 September 2009
CreatorsKaralevičius, Raimundas
ContributorsBastys, Algirdas, Vilnius University
PublisherLithuanian Academic Libraries Network (LABT), Vilnius University
Source SetsLithuanian ETD submission system
LanguageLithuanian
Detected LanguageUnknown
TypeMaster thesis
Formatapplication/pdf
Sourcehttp://vddb.library.lt/obj/LT-eLABa-0001:E.02~2007~D_20090908_193959-14851
RightsUnrestricted

Page generated in 0.1182 seconds