• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • Tagged with
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Kompiuterio valdymas balsu / Control of computer using voice

Karalevičius, Raimundas 08 September 2009 (has links)
Šiame darbe gilinamasi į kompiuterio valdymo lietuvių kalba galimybes, apžvelgiant jau pasaulyje taikomus algoritmus bei pabrėžiant balso technologijų svarbą ateityje. Pagrindinis tikslas yra realizuoti kai kuriuos iš apžvelgtų atpažinimo algoritmų ir imituoti tam tikras valdymo balsu situacijas. Kaip kalbos atpažinimo pagrindas yra naudojamas dinaminės laiko skalės algoritmas (DTW) spektrinės poros (LSP) parametrams. Pagrindinės realizavimo priemonės – Java programavimo kalba, mikrofonas ir WAVE garsiniai failai. Pasiekti rezultatai leidžia teigti, kad įgyvendintas atpažinimo algoritmas gana tiksliai randa tariamus žodžius ir su nedideliu žodynu (iki 20 žodžių) efektyviai vykdo nurodytas komandas. Buvo apžvelgti tiesinės prognozės, spektrinės poros, kvantavimo, dinaminės laiko skalės tempimo ir paslėptų Markovo modelių algoritmai, suprogramuotas lietuvių kalbos atpažinimo algoritmas ir imituotos kompiuterio valdymo situacijos: kalkuliatorius, lango spalvos keitimas ir pelės žymeklio judinimas. Atlikti išsamūs suprogramuoto atpažinimo algoritmo testavimai parodė, kad rezultatų kokybė labai priklauso nuo kompiuterio mikrofono keliamo triukšmo, diktoriaus žodžių tarimo greičio ir pašalinių aplinkos triukšmų. Pagal eksperimentų rezultatus galima teigti, kad ilgesnių žodžių (daugiau negu du skiemenys) atpažinimo tikslumas yra didesnis negu trumpų žodžių (vienas arba du skiemenys). Taip pat pastebėta, kad akustiškai panašūs žodžiai atpažįstami blogiau negu neturintys jokio... [toliau žr. visą tekstą] / Nowadays speech processing should become very important because it is one of the best alternatives of present control means like keyboard and mouse. So this work studies: • The use of speech signal processing. • Various methods and algorithms of speech recognition. • The implementation of Lithuanian speech recognition in this work. • Comparison with other algorithms. • Simulation of voice control. There are described and analyzed these algorithms that are used in speech processing: Dynamic Time Warping [1], Linear Predictive Coding [2], Linear Spectral Pair (or Frequencies) ([2], [3], [8]), Vector Quantization [4], Adaptive Quantization [5] and Hidden Markov Models [9]. In the implementation of Lithuanian speech recognition were used Linear Predictive Coding, Linear Spectral Pair, Vector Quantization and Dynamic Time Warping algorithms, Java programming language, microphone and WAVE format. The speech recognition system were tested with more noisy and less noisy microphones, with various WAVE files recorded in different conditions and with real time speaking. Further for simulation of voice control were modeled three situations: calculator with four operations (sum, subtraction, multiplication and division), changing background colors and moving mouse cursor. To conclude it should be noted that: • Implemented speech recognition algorithm mostly gives around 90% recognition. • The precision of testing depends on microphone and surrounding noise, length and acoustic likeness of... [to full text]

Page generated in 0.086 seconds