Balso atpažinimo biometrinis metodas remiasi tuo kad žmogaus balsas savyje turi nemažą kiekį informacijos: kalba(anglų, rusų, lietuvių), kalbos patologija, lyti, emocinę būseną, amžių. Todėl kaip ir pirštų antspaudai žmonių balsai skiriasi. Nors kalbėtojo atpažinimo tikslumas yra mažesnis už pirštų antspaudus ar tinklainės skanavimą, tačiau kalbėtojo atpažinimo techninė įranga yra kur kas pigesnė, užtenka paprasto mikrofono. Todėl mano magistro darbui buvo pasirinkta tema : Balso technologijų taikymas vartotojo atpažinimo uždaviniuose. Šiame darbe yra apžvelgti iki šiol įvykdyti eksperimentai ir tyrimai šioje srityje. Taip pat apžvelgti pagrindiniai kalbėtojų atpažinimo principai ir metodai. Jų veikimo pobūdis, panaudojimo galimybės ir teikiamas atpažinimo tikslumas. Tad pasinaudojant Eksperimento metu buvo sukurta programa, kurios tikslas yra kalbėtojo atpažinimas. Programos veikimas susideda iš trijų pagrindinių žingsniu: Duomenų rinkimo, treniravimo ir testavimo. Pasinaudojant analizės ir teorijos rezultatais sukuriamas eksperimento planas, kuris buvo realizuotas. Sukuriama atpažinimo programa, kurios veikimo principas: paimti garso failai yra apdorojami, iškerpamas reikalingas eksperimentinis žodis „vienas“, bei naujas garso failas yra apdorojamas (naikinami amplitudės ir DC svyravimai, bei pašalinama tyla ir triukšmas). Tada vykdomas testavimo etapas, kurio metu treniruojamas kalbos modelis, kuriama VQ kodų knyga kiekvienam etalonui. Vėliau kodų knyga bus panaudota... [toliau žr. visą tekstą] / Voice biometric authentication method based on the fact that the human voice itself has a significant amount of information: the language (English, Russian, Lithuanian), speech pathology, sex, emotional status, age. Therefore, as the fingerprints of human voices are different. Although the speaker identification accuracy is lower for fingerprints or retinal scanning, but the speaker recognition hardware is much cheaper, just a simple microphone is needed. This work will review the experiments and studies done in this field. As well as an overview of the main principles and methods of speakers identification. Their operational nature, uses, and the accuracy recognition. So the experiment was developed, which aims to speaker identification. Program operation consists of three main steps: data collection, training and testing. The analysis of the theory resulted in creating a plan of the experiment, which has been realized. Created an authentication program, with the operating principle: taken audio files are processed, the necessary experimental word "one" is cut , and a new sound file is handled (noise and silence reduction, and DC offset elimination). Then, out of testing phase, during which the language model is trained, a VQ code book for each standard. Later, the code book will be used for speaker recognition. Testing at the same loaded the sound files in succession, and the use of VQ code book is calculated using Euclidean distance, the standard test with which the... [to full text]
Identifer | oai:union.ndltd.org:LABT_ETD/oai:elaba.lt:LT-eLABa-0001:E.02~2009~D_20101125_190800-70650 |
Date | 25 November 2010 |
Creators | Rudeičiukas, Marius |
Contributors | Driaunys, Kęstutis, Vilnius University |
Publisher | Lithuanian Academic Libraries Network (LABT), Vilnius University |
Source Sets | Lithuanian ETD submission system |
Language | Lithuanian |
Detected Language | Unknown |
Type | Master thesis |
Format | application/pdf |
Source | http://vddb.laba.lt/obj/LT-eLABa-0001:E.02~2009~D_20101125_190800-70650 |
Rights | Unrestricted |
Page generated in 0.0026 seconds