Global ETD Search

1	Algoritmas skirtas balsių ir priebalsių diferenciacijai šnekamosios kalbos signale / An algorithm for consonants and vowels differentiation in speech signal Morkevičius, Aurelijus 25 November 2010 (has links) Darbe pristatomas naujas algoritmas balsiams nuo priebalsių atskirti. Šis algoritmas pasižymi greitu požymio, gebančio atskirti balsius nuo priebalsių apskaičiavimu. Jis paremtas filtruoto signalo energijų suma esminiuose signalo regionuose. Požymio tikslumas ir gebėjimas atskirti balsius nuo priebalsių patikrintas atliekant eksperimentą su vyriškos ir moteriškos šnekos garso įrašais. Darbo objektas: balsių nustatymo algoritmas. Darbo tikslas: realizuoti ir eksperimentais patikrinti balsių nustatymo požymį pagrįstą pagrindinio tono ir harmonikų dažnių energijos suma. Hipotezė: tiriamas balsių nustatymo požymis gali būti taikomas Lietuvių kalbos balsiams atskirti nuo priebalsių. Darbo uždaviniai: 1. apibūdinti pagrindinio tono sąvoką, jo paieškos ypatumus, paieškos poreikį ir galimą praktinį taikymą; 2. išanalizuoti ir ištirti eksperimentu plačiausiai taikomus pagrindinio tono nustatymo algoritmus; 3. išanalizuoti esamus balsių nustatymo algoritmus, naudojamus balsių identifikavimo požymius; 4. išanalizuoti plačiausiai taikomus skaitmeninius filtrus; 5. iš analizės ir eksperimentinių rezultatų sudaryti tiriamo požymio algoritmo modelį; 6. realizuoti informacinę sistemą tiriamam požymiui apskaičiuoti; 7. atlikti pagrindinį eksperimentą tiriamo požymio tikslumo įvertinimui; 8. atlikti papildomus eksperimentus tiriamo požymio rezultatų patikslinimui. Tyrimo metodai: 1. kokybiniai tyrimo metodai: pagrindinio tono paieškos metodų kalbos signaluose klasifikacija, balsių atpažinimo... [toliau žr. visą tekstą] / New algorithm for consonants and vowels differentiation is revealed in this paper. This signifacally fast algorithm calculates a feature based on the sum of energies of a filtered signal. This feature allows determining whether a vowel or a consonant is an exploratory. An experiment is done to make estimations how reliable the feature is. The main aim of this paper is to realize and evaluate by the experiments consonants and vowels differentiation algorithm based on the calculation of pitch and the sum of energies of a filtered signal. The object of this paper is the algorithm of consonants and vowels differentiation in speech signal. To realize the main aim there are several tasks to be resolved: 1. describe the definition of the pitch, pitch detection methods and their possible practical use; 2. evaluate mostly used pitch detection methods; 3. analyze existing vowels differentiation and recognition algorithms; 4. analyze mostly used digital filters; 5. according to analysis results implement an algorithm model; 6. realise information system to calculate desired feature; 7. evaluate feature precision and quickness; For these tasks to be resolved there are several research techniques used. 1. Qualitative techniques: pitch detection methods classification, vowel recognition methods classification, scientific literature analysis and filing and UML for algorithm modeling. 2. Quantitative techniques: performance evaluation and comparison of algorithms using mathematical and... [to full text] Pagrindinis tonas Signalo energija Balsis Priebalsis Skaitmeninis filtras Kalbos signalas
2	Speaker recognition by voice / Asmens atpažinimas pagal balsą Kamarauskas, Juozas 15 June 2009 (has links) Questions of speaker’s recognition by voice are investigated in this dissertation. Speaker recognition systems, their evolution, problems of recognition, systems of features, questions of speaker modeling and matching used in text-independent and text-dependent speaker recognition are considered too. The text-independent speaker recognition system has been developed during this work. The Gaussian mixture model approach was used for speaker modeling and pattern matching. The automatic method for voice activity detection was proposed. This method is fast and does not require any additional actions from the user, such as indicating patterns of the speech signal and noise. The system of the features was proposed. This system consists of parameters of excitation source (glottal) and parameters of the vocal tract. The fundamental frequency was taken as an excitation source parameter and four formants with three antiformants were taken as parameters of the vocal tract. In order to equate dispersions of the formants and antiformants we propose to use them in mel-frequency scale. The standard mel-frequency cepstral coefficients (MFCC) for comparison of the results were implemented in the recognition system too. These features make baseline in speech and speaker recognition. The experiments of speaker recognition have shown that our proposed system of features outperformed standard mel-frequency cepstral coefficients. The equal error rate (EER) was equal to 5.17% using proposed... [to full text] / Disertacijoje nagrinėjami kalbančiojo atpažinimo pagal balsą klausimai. Aptartos kalbančiojo atpažinimo sistemos, jų raida, atpažinimo problemos, požymių sistemos įvairovė bei kalbančiojo modeliavimo ir požymių palyginimo metodai, naudojami nuo ištarto teksto nepriklausomame bei priklausomame kalbančiojo atpažinime. Darbo metu sukurta nuo ištarto teksto nepriklausanti kalbančiojo atpažinimo sistema. Kalbėtojų modelių kūrimui ir požymių palyginimui buvo panaudoti Gauso mišinių modeliai. Pasiūlytas automatinis vokalizuotų garsų išrinkimo (segmentavimo) metodas. Šis metodas yra greitai veikiantis ir nereikalaujantis iš vartotojo jokių papildomų veiksmų, tokių kaip kalbos signalo ir triukšmo pavyzdžių nurodymas. Pasiūlyta požymių vektorių sistema, susidedanti iš žadinimo signalo bei balso trakto parametrų. Kaip žadinimo signalo parametras, panaudotas žadinimo signalo pagrindinis dažnis, kaip balso trakto parametrai, panaudotos keturios formantės bei trys antiformantės. Siekiant suvienodinti žemesnių bei aukštesnių formančių ir antiformančių dispersijas, jas pasiūlėme skaičiuoti melų skalėje. Rezultatų palyginimui sistemoje buvo realizuoti standartiniai požymiai, naudojami kalbos bei asmens atpažinime – melų skalės kepstro koeficientai (MSKK). Atlikti kalbančiojo atpažinimo eksperimentai parodė, kad panaudojus pasiūlytą požymių sistemą buvo gauti geresni atpažinimo rezultatai, nei panaudojus standartinius požymius (MSKK). Gautas lygių klaidų lygis, panaudojant pasiūlytą požymių... [toliau žr. visą tekstą] Informatics Engineering Automatic speaker recognition system Gaussian mixture models Formants Antiformants Pitch Gauso mišinių modeliai Formantės Antiformantės Pagrindinis tonas

Search results

Algoritmas skirtas balsių ir priebalsių diferenciacijai šnekamosios kalbos signale / An algorithm for consonants and vowels differentiation in speech signal

Speaker recognition by voice / Asmens atpažinimas pagal balsą