Global ETD Search

Return to search

Acoustic modelling of Lithuanian speech recognition / Lietuvių šnekos atpažinimo akustinis modeliavimas

This paper is devoted to an acoustic modelling of Lithuanian speech recognition. Word-, syllable-, contextual syllable-, phoneme- and contextual phoneme-based speech recognition was investigated. Investigations were performed for isolated words and continuous speech. The most popular sub-word units in Lithuanian speech recognition are phonemes and contextual phonemes, and research on other sub-word units is omitted. This paper aims to compare capacity of linguistic sub-word units to model speech and to demonstrate that investigation of sub-word units suggest using alternative sub-word units to phoneme and contextual phoneme.
The dissertation proposes a new methodology for acoustic modelling of syllables and phonemes, new sub-word unit – pseudo-syllable; technologies for acoustic modelling of separate sub-word units, including developed schemes, tools and recommendations. Speech corpus of isolated words was prepared and two versions of corpus of continuous speech LRN were developed for experimental research.
Investigation of recognition of isolated words and construction of acoustic models for words showed that a size of training set of acoustic models, a content of training set in regard to number of speakers have an influence on speech recognition accuracy. The recommendations for word-based acoustic modelling are given.
Investigation of recognition of isolated words and construction of acoustic models for words, syllables and phonemes showed that the best recognition... [to full text] / Darbas „Lietuvių šnekos atpažinimo akustinis modeliavimas“ yra skirtas lietuvių šnekos atpažinimo akustiniam modeliavimui. Darbe buvo tirtas žodžiais, skiemenimis, kontekstiniais skiemenimis, fonemomis ir kontekstinėmis fonemomis grįstas šnekos atpažinimas. Tyrimai atlikti izoliuotiems žodžiams ir ištisinei šnekai. Iki šiol lietuvių šnekos atpažinime populiariausi kalbos vienetai buvo fonema ir kontekstinė fonema, o kitų kalbos vienetų analizė nebuvo atliekama. Šiame darbe siekiama palyginti lingvistinio tipo kalbos vienetų gebėjimą modeliuoti šneką ir parodyti, kad kalbos vienetų analizė siūlo alternatyvius fonemai ir kontekstinei fonemai kalbos vienetus.
Darbe pasiūlyta metodika mišriam skiemenų ir fonemų akustiniam modeliavimui, naujas kalbos vienetas – pseudo-skiemuo; technologijos atskirų kalbos vienetų akustiniam modeliavimui (schemos, įrankiai, rekomendacijos). Eksperimentiniams tyrimams atlikti paruoštas izoliuotų žodžių garsynas ir sukurtos dvi ištisinės šnekos garsyno LRN versijos.
Ištyrus izoliuotų žodžių atpažinimą, akustinius modelius konstruojant žodžiams, nustatyta, kad modelių mokymo aibės dydis, akustinių modelių mokymo aibės turinys daro įtaką šnekos atpažinimo tikslumui. Pateikiamos rekomendacijos akustiniam modeliavimui žodžių pagrindu.
Ištyrus izoliuotų žodžių atpažinimą, akustinius modelius konstruojant žodžiams, skiemenims ir fonemoms, gauti rezultatai 98 ±1,8 % tikslumu siejami su skiemens tipo kalbos vienetais. Dėl skiemenų akustinio modeliavimo... [toliau žr. visą tekstą]

Informatics Engineering

Speech recognition

Acoustic modelling

Hidden Markov model

Syllable-based speech recognition

Phoneme-based speech recognition

Šnekos atpažinimas

Akustinis modeliavimas

Paslėptieji Markovo modeliai

Fonemomis grįstas šnekos atpažinimas

Identifer	oai:union.ndltd.org:LABT_ETD/oai:elaba.lt:LT-eLABa-0001:E.02~2008~D_20080626_121551-77545
Date	26 June 2008
Creators	Laurinčiukaitė, Sigita
Contributors	LIPEIKA, Antanas, BAUŠYS, Romualdas, NAVAKAUSKAS, Dalius, KASPARAITIS, Pijus, Vilnius Gediminas Technical University
Publisher	Lithuanian Academic Libraries Network (LABT), Vilnius Gediminas Technical University
Source Sets	Lithuanian ETD submission system
Language	English
Detected Language	English
Type	Doctoral thesis
Format	application/pdf
Source	http://vddb.library.lt/obj/LT-eLABa-0001:E.02~2008~D_20080626_121551-77545
Rights	Unrestricted

Page generated in 0.0025 seconds

Acoustic modelling of Lithuanian speech recognition / Lietuvių šnekos atpažinimo akustinis modeliavimas

Description

Links & Downloads

Tags

Additional Fields