Global ETD Search

1	Kalbos signalų kokybinių charakteristikų analizės sistema / Speech signals qualitative characteristics analysis system Jakimčikienė, Indrė 09 July 2011 (has links) Tyrimas skirtas kalbos signalų kokybinių charakteristikų analizei, įvardinant galimybes, kurių pagalba atliekamas garsų atpažinimas, taip pat atskleidžiant kalbos signalų kriterijus, padedančius atlikti kokybinės charakteristikos analizę. Darbe analizei naudojamas kalbos signalų garsynas, kuriame sukaupta diktorių šnekos įrašai. Tokiu būdu tyrimo tikslas - sukurti kalbos signalų kokybinių charakteristikų analizės algoritmą, kuris galėtų automatiškai nustatyti ar padarytas žodžio įrašas atitinka nustatytus kriterijus. Šiam tikslui pasiekti reikia išanalizuoti esamus segmentavimo algoritmus, išskiriant jų privalumus ir trūkumus, sukurti signalų kokybės nustatymo algoritmą, pasiruošti kalbos signalų kokybės nustatymo tyrimui duomenis, įvertinti kalbos signalų kokybės nustatymo algoritmo rezultatus, apibendrinti tyrimo rezultatus. Tyrimui atlikti remsimės moksline literatūra bei apibendrintais metodais, eksperimento įgyvendinimui – eksperimentinio matavimo bei statistinės analizės metodais. Tyrimui vykdyti ketiname sudaryti kalbos signalų kokybės analizės algoritmą, parenkant kalbos signalų kokybės charakteristikų kriterijus. / Research for the qualitative characteristics of the speech signal analysis, a description of the potential that exists to accomplish the recognition of sounds, including speech detection criteria to facilitate analysis was performed for qualitative characteristics. The paper used in the analysis of speech corpus in which the accumulated announcer speech recordings. Thus, the study objective - to establish the qualitative characteristics of speech analysis algorithm which can automatically determine whether the word record made the qualifying criteria. To achieve this requires the examination of existing segmentation algorithms, highlighting their advantages and disadvantages of a signal quality determination algorithm, speech preparation of quality research data, to evaluate speech quality determination algorithm, the results of the research findings. We base the scientific study of literature and summarized the methods for the implementation of the experiment - the experimental measurement and statistical analysis. The study we intend to carry out a speech quality analysis algorithm, the choice of speech quality performance criteria. Kalbos signalai Garsynas Signalų požymiai Atpažinimo sistemos
2	Garsų trukmių modelių kūrimo metodas, naudojant didelės apimties daugelio kalbėtojų garsyną / Method for creating phone duration models using very large, multi-speaker, automatically annotated speech corpus Norkevičius, Giedrius 01 February 2011 (has links) Disertacijoje nagrinėjamos dvi iki šiol netyrinėtos problemos: 1. Lietuvių kalbos garsų trukmių prognozavimo modelių kūrimas Iki šiol visi darbai, kuriuose yra nagrinėjamos lietuvių kalbos garsų trukmės, yra atlikti kalbininkų, tačiau šie tyrimai yra daugiau aprašomosios statistikos pobūdžio ir apsiriboja pavienių požymių įtakos garso trukmei analize. Šiame darbe, mašininio mokymo algoritmo pagalba, požymių įtaka garsų trukmei yra išmokstama iš duomenų ir užrašoma sprendimo medžio pavidalu. 2. Nuo kalbos nepriklausomų garsų trukmių prognozavimo modelių kūrimo metodas, naudojant didelės apimties daugelio, kalbėtojų automatiškai, anotuotą garsyną. Dėl skirtingų kalbėtojų tarties specifikos ir dėl automatinio anotavimo netikslumų, kuriant garsų trukmės modelius visame pasaulyje yra apsiribojama vieno kalbėtojo ekspertų anotuotais nedidelės apimties garsynais. Darbe pasiūlyti skirtingų kalbėtojų tarties ypatybių normalizavimo ir garsyno duomenų triukšmo atmetimo algoritmai leidžia garsų trukmių modelių kūrimui naudoti didelės apimties, daugelio kalbėtojų automatiškai anotuotus garsynus. Darbo metu atliktas audicinis tyrimas, kurio pagalba parodoma, kad šnekos signalą sudarančių garsų trukmės turi įtakos klausytojų/respondentų suvokiamam šnekos signalo natūralumui; kontekstinės informacijos panaudojimas garsų trukmių prognozavimo uždavinio sprendime yra svarbus faktorius įtakojantis sintezuotos šnekos natūralumą; natūralaus šnekos signalo atžvilgiu, geriausiai vertinamas yra... [toliau žr. visą tekstą] / Two heretofore unanalyzed aspects are addressed in this dissertation: 1. Building a model capable of predicting phone duration of Lithuanian. All existing investigations of phone durations of Lithuanian were performed by linguists. Usually these investigations are the kind of exploratory statistics and are limited to a single factor, affecting phone duration, analysis. Phone duration dependencies on contextual factors were estimated and written in explicit form (decision tree) in this work by means of machine learning method. 2. Construction of language independent method for creating phone duration models using very large, multi-speaker, automatically annotated speech corpus. Most of the researchers worldwide use speech corpus that are: relatively small scale, single speaker, manually annotated or at least validated by experts. Usually the referred reasons are: using multi-speaker speech corpora is inappropriate because different speakers have different pronunciation manners and speak in different speech rate; automatically annotated corpuses lack accuracy. The created method for phone duration modeling enables the use of such corpus. The main components of the created method are: the reduction of noisy data in speech corpus; normalization of speaker specific phone durations by using phone type clustering. The performed listening tests of synthesized speech, showed that: the perceived naturalness is affected by the underlying phones durations; The use of contextual... [to full text] Informatics Garsų trukmių modeliai Daugelio kalbėtojų garsynas Prognozavimas Klasifikavimo ir regresijos medžiai Phone duration models Multi-speaker corpus Prediction CART
3	Method for creating phone duration models using very large, multi-speaker, automatically annotated speech corpus / Garsų trukmių modelių kūrimo metodas, naudojant didelės apimties daugelio kalbėtojų garsyną Norkevičius, Giedrius 01 February 2011 (has links) Two heretofore unanalyzed aspects are addressed in this dissertation: 1. Building a model capable of predicting phone duration of Lithuanian. All existing investigations of phone durations of Lithuanian were performed by linguists. Usually these investigations are the kind of exploratory statistics and are limited to a single factor, affecting phone duration, analysis. Phone duration dependencies on contextual factors were estimated and written in explicit form (decision tree) in this work by means of machine learning method. 2. Construction of language independent method for creating phone duration models using very large, multi-speaker, automatically annotated speech corpus. Most of the researchers worldwide use speech corpus that are: relatively small scale, single speaker, manually annotated or at least validated by experts. Usually the referred reasons are: using multi-speaker speech corpora is inappropriate because different speakers have different pronunciation manners and speak in different speech rate; automatically annotated corpuses lack accuracy. The created method for phone duration modeling enables the use of such corpus. The main components of the created method are: the reduction of noisy data in speech corpus; normalization of speaker specific phone durations by using phone type clustering. The performed listening tests of synthesized speech, showed that: the perceived naturalness is affected by the underlying phones durations; The use of contextual... [to full text] / Disertacijoje nagrinėjamos dvi iki šiol netyrinėtos problemos: 1. Lietuvių kalbos garsų trukmių prognozavimo modelių kūrimas Iki šiol visi darbai, kuriuose yra nagrinėjamos lietuvių kalbos garsų trukmės, yra atlikti kalbininkų, tačiau šie tyrimai yra daugiau aprašomosios statistikos pobūdžio ir apsiriboja pavienių požymių įtakos garso trukmei analize. Šiame darbe, mašininio mokymo algoritmo pagalba, požymių įtaka garsų trukmei yra išmokstama iš duomenų ir užrašoma sprendimo medžio pavidalu. 2. Nuo kalbos nepriklausomų garsų trukmių prognozavimo modelių kūrimo metodas, naudojant didelės apimties daugelio, kalbėtojų automatiškai, anotuotą garsyną. Dėl skirtingų kalbėtojų tarties specifikos ir dėl automatinio anotavimo netikslumų, kuriant garsų trukmės modelius visame pasaulyje yra apsiribojama vieno kalbėtojo ekspertų anotuotais nedidelės apimties garsynais. Darbe pasiūlyti skirtingų kalbėtojų tarties ypatybių normalizavimo ir garsyno duomenų triukšmo atmetimo algoritmai leidžia garsų trukmių modelių kūrimui naudoti didelės apimties, daugelio kalbėtojų automatiškai anotuotus garsynus. Darbo metu atliktas audicinis tyrimas, kurio pagalba parodoma, kad šnekos signalą sudarančių garsų trukmės turi įtakos klausytojų/respondentų suvokiamam šnekos signalo natūralumui; kontekstinės informacijos panaudojimas garsų trukmių prognozavimo uždavinio sprendime yra svarbus faktorius įtakojantis sintezuotos šnekos natūralumą; natūralaus šnekos signalo atžvilgiu, geriausiai vertinamas yra... [toliau žr. visą tekstą] Informatics Phone duration modeling Text-to-speech synthesis CART Multi-speaker corpus Garsų trukmių modeliai Šnekos sintezė Klasifikavimo ir regresijos medžiai Daugelio kalbėtojų garsynas

1

Page generated in 0.0229 seconds