Global ETD Search

Return to search

Analysis and synthesis of Lithuanian phoneme dynamic sound models / Lietuviškų fonemų dinaminių modelių analizė ir sintezė

Speech is the most natural way of human communication. Text-to-speech (TTS) problem arises in various applications: reading email aloud, reading text from e-book aloud, services for the people with speech disorders. Construction of speech synthesizer is a very complex task. Researchers are trying to automate speech synthesis. In order to solve the problem of Lithuanian speech synthesis, it is necessary to develop mathematical models for Lithuanian speech sounds. The research object of the dissertation is Lithuanian vowel and semivowel phoneme models. The proposed vowel and semivowel phoneme models can be used for developing a TTS formant synthesizer. Lithuanian vowel and semivowel phoneme modelling framework based on a vowel and semivowel phoneme mathematical model and an automatic procedure of estimation of the vowel phoneme fundamental frequency and input determining is proposed. Using this framework, the phoneme signal is described as the output of a linear multiple-input and single-output (MISO) system. The MISO system is a parallel connection of single-input and single-output (SISO) systems whose input impulse amplitudes vary in time. Within this framework two synthesis methods are proposed: harmonic and formant. Simulation has revealed that that the proposed framework gives sufficiently good vowel and semivowel synthesis quality. / Kalba yra natūralus žmonių bendravimo būdas. Teksto-į-šneką (TTS) problemos atsiranda įvairiose srityse: elektroninių laiškų skaitymas balsu, teksto iš elektroninių knygų skaitymas balsu, paslaugos kalbos sutrikimų turintiems žmonėms. Kalbos sintezatoriaus kūrimas yra be galo sudėtingas uždavinys. Įvairių šalių mokslininkai bando automatizuoti kalbos sintezę. Siekiant išspręsti lietuvių kalbos sintezės problemą, būtina kurti naujus lietuvių kalbos garsų matematinius modelius. Disertacijos tyrimo objektas yra dinaminiai lietuviškos šnekos balsių ir pusbalsių fonemų modeliai. Pasiūlyti balsių ir pusbalsių fonemų dinaminiai modeliai gali būti panaudoti kuriant formantinį kalbos sintezatorių. Garsams aprašyti pasiūlyta modeliavimo sistema pagrįsta balsių ir pusbalsių fonemų matematiniu modeliu bei pagrindinio tono ir įėjimų nustatymo automatine procedūra. Fonemos signalas yra gaunamas kai daugelio-įėjimų ir vieno-išėjimo (MISO) sistemos išėjimas. MISO sistema susideda iš lygiagrečiai sujungtų vieno-įėjimo ir vieno-išėjimo (SISO) sistemų, kurių įėjimų amplitudes kinta laike. Disertacijoje du sintezės metodai sukurti: harmoninis ir formantinis. Eksperimentiniai rezultatai parodė, kad balsiai ir pusbalsiai sintezuoti minėta sistema skamba pakankamai natūraliai.

Informatics Engineering

MISO system

SISO system

Quasipolynomial model

Kvazipolinominis modelis

Parametrų įvertinimas

Kalbos sintezė

Identifer	oai:union.ndltd.org:LABT_ETD/oai:elaba.lt:LT-eLABa-0001:E.02~2013~D_20131125_134056-50408
Date	25 November 2013
Creators	Pyž, Gražina
Contributors	DZEMYDA, GINTAUTAS, AUGUTIS, JUOZAS, ČENYS, ANTANAS, DAMAŠEVIČIUS, ROBERTAS, KAZLAUSKAS, KAZYS, BAREIŠA, EDUARDAS, KURASOVA, OLGA, Vilnius University
Publisher	Lithuanian Academic Libraries Network (LABT), Vilnius University
Source Sets	Lithuanian ETD submission system
Language	English
Detected Language	Unknown
Type	Doctoral thesis
Format	application/pdf
Source	http://vddb.library.lt/obj/LT-eLABa-0001:E.02~2013~D_20131125_134056-50408
Rights	Unrestricted

Page generated in 0.0042 seconds

Analysis and synthesis of Lithuanian phoneme dynamic sound models / Lietuviškų fonemų dinaminių modelių analizė ir sintezė

Description

Links & Downloads

Tags

Additional Fields