• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 6
  • 1
  • Tagged with
  • 7
  • 7
  • 5
  • 5
  • 4
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Balso tono valdymas lietuvių kalbos sintezėje / Pitch control in lithuanian speech synthesis

Agejevas, Vitalijus 08 September 2009 (has links)
Magistrinio darbo tyrimo objektas – sintetinio balso tono valdymas dvigarsiais pagrįstoje lietuvių kalbos sintezėje. Darbe sukurta natūralaus balso tono duomenų bazė, kuri panaudota balso tono kitimui kalboje tirti. Gauti tyrimų rezultatų pagrindu sumodeliuoti natūralios lietuvių kalbos balso konstatuojamasios frazės bei kirčių tonai. Modeliuojant balso toną remtasi Fujisaki balso tono modeliu. / The paper deals with pitch control in lithuanian speech synthesis. Voice pitch database based on natural lithuanian voice was created for research purposes. Using the database natural pitch behaviour was analized and upon analizes results the pitch modelling was done for phrase declarative and stress pitches. In the paper pitch modeling is based on well known Fujisaki voice pitch model.
2

Kalbos technologijų produktų adaptavimo galimybių komandų atpažinimui ir sintezei tyrimas / Research of possibilities to adapt speech technologies product for command recognition and synthesis

Rakauskaitė, Irutė 25 November 2010 (has links)
Šiuo metu kalbos technologijos vystosi ir tobulėja, daugėja jų taikymo sričių, tačiau nėra plačiai prieinamų lietuvių kalbos atpažinimo ir sintezavimo produktų. Daugelis kalbos technologijų produktų yra pritaikyti anglų kalbai. Šio darbo tikslas – išnagrinėti, kalbos atpažinimo ir kalbos sintezės produktų adaptavimo lietuvių kalbai galimybes. Tuo tikslu atliktas tyrimas su kalbos sintezės programa „ReadPlease 2003“ ir kalbos atpažinimo programa „Dragon NaturallySpeaking 10“. Su programa „ReadPlease 2003“, nustatytas lietuviškų žodžių perskaitymo aiškumas yra vos 35%. Tuos pačius žodžius transkribavus perskaitymo aiškumas gautas 95%. Galima teigti, kad lietuvių kalbos žodžiams užrašyti naudojant anglų kalbos fonetinę rašybą ir pateikus užrašytus žodžius programai „ReadPlease 2003“ perskaityti, žodžių aiškumas tapo 60% didesnis nei užrašius pagal lietuvių kalbos fonetinę rašybą. Su programa „Dragon Naturally Speaking 10“, nustatyta, kad geriausiai yra atpažįstami ilgi žodžiai, mažiausiai - trumpi. Daugiausia klaidų yra daroma ties dviejų balsių a ir i trumpinimu bei ilginimu. Taip pat daugiau klaidų yra daroma žodžiuose su dusliaisiais priebalsiais nei žodžiuose su skardžiaisiais. Apskaičiuotas bendras programos atpažinimo efektyvumas, pagal penkių diktorių diktavimo rezultatus, yra 84,8%. Todėl galima teigti, kad aklai pasikliauti programa diktuojant žodžius negalima, tačiau prižiūrint ir pataisant neteisingai įvestą žodį, ji gali būti naudojama kaip puiki rašymo priemonė... [toliau žr. visą tekstą] / Currently, the speech technologies develop and improve, increase the number of application areas, but is not widely available in Lithuanian language recognition and speech synthesis programs. Many speech technology products are adapted to the English language. The aim of this work - to examine of possibilities to adapt speech recognition and speech synthesis products for Lithuanian language. To achieve the aim was researching two of the English language programs, „ReadPlease 2003“ and „Dragon Naturally Speaking 10“ the use of Lithuanian language possibilities. The first test of the program „ReadPlease 2003“, established the Lithuanian words perusal clarity is only 35%. The same words were transcriptioned, then clarity of reading became 95%. It can be argued that the Lithuanian words recorded using the phonetic spelling of the English language and presentation of written words for „ReadPlease 2003“ perusal the words of clarity was 60% higher than Lithuanian words recorded using the phonetic spelling of the Lithuanian language. The program „Dragon NaturallySpeaking 10“ was used during the second test. This time was found that the best is to identify long words, at least - short. Most mistakes are made at the two vowels a and i, when its are shortened and extensioned. As well as more errors are made in the words with voiceless consonants than words with voiced consonants. There were calculated a general efficiency of identification of the program, according to the five speakers... [to full text]
3

Lietuvių kalbos priebalsių spketro analizė / Lithuanian language consonats spectrum analysis

Šimkus, Ramūnas, Stumbras, Tomas 03 September 2010 (has links)
20 amžiaus antrojoje pusėje ypač suaktyvėjo tyrimai kalbančiojo atpažinimo ir kalbos sintezavimo srityje. Jau nuo penktojo dešimtmečio vykdomi tyrimai siekiant sukurti sistemas galinčias atpažinti šnekamąją kalbą. Ypač svarbu šioje srityje yra kokybiškai atskirti kalbos signalus. Aštuntajame dešimtmetyje buvo sukurta eilė požymių išskyrimo metodų. Svarbesni iš jų yra melų skalės kepstras, suvokimu paremta tiesinė prognozė (perceptual linear prediction), delta kepstras ir kiti.[3] Naudojant šiuolaikinę kompiuterinę įrangą, signalų atskyrimo uždavinys gerokai supaprastėja, tačiau vis tiek išlieka labai sudėtingas. Kalbos sintezatorius yra kompiuterinė sistema, kuri gali atpažinti žmogaus balsą bet kokiame tekste. Sistema gali automatiškai sugeneruoti žmogaus balsą. Viena iš perspektyviausių balso technologijų panaudojimo sričių – įvairūs neįgaliems žmonėms skirti taikymai (akliems ir silpnaregiams, nevaikščiojantiems arba turintiems ribotas judėjimo galimybes). Balso technologijų panaudojimas dažnai yra esminis arba net vienintelis tokių žmonių integravimo į visuomenę būdas. Dar yra daugybė tokių sistemų panaudojimo sričių: • telefoninių ryšių centrai, automatiškai aptarnaujantys telefoninius pokalbius, atpažįstantys ir suprantantys, ką skambinantis sako; • automatinės transporto tvarkaraščių užklausimo sistemos; • automobilio mazgų valdymo žmogaus balsu priemonės; • nenutrūkstamos kalbos atpažinimo sistemos darbui teksto redaktoriais; Kalbos signalams analizuoti bei atskirti... [toliau žr. visą tekstą] / In 20th century speech recognition and synthesis became very important part of science. In last 50 years were a lot of researches in speech recognition. And for the moment there are many systems for speech recognition and synthesis for popular European languages, such as French, English, Germanic languages. One of the most important benefits of this is for disabled people to make their life more comfortable and adopt them to normal life, to create new interfaces and possibility to use personal computers for them. For Lithuanian language need researches, because of our language unique. An aim of research is a spectrum of Lithuanian consonants. Main method is linear prediction is used for finding formants. There are some main methods for speech signals analysis: linear prediction, Furier transformation, cepstral analysis. For linear prediction are several different algorithms. We used Burg algorithm for finding formants. In this research paper records of words were annotated and analyzed by PRAAT software. Formant movement obtained with same program. Obtained data of research was processed with MATLAB 6.5 software. All consonants were divided to groups, such as voiced and unvoiced, semivowels, plosives and fricatives. In our research was analyzed influence of vowels following after consonant. Obtained data is useful for increasing quality in speech recognition and synthesis. Paper includes: 1. Speech generation analysis. 2. Spectrum analysis methods. 3. Experiment methodology... [to full text]
4

Balso atpažinimo programų lietuvinimo galimybių tyrimas / Speech recognition program`s Lithuanization possibility survey

Bivainis, Robertas 30 September 2013 (has links)
Šiame darbe yra analizuojama ir tiriama kaip veikia balso atpažinimo sistema HTK, kokie žingsniai turi būti atlikti norint sėkmingai atpažinti lietuviškai išartus žodžius. Taip pat apžvelgiamos kokių kalbos technologijų samprata reikalinga norint sukurti balso atpažinimo programą. Balso atpažinime labai svarbu yra kalbos signalų atpažinimo modeliai ir paslėptosios Markovo grandinės, todėl analizėje yra apžvelgiama jų veikimo principai ir algoritmai. / This thesis will focus on how the speech recognition program HTK operates and what steps have to be taken in order to recognize spoken Lithuanian words. Also the emphasis of this thesis goes to conceptions of speech recognition technologies which are needed to create a speech recognition program.
5

Melizmų sintezė dirbtinių neuronų tinklais / Melisma synthesis using artificial neural networks

Leonavičius, Romas January 2006 (has links)
Modern methods of speech synthesis are not suitable for restoration of song signals due to lack of vitality and intonation in the resulted sounds. The aim of presented work is to synthesize melismas met in Lithuanian folk songs, by applying Artificial Neural Networks. An analytical survey of rather a widespread literature is presented. First classification and comprehensive discussion of melismas are given. The theory of dynamic systems which will make the basis for studying melismas is presented and finally the relationship for modeling a melisma with nonlinear and dynamic systems is outlined. Investigation of the most widely used Linear Prediction Coding method and possibilities of its improvement. The modification of original Linear Prediction method based on dynamic LPC frame positioning is proposed. On its basis, the new melisma synthesis technique is presented.Developed flexible generalized melisma model, based on two Artificial Neural Networks – a Multilayer Perceptron and Adaline – as well as on two network training algorithms – Levenberg- Marquardt and the Least Squares error minimization – is presented. Moreover, original mathematical models of Fortis, Gruppett, Mordent and Trill are created, fit for synthesizing melismas, and their minimal sizes are proposed. The last chapter concerns experimental investigation, using over 500 melisma records, and corroborates application of the new mathematical models to melisma synthesis of one [ ...].
6

Lietuviškų fonemų dinaminių modelių analizė ir sintezė / Analysis and synthesis of Lithuanian phoneme dynamic sound models

Pyž, Gražina 25 November 2013 (has links)
Kalba yra natūralus žmonių bendravimo būdas. Teksto-į-šneką (TTS) problemos atsiranda įvairiose srityse: elektroninių laiškų skaitymas balsu, teksto iš elektroninių knygų skaitymas balsu, paslaugos kalbos sutrikimų turintiems žmonėms. Kalbos sintezatoriaus kūrimas yra be galo sudėtingas uždavinys. Įvairių šalių mokslininkai bando automatizuoti kalbos sintezę. Siekiant išspręsti lietuvių kalbos sintezės problemą, būtina kurti naujus lietuvių kalbos garsų matematinius modelius. Disertacijos tyrimo objektas yra dinaminiai lietuviškos šnekos balsių ir pusbalsių fonemų modeliai. Pasiūlyti balsių ir pusbalsių fonemų dinaminiai modeliai gali būti panaudoti kuriant formantinį kalbos sintezatorių. Garsams aprašyti pasiūlyta modeliavimo sistema pagrįsta balsių ir pusbalsių fonemų matematiniu modeliu bei pagrindinio tono ir įėjimų nustatymo automatine procedūra. Fonemos signalas yra gaunamas kai daugelio-įėjimų ir vieno-išėjimo (MISO) sistemos išėjimas. MISO sistema susideda iš lygiagrečiai sujungtų vieno-įėjimo ir vieno-išėjimo (SISO) sistemų, kurių įėjimų amplitudes kinta laike. Disertacijoje du sintezės metodai sukurti: harmoninis ir formantinis. Eksperimentiniai rezultatai parodė, kad balsiai ir pusbalsiai sintezuoti minėta sistema skamba pakankamai natūraliai. / Speech is the most natural way of human communication. Text-to-speech (TTS) problem arises in various applications: reading email aloud, reading text from e-book aloud, services for the people with speech disorders. Construction of speech synthesizer is a very complex task. Researchers are trying to automate speech synthesis. In order to solve the problem of Lithuanian speech synthesis, it is necessary to develop mathematical models for Lithuanian speech sounds. The research object of the dissertation is Lithuanian vowel and semivowel phoneme models. The proposed vowel and semivowel phoneme models can be used for developing a TTS formant synthesizer. Lithuanian vowel and semivowel phoneme modelling framework based on a vowel and semivowel phoneme mathematical model and an automatic procedure of estimation of the vowel phoneme fundamental frequency and input determining is proposed. Using this framework, the phoneme signal is described as the output of a linear multiple-input and single-output (MISO) system. The MISO system is a parallel connection of single-input and single-output (SISO) systems whose input impulse amplitudes vary in time. Within this framework two synthesis methods are proposed: harmonic and formant. Simulation has revealed that that the proposed framework gives sufficiently good vowel and semivowel synthesis quality.
7

Analysis and synthesis of Lithuanian phoneme dynamic sound models / Lietuviškų fonemų dinaminių modelių analizė ir sintezė

Pyž, Gražina 25 November 2013 (has links)
Speech is the most natural way of human communication. Text-to-speech (TTS) problem arises in various applications: reading email aloud, reading text from e-book aloud, services for the people with speech disorders. Construction of speech synthesizer is a very complex task. Researchers are trying to automate speech synthesis. In order to solve the problem of Lithuanian speech synthesis, it is necessary to develop mathematical models for Lithuanian speech sounds. The research object of the dissertation is Lithuanian vowel and semivowel phoneme models. The proposed vowel and semivowel phoneme models can be used for developing a TTS formant synthesizer. Lithuanian vowel and semivowel phoneme modelling framework based on a vowel and semivowel phoneme mathematical model and an automatic procedure of estimation of the vowel phoneme fundamental frequency and input determining is proposed. Using this framework, the phoneme signal is described as the output of a linear multiple-input and single-output (MISO) system. The MISO system is a parallel connection of single-input and single-output (SISO) systems whose input impulse amplitudes vary in time. Within this framework two synthesis methods are proposed: harmonic and formant. Simulation has revealed that that the proposed framework gives sufficiently good vowel and semivowel synthesis quality. / Kalba yra natūralus žmonių bendravimo būdas. Teksto-į-šneką (TTS) problemos atsiranda įvairiose srityse: elektroninių laiškų skaitymas balsu, teksto iš elektroninių knygų skaitymas balsu, paslaugos kalbos sutrikimų turintiems žmonėms. Kalbos sintezatoriaus kūrimas yra be galo sudėtingas uždavinys. Įvairių šalių mokslininkai bando automatizuoti kalbos sintezę. Siekiant išspręsti lietuvių kalbos sintezės problemą, būtina kurti naujus lietuvių kalbos garsų matematinius modelius. Disertacijos tyrimo objektas yra dinaminiai lietuviškos šnekos balsių ir pusbalsių fonemų modeliai. Pasiūlyti balsių ir pusbalsių fonemų dinaminiai modeliai gali būti panaudoti kuriant formantinį kalbos sintezatorių. Garsams aprašyti pasiūlyta modeliavimo sistema pagrįsta balsių ir pusbalsių fonemų matematiniu modeliu bei pagrindinio tono ir įėjimų nustatymo automatine procedūra. Fonemos signalas yra gaunamas kai daugelio-įėjimų ir vieno-išėjimo (MISO) sistemos išėjimas. MISO sistema susideda iš lygiagrečiai sujungtų vieno-įėjimo ir vieno-išėjimo (SISO) sistemų, kurių įėjimų amplitudes kinta laike. Disertacijoje du sintezės metodai sukurti: harmoninis ir formantinis. Eksperimentiniai rezultatai parodė, kad balsiai ir pusbalsiai sintezuoti minėta sistema skamba pakankamai natūraliai.

Page generated in 0.0575 seconds