Kalbos technologijų produktų adaptavimo galimybių komandų atpažinimui ir sintezei tyrimas / Research of possibilities to adapt speech technologies product for command recognition and synthesis

Šiuo metu kalbos technologijos vystosi ir tobulėja, daugėja jų taikymo sričių, tačiau nėra plačiai prieinamų lietuvių kalbos atpažinimo ir sintezavimo produktų. Daugelis kalbos technologijų produktų yra pritaikyti anglų kalbai. Šio darbo tikslas – išnagrinėti, kalbos atpažinimo ir kalbos sintezės produktų adaptavimo lietuvių kalbai galimybes. Tuo tikslu atliktas tyrimas su kalbos sintezės programa „ReadPlease 2003“ ir kalbos atpažinimo programa „Dragon NaturallySpeaking 10“. Su programa „ReadPlease 2003“, nustatytas lietuviškų žodžių perskaitymo aiškumas yra vos 35%. Tuos pačius žodžius transkribavus perskaitymo aiškumas gautas 95%. Galima teigti, kad lietuvių kalbos žodžiams užrašyti naudojant anglų kalbos fonetinę rašybą ir pateikus užrašytus žodžius programai „ReadPlease 2003“ perskaityti, žodžių aiškumas tapo 60% didesnis nei užrašius pagal lietuvių kalbos fonetinę rašybą. Su programa „Dragon Naturally Speaking 10“, nustatyta, kad geriausiai yra atpažįstami ilgi žodžiai, mažiausiai - trumpi. Daugiausia klaidų yra daroma ties dviejų balsių a ir i trumpinimu bei ilginimu. Taip pat daugiau klaidų yra daroma žodžiuose su dusliaisiais priebalsiais nei žodžiuose su skardžiaisiais. Apskaičiuotas bendras programos atpažinimo efektyvumas, pagal penkių diktorių diktavimo rezultatus, yra 84,8%. Todėl galima teigti, kad aklai pasikliauti programa diktuojant žodžius negalima, tačiau prižiūrint ir pataisant neteisingai įvestą žodį, ji gali būti naudojama kaip puiki rašymo priemonė... [toliau žr. visą tekstą] / Currently, the speech technologies develop and improve, increase the number of application areas, but is not widely available in Lithuanian language recognition and speech synthesis programs. Many speech technology products are adapted to the English language. The aim of this work - to examine of possibilities to adapt speech recognition and speech synthesis products for Lithuanian language. To achieve the aim was researching two of the English language programs, „ReadPlease 2003“ and „Dragon Naturally Speaking 10“ the use of Lithuanian language possibilities. The first test of the program „ReadPlease 2003“, established the Lithuanian words perusal clarity is only 35%. The same words were transcriptioned, then clarity of reading became 95%. It can be argued that the Lithuanian words recorded using the phonetic spelling of the English language and presentation of written words for „ReadPlease 2003“ perusal the words of clarity was 60% higher than Lithuanian words recorded using the phonetic spelling of the Lithuanian language. The program „Dragon NaturallySpeaking 10“ was used during the second test. This time was found that the best is to identify long words, at least - short. Most mistakes are made at the two vowels a and i, when its are shortened and extensioned. As well as more errors are made in the words with voiceless consonants than words with voiced consonants. There were calculated a general efficiency of identification of the program, according to the five speakers... [to full text]
