• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 19
  • 4
  • Tagged with
  • 23
  • 14
  • 7
  • 7
  • 7
  • 6
  • 6
  • 5
  • 4
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Balso tono valdymas lietuvių kalbos sintezėje / Pitch control in lithuanian speech synthesis

Agejevas, Vitalijus 08 September 2009 (has links)
Magistrinio darbo tyrimo objektas – sintetinio balso tono valdymas dvigarsiais pagrįstoje lietuvių kalbos sintezėje. Darbe sukurta natūralaus balso tono duomenų bazė, kuri panaudota balso tono kitimui kalboje tirti. Gauti tyrimų rezultatų pagrindu sumodeliuoti natūralios lietuvių kalbos balso konstatuojamasios frazės bei kirčių tonai. Modeliuojant balso toną remtasi Fujisaki balso tono modeliu. / The paper deals with pitch control in lithuanian speech synthesis. Voice pitch database based on natural lithuanian voice was created for research purposes. Using the database natural pitch behaviour was analized and upon analizes results the pitch modelling was done for phrase declarative and stress pitches. In the paper pitch modeling is based on well known Fujisaki voice pitch model.
2

Balso komandų atpažinimo metodai, naudojant fonemų diskriminavimą ir transkripcijų adaptavimą / Voice commands recognition techniques using phonemic discrimination and pronunciation adaptation

Rasymas, Tomas 27 June 2014 (has links)
Šiuolaikiniame technikos pasaulyje vis didesnę prasmę įgauna kalbos technologijos, tokios kaip kalbos atpažinimas, kalbos signalų sintezė, bei kombinuoti jų variantai. Pasaulyje visada buvo jaučiamas didelis poreikis kalbos atpažinimo sistemų, programų. Tokios sistemos labai populiarios dėl plataus savo pritaikymo spektro: karinė pramonė, įvairių prekių ar paslaugų užsakymų priėmimas, žmonių su įvairia negale darbo palengvinimas, telekomunikacijų, bankų sfera ir t.t. Kalbos atpažinimas kelia skirtingus uždavinius kiekvienai kalbai, nes kiekviena kalba turi savo specifiką. Pastaruoju metu kitose šalyse yra sukurta daug įvairių atpažinimo sistemų, tačiau jos nėra naudojamos lietuvių kalbos atpažinimui. Todėl yra būtina eksperimentuoti bei kurti savai kalbai pritaikytas tokio tipo sistemas naudojant kitų kalbų atpažinimui pritaikytus produktus. Darbo objektas: Lietuviškų balso komandų atpažinimas naudojant kitų kalbų atpažinimo priemones. Tyrimo tikslas: Ištirti lietuviškų balso komandų atpažinimo galimybę, naudojant nelietuviškas atpažinimo priemones (Microsoft Speech Application Programming Interface). Tyrimo uždaviniai: 1. Apžvelgti kalbos atpažinimo metodus; 2. Ištirti kalbos atpažinimo metodus, išskiriant jų privalumus ir trūkumus; 3. Apžvelgti kalbos atpažinimo paketą SAPI; 4. Atlikti komandų išskyrimo, iš kalbos signalo, metodo kiekybinę analizę; 5. Atlikti lietuviškų komandų atpažinimo eksperimentą, naudojantis SAPI varikliu; 6. Pateikti siūlymą kaip perrašyti... [toliau žr. visą tekstą] / In the contemporary world of techniques, voice technologies, such as speech recognition, synthesis of speech signals and their combined versions, acquire more and more significance. These technologies are very popular for wide practical use: telecommunications, banking, army and so on. The aim of the research paper is to analyze opportunity to adapt others languages speech recognition engine for Lithuanian language recognition using voice detection in speech signal and signal pre-emphasis methods. Microsoft SAPI English recognition engine was used for experiments in his paper. P. Kasparaitis has offered how Lithuanian phonemes can be transcribed using English phonemes, but not all Lithuanian phonemes has been analyzed. So this paper also replenish P. Kasparaitis paper (P. Kasparaitis (2008). Lithuanian Speech Recognition Using the English Recognizer.) by offering new ways how some Lithuanian sounds can be transcribed by English phonemes.
3

Aukštesnių eilių statistika grįsto balso detektavimo algoritmo sudarymas ir tyrimas / Design and analysis of voice activity detector based on higher order statistics

Duchovskis, Donatas 29 May 2006 (has links)
This report covers a robust voice activity detection (VAD) algorithm presented in [1]. The algorithm uses higher order statistics (HOS) metrics of speech signal in linear prediction coding (LPC) residual domain to classify noise and speech frames of a signal. Chapters in this report present voice activity detection problem and analysis of environment issues for VAD, deep HOS based and standard algorithms analysis and a real time HOS based voice activity detector model. New improvements (instantaneous SNR estimation, decision smoothing, adaptive thresholds, artificial neural network) to the proposed algorithm are introduced and performance results of the improved algorithm compared to standard VAD algorithms are presented.
4

Internetinės telefonijos (VOIP) kanalais perduotos kalbos kokybės analizė / Quality analysis of speech transmitted by voip (voice over ip) channels

Narvydas, Marius 23 June 2014 (has links)
Internetas bei jo paslaugos – neatskiriama šiuolaikinės visuomenės dalis. Šiuo metu sunkiai įsivaizduojamas yra kompanijų darbas – be elektroninės bankininkystės, deklaracijų, prekybos sistemų ir pan. Viena iš tokių paslaugų yra sparčiai besivystanti internetinė telefonija (IP telefonija) arba VoIP (Voice Over IP – angl.). Esminis ir pagrindinis šios komunikavimo paslaugos pranašumas prieš tradicines priemones – kaina. Tarptautiniai IP telefonijos pokalbių tarifai jau senokai pigumu viršija tradicinės telefonijos įkainius , o neretai šie pokalbiai yra visiškai nemokami. Nepaisant ekonomiškumo, IP telefonijos srityje kyla taip pat nemažai problemų. Kadangi balso informacija yra perduodama paketiniu būdu (SIP, H.323 protokolai) per IP tinklus ir neturi atskiro kanalo duomenų perdavimui, neretai susiduriama su tam tikromis kokybės problemomis. Svarbiausios jų – uždelsimas(vėlinimas) bei paketų praradimas. Šio darbo esmė – IP telefonijos kanalu perduoto balso įrašo kokybės tyrimas, originalaus bei perduoto įrašo kokybiniai skirtumai, todėl darbo problema yra – balso, perduoto IP telefonijos kanalais kokybės nuostoliai. Tyrimo metu bus matuojami kokybės nuostoliai. Šio darbo objektas – IP kanalu perduoto balso kokybė. Darbo tikslas – ištirti bei įvertinti IP telefonijos kanalais perduoto balso kokybę ir nustatyti, ar perduotas balso įrašas yra tinkamas naudoti balso atpažinimo sistemose. Uždaviniai tikslui pasiekti: • Išsiaiškinti IP telefonijos veikimo principus, technologijas; •... [toliau žr. visą tekstą] / VoIP (voice over IP protocol) is quickly growing and expanding technology. Calls and other services are much cheaper than traditional ones. Nevertheless it meets some quality problems such as packet delay and packet loss. The object of this paper is to explore voice transmitted by IP channels quality and to conclude about if that voice could be used in voice recognition systems. To complete this object, there are 4 main tasks: • Find out the technologies and working techniques of the VoIP. • Determine tools for quality analysis of the transmitted voice • Build an algorithm which could help to extract useful data from voice signal. • Summarize the results and conclude about ability to use transmitted voice in voice recognition systems. There was made 150 transmissions („Skype“ system was used) of the voice during the experiment and all of them was recorded. Fast Fourier transform was used to transform those recording to frequency scale. The quality loss was analyzed; original voice record specter was compared with transmitted voice record specter. The transmissions were divided into two parts. Transmissions was made in 2008 February (1st part) and 2008 May (2nd part). In the first part the results are almost the same, quality variations are stable (specter difference average is 1,44), all values are between 1,44 and 1,55 (specter difference average value). It was noticed that transmitted voice signal has large quality variations in the second part of the experiment. The... [to full text]
5

Profesijos ir balso sutrikimų ryšys / THE RELATIONSHIP BETWEEN AN OCCUPATION AND VOICE DISORDERS

Ulytė, Agnė 11 February 2012 (has links)
Darbe atlikta teorinė balso sutrikimų sampratos bei balso sutrikimų atsiradimo aiškinimo teorijų analizė. Anketinės apklausos metodu buvo atliktas tyrimas, kurio tikslas – išsiaiškinti profesijos ir balso sutrikimų ryšį. Atlikta statistinė (aprašomoji procentų, x2 testo) duomenų analizė. Tyrime dalyvavo 308 respondentai. Kauno klinikų medicinos darbuotojai (40), Naujosios Akmenės ligoninės medikai (50), Šiaulių miesto pedagogai (89) iš jų lopšelio – darželio auklėtojų (23), tiksliųjų ir humanitarinių mokslų mokytojų (35), pradinių klasių mokytojų (31). Taip pat buvo apklausti pardavėjai (36), vadybininkai (27 ), įstaigų vadovai (31 ) bei nekvalifikuoti darbininkai (35). Empirinėje dalyje nagrinėjamas profesijos ir balso sutrikimų ryšys. Taip pat bandoma išsiaiškinti, ar yra ryšys tarp lyties ir problemų susijusių su balsu. Svarbiausios empirinio tyrimo išvados: 1. Pedagoginės, psichologinės ir medicininės literatūros analizė atskleidė, kad pagrindinės balso sutrikimų atsiradimo priežastys yra pinkaudžiavimas balsu ir netinkamas jo vartojimas. 2. Pedagogo profesija patenka į didžiausią rizikos grupę, pagal balso sutrikimų atsiradimą, o darbininkai ir vadybininkai mažiausiai jaučia neigiamų balso pokyčių. 3. Pojūčius bei pokyčius, susijusius su balso sutrikimų atsiradimu, dažniausiai jaučia lopšelio – darželio auklėtojai, o mažiausiai – darbininkai, vadybininkai bei vadovaujantis personalas. 4. Dėl aukšto balso tembro ir jaučiamos didesnės psichologinės įtampos bei jautrumo... [toliau žr. visą tekstą] / At Masters work carried out theoretical concepts of voice disorders and voice disorders emergence of theories of interpretation of the analysis. Questionnaire survey method was conducted with the aim - to find out the relationship between an occupation and voice disorders. Was made the statistical (descriptive percent, x2 test) data analysis. The study included 308 respondents. Kaunas Hospital medical personnel (40), Naujoji Akmenė hospital doctors (50), Šiauliai city teachers (89) consisting of the nursery - kindergarten teachers (23), the exact sciences and humanities teachers (35), primary school teachers (31). Also, sales consultant were interviewed (36), managers (27), heads of institutions (31) and laborers (35). The empirical part deals with the relationship between an occupation and voice disorders. It is also trying to find out whether there is a relationship between sex and the problems associated with voice. The main empirical findings: 1. Pedagogical, psychological and medical literature shows that the main causes of voice disorders is voice abuse and its inappropriate use. 2. Teacher’s profession enters of the highest risk group, according to the probability of occurrence of voice disorders among workers and the managers are reluctant to complain about the voice-related problems. 3. Most feelings and changes that may be the initial symptoms associated with voice disorders appearance, feel the nursery - kindergarten teachers, who have long hours of intensive... [to full text]
6

Balso technologijų naudojimas vartotojų atpažinimo uždaviniuose / User recognition using voice techniques

Rudeičiukas, Marius 25 November 2010 (has links)
Balso atpažinimo biometrinis metodas remiasi tuo kad žmogaus balsas savyje turi nemažą kiekį informacijos: kalba(anglų, rusų, lietuvių), kalbos patologija, lyti, emocinę būseną, amžių. Todėl kaip ir pirštų antspaudai žmonių balsai skiriasi. Nors kalbėtojo atpažinimo tikslumas yra mažesnis už pirštų antspaudus ar tinklainės skanavimą, tačiau kalbėtojo atpažinimo techninė įranga yra kur kas pigesnė, užtenka paprasto mikrofono. Todėl mano magistro darbui buvo pasirinkta tema : Balso technologijų taikymas vartotojo atpažinimo uždaviniuose. Šiame darbe yra apžvelgti iki šiol įvykdyti eksperimentai ir tyrimai šioje srityje. Taip pat apžvelgti pagrindiniai kalbėtojų atpažinimo principai ir metodai. Jų veikimo pobūdis, panaudojimo galimybės ir teikiamas atpažinimo tikslumas. Tad pasinaudojant Eksperimento metu buvo sukurta programa, kurios tikslas yra kalbėtojo atpažinimas. Programos veikimas susideda iš trijų pagrindinių žingsniu: Duomenų rinkimo, treniravimo ir testavimo. Pasinaudojant analizės ir teorijos rezultatais sukuriamas eksperimento planas, kuris buvo realizuotas. Sukuriama atpažinimo programa, kurios veikimo principas: paimti garso failai yra apdorojami, iškerpamas reikalingas eksperimentinis žodis „vienas“, bei naujas garso failas yra apdorojamas (naikinami amplitudės ir DC svyravimai, bei pašalinama tyla ir triukšmas). Tada vykdomas testavimo etapas, kurio metu treniruojamas kalbos modelis, kuriama VQ kodų knyga kiekvienam etalonui. Vėliau kodų knyga bus panaudota... [toliau žr. visą tekstą] / Voice biometric authentication method based on the fact that the human voice itself has a significant amount of information: the language (English, Russian, Lithuanian), speech pathology, sex, emotional status, age. Therefore, as the fingerprints of human voices are different. Although the speaker identification accuracy is lower for fingerprints or retinal scanning, but the speaker recognition hardware is much cheaper, just a simple microphone is needed. This work will review the experiments and studies done in this field. As well as an overview of the main principles and methods of speakers identification. Their operational nature, uses, and the accuracy recognition. So the experiment was developed, which aims to speaker identification. Program operation consists of three main steps: data collection, training and testing. The analysis of the theory resulted in creating a plan of the experiment, which has been realized. Created an authentication program, with the operating principle: taken audio files are processed, the necessary experimental word "one" is cut , and a new sound file is handled (noise and silence reduction, and DC offset elimination). Then, out of testing phase, during which the language model is trained, a VQ code book for each standard. Later, the code book will be used for speaker recognition. Testing at the same loaded the sound files in succession, and the use of VQ code book is calculated using Euclidean distance, the standard test with which the... [to full text]
7

Balso technologijų adaptavimas lietuviškai kalbantiems asmenims su regėjimo negalia / Adaptation of voice technologies for lithuanian visually impaired persons

Maceinaitė, Eglė 25 November 2010 (has links)
Šiame darbe nagrinėjamas balso technologijų adaptavimas lietuviškai kalbantiems asmenims su regėjimo negalia. Tiriamas lietuviškų internetinių puslapių pritaikymas akliesiems ir silpnaregiams, naudojantis ekrano skaitytuvu „Jaws for Windows“. Darbo tikslas – ištirti naudojamų kalbos technologijų taikymų adaptavimo galimybes, lietuviškai kalbančiam neįgaliam asmeniui. Darbo uždaviniai: 1. Išsiaiškinti balso technologijų taikymų neįgaliesiems svarbą; 2. Išnagrinėti programinę ir techninę balso technologijų neįgaliesiems taikymo įrangą; 3. Ištirti ekrano skaitytuvo „Jaws for Windows“ funkcionalumą ir vartotojiškumą; 4. Įvertinti kiek Lietuva yra pasiruošusi internetinių puslapių neįgaliesiems kūrime ir naudojime; 5. Pasiūlyti priemones, internetinių svetainių akliesiems ir silpnaregiams, kūrimui ir naudojimui. Darbe naudotini metodai: literatūros analizė ir apibendrinimas, empirinis-eksperimentinis bandymas bei lyginamoji analizė. Išvados: 1. Darbe išsiaiškinta, kad balso technologijų taikymai neįgaliesiems yra esminis jų integravimo į visuomenę elementas. 2. Nustatyta, kad didžiausias yra techninės įrangos pasirinkimas kurtiesiems ir neprigirdintiems, tačiau programinės įrangos didžiausia rinka yra skirta akliesiems ir silpnaregiams. 3. Išsiaiškinta, kad „Jaws for Windows“ ekrano skaitytuvas yra tarptautinis ekrano skaitytuvų standartas akliesiems ir silpnaregiams. 4. Ištirtas ekrano skaitytuvo „Jaws for Windows“ funkcionalumas ir vartotojiškumas, nustatyta, kad programa daro... [toliau žr. visą tekstą] / This paper considers the adaptation of voice technologies for Lithuanian visually impaired persons. Studied Lithuanian popular websites use of blind and partially sighted people, using a screen reader "JAWS for Windows." The aim of work – explore adaptation of speech technologies applications oriented for disabled Lithuanian people. The tasks of work: 1. To clarify the importance of speech technologies applications oriented for disabled people; 2. Examine the software and the hardware of speech technologies oriented for disabled people; 3. Examine the screen scanner „Jaws for Windows“ functionality and consumption; 4. Assess how Lithuania is ready to develop and to use websites for disabled people; 5. To propose measures for creation and use websites for blind and partially sighted people. The work methodology: Analysis and synthesis of the literature, empirical test-experimental and comparative analysis. Conclusions: 1. Recognition of the work that the voice technology applications for disabled people are essential to their way of integration into society. 2. Clear that the „Jaws for Windows“ screen reader is an international standard of screen readers for blind and sighted people. 3. Studied the screen reader „Jaws for Windows“ functionality and consumption, found that the program has twice as many errors, in reading the most popular Lithuanian sites, than those recommended by the American Association for the blind and sighted. 4. Experimental study of the proposal to... [to full text]
8

Balso daugiaparametrio tyrimo sisteminės analizės reikšmė pirminei gerklų ligų atrankai / The value of voice multidimensional assessment in screening of laryngeal disorders

Vegienė, Aurelija 04 September 2014 (has links)
Disertaciniame darbe ištirti gerklų ligomis sergantys ir sveiki asmenys, naudojant įvairiapusius metodus – klausimynus, akustinę analizę, balso lauko tyrimą, vaizdo laringostroboskopiją (VLS). Sukurta informaty¬viausia įvairialypių požymių sistema, padedanti spręsti apie tikimybę, kuriai gerklų ligų grupei priskirtinas tiriamasis asmuo. Sukurta originali VLS vaizdų matavimo metodika bei nustatyti svarbiausi parametrai, kurie tiksliausiai apibūdina klasifikuojamas gerklų ligų grupes. Disertacinio darbo uždaviniai: (1) nustatyti informatyviausius anamne¬zės bei demografinius faktorius, kurie leistų tiriamuosius klasifikuoti į sveiko ir patologinio balso, taip pat į gerklų ligų grupes; įvertinti šių faktorių efektyvumą pirminei gerklų ligų atrankai; (2) atlikti subjektyvią ir kompiuterinę akustinę balso analizę bei sudaryti informatyviausių balso parametrų sistemą gerklų ligų grupėms klasifikuoti; (3) atlikti ir kiekybiškai įvertinti VLS bei nustatyti kiekybinių VLS vertinimo parametrų patikimumą bei reikšmingumą klasifikuojant tiriamuosius į gerklų ligų grupes; (4) sukurti VLS paveikslų objektyvaus kiekybinio matavimo sistemą bei nustatyti VLS matavimo parametrų reikšmingumą klasifikuojant į atitinkamas gerklų ligų grupes; (5) jungiant anketinius duomenis, akustinę balso analizę, VLS vertinimo ir VLS matavimo parametrus, įvertinti gerklų ligų pirminės atrankos sistemos efektyvumą. / In this dissertation were determined the most important questionnaire statements, parameters of perceptive and acoustic voice analysis and quantitatively evaluated and measured parameters of video laryngo-stroboscopy for classification tasks of laryngeal disorders. It was established the most sensitive and specific laryngeal and voice features system discriminating normal, pathological and other voice disorders groups. It was established the original VLS measurement methodic with original parameters. The objectives of the study: (1) to determine the most important questionnaire statements, discriminating normal and pathological voice, glottal cancer and other mass lesions, nodular, diffuse, paralysis and healthy classes and to evaluate their classification efficiency for screening of laryngeal diseases; (2) to perform perceptual, acoustic, aerodynamic vocal function measurements and to determine the most sensitive and specific parameters discriminating voice groups; (3) to evaluate quantitatively parameters of VLS and to determine the sensitivity and specificity of these parameters discriminating groups of laryngeal diseases; (4) to establish the system of quantitative objective VLS measurements revealing their reliability discriminating normal and pathological voice groups; (5) to establish the most sensitive and specific laryngeal and voice features system for laryngeal diseases screening purposes.
9

Mathematical modelling of some aspects of stressing a Lithuanian text / Kai kurių lietuvių kalbos teksto kirčiavimo aspektų matematinis modeliavimas

Anbinderis, Tomas 02 July 2010 (has links)
The present dissertation deals with one of the speech synthesizer components – automatic stressing of a text and two other goals relating to it – homographs (words that can be stressed in several ways) disambiguation and a search for clitics (unstressed words). The method, which by means of decision trees finds sequences of letters that unambiguously define the word stressing, was applied to stress a Lithuanian text. Decision trees were created using large corpus of stressed words. Stressing rules based on sequences of letters at the beginning, ending and in the middle of a word have been formulated. The algorithm proposed reaches the accuracy of about 95.5%. The homograph disambiguation algorithm proposed by the present author is based on frequencies of lexemes and morphological features, that were obtained from corpus containing about one million words. Such methods were not used for Lithuanian language so far. The proposed algorithm enables to select the correct variant of stressing within the accuracy of 85.01%. Besides the author proposes methods of four types to search for the clitics in a Lithuanian text: methods based on recognising the combinational forms, based on statistical stressed/unstressed frequency of a word, grammar rules and stressing of the adjacent words. It is explained how to unite all the methods into a single algorithm. 4.1% of errors was obtained for the testing data among all the words, and the ratio of errors and unstressed words accounts for 18... [to full text] / Disertacijoje nagrinėjama viena iš kalbos sintezatoriaus sudedamųjų dalių – teksto automatinis kirčiavimas, bei su kirčiavimu susiję kiti uždaviniai: vienodai rašomų, bet skirtingai tariamų, žodžių (homografų) vienareikšminimas bei prie gretimo žodžio prišlijusių bekirčių žodžių (klitikų) paieška. Teksto kirčiavimui pritaikytas metodas, kuris naudodamas sprendimų medžius randa raidžių sekas, vienareikšmiai nusakančias žodžio kirčiavimą. Sprendimo medžiams sudaryti buvo naudojamas didelies apimties sukirčiuotų žodžių tekstynas. Buvo sudarytos kirčiavimo taisyklės remiantis raidžių sekomis žodžių pradžioje, pabaigoje ir viduryje. Pasiūlytas kirčiavimo algoritmas pasiekia apie 95,5% tikslumą. Homografams vienareikšminti pritaikyti iki šiol lietuvių kalbai nenaudoti metodai, pagrįsti leksemų ir morfologinių pažymų vartosenos dažniais, gautais iš vieno milijono žodžių tekstyno. Darbe parodyta, kad morfologinių pažymų dažniai yra svarbesni už leksemų dažnius. Pasiūlyti metodai leido homografus vienareikšminti 85,01% tikslumu. Klitikų paieškai pasiūlyti metodai, kurie remiasi: 1) samplaikinių formų atpažinimu, 2) statistiniu žodžio kirčiavimo/nekirčiavimo dažniu, 3) kai kuriomis gramatikos taisyklėmis bei 4) gretimų žodžių kirčių pasiskirstymu (ritmika). Paaiškinta, kaip visus metodus sujungti į vieną algoritmą. Pritaikius šį algoritmą testavimo duomenims, klaidų ir visų žodžių santykis buvo 4,1%, o klaidų ir nekirčiuotų žodžių santykis – 18,8%.
10

Kai kurių lietuvių kalbos teksto kirčiavimo aspektų matematinis modeliavimas / Mathematical modelling of some aspects of stressing a Lithuanian text

Anbinderis, Tomas 02 July 2010 (has links)
Disertacijoje nagrinėjama viena iš kalbos sintezatoriaus sudedamųjų dalių – teksto automatinis kirčiavimas, bei su kirčiavimu susiję kiti uždaviniai: vienodai rašomų, bet skirtingai tariamų, žodžių (homografų) vienareikšminimas bei prie gretimo žodžio prišlijusių bekirčių žodžių (klitikų) paieška. Teksto kirčiavimui pritaikytas metodas, kuris naudodamas sprendimų medžius randa raidžių sekas, vienareikšmiai nusakančias žodžio kirčiavimą. Sprendimo medžiams sudaryti buvo naudojamas didelies apimties sukirčiuotų žodžių tekstynas. Buvo sudarytos kirčiavimo taisyklės remiantis raidžių sekomis žodžių pradžioje, pabaigoje ir viduryje. Pasiūlytas kirčiavimo algoritmas pasiekia apie 95,5% tikslumą. Homografams vienareikšminti pritaikyti iki šiol lietuvių kalbai nenaudoti metodai, pagrįsti leksemų ir morfologinių pažymų vartosenos dažniais, gautais iš vieno milijono žodžių tekstyno. Darbe parodyta, kad morfologinių pažymų dažniai yra svarbesni už leksemų dažnius. Pasiūlyti metodai leido homografus vienareikšminti 85,01% tikslumu. Klitikų paieškai pasiūlyti metodai, kurie remiasi: 1) samplaikinių formų atpažinimu, 2) statistiniu žodžio kirčiavimo/nekirčiavimo dažniu, 3) kai kuriomis gramatikos taisyklėmis bei 4) gretimų žodžių kirčių pasiskirstymu (ritmika). Paaiškinta, kaip visus metodus sujungti į vieną algoritmą. Pritaikius šį algoritmą testavimo duomenims, klaidų ir visų žodžių santykis buvo 4,1%, o klaidų ir nekirčiuotų žodžių santykis – 18,8%. / The present dissertation deals with one of the speech synthesizer components – automatic stressing of a text and two other goals relating to it – homographs (words that can be stressed in several ways) disambiguation and a search for clitics (unstressed words). The method, which by means of decision trees finds sequences of letters that unambiguously define the word stressing, was applied to stress a Lithuanian text. Decision trees were created using large corpus of stressed words. Stressing rules based on sequences of letters at the beginning, ending and in the middle of a word have been formulated. The algorithm proposed reaches the accuracy of about 95.5%. The homograph disambiguation algorithm proposed by the present author is based on frequencies of lexemes and morphological features, that were obtained from corpus containing about one million words. Such methods were not used for Lithuanian language so far. The proposed algorithm enables to select the correct variant of stressing within the accuracy of 85.01%. Besides the author proposes methods of four types to search for the clitics in a Lithuanian text: methods based on recognising the combinational forms, based on statistical stressed/unstressed frequency of a word, grammar rules and stressing of the adjacent words. It is explained how to unite all the methods into a single algorithm. 4.1% of errors was obtained for the testing data among all the words, and the ratio of errors and unstressed words accounts for 18.8%... [to full text]

Page generated in 0.0253 seconds