Spelling suggestions: "subject:"klitikai"" "subject:"politikai""
1 |
Mathematical modelling of some aspects of stressing a Lithuanian text / Kai kurių lietuvių kalbos teksto kirčiavimo aspektų matematinis modeliavimasAnbinderis, Tomas 02 July 2010 (has links)
The present dissertation deals with one of the speech synthesizer components – automatic stressing of a text and two other goals relating to it – homographs (words that can be stressed in several ways) disambiguation and a search for clitics (unstressed words).
The method, which by means of decision trees finds sequences of letters that unambiguously define the word stressing, was applied to stress a Lithuanian text. Decision trees were created using large corpus of stressed words. Stressing rules based on sequences of letters at the beginning, ending and in the middle of a word have been formulated. The algorithm proposed reaches the accuracy of about 95.5%.
The homograph disambiguation algorithm proposed by the present author is based on frequencies of lexemes and morphological features, that were obtained from corpus containing about one million words. Such methods were not used for Lithuanian language so far. The proposed algorithm enables to select the correct variant of stressing within the accuracy of 85.01%.
Besides the author proposes methods of four types to search for the clitics in a Lithuanian text: methods based on recognising the combinational forms, based on statistical stressed/unstressed frequency of a word, grammar rules and stressing of the adjacent words. It is explained how to unite all the methods into a single algorithm. 4.1% of errors was obtained for the testing data among all the words, and the ratio of errors and unstressed words accounts for 18... [to full text] / Disertacijoje nagrinėjama viena iš kalbos sintezatoriaus sudedamųjų dalių – teksto automatinis kirčiavimas, bei su kirčiavimu susiję kiti uždaviniai: vienodai rašomų, bet skirtingai tariamų, žodžių (homografų) vienareikšminimas bei prie gretimo žodžio prišlijusių bekirčių žodžių (klitikų) paieška. Teksto kirčiavimui pritaikytas metodas, kuris naudodamas sprendimų medžius randa raidžių sekas, vienareikšmiai nusakančias žodžio kirčiavimą. Sprendimo medžiams sudaryti buvo naudojamas didelies apimties sukirčiuotų žodžių tekstynas. Buvo sudarytos kirčiavimo taisyklės remiantis raidžių sekomis žodžių pradžioje, pabaigoje ir viduryje. Pasiūlytas kirčiavimo algoritmas pasiekia apie 95,5% tikslumą. Homografams vienareikšminti pritaikyti iki šiol lietuvių kalbai nenaudoti metodai, pagrįsti leksemų ir morfologinių pažymų vartosenos dažniais, gautais iš vieno milijono žodžių tekstyno. Darbe parodyta, kad morfologinių pažymų dažniai yra svarbesni už leksemų dažnius. Pasiūlyti metodai leido homografus vienareikšminti 85,01% tikslumu. Klitikų paieškai pasiūlyti metodai, kurie remiasi: 1) samplaikinių formų atpažinimu, 2) statistiniu žodžio kirčiavimo/nekirčiavimo dažniu, 3) kai kuriomis gramatikos taisyklėmis bei 4) gretimų žodžių kirčių pasiskirstymu (ritmika). Paaiškinta, kaip visus metodus sujungti į vieną algoritmą. Pritaikius šį algoritmą testavimo duomenims, klaidų ir visų žodžių santykis buvo 4,1%, o klaidų ir nekirčiuotų žodžių santykis – 18,8%.
|
2 |
Kai kurių lietuvių kalbos teksto kirčiavimo aspektų matematinis modeliavimas / Mathematical modelling of some aspects of stressing a Lithuanian textAnbinderis, Tomas 02 July 2010 (has links)
Disertacijoje nagrinėjama viena iš kalbos sintezatoriaus sudedamųjų dalių – teksto automatinis kirčiavimas, bei su kirčiavimu susiję kiti uždaviniai: vienodai rašomų, bet skirtingai tariamų, žodžių (homografų) vienareikšminimas bei prie gretimo žodžio prišlijusių bekirčių žodžių (klitikų) paieška. Teksto kirčiavimui pritaikytas metodas, kuris naudodamas sprendimų medžius randa raidžių sekas, vienareikšmiai nusakančias žodžio kirčiavimą. Sprendimo medžiams sudaryti buvo naudojamas didelies apimties sukirčiuotų žodžių tekstynas. Buvo sudarytos kirčiavimo taisyklės remiantis raidžių sekomis žodžių pradžioje, pabaigoje ir viduryje. Pasiūlytas kirčiavimo algoritmas pasiekia apie 95,5% tikslumą. Homografams vienareikšminti pritaikyti iki šiol lietuvių kalbai nenaudoti metodai, pagrįsti leksemų ir morfologinių pažymų vartosenos dažniais, gautais iš vieno milijono žodžių tekstyno. Darbe parodyta, kad morfologinių pažymų dažniai yra svarbesni už leksemų dažnius. Pasiūlyti metodai leido homografus vienareikšminti 85,01% tikslumu. Klitikų paieškai pasiūlyti metodai, kurie remiasi: 1) samplaikinių formų atpažinimu, 2) statistiniu žodžio kirčiavimo/nekirčiavimo dažniu, 3) kai kuriomis gramatikos taisyklėmis bei 4) gretimų žodžių kirčių pasiskirstymu (ritmika). Paaiškinta, kaip visus metodus sujungti į vieną algoritmą. Pritaikius šį algoritmą testavimo duomenims, klaidų ir visų žodžių santykis buvo 4,1%, o klaidų ir nekirčiuotų žodžių santykis – 18,8%. / The present dissertation deals with one of the speech synthesizer components – automatic stressing of a text and two other goals relating to it – homographs (words that can be stressed in several ways) disambiguation and a search for clitics (unstressed words).
The method, which by means of decision trees finds sequences of letters that unambiguously define the word stressing, was applied to stress a Lithuanian text. Decision trees were created using large corpus of stressed words. Stressing rules based on sequences of letters at the beginning, ending and in the middle of a word have been formulated. The algorithm proposed reaches the accuracy of about 95.5%.
The homograph disambiguation algorithm proposed by the present author is based on frequencies of lexemes and morphological features, that were obtained from corpus containing about one million words. Such methods were not used for Lithuanian language so far. The proposed algorithm enables to select the correct variant of stressing within the accuracy of 85.01%.
Besides the author proposes methods of four types to search for the clitics in a Lithuanian text: methods based on recognising the combinational forms, based on statistical stressed/unstressed frequency of a word, grammar rules and stressing of the adjacent words. It is explained how to unite all the methods into a single algorithm. 4.1% of errors was obtained for the testing data among all the words, and the ratio of errors and unstressed words accounts for 18.8%... [to full text]
|
3 |
Lietuvių senųjų raštų klitiniai įvardžiai XVI-XVIII a / Personal pronominal clitics in Old Lithuanian (16th–18th centuries)Razanovaitė, Auksė 02 June 2014 (has links)
Disertacijoje tiriami ir aprašomi senosios lietuvių kalbos klitiniai įvardžiai (formos m(i), t(i)), pateikiamas išsamus jų sąvadas. Remiantis surinkta medžiaga, įvertinamos klitinių įvardžių linksnių reikšmės, apibrėžiama šių formų pozicija sakinyje ir pozicija žodžio, prie kurio šlyja klitinis įvardis, atžvilgiu, apžvelgiama klitinių įvardžių raida, jų vartosenos pokyčiai. Teorinėje darbo dalyje aptariami tipologiniai klitikų parametrai ir tyrimai, taip pat veiksmažodiniai ir antrosios pozicijos klitikai, kelių kalbų klitinių įvardžių sistemų raida — tarpinė padėtis tarp veiksmažodinių ir antrosios pozicijos klitikų. Nustatomi lietuvių kalbos senųjų raštų pirmojo ir antrojo asmens klitinių įvardžių pozicijos sakinyje tipai. Tiriamojoje darbo dalyje chronologiškai ir pagal atskirus autorius išsamiai analizuojama lietuvių XVI—XVIII a. raštų klitinių įvardžių vartosena. Nemažai duomenų apie klitinių įvardžių raidą, vartosenos pokyčius teikiama remiantis to paties teksto ar tekstų rinkinio skirtingų laikotarpių leidimais. Be kitų disertacijos išvadų, pastebėta, kad senosios lietuvių kalbos klitinių įvardžių raida yra tipologiškai artima slavų kalboms. Panašiai kaip jose, lietuvių kalbos senuosiuose raštuose klitiniai įvardžiai rodo stiprią tendenciją eiti greta veiksmažodžio lyčių, nors yra atvejų, kuriuos galima vertinti ir kaip atitinkančius archajišką Wackernagelio poziciją. / The dissertation investigates and describes the pronominal clitics of the Old Lithuanian (forms m(i), t(i)). It also provides a detailed inventory of these forms. On the basis of the collected material, declensional meanings of pronominal clitics are evaluated, the position of the forms in a sentence is defined as well as their position in respect of the word to which the pronominal clitic is adjacent. An overview of the evolution of pronominal clitics and the changes of their usage is adduced.
The theoretical part of the paper discusses the typological parameters and researches of clitics, as well as the verbal and the second position clitics, and the evolution of multi-language systems of pronominal clitics – an intermediate position between the verbal and the second position clitics. The types of the positions in a sentence of the first and the second person pronominal clitics in the Old Lithuanian are determined.
The investigative part of the thesis adduces the usage of the patterns of pronominal clitics in the Lithuanian texts of the 16th-18th centuries, analyzed in detail, in chronological order and according to individual authors. A lot of information about the evolution of the pronominal clitics and the changes of their usage is given on the basis of the editions of different periods of the same text or a set of texts.
Among the other conclusions of the thesis, it is noted that the evolution of the pronominal clitics of the Old Lithuanian is typologically similar to... [to full text]
|
4 |
Personal pronominal clitics in old Lithuanian (16th–18th centuries) / Lietuvių senųjų raštų klitiniai įvardžiai (XVI–XVIII a.)Razanovaitė, Auksė 02 June 2014 (has links)
The dissertation investigates and describes the pronominal clitics of the Old Lithuanian (forms m(i), t(i)). It also provides a detailed inventory of these forms. On the basis of the collected material, declensional meanings of pronominal clitics are evaluated, the position of the forms in a sentence is defined as well as their position in respect of the word to which the pronominal clitic is adjacent. An overview of the evolution of pronominal clitics and the changes of their usage is adduced.
The theoretical part of the paper discusses the typological parameters and researches of clitics, as well as the verbal and the second position clitics, and the evolution of multi-language systems of pronominal clitics – an intermediate position between the verbal and the second position clitics. The types of the positions in a sentence of the first and the second person pronominal clitics in the Old Lithuanian are determined.
The investigative part of the thesis adduces the usage of the patterns of pronominal clitics in the Lithuanian texts of the 16th-18th centuries, analyzed in detail, in chronological order and according to individual authors. A lot of information about the evolution of the pronominal clitics and the changes of their usage is given on the basis of the editions of different periods of the same text or a set of texts.
Among the other conclusions of the thesis, it is noted that the evolution of the pronominal clitics of the Old Lithuanian is typologically similar to... [to full text] / Disertacijoje tiriami ir aprašomi senosios lietuvių kalbos klitiniai įvardžiai (formos m(i), t(i)), pateikiamas išsamus jų sąvadas. Remiantis surinkta medžiaga, įvertinamos klitinių įvardžių linksnių reikšmės, apibrėžiama šių formų pozicija sakinyje ir pozicija žodžio, prie kurio šlyja klitinis įvardis, atžvilgiu, apžvelgiama klitinių įvardžių raida, jų vartosenos pokyčiai. Teorinėje darbo dalyje aptariami tipologiniai klitikų parametrai ir tyrimai, taip pat veiksmažodiniai ir antrosios pozicijos klitikai, kelių kalbų klitinių įvardžių sistemų raida — tarpinė padėtis tarp veiksmažodinių ir antrosios pozicijos klitikų. Nustatomi lietuvių kalbos senųjų raštų pirmojo ir antrojo asmens klitinių įvardžių pozicijos sakinyje tipai. Tiriamojoje darbo dalyje chronologiškai ir pagal atskirus autorius išsamiai analizuojama lietuvių XVI—XVIII a. raštų klitinių įvardžių vartosena. Nemažai duomenų apie klitinių įvardžių raidą, vartosenos pokyčius teikiama remiantis to paties teksto ar tekstų rinkinio skirtingų laikotarpių leidimais. Be kitų disertacijos išvadų, pastebėta, kad senosios lietuvių kalbos klitinių įvardžių raida yra tipologiškai artima slavų kalboms. Panašiai kaip jose, lietuvių kalbos senuosiuose raštuose klitiniai įvardžiai rodo stiprią tendenciją eiti greta veiksmažodžio lyčių, nors yra atvejų, kuriuos galima vertinti ir kaip atitinkančius archajišką Wackernagelio poziciją.
|
Page generated in 0.0391 seconds