Šiame darbe tirtos šešiažodės kolokacijos, kuriose yra bent vienas daiktavardis. Tyrimas atlikas laikantis nuomonės, kad kolokacija – dažnai kartu einančių žodžių junginys, sudarytas bent iš vieno kaitomo žodžio ir turintis bendrą reikšmę. Tirtos kolokacijos automatiškai buvo išrinktos iš Dabartinės lietuvių kalbos tekstyno naudojant statistinį Gravity Count metodą.
Šis darbas skirtas tam, kad būtų išsamiau išanalizuotos lietuvių kalbos kolokacijos, taigi darbo tikslas – nustatyti šešiažodžių daiktavardinių kolokacijų gramatinius ir semantinius modelius bei galimas jų sąsajas. Kolokacijos buvo atrinktos iš Dabartinės lietuvių kalbos tekstyno statistiniu būdu. Darbo šaltinį sudaro daugiau nei 100 mln. žodžių.
Šešiažodės kolokacijos, lyginant su iš dviejų, trijų, keturių žodžių sudarytomis kolokacijomis, yra gana retos, nes minėtų tipų kolokacijos sudaro 85 proc. visų daiktavardinių kolokacijų. Nustatyta, kad kuo ilgesnė frazė, tuo ji rečiau vartojama tekstyne.
Šiame darbe kolokacijos analizuotos gramatiniu ir semantiniu aspektais. Analizuojant gramatiškai, kolokacijos suskirstytos į šešis tipus, pagal tai, kiek jose vartojama daiktavardžių. Tuos tipus sudaro kolokacijos, kuriose pavartotas vienas, du, trys, keturi, penki arba šeši daiktavardžiai. Kiekvienas šis tipas buvo tirtas išsamiau.
Kolokacijos buvo anotuotos su automatinės morfologinės analizės programa. Tokiu būdu buvo nustatyti visi galimi gramatiniai kolokacijų modeliai. Jų rasta 824. Daugiausiai gramatinių modelių... [toliau žr. visą tekstą] / The main purpose of this research was to set grammatical and semantic typology of six-word – length Lithuanian collocations. Collocations were extracted automatically from the „Corpus of Contemporary Lithuanian Language“ using statistical Gravity Counts method.
The Source of this study concist of 100 million words. Six–words–length collocations are very rare, two, three, four–length-words collocations make 85% of all noun collocations. It was notified that as the phrase is longer, as more seldom it is used in Corpora.
In this study collocations were researched grammatically and semantically. Grammatically researhed collocations were devided into six types, accourding to the number of nouns used in it. Those types are made of collocations which have one, two, three, four, five, six nouns. All those types were researched more deeply.
Collocations were annotated using automatical marphology analysis program. In this way all possible grammatical collocation models concist of three nouns collocations – 255 models (31.33 %).
Different collocations number is not equal to different grammatical models. 1560 different collocations were found. The most of different collocations have four nouns – 459 which makes 1/3 of all collocations.
Despite the variaty of grammatical models, the models which are made of single collocations are the most frequent. The more noun collocation type has, the less single grammatical models can be made, for example, single one noun collocations make... [to full text]
Identifer | oai:union.ndltd.org:LABT_ETD/oai:elaba.lt:LT-eLABa-0001:E.02~2008~D_20080804_101936-51028 |
Date | 04 August 2008 |
Creators | Demenienė, Kristina |
Contributors | Marcinkevičienė, Rūta, Utka, Andrius, Vytautas Magnus University |
Publisher | Lithuanian Academic Libraries Network (LABT), Vytautas Magnus University |
Source Sets | Lithuanian ETD submission system |
Language | Lithuanian |
Detected Language | Unknown |
Type | Master thesis |
Format | application/pdf |
Source | http://vddb.library.lt/obj/LT-eLABa-0001:E.02~2008~D_20080804_101936-51028 |
Rights | Unrestricted |
Page generated in 0.002 seconds