Return to search

Ordföljdsvariation inom kardinaltalssystem : Extraktion av ordföljdstypologi ur parallella texter / Numeral-dependent word order of cardinal numbers

Typologisk klassificering av kardinaltals ordföljdstendenser har generellt utgått från en binär uppdelning i pre- och postnominella språk, men viss inomspråklig variation i ordföljdsmönster mellan olika kardinaltal har hittats bland världens språk. Tillgång till parallelltexter på många olika språk möjliggör storskalig kvantitativ typologisk analys av syntaktiska fenomen som detta, givet en lämplig strategi för språkoberoende parsning av icke-annoterat material. I denna studie undersöks aspekter av kardinaltalsberoende ordföljdsvariation i 1336 språk genom ordlänkning och annoteringsöverföring i en massivt parallell korpus av Bibelöversättningar. Källtexter märks upp med syntaktisk och lexikal annotering som förs över till icke-annoterad ordlänkad data på andra språk, och ordföljdstendenser för varje kardinaltal och språk mäts statistiskt. Utvärdering av metodens klassificering av generell kardinaltalsordföljd gav 87 % överensstämmelse med data från den manuellt sammanställda WALS-databasen, i linje med tidigare evalueringar av liknande metoder. Variation i ordföljdsmönster mellan individuella kardinaltal uppvisades i en väsentlig andel av undersökta språk, vilket motiverar värdet av en mer detaljerad klassificering av kardinaltals ordföljdstypologi. Undersökning av seriell ordföljdsvariation, där ett seriellt gränsvärde finns mellan olika dominerande ordföljdstyper i ett språks kardinaltalssystem, visade att den överlägset vanligaste strukturen för seriell variation i den undersökta datan var prenominella uttryck för 1 i språk där den dominerande kardinaltalsordföljden klassats som postnominell. / Typological word order classification for cardinal numerals has generally used a binary pre- or postnominal model, but in some languages word order behaviour has been shown to vary between individual cardinal numerals. This phenomenon can be quantitatively studied on a larger typological scale using massively parallel texts, given a cross-language method for parsing non-annotated texts. In this study, cardinal numeral-dependent word order variation is extracted from Bible translations in 1336 languages through word alignment and annotation transfer from syntactically and lexically annotated source texts to all translations in the corpus. Classification of dominant numeral word order using the transferred annotations agreed with manually gathered classifications from the WALS database for 87 % of common languages, which is in line with previous similar studies. Possible numeral-dependent word order variation was identified in a significant number of languages in the sample, supporting the case for use of a more nuanced word order classification structure. Analysis of serial word order variation, where a cardinal numeral of a certain value separates continuous numeral sequences with different dominant word orders, showed the most common structure for this type of variation to be the 1-numeral preceding the noun while all other numerals follow the noun they modify.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:su-170300
Date January 2019
CreatorsKann, Amanda
PublisherStockholms universitet, Institutionen för lingvistik
Source SetsDiVA Archive at Upsalla University
LanguageSwedish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0015 seconds