In some languages, vague and exaggerated quantities can be represented using certain conventionalised numeral expressions with cross-linguistically varying values, such as Danish hundredesytten "117". Hyperbolic quantities can also be expressed using other quantifier expressions (such as English zillion) which, while they do not denote a specific numerical value, have both structural and functional similarities with exact numerals.These hyperbolic numerals and quasi-numerals are common in a variety of primarily informal contexts, but have yet to be subject to a systematic cross-linguistic investigation. In this study, hyperbolic numerals and quasi-numeral expressions are extracted from a massively parallel corpus of film and TV subtitles in a convenience sample of 50 languages, using automatic word alignments and seed expressions in 5 languages. Additional expressions are also obtained through elicitation. The collected expressions are subsequently analyzed and categorized to investigate patterns in distribution, value, morphology, function and usage. Findings include a cross-linguistic preference toward certain powers of the numeral base for hyperbolic numerals, and consistent patterns of construction with varying degrees of cross-linguistic prevalence for quasi-numerals. / Obestämda och överdrivna mängder kan i vissa språk uttryckas genom specifika räkneord med tvärspråkligt varierande, exakta numeriska värden, t ex danska hundredesytten "117". Överdrivna mängder kan även uttryckas med andra kvantifieraruttryck (t ex engelska zillion) som liknar räkneord i form och funktion, trots att de inte har något eget numeriskt värde. Dessa hyperboliska räkneord och kvasinumeriska uttryck är vanligt förekommande i informellt språk, men har ännu inte varit föremål för en systematisk tvärspråklig undersökning. I denna studie extraheras hyperboliska räkneord och kvasinumeriska uttryck från en massivt parallell korpus av film- och TV-undertexter i ett bekvämlighetsurval av 50 språk, genom automatisk ordlänkning och seed-uttryck på 5 språk. Ytterligare uttryck samlas in genom elicitering. De identifierade uttrycken analyseras och kategoriseras för att undersöka tvärspråkliga mönster i förekomst, numeriskt värde, morfologi, funktion och användning. Hyperboliska räkneord tenderar tvärspråkligt att föredra vissa potenser av talbasen som värden, och konsekventa mönster (med varierande tvärspråklig frekvens) för konstruktion av kvasinumeriska uttryck identifieras.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:su-206994 |
Date | January 2022 |
Creators | Kann, Amanda |
Publisher | Stockholms universitet, Institutionen för lingvistik |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0026 seconds