The aim of this study was to examine how Swedish compound nouns are translated by the machine translation program Google Translate. In order to conclude what main types of mistranslation occur, different texts were first translated by the program; all compound nouns were then listed and analysed, and the mistranslated compound nouns were categorised in accordance with the manner of mistranslation. The study was also working from a hypothesis that the frequency of a compound would affect the chances of getting a correct translation. To test this hypothesis, queries were run in a Swedish corpus to get an estimation of how frequently used the compounds are. The results show that mistranslations could be categorised into four different types, and that the most common types of mistranslation were omitting part of the compound, and translating reoccurring compounds inconsistently. The hypothesis that compounds with high frequency in the corpus would be correctly translated, while compounds with low frequency would be incorrectly translated, could not be conclusively confirmed or refuted. Although there was some indication of a link between frequency and translation accuracy, the connection was not clear enough to claim that there is a correlation. / Syftet med denna undersökning var att undersöka hur sammansättningar på svenska behandlas av maskinöversättningsprogrammet Google Translate. För att bedöma vilka som var de vanligaste typerna av felöversättningar översattes först olika texter med programmet. Sammansättningarna listades sedan och analyserades, och felöversatta sammansättningar kategoriserades efter typ av felöversättning. Undersökningen utgick vidare från hypotesen att frekvensen av ett sammansatt ord skulle påverka sannolikheten för en korrekt översättning. För att testa denna hypotes gjordes sökningar på orden i en svensk korpus för att få en uppfattning om hur vanligt förekommande sammansättningarna är. Resultaten visar att felöversättningarna kunde kategoriseras som fyra olika typer, och att de vanligaste typerna var att ett led i sammansättningen utelämnades samt att återkommande sammansättningar var inkonsekvent översatta. Hypotesen att sammansättningar med hög frekvens i korpusen skulle bli korrekt översatta och sammansättningar med låg frekvens inkorrekt översatta, kunde inte entydigt bekräftas eller vederläggas. Det fanns vissa indikationer på en koppling mellan frekvens och översättning, dock var dessa inte tydliga nog för att hävda att ett klart samband existerar.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kau-34500 |
Date | January 2013 |
Creators | Allansson, Jimmy |
Publisher | Karlstads universitet, Institutionen för språk, litteratur och interkultur |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0023 seconds