Return to search

When grundskoleklass becomes mainstream classroom : An investigation of the translation of Swedish compound nouns into English using Google Translate / När grundskoleklass blir mainstream classroom : En undersökning av översättningen av svenska sammansättningar till engelska med Google Translate

The aim of this study was to examine how Swedish compound nouns are translated by the machine translation program Google Translate. In order to conclude what main types of mistranslation occur, different texts were first translated by the program; all compound nouns were then listed and analysed, and the mistranslated compound nouns were categorised in accordance with the manner of mistranslation. The study was also working from a hypothesis that the frequency of a compound would affect the chances of getting a correct translation. To test this hypothesis, queries were run in a Swedish corpus to get an estimation of how frequently used the compounds are. The results show that mistranslations could be categorised into four different types, and that the most common types of mistranslation were omitting part of the compound, and translating reoccurring compounds inconsistently. The hypothesis that compounds with high frequency in the corpus would be correctly translated, while compounds with low frequency would be incorrectly translated, could not be conclusively confirmed or refuted. Although there was some indication of a link between frequency and translation accuracy, the connection was not clear enough to claim that there is a correlation. / Syftet med denna undersökning var att undersöka hur sammansättningar på svenska behandlas av maskinöversättningsprogrammet Google Translate. För att bedöma vilka som var de vanligaste typerna av felöversättningar översattes först olika texter med programmet. Sammansättningarna listades sedan och analyserades, och felöversatta sammansättningar kategoriserades efter typ av felöversättning. Undersökningen utgick vidare från hypotesen att frekvensen av ett sammansatt ord skulle påverka sannolikheten för en korrekt översättning. För att testa denna hypotes gjordes sökningar på orden i en svensk korpus för att få en uppfattning om hur vanligt förekommande sammansättningarna är. Resultaten visar att felöversättningarna kunde kategoriseras som fyra olika typer, och att de vanligaste typerna var att ett led i sammansättningen utelämnades samt att återkommande sammansättningar var inkonsekvent översatta. Hypotesen att sammansättningar med hög frekvens i korpusen skulle bli korrekt översatta och sammansättningar med låg frekvens inkorrekt översatta, kunde inte entydigt bekräftas eller vederläggas. Det fanns vissa indikationer på en koppling mellan frekvens och översättning, dock var dessa inte tydliga nog för att hävda att ett klart samband existerar.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kau-34500
Date January 2013
CreatorsAllansson, Jimmy
PublisherKarlstads universitet, Institutionen för språk, litteratur och interkultur
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0023 seconds