Return to search

Post Editese als verschärfte Form der Translationese?: Eine Korpusanalyse zu Simplification und Interference in posteditierten Texten

Mit Versprechungen von teils enormen Produktivitätssteigerungen bei mindestens gleicher Qualität im Vergleich zu Humanübersetzungen hat Post-Editing über die Jahre zunehmend an Relevanz gewonnen und ist heute aus der Übersetzungslandschaft nicht mehr wegzudenken. Neben zahllosen Qualitäts- und Produktivitätsstudien gab es vereinzelt Bemühungen, mögliche linguistische Unterschiede zwischen posteditierten und humanübersetzten Texten („Post-Editese“ nach Daems et al 2017) zu untersuchen. So stellte Toral (2019) fest, dass posteditierte Texte bestimmte Merkmale übersetzter Texte („Translationese“ nach Gellerstam, 1986), nicht nur aufweisen, sondern dass diese signifikant häufiger in posteditierten Texten vorzufinden seien. Insofern sei Post-Editese eine verschärfte Form der Translationese.
Allerdings hat das Forschungsfeld der Post-Editese vergleichsweise wenig Aufmerksamkeit erfahren und in den meisten Korpusanalysen wurden Zeitungsartikel oder Texte aus dem Bereich general language untersucht, obwohl sich ein Großteil des Übersetzungsbedarfs im Bereich der Fachtexte und Language for Specific Purposes verorten lässt.
Um dieses Desiderat zu bearbeiten, wird an die Vorarbeit von Toral angeknüpft und anhand eines Fachtextkorpus untersucht, ob sich seine These für die Translationese-Merkmale Simplification und Interference anhand von Ausschnitten aus technischen und medizinischen Fachtexten und den dazugehörigen Übersetzungen bestätigen lässt.
Das Korpus besteht aus 75 Korpustexten des Sprachenpaars Englisch-Deutsch, darunter 6 Ausgangstexte und 69 Übersetzungen der Modi MÜ, LPE, FPE und HÜ. Die Methodik von Toral (2019) und Lapshinova-Koltunski (2013) wird in adaptierter Form und unter Zuhilfenahme der Sprachanalyse-Software Sketch Engine angewendet. Simplification soll anhand der lexikalischen Dichte und lexikalischen Diversität (Type-Token-Ratio, TTR) nachgewiesen werden. Das Verhältnis Nominalität/Verbalität und das Satzlängenverhältnis zwischen AT und ZT werden zum Nachweis von Interference herangezogen.
Die Ergebnisse lassen weder zu Simplification noch zu Interference eindeutige Schlüsse zu: Während der TTR in posteditierten Texten wie erwartet geringer ist als in humanübersetzten Texten, d. h. die posteditierten Texte weniger lexikalisch divers sind als die humanübersetzten, ist die lexikalische Dichte in den posteditierten Texten entgegen der Hypothese höher als in den humanübersetzten Texten. Die Satzlängenverhältnisse zwischen AT und ZT sind in den posteditierten Texten tatsächlich ähnlicher als bei den Humanübersetzungen, was entsprechend der aufgestellten Hypothese auf mehr Interference des AT in den posteditierten Texten hindeutet. Die Ergebnisse zu den Verhältnissen von Nominalität/Verbalität jedoch konnten aufgrund von mutmaßlichen Verzerrungen durch Sprachsystemunterschiede im Bereich der Kompositabildung nicht sinnvoll ausgewertet werden. Durch die geringe Korpusgröße und die geringe Länge der Korpustexte wirken sich bereits einzelne idiosynkratische Entscheidungen auf Einzeltextebene, etwa bei der Satzsegmentierung oder bei der Terminologie, stark auf das Gesamtergebnis aus. Insofern zeigt sich, dass Besonderheiten auf Einzeltextebene in künftigen quantitativen Korpusanalysen, insbesondere in solchen mit größeren Korpora, stärker berücksichtigt werden sollten. Torals These, Post-Editese sei eine verschärfte Form der Translationese, konnte im Rahmen dieser Arbeit folglich nicht eindeutig bestätigt werden.:1 Einleitung
1.1 Herleitung
1.2 Ziel der Arbeit
1.3 Aufbau der Arbeit

2 Hintergrund
2.1 Post-Editing
2.1.1 Definition
2.1.2 Arten von Post-Editing
2.1.3 Produktivitäts- und Kostenvorteile
2.1.4 Qualitätsanalysen
2.1.5 Einflussfaktoren auf die Qualität des MÜ-Outputs
2.1.6 Präferenz- und Akzeptanzstudien
2.1.7 Einstellungen von Übersetzern, Sprachdienstleistern und Kunden
2.1.8 Weitere Forschungsrichtungen
2.2 Translationese
2.2.1 Definition
2.2.2 Übersetzungsuniversalien nach Baker
2.2.3 Interference nach Toury bzw. Teich
2.2.4 Forschungsstand
2.2.5 Neuere Forschungsrichtungen
2.3 Post-Editese
2.3.1 Definition
2.3.2 Forschungsstand
2.4 Zwischenfazit und Forschungsdesiderat

3 Daten und Methoden
3.1 Korpus
3.1.1 Beschreibung der Korpustexte
3.1.2 Erstellung des Korpus
3.1.3 Begründung der Auswahl des Korpus
3.1.4 Aufbereitung der Korpustexte für die maschinelle Auswertung
3.2 Analysemethoden
3.2.1 Simplification
3.2.2 Interference

4 Ergebnisse der eigenen Korpusanalyse und Einordnung der Ergebnisse
4.1 Simplification
4.1.1 Lexikalische Diversität
4.1.2 Lexikalische Dichte
4.1.3 Einordnung der Ergebnisse zu Simplification
4.2 Interference
4.2.1 Verhältnis der Verhältnisse von nominalen und verbalen Wortarten zwischen AT und ZT
4.2.2 Verhältnis der Satzlängen zwischen AT und ZT
4.2.3 Einordnung der Ergebnisse zu Interference

5 Diskussion
6 Fazit und Ausblick
7 Literaturverzeichnis / Promising moderate to sharp increases in productivity while achieving quality that is at least on par with human translation, post-editing has increasingly gained in importance in recent years and has become an integral part of the translation landscape. Aside from countless studies on productivity and quality, there have been isolated efforts to examine possible linguistic differences between postedited texts and human translations (“post-editese” according to Daems et al, 2017). Toral (2019) observed that postedited texts not only exhibit certain characteristics of translated texts (“translationese” according to Gellerstam, 1986), but that they exhibit them to a significantly higher degree compared with human translations. This prompted Toral to describe post-editese as an “exacerbated translationese”.
However, research into post-editese has received relatively little attention and most corpus studies have focused on newspaper articles or so-called general language, despite the fact that most of professional translation takes place in the domain of Language for Specific Purposes.
In order to address this desideratum, this work builds on Toral’s research. A corpus of technical texts is used to examine whether his thesis can be confirmed for simplification and interference, two well-known translationese characteristics, when relying on text excerpts from the technical and medical domain and their corresponding translations.
The corpus consists of 75 texts in total, made up of 6 English source texts and 69 corresponding German translations produced via MT, LPE, FPE and HT. The analysis relies on an adapted form of Toral’s (2019) and Lapshinova-Koltunski’s (2013) methods and makes use of the text analysis software Sketch Engine. The parameters lexical density and lexical variety (type-token ratio, TTR) are used to identify simplification, whereas the nominality/verbality ratio and sentence length ratio between source and target text are interpreted as evidence for interference.
The results are inconclusive for both simplification and interference. While the TTR is, as per the hypothesis, lower in the postedited texts, i. e. while the postedited texts are less lexically varied compared with the human translations, the lexical density of the postedited texts is higher than that of the human translations, which contradicts the hypothesis. The sentence length ratios between source and target texts are more similar in the postedited texts compared with human translations, confirming the hypothesis that postedited texts show more interference from their source text. The results for the nominality/verbality ratio, however, could not be interpreted in any meaningful way, as distortions due to differences in the language systems with respect to compounding likely play a role. Given the small corpus size and the short length of the corpus texts, even isolated, idiosyncratic decisions at the individual text level, e.g. in regards to sentence segmentation and terminology seem to have a major impact on the total result. This shows that peculiarities at the individual text level need to be considered more carefully in future quantitative corpus studies, in particular when dealing with larger corpora. Consequently, Toral’s thesis of post-editese being an exacerbated form of translationese could not definitively be confirmed within this work.:1 Einleitung
1.1 Herleitung
1.2 Ziel der Arbeit
1.3 Aufbau der Arbeit

2 Hintergrund
2.1 Post-Editing
2.1.1 Definition
2.1.2 Arten von Post-Editing
2.1.3 Produktivitäts- und Kostenvorteile
2.1.4 Qualitätsanalysen
2.1.5 Einflussfaktoren auf die Qualität des MÜ-Outputs
2.1.6 Präferenz- und Akzeptanzstudien
2.1.7 Einstellungen von Übersetzern, Sprachdienstleistern und Kunden
2.1.8 Weitere Forschungsrichtungen
2.2 Translationese
2.2.1 Definition
2.2.2 Übersetzungsuniversalien nach Baker
2.2.3 Interference nach Toury bzw. Teich
2.2.4 Forschungsstand
2.2.5 Neuere Forschungsrichtungen
2.3 Post-Editese
2.3.1 Definition
2.3.2 Forschungsstand
2.4 Zwischenfazit und Forschungsdesiderat

3 Daten und Methoden
3.1 Korpus
3.1.1 Beschreibung der Korpustexte
3.1.2 Erstellung des Korpus
3.1.3 Begründung der Auswahl des Korpus
3.1.4 Aufbereitung der Korpustexte für die maschinelle Auswertung
3.2 Analysemethoden
3.2.1 Simplification
3.2.2 Interference

4 Ergebnisse der eigenen Korpusanalyse und Einordnung der Ergebnisse
4.1 Simplification
4.1.1 Lexikalische Diversität
4.1.2 Lexikalische Dichte
4.1.3 Einordnung der Ergebnisse zu Simplification
4.2 Interference
4.2.1 Verhältnis der Verhältnisse von nominalen und verbalen Wortarten zwischen AT und ZT
4.2.2 Verhältnis der Satzlängen zwischen AT und ZT
4.2.3 Einordnung der Ergebnisse zu Interference

5 Diskussion
6 Fazit und Ausblick
7 Literaturverzeichnis

Identiferoai:union.ndltd.org:DRESDEN/oai:qucosa:de:qucosa:82946
Date17 January 2023
CreatorsConze, Marlena
ContributorsUniversität Leipzig
Source SetsHochschulschriftenserver (HSSS) der SLUB Dresden
LanguageGerman
Detected LanguageGerman
Typeinfo:eu-repo/semantics/publishedVersion, doc-type:masterThesis, info:eu-repo/semantics/masterThesis, doc-type:Text
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0036 seconds