Das Thema maschinelle Übersetzung scheidet die Geister in der Übersetzungsbranche wie kein zweites. Doch ist die Kritik gerechtfertigt? Fehlerfrei ist die MT jedenfalls (noch) nicht – wir zeigen die typischen Fehlerquellen maschineller Übersetzungen und wie diese mit Full Post-Editing bereinigt werden können.
„Mensch UND Maschine” statt „Mensch ODER Maschine”
In unserem vorangegangenen Artikel zur maschinellen Übersetzung haben wir bereits festgestellt: Die Antwort auf die Frage „Mensch ODER Maschine?” lautet schlicht: „Mensch UND Maschine”! Denn die maschinelle Übersetzung kann bislang noch nicht mit der Qualität von Humanübersetzungen mithalten. Um dieselbe Qualität wie bei einer Humanübersetzung zu erzielen, ist eine Nachbearbeitung der Übersetzung, das sogenannte Full Post-Editing, erforderlich. Was genau hinter „Full Post-Editing” steckt, verraten wir hier.
Drei Fehlerquellen maschinell erstellter Übersetzungen
Momentan gibt es noch Bereiche, in denen die Maschine bei der Übersetzung an ihre Grenzen stößt. Hier heißt es daher: Augen auf beim Post-Editing! Denn hinter den typischen Fehlerquellen stecken Faktoren, die für die Qualität der Übersetzung wichtig sind. Die folgenden Beispiele zeigen anschaulich, in welchen Bereichen die Machine Translation noch nicht mit der Humanübersetzung mithalten kann und warum hier Post-Editing so wichtig ist. In den Screenshots ist dabei links immer der Ausgangstext zu sehen, während rechts der Zieltext steht.
Terminologie
Eine sorgfältig gepflegte Terminologie ist die Basis für eine qualitativ hochwertige Übersetzung. Die Terminologie wird in Datenbanken gepflegt, in welchen ein kontrolliertes und einheitliches Vokabular für die Übersetzungsprojekte eines Auftraggebers festgelegt ist. Damit liefert die Terminologie eine wichtige Grundlage für einen optimierten Übersetzungsprozess. Denn sie sorgt für mehr Klarheit und Konsistenz bei der Übersetzung.
Doch maschinelle Übersetzungssysteme berücksichtigen solche Termdatenbanken (noch) nicht. Das kann zu einer inkonsistenten Verwendung von Vokabular und so zu missverständlichen und im schlimmsten Fall inkorrekten Übersetzungen führen. Ein Beispiel hierfür ist:
Das Problem: In dem Beispiel wurde sowohl für „user’s manual” als auch für „instruction manual“ das Wort „Bedienungsanleitung” verwendet. Die englischen Wörter beschreiben womöglich zwei verschiedene Anleitungen, was von der Maschine jedoch nicht erkannt wird und so zu Verständnisproblemen führen kann.
Kontext
Komplexe Zusammenhänge herzustellen ist bei der menschlichen Übersetzung ein logischer Gedankenschritt, doch die Maschine stößt hier an ihre Grenzen: Statt, wie der Mensch, den gesamten Kontext zu erfassen, übersetzt sie Satz für Satz und erkennt so die Abhängigkeiten zwischen den Teilkomponenten nicht. Dadurch kann der Sinn des Textes verloren gehen, was wiederum zu Fehlern im Verständnis führen kann. Wie das aussehen kann, zeigt folgendes Beispiel:
Das Problem: Das „it” im Originaltext bezieht sich unter Segment 9 auf „die Datei” bzw. „the file” aus dem Satz im Segment 8. In der Übersetzung wird „it” jedoch mit „es” übersetzt, wodurch der Bezug zu der Datei verloren geht. In Segment 10 bezieht sich „save it” ebenfalls auf die Datei. Die Maschine erkennt diese Zusammenhänge zwischen den drei Segmenten jedoch nicht.
Textkomponenten
Auch bei bestimmten Textkomponenten zeigt sich, dass die Maschine noch nicht auf dem selben Level wie das menschliche Gehirn ist. Während bei der Humanübersetzung textliche Bausteine, die von Sprache zu Sprache variieren, quasi „automatisch” gesetzt werden, ist die Maschine noch nicht so weit. Ein Beispiel dafür sind Anführungszeichen. Die Maschine fügt unabhängig von der Sprache immer die gleichen Anführungszeichen ein.
Weitere Fehler aus diesem Bereich sind:
- Inkonsistente Formulierungen
- Inkonsistente Höflichkeitsformen
- Inkonsistente Verwendung des Imperativs
Im Machine Translation-Output sieht das Ganze dann so aus:
- Falsche Anführungszeichen
Das Problem: Die Anführungszeichen wurden 1:1 aus dem Ausgangstext übernommen, sind in der Zielsprache aber schlichtweg inkorrekt. So müsste im Deutschen eigentlich die Form „Anführungszeichen” statt “Anführungszeichen” gewählt werden.
- Inkonsistente Verwendung der Höflichkeitsform
Das Problem: In diesem Fall wird in der Übersetzung einmal die Höflichkeitsform „Sie” und im nächsten Segment die umgangssprachliche Form „du” verwendet. Da es im Englischen keine Unterscheidung zwischen den Wörtern gibt (für beides wird „you” verwendet) und die Maschine Zusammenhänge zwischen den Segmenten nicht erkennt, kommt es zu der inkonsistenten Verwendung.
- Inkonsistente Verwendung des Imperativs
Das Problem: Auch bei Aufforderungen „denkt” die Maschine nicht mit bzw. bezieht sich nicht auf die vorherigen Segmente. So wurde in Segment 5 bei der Übersetzung eine ausführliche Aufforderung mit Ansprache verwendet, während in Segment 6 eine knappere Form ohne direkte Ansprache genutzt wurde. Dies führt zu Uneinheitlichkeit und ist besonders dann ein unschöner Fehler, wenn mehrere Aufforderungen untereinander stehen.
Fazit: Post-Editing ist für Qualität, Kosten und Verständnis essentiell
Fehler in der Terminologie, im Kontext oder in einzelnen Textkomponenten – auch wenn es oft wie Wortklauberei wirkt – können ernsthafte Konsequenzen haben. Denn im schlimmsten Fall führen Übersetzungsfehler nicht nur zu einer schlechteren textlichen Qualität, sondern zu Verständnisproblemen der technischen Dokumentation. Das Worst-Case-Szenario sind Fehler bei der Anwendung, die zu ernsthaften Unfällen und so zu Haftungsschäden beim Hersteller führen können. Darüber hinaus wirken sich Sätze bzw. Wörter, die jedes Mal unterschiedlich übersetzt werden, auch auf die Kosten aus. Das trifft beispielsweise auf Terminologie oder sich wiederholende Sätze zu. Denn bereits übersetzte Sätze oder Wörter müssen nicht noch einmal übersetzt werden. Vor diesem Hintergrund ist Full Post-Editing durchaus ein essentieller Teil maschineller Übersetzung, durch den die Qualität der Machine Translation mit der von Humanübersetzungen mithalten kann.
In diesem Artikel haben wir bereits einige Beispiele angeführt, doch über diese Fehlerquellen hinaus gibt es noch zahlreiche weitere Aspekte, die beim Full Post-Editing beachtet werden sollten. Wir haben daher eine übersichtliche Checkliste für Sie zusammengestellt, mit der das Nachbearbeiten maschineller Übersetzungen garantiert gelingt.
Die im Text gewählten personenbezogenen Bezeichnungen sollen sich ausdrücklich auf alle Geschlechter in gleicher Weise beziehen. Soweit im Text die männliche Form gewählt wurde, geschah dies aufgrund der besseren Lesbarkeit. Hintergründe zu unserer Entscheidung finden Sie in unserem Artikel So lebt MEINRAD das Thema Gleichberechtigung und gendergerechte Sprache.