Machine Translation

Koop­eration von Mensch und Maschine - Full Post-Editing als essen­tieller Teil masch­ineller Über­setzungen

AdobeStock_140939172_1920x1080

Machine Translation ist bei vielen Übersetzern noch mit Vorurteilen behaftet. Doch durch Full Post-Editing, das Nachbereiten maschineller Übersetzung, kann die Qualität des Machine Translation-Outputs mit dem Niveau von Humanübersetzungen mithalten. Allerdings gilt es beim Post-Editing einige textliche und kontextuelle Herausforderungen zu beachten. Die ISO Norm 18587:2017 bietet hierbei eine nützliche Richtlinie.

Natürlich hat künstliche Intelligenz auch vor der Übersetzungsbranche nicht Halt gemacht. Maschinelle Übersetzungssysteme sind inzwischen ein fester Bestandteil und die Vorteile sind eindeutig: Es kann Zeit und damit Geld gespart werden. Doch viele stehen der Machine Translation noch skeptisch gegenüber: Kann die Maschine ein ebenso gutes Ergebnis liefern wie die klassische „menschliche” Übersetzung? Jein. Der Weg zu einer optimalen maschinellen Übersetzung liegt in einem Zusammenspiel von Mensch und Maschine und wird durch Machine Translation Post-Editing erreicht.

Post-Editing dort, wo die Maschine an ihre Grenzen stößt

Obwohl maschinelle Übersetzungssysteme inzwischen gut ausgereift und in der Praxis nicht mehr wegzudenken sind, sind Maschinen natürlich nicht unfehlbar. Es gibt klassische Risiken der Machine Translation, die dazu führen können, dass sich die Qualität von einer menschlichen Übersetzung unterscheidet.

Damit das Ergebnis am Ende trotzdem stimmt, müssen die Fehlerquellen im Nachhinein händisch bereinigt werden – dieser Prozess nennt sich Post-Editing.

Zu den klassischen Fehlerquellen von maschinellen Übersetzungssystemen gehören:

  • Terminologie
    Datenbanken mit definierter Terminologie optimieren den Übersetzungsprozess, da sie für mehr Klarheit und Konsistenz sorgen. Doch maschinelle Übersetzungssysteme berücksichtigen Termdatenbanken noch nicht.
  • Kontext
    Trotz intelligenter Programmierung stößt auch die Maschine bei komplexen Zusammenhängen an ihre Grenzen. Da sie Satz für Satz übersetzt, erkennt sie, anders als menschliche Übersetzer, die Zusammenhänge zwischen den Sätzen nicht. So scheinen Sätze oft zusammenhangslos und ergeben dadurch keinen Sinn.
  • Fehlerhafte Textkomponenten
    Anführungszeichen, inkonsistente Formulierungen oder Höflichkeitsformen: Bei bestimmten sprach- und textlichen Bausteinen schleichen sich bei der maschinellen Übersetzung Fehler ein. Die Maschine fügt beispielsweise immer die gleichen Anführungszeichen ein, diese unterscheiden sich jedoch von Sprache zu Sprache. Ein weiteres Problem für die Maschine sind Aufforderungen in einer Betriebsanleitung. Während der Übersetzer darauf achtet, dass Aufforderungen im Text einheitlich formuliert sind, können die Formulierungen einer maschinellen Übersetzung variieren.

Kooperation von Mensch und Maschine

Die Maschine allein liefert also noch keine perfekte Übersetzung. Und genau hier greift das Post-Editing. Nach ISO-Definition sollte das Full Post-Editing mit folgendem Ziel  durchgeführt werden:

Das Ziel dieser Nachbearbeitungsebene ist es, eine Ausgabe zu erzeugen, die sich nicht von der menschlichen Übersetzungsausgabe unterscheidet.” ( ISO 18587:2017)

Da das Ausgangsmaterial beim Post-Editing der maschinell übersetzte Text ist, unterscheidet sich ein Teil des Prozesses von einer klassischen Übersetzung. Denn die Übersetzung wird nicht mehr von Grund auf neu verfasst, sondern die maschinell erstellte Vorübersetzung wird überarbeitet. Anfang und Ende der Arbeitsschritte bleiben für die Übersetzerin, beziehungsweise für den Post-Editoren, gleich. Der erste Schritt besteht stets darin, sich mit dem gesamten Projekt vertraut zu machen. Wenn sich der Übersetzer beziehungsweise die Post-Editorin bereits vorab ein Bild von Thematik, Struktur und Terminologie gemacht hat, ist der Grundstein für ein gutes Ergebnis gelegt.

Der letzte Schritt besteht sowohl bei Übersetzerinnen als auch bei Post-Editoren aus finalen Checks und der Qualitätssicherung. Zu diesen finalen Qualitätsprüfungen zählen beispielsweise das Korrekturlesen des eigenen Textes, QA- und Terminologie-Checks, Rechtschreibprüfung sowie das Sicherstellen, dass alle projektspezifischen Anweisungen beachtet wurden.

Full Post-Editing gemäß ISO 18587:2017

Der gesamte Prozess des Post-Editierens sollte, bezugnehmend auf die zuvor genannten Herausforderungen und Fehlerquellen des MT-Outputs, unter Berücksichtigung bestimmter Aspekte durchgeführt werden. Idealerweise richtet sich das Post-Editing nach den Richtlinien der internationalen Norm zur Nachbereitung maschineller Übersetzungsergebnisse – der ISO 18587:2017.

Dazu gehören folgende Maßnahmen:

  • Sicherstellung, dass keine Informationen hinzugefügt oder weggelassen wurden
  • Bearbeitung von unangemessenen Inhalten
  • Umstrukturierung von Sätzen, wenn diese falsch oder unklar sind
  • Erstellung grammatikalisch, syntaktisch und semantisch korrekter Zielspracheninhalte
  • Einhaltung der Client- und / oder Domain-Terminologie
  • Anwendung von Rechtschreib-, Interpunktions- und Silbentrennungsregeln
  • Sicherstellung, dass Stilrichtlinien eingehalten wurden
  • Anwendung von Formatierungsregeln

Grundsätzlich wird beim Post-Editing empfohlen, den MT-Output so oft wie möglich miteinzubeziehen. Trotzdem sollten TM-Matches, Konkordanzsuche, Terminologiedatenbanken und Referenzdateien beachtet werden.

Weitere Informationen zu Machine Translation Post-Editing auf der Tekom 2019

Das Post-Editing maschineller Übersetzungen ist ein wichtiger Schritt, um maschinell generierte Übersetzungen zu optimieren. Doch damit sind auch Herausforderungen verknüpft, denen Übersetzer teilweise noch unsicher gegenüberstehen. Um noch mehr Klarheit zum Thema und zur Relevanz von Post-Editing zu schaffen, halten Bianca Stadler und Martin Maritschnig von MEINRAD dieses Jahr auf der tekom-Jahrestagung einen interaktiven Workshop zum Thema. Besucher der größten Messe und Tagung im Bereich „Technische Kommunikation” haben hier die Möglichkeit ausführliche Informationen rund um die Gebiete Machine Translation und Post-Editing zu erhalten, Rückfragen zu stellen und mit Vorurteilen gegenüber maschinellen Übersetzungsprozessen aufzuräumen.