Übersetzungseinkauf

Glossarfunktion bei DeepL: Individualisierung des MT-Outputs endlich möglich

Lupe zeigt DeepL Logo

Bereits seit längerem bietet das Machine-Translation-Tool DeepL online die Möglichkeit, ein Glossar zu erstellen und zu nutzen. Dieses war für den Einsatz im Übersetzungsbüro aber wenig praxistauglich. Seit kurzem gibt es diese Funktion auch für die Nutzung mit dem DeepL Pro-Plugin in memoQ. Terminologiemanagerin und MT-Beauftragte Bianca Stadler schildert im Interview ihre Eindrücke nach den Tests bei MEINRAD.

Was war bisher der Nachteil bei maschinellen Übersetzungen von DeepL?

DeepL Pro liefert aus MEINRADs Sicht in Sachen Stil und Formulierung beim Machine-Translation-Output sehr gute Ergebnisse. Größtes Manko bisher: Begriffe wurden – auch innerhalb eines Textes – unterschiedlich übersetzt. Dass es für Fach- und Schlüsselbegriffe zwei, drei, vier oder gar noch mehr Formulierungen gibt, ist keine Seltenheit. Für den Post-Editor ist das natürlich eine mühsame Angelegenheit. Hier schafft die DeepL-Glossarfunktion für die DeepL-Anbindung Abhilfe. Prinzipiell gibt es in der Webversion von DeepL bei gewissen Sprachen schon seit rund zwei Jahren die Möglichkeit, eigene Begriffe einzutragen und diese für die Übersetzungen zu nutzen. Dies konnte aber nur online gemacht werden und war somit für uns als Übersetzungsbüro nicht wirklich brauchbar. Nun ist es aber möglich, die Glossarfunktion via Plugin im CAT-Tool zu nutzen.

Was ist die Glossarfunktion von DeepL und was kann sie?

Die Glossarfunktion ermöglicht es, DeepL zu „sagen“, wie man bestimmte Begriffe übersetzt haben möchte. Die Funktion bedeutet hier also gewissermaßen das Ende inkonsistenter Übersetzungen, da man die Übersetzung für bestimmte Begriffe vorgeben kann. Das führt dazu, dass die maschinell übersetzten Texte konsistenter werden. Für mich ist das eine großartige Weiterentwicklung.

 

Beispiel 1: DeepL ohne Glossarfunktion – Ausgangstext (links), Zieltext (rechts):

DeepL Oberfläche. Wort „imager“ wird als „Imager“ ins Deutsche übersetzt.

Beispiel 2: DeepL mit Glossarfunktion:

DeepL Oberfläche. Wort „imager“ wird als „Bildgenerator“ ins Deutsche übersetzt.

In Beispiel 1 wurde DeepL ohne Glossarfunktion verwendet. Hier hat DeepL „Imager“ im Deutschen so übernommen. In Beispiel 2 wurde DeepL mit Glossarfunktion verwendet und DeepL übersetzt das Wort genau so, wie es im kundenspezifischen Glossar steht, nämlich als „Bildgenerator“. Hervorzuheben ist, dass DeepL das Wort auch bei zusammengesetzten Begriffen wie Bildgeneratormodul korrekt verwendet.

Du und dein Kollege Martin Maritschnig habt die Glossarfunktion bereits ausgiebig getestet – wie seid ihr vorgegangen?

Ja, Martin und ich haben bereits einige Tests durchgeführt. Zunächst muss die Terminologie entsprechend aufbereitet werden. Das ist derzeit noch etwas aufwendig. Im Moment kann man nur txt- und tsv-Dateien verwenden. Außerdem muss die Terminologie vorher bereinigt werden. Falls Sonderzeichen wie Sternchen oder Trennstriche zum Markieren der Wortstämme in einer Termdatenbank/Terminologieliste vorkommen, müssen diese vor der Verwendung mit DeepL manuell bereinigt werden. Sehr empfindlich ist die Glossarfunktion auch bei Synonymen. Jeder eingetragene Begriff darf wirklich nur ein einziges Mal vorkommen. Das ist aber auch richtig und gut so, bedeutet in der Praxis aber meist viel Arbeit, da doppelte Einträge weit verbreitet sind. Wenn die Datei dann einmal bereinigt ist, muss sie nur noch hinzugefügt werden und kann dann bei der nächsten maschinellen Vorübersetzung für diesen Kunden schon verwendet werden.

Was sind deine Eindrücke – wie funktioniert die Glossarfunktion?

Ich bin wirklich begeistert. DeepL verwendet die eingetragenen Terme absolut zuverlässig und meistert auch die meisten Beugungen und Pluralformen gut. Die Übersetzungen lesen sich gleich viel flüssiger und sind konsistenter – noch bevor der Post-Editor ans Werk geht.

Abgesehen von der Konsistenzsteigerung, welche Vorteile siehst du persönlich noch?

Für mich bietet die Glossarfunktion auch ganz klar eine Individualisierung des Machine Translation Outputs. Der war ja mit DeepL bisher für jeden Kunden gleich. Nun kann man die maschinelle Übersetzung auf den Kunden abstimmen, indem seine Terminologie berücksichtigt wird. Der Vorteil zeigt sich ganz besonders auch für jene, die unser Machine Translation Self-Service Portal nutzen. Da ist es ja möglich, Texte maschinell übersetzen zu lassen und ohne Prüfung durch einen unserer Post-Editoren sofort retour zu erhalten, was für interne Zwecke oft ja völlig ausreichend ist.

Ist die Glossarfunktion schon für die Kunden von MEINRAD einsatzbereit und wenn ja, was muss ein Kunde tun, damit die Funktion bei seinen Übersetzungen genutzt werden kann?

Ja, die Funktion steht schon zur Verfügung, allerdings derzeit nur für eine eingeschränkte Auswahl an Sprachkombinationen. Wenn ein Kunde Interesse hat, kann er uns das ganz einfach mitteilen. Dann müsste geklärt werden, ob er uns die Terminologie zur Verfügung stellt oder wir bereits bestehende Termdatenbanken aufbereiten sollen. Das ist, wie bereits erwähnt, je nach Größe und Zustand der Termdatenbank mit einem gewissen einmaligen Aufwand verbunden. Wenn wir noch keine Termdatenbank haben, ist es am leichtesten, wenn wir zweispaltige Excel-Tabellen mit spezifischen Begriffen bekommen. Hier sollten in Spalte A die Begriffe in der Ausgangssprache und in Spalte B die gewünschte Übersetzung stehen. Je weniger doppelte Einträge vorkommen, desto besser, da dann weniger Rückfragen und Bereinigungen notwendig sind. Es empfiehlt sich auch, die Liste vorher noch dahingehend zu überprüfen, ob tatsächlich nur Fachwörter enthalten sind. In einem Glossar sollten nämlich keine „Alltagswörter“ vorkommen. Zu beachten ist auch, dass die final aufbereitete Datei nur eine maximale Größe von 10 MB haben darf.

 

Grafische Darstellung der Glossarfunktion

Für welche Sprachen bietet DeepL die Glossarfunktion an?

Derzeit gibt es die Glossarfunktion für mehrere Sprachkombinationen, nämlich Englisch nach Deutsch (EN -> DE), Deutsch nach Englisch (DE -> EN), Englisch nach Französisch (EN -> FR), Französisch nach Englisch (FR -> EN), Englisch nach Spanisch (EN -> ES), Spanisch nach Englisch (ES -> EN), Englisch nach Japanisch (EN -> JA), Japanisch nach Englisch (JA -> EN), Englisch nach Italienisch (EN -> IT), Italienisch nach Englisch (IT -> EN), Englisch nach Polnisch (EN -> PL), Polnisch nach Englisch (PL -> EN), Deutsch nach Französisch (DE -> FR), Französisch nach Deutsch (FR -> DE), Englisch nach Niederländisch (EN -> NL) und Niederländisch nach Englisch (NL -> EN). Ich denke aber, dass das bald erweitert wird.

Was kann die Glossarfunktion derzeit noch nicht so gut und welche Wünsche hast du persönlich an DeepL?

Die Formate sind derzeit wie bereits erwähnt auf .txt und .tsv beschränkt, was die Aufbereitung auf unserer Seite etwas mühsam macht. Hier wünsche ich mir, dass man in Zukunft auch andere Formate wie .csv nutzen wird können. Derzeit kann man auch nur ein Glossar pro Kunde und Sprachkombination verwenden. Mit verbotenen Begriffen kann das Glossar im Moment auch noch nichts anfangen. Wenn verbotene Wörter berücksichtigt werden könnten, wäre das auf alle Fälle toll. Aus Sicht eines Übersetzungsbüros wäre es natürlich am allerbesten, wenn man einfach die im CAT-Tool vorhandenen Termdatenbanken zusammen mit dem DeepL-Plugin verwenden könnte. Aber hier bin ich schon im absoluten Traumraum. Ich bin aber zuversichtlich, dass DeepL die Glossarfunktion weiter verbessert, sie ist nämlich wirklich vielversprechend.

 

 

E-Book Machine Translation und Datensicherheit MEINRAD

 

Titelbild: © Shutterstock

Newsletter

Gut informiert & ehrlich beraten

Wir teilen gerne – unser Wissen nämlich. Deshalb liefert unser Newsletter alle zwei Monate wertvolle Informationen aus der Welt der Übersetzungen:

  • Best Practices im Einkauf von Übersetzungsdienstleistungen
  • Tipps & Tricks für optimierte Übersetzungsprozesse
  • Alles rund um Machine Translation

Guter Rat ist nicht teuer!