Machine Translation

DeepL und Google Translate: Maschinelle Übersetzung ist nicht gleich maschinelle Übersetzung

Google vs DeeplOb im Berufs­alltag, auf Reisen oder im Bereich des profes­sionellen Über­setzens: Wohl jeder hat schon einmal Machine Trans­lation ver­wendet. Die Frage ist nur, welche Engine wird genutzt. Vor allem in Sachen Qualität und Datenschutz gibt es wesentliche Unterschiede zwischen den ver­schiedenen An­bietern. Welche das sind, wird bei der Be­trachtung der beiden Systeme Google Translate und DeepL besonders gut deutlich.

Übersetzen so schnell und einfach wie nie zuvor

Wir wissen, Sie tun es auch! Wohl jeder hat schon einmal einen Text kopiert, bei Google Translate in die Eingabemaske eingefügt und ihn auf einer anderen Sprache bequem wieder ausspucken lassen. Das Ganze kostet keinen Cent und dauert nur wenige Sekunden – klingt super, oder? 

Während maschinelle Übersetzungstools wie Google Translate aufgrund ihrer anfänglichen Fehleranfälligkeit von vielen zunächst belächelt wurden, können die Ergebnisse der maschinellen Übersetzung inzwischen durchaus überzeugen. Mehr zu dieser Entwicklung können Sie hier nachlesen. 

Damit machen es Übersetzungstools wie Google Translate uns so schnell und einfach wie nie, global zu arbeiten und zu kommunizieren. Kein Wunder also, dass es inzwischen zahlreiche erfolgreiche Anbieter auf dem Markt gibt. Doch worin bestehen die größten Unterschiede, beispielsweise in Aspekten wie der Qualität der Übersetzung und der Datensicherheit? Wir nehmen zwei der bekanntesten Übersetzungstools unter die Lupe.

Google Translate

Vielleicht erinnern Sie sich noch an Ihre ersten Versuche mit Google Translate, das könnte 2006 gewesen sein, denn seitdem existiert das System. Wahrscheinlich haben Sie damals das ein oder andere abenteuerliche Ergebnis erhalten. Aus dem Wort „Kernseife” machte das Übersetzungstool beispielsweise früher die atomverseuchte „nuclear soap”. 

Übersetzungsfehler wie diese sind damit zu begründen, dass die Technik des Google Übersetzers zunächst auf der statistischen Übersetzungsmethode basierte. Problematisch an dieser Methode ist, dass die Übersetzung Wort für Wort auf Basis von sprachlichen Regeln erfolgt. Zusammenhänge wurden daher nicht erkannt. Durch den fehlenden Kontext werden Übersetzungen fehlerhaft oder ergeben keinen Sinn. Solche Übersetzungs-Fails passieren dem Google Übersetzer, der inzwischen 103 verschiedene Sprachen übersetzt, mittlerweile kaum mehr. Google hat das Verfahren angepasst und greift für einige Sprachen auf neuronale Netze zurück – eine Form der künstlichen Intelligenz, die als eine Nachbildung des Nervensystems unseres Gehirns verstanden werden kann. Dabei liegt eine große Menge an bestehenden Daten dem Internet zugrunde, mit denen ein neuronales Netzwerk angelernt wird, das eine Vielzahl an kontextbezogenen und linguistischen Informationen abspeichert. Das macht die neuronale Technologie nicht nur besser lernfähig als das statistische System, sondern auch flexibler im Übersetzungsprozess und liefert so bei bestimmten Sprachkombinationen erstaunlich gute Ergebnisse. 

Bei kleineren Textabschnitten funktioniert dies weitgehend gut, doch fehlerfrei ist der Google Übersetzer noch lange nicht. Die größten Bedenken wirft allerdings die Frage nach der Datensicherheit auf. Denn wer einen Blick in die Nutzungsbedingungen von Google wirft, liest folgendes:

„Wenn Sie Inhalte in oder über unsere Dienste hochladen oder einstellen oder in unseren Diensten oder über unsere Dienste speichern, senden oder empfangen, räumen Sie Google (und denen, mit denen wir zusammenarbeiten) das Recht ein, diese Inhalte weltweit zu verwenden, zu hosten, zu speichern, zu vervielfältigen, zu verändern, abgeleitete Werke daraus zu erstellen (einschließlich solcher, die aus Übersetzungen, Anpassungen oder anderen Änderungen resultieren, die wir vornehmen, damit Ihre Inhalte besser in unseren Diensten funktionieren), zu kommunizieren, zu veröffentlichen, öffentlich aufzuführen, öffentlich anzuzeigen und zu verteilen.“

Zusammengefasst heißt das: Die Sicherheit der Daten ist nicht gewährleistet. Klar, dass das besonders bei sensiblen geschäftlichen Inhalten unbedingt vermieden werden sollte.  

DeepL

Das Übersetzungstool DeepL sorgt seit einiger Zeit für Aufsehen. Das Start-up aus Köln ging 2017 online und behauptet, die großen Player Google, Bing und Co. mit seinem Übersetzungstool zu überbieten. Und tatsächlich: In zahlreichen Tests hat das Übersetzungsprogramm DeepL besser abgeschnitten als Google Translate. 

Doch was macht das Übersetzungstool so besonders? 

Grundsätzlich gibt es zwei Versionen des Übersetzungssystems: Die kostenlose Variante ist auf 5.000 Zeichen begrenzt. Wer mehr Zeichen zur Verfügung haben möchte, muss ein kostenpflichtiges Abo abschließen. Für monatlich 20 Euro übersetzt das Tool bis zu eine Million Zeichen in die Sprachen Deutsch, Englisch, Französisch, Spanisch, Portugiesisch, Italienisch, Niederländisch, Polnisch und Russisch. Vor allem für Übersetzungsbüros interessant ist außerdem, dass die Pro-Version Programmierschnittstellen und ein Software-Plugin für CAT-Tools beinhaltet. 

In der Benutzung unterscheiden sich die beiden Anbieter auf den ersten Blick kaum. Ähnlich wie beim Google Übersetzer besteht die DeepL-Website aus zwei Eingabefeldern: Der zu übersetzende Text wird in das eine Feld kopiert oder getippt, die Übersetzung erscheint in dem Feld daneben. Im Gegensatz zu Google Translate, das über 100 Sprachen übersetzt, bietet DeepL derzeit jedoch nur neun Sprachen an. Darüber hinaus können einzelne Wörter markiert werden, um eine alternative Übersetzung angezeigt zu bekommen. 

Der wahre Unterschied zwischen den beiden Anbietern liegt in der Technologie. Beide Tools setzen auf neuronale Netze. Bisher verwenden die meisten maschinellen Übersetzungssysteme im Bereich der neuronalen Netze, so auch Google Translate, sogenannte rekurrente Netze. Für lange, zusammenhängende Wortfolgen eignen sich jedoch Convolutional Neural Networks (CNN) grundsätzlich besser. Durch dieses System können Texte stärker parallel verarbeitet werden. CNN wurden jedoch aufgrund ihrer Schwächen bislang nicht von Anbietern maschineller Übersetzungstools genutzt. 

DeepL setzt genau auf diese Convolutional Neural Networks, die mit der Datenbank des hauseigenen Wörterbuchs Linguee trainiert wurde. Linguee durchsucht das Netz nach Übersetzungen und nimmt diese in seinen Wortschatz auf. Mittels Algorithmen und Userfeedback werden diese außerdem bewertet. Die Schwächen des CNN werden bei DeepL mit nur teilweise öffentlich bekannten Maßnahmen aufgefangen.

Unterschiede in der Datensicherheit

Bei Google Translate ist die Unsicherheit der Daten bereits in deren Nutzungsbedingungen ersichtlich. Doch wie sieht es bei DeepL aus? Hier gilt: Für den Privatgebrauch ist die kostenlose Version des Tools durchaus zu verwenden. Ähnlich wie bei Google Translate empfiehlt sich das kostenlose Tool für die geschäftliche Nutzung jedoch nicht. Zwar erfüllt auch die kostenlose Version die EU-Datenschutzbestimmungen, da DeepL seinen Sitz in Deutschland hat. Anspruch auf verschlüsselte Datenübermittlung sowie das direkte Löschen der Ausgangstexte nach der Übersetzung haben jedoch nur Abonnenten der zahlungspflichtigen Pro-Version. 

Wenn's drauf ankommt zum Experten

Grundsätzlich eignet sich die Pro-Version von DeepL damit folglich auch für Texte im geschäftlichen Kontext. Jedoch kann der Output der  Maschinen noch nicht als qualitativ gleichwertig im Vergleich zu Humanübersetzungen bezeichnet werden. Dies begründet sich beispielsweise mit dem Stil des Textes. Kreative Marketing-Texte kann die Maschine beispielsweise nicht 1:1 übertragen. Auch sicherheitsrelevante oder rechtlich bindende Inhalte wie technische Dokumentationen, Gefahrenhinweise etc. sollten den Experten überlassen werden. Denn wenn es um die Sicherheit von Menschen bei der Bedienung von Maschinen geht, sollten Fehler in der Übersetzung unbedingt vermieden werden, um Personenschaden und Schadensersatzklagen zu vermeiden. Als Ergänzung zur Verwendung von Machine Translation sollte also immer  Post-Editing, also das händische Korrigieren der maschinell übersetzten Texte, in Betracht gezogen werden. 

Moderne Übersetzungspartner kennen die Vor- und Nachteile der maschinellen Übersetzung und sollten diese zu Ihrem Vorteil nutzen. Wenn es darauf ankommt: Holen Sie sich professionelle Beratung durch Ihren Übersetzungspartner!

Tele-Coaching MEINRAD

Die im Text gewählten personenbezogenen Bezeichnungen sollen sich ausdrücklich auf alle Geschlechter in gleicher Weise beziehen. Soweit im Text die männliche Form gewählt wurde, geschah dies aufgrund der besseren Lesbarkeit. Hintergründe zu unserer Entscheidung finden Sie in unserem Artikel So lebt MEINRAD das Thema Gleichberechtigung und gendergerechte Sprache.