Künstliche Intelligenz

Künstliche Intelligenz soll die Welt verändern. Aber die Revolution scheitert bislang an den entscheidenden Details. Zum Beispiel in der Übersetzungsbranche.





• Das Berliner Übersetzungsbüro Text & Form experimentiert seit 2014 mit der Maschinellen Übersetzung (MÜ). Das liegt nahe, denn es hat sich auf die Übersetzung von Gebrauchstexten spezialisiert wie etwa Montage- und Bedienungsanleitungen, Produktbroschüren und Software-Übersetzungen, und bei solchen technischen Übersetzungen ist der Einsatz elektronischer Hilfsmittel seit mehr als 30 Jahren ohnehin üblich – anders als bei der Übersetzung literarischer Werke, die bis heute von Menschen Wort für Wort in eine andere Sprache übertragen werden. Die Mitarbeiter von Text & Form sind es also gewohnt, bei ihrer täglichen Arbeit auf Programme zurückzugreifen, die die sogenannte Computer-Aided Translation möglich machen. Die Software sucht dabei in Datenbanken, in denen Sätze paarweise (Original und Übersetzung) gespeichert sind, nach Übersetzungsvorschlägen, die ihre Nutzer übernehmen oder umschreiben können – meist tun sie Letzteres. Sätze, die das System nicht kennt, lässt es aus.

Die MÜ, die auf statistischer oder neuronaler künstlicher Intelligenz (KI) basiert (siehe Interview auf Seite 52), soll Texte vollständig übersetzen, ohne dass ein Mensch daran beteiligt ist. Würde sie das eines Tages wirklich schaffen, wäre es das Ende der Branche.

Warum beteiligt sich ein Übersetzerbüro dann an solch einer Entwicklung? „Sie brauchen heute mindestens 24 Sprachen, um überhaupt wettbewerbsfähig sein zu können“, sagt Kim Harris, die Text & Form vor 21 Jahren mit drei Partnern gegründet hat. „Seither hat sich das zu übersetzende Material verhundert-, wenn nicht sogar vertausendfacht – die ständig zu aktualisierenden Websites nicht mitgerechnet. Für all das haben wir gar nicht genug Übersetzer. Es werden zum Beispiel immer mehr Software-Produkte veröffentlicht, bei denen die Nutzer einen Gewährleistungsanspruch haben, wenn keine Bedienungsanleitung in ihrer Landessprache vorliegt. Von den vielen Updates ganz zu schweigen.“

Das Unternehmen der 52-jährigen Britin ist ein solider Mittelständler, für das rund 40 Menschen arbeiten. Übersetzt wird, im Verbund mit internationalen Partnerfirmen, in 40 Sprachen. Zu den wichtigsten Kunden gehören SAP, Sennheiser und SEW- Eurodrive. Jahresumsatz: rund fünf Millionen Euro.

Der Weg in die Zukunft begann für Harris eher zufällig. Vor einigen Jahren engagierte die Berliner Zweigstelle des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI) Text & Form, um die Arbeiten eines Übersetzungssystems zu bewerten. Aus dem kleinen Auftrag erwuchs eine langfristige Zusammenarbeit: Heute testet das DFKI mit dem Büro serielle und neuronale KI, und Harris ist Gastwissenschaftlerin am Institut.

Das DFKI ist die weltweit größte Forschungseinrichtung für künstliche Intelligenz mit deutschlandweit 800 Mitarbeitern. Aljoscha Burchardt, in Berlin zuständig für Maschinelle Übersetzung, hält menschliche Intelligenz bei der Entwicklung von KI für essenziell und erklärt das am Problem der Unschärfe: „Wenn der Ausgangssatz lautet: ‚Hier kommt ein leckeres Gericht‘, und die Maschine daraus macht: ‚Hier kommt ein leckeres Essen‘, kann man nicht sagen: ,Lecker‘ ist richtig, aber ,Essen‘ ist falsch. Man muss entscheiden, wie richtig oder falsch es ist. Deshalb müssen wir auch Übersetzer in die Entwicklung einbeziehen. Wenn Menschen die Übersetzungen der Maschinen bewerten, wird deutlicher, wo die Maschinen noch Schwächen haben.“

Computer haben keinen Ermessensspielraum. Für sie ist die Welt binär: richtig – falsch. Doch die wirkliche Welt ist nicht so. Sprache auch nicht: Sie hängt unter anderem vom Kontext ab, der Kultur, in der sie benutzt wird, und den Zielen, mit denen sie verbunden ist. Kurz: Sprache ist von einer Komplexität, mit der bislang nur Menschen umgehen können.

Zudem entstehen mit dem technischen Fortschritt immer neue Probleme. „Wir haben es bei Software mit Texten zu tun, in denen sich vieles wiederholt, und so denkt man, dass sich die MÜ dafür besonders gut eignet“, sagt Jenny Fincke, die das Berliner Übersetzungsbüro von Text & Form leitet. „Aber oft sind bereits die Ausgangstexte fehlerhaft. Viele Software-Entwicklungen entstehen in Indien, wo die Leute in einem Stil schreiben, der nicht immer grammatikalisch korrekt ist. Mitunter lassen Entwickler auch Schritte aus, weil sie denken, dass die klar seien. Selbst die Nutzung bestimmter Satzzeichen wie Doppelpunkte kann in der MÜ einen Text zerreißen. Wir kommen mit all dem zurecht, aber Maschinen nicht.“

Am Anfang habe keiner daran gedacht, die Ursprungstexte auf Schlüssigkeit und Übersetzbarkeit zu überprüfen, sagt ihre Kollegin Katrin Marheinecke. „Das ändert sich jetzt langsam. Es zeigt aber auch, dass zu Anfang keiner so recht wusste, wie man am besten vorgeht.“ Inzwischen haben jedoch alle Seiten begriffen, dass sie einen langen Atem brauchen.

Einfach sei der Lernprozess nicht, sagt Kim Harris. Vor allem die Kunden müssten lernen, dass MÜ nicht automatisch weniger Arbeit und damit auch weniger Bezahlung bedeute: „Man kann die Systeme nicht einfach installieren und laufen lassen – man muss sie auf den Bereich trainieren, in dem sie arbeiten sollen. Bei Fehlermeldungen und Benutzeroberflächen von technischen Geräten zum Beispiel unterscheidet sich der Schreibstil, also müssen die Systeme erkennen lernen, womit sie es zu tun haben. Hinzu kommt, dass sich die Software rasend schnell entwickelt, sodass alte Textvorlagen teilweise nicht mehr zu gebrauchen sind. Deshalb muss man die Systeme immer wieder bereinigen, was natürlich auch Arbeit ist. Bis sich das alles rentiert, dauert es.“

Inzwischen testet das Unternehmen auch neuronale MÜ, die wiederum für ganz neue Probleme sorgt. „Bei den alten Systemen haben die Sätze geholpert, man sah sofort, was falsch war. Es waren auch häufig dieselben Fehler, oft fehlten zum Beispiel Negationen“, sagt Katrin Marheinecke. „Bei einem neuronalen System dagegen sieht auf Anhieb meist alles gut aus – aber dafür können die Sätze inhaltlich falsch sein.“ Sie hat Russistik, Amerikanistik und Germanistik studiert und kam vor zehn Jahren als Prozessmanagerin zu Text & Form. Und war von der neuronalen MÜ anfangs sehr beeindruckt. „Die bekommt den Textfluss wirklich sehr gut hin“, sagt sie. „Aber dann entdeckt man Stellen, in denen das Original und die Übersetzung kaum etwas miteinander zu tun haben. Da steht zum Beispiel:

Der Hund sitzt auf der Straße.
Und das System übersetzt:
Die Katze schläft.
So einen Text muss ein Mensch durchsehen, das geht gar nicht anders.“

Marheinecke kümmert sich inzwischen vor allem um die Überarbeitung maschinell übersetzter Texte, das sogenannte Post-Editing. Darin sieht sie auch eine Zukunft für die Branche. „Es gibt Texte, in denen es nicht auf Details ankommt und MÜ völlig in Ordnung ist“, sagt die 47-Jährige. „Aber wenn alles exakt sein soll, bei juristischen Texten zum Beispiel, wird es auch in Zukunft ohne eine Prüfung durch Menschen nicht gehen.“

Das Potenzial neuronaler Systeme ist bislang kaum absehbar. Burchardts Team hat zum Beispiel den Google-Übersetzer mit 800 Sätzen getestet und war beeindruckt. „Im alten System waren 200 Übersetzungen gut und 600 schwierig“, sagt er. „Im neuen System ist es umgekehrt. Und man muss bedenken, dass die alte Technik einen Reifeprozess von fast 20 Jahren hatte – das neue System hat das in einem Jahr geschafft.“

Die Qualität der neuronalen KI hängt von der Menge der Daten ab, mit denen sie trainiert wird – und da ist Google führend. Doch selbst, wenn der Trainingsaufwand mit der Zeit abnähme, hieße das noch lange nicht, dass neuronale Systeme die automatisierte Zukunft sind. „Die neuronalen Netze entwickeln sich ganz unterschiedlich, je nachdem, in welcher Reihenfolge wir die Daten ins System eingeben“, sagt Aljoscha Burchardt. „Und so entscheidet man aus dem Bauch heraus, wie man was macht. Das hat im Moment noch viel von Alchemie: Wenn es mehr glänzt, glaubt man, man ist näher am Gold dran.“ Noch ist nicht einmal sicher, ob sich die neuronale Übersetzung vielleicht als Plateauproblem erweist, also eines, bei dem man ständig das Gefühl hat, dem Optimum näherzukommen – ohne es jemals zu erreichen.

Für den populären Mythos, dass KI irgendwann so klug werden könnte, dass Menschen für sie wie Ameisen sind, sieht Burchardt keinen Anlass. „Maschinenfähigkeiten werden in der Öffentlichkeit massiv überschätzt“, sagt er. „Es geht zurzeit nur um die Entwicklung von Einzelfähigkeiten, die alle nur im kleinen Rahmen funktionieren. Sie können heute nicht einmal ihr Auto fragen, ob es mit ihnen eine Partie Go spielen will. Mit Intelligenz im geläufigen Sinne hat das nichts zu tun.“

Dennoch wird die MÜ den Markt verändern. Bei Text & Form geht man davon aus, dass in naher Zukunft wichtige Dokumente von Übersetzerbüros bearbeitet werden, nicht so wichtige gehen in die MÜ, so wie es bei Ebay oder in Diskussionsforen schon jetzt üblich ist.

Katrin Marheinecke findet das nicht weiter schlimm. Die Kunden müssten sich in Zukunft eben genau überlegen, was sie brauchen. Wenn es um den reinen Inhalt ohne Sprachfertigkeit gehe, reiche auch eine MÜ. Schwieriger werde es, wenn der Kunde zwar kein Meisterwerk wolle, aber mehr, als die Maschine leiste. „Übersetzer sind darauf trainiert, das Beste zu geben“, sagt Kim Harris. „Mittlere Qualität können sie nicht. Aber es wird in Zukunft auch darum gehen, schlechte Texte aus der MÜ in halbwegs gute Texte zu verwandeln.“ Und gut, ergänzt Marheinecke könne auch bedeuten „schnell oder effizient“. Der Kunde wolle nicht unbedingt eine brillant geschriebene Anleitung, sondern eine korrekte Übersetzung, die pünktlich geliefert werde und nicht zu viel koste.

Mit der Technik wird sich auch die Arbeitsweise verändern – weg vom traditionellen Einzelkämpfer, hin zum Team. Kim Harris kann sich das durchaus vorstellen: „Einer kümmert sich um die Technik, einer ums Post-Editing.“ Jenny Fincke ist nicht ganz so enthusiastisch: „Man wird mehr Disziplin brauchen, weil man viel konzentrierter arbeiten muss“, sagt sie, „und wenn man dann auch noch Lektor ist, wird man noch mehr inhaltliches Wissen benötigen. Der Beruf wird komplexer werden.“ Aber zurück? Will sie auch nicht. „Ich merke jetzt schon, dass die MÜ mir fehlt, wenn sie mal nicht funktioniert. Sie macht einige Dinge eben doch einfacher. Man gewöhnt sich schnell daran. Und der Mensch ist nun mal ein Gewohnheitstier.“ ---