Mein neuronales Maschinenübersetzungs-Projekt – Vorwort

Mein neuronales Maschinenübersetzungs-Projekt – Vorwort

In letzter Zeit, wenn ich mich als Übersetzerin, genauer Patentübersetzerin vorstelle, werde ich immer häufiger gefragt, ob ich aufgrund der neuronalen Maschinenübersetzung (MÜ) nicht unter Existenzängsten leide. Normalerweise würde ich einfach auf den neuesten MÜ-Witz verweisen, der in sozialen Netzwerken die Runde macht, und die Sache wäre gegessen. Hier im Silicon Valley, wo selbstfahrende Autos, Drohnen und Roboter-Wachmänner zum Alltag gehören, ist das jedoch nicht ganz so einfach. Darüber hinaus hat das Europäische Patentamt das neue EU-Patent bekannt gegeben, dessen Einführung für Anfang 2018 geplant ist und Übersetzungskosten mithilfe von MÜ sparen soll. Derzeit sieht es jedoch so aus, als ob sich die Einführung verzögern wird.

Nichtsdestotrotz füllt sich auch mein Posteingang immer mehr mit Anfragen zur Nachbearbeitung von maschinell übersetzten Texten. Da ich auch beim Redigieren von von Menschen übersetzten Texten nicht besonders effizient bin, auch wenn die Übersetzung ausgezeichnet ist, bin ich wohl für die Nachbearbeitung von maschinell übersetzten Texten ungeeignet. Da habe ich einfach nicht den Nerv dafür. Deswegen hat sich vor einiger Zeit die folgende Idee in meinem Kopf festgesetzt: Ich will meine eigene neuronale Maschinenübersetzungs-Engine einrichten.

Das hört sich äußerst ambitioniert an, ist jedoch nicht unmöglich. Ich verfüge über jahrelange/jahrzehntelange Erfahrung mit höherer Mathematik (theoretischer Physik) und Computerprogrammierung. Außerdem gibt es mittlerweile mehrere Open-Source-Toolkits für neuronale MÜ, die man zusammen mit verschiedenen Libraries herunterladen kann, unterstützt von Diskussionsforen. Ich könnte also einfach eines dieser Toolkits herunterladen, das neuronale Netz mithilfe verschiedener Open-Source-Korpora trainieren und voila. Aber das wäre viel zu einfach! Und nicht sehr produktiv. Ich will das Netz an einen Punkt bringen, an dem ich es bei der täglichen Arbeit einsetzen kann. Außerdem will ich verstehen, wie die neuronale MÜ wirklich funktioniert, um vielleicht später, nach der maschinellen Apokalypse (die sicher noch weiter entfernt ist, als manche das behaupten) als Beraterin für neuronale MÜ anstatt als MÜ-nachbearbeitende Sklavin zu fungieren. Hierzu werde ich meine Erfahrungen auf diesem Blog dokumentieren. Da ich dieses ambitionierte Projekt nur neben der täglichen Arbeit mache, kann ich jedoch keine allzu regelmäßigen Beiträge versprechen, da der Fortschritt eben von der täglichen Arbeitslast abhängt. Auf keinen Fall wird es ein ‚Live-Blog‘, da ich den Leserinnen und Lesern beim Programmieren unerlässlichen österreichischen Kraftausdrücke ersparen will …

Ich begann mit diesem Projekt vor mehr als einem Jahr mit einem einführenden Kurs von Andrew Ng über maschinelles Lernen auf Coursera. Andrew Ng ist nicht nur einer der Mitbegründer von Coursera und Professor an der Stanford-Universität, er ist außerdem ein ausgezeichneter Vortragender. Er führte alle notwendigen Konzepte im Kurs ein, auf dem (für mich als Physikerin) gerade richtigen mathematischen Niveau mit nicht allzu viel Programmierarbeit (in der symbolischen Sprache MATLAB). Ich kann diesen Kurs als Einführung in das Thema ‚Künstliche Intelligenz‘ nur empfehlen. Allerdings behandelt Andrew Ng in seinem ausgezeichneten Kurs die maschinelle Übersetzung nicht. Nach diesem Kurs belegte ich mehrere Kurse über Robotik (auf Coursera) und künstliche Intelligenz (auf EdX) auf beginnendem Master-Niveau. Ich habe sogar einen autonom navigierenden Rover namens Boticelli konstruiert. Natürlich bin ich noch keine Expertin, aber ich weiß jetzt viel mehr über neuronale Netze und künstliche Intelligenz als der durchschnittliche Amateur. Im Herbst werde ich meine Erkenntnisse in einem Vortrag auf der 58. Jahreskonferenz der American Translators Association zusammenfassen.

Als Nächstes werde ich die notwendige Computer-Hardware kaufen und eines der Open-Source-Toolkits für neuronale MÜ auswählen. Für neuronale Netze braucht man dedizierte Hardware, genauer, hochwertige Grafikprozessoren (GPUs), da die Trainingsphase eines neuronalen Netzwerks praktisch aus sehr vielen Matrixmultiplikationen besteht. Dedizierte GPUs können eine große Anzahl an parallelen Rechenvorgängen ausführen, im Gegensatz zu CPUs, die für serielle Berechnungen am besten geeignet sind. Deshalb wird für eine NMÜ-Engine ein „Gaming-PC“ mit einer VR-fähigen Highend-Grafikkarte benötigt, da ironischerweise die Berechnungen für Computerspiele mit virtueller Realität und die für neuronale Netze für „seriöse“ Anwendungen wie maschinelle Übersetzung ziemlich ähnlich sind.

Mehr zu diesen nächsten Schritten im nächsten Beitrag. Bis zum nächsten Mal!

Carola F Berger

Website: https://www.cfbtranslations.com

Carola F. Berger ist eine Patentübersetzerin für die Sprachen Englisch und Deutsch mit einem Doktorat in Physik und einem Abschluss als Diplom-Ingenieurin der Technischen Physik. Sie ist von der American Translators Association für Übersetzungen vom Deutschen ins Englische und vom Englischen ins Deutsche zertifiziert. Carola ist derzeit als Webmaster im Vorstand der Northern California Translators Association und Administratorin von ATAs Science and Technology Division.

Kommentar abgeben

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.