Es gibt auf dem Markt bereits zahlreiche Lösungen im Bereich der Statistischen Maschinellen Übersetzung (SMÜ), die auf Moses basieren. Warum sollte sich ein Sprachdienstleister also überhaupt mit der Entwicklung einer eigenen Lösung beschäftigen? 

Die Berechnung der Rentabilität ist bei der Verwendung von SMÜ schon schwierig genug, ganz zu schweigen von der Rentabilität, wenn ein eigenes System aufgebaut wird. Insbesondere bei kleinen Dienstleistern kann diese Investition als zu groß angesehen werden, um sie überhaupt in Erwägung zu ziehen. Warum denken wir also trotzdem darüber nach?

Weil ein eigenes System Flexibilität, Genauigkeit, nahtlosere Integration und größere Kontrolle über die Qualität der Ausgabe bietet.

Flexibilität

Es gibt viele SMÜ-Lösungen, die auf Moses basieren, und alle bieten einen gewissen Grad der Flexibilität. Einige erlauben es, eine ganze Liste von Parametern zu ändern, während andere nur ein Texteingabefeld für den Namen der Übersetzungs-Engine bieten. Im Allgemeinen ist ein System mit steigender Flexibilität auch weniger benutzerfreundlich, komplizierter und fehleranfälliger. Die komplexeren Systeme können zu so viel Verwirrung oder Frustration führen, dass der erwünschte Produktivitätsgewinn durch die Verwendung der MÜ vollständig verloren geht. Auf der anderen Seite stehen die stark generischen Systeme, bei denen es keine wirkliche Möglichkeit zur Verbesserung der Qualität gibt, was zu Frustrationen seitens der Nachbearbeiter führt, was dann wiederum abträglich für die Produktivitätssteigerung ist, die erzielt werden soll.

Wenn man ein eigenes System aufbaut, kann man selbst über die Komplexität entscheiden und sie an die eigenen Anforderungen anpassen, sowie an diejenigen der Dienstleister und Kunden, mit denen man zusammenarbeitet. Man kann die benötigten Funktionen implementieren und den Rest einfach weglassen.

Flexibilität

Speziell für die Kunden

Da man ein System aufbaut, das nur solche Daten verarbeiten muss, mit denen man vertraut ist, kann man es den eigenen Daten entsprechend zuschneiden. Statt allgemeine Regeln zu integrieren, um so viele Daten wie möglich auf die gleiche Art zu verarbeiten, kann man spezielle Regelsätze für spezielle Kunden und/oder Sprachenkombinationen implementieren. Das ist bei einer vorgefertigten Lösung deutlich schwieriger. Das bedeutet allerdings auch, dass man diese Regelsätze fortlaufend anpassen muss, um Änderungen an den zu übersetzenden Daten zu bewältigen.

Man muss ein Gleichgewicht zwischen dem perfekten Regelsatz, der fortlaufende Aktualisierungen erforderlich macht, und einem allgemeineren - dafür aber zukunftssicheren - Regelsatz erzielen.

Speziell für die Kunden

Einfache Integration

Jeder Sprachdienstleister hat seine eigenen Arbeitsabläufe und daher werden einige der vorhandenen SMÜ-Lösungen von vornherein nicht in Erwägung gezogen. Bei einigen Lösungen wäre die Integration einfach zu schwierig, wenn bereits ein bestimmter Arbeitsablauf etabliert wurde. Dies ist ein weiteres Problem, das vermieden wird, wenn man seine eigene Lösung speziell für die eigenen Arbeitsabläufe entwickelt.

Kontrolle über die Qualität des Outputs

Jede SMÜ-Lösung, die ich jemals getestet habe, basiert auf die ein oder andere Art auf Moses. Einige davon verwenden eigene Algorithmen zur Bereinigung der Daten, eigene Tokenizer, XML-Markup-Handler... Und wenn sich die Softwareentwickler dazu entscheiden, diese zu übernehmen, hat man als Benutzer wenig oder gar keine Kontrolle darüber. Die Ergebnisse können sich dadurch ohne eigenen Beitrag verbessern, aber es kann auch bedeuten, dass man sich plötzlich gezwungen sieht, Änderungen an Pre- oder Post-Editing-Arbeitsabläufen vorzunehmen. Das ist sogar noch gefährlicher, wenn man die MÜ für Projekte einsetzt, wo keine abschließende Korrektur durch einen Menschen vorgesehen ist.

Auch wenn es ressourcenintensiv ist, den Moses-Decoder im eigenen System zu verpacken, kann der Gewinn an Kontrolle, der daraus resultiert, die Arbeit durchaus wert sein.

Kontrolle über die Qualität des Outputs

Schlussfolgerung

Als Sprachdienstleister steht man vor der Frage, ob man das beste Modell unter den vielen bestehenden SMÜ-Lösungen suchen möchte, oder aber versuchen möchte, eine eigene Lösung zu entwickeln. Da sich die Rentabilitätsberechnung in beiden Fällen als sehr schwierig darstellt, ist das keine einfache Entscheidung. Trotzdem ist es - abhängig von den Ressourcen und dem MÜ-Bedarf - eine Frage, die es sich jedenfalls zu stellen lohnt.