Yamagata Europe maakt al gebruik van machinevertaling sinds 2009. In deze post willen we je een kort overzicht geven van de meest gebruikte machinevertalingstechnologieën: Rule-Based Machine Translation (RBMT), Statistical Machine Translation (SMT) en Neural Machine Translation (NMT).

Vandaag gaat Neural Machine Translation met al de aandacht lopen. Maar is dat wel terecht?

Machinevertaling in het vertalingsproces

De traditionele vertaalflow - zonder machinevertaling - bevat meestal een menselijke vertaler die gebruik maakt van een vertaalgeheugen. Vandaag de dag wordt automatische vertaling toegevoegd als een extra stap in het vertaalproces.

Rule-based machine translation (RBMT)

RBMT genereert vertalingen op basis van morfologische, syntactische en semantische analyse van de bron- en doeltaal. Deze technologie werd voor het eerst ontwikkeld om Russisch in het Engels te vertalen tijdens de Koude Oorlog. De eerste commerciële RBMT-systemen werden al in de jaren zestig beschikbaar.

RBMT werkt in vijf stappen:

  1. Een woordenboek haalt de basisinformatie op over elk deel van de uiting (werkwoord, zelfstandig naamwoord, bijwoord, enz....).
  2. Het bronwoord wordt geanalyseerd op syntactische informatie (bv. tijd, geslacht, enkelvoud/meervoud, enz.).
  3. De bronzin wordt ontleed.
  4. De bronwoorden worden vertaald.
  5. De woordenboekitems worden gematcht met de juiste verbogen vormen.

RBMT genereert doorgaans consistente, stabiele vertalingen, zonder dat deze technologie een groot tweetalig corpus nodig heeft. Maar er zijn ook een aantal nadelen.

Laten we eens kijken naar een voorbeeld van RBMT-vertaling van het Duits naar het Engels:

Starten Sie die Wiedergabe am angeschlossenen Gerät und stellen Sie eine moderate Lautstärke ein.
Start the rendition at the attached equipment and adjust you a moderate volume.

Het probleem met deze sample is dat het zich direct openbaart als machinevertaling. De grammatica is niet correct en de zin klinkt niet vloeiend. Dat hoeft geen probleem te zijn als er geen ander vertaalsysteem beschikbaar is, maar het mechanische karakter van RBMT is wel hinderlijk.

Statistical machine translation (SMT)

In de jaren negentig namen de rekenkracht en opslagcapaciteit van computers een hoge vlucht. Dat zorgde voor de opkomst van statistische machinevertaling (SMT). Deze technologie genereert vertalingen op basis van statistische modellen afgeleid van grote tweetalige tekstcorpora, die vanaf de jaren negentig beschikbaar kwamen.

SMT kan praktisch elke taal aan en klinkt veel vloeiender in vergelijking met RBMT. Kijk even naar het onderstaande SMT-voorbeeld (Duits naar Engels):

Starten Sie die Wiedergabe am angeschlossenen Gerät und stellen Sie eine moderate Lautstärke ein.
Playback starts from the connected device and set a moderate volume.

Nog steeds geen perfecte vertaling, maar wel al veel vloeiender dan de RBMT-vertaling.

Het nadeel voor SMT is echter dat je een groot, tweetalig corpus van hoge kwaliteit nodig hebt. Die kwaliteit is van cruciaal belang. Een translation engine trainen met gegevens van lage kwaliteit kan wel eens leiden tot een grote teleurstelling.

Neural machine translation (NMT)

Artificiële Intelligentie (AI) doordringt geleidelijk aan alle aspecten van het leven en het bedrijfsleven. In de vertaalwereld is Neural Machine Translation (NMT) daar de exponent van. Neurale machinevertaling maakt gebruik van neurale netwerktechnologie, wat een vorm van kunstmatige intelligentie (AI) is, en ‘machine learning’.

Dit is een sample voortaald door NMT:

Starten Sie die Wiedergabe am angeschlossenen Gerät und stellen Sie eine moderate Lautstärke ein.
Start playback on the connected device and set a moderate volume.

Zoals je kunt zien levert NMT vertalingen op die veel vloeiender en leesbaarder zijn dan RBMT of SMT.

Welke machinevertalingstechnologie scoort het best?

Het korte antwoord op deze vraag is dat het afhankelijk is van de hoeveelheid trainingsgegevens, de hoeveelheid data die je wil vertalen en het type content dat je wil vertalen.

De meest recente technologieën (SMT, NMT) hebben enorme vooruitgang geboekt op het gebied van snelheid en nauwkeurigheid in vergelijking met RBMT. Deze vertaalkwaliteit kan echter alleen worden bereikt als er een groot aantal hoogwaardige trainingsdata beschikbaar is. SMT en NMT zijn het meest zinvol wanneer je grote volumes moet vertalen, zoals technische handleidingen.

RBMT daarentegen is prima voor de vertaling van kleine tekstvolumes en biedt consistente vertaalkwaliteit voor korte zinnen en voor een vaste dataset van terminologieën.

Vraag het ons!

Heb jij:

  • Een strakke deadline?
  • Grote vertaalvolumes?
  • De noodzaak om de langetermijnkosten onder controle te houden?

Dan is machinevertaling voor jou de juiste oplossing. Yamagata Europe heeft de technologie om dit te doen en ook de juiste mensen om in te staan voor post-editing.

Laat ons even weten wat je nodig hebt. We beloven jou een offerte binnen 24 uur.