In de geglobaliseerde economie van vandaag slaan meer en meer Aziatische bedrijven hun vleugels uit naar de rest van wereld. In een snel tempo verhuizen deze bedrijven weg van gecentraliseerde engineering sites in Azië naar een gedistribueerd model met regionale vestigingen. En hoewel geografische grenzen lijken te vervagen, is er nog één belangrijke barrière die moet worden overwonnen: taal. Om de bedrijfscommunicatie tussen verschillende geografische business units te verbeteren, kiezen veel klanten van Yamagata nu voor machinevertaling.

Neem nu dit voorbeeld van een Yamagata-klant in de automobielsector. Het productverbeteringscentrum van dat bedrijf in Japan was belast met het verwerken van rapporten over technische problemen van lokale dealers. Die rapporten waren in het Engels geschreven. Het Japanse team moest vertrouwen op handmatige vertalingen van deze rapporten, uitgevoerd door een interne werknemer gedurende een halve dag in de week. Deze werkwijze leidde niet alleen tot vertraagde vertalingen, maar ook tot vertraagde registraties van technische claims en veel gefrustreerde lokale dealers.

Wellicht is dit een situatie waar veel wereldwijde bedrijven zich in kunnen herkennen: grote hoeveelheden content, vaak user-generated content, gecreëerd vanuit verschillende geografische locaties, die zo snel en zo kosteneffectief mogelijk moeten worden vertaald, zodanig dat het bedrijf daar zo weinig mogelijk negatieve impact van ondervindt.

Recentelijk is machinevertaling een steeds belangrijker rol gaan spelen in het beheren van de wereldwijde toevoer aan content en bij het helpen van corporate communication teams om hun wereldwijde communicatiebehoeften aan te pakken.

Wat is machinevertaling?

Machinevertaling is automatische vertaling door middel van slimme software. De techniek kan ofwel geïntegreerd worden in een semi-geautomatiseerd vertaalproces, waarbij voorvertaalde tekst vervolgens wordt voorgelegd aan een menselijke vertaler, of het kan worden toegepast als een volledig geautomatiseerde techniek waarbij elke interventie van een menselijke vertaler in het proces wordt weggelaten.

In het laatstgenoemde geval wordt de ruwe output van de machinevertaling gebruikt als een vertaald document. Hier is machinevertaling bijzonder nuttig om toegang te krijgen tot informatie die niet eerder werd vertaald, bijvoorbeeld database content, chats of e-mails tussen medewerkers. Uiteraard is de vertaalkwaliteit hier niet perfect, maar machinevertaling biedt wel een manier om enorme hoeveelheden te vertalen content op een economische manier op te vangen.

Machinevertaling

Machinevertaling voor Aziatische talen: de uitdagingen

Kan machinevertaling de bedrijfscommunicatie in Aziatische talen stroomlijnen? Wij denken zeker van wel. Toch hebben Aziatische talen een aantal kenmerken die een bijkomende uitdaging vormen voor machinevertaling:

  • Geen woordgrenzen: Statistische machinevertaling werkt aan de hand van phrase tables - bron/doel-taalparen van woorden of zinnen die gelinkt worden met hun vertaalmogelijkheden. In het Chinees of het Japans bijvoorbeeld zijn woordgrenzen echter niet altijd duidelijk. Dat maakt het soms moeilijk om de correcte phrase tables te bepalen. Een mogelijke oplossing hiervoor is het voorbereiden van taaldata, bijvoorbeeld door middel van woordparsers die kunstmatige woordgrenzen kunnen creëren.
  • Elliptische taal: In de Japanse omgangstaal kunnen veel woorden weggelaten worden (Dat noemen we een ‘ellips’). Voornaamwoorden en onderwerpen worden vaak weggelaten, waardoor de werkelijke betekenis van de zin duidelijk moet worden uit de context. Dat zorgt voor een zekere mate van ambiguïteit, wat de prestaties van de machinevertaling kan beïnvloeden en kan leiden tot vertalingen die niet juist zijn in hun context. Een groot en specifiek vertaalcorpus, alleen met relevante gegevens, kan dit probleem tot op zekere hoogte oplossen.
  • Verschillende woordvolgorde: Aziatische en Europese talen hebben meestal een andere woordvolgorde. Dat maakt het moeilijk om de juiste phrase tables te bepalen tijdens de engine training van de machinevertaling. In dit geval is “hoe meer, hoe beter” het devies. Door het corpus te optimaliseren en door meerdere zinnen toe te voegen, kan je de kans vergroten dat zinnen correct zijn gelinkt. Ideaal gezien zou een corpus meer dan 400.000 segmenten moeten bevatten bij machinevertaling tussen Europese en Aziatische talen.

Yamagata Machine Translation System (YMTS)

Machinevertaling is een blijver. Online content bloeit wereldwijd als nooit tevoren. In het bijzonder user-generated content en sociale media nemen een steeds groter stuk van de content-taart. Menselijke vertalers zullen deze groeiende vraag niet meer alleen aankunnen. En hoewel Aziatische talen vaak nog een uitdaging zijn voor machinevertaling, blijft deze technologie een perfect alternatief voor wereldwijde bedrijven om snelle, consistente en kosteneffectieve vertalingen te leveren voor grote hoeveelheden data.

Om enkele van de specifieke uitdagingen van de Aziatische talen aan te pakken, is het van cruciaal belang om op maat gemaakte machinevertaling-engines te bouwen die betrekking hebben op een specifiek domein. Bij Yamagata bieden wij machinevertaling aan voor Aziatische en andere talen via onze online portal, die we het Yamagata Machine Translation System (YMTS) noemen.

Als jij wil weten hoe machinevertaling voor jouw bedrijf kan werken, laat het ons dan weten. Onze specialisten op het gebied van machinevertaling kunnen je helpen bij het opzetten van jouw eigen machinevertaalsysteem.