Bron: nieuwsbrief Volkskrant 29.8.2017
Nee, de perfecte vertaling geeft DeepL nog niet, maar de automatische vertalingen van deze nieuwe dienst zijn opvallend goed in vergelijking met de bestaande concurrentie.’Een enorme en woedende reddingsoperatie‘.
Wie Google Translate aan het werk zet om de woorden ‘an enormous and frantic rescue operation’ uit een recent artikel van The New York Times in het Nederlands vertalen, krijgt dit als antwoord. Het voorbeeld staat niet op zichzelf. De vorderingen in automatische vertalingen mogen dan indrukwekkend genoemd worden, het is nu nog vaak behelpen met slecht vertaalde woorden en, vooral, kromme zinsconstructies. Dat moet een stuk beter kunnen, meent DeepL, dat het op ‘een enorme en hectische reddingsoperatie’ houdt. De andere grote concurrent, Microsoft, besluit ‘frantic’ helemaal niet te vertalen.Het Duitse DeepL lanceert vandaag ……
een vertaalmachine die rechtstreeks de concurrentie moet aangaan met onder andere Google Translate en Bing Translator van Microsoft. Geen kleine spelers, eufemistisch geformuleerd. Toch claimt het bedrijf beter te zijn dan zijn bekende voorgangers. Zo schermt DeepL met hogere BLEU-scores, de gestandaardiseerde score die gebruikt wordt om de kwaliteit van automatische vertalingen aan te geven. Hoe kan dat?
Training
Tegelijkertijd beschikte DeepL over een enorme hoeveelheid meertalige teksten om de netwerken te trainen. Het bedrijf kon voortbouwen op een al langer bestaand ander product: Linguee, een in Duitsland, Frankrijk en Spanje populaire zoekmachine voor vertalingen. In de afgelopen tien jaar heeft DeepL meer dan een miljard vertaalde teksten van hoge kwaliteit verzameld. Een supercomputer in IJsland wordt vervolgens gebruikt om de neurale netwerken met deze berg teksten te trainen. De netwerken leren zelfstandig hoe ze grammaticaal correct kunnen vertalen.
Suzan Verberne van de Universiteit Leiden beaamt dat de ontwikkelingen razendsnel gaan sinds Google is overgestapt op deep learning. ‘Zeker bij formele teksten gaat het nu al heel goed.’ Andere factoren die een rol spelen zijn de lengte van de vertalen tekst (hoe langer, hoe beter een computer het doet) en de taalparen (Nederlands – Engels gaat bijvoorbeeld een stuk beter dan Engels – Nederlands).
DeepL Translator ondersteunt – via zijn site, apps volgen later – op dit moment 42 taalcombinaties tussen Nederlands, Engels, Duits, Frans, Spaans, Italiaans en Pools. In de nabije toekomst zullen meer talen worden toegevoegd, waaronder Mandarijn, Japans en Russisch. De dienst zelf is gratis; het bedrijf wil geld verdienen door, net als Google, zijn vertaaldiensten aan te bieden aan andere bedrijven.
Er is, kortom, nog steeds werk aan de winkel bij Google, Microsoft én DeepL, zeker als er naar het Nederlands moet worden vertaald.