3352 Ex'tent | Eckart Wintzen » Nederlandse vertaalcomputer loopt warm
ECKARTS NOTES. Click here to read more and order!

Nederlandse vertaalcomputer loopt warm

Dec 10, 1987 (Het financiele dagblad )

Na zeven jaar onderzoek en ontwikkeling beschikt het Utrechtse softwarehuis BSO sinds kort over een werkend prototype van een Nederlands vertaalcomputersysteem dat het zelf heeft ontwikkeld. Verwacht wordt dat in 1993 de commerciële versie van dit systeem op de markt komt, dat vertalingen zal produceren van het Engels naar het Frans. In de loop van de jaren negentig zullen daar andere talen aan worden toegevoegd.

De belangstelling voor vertaalcomputers begint internationaal aan te trekken nadat zij vooral in de VS sterk was verflauwd. Daar was in de jaren zestig nog spraken van een onderzoek, waarna financiële sponsors zich terugtrokken toen zij constateerden dat computervertalen een langdurige, moeizame bezigheid was en er vanwege voldoende vertalers eigenlijk geen acute noodzaak voor bestond.

Op dit moment zijn er zo'n tien grote concurrerende onderzoeks-en ontwikkelingsprojecten in de wereld, de meeste in Japan, waar een aantal elektronische bedrijven zich heeft geworpen op vertalingen van het Engels in het Japans en omgekeerd. Binnen de Europese Gemeenschap heeft het massale vertaalproces van de gemeenschapstalen geleid tot het ontstaan van een ware vertaalindustrie, waarbij ook machinevertalingen als hulpmiddel worden ingezet. Behalve Japan en de EG is ook het tweetalige Canada op dit gebied actief daar wordt bijvoorbeeld een automatisch vertaald dagelijks weerbericht uitgebracht.

Toch is algemeen directeur E. J. Wintzen van BSO niet geïnteresseerd in het werkterrein van bijvoorbeeld de 50.000 vertalers in Europa. Hij mikt met zijn vertaalcomputersysteem vooral op de noodzaak van communicatie in kantooromgevingen. 'Denk aan electronic mail, denk aan de grote aantallen tekstverwerkers in kantoren, alleen in Nederland worden er dat naar schatting 1,4 miljoen in 1990, met inbegrip van communicerende werkstations. Iedereen die met het buitenland te maken heeft is een potentiële gebruiker van een vertaalcomputer. Neem uzelf, u hebt immers regelmatig te maken met nieuws van Reuters of andere persbureaus.'

Het Utrechtse softwarebedrijf BSO/Buro voor Systeemontwikkeling (omzet ruim f 100 mln.) legt zich vooral toe op de ondersteuning van opdrachtgevers bij de introductie van nieuwe technologieën. In 1980 startte hier Ir T. Witkam met de uitwerking van plannen voor het vertaalsysteem. Met behulp van een EG-subsidie van een kwart miljoen gulden werd in 1982-83 een toepasbaarheidsstudie uitgevoerd. Dat leidde in 1984 tot de opstelling van een plan voor een 6-jarig -onderzoeks- en ontwikkelingsproject met een omvang van 75 mensjaren en een kostenraming van f 18 mln. Dit plan werd aan het ministerie van Economische Zaken voorgelegd en gehonoreerd met een subsidie van f 7,6 mln. in het kader van innovatiestimulering in de software-industrie.

Met nieuwe systeem heet DLT (Distributed Language Translation) en heeft als typische eigenschap dat niet zozeer spraken is van een vertaalcomputer als wel van een netwerk van op elkaar afgestemde vertaalcomputers. Elke aangesloten computer (bijvoorbeeld een personal computer binnen kantoornetwerken) neemt daarbij alleen de vertaling van of naar de taal van de 'eigenaar' voor zijn rekening. De verbindende schakel wordt gevormd door een zgn. tussentaal, een soort onzichtbaar halfproduct, waarvoor Esperanto is gekozen.

Bij computervertalen vormt het vertalen van woorden uiteraard maar een zeer klein onderdeel van het geheel. Het gaat vooral om het mechanisme van de (automatische) keuze van de juiste betekenis van een woord in de gegeven context. Uit het zinsverband moet worden opgemaakt welke betekenis (en dus vertaling) van toepassing is. Bij deze 'semantische' problematiek wordt het nieuwe vakgebied van de kunstmatige intelligentie ingezet, het laten redeneren van de computer. Als meer interpretaties mogelijk zijn, worden met behulp van 80.000 'semantische atomen' in een zgn. kennisbank de zinnige en onzinnige betekenisinterpretaties van elkaar gescheiden.

Hoe moet je je zoiets voorstellen? Neem het simpele zinnetje 'The golden watch was sold by the je weller to a man with a board'. Voor iemand met enige kennis van Engels is hier geen enkel vertaalprobleem. Maar een computer moet heel wat tekenwerk verrichten voordat hij heeft vastgesteld dat de baard niet bij de juwelier hoort, maar bij de koper van het horloge. Het was een van de vele voorbeelden die Prof. W. J. Hutchins, docent aan de University of Wast Anglia en schrijver van het in 1986 verschenen standaardwerk 'Machine Translation, past, present, future', vorige week gaf tijdens de eerste demonstratie van het DLT-systeem in Utrecht.

BSO liet tijdens deze demonstratie met behulp van grafische werkstations zgn. ontleedbomen zien, ontlede zinnen met keuzemogelijkheden, gevisualiseerd als een soort takken. Het Utrechtse softwarebureau heeft niet voor een volledig automatische vertaling gekozen, maar laat het systeem de gekozen oplossing ter controle aan de mens voorleggen, waarna de tussentaal definitief wordt vertaald. Dit om het aantal keuzeprocessen van de computer enigszins binnen de perken te houden.

Het bedrijf denkt nu ongeveer op de helft van het -onderzoeks- en ontwikkelingstraject te zijn aangekomen. Volgens algemeen directeur Wintzen is het belangrijkste dat de principes nu onder de knie zijn en het systeem blijkt te werken. De rest is vooral 'voetenwerk': de (tijdrovende) uitbreiding van woordenschat en kennisbank die in de komende jaren tot schaalvergroting van het systeem moeten leiden. De introductie naar buiten is bedoeld om de belangstelling te wekken van mogelijke partners bijvoorbeeld computers fabrikanten die zich richten op de kantooromgeving elektronische uitgevers.

Machinevertalen begint al een beetje om zich heen te grijpen. Het heeft al geleid tot het ontstaan van nog een ander fenomeen, de zgn. controller language. Dit is taalgebruik dat tot zo min mogelijk misverstanden door de computer leidt en zich daardoor goed leent voor multilinguale toepassingen. Het Amerikaanse bedrijf Xerox laat bijvoorbeeld bepaalde handboeken in deze controletaal schrijven, een vrij kostbare vorm van 'editing', die zich op den duur wel betaalt naarmate computers meer vertalingen voor hun rekening gaan nemen.

H. Leerink

» Article index

0