De computer luistert mee
Volksstammen doen het, praten tegen de computer. Meestal in verwijtende zin. Zo van: waarom doe je het, niet. Hoewel het oplucht, helpt het niets. Tenzij je het ding met een programmaatje hebt, leren luisteren. Fabrikanten schetsen in uitbundige bewoordingen de voordelen. Maar moet je je eens voorstellen dat na een onhandige manipulatie de computer vraagt of jij je harde schijf wilt vernietigen, er iemand op de deur klopt en jij uit gewoonte 'ja' roept.
Soms is een kletsende computer wel nuttig. In de procestechniek bijvoorbeeld. Een verkeerde handeling en een complete fabriek vliegt in de lucht. Wat is er dan veiliger dan een besturingscomputer die de opdracht herhaalt en om een bevestiging vraagt. Of zelfs waarschuwt voor de gevolgen van de net ingevoerde opdracht.
Een computer, leren luisteren lijkt eenvoudiger dan het is. Het apparaat moet het gesproken woord omzetten in binaire informatie, enen en nullen. Nu is dat in, de telefonie geen enkel probleem. Alleen hoeft de computer in dat geval niet meer te doen dan de geluidsgolven om te zetten in bytes en aan het einde van de rit het omgekeerde.
Om hem gesproken 'woord te 1aten begrijpen moet hij het verschil weten tussen woorden met dezelfde klank maar met een andere betekenis. Hoe leer je het ding nu het verschil tussen meid, mijdt en mijt?
Bij BSO/Origin denken ze een oplossing te hebben gevonden.
Het Utrechtse bedrijf is al jaren bezig met de ontwikkeling van een vertaalcomputer. Ook, daar speelt het interpretatieprobleem.
'Bepaalde woorden horen op een zekere manier bij elkaar en hebben zo ook een bepaalde waarde. Bijvoorbeeld: de top bereiken. Dat doe je doorgaans maar één keer. Zo'n combinatie noemen wij een feature'.
Op die manier, kun je de computer het verschil tussen schijnbaar dezelfde 'woorden leren", aldus Trude Maas van BSO/Origin.
Philips, dat, een groot aandeel heeft in BSO/Origin, kondigde onlangs de luisterende computer aan. Dat systeem zou alle bestaande prograrmma's in snelheid en gebruikersgemak overtroeven.' Met de taalmethode van BSO/Origin zou veel snelheid gewonnen kunnen worden doordat de computer niet elk woord apart in zijn geheugen behoeft op te zoeken.
Dat is wel het geval met het spraakherkeningssysteem van Compuspeak. "Wij maken gebruik, van, 'isolated word" aldus Marcel. Kars van ComPuspeak. "De computer maakt een digitaal plaatje van het ingesproken commando. Als dat woord op precies dezelfde wijze wordt uitgesproken door dezelfde persoon, zal de computer het herkennen. Tussen elk ingegeven woord moet even een pauze komen, om de computer de tijd te geven het ingegeven commando te vergelijken met wat hij in zijn geheugen heeft."
Computers kunnen met een programma van Compuspeak ook leren praten. Daarvoor is een vertaalsysteem ontwikkeld waarmee het apparaat ingetikte tekst leert uitspreken. Dat was ook wel nodig. Want stel je, voordat je 22.000 artikelen moet inspreken in een spraakgeheugen. Dan, gaat tikken sneller.
Philips werkt aan een systeem op basis van lettergrepen. Wij gaan uit van klanken. De computer plakt die klanken achter elkaar en leert zo de woorden. Dat werkt prima. Hij weet echt het verschil tussen geep en reep."
Het consequent op dezelfde manier uitspreken van commando's is onnodig, bij een computer geladen met het Voice Mastersysteem. Hij verstaat alle dialecten die in Noord-Amerika worden gesproken. En zelfs mijn 'steen'-kolen-Engels", aldus Hans van Heertum van Vóice Master.
Het geheim van de smid is in dit geval de klankbeeldherkenning. Daar waar het andere systeem alleen de golfkarakteristiek onthoudt van een bepaalde klank, meet Voice Master op zestien cruciale punten het grafiekpatroon van pieken en dalen die ontstaan als je een woord uitspreekt.
Die punten zijn zo gekozen dat ook bij een slordige uitspraak of een accentverschil de computer begrijpt wat er bedoeld wordt. En dat maakt het mogelijk dat iedereen met dat ene programma kan werken, als hij weet welke commando's uitgesproken moeten worden. Doordat de computer de woorden in zijn context, kan plaatsen, is tussen de woorden van een commandoreeks geen pauze meer nodig.
"De computer kent in totaal 16.000 commando's. Om die te maken zijn 2300 verschillende woorden nodig. Op dit moment werkt hij in het Engels. Maar het maakt hem niets uit of er nu in Swahili tegen hem wordt gesproken of in plat Amsterdams. Als hij in die talen eerst maar die 2300 woorden heeft geleerd", legt Van Heertum uit.
Volgens hem kunnen mensen met luisterende computers meer uit hun computerprogramma's halen. Neem WP. De meeste mensen gebruiken maar 15 tot 25 procent van de mogelijkheden. Omdat ze niet kunnen onthouden welke toetscombinaties allemaal nodig zijn om een handeling te verrichten. Vraag het maar eens in de kroeg: wie weet de combinatie om een stuk tekst vet te zetten? Je krijgt de meest uiteenlopende antwoorden. Het is toch veel simpeler om tegen je computer te zeggen: alinea twee vet."
"Voor echt herkenning van gesproken teksten moet er nog heel wat gebeuren", meent Van Heertum, "Toch is het nu al, sensationeel hoor, als je met je handen in je zakken naast dat ding staat en hij precies doet wat je zegt."
DragonDictate presenteerde deze week eveneens een 'redelijk' werkend dictaatprogramma'. Waarmee ook onder Windows commando's gegeven kunnen worden. De software kost tussen de fl 3000 en fl 6000. Het programma van VoiceMaster kost inclusief koptelefoon en microfoon fl 395. Het systeem van Compuspeak, vooraf bedoeld voor industriële toepassingen, kost inclusief zenders en headsets ongeveer fl 25.000. Het spraaksysteem van Philips, dat ongeveer fl 40.0000 kost, komt waarschijnlijk in maart op de markt.
ARNOUD CORNELISSEN

