Medialab maakt een einde aan het grootste obstakel van de informatiemaatschappij
Snel en gemakkelijk zoeken van informatie via een computer. Dat lijkt makkelijker dan het is. De hele wereld aan kennis ligt op en voor steeds meer mensen. Precies dat ene stukje kennis vinden wordt steeds moeilijker. Ziedaar het grootste obstakel voor mensen die via databanken of Internet kennis willen opdoen. Dat obstakel frustreert de ontwikkeling van een kenniseconomie waarvan een land als Nederland zo afhankelijk is. De oplossing ligt in computers die begrijpen wat mensen vragen. Het Nederlandse Medialab van automatiseerder Origin ontwikkelde een zoeksysteem met kunstmatige intelligentie en deed enkele succesvolle proefprojecten.
Een doorbraak op wereldschaal.
'Ik zoek een C-programmeur met gymnasium in Amsterdam'. De huidige zoeksystemen geven pas antwoord als iemand aan alle drie de eisen voldoet. Een collega of vriend kan antwoorden: 'ja, Piet in Halfweg is C++-programmeur en heeft Atheneum B. 'Piet voldoet aan geen van de drie eisen, maar lijkt toch heel geschikt voor de vacature. Computers kunnen dat nog niet, maar Thijs Chanowski en de zijnen hebben een zoeksysteem ontwikkeld, Aqua Browser genaamd, dat begrijpt wat de vrager bedoelt. "Het Medialab heeft de afgelopen jaren diverse hulpmiddelen ontwikkeld voor deelproblemen. Toen we ze aan elkaar koppelden, bleek een enorme synergie te ontstaan. Een doorbraak in de ontwikkeling van zoeksystemen. De vrager gaat in dialoog met de computer zoeken naar het antwoord. Zelfs op domme en vage vragen komt op die manier een antwoord."
Chanowski geeft een demonstratie. Op de oude manier komt er op het scherm één naam van een C-programmeur in Amsterdam. "Maar die vind ik niet aardig." Dan zet Chanowski het fuzzy zoeksysteem aan en stelt het in op 95 procent. Dat betekent dat de antwoorden niet 100 procent exact hoeven zijn en zie: zeven namen. Een deel heeft een opleiding die verwant is aan gymnasium, de anderen wonen in de omgeving van Amsterdam. "We kunnen ook op een kaart van Nederland een cirkel trekken om Amsterdam, waarbinnen de computer mag zoeken."
Gebruiker voorop
Allesoverheersend uitgangspunt is de gebruiker. "Tot nu toe moeten mensen leren hoe ze met machines kunnen omgaan. Wij vragen: kan het niet andersom? Dus, machines leren hoe mensen in elkaar zitten." De voordelen zijn groot. Zoeken naar een telefoonnummer en niet precies weten hoe de naam geschreven wordt? Geen probleem. De computer antwoordt met een lijst van mogelijke plaatsnamen. Maar Aqua Browser kan meer.
Elke gebruiker heeft zijn of haar eigen interesses. Dat blijkt uit het zoekgedrag. Als een gebruiker elke dag vijf handelingen verricht en steeds weer uitkomt bij de recentste documenten, kan de computer leren dat voor deze gebruiker de nieuwe informatie meteen op het scherm verschijnt zonder al die handelingen te moeten verrichten. Zo krijgt in één bedrijf de directeur een ander gebruikersprofiel dan de boekhouder, de verkoper en de inkoper. Aqua Browser kan echter nog meer.
Je zoekt bijvoorbeeld informatie over biotechnologie. Dat trefwoord verschijnt op het scherm, waarna andere trefwoorden verschijnen die relaties hebben met het eerste woord. "Zo krijg je al antwoorden op vragen die je nog moest bedenken. Het programma plaatst de gezochte informatie in een context. Dat past bij de manier waarop de meeste mensen informatie zoeken. je gaat een bibliotheek binnen met een vaag idee over watje wilt weten, bij voorbeeld over een vakantieland. Pas als je iets vindt, worden je vragen concreter."
Aqua Browser kan nog iets. Het systeem springt van databank naar Internet en verder. Als een tekst gevonden is en de gebruiker vraagt om meer, zoekt het systeem niet verder op trefwoord, maar verwerkt het de hele tekst in een zogenaamde vector en zoekt het de toegankelijke databanken af op verwante teksten. Chanowski tikt als voorbeeld de naam 'Fog' in. Hij krijgt binnen enkele seconden het hele manuscript op zijn scherm van Jules Verne's De reis om de wereld in 80 dagen met hoofdpersoon Phileas Fogg. Zoekt hij verder, dan verschijnt 20.000 mijlen onder zee als meest verwante tekst inclusief het percentage van verwantschap, terwijl de naam Fogg of Fog hier niet voorkomt. "Kennelijk vertonen stijl en woord gebruik van JulesVernelsboekenveelverwantschap."
Zo zal Aqua Browser bij een vraag naar informatie over Ahold ook gegevens aanbieden over andere supermarktketens. Tenzij uit het gebruikersprofiel blijkt dat de gebruiker meestal geïnteresseerd is in de relatie met de beurs, dan komen die aspecten aan bod.
Ongevraagd advies
Is dit het einde? Of komen er nog slimmere zoeksystemen? Chanowski voorspelt over twee of drie jaar een volgende generatie: systemen die ongevraagd advies geven. Hij geeft als voorbeeld iemand die last heeft van een boer die dagelijks met een mestkar door zijn tuin rijdt, verwijzend naar een recht van overpad. "Zo iemand zal regelmatig informatie zoeken over dat recht van overpad. Nieuwe, zogenaamde spider-software signaleert dat en gaat vervolgens zelfstandig zoeken naar informatie. Als de gebruiker de volgende dag zijn computer aanzet, kan hij de melding krijgen dat 'spider' twee artikelen gevonden heeft die mogelijk interessant kunnen zijn. Een artikel in een regionale krant bijvoorbeeld over een soortgelijk conflict."
Chanowski zegt met nadruk dat het Medialab geen producten maakt. "Wij maken prototypes, vaak samen met een researchpartners Zo is de manier van kijken naar gerelateerde informatie ontwikkeld met Mike Murtaugh van het MIT-Medialab in Boston. We hebben proefprojecten uitgevoerd samen met Rijkswaterstaat en de Rijksacademie van Beeldende Kunsten. Zij betalen ons voor ons deel van het werk en kunnen verder met de kennis doen wat zij willen. Tegelijk kan Origin die kennis aanbieden aan klanten. Het Medialab is geen commercieel bedrijf. Wij zijn onderzoekers en die positie versoepelt de contacten met andere onderzoekers. Niemand doet moeilijk over het delen van onderzoeksresultaten, want iedereen weet dat wij onze kennis ook met hen delen."

