• No results found

Een IR systeem zoekt voor de gebruiker naar een document in de collectie. De meeste zoeksystemen doen dit. Ook Google, Bing, Yahoo. We zijn er eigenlijk aan gewend dat dit zo is, maar zo langzamerhand is de technologie dermate volwassen dat we aan een computer gewoon een vraag kunnen stellen, en dat we dan het antwoord terugkrijgen, in plaats van een document waar het antwoord in staat. Systemen die dit kunnen heten Question Answering (QA) systemen.

Een voorbeeld van een dergelijk systeem wat vrij en online is te gebruiken is Wolfram Alpha. Dit bedrijf presenteert zich als volgt: 13 ‘Wolfram Alpha's long-term goal is to make all systematic knowledge immediately

computable and accessible to everyone. We aim to collect and curate all objective data; implement every known model, method, and algorithm; and make it possible to compute whatever can be computed about anything. Our goal is to build on the achievements of science and other systematizations of knowledge to provide a single source that can be relied on by everyone for definitive answers to factual queries. ‘ Dit vergeleken met die van Google14: ‘Google’s mission is to organize the world’s information and make it

universally accessible and useful.’

Figuur 12

Wolfram Alpha, voorbeeld van een QA system op het web.

13 http://www.wolframalpha.com/about.html 14 https://www.google.nl/intl/en/about/

In Figuur 12 is te zien dat Wolfram Alpha gebruik maakt van synoniemenlijsten (rainfall - precipitation) en een geografische namen-lijst bij de interpretatie van de vraag.

Apple en IBM hebben elk hun eigen QA systeem ontwikkeld. Dat van Apple (Siri) is geïntegreerd in de iPhone4S en nieuwere toestellen. De bronnen waaruit Siri de antwoorden genereert zitten in de iPhone (contacten, agenda) of worden gezocht op het web. Siri werkt met spraakherkenning [14]. Door de beperkte computing mogelijkheden van een telefoon is Siri niet heel uitgebreid. Het is wel opgezet als lerend systeem. Het verbetert zichzelf wanneer het vaker wordt gebruikt.

IBM heeft een reputatie hoog te houden als het gaat om doorbraken in intelligente systemen. Na een schaak- computer die van de wereldkampioen won en een supercomputer die eiwitstructuren doorrekent kwamen ze in 2011 met Watson, die de beste spelers van de televisiequiz ‘Jeopardy!’ versloeg. In deze quiz wordt de algemene kennis van de deelnemers getest door het stellen van cryptogram-achtige vragen. Verder zit er een spel-strategisch element in. Begin 2011 won Watson de ‘Jeopardy!’ quiz van de twee beste spelers.

Het moge duidelijk zijn dat een QA systeem veel complexer is dan een IR systeem, en dat er meer nodig is dan taaltechnologie om het juiste antwoord te genereren. De makers van Watson wilden een aantal technische doorbraken realiseren. De problematiek speelt zich af in een open domein (er is geen sprake van een gesloten knowledge base), er wordt gebruik gemaakt van complexe taalvoorbeelden, de precisie van de antwoorden is hoog (dus niet 'het antwoord staat in dit document', maar het exacte antwoord dat werd gevraagd moet worden gegeven). Verder is vanwege het spelelement van ‘fout antwoord is geld verliezen’ vereist dat er een hoge mate van zekerheid van het antwoord is, en dat er snel wordt geantwoord.

IBM Watson is een grote doorbraak op het terrein van kunstmatige intelligentie. Het systeem werkt niet volgens het traditionele principe van het via NLP vertalen van de vraag naar een aantal antwoorden en deze vervolgens opzoeken in een database. Dit is namelijk niet werkbaar in een open domein waarin de vraag en het onderwerp van tevoren niet bekend zijn. Het principe van Watson is gebaseerd op een ranking van een aantal kandidaat antwoorden en het vinden van bewijs voor dit antwoord in andere bronnen. Het bewijs kan worden gevonden in een aantal bewijscategorieën, b.v. geografisch, chronologisch en lexicografisch. Voorbeeld: 'deze man was president van de VS ten tijde van gebeurtenis x'. Voor het goede antwoord moeten de tijdstippen 'was president van de VS' en het tijdstip van de betreffende gebeurtenis overlappen. Alle bewijscategorieën worden gewogen en volgens een machine learning algoritme wordt het meest waarschijnlijke antwoord gegeven. Verder is interessant dat Watson werkt op basis van open software. Uiteraard zitten er allerlei gepatenteerde algoritmen in, maar de basis van Watson bestaat uit veel hardware en het principe van parallel software processing via een groot aantal losse componenten die met een open source framework worden aangestuurd [15] [16].

5.1

QA in het GI domein

In het GI domein wordt vaak de naam question answering systeem gebruikt in de context van beslissingsonder- steunende systemen (decision support system). Dergelijke systemen zijn bedoeld om een vraag waarvan het antwoord afhankelijk is van veel factoren te kunnen beantwoorden (‘wat gebeurt er met variabele x als beleid y wordt uitgevoerd’). De resultaten worden vaak in grafieken en kaartbeelden weergegeven om de nuances in het antwoord goed te kunnen afbeelden. Dit is een ander type systeem dan bijvoorbeeld Watson, dat een enkel antwoord geeft. Een QA systeem van dat type zou er als volgt uit kunnen zien. In de geo informatie wordt er veel gerekend. Geodata is input voor modellen en overlays (kaartlagen over elkaar heen). Zo kunnen ruimtelijke vragen worden beantwoord, en analyses worden gemaakt over mogelijke toekomstige gebeurtenissen zoals overstromingen of landverschuivingen door erosie. De resultaten van een GIS analyse worden meestal gepresenteerd in een kaartbeeld. Het is denkbaar dat een GIS systeem via QA zou kunnen worden bevraagd.

Voorbeeld: 'Als de dijk bij plaats X doorbreekt, hoe hoog komt het water dan te staan in mijn huis?' Deze vraag kan via NLP worden geanalyseerd. De locatie van het huis zou ergens bekend moeten zijn (bijvoorbeeld in de instellingen van het gebruikersprofiel) en de locatiegegevens van 'plaats X' worden opgezocht via Geonames. Het GIS moet op basis van deze waarden de analyse uitvoeren en het resultaat uitlezen op de locatie 'mijn huis'. Dan kan met een NLP algoritme op basis van de oorspronkelijke vraag het antwoord worden gegene- reerd: 'Het water in jouw huis is dan Y meter hoog.'

GERELATEERDE DOCUMENTEN