• No results found

KWARTE T TEN logica en strategie voor het kaartspel

N/A
N/A
Protected

Academic year: 2021

Share "KWARTE T TEN logica en strategie voor het kaartspel"

Copied!
80
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)
(2)

KWARTE T TEN

logica en strategie voor het kaartspel

Auteur:

Fiona Douma Begeleiders:

Gerard Renardel de Lavalette Barteld Kooi

Referent:

Rineke Verbrugge

Rijksuniversiteit Groningen Technische Cognitiewetenschap maart, 2002

Illustratie voorkant:

Dick Bruna

(3)

Voorwoord

Eindelijk is het zover, geen tentamens meer, de scnptie is af en de buluitreiking in zicht.

Binnenkort is mijn studententijd voorbij en heeft deze scriptie een officiële plaats in de boekenkast.

Deze scriptie gaat over het spelletje kwartetten en is het resultaat van mijn afstudeeronderzoek voor de studie Technische Cognitiewetenschap aan de Rijksuniversiteit Groningen. Dit is een van de weinige studies waarbij je je met robots en spelletjes bezig mag houden en daar ook nog studiepunten voor krijgt.

Steeds als ik iemand vertelde dat ik voor mijn afstuderen met spelletjes bezig was, dan was diegene heel enthousiast en geInteresseerd. Zodra ik echter vertelde dat het om het spelletje kwartetten ging, werd ik uitgelachen. Ondanks dit ben ik kwartetten en andere spelletjes

alleen maar leuker gaan vinden. Na het lezen van dit verslag zullen jullie het vast met mij eens zijn dat kwartetten niet een dom kleuterspelletje is, maar een interessant kennisspel.

Uiteindelijk heb ik nog net geen jaar over mijn afstuderen gedaan. Zonder een aantal mensen was dit waarschijnlijk niet gelukt en daarom wil ik ze flu even bedanken.Ten eerste wil ik mijn begeleiders, Gerard en Barteld, bedanken, waarmee ik, regelmatig onder het genot van een kop koffie, steeds mijn vorderingen heb besproken. Verder bedank ik Rineke, die zelfs terwijl ze in het buitenland zit, bereid is mijn scnptie te lezen en te beoordelen. Ook bedank ik Frank Brokken, die mijn programmeerprobleempje interessant vond en hier een oplossing voor heeft gevonden.

Verder wil ik nog Sjoerd bedanken, die vaak zelfs enthousiaster was dan ikzelf en alle mensen die tij dens de pauzes kwartet met mu gespeeld hebben in de kantine.

Tot slot wil ik mijn familie, vrienden en huisgenoten bedanken, die mij steeds weer wisten te motiveren als mijfl inspiratie even verdwenen was.

(4)

Inhoudsopgave

1.

1eiding

. 1

2. Drie spelers, dne kaarten 2

2.1. Epistemische logica 2

2.1.1. Operator K 2

2.1.2. Kripke modellen 3

2.1.3. Kripke semantiek van epistemische formules 3

2.1.4. SysteemK

3

2.1.5. SysteemS5 4

2.1.6. Algemene en gemeenschappelijke kennis 5

2.2. Logica toegepast op kwartetten 6

2.3. Possibility sets 7

2.4. Het spelverloop 7

2.5. Actie modellen 9

2.5.lDetaal

2.5.2 De semantiek 10

2.5.3 Axiomatisering 10

2.5.4 Toepassing op kwartetten 11

2.6. De spelboom 14

2.7.Kansen 19

3. Vier spelers, vier kaarten 22

3.1. Het model 22

3.2. De eerste vraag 23

3.3. Het antwoord op de eerste vraag 24

3.4. ZOTN als 'echte' wereld 26

3.5. Geen vaste wereld 26

3.6. Een lastige situatie (splitsen) 27

3.7. Kansen toekennen 32

4. Vijfspelers, vijfkaarten 34

4.1. Splitsen 34

4.2. Mogelijke oplossingen 37

4.2.1. Hetprogramma 37

4.2.2. Typen vragen aanpassen 39

4.2.3. De takken samenvoegen 39

4.2.4. De takken doorrekenen 41

4.3. De splitssituatie van hoofdstuk 3.6 42

4.4.Watnu7 5. Conclusie Referenties

Bijiage 1: Mogelijke vragen bij vier spelers, vier kaarten boom 48 Bijlage 2: De kennistoestanden bij vier spelers, vier kaarten boom 51 Bijiage 3: Kansen bij vier spelers, vier kaarten boom 53 Bijiage 4: Programma dat de vier spelers, vier kaarten boom genereert 55

(5)

1. INLEIDING

Kwartetten, iedereen heeft het vroeger wel gespeeld. Het is een heel eenvoudig spelletje en is ook zeer geschikt voor kleuters. Toch zitten er wel interessante aspecten aan. Denk bijvoorbeeld aan het volgende: Van een bepaald kwartet heb je één kaart en van een ander kwartet twee kaarten. Naar welk kwartet kan je nu het beste vragen? Wanneer het spel z'n einde nadert, kan een andere interessante situatie ontstaan: In het spel bevindt zich nog één kwartet en iedereen heeft één kaart. Nu heeft iemand je een kaart gevraagd die je met hebt, wat moet je dan doen? Vragen naar de kaart waarnaar al gevraagd is, vragen aan de speler die jou jets gevraagd heeft, of jets anders? En wat moet je doen als er eerder in het spel naar een kaart van een bepaald kwartet gevraagd is en jij hebt daar ook een kaart van? Moetje dan naar dat kwartet vragen ofjuist naar een ander?

Het doe! van mijn onderzoek, dat in dit vers!ag wordt beschreven, is een antwoord te vinden op deze vragen. Dit ga ik doen door middel van het bepalen van een optimale strategie (voor zover mogelijk). 1k ga djt laten zien door eerst een vereenvoudigde versie van het spel te bekijken, waarin slechts éen 'kwartet' bekeken wordt bestaande uit slechts drie kaarten en waar wordt gespeeld door drie spelers. In dt dee! worden de begrippen en methodes die later gebruikt zullen worden, uitgelegd. Vervolgens wordt dit uitgebreid naar een spel met vier spelers en vier kaarten. Daarna zal er gekeken worden of dezelfde conclusies van toepassing zijn op een spe! met vijfspelers en vijfkaarten. Tenslotte za! ik in de conclusie de resultaten bespreken en antwoord geven op de eerder genoemde vragen. Voordat ik hiermee ga beginnen, zijn hier de speiregels.

Dc speiregels vo!gens het Dick Bruna kwartetspel zijn als volgt. (Ravensburger, [1]) Dc kaarten worden geschud en opgedeeld. De opgave is zoveel mogelijk kwartetten, d.w.z.

groepjes van 4 bij e!kaar behorende kaarten, te verzamelen. Dc speler die gedeeld heefi, begint met vragen. Hij vraagt een kaart, die hij zou willen hebben. A!s de speler aan wie gevraagd wordt de verlangde kaart bezit, dan moet hij deze aan de wager afstaan. De wager mag doorgaan met vragen naar een vo!gende kaart, maar hij mag elke gevraagde kaart maar aan één speler vragen. Als deze de kaart niet heeft, dan komt hij aan de beurt en mag verder vragen totdat iemand de gevraagde kaart niet heeft, enz. Wie eenkwartet kompleet heeft, mag dat afleggen. Wie de meeste kwartetten heeft kunnen afleggen, is winnaar. Belangrijk: Men moet minstens één kaart van een kwartet bezitten om naar de overige dne te mogen vragen en men mag niet vragen naar een kaart die men ze!fheeft.

1

(6)

2. DRIE SPELERS, DRIE KAARTEN

Bij kwartetten heb je gewonnen als je aan het eind van het spel de meeste kwartetten hebt. Het doel van kwartetten kan gezien worden als het als eerste uitvinden wie welkekaart heeft (en daarbij zeif aan de beurt zijn). Om dit te bereiken, moet je er ook voor zorgen dat anderen zo weinig mogelijk weten over welke kaarten jij hebt. Als alle kaarten verdeeld zijn, maar de spelers nog niet gezien hebben welke kaarten ze zeif hebben, dan houden ze alle mogelijke kaartverdelingen voor mogelijk. Wanneer ze hun eigen kaarten bekeken hebben, vallen er voor elke speler al een aantal af. De kaartverdelingen die afvallen verschillen per speler. Om er voor te zorgen dat anderen zo weinig mogelijk weten over welke kaarten iii hebt, moet er altijd rekening gehouden worden met de kennis van de andere spelers, dus met alle mogelijke kaartverdelingen.

Een normaal kwartetspel bevat 36 kaarten (9 kwartetten). Dat betekent dat bij een spel met vier spelers deze kaarten op 2,14x iO'9 verschillende manieren' verdeeld kunnen worden. Om in de beginsituatie van deze grote hoeveelheid mogelijke kaartverdelingen uit te gaan is met heel handig. Daarom kunnen we beter eerst naar een vereenvoudigde versie gaan kijken. Bij één kwartet en vier spelers kunnen de kaarten op 4! is 24 manieren verdeeld worden en bij drie spelers en een kwartet van drie kaarten op 3! is 6 manieren. Dit lijkt mu een leuke situatie om te beginnen. In dit hoofdstuk worden de begrippen geIntroduceerd en uitgelegd. Er zal

begonnen worden met een korte uitleg van de benodigde logica, vervolgens komt de

kennisverandering aan bod aan de hand van een voorbeeld. Hiema wordt het weergeven van de kennisverandering met logica besproken. Daarna wordt de spelboom behandeld en tenslotte worden de kansen aan de verschillende takken van de boom toegekend.

2.1 Epistemische logica

De basiskennis van de (propositie) logica wordt bekend verondersteld. Om de rest van dit versiag goed te kunnen begrijpen moet ook een redelijk begrip van de epistemische logica (ofwel kennislogica) aanwezig zijn. Hier volgt in het kort de basis, met de nadruk op Kripke modellen, ontleend aan (Meyer en van der Hoek, [6]), zie aldaar voor een uitgebreidere uitleg.

2.1.1 Operator K

Als eerste introduceren we een nieuwe operator, de operator K. K1p staat voor: Actor i weet dat p waar is. De benodigde taal ziet er als volgt uit.

P is de verzameling propositionele atomen; P = {po, ...,Pn-I } voor een zekere n E N. A is een verzameling van m actoren; A = (1, ..., m}, voor een zekere m E N. De verzameling LmK(P) van epistemische formules p, j, ... overA is de kleinste verzameling gesloten onder:

(i). Als p E P, dan p E LmK(P).

(ii). Als q', i E LmK(P), dan((p A y),

-p E

LmK(P).

(iii).

Als (

E LmK(P), dan K1(p E LmK(P), voor alle i e A.

Bovendien introduceren we de gebruikelijke afkortingen ip —*

, (p v

wen p w en

I =

( A

—up en T =—a. M1p staat voor i houdt p voor mogelijk: M1p =

(36 (27 (18 (

'I lxi lxi lxi I =2,14x iO'9

9) 9) 9) 9)

(7)

12

-pq. +

+ •

'—"1 2

2.1.2 Kripke modellen

DEF1NITIE: Een Kripke model M is een tupel (S, it, R1,..., Rm),waarvoor geldt:

(i).

(ii).

(iii).

S is een niet lege verzameling van toestanden.

it: S(P [WI)) is een waarheidstoekenning aan de propositionele atomen per toestand.

R ç S x S (i =

l

..., m) zijn de zogenaamde toegankelijkheidsrelaties.

Een gepunt Kripke model w, ook wel wereld genoemd, bestaat uit een Kripke model M samen met een bepaalde toestand s e S: (M, s). De interpretatie van (s, t) E R1 is: in wereld (M, s) houdt actor i wereld (M, t) voor mogelijk.

2.1.3 Kripke semantiek van epistemische formules

We definiëren de relatie w I

=q' ((p is waar in w) met inductie op

de structuur van de epistemische formule (p:

(M,s) =p

(M,s AW

(M,s)

-p

(M,sX =Kp

ir(s)(p) =Woorp E P

(M,s =pen(M,s =*41

(M,s *p

(M, t) p voor alle t met (s, t) ER1

Kripke modellen kunnen worden weergegeven zoals in figuur 2.1. De punten geven de toestanden weer en de pijien de toegankelijkheidsrelaties. (Er is hier sprake van tweeactoren.)

2

p

12

pq

p—q

112

2.1. Een Kripke model

q.

De formules hierboven kunnen op de volgende manier op het Kripke model van figuur 2.1 geInterpreteerd worden. K1p geldt in de wereld rechtsboven. Er zijn voor actor 1 namelijkdrie werelden voorstelbaar (de wereld zelf en de onderste twee werelden) en in deze werelden is p waar. K1q is in de wereld rechtsboven niet waar, omdat q in de wereld linksonder niet waar is.

M1q is wel waar, de wereld zelf is door actor I namelijk voorstelbaar en in deze wereld geldt Er is wel een relatie (voor actor 1) van de wereld linksonder naar de wereld rechtsonder, maar andersom niet. In de wereld rechtsonder geldt dus K1p en K1q en dus Ki(p A q), maar niet K1K1q, omdat in de wereld rechtsboven K1q niet waar is.

2.1.4 Systeem K

Nu introduceren we een eerste axioma systeem, systeem K(m). Hetsysteem bestaat uit:

Axioma's

(PC) Alle (instanties van) propositionele tautologieen

(8)

(K)

-(AKj((P--w))--Ki9I vooril,...,m

Afleidingsregels

(MP) I — I —p —'u Modusponens

I-'v

(NecK) I — (i = 1, ...,m) Necessitatie I—Kp

2.1.5 Systeem S5

DEFINITIE: Laat S de verzameling toestanden van een

Kripke model zijn en R ç S x S

toegankelijkheidsrelaties.

(i). R is reflexiefals Vs E S: (s, s) E R.

(ii). R is transitiefals Vs, t, u E S: (s, t) E R& (t, u) E R (s, u) R.

(iii). R is symmetrisch als Vs, t e S: (s, t) R (t, s) E R.

(iv). R is euclidisch als Vs, t, u S: (s, t) E R& (s, u) E R (t, u) E R.

(v). R is serieel als Vs E S

t E

S: (s, t) E R.

(vi). R is een equivalentierelatie als R reflexief, transitief en symmetrisch is.

Figuur 2.2 laat zien hoe een equivalentierelatie tussen twee punten er in een Kripke model uit kan zien. Reflexief houdt in dat er vanuit elke wereld een piji naar die wereld zeif wijst.

Transitief houdt in dat als er vanuit een bepaalde wereld een andere wereld voorstelbaar is en vanuit die wereld een derde wereld, dan is vanuit die eerste wereld ook de derde wereld voorstelbaar. (Figuur 2.2 laat maar twee werelden zien.) Een toegankelijkheidsrelatie is symmetrisch als altijd wanneer vanuit een wereld een andere wereld voorstelbaar is, dat vanuit die andere wereld, dan ook altijd de eerste voorstelbaar is.

.4

2.2.Een equivalentierelatie

Systeem S5(m) gaat behalve van de gebruikelijke afleidingsregels voor Km), ook van de volgende axioma's uit:

(T) I —Kp —+ q (Als je iets weet dan is het zo)

(P1) I -lQp

-

KK1q (Alsje jets weet dan weetje dat je dat weet)

(NI) I —Kp K—K1sp (Alsje jets niet weet dan weetje datje dat met weet) Het eerste axioma zorgt ervoor dat alle relaties reflexief zijn. Het tweede en derde axioma zorgen ervoor dat de relaties zowel transitief als euclidisch zijn. Als alle relaties zowel reflexief als euclidisch zijn, dan houdt dat in dat de relaties ook symmetnsch zijn. Dus in

systeem S5(m) zijn alle relaties equivalentierelaties. Binnen de filosofie worden het tweede en het derde axioma, positieve en negatieve introspectie, verworpen. Binnen de kunstmatige intelligentie worden ze over het algemeen wel geaccepteerd. Systeem S5(m) is dan ook het meest gebruikte axioma systeem binnen de kunstmatige intelligentie.

(9)

2.1.6 Algemene en gemeenschappelijke kennis

We breiden de taal uit met twee nieuwe operatoren en noemen de taal flu LmKEC. Dc meuwe operatoren zijn E en C. Ep staat voor 'iedereen weet dat (p' (algemene kennis) en Csp staat voor 'het is gemeenschappelijkekennis dat (p'.

E(p= K1p A A Kmq,

Cp= ( A E(pA EE(p A EEE(p A

In figuur 2.1 is

in de wereld linksonder Ep waar. Zowel p als q

zijn nergens gemeenschappelijke kennis. In figuur 2.1 kan jets alleen maar gemeenschappelijke kennis zijn als het in alle werelden waar is. Het is dan ook direct in elke wereld gemeenschappelijke kennis. C(p v q) is in het model van figuur 2.1 waar.

Er is een nieuwe definitie (m.b.t. toegankelijkheidsrelaties) nodig voor de juiste semantiek van de nieuwe operatoren.

DEFINITIE: Gegeven een Kripke model M =(S,7t, R1, ..., Rm) en s, t S (i) In plaats van (s, t) E R, schrijven we nu s — t.2

(ii)

iflp1aatsvan(s,t)ERjL)...L)Rmschr1jvenWeflust.We5th11jve1stal5 ereensequenties=So—)si —÷...--3sk=t,voorbepaaldes(O i k).

(iii) De relatie —> is de 'reflexieve-transitieve afsluiting' van de één-staps bereikbaarheidsrelatie —. Dus s —> t houdt desda s k voor bepaalde k 0.

Nu de definitie voor de semantiek van de operatoren C enE.

DEFINITIE: Laat M = (S, 7t, R1, ..., Rm>

en s E

S. ( is een epistemische formule. Dc semantiek van zulke formules wordt gedefinieerd door de eerder genoemde semantische regels uitgebreid met het volgende:

(M, s =Ep

(M, t) pvoor alle t mets —÷ t, (M, s) =Op

(M, t =pvoor alle t mets 0 t.

Aanvullend op de eerdergenoemde axioma's en afleidingsregels voor SS(m) is dit een axiomatisering voor de operator E en operator C:

(E) -EpE-K1(pA...AKm(p

(IC) I-Op—*p

(Mix) I -Op —p ECp

(KC) I-(C(pAC(p-+J))-*CtI

(IA) I —C(p —E(p) ((p—+ C(p)

Samen met de volgende afleidingsregel:

(NecC)

I-Op

Dit nieuwe systeem noemen we S5EC(m).

2De—+dienu in de semantiek gebruikt wordt, heeft een andere betekenis dan de 'a1s-dan'-- die normaal in de syntaxis gebruikt wordt.

(10)

2.2 Logica toegepast op kwartetten

Hoe kan dit worden toegepast op een kwartetspel met drie spelers (1, 2 en 3) en drie kaarten (Zeehond, Olifant, Tijger)? Dc kaarten kunnen op 6 verschillende manieren verdeeld worden.

Dc verdelingen worden als volgt weergegeven: ZOT staat voor speler 1 heeft kaart Z (zeehond), speler 2 heeft kaart 0 (olifant) en speler 3 heeft kaart T (tijger). Deze verschillende kaartverdelingen zijn de toestanden. Elke toestand s is een functie van kaarten naar spelers. (s:

D —* A)Er zijn drie spelers, die gezien kunnen worden als drie actoren.

Als de werkelijke kaartverdeling ZOT is, dan heeft speler 1 kaart Z. Hij weet niet wie van de andere spelers kaart 0 heeft en wie kaart T. Hij houdt ZOT en ZTO voor mogelijk. Als ZTO de daadwerkelijke kaartverdeling is, dan geldt hetzelfde en houdt speler 1 ook ZOT en ZTO voor mogelijk. Op eenzelfde manier kan naar de andere spelers en de andere werelden gekeken worden. Dat verschillende kaartverdelingen voorstelbaar zijn wordt weergegeven door toegankelijkheidsrelaties voor bepaalde spelers tussen de werelden.

Het model van drie spelers en drie kaarten wordt ook wel het Hexa model genoemd.(van Ditmarsch, [5])

ZTO 3 TZO

_

/

OTZ 3 TOZ

2.3. Het Hexa model

Als propositionele atomen nemen we voor speler 1 heeft kaart Z, Z1. 02 staat voor speler 2 heeft kaart 0, enz.. In wereld ZOT heeft speler 1 kaart Z, speler 2 kaart 0 en speler 3 kaart T, ofwel 7t(ZOT)(Zi) = t(ZOT)(O2)=t(ZOT)(T3) = Wn onder andere ir(ZOT)(Z2) =I.

In wereld ZOT weet speler 1 dat hij kaart Z heeft, maar hij weet niet of speler 2 of speler 3 kaart 0 heeft, dit wordt weergegeven door:

(Hexa, ZOT) =K1Z1,

(Hexa, ZOT) =-K1O2 A-,K103, (Hexa, ZOT) =M102 A M103.

In figuur 2.3 staat het Kripke model dat ontstaat voor een spel met dne spelers en drie kaarten.

Stel dat de kaartverdeling ZOT is, dan houden alle spelers deze wereld ook voor mogelijk. Als ze vanuit die wereld, gegeven hun kennis, een andere wereld voor mogelijk houden, dan houden ze vanuit die andere wereld ook ZOT voor mogelijk. De kennis die de spelers hebben is namelijk in elke wereld van het model hetzelfde. Als op een bepaald moment een bepaalde wereld voor mogelijk gehouden wordt en vanuit die wereld een andere, dan is vanuit die eerste ook de derde voorstelbaar. De kennis is namelijk hetzelfde, dus worden ook dezelfde

werelden voor mogelijk gehouden. Dc relaties in het model van figuur 2.3 zijn dus

equivalentierelaties zoals in figuur 2.2.

2.3 Possibility sets

De werelden die een bepaalde speler op hetzelfde moment voor mogelijk houdt, worden ook we! de possibility set voor die speler genoemd. (Zie Binmore, [3]) De tenn possibility set komt uit de speitheorie en geeft hetzelfde weer als de eerder genoemde

(11)

toegankelijkheidsrelaties, mits het equivalentierelaties zijn. De possibility sets voor de verschillende spelers in het bovenstaande voorbeeld staan in figuur 2.4.

/j?

OZT

rc1'jOZT

fr

OTZ

\zT\ \izo

speler I speler 2 speler 3

2.4. Possibility sets in Hexa voor de verschillende spelers

2.4 Het spelverloop

Om te zien wat er met de kennis vande spelers gebeurt als er vragen gesteld worden en hoe je dit het beste weer kan geven,gaan we naar een voorbeeld kijken.

Laten we zeggen dat ZOT de werkelijke wereld is en dat speler I mag beginnen. Speler 1 heeft kaart Z en mag dus alleen maar een vraag stellen over kaart 0 of kaart T. Deze maghij

vragen aan speler 2 of speler 3.

Stel dat speler I kaart 0 aan speler 2 vraagt. Zelfs voordat speler 2 antwoordt,verandert de kennis van de spelers al. Omdat speler 1 de vraag hardop stelt en iedereen dat kan horen, is het gemeenschappelijke kennis dat speler I kaart 0 niet heeft. Het model kan nu aangepast worden. De werelden waarin speler 1 kaart 0 heeft vallen weg. Niemand houdt deze nog voor mogelijk. Zo ontstaat het model van figuur 2.5.

ZOT

ZTO 3 TZO

TOZ

2.5. Speler 1 vraagt naar kaart 0

Uit het model van figuur 2.5 kan afgeleid worden dat er voor speler 3 nog maar één wereld over is. (Vanuit ZOT is geen andere wereld bereikbaar voor speler 3.) Hij heeft zelfnamelijk kaart T en speler 1 heeft kaart 0 niet. Hieruit kan hij afleiden dat speler 2 kaart 0 moet hebben en dan blijft er voor speler 1 alleen nog kaart Z over. Voor speler 1 en speler 2 is er nog niks veranderd, zij wisten beiden al dat speler I kaart 0 niet heeft. Ze weten echter wel dat alle spelers dit flu weten. Het is gemeenschappelijke kennis. (C—0i)

Speler 2 moet flu antwoord geven op de vraag die speler 1 hem gesteld heeft. ZOT is de echte wereld, dus speler 2 heeft kaart 0 en antwoordt dus: "Ja". Op dit moment weten alle spelers dat speler 2 kaart 0 heeft. Het model kan weer aangepast worden. Het resultaat is te zien in

figuur2.6.

(12)

ZOT

TOZ

2.6. Speler 2 heeft kaart 0

Alleen speler 2 weet flu nog niet wat de echte wereld is. Speler 1 is nog steeds aan zet en wint door kaart T aan speler 3 te vragen.

Als speler 1 de vraag aan speler 3 had gesteld in plaats van aan speler 2, dan had speler 3 gezegd dat hij de kaart niet had. Figuur 2.7 geeft weer hoe het model er dan uit had gezien.

ZOT

TOZ

2.7. Speler 3 heeft kaart 0 niet.

De situatie is nu hetzelfde als de vorige. Het enige verschil is, dat speler 1 nu niet meer aan de beurt is, maar speler 3. In deze situatie wint speler 3 door kaart Z aan speler 1 te vragen en kaart 0 aan speler 2.

Bij kwartetten is het zo dat wanneer een kaart gevraagd wordt en de betreffende speler heeft deze, dan moet hij de kaart aan de vrager geven. Tot nu toe is daar nog geen rekening mee gehouden. Voor het model maakt dit echter geen verschil. Als een speler zegt dat hij de kaart wel heeft, dan weten alle spelers dat hij de kaart heeft. Als hij deze vervolgens aan iemand anders geeft, dan weet iedereen dat die andere speler de kaart heeft. Het weggeven van kaarten heeft verder geen invloed op de kennis van de spelers en dus ook niet op het model.

Pas bij het spelen met meerdere kwartetten is het weggeven van kaarten wel van belang, omdat een speler minimaal een kaart van een kwartet moet bezitten voordat hij naar andere kaarten van dat kwartet mag vragen. Zolang er met één kwartet gewerkt wordt, wordt er geen rekening meer gehouden met het weggeven van kaarten. (De speler die aan de beurt is heeft gewonnen als elke kaart aan de juiste speler gevraagd is, met uitzondenng van zijn eigen kaart.)

In Kripke modellen kan de kennis van de spelers duidelijk worden weergegeven. Het model bevat geen informatie over welke speler aan de beurt is. (Het model alleen zegt niet alles over het spel).

2.5 Actie modellen

Om het spelverloop met logica weer te kunnen geven, hebben we een logica nodig die op een bepaalde manier een multi-agent epistemische logica combineert met een dynamische logica

(13)

van "epistemische acties". (Baltag, [4], Baltag, Moss, Solecki, [2]) Hiermee kan dan de verandering van de kennis van de actoren, veroorzaakt door bepaalde acties, gemodelleerd worden. Vervolgens kunnen we het Kripke model aanpassen corresponderend met de

kennisveranderingen in de toestanden van het model. Acties hebben drie belangrijke

kenmerken:

1) Niet elke actie kan in elke wereld uitgevoerd worden, er zijn precondities.

2) Een actor kan meerdere acties voor mogelijk houden wanneer eenbepaalde actie is uitgevoerd, de epistemische actie altematieven.

3) De waarden van propositionele atomen kunnen veranderen als gevoig van de actie, de postconditie.

Als we acties zien als semantische objecten, op hetzelfde niveau als Kripke modellen, dan

kunnen we de verandering van een toestand door een

actie modelleren als een

vermenigvuldiging van twee Kripke modellen (het statische model en het actie model). Dit komt neer op het weghalen van de toestand-actie-paren waarin de toestand de preconditie van de actie niet waarmaalct.

thu dit toe te passen wordt eerst de benodigde taal beschreven. Vervolgens wordt beschreven hoe de actiestructuur en de semantiek er uit zien. Daarna wordt een nieuw axioma systeem voor acties behandeld, dat toegepast kan worden op het kwartetten.

2.5.1 De taal

We introduceren flu acties: [a]q) betekent

dat (

waar is na het uitvoeren van actie a.

De taal is voomamelijk een uitbreiding op de taal die al besproken is in sectie 1 van dit hoofdstuk. Voor de duidelijkheid wordt dit bier herhaald. P is de verzameling propositionele atomen; P = (p0, ...,

p}

voorn E N.A is een verzameling van m actorefl; A = (1,..., m}.

DEFINITIE: De verzameling Lmjqaj(P) van epistemische formules

p, ,

... over

A is de

kleinste verzameling gesloten onder:

(i) Als p E P,dan p E Lm}qa](P)

(ii) Als (p, E Lmiqaj(P),dan (p A \jf), —(p e Lm,qa](P)

(iii) Als ( E Lmiqaj(P),dan K(p E LmK[a](P),voor alle i E A (iv) Als cp E LmK[](P),dan Ep, C(p E LmK[CZ)(P)

(v) Als (p E Lmlqa](P) en a is een actie over Lmiqa1(P), dan [a]q E LmK(a)(P)

Bovendien introduceren we de gebruikelijke afkortingen (p —+ ji, p V en (p w en

J =

A

enT = —..L. M1p staat voor i houdt p voor mogelijk. Mp =

Eenactie over Lmlqa)(P) is een gepunte actiestructuur t = (H,R, pre, post, h):

H

0

eenverzameling van mogelijke acties/handelingen R H x H (i E A) kent een toegankelijkheidsrelatie toe aan elke agent

en R is een equivalentierelatie

pre: H —*Lm1(p) kent een preconditie toe aan elke actie

post:H —÷ (P —÷LmKtal(p)) kent een postconditie toe aan elke actie

h E H h is een handeling

2.5.2 De semantiek

De definities voor — en—> zijn zoals op bladzijde 5 isbescbreven. M•t is bet gevolg van bet uitvoeren van een actie OP model M.

DEFINITIE: We definiëren de relatie l =p ((p is waar in w) met inductie op de structuur van de epistemische formule (p:

(14)

(M,s =p 7t(sp)=WoorpEP

(M,s) =PAW (M,s =pen(M,s v

(M,s -p (M,s p

(M,s =Kp (M,t) =pvooralletmet(s,t) eR1 (M, s =&p (M,t =voora11etmets—+t, (M, s =Qp (M,t =pvoora11etmets—>t.

(M, s) 4a1p

Als a =(t, h), waarbij t= (H, R, pre, post) en (M, sj =pre(h), dan (M.i.t, (s, h) p

Waarbij M•p. = (S',it',R1', ..., Rm')

S' = {(t, g) I (M,

t

pre(g)}

R' = {((t, g), (u, j)) tR1u

en gRj)

it' (t, g)(p) =Vdesda(M, t) =post(t)Q,)

2.5.3 Axiomatisering

Het nieuwe axiomatische systeem noemen we systeem K[a](m).

S5 axioma's en regels

(PC) I —p, waar q een instantie van een propositionele tautologie is.

(K) I —Kp — w) - (K,(p-+ K141)

(T)

I-Kp--p

(P1) I —Kp —pKK1p (NI) I -Mp —p KM1(p

(MP) I-wi

—<p-+w

i-MI

(NecK)

L

I-Ki(p

EC axioma's en regels

(KC) I —C((p — i) — (C(p

- C)

(E)

I-E-*KIpA...AKp

(IC) I-C4:p--)(p (Mix) I -Op —*ECq)

(IA) I —C( — Eq)) (p—+ C(p)

(NecC) I

I-Op Actie axioma's en regels

(KA) I -[a](cp — '41) -+ ([a](p —* [ulMi) (AP) I -[a]p +- (pre(a) post(a)(p)) (PF) I -[a]-(p (pre(a) —* -,[a](p)

(AK) I -[a]K(p (pre(a)

A{K[](p: a -

(NecA)

(15)

Actie regel

Laat y formules zijn voor alle ,zodat

a DA f 1. i-g—*[f]q

2.

Als D y. dar

A pre(I)) —p

Kj

L—x--3[a]C(P

Deze axiomatisering is sound en complete. (Zie Baltag, Moss, Solecki, [2]) 2.5.4 Toepassing op kwartetten

Er zijn vier verschillende soorten acties:

1) Devraag

Preconditie:

Je moet aan de beurt zijn.

Je mag niet vragen naar een kaart dieje zelfhebt.

Je mag niet vragen naar een kaart waarvan a! bekend is welke speler hem heeft.

Er hoeft niemand antwoord te geven.

Postconditie:

De gevraagde speler moet antwoord geven.

Een bepaalde kaart is gevraagd.

2) Het antwoord ja Preconditie:

De speler die antwoord moet geven, heeft degevraagde kaart.

Postconditie:

De speler die aan de beurt was, mag nog een vraag stellen.

Dc speler die antwoord moest geven hoeft geen antwoord meer te geven.

De gevraagde kaart is niet meer de gevraagdekaart.

3) Het antwoord nee Preconditie:

Dc speler die antwoord moet geven, heeft degevraagde kaart niet.

Postconditie:

De gevraagde speler is nu aan de beurt.

De speler die antwoord moest geven hoeft geen antwoord meer te geven.

De gevraagde kaart is niet meer de gevraagde kaart.

4) Winnen Preconditie:

Je moet aan de beurt zijn.

Voor elke kaart moet het gemeenschappelijke kennis zijn wie hem heeft.

Postconditie:

De speler die aan de beurt is heeft gewonnen.

Het spelletje is voorbij.

De verzameling van mogelijke acties (epistemische actie altematieven) bevat altijd maar één element. Als een actie uitgevoerd wordt, dan is het voor alle spelers duidelijk welke actie wordt uitgevoerd. Een vraag en een antwoord worden namelijk altijd hardop gezegd. Spelers houden geen andere acties voor mogelijk. De toegankelijkheidsrelaties bevatten dan ook voor elke actor alleen een reflexieve relatie naar de actie zeif.

(16)

Dat betekent dat bij de vermenigvuldiging van het statische model met een actie, de

toestanden die niet aan de preconditie voldoen gewoon weggehaald kunnen worden.

Wat moet er gerepresenteerd worden?

Z

speler x heeft kaart Z 0, speler x heeft kaart 0

T

speler x heeft kaart T

B

speler x is aan de beurt

A

speler x moet antwoord geven

G

kaart x is gevraagd W, speler x heefi gewonnen

Aan het begin van het spel is B1 waar in elke toestand van model M en B2, B3, W1, W2, W3, A1, A2, A3, Gz, Go en G-r zijn niet waar. De andere propositionele atomen verschillen per toestand (zie 2.2).

Hieronder volgt een toepassing voor elk van de verschillende acties, namelijk voor het stellen van de vraag, ja antwoorden, nee antwoorden en winnen. Deze toepassing is steeds voor een

specifieke actie, maar kan voor elke actie.

De actoren en propositionele atomen voor een spel met dne spelers en drie kaarten:

A= {1,2,3}

P = {Z1, Z2,Z3,

0, 02, 03,

T1, 12, T3, B1, B2, B3, A1, A2, A3, Gz, G0, G1, W1, W2, W3}

Het stellen van een vraag: Speler 1 vraagt kaart Z aan speler 2

6h

H = {h}

R1={(h,h)}

pre(h) = B1 A A —1A1 A —1A2 A—1A3 A A post(h)( A2) =T

post(h)(Gz) =T

als p E P \ (A2, Gz), dan post(h)(p) =p

Het Kripke model kan flu aangepast worden. De toestanden die niet aan de preconditie voldoen kunnen verwijderd worden. Als deze vraag aan het begin van het spel gesteld wordt kan het Hexa model (figuur 2.3) aangepast worden.

In een tabel kan voor elke toestand aangegeven worden of deze aan de preconditie van de actie voldoet, dus of de actie in de toestand uitgevoerd kan worden:

(17)

actie h

Het resulterende Kripke model is:

OZT

/

TZO

OTZ TOZ

Ja antwoorden: Speler 2 zegt dat hij kaart Z heeft.

H = {h}

R1= {(h,h)}

pre(h) =A2 A A Z2

post(h)(A2) =

I

pOSt(h)(Gz) =

I

als p e P \ {A2, Gz}, dan post(hXp) =p

Ook flu kan het Kripke model aangepast worden:

actie h OZT OTZ

TZO -- - -

TOZ

Het resulterende Kripke model is:

OZT

TZO

ZOT

ZTO

OzT(OZT,h)

OTZ (OTZ, h)

TZO (TZO, h)

TOZ (TOZ, h)

(18)

Nee antwoorden: Speler 2 zegt dat hij kaart Z met heeft.

6h

H = {h}

R= {(h,h)}

pre(h) =A2 A

G

A —1Z2

post(h)(A2) =

J

post(h)(Gz) =-L post(h)(B,) =

J

post(h)(B2) =T

als p P \ {A2,Gz, B1, B2}, dan post(hXp) =p

Als het antwoord nec was geweest in plaats vanja, dan was dit het resultaat:

actie h

OZTJ

OTZ TZO

TOZ (TOZ, h)

Het resulterende Kripke model is:

OTZ TOZ

Winnen: Speler 1 wint

6h

H = {h}

R={(h,h))

pre(h) =B1 A(CZ1 v C-,Z1) A(CZ2 v C-1Z2) A (CZ3v C-,Z3)

A (CO1

v

C-,01) A (CO2

v

C-102)A(CO3

v

C-O3)

A (CT1 v C-,T1) A (CT2v C-T2) A (CT3v C-T3) post(h)(Wi) =T

alsp E P\ {W1},danpost(h)(p)=p

Een speler kan pas winnen als het Kripke model nog maar één toestand bevat. Het moet namelijk voor alle spelers duidelijk zijn wie welke kaart heeft. Er kan geen toestand meer verwijderd worden, maar één propositioneel atoom verandert door de actie Winnen wel van waarde.

Hier is nog geen rekening gehouden met het weggeven van kaarten, dit kan wel heel

makkelijk en de preconditievan winnen wordt dan veel korter. (B1 AZ1 A

0

A Ti)

(19)

2.6 De spelboom

Dc tot nu toe gebruikte modellen zeggen jets over de kennis van de spelers op een bepaald tijdstip in het spel. Er moet een andere structuur gebruikt worden om jets te kunnen zeggen over het spelverloop, de kansen om te winnen en uiteindelijk over strategieen. Namelijk een structuur die het spelverloop weergeeft. Een voorbeeld van zo'n structuur is een spelboom.

Een spelboom bevat informatie over wie wat kan doen en wanneer, en wie hoeveel krijgt als het spel voorbij is. (Zie Binmore, [3])

Aan het begin van het spel worden de kaarten verdeeld. Dc spelers zjen direct welke kaart ze zelfhebben, maar weten niet hoe de andere kaarten verdeeld zijn.

Een vraag wordt dan weergegeven, zoals in figuur 2.8(a) is aangegeven. Dc cijfers bij de knopen geven weer welke speler aan de beurt is. Het eerste deel geeft de vraag weer en het tweede deel het antwoord. Speler I mag een vraag stellen. In dit geval vraagthjj kaart 0 aan speler 3. Speler 1 weet bjj het stellen van deze vraag niet of hij in de situatie zjt waarin speler 3 kaart 0 heeft of in de situatie waarin speler 3 kaart 0 met heeft. (Dit wordt weergegeven door de gestreepte lijn.) Vervolgens moet speler 3 antwoord geven. Hij moet eerlijk zeggen of hij de kaart wel of niet heeft (j of n). Het is nu lastig te zeggen welke speler aan de beurt is, de speler die de vraag gesteld heeft of de speler die antwoord moet geven. Bij de actiemodellen heb ik er voor gekozen de speler die de vraag gesteld heeft aan de beurt te laten blijven.

Vandaar dat ik dat hier flu weer doe. In de situatie waarin speler 3 de kaart heeft, blijft speler 1 aan de beurt. In de andere situatie is speler 3 aan de beurt.

Het representeren van een vraag en een antwoord hoort officieel zoals in figuur 2.8(a). In figuur 2.8(b) staat een eenvoudiger manier, die wel everiveel informatie bevat. Deze manier zal verder gebruikt worden.

1

I

0(3) 0(3)

1 1

j n

1 3 1

(a) (b)

2.8. Deel van een spelboom.

Ook hier geven de cijfers bij de knoperi aan welke speler op dat punt aan de beurt is. Het eerste dee! geeft de vraag weer en het tweede dee! het antwoord met een ja-dee! en een nec- dccl. Het tweede deel is gestreept, omdat er anders gesuggereerd wordt dat iemand eenkeuze

heeft op dat punt en dat is niet zo. Elke knoop correspondeert met een

(verschillend) kennismodel. Een vraag wordt weergegeven door de naam van de kaart, waarbij tussen haakjes het nummer van de speler waaraan de kaart gevraagd wordt, staat.

In principe moet bij elke knoop een bepaa!de speler aan de beurt zijn. Net werd gezegd, dat de speler die aan de beurt is ook na het stellen van de vraag aan de beurt is. Er is echter nooit sprake van een keuze voor één van de spelers op dat punt. Vandaar dat er geen cijfer meer bij de knoop staat. Het punt correspondeert we! met een bepaald kennismodel.

(20)

We hebben net al gezien dat na het stellen van de eerste vraag al bepaald is wie wint, namelijk de speler die dan aan de beurt is. Als voor elke vraag een apartetak wordt gemaakt, zal de boom erg groot worden. Zelfs bij dit eenvoudige voorbeeld ontstaat al een grote boom. Dit is echter helemaal met nodig. Voor de speler die begint maakt het niet uit welke vraag hij aan het begin stelt. De kans dat het antwoord ja is, is voor elke vraag even groot. Deze vragen kunnen flu samengenomen worden als zijnde één type vraag.

DEF1NITIE: Twee vragen zijn van hetzelfde type als de kennismodellen na de antwoorden door permutaties van spelers en/of kaarten gelijk aan elkaarzijn.

Vraag: q is een paar (x, d(y))

x,yEA xenyzijnspelers

dED diseenkaart

Vraag met antwoord: (q, b) b E (j, n)

qI

het resultaat (een model) van vraag q in model M

qi M

q2"qi en q2 hebben hetzelfde type m.b.t. model M"

qi M

q2 : eris een bijectie p: A—*A, D—÷D met

p(lI) = )q2I

A

p(q1,bI) = )q2,b1

De speler die aan de beurt is, moet ook gelijk zijn:

b=j: p(x)=x

b=n:

p(y)=y

Het gevoig van de bijectie:

Als speler k in toestand s kaart d heeft, dan heeft de omgenoemde speler de omgenoemde kaart:

s(d) =k => s(p(d)) = p(k)

UITLEG: Als de namen van twee kaarten omgewisseld zijn, dan is het spelverloop daarna wet hetzelfde. Als in het hierboven genoemde voorbeeld speler 2 kaart T had gehad en speler 3 kaart 0 en speler I had naar kaart T gevraagd i.p.v. naar kaart 0, dan had dat niks uitgemaakt voor het spelverloop. Ook in het model zou het enige verschil de naam van de kaart zijn. Bij personen geldt ongeveer hetzelfde. Als deze omgewisseld zijn, is het spelverloop verder ook hetzelfde. Hier moet echter ook gelet worden op de speler aan de beurt is. Als de speler die aan de beurt is bij het omgewisselde paar hoort, dan moet juist de andere aan de beurt zijn. In

het model moeten ook de relaties tussen de werelden voor de

omgewisselde spelers omgewisseld zijn.

Er zijn flu twee mogelijkheden om de boom te vormen. Dc eerste mogelijkheid is dat er voor een vaste wereld gekozen wordt, bijvoorbeeld ZOT. Er wordt dan uitgegaan van een gepunt Kripke model. De tweede mogelijkheid is dat er geen vaste wereld gekozen wordt, maar dat deze in de loop van het spel wordt gevormd. Deze manier is meer rekenwerk, omdat er voor elke kaart die de speler zeif zou kunnen hebben alle vragen bekeken moeten worden. Hier wordt uitgegaan van een ongepunt Kripke model. Beide manieren zullen nu bekeken worden.

(21)

Als ZOT als de werkelijke wereld genomen wordt, ontstaat de boom van figuur 2.9. We gaan er van uit dat de spelers geen vragen stellen waarvan ze weten dat het antwoord nec zal zijn.

Elke kaart moet aan de juiste persoon gevraagd zijn, voordat eenspeler geworinen heeft.

Het zou flu mogelijk tactisch kunnen zijn een vraag te stellen waarop het antwoord zeker nec zal zijn. Dit komt dan overeen met de beurt doorgeven. Als iedereen al weet dat die speler die kaart niet heeft en dat jij hem ook met hebt, dan geefje geen informatie over je zeif weg en van de vraag van de volgende speler kun je jets leren. Dit is waarschijnlijk met verstandig, maar kan het uitgesloten worden?

Bij het vraag dccl van de boom staat flu jets van de volgende vorm OIT(2/3). Dit geeft meerdere vragen weer dje van hetzelfde type zijn. O/T(2/3) staat voorkaart 0 aan speler 2 of speler 3, of kaart T aan speler 2 of speler 3. Om de boom te kunnen berekenen moet na elk type vraag cen ja en een nec antwoord berekerid worden met de bijbehorende kennismodellen.

Daarom moet er steeds één vraag genomen worden waarmee het kennismodel en de rest van de boom verder berekend wordt. Deze vraag wordt met een uitroepteken weergegeven.

T(3

J

•h

1 wifit

2.9. Spelboom voor ecn spel met ZOT als wereld.

a

b

J ,,

!9E2)

"C d

g

1

m n

3 wint 3 wint

(22)

Dc kleine letters bij de knopen in figuur 2.9 corresponderen met de volgende kennismodellen:

a. figuur 2.3 h.

b. figuur 2.5 i.

c. figuur2.6 j.

d. figuur2.7 k.

e. ZOT 1.

f. ZOT m.

g. figuur2.7 n.

ZOT ZOT figuur2.7 ZOT ZOT ZOT ZOT

O/T(2/3) Z/T(2/3) Z/0(2/3)

!9(2)

J,

n

Z T(3) T Z(3)

Z 0(3) 0(3)

!T(3)

o

I wint

Z 0(3)

2

2 wint 2 wint

2.10. Spelboom met als uitgangspunt een ongepunt Kripke model.

(23)

Het maken van een spelboom wordt jets lastiger als er geen vaste wereld gekozen wordt. Nu kan niet aangenomen worden dat de speler die aan de beurt is een bepaalde kaart heeft, maar moet er gekeken worden welke kaarten hij zou kunnen hebben en die situaties moeten allemaal bekeken worden. De enige aanname is dat speler 1 begint.

Dit betekent dat speler 1 aan het begin kaart Z, 0 of T kan hebben. Als hij kaart Z heeft, kan hij kaart 0 of kaart T aan speler 2 of speler 3 vragen. Als hij kaart0 heeft, kan hij kaart Z of kaart T aan speler 2 of speler 3 vragen en als hij kaart T heeft, kan hij kaart Z of kaart 0 aan speler 2 of speler 3 vragen. Zowel de positieve als de negatieve antwoorden op deze vragen zijn allemaal door permutaties van spelers en/of kaarten gelijk. Het blijft dus één type vraag.

De spelboom die dan ontstaat, staat in figuur 2.10. Bij de mogelijke vragen wordt flu de kaart die de speler zeif heeft vermeld en vervolgens de dan mogelijke vragen. Z 0(2/3) betekent dus dat als de speler kaart Z heeft, kan hij kaart 0 vragen aan speler 2 of speler 3.

De twee verschillende soorten spelbomen zijn wat vorm betreft precies hetzelfde. De

spelboom zonder vaste wereld als uitgangspunt lijkt meer op de echte situatie, maar blijkt flu toch eenzelfde soort boom op te leveren. Dit is natuurlijk wel een vereenvoudigde versie van het echte kwartetspel, maar waarschijrilijk is het wel de moeite waard om te kijken of bij een uitgebreidere versie een spelboom met een vaste wereld wederom hetzelfde resultaat oplevert.

Het maken van een spelboom met als uitgangspunt een gepunt Kripke model scheelt erg veel rekenwerk.

2.7 Kansen

Het is de bedoeling op basis van de gegenereerde spelboom kansen aan het spel toe te kennen.

Uiteindelijk kan dan besloten worden wat een speler in een bepaalde situatie moet doen, zodat de kans om te winnen zo groot mogelijk is.

Uit de boom kan direct het volgende afgeleid worden. Als speler 1 bij zijn eerste vraag de goede vraag stelt, dan heeft hij gewonnen. Als hij verkeerd gokt, zal hij niet meer winnen.

In dit geval kunnen de kansen eenvoudig beredeneerd worden. Speler I mag beginnen met het stellen van een vraag. Hij kan deze vraag aan speler 2 of speler 3 stellen. Als de ene speler de

kaart niet heeft, moet de andere hem wel hebben. De kans dat de gevraagde speler de

gevraagde kaart heeft is dus Y2. Als de gevraagde speler de gevraagde kaart niet heeft, dan wint hij. Voor speler 1 maakt het niet uit of hij een vraag stelt aan speler 2 of aan speler 3.

Voor beiden is de kans dus even groot dat ze gevraagd worden. Hieruit volgt dat de kans dat speler 1 wint V2 is en voor de andere twee spelers V4. In de boom van figuur 2.11 staan de kansen vermeld. De dubbele lijnen geven aan dat dat type vraag de beste keuze is. Alle vragen hebben echter dubbele lijrien, dit houdt in dat er nog geen mogelijkheid tot een echte keuze tussen verschillende typen vragen is.

(24)

2.11. Spelboom voor een spel zonder vaste wereld met kansen.

In dit geval zijn de kansen gemakkelijk te beredeneren. Als

dit niet het geval is, kan

Zermelo's algoritme gebruikt worden om kansen aan een spel toe te kennen. Dit algoritme werkt als volgt:

Elke knoop van een spelboom kan opgevat worden als een sub-spel. Je moet beginnen bij het kleinste sub-spel, dus aan het eind van het spel. Bij dit sub-spel verdubbel je de lijnen van de optimale keuze voor de speler die aan de beurt is op dat punt. Vervolgens doe je of de niet- verdubbelde lijnen niet bestaan en ga je kijken naar een knoop hoger. Ook hier verdubbel je weer de lijnen van de optimale keuze en zo werk je terug naar het begin van het spel.

Wanneer er sprake is van kansen (zoals bij kwartetten het geval is) moet er voor elke speler in elke knoop worden bijgehouden wat voor hem de kansen zijn om te winnen. Bij een punt waar sprake is van kansen, moeten de kansen op de thicken vermenigvuldigd worden met de kansen die daarna gelden. (Zie Binmore, [3])

ITa

Z 011'(2/3) 0 Z/T(2/3) T Z/0(2/3)

2

Z T(3) T Z(3)

ZT(1)

II II

Z 0(3) 0(3)

II U

i:: I ,T(3s)siII

us

'I

1 wint

SI SI

1

T( 1 )

2? j

N N N N N

!0(3)

J2

ZT(1) TZ(1) Z 0(3)

k1

SI

II

IS N

ill!

SI IS IS SI

m.

IS

2 wint

I

r:!T(1)

2 wint

(25)

Zermelo's algoritme is eigenlijk bedoeld voor spellen van perfecte informatie, dat wil zeggen voor spellen waarbij alle spelers

precies weten hoe het spel ervoor staat. Schaken is bijvoorbeeld een spel van perfecte informatie. Kwartetten is een

spel van imperfecte informatie. De spelers weten namelijk niet welke kaarten de andere spelers hebben. Door de kansen als zetten tij dens het spel te representeren, kan Zermelo's algoritme wel toegepast worden op de spelboom van figuur 2.10.

Er zijn een aantal voorwaarden voor het op de juiste manier berekenen van de kansen.

Verschillende vragen van hetzelfde type hebben allemaal evenveel kans om gesteld te worden en elke toestand in een model heefI evenveel kans om de werkelijke wereld te zijn. Dc kans dat het antwoord ja is OP een vraag kan als volgt berekend worden: Kijken in hoeveel toestanden een speler de vraag zou kunnen stellen, afhankelijk van de kaart die hij zeif heeft, dan kijken in hoeveel van de toestanden het antwoord ja oplevert.

Het toepassen van Zermelo's algoritme op de boom van figuur 2.11 gaat als volgt. In knoop m en knoop n heeft speler 2 gewonnen. Dc kans om te winnen voor speler 2 is in beide punten I en voor de overige spelers is de kans 0. In knoop h heeft speler 1 gewonnen. Hier is voor speler 1 de kans om te winnen I en voor de andere twee spelers 0. Als we bij knoop m een knoop hoger gaan kijken dan komen we bij knoop k. Knoop k heeft maar één tak, de kans op deze tak moet dus wel 1 zijn en de kansen om te winnen zijn in knoop k dus gelijk aan de kansen in knoop m. Hetzelfde geldt als we nog een knoop hoger gaan kijken en weer als we nog een knoop hoger gaan kijken. We zijn flu bij knoop f. Van knoop n naar knoop g geldt hetzelfde verhaal. De kans om te winnen voor speler 2 is in knoop g 1 en voorde overige spelers 0.

Als we nu een knoop hoger gaan kijken dan is dat knoop d. In knoop d is speler 2 aan de beurt. Hij heeft twee mogelijkheden, namelijk een kaart aan speler 1 vragen of één aan speler 3. In beide gevallen is de kans dat hij wint even groot (namelijk 1). Beide lijnen worden flu verdubbeld en de kansen na beide takken (die in knoop f en knoop g) worden gemiddeld. In knoop d is de kans om te winnen voor speler 2 nog steeds 1 en voor de anderen nog steeds 0.

In knoop e en knoop c is de kans gelijk aan de kans in knoop h, namelijk 1 voor speler 1 en voor de andere twee 0.

Nu komen we bij knoop b. Dc kansen op de sub-takken zijnbepaald door de kans dat het antwoord op een bepaalde vraag ja is. In dit geval is de kans dat het antwoord op de vraag ja is /2. Dckansen om te winnen voor de verschillende spelers is in knoop b '/2 keerde kansen in knoop d en '/2 keerde kansen in knoop c. Dc kans voor speler I is gelijk aan die van speler 2, namelijk '/2 ende kans voor speler 3 is 0.

De laatste stap is het lastigst. Vanaf knoop a is er slechts

één sub-tak, maar deze tak representeert meerdere vragefl. De kans dat de vraag aan speler 2 of aan speler 3 gesteld wordt is even groot. In de boom is bij de verdere berekening ervan uit gegaan dat de vraag aan speler 2 werd gesteld. De kansen in knoop a zijn flu een half keer de kansen die al berekend zijn voor knoop b en een half keer die kansen, maar dan de kansen van speler 2 en speler 3 omgedraaid. Voor speler 1 is dit ('/2 x V2) en nog een keer ('/2 x 'A), dit is dus '/2. Voorspeler 2

is dit (Y2 x 0) + ('/2x '/2), is '/4. Voorspeler 3 is het (Y2 x 'A) + (V2x 0), is ook ¼. Deze kansen zijn gelijk aan de kansen die hierboven al beredeneerdwaren.3

Bij een gepunt Kripke model is de laatste stap jets lastiger, omdat er bij het ja- ennee-deel niet voor dezelfde vraaggekozenkan worden.

(26)

3. VIER SPELERS, VIER KAARTEN

Bij een spel met drie spelers is het spel niet zo interessant, omdat er na een vraag direct duidelijk is wie de gevraagde kaart heeft. Ook als het antwoord nee is, dan is het duidelijk dat de speler die gevraagd heeft en de speler die geantwoord heeft de kaart met hebben. ledereen kanflu afleiden dat de andere speler de kaart we! moet hebben. Bij een spe! met vier spelers is dit niet het geval, omdat één van de twee andere spe!ers de kaart heeft (de vrager en de

antwoorder weten met wie de kaart heeft, de andere twee spelers we!).

3.1 Het model

Een echt kwartet bestaat uit vier kaarten. We gaan flu kijkeri naar eeri spe! met vier spelers en vier kaarten. Naast de kaarten Zeehond, Olifant en

Tijger hebben we nu ook de kaart

Nijlpaard. Deze kaarten kunnen op 24 manieren verdeeld worden. In plaats van het Hexa mode! ontstaat er een geknotte kubus (of een geknotte octaëder) (zie figuur 3.1). Bij de relaties tusseri de verschillende werelden staat met weergegeven voor wie ze gelden, omdat het plaatje daar erg onduidelijk door zou worden. Ook zijn met a!le relaties tussen werelderi weergegevefl, omdat ook dan het p!aatje ergonduidelijk zou worden.

3.1. Het 4 spelers 4 kaarten model

(27)

Richtingen van lijnen/kanten in figuur 2.3 staan voor de toegankelijkheidsrelaties tussen verschillende werelden voor een bepaalde speler. Zo geven de horizontale lijnen infiguur 2.3 toegankelijkheidsrelaties voor speler 3 weer. In figuur 3.1 staat de richting van een viak voor de werelden die voor een bepaalde speler voorstelbaar zijn. Tussen alle werelden in dat viak zijn toegankelijkheidsrelaties voor die speler. Dit is bijvoorbeeld te zien in figuur 3.2. Het daar vetgedrukte dee! geeft een viak weer voor speler 1. Deze werelden zijn voorstelbaar voor speler 1 als hij kaart T heeft. Alle andere vlakken met dezelfde richting geven ook werelden weer die tegelijk voorstelbaar zijn voor speler 1, maar dan gegeven dat speler 1 een andere kaart heeft. Elke speler heeft zo zijn eigen richting. Als een wereld voorstelbaar is voor een bepaalde speler, dan zijn ook alle andere werelden in het viak met die richting voorstelbaar

voor die speler.

3.2 De eerste vraag

Om een idee te krijgen hoe de kennis beInvloed wordt door bepaalde vragen, volgt een voorbeeld van de eerste vraag. Stel dat speler 1, die mag beginnen, een vraag stelt over kaart

T. Na deze vraag weet iedereen dat spe!er 1 kaart T met heeft. In

figuur 3.2 geeft de vetgedrukte zeshoek de werelden weer waarin speler 1 kaart T heeft.

3.2. De werelden waarin speler I kaart T heeft en de relaties daartussen zijn vetgedrukt

(28)

Na het stellen van de vraag is deze zeshoek voor niemand meer voorstelbaar, dat betekent dat de zes punten en alle lijnen naar deze punten verdwijnen (figuur 3.3).

Als je goed naar het vetgedrukte deel van figuur 3.2 kijkt, zie je dat dit een Hexa model is. Dit is makkelijk te verkiaren, omdat er van de vier kaarten één aan een bepaalde speler is toegekend. Dan blijven er nog drie kaarten over om aan de drie andere spelers toe te kennen en dat is het Hexa model. In figuur 3.3 worden voor de duidelijkheid nog steeds niet alle lijnen weergegeven.

3.3. Speler 1 heeft naar kaart T gevraagd.

3.3 Het antwoord op de eerste vraag

Als speler 1 de vraag aan speler 2 heeft gesteld en speler 2 heeft deze kaart niet, ontstaat het model van figuur 3.4. Speler 2 kan geen onderscheid maken tussen speler 3 en speler 4. Hij kan ook geen onderscheid maken tussen kaart Z en kaart N. Over deze kaarten en aan deze spelers is namelijk nog niks gevraagd.

In figuur 3.4 worden alle relaties weergegeven, maar niet voor wie ze gelden. Uit het plaatje blijkt wel waarom. Vetgedrukt zijn de lijnen van de oorspronkelijke figuur (figuur 3.1), hieraan kan nog emgszins de vorm afgeleid worden.

(29)

3.4. Speler 2 heeft kaart T ook niet.

Als speler 2 kaart T wel heeft, ontstaat het Hexa model weer (figuur 3.5),omdat wederom één van de vier kaarten aan één bepaalde speler is toegekend. Er is nog steeds alleen maar informatie over kaart T.

ZTON M OTZN

ZTNO 21 NTZO

__

OTNZ 24 NTOZ

/2

3.5. Het Hexa model

In een aantal van de bovenstaande modellen zijn niet alle relaties tussen alle werelden weergegeven. Dit maakt niet uit, omdat het model met alle relaties afgeleid kan worden van de losse werelden. Het kennismodel ligt vast door de punten. Alle kanten zijn daar van afgeleid. Alle nieuwe kennis is namelijk publiek. Alle spelers kunnen zowel de vragen als de

(30)

antwoorden horen. Als speler 1 aan speler 2 vraagt of hij kaart Z heeft, dan weet iedereen dat speler I kaart Z niet heeft. En wanneer speler 2 antwoordt, weet iedereen of speler 2 kaart Z heeft. Bij de modellen houdt dit in dat er nooit eentoegankelijkheidsrelatie voor één speler verdwijnt, maar altijd de relaties voor alle spelers. Dc wereld verdwijnt namelijk.

Vanaf dit moment wordt er niet meer met de modellen gewerkt, maar met de losse werelden.

Bet model van figuur 3.5 ziet er flu als volgt uit: ZTON, OTZN, ZTNO, NTZO, O1'NZ, NTOZ. Deze werelden worden vanafnu ook we! de kennistoestand genoemd.

3.4 ZOTN als 'echte' wereld

hi hoofdstuk 2.3 zijn twee verschillende manieren besproken om een spelboom te maken. We hebben gezien dat deze twee marneren bij drie spe!ers en drie kaarten hetzelfde resultaat opleveren. Aangezien de manier met als uitgangspunt een gepunt Kripke mode! minder rekenwerk oplevert, wordt deze methode flu eerst bekeken.

Als uitgangspunt voor deze spelboom wordt weer een vaste kaartverde!ing genomen, namelijk speler I heeft kaart Z, speler 2 heeft kaart 0, speler 3 heeft kaart T en spe!er 4 heeft kaart N (of kortweg ZOTN). In dit geval wordt er vanuit gegaan dat voor elk type vraag waar het antwoord ja op is, er een soortge!ijke vraag bestaat, waar het antwoord nee op is en andersom.

Zoals in de bovenstaande figuren te zien is zijn de kennismodellen voor vier spelers en vier kaarten a! rede!ijk complex. Om er zeker van te zijn dat er geen fouten gemaakt zijn bij het berekenen van de nieuwe kennismodellen (in de loop van het spe!) heb ik daarvoor een computerprogramma geschreven. Dit programma bepaalt welke vragen er op een bepaald moment gesteld kunnen worden en hoe de kennistoestanden er na de antwoorden (ja en nee) op deze vragen uit zien. Ook bekijkt het programma welke vragen door permutaties van spelers en/of kaarten gelijk aan e!kaar zijn.

Door dit programma b!eek a! snel dat deze methode niet werkt. Aan het einde van de takken zijn er niet meer twee 'gelijke' vragen. Dit houdt in dat er dan een vraag ontstaat waar alleen een ja of een nee antwoord op is, maar de kans op dat antwoord is dan ongelijk aan één. Hier vail niet verder mee te rekenen.

Er zijn situaties waarin er een kans is dat de speler die aan de beurt is precies weet hoe de kaarten verdeeld zijn, maar er is ook een kans dat bij dit nog niet weet, athankelijk van de wereld waar vanuit gegaan wordt. A!s beide situaties bereikt kunnen worden door vragen van hetzelfde type, dan gaat het berekerien van de spelboom door het programmaniet he!emaal goed.

Bijvoorbeeld, de mogelijke werelden zijn ZOTN, ZION, ZTNO, ZNTO, OZTN, OTZN, OTNZ, ONTZ, NZTO, NOTZ, NTZO en NTOZ en speler 4 is aan de beurt. In het geval dat ZOTN de echte wereld is en speler 4 vraagt kaart Z aan speler 2, waarop het antwoord nee is, dan is speler 2 aan de beurt en weet hoe de kaarten verdeeld zijn. Als kaart Z aan speler 3 gevraagd wordt, dan is speler 3 aan de beurt, maar deze weet nog niet hoe de kaarten verdeeld zijn. De werelden die overblijven na het stellen en beantwoorden van de vraag zijn door permutatie echter wel aan elkaar ge!ijk en worden als één type vraag gezien. Deze situatie is sowieso lastig en wordt uitgebreid behandeld in 3.6.

3.5 Geen vaste wereld

Aangezien de methode die uitgaat van een gepunt Kripke model niet werkt, wordt er flu van een niet gepunt Kripke model uitgegaan. Dit houdt in dat de kans op alle 24 werelden even groot is en dat bij elke vraag naar het ja- en het nee-antwoord van exact dezelfde vraag wordt gekeken. Er wordt van uit gegaan dat de spelers intelligent zijn en dus geen vragen stellen die

(31)

gezien hun kennis niet tot een positief antwoord kunnen leiden. Ms ze weten hoe de kaarten verdeeld zijn, dan winnen ze ook. Ook hiervoor heb ik een computerprogramma geschreven dat de spelboom berekent. (Dit programma staat in bijlage 4.)

Nu volgt een stap voor stap uitleg hoe het programma werkt.

1. Gegeven de kennistoestand kijk welke vragen de speler die aan de beurt is, zou kunnen stellen. (De speler die aan de beurt is, zou elke mogelijke kaart kunnen hebben).

2. Loop flu alle mogelijke vragen langs en voor elke vraag:

a. Bereken de kennistoestand na een positief antwoord en ook na eennegatief antwoord.

b. Als er nog geen tak gecreeerd is, creëer dan een meuwe tak en een nieuwe knoop voor deze vraag (en sla stap c, d en e over).

c. Als er al takken gecreëerd zijn, bereken dan voor de kennistoestanden alle mogelijke permutaties.

d. Kijk vervolgens of één van de permutaties identiek is aan één van de knopen van de takken.

e. Als dit het geval is, voeg dan de vraag toe aan de identieke tak. Als dit niet het geval is, creëer dan een nieuwe tak creëren.

3. Als dit voor alle vragen is gedaan, creëer dan voor elke nieuwe knoop het antwoord.

(Dit houdt in dat er over het algemeen twee takken gecreeerd worden. Eén voor de situatie waarin de gevraagde speler de gevraagde kaart heeft en één voor de situatie waarin hij die niet heeft. Als de speler die aan de beurt is naar een kaart vraagt, waarvan hij zeker weet dat de gevraagde speler die heeft, dan is er maar één talc) 4. Herhaal alle stappen (vanaf 1) voor deze takken tot er geen vragen meermogelijk zijn.

(Of tot ze geen nieuwe informatie opleveren, omdat de speler die aan de beurt is precies weet hoe de kaarten verdeeld zijn)

3.6 Een lastige situatie (splitsen)

Als er niet van een vaste wereld uitgegaan wordt, kan er een situatie ontstaan waarin bij een bepaalde kennistoestand, verschillende 'echte' werelden verschillende gevolgen voor het verdere spelverloop hebben. Dit kan het beste uitgelegd worden aan de hand van een voorbeeld.

Stel, speler 3 is aan de beurt en de volgende werelden worden voor mogelijk gehouden:

ZNOT, TZON, TZNO, TNZO, TNOZ, NZOT.

De vragen die speler 3 kan stellen zijn:

AlshijkaartZheeftTaan 1,Naan2enOaan4.

Als hij kaart 0 heeft Z aan 1, T aan 1, N aan 1, Z aan 2, N aan 2, 1 am 1, T aan 4, Z aan 4, T

aan4enNaan4.

AlshijkaartNheeftTaanl,Zaan2enOaan4.

In het geval dat TZNO of TNZO de echte wereld is, dus wanneer speler 3 kaart N of kaart Z heeft, dan weet hij hoe de kaarten verdeeld zijn. In het geval dat speler 3 kaart 0 heeft, weet hij het nog niet. Dit heeft gevolgen voor de vragen die gesteld kunnen worden. In het geval dat speler 3 kaart 0 heeft, kan hij kaart Z aan 1 vragen. Als hij kaart N of Z heeft, zal hij deze vraag niet stellen, omdat hij weet dat speler I kaart Z niet heeft. Er is ook geen soortgelijke vraag (een vraag die dezelfde kennistoestand oplevert).

(32)

De hierboven beschreven situatie is ontstaan doordat speler I een vraag heeft gesteld over een bepaalde kaart (0) en speler 2 heeft nec geantwoord. Speler 2 heeft vervolgens een vraag over een andere kaart (T) gesteld aan speler 3 en deze heeft ook nec geantwoord.

Als hij zeif de kaart waarover speler 1 een vraag heeft gesteld niet heeft, kan hij het volgende afleiden: Speler 1 heeft die kaart niet, speler 2 heeft die kaart ook niet en ik zeif niet, dus speler 4 moet die kaart wel hebben. Speler 2 heeft de kaart waarover hij een vraag aan mij heeft gesteld niet, speler 4 heeft die kaart niet en ik ook niet, dus moet speler 1 die kaart wel hebben. Hij weet welke kaart hij zeif heeft en dan blijft er voor speler 2 nog maar een kaart over. Hij weet dus precies wie welke kaart heeft.

Als hij zeif echter de kaart heeft waarover speler 1 een vraag heeft gesteld, dan heeft speler 3 bij de eerste vraag nog geen extra informatie over de kaartverdeling. Nadat speler 2 zijn vraag gesteld heeft, weet speler 3 dat speler 1 of speler 4 die kaart moet hebben. Over de twee kaarten waarnaar niet gevraagd is, weet hij nog niks (alleen dat hij ze zelfniet heeft).

ZNOT TNZO TZNO TZON TNOZ NZOT

3.6 Dccl van de boom, als er gewoon doorgerekend wordt

4 ZNOT TZNO

TZON NZOT

Een zelfde vraag levert altijd dezelfde kennistoestand op, onafhankelijk van de kaart die de vrager zeif heeft. Toch bepaalt de kaart die de speler zeif heeft in welke situatie hij zit en welke werelden hij voor mogelijk houdt. Als in de bovenstaande situatie speler 3 kaart N heefi, dan weet hij zeker dat speler 1 kaart T heeft (de kans is 1). Als speler 3 kaart 0 heeft, dan weet hij niet zeker of speler 1 kaart T heeft (voor hem is de kans daarop Y2). Als de boom gewoon doorgerekend gaat worden, dan is het lastig de juiste kansen aan de antwoorden toe te kennen. Dit zou dan gedaan moeten worden door alle werelden te nemen waarin de speler die aan de beurt is zeif de gevraagde kaart niet heeft en te kijken hoe vaak het antwoord op de vraag ja zou zijn. Als speler 3 kaart T aan speler 1 vraagt dan is de kans dat het antwoord ja is 4/6.

Dc kans dat het antwoord ja is als kaart T aan speler 1 gevraagd wordt, is in de bovenstaande situatie dan 4/6. De kans dat het antwoord ja is als speler 3 kaart 0 aan speler 4 zou vragen is

1. Als speler 3 kaart Z heeft maakt het voor hem niet uit of hij kaart 0 aan speler 4 vraagt of kaart T aan speler 1, maar toch lij ken de kansen jets anders te zeggen. Dit wordt weergegeven in figuur 3.6. Dc schuingedrukte werelden zijn de werelden waarin de vraag niet gesteld zou zijn.

3

I'

I'

I

I'

'.

.5I ,

J,l

\fl

I S

S I

I I

3' 1 3'

TNZO ZNOT TZNO TZNO NZOT TZON

TZON NZOT

TNOZ ZNOT TZNO

TZON TNOZ NZOT

2

ZNOT TNZO TNOZ TZNO

ZNOT NZOT

TNZO TNOZ 1ZNO TZON TNOZ

Referenties

GERELATEERDE DOCUMENTEN

De linde heeft belang als achtertuinboom en voor de leefbaarheid, maar dit belang wordt verminderd doordat de aanvrager en de buren overlast ervaren. Een linde kan in

De begroeiingen dienen zo kort mogelijk boven het maaiveld te worden afgemaaid en op de plaatsen waar het maaisel hinderlijk is voor de opsporingswerkzaamheden dient dit te

[r]

Als gevolg van historische winning (niet boring) in de Bergen concessie is er veel data beschikbaar over de ondergrond rondom Bergen (via www.nlog.nl op te vragen) waar gebruik

1) Het onderhoud van de velden op sportpark Naarden wordt volledig door de gemeente verzorgd. De verenigingen hebben hier dus geen kosten aan.. 2) Bij deze sportparken komen alleen

tenzij anders aangegeven Inritband 500x160x500 mm, Opsluitband 200x200 mm.

tenzij anders aangegeven Inritband 500x160x500 mm, Opsluitband 200x200 mm.

tenzij anders aangegeven Inritband 500x160x500 mm, Opsluitband 200x200 mm.