• No results found

Complexiteit deterministische Markovbeslissingsketens

N/A
N/A
Protected

Academic year: 2021

Share "Complexiteit deterministische Markovbeslissingsketens"

Copied!
1
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Complexiteit deterministische Markovbeslissingsketens

Begeleider: Lodewijk Kallenberg

Bij Markov beslissingsketens hebben we niet te maken met ´e´en Markov keten, maar met een aantal Markov ketens. We zullen veronderstellen dat de ketens eindig veel toestanden hebben.

Formeel is het model als volgt:

- S is een eindige toestandsruimte, zeg S = {1, 2, . . . , N };

- in toestand i ∈ S wordt een actie uit een eindige actieverzameling A(i) gekozen;

- indien in toestand i actie a ∈ A(i) wordt gekozen, dan gebeurt het volgende: er is een directe opbrengst ri(a) en met overgangskans pij(a) is het systeem op het volgende beslissingstijdstip in toestand j.

Een (deterministische) strategie f is een beslisregel: het geeft aan welke actie in toestand i wordt gekozen; de actie die in toestand i wordt gekozen noteren we met f (i). Iedere stategie genereert een Markov keten met overgangsmatix P (f ), waarbij [P (f )]ij = pij(f (i)) voor alle i, j ∈ S.

Er zijn verschillende manieren om Markovbeslissingsketens te klassificeren: via het begrip com- municeren en via de ergodische structuur, bijvoorbeeld unichain. De vraag of een Markovbesliss- ingsketen tot een bepaalde deelklasse behoort kan in een aantal gevallen met een polynomiaal algoritme worden opgelost. Recentelijk, in 2007, is aangetoond dat de vraag of een Markovbesliss- ingsketens wel of niet unichain is een N P-moeilijk probleem is. Je kunt nu kijken naar een speciale subklasse van Markovbeslissingsketens, de deterministische ketens, waarin iedere overgangskans 0 of 1 is. Het vermoeden bestaat dat de klassificatie van deterministische Markovbeslissingsketens oplosbaar is met polynomiale algoritmen.

Het project houdt het volgende in:

1. Het en en ander bestuderen over Markovbeslissingsproblemen.

2. Eerder uitgezochte complexiteitszaken bestuderen.

3. Werken aan het complexiteitsprobleem van deterministische Markovbeslissingsketens.

Referenties

GERELATEERDE DOCUMENTEN

In 2007 hebben de Japanners Iki, Horiguchi en Kurano een waarde-iteratie methode voorgesteld voor multichain Markovbesliss- ingsketens.. Het project houdt het

Doordat het bestaan en de werking van interne controles en de VIC (de uitvoering dus) nog niet op het gewenste niveau zijn en kunnen zijn (het vergt immers een langere periode om

N RE Created for Crossings Community Church Christmas Eve Chapel Service Don Peslis, Worship Pastor... slowing to

[r]

het bezoek goed voor te bereiden, de juiste werkwijze te volgen, bij risicogesprekken de.. mobiele alarmknop

Alleen enkele wilde zwijnen, die waren dood gevonden op plekken waar AVP was uitgesloten door het testen van andere eerdere kadavers, zijn in overleg voor onderzoek aangeboden bij het

Het artificieel grondwater dat de bakken bevloeit, verandert van samenstelling. Vooral de nitraat en ammoniumconcentraties verschillen van de beginsituatie. Er is te veel nitraat

c) Een andere mogelijkheid om het probleem van b) op te lossen is met behulp van een ILP- formulering gebaseerd op klantenkringen; een klantenkring van centrum i is een verzame-