• No results found

Algoritmen voor multichain Markovbeslissingsketens

N/A
N/A
Protected

Academic year: 2021

Share "Algoritmen voor multichain Markovbeslissingsketens"

Copied!
1
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Algoritmen voor multichain Markovbeslissingsketens

Begeleider: Lodewijk Kallenberg

Bij Markov beslissingsketens hebben we niet te maken met ´e´en Markov keten, maar met een aantal Markov ketens. We zullen veronderstellen dat de ketens eindig veel toestanden hebben.

Formeel is het model als volgt:

- S is een eindige toestandsruimte, zeg S = {1, 2, . . . , N };

- in toestand i ∈ S wordt een actie uit een eindige actieverzameling A(i) gekozen;

- indien in toestand i actie a ∈ A(i) wordt gekozen, dan gebeurt het volgende: er is een directe opbrengst ri(a) en met overgangskans pij(a) is het systeem op het volgende beslissingstijdstip in toestand j.

Een (deterministische) strategie f is een beslisregel: het geeft aan welke actie in toestand i wordt gekozen; de actie die in toestand i wordt gekozen noteren we met f (i). Iedere stategie genereert een Markov keten met overgangsmatix P (f ), waarbij [P (f )]ij = pij(f (i)) voor alle i, j ∈ S.

Als minstens ´e´en zo’n Markov keten meerdere recurrente klassen heeft, dan spreken we van een multichain Markovbeslissingsketen. Voor dergelijke ketens bestond tot voor kort geen waarde- iteratie methode om de gemiddelde opbrengst te optimaliseren. In 2007 hebben de Japanners Iki, Horiguchi en Kurano een waarde-iteratie methode voorgesteld voor multichain Markovbesliss- ingsketens.

Het project houdt het volgende in:

1. Het en en ander bestuderen over Markovbeslissingsproblemen.

2. Het artikel van Iki, Horiguchi en Kurano (en enkele andere artikelen waarop dit gebaseerd is).

3. Een implementatie maken van deze methode.

Referenties

GERELATEERDE DOCUMENTEN

Het probleem van marktmacht heeft niet zo- zeer betrekking op onvolkomenheid in de prijsoverdracht, maar op de (overtollige) winstmarge tussen consumenten- en af-boerderijprijs.

Duidelijk zal zijn dat deze complexe pro- blematiek niet een, twee, drie, door het bestuur is op te los- sen.Zoals reeds gevraagd op de algemene ledenvergade- ring hierbij nogmaals

a) Begin een nieuwe algoritmenwerkmap. Noem die Kleuren. Maak een werkblad met 6 knoppen. De randen van deze knoppen moeten perfect op de randen van de cellen liggen. Hoe doe je

In this study we focused on government interventions in cereal markets in four East African countries (Ethiopia, Kenya, Tanzania and Uganda) in the context of high international

Deze Markovbeslissingsketens worden dan ook door dit algoritme geclassificeerd, want een gereduceerde graaf heeft minstens drie knooppunten, aangezien in een gereduceerde graaf de

De vraag of een Markovbesliss- ingsketen tot een bepaalde deelklasse behoort kan in een aantal gevallen met een polynomiaal algoritme worden opgelost.. Recentelijk, in 2007,

Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of

2) Getallen buiten de eenheidscirkel hebben modulus groter dan 1. Herhaaldelijk kwadrateren van deze getallen betekent ook herhaaldelijk kwadrateren van hun modulus, waardoor