4.2 Lineaire (on)gelijkheden en polyhedra
4.2.1 Theorie van de lineaire (on)gelijkheden
Beschouw de n-dimensionale Euclidische ruimte Rn met de Euclidische norm k · k. C ⊆ Rn heet convex indien voor alle x, y ∈ C en alle re¨ele getallen 0 ≤ λ ≤ 1 geldt:
λx + (1 − λ)y ∈ C.
Meetkundig gesproken betekent dit dat als twee punten tot C behoren het lijnsegment dat deze punten verbindt (dit wordt ook wel de convexe combinatie van deze punten genoemd) ook tot C behoort.
Een extreem punt x van een convexe verzameling C is een punt dat geen convexe combinatie is van twee verschillende punten van C. Een d 6= 0 heet een richting van een convexe verzameling C als voor iedere x ∈ C geldt dat
x + λd ∈ C voor iedere λ ≥ 0.
Een begrensde verzameling heeft dus geen richtingen. Een extreme richting van C is een richting van C die geen positieve combinatie is van twee verschillende richtingen van C.
Een hypervlak is een verzameling van punten x die voldoen aan a1x1+ a2x2+ · · · + anxn= a0 voor zekere gegeven re¨ele getallen a0, a1, . . . , an.
Een kegel is een verzameling C waarvoor geldt dat als x ∈ C, dan ook λx ∈ C voor alle λ ≥ 0. Stelling 4.1 (Stelling van het scheidende hypervlak)
Zij C ∈ Rn een gesloten convexe verzameling en x /∈ C.
Dan is er een scheidend hypervlak, d.w.z. er bestaan re¨ele getallen a0, a1, . . . , an zdd. a1x1+ a2x2+ · · · + anxn> a0 en a1y1+ a2y2+ · · · + anyn< a0 voor alle y ∈ C.
Bewijs
Het idee van het bewijs is om eerst het punt van C te bepalen dat het dichtst bij x ligt, zeg z, en dat dan het hypervlak dat loodrecht op x − z staat en door het midden van het lijnsegment [x, z] gaat, voldoet.
De uitwerking van dit idee is als volgt formeel op te schrijven. De continue functie
f (y) = kx − yk2
neemt op een compacte verz. een minimum aan. Kies een y∗ ∈ C en laat B = {y | ky − xk2≤ f (y∗)}.
Dan is C ∩ B een compacte verz. waarop f (y) zijn minimum aanneemt, zeg in het punt z (z is dan het punt van C dat het dichtst bij x ligt). Omdat C convex is, ligt voor iedere y ∈ C en iedere 0 ≤ λ ≤ 1 ook λy + (1 − λ)z ∈ C, zodat geldt:
kx − zk2 ≤ kx − {λy + (1 − λ)z}k2 = k(x − z) − λ(y − z)k2, waaruit volgt dat
−2λ(x − z, y − z) + λ2(y − z, y − z) ≥ 0 voor alle y ∈ C en alle λ ∈ [0, 1].
Dus is (x − z, y − z) ≤ 0 voor alle y ∈ C. Laat a = x − z, dan geldt: a 6= 0 en (a, y) ≤ (a, z). Neem a0 = 1 2 ½ (x, a) + (z, a) ¾ = 1 2 ½ (a, a) + 2(z, a) ¾ . Omdat (a, a) > 0 geldt
(x, a) = (a, a) + (z, a) > 1
2(a, a) + (z, a) = a0> (z, a) ≥ (y, a) voor alle y ∈ C. Stelling 4.2
Laat T = {y ∈ Rn | (x, y) ≤ 0 voor alle x ∈ S} met S een niet-lege verz. in Rn. Dan is T een gesloten convexe kegel.
Bewijs
Indien y, z ∈ T , dan geldt: (x, y) ≤ 0 en (x, z) ≤ 0 voor alle x ∈ S. Dus ook (x, λy + (1 − λ)z) = λ(x, y) + (1 − λ)(x, z) ≤ 0 voor alle λ ∈ [0, 1].
Tevens geldt (x, λy) = λ(x, y) ≤ 0 voor alle λ ≥ 0. Dus T is een convexe kegel. Indien yk ∈ T, k = 1, 2, . . . en limk→∞yk = y, dan geldt
(x, y) = n X i=1 xi( lim k→∞yik) = lim k→∞ n X i=1 xiyik≤ 0, dus T is ook gesloten.
Voor een kegel C ⊆ Rn defini¨eren we de duale kegel C∗ door
C∗= {y ∈ Rn | (x, y) ≤ 0 voor alle x ∈ C}. Uit Stelling 4.2 volgt dat C∗ een gesloten convexe kegel is.
Stelling 4.3
Indien C een gesloten convexe kegel is, dan geldt dat de duale van de duale kegel gelijk is aan C, d.w.z. (C∗)∗ = C.
Bewijs
Volgens de definitie van duale kegel geldt C∗ = {y | (x, y) ≤ 0 voor alle x ∈ C}. Uit de symmetrie van het inwendig product geldt voor x ∈ C dat (y, x) ≤ 0 voor alle y ∈ C∗.
Omdat (C∗)∗ = {z | (y, z) ≤ 0 voor alle y ∈ C∗}, zien we dat x ∈ C impliceert dat x ∈ (C∗)∗ en dus geldt: C ⊆ (C∗)∗.
Via een tegenspraak zullen we nu aantonen dat (C∗)∗ ⊆ C. Laten we veronderstellen dat z ∈ (C∗)∗ en z /∈ C. Volgens de Stelling van het scheidende hypervlak zijn er re¨ele getallen a0, a1, . . . , an zdd.
a1z1+ a2z2+ · · · + anzn> a0 en a1x1+ a2x2+ · · · + anxn< a0 voor alle x ∈ C. (4.7) Omdat de nulvector tot C behoort, geldt dat a0 > 0. Stel dat er een x ∈ C bestaat zdd. (a, x) > 0. Dan geldt voor λ groot genoeg dat (a, λx) > a0, wat in tegenspraak is met (4.7). Dus (a, x) ≤ 0 voor alle x ∈ C, zodat geldt a ∈ C∗. Volgens de definitie van (C∗)∗ volgt hieruit dat (a, z) ≤ 0. Dit is echter in tegenspraak met (4.7).
In de lineaire optimalisering werken we met convexe veelvlakkenkegels. Zij A = (aij) een m × n-matrix met re¨ele elementen, dan is C = {x | Ax ≤ 0} een convexe veelvlakkenkegel. Met Ax ≤ 0 bedoelen we dat iedere component van de m-dimensionale vector Ax kleiner dan of gelijk aan nul is. De zijvlakken van C zijn de hypervlakken {x ∈ Rn | (ai•, x) = 0}, waarbij ai• de vector behorend bij de i-de rij van A is.
Stelling 4.4
De convexe kegels {x | Ax ≤ 0} en {y | y = ATu; u ≥ 0} zijn elkaars duale. Bewijs
Zij C = {y | y = ATu; u ≥ 0}. Volgens Stelling 4.3 is het voldoende om aan te tonen dat C∗ = {x | Ax ≤ 0}. Per definitie geldt C∗ = {x | (y, x) ≤ 0 voor alle y ∈ C}, waaruit volgt dat
C∗ = {x | yTx ≤ 0 voor alle y = ATu met u ≥ 0} = {x | uTAx ≤ 0 voor alle u ≥ 0} = {x | Ax ≤ 0}.
Gevolg 4.1 (Stelling van Farkas, 1902)1
De vector p ∈ Rn maakt een niet-scherpe hoek met iedere vector van de convexe veelvlakkenkegel C = {x | Ax ≤ 0} d.e.s.d. als p = ATu voor zekere u ≥ 0, ofwel:
p behoort tot de duale kegel C∗ d.e.s.d. als p = ATu voor zekere u ≥ 0.
De Stelling van Farkas kan ook worden geformuleerd als een keuze tussen twee alternatieven: `ofwel er is een u ≥ 0 zdd. ATu = p, `ofwel er is een x zdd. Ax ≤ 0 en pTx > 0.
Met de Stelling van Farkas kan de volgende stelling worden bewezen, waarbij voor een vector y > 0 betekent dat alle componenten van y strict positief zijn.
Stelling 4.5 (Stelling van Tucker, 1956)2
Het stelsel Ax ≥ 0, ATu = 0, u ≥ 0 heeft altijd een oplossing (x∗, u∗) met de eigenschappen: (1) Ax∗+ u∗ > 0; (2) (x∗)TATu∗ = 0.
Bewijs
Om eigenschap (1) aan te tonen nemen we de k-de rij van A.
Als voor alle x met Ax ≥ 0, d.w.z. (−A)x ≤ 0, geldt dat (ak•, x) ≤ 0, dan volgt uit de Stelling van Farkas dat ak• = −ATu voor zekere u ≥ 0, d.w.z. ATu + ak• = 0. Er is dus een uk ≥ 0, namelijk de uk= u + ek, waarvoor geldt Auk= 0 en uk
k> 0. Neem xk= 0, dan geldt: {Axk+ uk}k = ukk> 0 en Auk= 0; uk≥ 0.
Als niet voor alle x met Ax ≥ 0 geldt dat (ak•, x) ≤ 0, dan is er een xk met Axk≥ 0 waarvoor geldt (ak•, xk) > 0. Neem uk= 0, dan geldt
{Axk+ uk}k= (ak•, xk) > 0 en Auk= 0; uk≥ 0.
Laat nu x∗ =Pmk=1 xk en u∗ =Pmk=1 uk, dan is Ax∗+ u∗ > 0 en Au∗ = 0; u∗≥ 0. Omdat ATu∗ = 0 is ook (x∗)TATu∗= 0.
Toepassing 4.6 Prijzen van financi¨ele producten
Beschouw een financi¨ele markt gedurende ´e´en periode waarin n producten worden verhandeld. Afhankelijk van de economische ontwikkelingen zijn er aan het einde van de periode m mogelijke situaties. Als we ´e´en eenheid van product j nemen en de toekomstige situatie blijkt i te zijn, dan ontvangen we een gegeven bedrag rij (1 ≤ i ≤ m, 1 ≤ j ≤ n). Laat de matrix R = (rij) deze uitbetalingsmatrix zijn.
Veronderstel dat we xj eenheden van product j nemen, j = 1, 2, . . . n. Een portefeuille is een vector x = (x1, x2, . . . , xn), waarbij xj zowel positief, nul of negatief mag zijn. Een positieve xj
1J. Farkas, Theorie der einfachen Ungleichungen, Journal f¨ur reine und angewandte Mathematik 124 (1902) 1 – 27.
betekent dat we xj eenheden van product j kopen; een negatieve xj betekent dat we xj eenheden van product j verkopen (short gaan in financi¨ele termen). Als aan het einde van de periode de toestand i blijkt te zijn, dan ontvangen we rijxj als xj positief is en betalen we −rijxj als xj negatief is. De waarde wi van toestand i voor portefeuille x voldoet dus aan:
wi =Pnj=1 rijxj, 1 ≤ i ≤ m, of in vectornotatie w = Rx.
Zij cj de kostprijs van product j aan het begin van de periode. Dan kost portefeuille x het bedrag
n
X
j=1
cjxj = cTx.
Het probleem bij het prijzen van financi¨ele producten is om cj ’eerlijk’ te bepalen voor alle j. Dit begrip ’eerlijk’ betekent in de financi¨ele wereld dat er geen arbitrage plaatsvindt, d.w.z. dat de prijzen z´o moeten worden vastgesteld dat geen enkele portefeuille een gegarandeerde niet-negatieve opbrengst kan halen uit een niet-negatieve investering.
Wiskundig betekent dat moet gelden:
voor iedere x met Rx ≥ 0, is cTx ≥ 0.
Volgens de Stelling van Farkas (neem in Gevolg 4.1 A = −R en p = −c) geldt: er is een u ≥ 0 zdd. (−R)Tu = −c, d.w.z. c = RTu.
Dit betekent dus dat in het geval er geen arbitrage is, er toestandsprijzen ui≥ 0 zijn die gebruikt kunnen worden om de prijs cj te bepalen, namelijk
cj =
m
X
i=1
rijui, 1 ≤ j ≤ n.
De toestandsprijs ui heeft de volgende interpretatie. Beschouw een elementair product dat 1 euro uitbetaalt als de toestand aan het einde van de periode i is en anders niets uitbetaalt, en laat ui de prijs van dit product zijn. Uit
cj =
m
X
i=1
rijui
volgt dat de prijs van product j de som is van de prijzen van de elementaire producten waaruit het is samengesteld.
Vraag 4.5
Zij A de volgende 2 × 2-matrix A = Ã
1 −1
1 0
! .
Bepaal de kegels C = {x | Ax ≤ 0} en C∗ = {y | y = ATu; u ≥ 0} en teken deze in de R2. Vraag 4.6
Bewijs de versie van de Stelling van Farkas als keuze tussen twee alternatieven: `ofwel er is een u ≥ 0 zdd. ATu = p, `ofwel er is een x zdd. Ax ≤ 0 en pTx > 0.