Theorie van de lineaire (on)gelijkheden - Lineaire (on)gelijkheden en polyhedra

4.2 Lineaire (on)gelijkheden en polyhedra

4.2.1 Theorie van de lineaire (on)gelijkheden

Beschouw de n-dimensionale Euclidische ruimte Rn met de Euclidische norm k · k. C ⊆ Rn heet convex indien voor alle x, y ∈ C en alle re¨ele getallen 0 ≤ λ ≤ 1 geldt:

λx + (1 − λ)y ∈ C.

Meetkundig gesproken betekent dit dat als twee punten tot C behoren het lijnsegment dat deze punten verbindt (dit wordt ook wel de convexe combinatie van deze punten genoemd) ook tot C behoort.

Een extreem punt x van een convexe verzameling C is een punt dat geen convexe combinatie is van twee verschillende punten van C. Een d 6= 0 heet een richting van een convexe verzameling C als voor iedere x ∈ C geldt dat

x + λd ∈ C voor iedere λ ≥ 0.

Een begrensde verzameling heeft dus geen richtingen. Een extreme richting van C is een richting van C die geen positieve combinatie is van twee verschillende richtingen van C.

Een hypervlak is een verzameling van punten x die voldoen aan a₁x₁+ a₂x₂+ · · · + a_nx_n= a₀ voor zekere gegeven re¨ele getallen a0, a₁, . . . , a_n.

Een kegel is een verzameling C waarvoor geldt dat als x ∈ C, dan ook λx ∈ C voor alle λ ≥ 0. Stelling 4.1 (Stelling van het scheidende hypervlak)

Zij C ∈ Rn een gesloten convexe verzameling en x /∈ C.

Dan is er een scheidend hypervlak, d.w.z. er bestaan re¨ele getallen a0, a₁, . . . , a_n zdd. a₁x₁+ a₂x₂+ · · · + a_nx_n> a₀ en a₁y₁+ a₂y₂+ · · · + a_ny_n< a₀ voor alle y ∈ C.

Bewijs

Het idee van het bewijs is om eerst het punt van C te bepalen dat het dichtst bij x ligt, zeg z, en dat dan het hypervlak dat loodrecht op x − z staat en door het midden van het lijnsegment [x, z] gaat, voldoet.

De uitwerking van dit idee is als volgt formeel op te schrijven. De continue functie

f (y) = kx − yk²

neemt op een compacte verz. een minimum aan. Kies een y∗ ∈ C en laat B = {y | ky − xk²≤ f (y^∗)}.

Dan is C ∩ B een compacte verz. waarop f (y) zijn minimum aanneemt, zeg in het punt z (z is dan het punt van C dat het dichtst bij x ligt). Omdat C convex is, ligt voor iedere y ∈ C en iedere 0 ≤ λ ≤ 1 ook λy + (1 − λ)z ∈ C, zodat geldt:

kx − zk² ≤ kx − {λy + (1 − λ)z}k² = k(x − z) − λ(y − z)k², waaruit volgt dat

−2λ(x − z, y − z) + λ2(y − z, y − z) ≥ 0 voor alle y ∈ C en alle λ ∈ [0, 1].

Dus is (x − z, y − z) ≤ 0 voor alle y ∈ C. Laat a = x − z, dan geldt: a 6= 0 en (a, y) ≤ (a, z). Neem a₀ = ¹ 2 ½ (x, a) + (z, a) ¾ = ¹ 2 ½ (a, a) + 2(z, a) ¾ . Omdat (a, a) > 0 geldt

(x, a) = (a, a) + (z, a) > ¹

2^{(a, a) + (z, a) = a}⁰^{> (z, a) ≥ (y, a) voor alle y ∈ C.} Stelling 4.2

Laat T = {y ∈ Rⁿ | (x, y) ≤ 0 voor alle x ∈ S} met S een niet-lege verz. in Rⁿ. Dan is T een gesloten convexe kegel.

Bewijs

Indien y, z ∈ T , dan geldt: (x, y) ≤ 0 en (x, z) ≤ 0 voor alle x ∈ S. Dus ook (x, λy + (1 − λ)z) = λ(x, y) + (1 − λ)(x, z) ≤ 0 voor alle λ ∈ [0, 1].

Tevens geldt (x, λy) = λ(x, y) ≤ 0 voor alle λ ≥ 0. Dus T is een convexe kegel. Indien yk ∈ T, k = 1, 2, . . . en lim_k→∞yk = y, dan geldt

(x, y) = n X i=1 x_i( lim k→∞y_i^k) = lim k→∞ n X i=1 x_iy_i^k≤ 0, dus T is ook gesloten.

Voor een kegel C ⊆ Rⁿ defini¨eren we de duale kegel C^∗ door

C^∗= {y ∈ Rⁿ | (x, y) ≤ 0 voor alle x ∈ C}. Uit Stelling 4.2 volgt dat C∗ een gesloten convexe kegel is.

Stelling 4.3

Indien C een gesloten convexe kegel is, dan geldt dat de duale van de duale kegel gelijk is aan C, d.w.z. (C∗)∗ = C.

Bewijs

Volgens de definitie van duale kegel geldt C∗ = {y | (x, y) ≤ 0 voor alle x ∈ C}. Uit de symmetrie van het inwendig product geldt voor x ∈ C dat (y, x) ≤ 0 voor alle y ∈ C∗.

Omdat (C∗)∗ = {z | (y, z) ≤ 0 voor alle y ∈ C∗}, zien we dat x ∈ C impliceert dat x ∈ (C∗)∗ en dus geldt: C ⊆ (C∗)∗.

Via een tegenspraak zullen we nu aantonen dat (C∗)∗ ⊆ C. Laten we veronderstellen dat z ∈ (C∗)∗ en z /∈ C. Volgens de Stelling van het scheidende hypervlak zijn er re¨ele getallen a₀, a₁, . . . , a_n zdd.

a₁z₁+ a₂z₂+ · · · + a_nz_n> a₀ en a₁x₁+ a₂x₂+ · · · + a_nx_n< a₀ voor alle x ∈ C. (4.7) Omdat de nulvector tot C behoort, geldt dat a₀ > 0. Stel dat er een x ∈ C bestaat zdd. (a, x) > 0. Dan geldt voor λ groot genoeg dat (a, λx) > a₀, wat in tegenspraak is met (4.7). Dus (a, x) ≤ 0 voor alle x ∈ C, zodat geldt a ∈ C∗. Volgens de definitie van (C∗)∗ volgt hieruit dat (a, z) ≤ 0. Dit is echter in tegenspraak met (4.7).

In de lineaire optimalisering werken we met convexe veelvlakkenkegels. Zij A = (a_ij) een m × n-matrix met re¨ele elementen, dan is C = {x | Ax ≤ 0} een convexe veelvlakkenkegel. Met Ax ≤ 0 bedoelen we dat iedere component van de m-dimensionale vector Ax kleiner dan of gelijk aan nul is. De zijvlakken van C zijn de hypervlakken {x ∈ Rn | (a_i•, x) = 0}, waarbij a_i• de vector behorend bij de i-de rij van A is.

Stelling 4.4

De convexe kegels {x | Ax ≤ 0} en {y | y = ATu; u ≥ 0} zijn elkaars duale. Bewijs

Zij C = {y | y = ATu; u ≥ 0}. Volgens Stelling 4.3 is het voldoende om aan te tonen dat C∗ = {x | Ax ≤ 0}. Per definitie geldt C∗ = {x | (y, x) ≤ 0 voor alle y ∈ C}, waaruit volgt dat

C∗ = {x | yTx ≤ 0 voor alle y = ATu met u ≥ 0} = {x | u^TAx ≤ 0 voor alle u ≥ 0} = {x | Ax ≤ 0}.

Gevolg 4.1 (Stelling van Farkas, 1902)¹

De vector p ∈ Rn maakt een niet-scherpe hoek met iedere vector van de convexe veelvlakkenkegel C = {x | Ax ≤ 0} d.e.s.d. als p = ATu voor zekere u ≥ 0, ofwel:

p behoort tot de duale kegel C∗ d.e.s.d. als p = ATu voor zekere u ≥ 0.

De Stelling van Farkas kan ook worden geformuleerd als een keuze tussen twee alternatieven: `ofwel er is een u ≥ 0 zdd. ATu = p, `ofwel er is een x zdd. Ax ≤ 0 en pTx > 0.

Met de Stelling van Farkas kan de volgende stelling worden bewezen, waarbij voor een vector y > 0 betekent dat alle componenten van y strict positief zijn.

Stelling 4.5 (Stelling van Tucker, 1956)2

Het stelsel Ax ≥ 0, ATu = 0, u ≥ 0 heeft altijd een oplossing (x∗, u∗) met de eigenschappen: (1) Ax^∗+ u^∗ > 0; (2) (x^∗)^TA^Tu^∗ = 0.

Bewijs

Om eigenschap (1) aan te tonen nemen we de k-de rij van A.

Als voor alle x met Ax ≥ 0, d.w.z. (−A)x ≤ 0, geldt dat (a_k•, x) ≤ 0, dan volgt uit de Stelling van Farkas dat a_k• = −A^Tu voor zekere u ≥ 0, d.w.z. A^Tu + a_k• = 0. Er is dus een u^k ≥ 0, namelijk de uk= u + e_k, waarvoor geldt Auk= 0 en uk

k> 0. Neem xk= 0, dan geldt: {Ax^k+ u^k}_k = u^k_k> 0 en Au^k= 0; u^k≥ 0.

Als niet voor alle x met Ax ≥ 0 geldt dat (a_k•, x) ≤ 0, dan is er een xk met Axk≥ 0 waarvoor geldt (a_k•, xk) > 0. Neem uk= 0, dan geldt

{Ax^k+ u^k}_k= (a_k•, x^k) > 0 en Au^k= 0; u^k≥ 0.

Laat nu x∗ =^P^m_k=1 xk en u∗ =^P^m_k=1 uk, dan is Ax∗+ u∗ > 0 en Au∗ = 0; u∗≥ 0. Omdat A^Tu^∗ = 0 is ook (x^∗)^TA^Tu^∗= 0.

Toepassing 4.6 Prijzen van financi¨ele producten

Beschouw een financiële markt gedurende één periode waarin n producten worden verhandeld. Afhankelijk van de economische ontwikkelingen zijn er aan het einde van de periode m mogelijke situaties. Als we één eenheid van product j nemen en de toekomstige situatie blijkt i te zijn, dan ontvangen we een gegeven bedrag r_ij (1 ≤ i ≤ m, 1 ≤ j ≤ n). Laat de matrix R = (r_ij) deze uitbetalingsmatrix zijn.

Veronderstel dat we x_j eenheden van product j nemen, j = 1, 2, . . . n. Een portefeuille is een vector x = (x₁, x₂, . . . , x_n), waarbij x_j zowel positief, nul of negatief mag zijn. Een positieve x_j

1J. Farkas, Theorie der einfachen Ungleichungen, Journal f¨ur reine und angewandte Mathematik 124 (1902) 1 – 27.

betekent dat we x_j eenheden van product j kopen; een negatieve x_j betekent dat we x_j eenheden van product j verkopen (short gaan in financi¨ele termen). Als aan het einde van de periode de toestand i blijkt te zijn, dan ontvangen we r_ijx_j als x_j positief is en betalen we −r_ijx_j als x_j negatief is. De waarde w_i van toestand i voor portefeuille x voldoet dus aan:

w_i =^Pⁿ_j=1 r_ijx_j, 1 ≤ i ≤ m, of in vectornotatie w = Rx.

Zij c_j de kostprijs van product j aan het begin van de periode. Dan kost portefeuille x het bedrag

j=1

c_jx_j = c^Tx.

Het probleem bij het prijzen van financiële producten is om cj ’eerlijk’ te bepalen voor alle j. Dit begrip ’eerlijk’ betekent in de financiële wereld dat er geen arbitrage plaatsvindt, d.w.z. dat de prijzen zó moeten worden vastgesteld dat geen enkele portefeuille een gegarandeerde niet-negatieve opbrengst kan halen uit een niet-negatieve investering.

Wiskundig betekent dat moet gelden:

voor iedere x met Rx ≥ 0, is cTx ≥ 0.

Volgens de Stelling van Farkas (neem in Gevolg 4.1 A = −R en p = −c) geldt: er is een u ≥ 0 zdd. (−R)^Tu = −c, d.w.z. c = R^Tu.

Dit betekent dus dat in het geval er geen arbitrage is, er toestandsprijzen u_i≥ 0 zijn die gebruikt kunnen worden om de prijs c_j te bepalen, namelijk

c_j =

i=1

r_iju_i, 1 ≤ j ≤ n.

De toestandsprijs u_i heeft de volgende interpretatie. Beschouw een elementair product dat 1 euro uitbetaalt als de toestand aan het einde van de periode i is en anders niets uitbetaalt, en laat u_i de prijs van dit product zijn. Uit

c_j =

i=1

r_iju_i

volgt dat de prijs van product j de som is van de prijzen van de elementaire producten waaruit het is samengesteld.

Vraag 4.5

Zij A de volgende 2 × 2-matrix A = Ã

1 −1

1 0

! .

Bepaal de kegels C = {x | Ax ≤ 0} en C∗ = {y | y = ATu; u ≥ 0} en teken deze in de R2. Vraag 4.6

Bewijs de versie van de Stelling van Farkas als keuze tussen twee alternatieven: `ofwel er is een u ≥ 0 zdd. A^Tu = p, `ofwel er is een x zdd. Ax ≤ 0 en p^Tx > 0.

In document BESLISKUNDE 1 L.C.M. KALLENBERG UNIVERSITEIT LEIDEN (pagina 149-154)