Analyse: van R naar R
nhoorcollege
Extrema in Rn (21)
Gerrit Oomens
G.Oomens@uva.nl
Korteweg-de Vries Instituut voor Wiskunde Faculteit der Natuurwetenschappen, Wiskunde en Informatica
Universiteit van Amsterdam
Extrema in R
Bekijk een C2-functie f : E → R, waar E ⊆ R open. We zeggen dat f eenlokaal maximumheeft in a als er een δ > 0 bestaat zodat voor alle x ∈ (a − δ, a + δ) geldt f (x ) ≤ f (a). Bekend:
1 als f een lokaal extremum aanneemt in a, dan f0(a) = 0,
2 als f een maximum aanneemt in a, dan is f00(a) ≤ 0,
3 als f0(a) = 0 en f00(a) < 0, dan heeft f een maximum in a.
Extrema in R
nWe bekijken een functie f : E → R, waar E ⊆ Rn.
f heeft eenlokaal maximumin ~a ∈ E als er een δ > 0 is zodat f (~x) ≤ f (~a) voor
~x ∈ B(~a, δ).
We noemen ~a eenabsoluutmaximum als f (~x) ≤ f (~a) voor alle ~x ∈ E . Anders heet ~arelatief.
We noemen ~a eensterkmaximum als er een δ > 0 is zodat f (~x) < f (~a) voor
~x ∈ B(~a, δ) en ~x 6= ~a. Anders heet ~azwak.
Het punt ~a kan eeninwendig maximum (~a ∈ E◦) of eenrandmaximum (~a ∈ ∂E ) zijn.
Extrema en afgeleides
Propositie 13.6
Zij f : E → R en ~a een inwendig extremum van f , dan
(1) Neem ~u ∈ R. Als de richtingsafgeleide (D~uf )(~a) bestaat, dan is (D~uf )(~a) = ~0.
(2) Als f differentieerbaar is in ~a, dan geldt f0(~a) = ~0.
Een punt met f0(~a) = ~0 heet eenstationair punt.
Bewijs: neem ~u ∈ Rnen definieer g (t) = f (~a + t~u). Dan is g een functie op R met een lokaal extremum in 0. Dus
(D~uf )(~a) := g0(0) = 0.
Dit bewijst (1). Merk nu op dat als f differentieerbaar is, dat voor alle ~u geldt f0(~a)~u = (D~uf )(~a) = 0,
dus dan volgt f0(~a) = ~0.
Taylorreeks
Zij f : R2→ R een C2functie. De Stelling van Taylor geeft f (~a + ~h) = f (~a) +
2
X
j1=1
Dj1f (~a) 1! hj1+
2
X
j1,j2=1
Dj1j2f (~a)
2! hj1hj2+ o(k~hk2)
= f (~a) + D1f (~a)h1+ D2f (~a)h2
+12D11f (~a)h12+ 2D12f (~a)h1h2+ D22f (~a)h22 + o(k~hk2)
= f (~a) +D1f (~a) D2f (~a)h1
h2
+12h1 h2
D11f (~a) D12f (~a) D12f (~a) D22f (~a)
h1 h2
+ o(k~hk2)
= f (~a) + f0(~a)~h +12~hTHf(~a)~h + o(k~hk2), waarbij
Hf(~a) =D11f (~a) D12f (~a) D12f (~a) D22f (~a)
deHesse-matrixofHessiaanvan f wordt genoemd.
Taylorreeks: meer algemeen
Zij f : Rn→ R een C2functie. Er geldt f (~a + ~h) = f (~a) +
n
X
j1=1
Dj1f (~a) 1! hj1+
n
X
j1,j2=1
Dj1j2f (~a)
2! hj1hj2+ o(k~hk2)
= f (~a) + f0(~a)~h +12~hTHf(~a)~h + o(k~hk2), waarbij
Hf(~a) =
D11f (~a) · · · D1nf (~a)
... ...
Dn1f (~a) · · · Dnnf (~a)
deHesse-matrixofHessiaanvan f wordt genoemd. In het bijzonder geldt in een stationair punt
f (~a + ~h) = f (~a) +12~hTHf(~a)~h + o(k~hk2).
Tweede afgeleide en extrema
Propositie 13.9
Zij f : E → Rneen C2functie en ~a ∈ E◦. Als f een lokaal minimum aanneemt in ~a, dan geldt ~hTHf(~a)~h ≥ 0 voor alle ~h ∈ Rn.
Bewijs: neem ~h ∈ Rnen bekijk g (t) := f (~a + t~h).
Als f een lokaal minimum aanneemt, dan neemt g een lokaal minimum aan in 0. Dus g00(0) ≥ 0. Met wat rekenwerk (Lemma 12.5) zien we dat
g00(0) = ~hTHf(~a)~h.
Tweede afgeleide en extrema
Stelling 13.10
Zij f : E → R een C2-functie en ~a ∈ E◦met f0(~a) = ~0. Stel dat voor alle ~h 6= 0 geldt
~hTHf(~a)~h > 0. Dan neemt f een sterk lokaal minimum aan in ~a.
Bekijk Λ : Rn→ R gegeven door Λ(~h) = ~hTHf(~a)~h.
Dit is continu en neemt dus een minimum aan op de compacte verzameling {~h ∈ Rn: k~hk = 1}.
Dus voor zekere ~h0geldt µ := infk~hk=1Λ(~h) = Λ(~h0) > 0.
Voor ~h 6= 0 willekeurig geldt nu
Λ(~h) = k~hk2~hTHf(~a)~h k~hk2 = k~hk2
"
~h k~hk
#T
Hf(~a)
"
~h k~hk
#
≥ µk~hk2.
Er bestaat δ > 0 zodat als k~hk < δ, dan
o(k~hk2)
<µ4k~hk2. Er volgt
f (~a + ~h) − f (~a) =12~hTHf(~a)~h + o(k~hk2) ≥ µ2k~hk2−µ4k~hk2> 0.
Symmetrische en positief definiete matrices
Bekijk een symmetrische matrix A.
We noemen Apositief semidefinietals ~xTA~x ≥ 0 voor alle ~x.
Als geldt ~xTA~x > 0 voor ~x 6= 0, dan heet Apositief definiet.
Analoog defini¨eren wenegatief (semi)definiet. Uit de lineaire algebra weten we dat we kunnen schrijven
A = OTDO =
~e1 · · · ~en
λ1
. ..
λn
~eT1 ...
~eTn
,
waarbij de ~ei de orthonormale eigenvectoren van A zijn en de λi de eigenwaarden.
Neem ~x ∈ Rnen schrijf O~x = ˜x1 · · · x˜n
T
. Dan
~xTA~x = (O~x)TDO~x = hO~x, DO~xi =
n
X
j =1
λjx˜j2.
We zien: A positief definiet ⇔ alle eigenwaarden zijn positief.
Vinden van extrema (in R
2)
Om extrema te vinden van een differentieerbare functie, zoeken we een punt met f0(~a) = 0. We willen dan onderzoeken wat voor punt ~a is. Wanneer f een C2functie is, bekijken we deHessiaan
Hf(~a) =(D11f )(~a) (D12f )(~a) (D21f )(~a) (D22f )(~a)
.
Als de eigenwaarden van Hf(~a) kleiner dan 0 zijn (Hf(~a) isnegatief definiet), dan neemt f een sterk lokaal maximum aan.
Als de eigenwaarden van Hf(~a) groter dan 0 zijn (Hf(~a) ispositief definiet), dan neemt f een sterk lokaal minimum aan.
Als Hf(~a) zowel positieve als negatieve eigenwaarden heeft (indefiniet), dan heeft f geen extremum in ~a (zadelpunt).
Truc: het teken van de eigenwaarden λ1, λ2is makkelijk te bepalen door tr Hf(~a) = λ1+ λ2en det Hf(~a) = λ1λ2.
Complicaties
Indien de Hessiaan in een stationair punt ~a te veel eigenwaarden 0 heeft, geeft deze geen informatie. We moeten dan op een andere manier het gedrag van f rond ~a onderzoeken, bijvoorbeeld door naar deniveaukrommenf (~x) = c te kijken.
Als we bekijken f : E → R waar E niet open is, zullen we ook naar randextrema moeten zoeken. Hiervoor kunnen we de rand parametriseren als een kromme
x (t), y (t) en zoeken naar extrema van g (t) = f x (t), y (t).
Vervolgens moeten we onderzoeken of deze ook extrema van f zijn.
Voorbeeld
Bekijk f (x , y ) = x2+ y2+ x op E = {(x , y ) : x2+ y2≤ 1}.
We bepalen de parti¨ele afgeleiden:
D1f (x , y ) = 2x + 1 = 0 ⇒ x = −12 D2f (x , y ) = 2y = 0 ⇒ y = 0 We zien f0(x , y ) = 0 in (−12, 0). Er geldt
Hf(x , y ) =2 0 0 2
,
dus Hf(−12, 0) is positief definiet: dit punt is een inwendig sterk minimum.
Voorbeeld
Bekijk f (x , y ) = x2+ y2+ x op E = {(x , y ) : x2+ y2≤ 1}. We hebben gezien dat f een inwendig sterk minimum heeft in (−12, 0).
We parametriseren de rand met (cos t, sin t) waar t ∈ [0, 2π):
g (t) := f (cos t, sin t) = cos2t + sin2t + cos t = 1 + cos t.
Dan is g0(t) = − sin t. We vinden 2 mogelijke randextrema:
t = 0 ⇒ (x , y ) = (1, 0) t = π ⇒ (x , y ) = (−1, 0)
Merk op: 0 is een maximum van g . De functie f neemt op E ergens een maximum aan, maar niet in een inwendig punt. Dus moet (1, 0) een absoluut (sterk) randmaximum van f zijn.
Het punt π is een minimum van g . Het zou dus kunnen dat (−1, 0) een randminimum van f is met f (−1, 0) = 0. Echter
f (x , 0) = x2+ x = x (x + 1) < 0 als x > −1.
We concluderen dat (−1, 0) geen extremum van f is.