Extrema in R

(1)

Analyse: van R naar R

ⁿ

hoorcollege

Extrema in Rⁿ (21)

Gerrit Oomens

G.Oomens@uva.nl

Korteweg-de Vries Instituut voor Wiskunde Faculteit der Natuurwetenschappen, Wiskunde en Informatica

Universiteit van Amsterdam

Extrema in R

Bekijk een C²-functie f : E → R, waar E ⊆ R open. We zeggen dat f eenlokaal maximumheeft in a als er een δ > 0 bestaat zodat voor alle x ∈ (a − δ, a + δ) geldt f (x ) ≤ f (a). Bekend:

1 als f een lokaal extremum aanneemt in a, dan f⁰(a) = 0,

2 als f een maximum aanneemt in a, dan is f⁰⁰(a) ≤ 0,

3 als f⁰(a) = 0 en f⁰⁰(a) < 0, dan heeft f een maximum in a.

Extrema in R

ⁿ

We bekijken een functie f : E → R, waar E ⊆ Rⁿ.

f heeft eenlokaal maximumin ~a ∈ E als er een δ > 0 is zodat f (~x) ≤ f (~a) voor

~x ∈ B(~a, δ).

We noemen ~a eenabsoluutmaximum als f (~x) ≤ f (~a) voor alle ~x ∈ E . Anders heet ~arelatief.

We noemen ~a eensterkmaximum als er een δ > 0 is zodat f (~x) < f (~a) voor

~x ∈ B(~a, δ) en ~x 6= ~a. Anders heet ~azwak.

Het punt ~a kan eeninwendig maximum (~a ∈ E^◦) of eenrandmaximum (~a ∈ ∂E ) zijn.

Extrema en afgeleides

Propositie 13.6

Zij f : E → R en ~a een inwendig extremum van f , dan

(1) Neem ~u ∈ R. Als de richtingsafgeleide (D~uf )(~a) bestaat, dan is (D~uf )(~a) = ~0.

(2) Als f differentieerbaar is in ~a, dan geldt f⁰(~a) = ~0.

Een punt met f⁰(~a) = ~0 heet eenstationair punt.

Bewijs: neem ~u ∈ Rⁿen definieer g (t) = f (~a + t~u). Dan is g een functie op R met een lokaal extremum in 0. Dus

(D~uf )(~a) := g⁰(0) = 0.

Dit bewijst (1). Merk nu op dat als f differentieerbaar is, dat voor alle ~u geldt f⁰(~a)~u = (D~uf )(~a) = 0,

dus dan volgt f⁰(~a) = ~0.

(2)

Taylorreeks

Zij f : R²→ R een C²functie. De Stelling van Taylor geeft f (~a + ~h) = f (~a) +

2

X

j₁=1

Dj₁f (~a) 1! hj1+

2

X

j₁,j₂=1

Dj₁j₂f (~a)

2! hj1hj2+ o(k~hk²)

= f (~a) + D1f (~a)h1+ D2f (~a)h2

+¹₂D11f (~a)h₁²+ 2D12f (~a)h1h2+ D22f (~a)h₂² + o(k~hk²)

= f (~a) +D1f (~a) D2f (~a)h1

h2

+¹₂h1 h2

D₁₁f (~a) D12f (~a) D12f (~a) D22f (~a)

h₁ h2

+ o(k~hk²)

= f (~a) + f⁰(~a)~h +¹₂~h^THf(~a)~h + o(k~hk²), waarbij

Hf(~a) =D₁₁f (~a) D12f (~a) D12f (~a) D22f (~a)

deHesse-matrixofHessiaanvan f wordt genoemd.

Taylorreeks: meer algemeen

Zij f : Rⁿ→ R een C²functie. Er geldt f (~a + ~h) = f (~a) +

n

X

j1=1

Dj₁f (~a) 1! hj1+

n

X

j1,j2=1

Dj₁j₂f (~a)

2! hj1hj2+ o(k~hk²)

= f (~a) + f⁰(~a)~h +¹₂~h^THf(~a)~h + o(k~hk²), waarbij

Hf(~a) =







D11f (~a) · · · D1nf (~a)

... ...

Dn1f (~a) · · · Dnnf (~a)







deHesse-matrixofHessiaanvan f wordt genoemd. In het bijzonder geldt in een stationair punt

f (~a + ~h) = f (~a) +¹₂~h^THf(~a)~h + o(k~hk²).

Tweede afgeleide en extrema

Propositie 13.9

Zij f : E → Rⁿeen C²functie en ~a ∈ E^◦. Als f een lokaal minimum aanneemt in ~a, dan geldt ~h^THf(~a)~h ≥ 0 voor alle ~h ∈ Rⁿ.

Bewijs: neem ~h ∈ Rⁿen bekijk g (t) := f (~a + t~h).

Als f een lokaal minimum aanneemt, dan neemt g een lokaal minimum aan in 0. Dus g⁰⁰(0) ≥ 0. Met wat rekenwerk (Lemma 12.5) zien we dat

g⁰⁰(0) = ~h^THf(~a)~h.

Tweede afgeleide en extrema

Stelling 13.10

Zij f : E → R een C²-functie en ~a ∈ E^◦met f⁰(~a) = ~0. Stel dat voor alle ~h 6= 0 geldt

~h^THf(~a)~h > 0. Dan neemt f een sterk lokaal minimum aan in ~a.

Bekijk Λ : Rⁿ→ R gegeven door Λ(~h) = ~h^THf(~a)~h.

Dit is continu en neemt dus een minimum aan op de compacte verzameling {~h ∈ Rⁿ: k~hk = 1}.

Dus voor zekere ~h0geldt µ := inf_k~hk=1Λ(~h) = Λ(~h0) > 0.

Voor ~h 6= 0 willekeurig geldt nu

Λ(~h) = k~hk²~h^THf(~a)~h k~hk² = k~hk²

"

~h k~hk

#T

Hf(~a)

"

~h k~hk

#

≥ µk~hk².

Er bestaat δ > 0 zodat als k~hk < δ, dan

o(k~hk²)

<^µ₄k~hk². Er volgt

f (~a + ~h) − f (~a) =¹₂~h^THf(~a)~h + o(k~hk²) ≥ ^µ₂k~hk²−^µ₄k~hk²> 0.

(3)

Symmetrische en positief definiete matrices

Bekijk een symmetrische matrix A.

We noemen Apositief semidefinietals ~x^TA~x ≥ 0 voor alle ~x.

Als geldt ~x^TA~x > 0 voor ~x 6= 0, dan heet Apositief definiet.

Analoog defini¨eren wenegatief (semi)definiet. Uit de lineaire algebra weten we dat we kunnen schrijven

A = O^TDO =





 ~e1 · · · ~en











 λ1

. ..

λn













~e^T₁ ...

~e^T_n





,

waarbij de ~ei de orthonormale eigenvectoren van A zijn en de λi de eigenwaarden.

Neem ~x ∈ Rⁿen schrijf O~x = ˜x1 · · · x˜n

T

. Dan

~x^TA~x = (O~x)^TDO~x = hO~x, DO~xi =

n

X

j =1

λjx˜_j².

We zien: A positief definiet ⇔ alle eigenwaarden zijn positief.

Vinden van extrema (in R

²

)

Om extrema te vinden van een differentieerbare functie, zoeken we een punt met f⁰(~a) = 0. We willen dan onderzoeken wat voor punt ~a is. Wanneer f een C²functie is, bekijken we deHessiaan

Hf(~a) =(D₁₁f )(~a) (D12f )(~a) (D21f )(~a) (D22f )(~a)

.

Als de eigenwaarden van Hf(~a) kleiner dan 0 zijn (Hf(~a) isnegatief definiet), dan neemt f een sterk lokaal maximum aan.

Als de eigenwaarden van Hf(~a) groter dan 0 zijn (Hf(~a) ispositief definiet), dan neemt f een sterk lokaal minimum aan.

Als Hf(~a) zowel positieve als negatieve eigenwaarden heeft (indefiniet), dan heeft f geen extremum in ~a (zadelpunt).

Truc: het teken van de eigenwaarden λ1, λ2is makkelijk te bepalen door tr Hf(~a) = λ1+ λ2en det Hf(~a) = λ1λ2.

Complicaties

Indien de Hessiaan in een stationair punt ~a te veel eigenwaarden 0 heeft, geeft deze geen informatie. We moeten dan op een andere manier het gedrag van f rond ~a onderzoeken, bijvoorbeeld door naar deniveaukrommenf (~x) = c te kijken.

Als we bekijken f : E → R waar E niet open is, zullen we ook naar randextrema moeten zoeken. Hiervoor kunnen we de rand parametriseren als een kromme

x (t), y (t) en zoeken naar extrema van g (t) = f x (t), y (t).

Vervolgens moeten we onderzoeken of deze ook extrema van f zijn.

Voorbeeld

Bekijk f (x , y ) = x²+ y²+ x op E = {(x , y ) : x²+ y²≤ 1}.

We bepalen de parti¨ele afgeleiden:

D1f (x , y ) = 2x + 1 = 0 ⇒ x = −¹₂ D2f (x , y ) = 2y = 0 ⇒ y = 0 We zien f⁰(x , y ) = 0 in (−¹₂, 0). Er geldt

Hf(x , y ) =2 0 0 2

,

dus Hf(−¹₂, 0) is positief definiet: dit punt is een inwendig sterk minimum.

(4)

Voorbeeld

Bekijk f (x , y ) = x²+ y²+ x op E = {(x , y ) : x²+ y²≤ 1}. We hebben gezien dat f een inwendig sterk minimum heeft in (−¹₂, 0).

We parametriseren de rand met (cos t, sin t) waar t ∈ [0, 2π):

g (t) := f (cos t, sin t) = cos²t + sin²t + cos t = 1 + cos t.

Dan is g⁰(t) = − sin t. We vinden 2 mogelijke randextrema:

t = 0 ⇒ (x , y ) = (1, 0) t = π ⇒ (x , y ) = (−1, 0)

Merk op: 0 is een maximum van g . De functie f neemt op E ergens een maximum aan, maar niet in een inwendig punt. Dus moet (1, 0) een absoluut (sterk) randmaximum van f zijn.

Het punt π is een minimum van g . Het zou dus kunnen dat (−1, 0) een randminimum van f is met f (−1, 0) = 0. Echter

f (x , 0) = x²+ x = x (x + 1) < 0 als x > −1.

We concluderen dat (−1, 0) geen extremum van f is.