0% ont trouvé ce document utile (0 vote)
5 vues8 pages

Points critiques et extrema en analyse

Transféré par

Cla sher coc
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
5 vues8 pages

Points critiques et extrema en analyse

Transféré par

Cla sher coc
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Cours L3 : Topologie et calcul différentiel :

Points critiques et extremum

On rappelle ici les définitions de minimum/maximum.


Définitions : Soit (X, d) un espace métrique et f : X → R une fonction à valeurs réelles et
x0 ∈ X. On dit que
— f a un minimum global en x0 si pour tout x ∈ X alors f (x) ≥ f (x0 ) ; autrement dit
si f (x0 ) = min f (X) = min{f (x), x ∈ X}.
— f a un minimum local en x0 s’il existe ϵ > 0 tel que lorsque x ∈ B(x0 , ϵ) alors
f (x) ≥ f (x0 ) ; autrement dit si f (x0 ) = min f (B(x0 , ϵ)) = min{f (x), x ∈ B(x0 , ϵ)}.
— f a un maximum global en x0 si pour tout x ∈ X alors f (x) ≤ f (x0 ) ; autrement dit
si f (x0 ) = max f (X) = min{f (x), x ∈ X}.
— f a un maximum local en x0 s’il existe ϵ > 0 tel que lorsque x ∈ B(x0 , ϵ) alors
f (x) ≤ f (x0 ) ; autrement dit si f (x0 ) = min f (B(x0 , ϵ)) = max{f (x), x ∈ B(x0 , ϵ)}.
On peut aussi introduire les notions de minimum/maximum global/local strict ; par exemple,
f admet un minimum global strict en x0 si

∀x ∈ X \ {x0 } : f (x) > f (x0 ).

On dira que f un extremum local en x0 ∈ X si f a un minimum local ou un maximum local


en x0 .

Conditions nécéssaires
Proposition : Soit E un espace vectoriel normé , Ω ⊂ E un ouvert de E, et f : Ω → R
une fonction différentiable. Si f a un extremum local en p ∈ Ω alors

df (p) = 0.

Si de plus f est de classe C 2 et que f a un maximum local en p ∈ Ω alors

∀h ∈ E : d2 f (p)(h, h) ≤ 0.

Preuve : Supposons que f a un maximum local en p ∈ Ω. Et considérons h ∈ E \ {0} et


O = {t ∈ R, p + th ∈ Ω} et posons pour t ∈ O :

φh (t) = f (p + th) − f (p).

L’ensemble O est l’image réciproque de l’ouvert Ω par l’application continue

t ∈ R 7→ p + th

donc O est un ouvert de R contenant 0. Il est aisé de vérifier que φh est dérivable sur O et que
φh a un maximum local 1 en 0, ainsi φ′h (0) = 0 or φ′h (0) = df (p)(h). Puisque df (p)(0) = 0,
1. En effet si on dispose d’un réel ϵ > 0 tel que
m ∈ B(p, ϵ) : f (m) ≤ f (p)
alors
t ∈ −ϵ∥h∥−1 , ϵ∥h∥−1 ⇒ p + th ∈ B(p, ϵ) ⇒ f (p + th) ≤ f (p) ⇒ φh (t) ≤ 0 = φh (0)
 
nous avons démontré que pour tout h ∈ E :

df (p)(h) = 0

c’est à dire que la forme linéaire df (p) est nulle.


Lorsque f est de classe C 2 alors φh est aussi de classe C 2 et on sait donc que d2 f (p)(h, h) =
φ′′h (0) ≤ 0. Q.E.D.
Définition : Soit E un espace vectoriel normé , Ω ⊂ E un ouvert de E, et f : Ω → R
une fonction différentiable. On appelle point critique de f tout point p ∈ Ω tel que

df (p) = 0.

Condition suffisante
Proposition : Soit E un espace vectoriel normé , Ω ⊂ E un ouvert de E, et f : Ω → R
une fonction C 2 . Si p ∈ Ω est un point critique de f et qu’il existe un réel λ > 0 tel que

∀h ∈ E : d2 f (p)(h, h) ≤ −λ∥h∥2

alors f a un maximum local strict en p.


Remarque : On laisse au lecteur le soin de formuler une condition suffisante pour qu’un
point p ∈ Ω soit un minimum local de f .
Preuve : Puisque f est de classe C 2 , x 7→ d2 f (x) est continue de Ω vers Bc (E × E, R) qui
est l’espace de Banach des formes bilinéaires continues sur E × E équipé de la norme

|β(h, k)|
β ∈ Bc (E × E, R) : ∥β∥ = sup .
h,k∈E\{0} ∥h∥ ∥k∥

Il y a donc un réel ϵ > 0 tel que B(p, ϵ) ⊂ Ω et


1
∀x ∈ B(p, ϵ) : ∥d2 f (x) − d2 f (p)∥ ≤ λ.
2
Ainsi pour tout x ∈ B(p, ϵ) et tout h ∈ E, nous avons
1
(d2 f (x) − d2 f (p))(h, h) = d2 f (x)(h, h) − d2 f (p)(h, h) ≤ λ ∥h∥2 .
2
Alors pour x ∈ B(p, ϵ) et h ∈ E ; nous avons

d2 f (x)(h, h) = d2 f (p)(h, h) + (d2 f (x)(h, h) − d2 f (p)(h, h))


1
≤ −λ∥h∥2 + λ ∥h∥2
2
1
≤ − λ ∥h∥2 .
2
Puisque B(p, ϵ) est convexe, nous pouvons employer la formule de Taylor avec reste intégrale :

2
pour x ∈ B(p, ϵ) :
Z 1
f (x) = f (p) + df (p)(x − p) + (1 − s)d2 f (p + s(x − p))(x − p, x − p)ds
0
Z 1
= f (p) + (1 − s)d2 f (p + s(x − p))(x − p, x − p)ds car on a supposé df (p) = 0
0
Z 1  
λ λ
≤ f (p) + (1 − s) − ∥x − p∥2 ds car ∀s ∈ [0, 1] : d2 f (p + s(x − p))(x − p, x − p) ≤ − ∥x − p∥2
0 2 2
λ
≤ f (p) − ∥x − p∥2 .
4
Ainsi x ∈ B(p, ϵ) et x ̸= p implique que f (x) ≤ f (p) − λ4 ∥x − p∥2 < f (p). Ce qui est le
résultat annoncé.

Cas de la dimension finie


Si Ω est un ouvert de Rn et f : Ω → R une fonction différentiable alors p ∈ Ω est un
point critique de f si et seulement si
∂f
∀i ∈ {1, . . . , n} : (p) = 0.
∂xi
Puisque d2 f (p) est une forme bilinéaire symétrique, elle est associée à la forme quadratique
Qp : Rn → R définie par
Qp (h) = d2 f (p)(h, h).
La matrice de cette forme bilinéaire symétrique dans la base canonique (e1 , . . . , en ) de Rn
est la matrice hessienne de f :
 2 
∂ f
Hess f (p) = d2 f (p)(ei , ej ) 1≤i,j≤n =

(p) ;
∂xi ∂xj 1≤i,j≤n
Pn
Si h = (h1 , . . . , hn ) = j=1 hj ej alors
 
h1
d2 f (p)(h, h) = (h1 , . . . , hn )Hess f (p)  ... 
 

hn
2
X ∂ f
= (p)hi hj
i,j
∂xi ∂xj
n
X ∂2f X ∂2f
= (p)h2i + 2 (p)hi hj .
j=1
∂x2i ∂xj ∂xi ∂xj
1≤i<j≤n

On sait qu’il y a une matrice orthogonal U ∈ O(n) et des réels λ1 , . . . , λn tels que
Hess f (p) = U Diag(λ1 , . . . , λn )U −1 .
Et si on note λ− la plus petite des valeurs propres de la matrice hessienne de f en p et λ+
la plus grande des valeurs propres de la matrice hessienne de f en p :
λ− = min {λi , i ∈ {1, . . . , , n}} et λ+ = max {λi , i ∈ {1, . . . , n}} ,

3
alors
λ− ∥h∥22 ≤ d2 f (p)(h, h) ≤ λ+ ∥h∥22 ;
où sX
∥h∥2 = h2j .
j

Et on obtient les critères suivants :


Proposition : Soit Ω un ouvert de Rn et f : Ω → R une fonction de classe C 2 et p ∈ Ω un
point critique de f et λ− la plus petite des valeurs propres de la matrice hessienne de f en
p et λ+ la plus grande des valeurs propres de la matrice hessienne de f en p :
— Si f a un minimum local en p alors λ− ≥ 0
— Si f a un maximum local en p alors λ+ ≤ 0
— Si λ− > 0 alors f a un minimum local strict en p.
— Si λ+ < 0 alors f a un maximum local strict en p.

Un exemple
On étudie la fonction φ définie sur R2 par
φ(x, y) = x3 + y 3 − 3xy.
Cette fonction est polynomiale donc C ∞ . De plus
∂φ ∂φ
p = (x, y) est un point critique de f si et seulement si (p) = (p) = 0.
∂x ∂y
Donc
3x2 − 3y = 0

p = (x, y) est un point critique de f ⇔
3y 2 − 3x = 0
x2 − y = 0


y2 − x = 0
x2 + y 2 = x + y


x2 − y 2 − y + x = 0
x2 + y 2 = x + y


(x − y)(x + y) − y + x = 0
x2 + y 2 = x + y


(x − y)(x + y + 1) = 0
x2 + y 2 = x + y


x − y = 0 ou x + y = −1
⇔ (x, y) = (0, 0) ou (x, y) = (1, 1)
Les points critiques de φ sont donc (0, 0) et (1, 1). De plus
 
6x −3
Hess φ (x, y) = .
−3 6y
En (0, 0) la matrice hessienne de φ a deux valeurs propres de signe opposé, à savoir 3 et −3
donc (0, 0) n’est pas un extremum local de φ. En (1, 1) la matrice hessienne de φ a deux
valeurs propres strictement positives, à savoir 3 et 9 donc (1, 1) un minimum local strict de
φ.
On remarquera que φ(R2 ) = R et donc φ n’a ni maximum global ni munimum local.

4
Extrema liés
Théorème Soit E un espace vectoriel normé , Ω un ouvert de E et f, g : Ω → R deux
fonctions de classe C 1 et soit c ∈ R on suppose que Σ = {p ∈ Ω; g(p) = c} est non vide, que
p ∈ Σ est un extremum local de f : Σ → R et que dg(p) ̸= 0 alors il existe un réel, λ, appelé
multiplicateur de Lagrange tel que

df (p) = λ dg(p).

Un exemple
Soit E un espace euclidien et u : E → E un endomorphisme auto-adoint, c’est à dire

∀x, y ∈ E : ⟨u(x), y⟩ = ⟨x, u(y)⟩.

Nous allons démontrer que u a une valeur propre réelle.


Introduisons pour cela la sphère unité de E :
p
SE = {x ∈ E ; ∥x∥ = ⟨x, x⟩ = 1}.

C’est l’image réciproque du fermé {1} par l’application norme ∥ • ∥ qui est continue, donc la
sphère unité est un ensemble fermé de E. Par définition SE est une partie bornée de E. Or
un espace euclidien est un espace vectoriel normé de dimension finie, par conséquent, une
partie fermée et bornée de E, comme SE , est une partie compacte de E. On introduit alors
f (x) = ⟨u(x), x⟩. C’est une fonction polynomiale donc C ∞ , ainsi sa restriction à la sphère
unité est une fonction continue définie sur une partie compacte, elle atteint ses bornes ; en
particulier il existe un x− ∈ SE telle que

f (x− ) = min{f (x), x ∈ SE }.

On introduit alors la fonction g : E → R définie par

g(x) = ⟨x, x⟩ = ∥x∥2 .

Cette fonction est polynomiale donc C ∞ et nous avons déjà calculé la différentielle de g :

dg(x)(h) = 2⟨x, h⟩.

Ainsi
dg(x− )(x− ) = 2 ̸= 0
donc la forme linéaire dg(x− ) est non nulle. Ainsi f : SE → R admet un minimum global en
x− et SE = g −1 {1} et dg(x− ) ̸= 0, nous pouvons donc invoquer le théorème des extrema
liés et en déduire qu’il existe un réel λ tel que

df (x− ) = λdg(x− ).

On calcule aisément

df (x)(h) = ⟨u(h), x⟩ + ⟨u(x), h⟩ = ⟨h, u(x)⟩ + ⟨u(x), h⟩ = ⟨u(x), h⟩ + ⟨u(x), h⟩ = 2⟨u(x), h⟩.

Ainsi pour tout h ∈ E :


2⟨u(x− ), h⟩ = λ2⟨x− , h⟩

5
Ce qui est équivalent 2 à
u(x) = λx− .
Enfin puisque x− ∈ SE , x− n’est pas le vecteur nul et donc λ est une valeur propre de u.

Une version plus élaborée


Il existe une version plus élaborée du théorème des extrema liés où on impose plusieurs
contraintes : Théorème Soit E un evn, Ω un ouvert de E et f, g1 , . . . , gk : Ω → R des fonc-
tions de classe C 1 et soit c1 , . . .k ∈ R on suppose que Σ = {p ∈ Ω; ∀i ∈ {1, . . . , k} : gi (p) = ci }
est non vide, que p ∈ Σ est un extremum local de f : Σ → R et que dg1 (p), dg2 (p), . . . , dgk (p)
est une famille libre alors il existe des réels λ1 , . . . , λk , appelés multiplicateurs de Lagrange
tel que
k
X
df (p) = λj dgj (p).
j=1

Si les fonctions f, g1 , . . . , gk sont de classe C 2 et qu’en plus p ∈ Σ est un minimum local de


f : Σ → R alors
Xk
∀h ∈ E : d2 f (p)(h, h) ≥ λj d2 gj (p)(h, h).
j=1

Preuve du théorème des extrema liés


On va utiliser le fait suivant d’algèbre linéaire 3 : Soit E un K espace vectoriel et ℓ ∈
L(E, K) une forme linéaire non nulle et H l’hyperplan défini par H = ker ℓ. Si ℓ′ ∈ L(E, K)
alors ℓ′ est proportionnelle à ℓ si et seulement si

H ⊂ ker ℓ′ .

Autrement dit il existe un scalaire λ ∈ K tel que ℓ′ = λℓ si et seulement si

ξ ∈ E et ℓ(ξ) = 0 ⇒ ℓ′ (ξ) = 0.

On pourra remarquer que lorsque E est un espace vectoriel normé ( et que K = R donc)
ce résultat implique le théorème des extrema liés lorsque f et g sont des fonctions affines.
Nous pouvons maintenant élaborer la preuve du théorème des extrema liés. Il n’y a rien
à démontrer si df (p) = 0. On suppose donc que df (p) ̸= 0 et on considère donc un vecteur
⃗u ∈ E tel que df (p)(⃗u) = −1. Soit ⃗v ∈ E tel que df (p)(⃗v ) = 0. On va démontrer que
dg(p)(⃗v ) = 0. Ce qui permettra avec le rappel d’algèbre linéaire fait ci-dessus d’en conclure
qu’il y a un µ ∈ R tel que
dg(p) = µdf (p).
2. car ceci implique que
∀h ∈ E : ⟨u(x− ) − λx− , h⟩ = 0.

3. Dont la preuve est la suivante. Seule l’implication réciproque mérite d’être démontré. Supposons donc
que H ⊂ ker ℓ′ . Puisque ℓ ̸= 0 il y a ξ1 ∈ E tel que ℓ(ξ1 ) ̸= 0. On pose ξ = (ℓ(ξ1 ))−1 ξ1 ainsi ℓ(ξ) = 1.
Posons λ = ℓ′ (ξ). Soit η ∈ E alors pour x = ℓ(η) on calcule ℓ(η − xξ) = ℓ(η) − xℓ(ξ) = ℓ(η) − x = 0 par
définition de x. Ainsi ℓ′ (η − xξ) = 0 donc
ℓ′ (η) = xℓ′ (ξ) = λx = λℓ(η).
Ceci étant valide pour tout η ∈ E nous avons bien démontré que ℓ′ = λℓ.

6
Si dg(p) ̸= 0 alors forcement µ ̸= 0 et pour λ = 1/µ on a bien

df (p) = λdg(p).

Supposons que dg(p)(⃗v ) ̸= 0 alors quite à changer ⃗v en


−1
w
⃗ = (dg(p)(⃗v )) ⃗v

qui est toujours un vecteur vérifiant df (p)(w)


⃗ = 0 on peut supposer que dg(p)(⃗v ) = 1. Posons
α = dg(p)(⃗u). Par hypothèse on dispose d’un ouvert U ⊂ Ω tel que

x ∈ U et g(x) = g(p) ⇒ f (x) ≥ f (p).

On introduit alors
O = {(s, t) ∈ R2 ; p + s⃗u + t⃗v ∈ U}
c’est l’image de l’ouvert U par l’application continue (s, t) ∈ R2 7→ p + s⃗u + t⃗v ∈ E. C’est
donc un ouvert contenant le point 0R2 = (0, 0). On introduit alors les fonctions définies sur
O par
φ(s, t) = f (p + s⃗u + t⃗v ) − f (p) et ψ(s, t) = g(p + s⃗u + t⃗v ) − g(p).
Nous avons donc l’implication

(s, t) ∈ O et ψ(s, t) = 0 ⇒ φ(s, t) ≥ 0

et donc par contraposée

(s, t) ∈ O et φ(s, t) < 0 ⇒ ψ(s, t) ̸= 0.

On dispose par ailleurs des développements limités suivant 4 :

φ(s, t) = −s + (|s| + |t|) ϵ1 (s, t) et ψ(s, t) = αs + t + (|s| + |t|) ϵ2 (s, t)

où
lim ϵ1 (s, t) = 0 et lim ϵ2 (s, t) = 0.
(s,t)→0R2 (s,t)→0R2

1
Posons ϵ = 2+|α| alors il y a un réel δ > 0 tel que

(|s| + |t|) < δ ⇒ |ϵ1 (s, t)| < ϵ.


ϵ
Alors si s > 1−ϵ |t| alors

φ(s, t) = −s + (|s| + |t|) ϵ ≤ −s(1 − ϵ) + ϵ|t| < 0

donc ψ(s, t) ̸= 0. Or l’ouvert


 
ϵ
∆ = (s, t) ∈ R2 ; (|s| + |t|) < δ et s > |t|
1−ϵ
4. car
∂φ ∂φ
u) = −1,
(0, 0) = df (p)(⃗ (0, 0) = df (p)(⃗v ) = 0
∂s ∂t
et
∂ψ ∂φ
(0, 0) = dg(p)(⃗
u) = α, (0, 0) = dg(p)(⃗
u) = 1.
∂s ∂t

7
est connexe. Sur cet ouvert connexe la fonction continue ψ ne s’annule donc garde un signe
ϵ 1
constant. On calcule 1−ϵ = 1+|α| donc pour τ ̸= 0 assez petit
 
|τ |
1 ,τ ∈ ∆.
2 + |α|

Or  
|τ | α|τ |
ψ 1 ,τ = 1 + τ + |τ |ϵ3 (τ )
2 + |α| 2 + |α|
où
lim ϵ3 (τ ) = 0.
τ →0

Il y a donc un réel η > 0 tel que


1
|τ | ≤ η ⇒ ϵ3 (τ ) ≤
1 + |α|

ce qui implique que si |τ | ≤ η alors


   
|τ | |α| 1
ψ 1 ,τ − τ ≤ 1 + |τ | < |τ |.
2 + |α| 2 + |α|
1 + |α|

ce qui implique que pour 0 < τ ≤ η alors


 
|τ |
ψ 1 ,τ > 0
2 + |α|

alors que lorsque 0 > τ > −η alors


 
|τ |
ψ 1 ,τ < 0.
2 + |α|

Ce qui est une contradiction avec le fait que


 
|τ |
τ ∈] − η, 0[∪]0, η[7→ ψ 1 ,τ
2 + |α|

ne change pas de signe. Q.E.D.

Vous aimerez peut-être aussi