Cours L3 : Topologie et calcul différentiel :
Points critiques et extremum
On rappelle ici les définitions de minimum/maximum.
Définitions : Soit (X, d) un espace métrique et f : X → R une fonction à valeurs réelles et
x0 ∈ X. On dit que
— f a un minimum global en x0 si pour tout x ∈ X alors f (x) ≥ f (x0 ) ; autrement dit
si f (x0 ) = min f (X) = min{f (x), x ∈ X}.
— f a un minimum local en x0 s’il existe ϵ > 0 tel que lorsque x ∈ B(x0 , ϵ) alors
f (x) ≥ f (x0 ) ; autrement dit si f (x0 ) = min f (B(x0 , ϵ)) = min{f (x), x ∈ B(x0 , ϵ)}.
— f a un maximum global en x0 si pour tout x ∈ X alors f (x) ≤ f (x0 ) ; autrement dit
si f (x0 ) = max f (X) = min{f (x), x ∈ X}.
— f a un maximum local en x0 s’il existe ϵ > 0 tel que lorsque x ∈ B(x0 , ϵ) alors
f (x) ≤ f (x0 ) ; autrement dit si f (x0 ) = min f (B(x0 , ϵ)) = max{f (x), x ∈ B(x0 , ϵ)}.
On peut aussi introduire les notions de minimum/maximum global/local strict ; par exemple,
f admet un minimum global strict en x0 si
∀x ∈ X \ {x0 } : f (x) > f (x0 ).
On dira que f un extremum local en x0 ∈ X si f a un minimum local ou un maximum local
en x0 .
Conditions nécéssaires
Proposition : Soit E un espace vectoriel normé , Ω ⊂ E un ouvert de E, et f : Ω → R
une fonction différentiable. Si f a un extremum local en p ∈ Ω alors
df (p) = 0.
Si de plus f est de classe C 2 et que f a un maximum local en p ∈ Ω alors
∀h ∈ E : d2 f (p)(h, h) ≤ 0.
Preuve : Supposons que f a un maximum local en p ∈ Ω. Et considérons h ∈ E \ {0} et
O = {t ∈ R, p + th ∈ Ω} et posons pour t ∈ O :
φh (t) = f (p + th) − f (p).
L’ensemble O est l’image réciproque de l’ouvert Ω par l’application continue
t ∈ R 7→ p + th
donc O est un ouvert de R contenant 0. Il est aisé de vérifier que φh est dérivable sur O et que
φh a un maximum local 1 en 0, ainsi φ′h (0) = 0 or φ′h (0) = df (p)(h). Puisque df (p)(0) = 0,
1. En effet si on dispose d’un réel ϵ > 0 tel que
m ∈ B(p, ϵ) : f (m) ≤ f (p)
alors
t ∈ −ϵ∥h∥−1 , ϵ∥h∥−1 ⇒ p + th ∈ B(p, ϵ) ⇒ f (p + th) ≤ f (p) ⇒ φh (t) ≤ 0 = φh (0)
nous avons démontré que pour tout h ∈ E :
df (p)(h) = 0
c’est à dire que la forme linéaire df (p) est nulle.
Lorsque f est de classe C 2 alors φh est aussi de classe C 2 et on sait donc que d2 f (p)(h, h) =
φ′′h (0) ≤ 0. Q.E.D.
Définition : Soit E un espace vectoriel normé , Ω ⊂ E un ouvert de E, et f : Ω → R
une fonction différentiable. On appelle point critique de f tout point p ∈ Ω tel que
df (p) = 0.
Condition suffisante
Proposition : Soit E un espace vectoriel normé , Ω ⊂ E un ouvert de E, et f : Ω → R
une fonction C 2 . Si p ∈ Ω est un point critique de f et qu’il existe un réel λ > 0 tel que
∀h ∈ E : d2 f (p)(h, h) ≤ −λ∥h∥2
alors f a un maximum local strict en p.
Remarque : On laisse au lecteur le soin de formuler une condition suffisante pour qu’un
point p ∈ Ω soit un minimum local de f .
Preuve : Puisque f est de classe C 2 , x 7→ d2 f (x) est continue de Ω vers Bc (E × E, R) qui
est l’espace de Banach des formes bilinéaires continues sur E × E équipé de la norme
|β(h, k)|
β ∈ Bc (E × E, R) : ∥β∥ = sup .
h,k∈E\{0} ∥h∥ ∥k∥
Il y a donc un réel ϵ > 0 tel que B(p, ϵ) ⊂ Ω et
1
∀x ∈ B(p, ϵ) : ∥d2 f (x) − d2 f (p)∥ ≤ λ.
2
Ainsi pour tout x ∈ B(p, ϵ) et tout h ∈ E, nous avons
1
(d2 f (x) − d2 f (p))(h, h) = d2 f (x)(h, h) − d2 f (p)(h, h) ≤ λ ∥h∥2 .
2
Alors pour x ∈ B(p, ϵ) et h ∈ E ; nous avons
d2 f (x)(h, h) = d2 f (p)(h, h) + (d2 f (x)(h, h) − d2 f (p)(h, h))
1
≤ −λ∥h∥2 + λ ∥h∥2
2
1
≤ − λ ∥h∥2 .
2
Puisque B(p, ϵ) est convexe, nous pouvons employer la formule de Taylor avec reste intégrale :
2
pour x ∈ B(p, ϵ) :
Z 1
f (x) = f (p) + df (p)(x − p) + (1 − s)d2 f (p + s(x − p))(x − p, x − p)ds
0
Z 1
= f (p) + (1 − s)d2 f (p + s(x − p))(x − p, x − p)ds car on a supposé df (p) = 0
0
Z 1
λ λ
≤ f (p) + (1 − s) − ∥x − p∥2 ds car ∀s ∈ [0, 1] : d2 f (p + s(x − p))(x − p, x − p) ≤ − ∥x − p∥2
0 2 2
λ
≤ f (p) − ∥x − p∥2 .
4
Ainsi x ∈ B(p, ϵ) et x ̸= p implique que f (x) ≤ f (p) − λ4 ∥x − p∥2 < f (p). Ce qui est le
résultat annoncé.
Cas de la dimension finie
Si Ω est un ouvert de Rn et f : Ω → R une fonction différentiable alors p ∈ Ω est un
point critique de f si et seulement si
∂f
∀i ∈ {1, . . . , n} : (p) = 0.
∂xi
Puisque d2 f (p) est une forme bilinéaire symétrique, elle est associée à la forme quadratique
Qp : Rn → R définie par
Qp (h) = d2 f (p)(h, h).
La matrice de cette forme bilinéaire symétrique dans la base canonique (e1 , . . . , en ) de Rn
est la matrice hessienne de f :
2
∂ f
Hess f (p) = d2 f (p)(ei , ej ) 1≤i,j≤n =
(p) ;
∂xi ∂xj 1≤i,j≤n
Pn
Si h = (h1 , . . . , hn ) = j=1 hj ej alors
h1
d2 f (p)(h, h) = (h1 , . . . , hn )Hess f (p) ...
hn
2
X ∂ f
= (p)hi hj
i,j
∂xi ∂xj
n
X ∂2f X ∂2f
= (p)h2i + 2 (p)hi hj .
j=1
∂x2i ∂xj ∂xi ∂xj
1≤i<j≤n
On sait qu’il y a une matrice orthogonal U ∈ O(n) et des réels λ1 , . . . , λn tels que
Hess f (p) = U Diag(λ1 , . . . , λn )U −1 .
Et si on note λ− la plus petite des valeurs propres de la matrice hessienne de f en p et λ+
la plus grande des valeurs propres de la matrice hessienne de f en p :
λ− = min {λi , i ∈ {1, . . . , , n}} et λ+ = max {λi , i ∈ {1, . . . , n}} ,
3
alors
λ− ∥h∥22 ≤ d2 f (p)(h, h) ≤ λ+ ∥h∥22 ;
où sX
∥h∥2 = h2j .
j
Et on obtient les critères suivants :
Proposition : Soit Ω un ouvert de Rn et f : Ω → R une fonction de classe C 2 et p ∈ Ω un
point critique de f et λ− la plus petite des valeurs propres de la matrice hessienne de f en
p et λ+ la plus grande des valeurs propres de la matrice hessienne de f en p :
— Si f a un minimum local en p alors λ− ≥ 0
— Si f a un maximum local en p alors λ+ ≤ 0
— Si λ− > 0 alors f a un minimum local strict en p.
— Si λ+ < 0 alors f a un maximum local strict en p.
Un exemple
On étudie la fonction φ définie sur R2 par
φ(x, y) = x3 + y 3 − 3xy.
Cette fonction est polynomiale donc C ∞ . De plus
∂φ ∂φ
p = (x, y) est un point critique de f si et seulement si (p) = (p) = 0.
∂x ∂y
Donc
3x2 − 3y = 0
p = (x, y) est un point critique de f ⇔
3y 2 − 3x = 0
x2 − y = 0
⇔
y2 − x = 0
x2 + y 2 = x + y
⇔
x2 − y 2 − y + x = 0
x2 + y 2 = x + y
⇔
(x − y)(x + y) − y + x = 0
x2 + y 2 = x + y
⇔
(x − y)(x + y + 1) = 0
x2 + y 2 = x + y
⇔
x − y = 0 ou x + y = −1
⇔ (x, y) = (0, 0) ou (x, y) = (1, 1)
Les points critiques de φ sont donc (0, 0) et (1, 1). De plus
6x −3
Hess φ (x, y) = .
−3 6y
En (0, 0) la matrice hessienne de φ a deux valeurs propres de signe opposé, à savoir 3 et −3
donc (0, 0) n’est pas un extremum local de φ. En (1, 1) la matrice hessienne de φ a deux
valeurs propres strictement positives, à savoir 3 et 9 donc (1, 1) un minimum local strict de
φ.
On remarquera que φ(R2 ) = R et donc φ n’a ni maximum global ni munimum local.
4
Extrema liés
Théorème Soit E un espace vectoriel normé , Ω un ouvert de E et f, g : Ω → R deux
fonctions de classe C 1 et soit c ∈ R on suppose que Σ = {p ∈ Ω; g(p) = c} est non vide, que
p ∈ Σ est un extremum local de f : Σ → R et que dg(p) ̸= 0 alors il existe un réel, λ, appelé
multiplicateur de Lagrange tel que
df (p) = λ dg(p).
Un exemple
Soit E un espace euclidien et u : E → E un endomorphisme auto-adoint, c’est à dire
∀x, y ∈ E : ⟨u(x), y⟩ = ⟨x, u(y)⟩.
Nous allons démontrer que u a une valeur propre réelle.
Introduisons pour cela la sphère unité de E :
p
SE = {x ∈ E ; ∥x∥ = ⟨x, x⟩ = 1}.
C’est l’image réciproque du fermé {1} par l’application norme ∥ • ∥ qui est continue, donc la
sphère unité est un ensemble fermé de E. Par définition SE est une partie bornée de E. Or
un espace euclidien est un espace vectoriel normé de dimension finie, par conséquent, une
partie fermée et bornée de E, comme SE , est une partie compacte de E. On introduit alors
f (x) = ⟨u(x), x⟩. C’est une fonction polynomiale donc C ∞ , ainsi sa restriction à la sphère
unité est une fonction continue définie sur une partie compacte, elle atteint ses bornes ; en
particulier il existe un x− ∈ SE telle que
f (x− ) = min{f (x), x ∈ SE }.
On introduit alors la fonction g : E → R définie par
g(x) = ⟨x, x⟩ = ∥x∥2 .
Cette fonction est polynomiale donc C ∞ et nous avons déjà calculé la différentielle de g :
dg(x)(h) = 2⟨x, h⟩.
Ainsi
dg(x− )(x− ) = 2 ̸= 0
donc la forme linéaire dg(x− ) est non nulle. Ainsi f : SE → R admet un minimum global en
x− et SE = g −1 {1} et dg(x− ) ̸= 0, nous pouvons donc invoquer le théorème des extrema
liés et en déduire qu’il existe un réel λ tel que
df (x− ) = λdg(x− ).
On calcule aisément
df (x)(h) = ⟨u(h), x⟩ + ⟨u(x), h⟩ = ⟨h, u(x)⟩ + ⟨u(x), h⟩ = ⟨u(x), h⟩ + ⟨u(x), h⟩ = 2⟨u(x), h⟩.
Ainsi pour tout h ∈ E :
2⟨u(x− ), h⟩ = λ2⟨x− , h⟩
5
Ce qui est équivalent 2 à
u(x) = λx− .
Enfin puisque x− ∈ SE , x− n’est pas le vecteur nul et donc λ est une valeur propre de u.
Une version plus élaborée
Il existe une version plus élaborée du théorème des extrema liés où on impose plusieurs
contraintes : Théorème Soit E un evn, Ω un ouvert de E et f, g1 , . . . , gk : Ω → R des fonc-
tions de classe C 1 et soit c1 , . . .k ∈ R on suppose que Σ = {p ∈ Ω; ∀i ∈ {1, . . . , k} : gi (p) = ci }
est non vide, que p ∈ Σ est un extremum local de f : Σ → R et que dg1 (p), dg2 (p), . . . , dgk (p)
est une famille libre alors il existe des réels λ1 , . . . , λk , appelés multiplicateurs de Lagrange
tel que
k
X
df (p) = λj dgj (p).
j=1
Si les fonctions f, g1 , . . . , gk sont de classe C 2 et qu’en plus p ∈ Σ est un minimum local de
f : Σ → R alors
Xk
∀h ∈ E : d2 f (p)(h, h) ≥ λj d2 gj (p)(h, h).
j=1
Preuve du théorème des extrema liés
On va utiliser le fait suivant d’algèbre linéaire 3 : Soit E un K espace vectoriel et ℓ ∈
L(E, K) une forme linéaire non nulle et H l’hyperplan défini par H = ker ℓ. Si ℓ′ ∈ L(E, K)
alors ℓ′ est proportionnelle à ℓ si et seulement si
H ⊂ ker ℓ′ .
Autrement dit il existe un scalaire λ ∈ K tel que ℓ′ = λℓ si et seulement si
ξ ∈ E et ℓ(ξ) = 0 ⇒ ℓ′ (ξ) = 0.
On pourra remarquer que lorsque E est un espace vectoriel normé ( et que K = R donc)
ce résultat implique le théorème des extrema liés lorsque f et g sont des fonctions affines.
Nous pouvons maintenant élaborer la preuve du théorème des extrema liés. Il n’y a rien
à démontrer si df (p) = 0. On suppose donc que df (p) ̸= 0 et on considère donc un vecteur
⃗u ∈ E tel que df (p)(⃗u) = −1. Soit ⃗v ∈ E tel que df (p)(⃗v ) = 0. On va démontrer que
dg(p)(⃗v ) = 0. Ce qui permettra avec le rappel d’algèbre linéaire fait ci-dessus d’en conclure
qu’il y a un µ ∈ R tel que
dg(p) = µdf (p).
2. car ceci implique que
∀h ∈ E : ⟨u(x− ) − λx− , h⟩ = 0.
3. Dont la preuve est la suivante. Seule l’implication réciproque mérite d’être démontré. Supposons donc
que H ⊂ ker ℓ′ . Puisque ℓ ̸= 0 il y a ξ1 ∈ E tel que ℓ(ξ1 ) ̸= 0. On pose ξ = (ℓ(ξ1 ))−1 ξ1 ainsi ℓ(ξ) = 1.
Posons λ = ℓ′ (ξ). Soit η ∈ E alors pour x = ℓ(η) on calcule ℓ(η − xξ) = ℓ(η) − xℓ(ξ) = ℓ(η) − x = 0 par
définition de x. Ainsi ℓ′ (η − xξ) = 0 donc
ℓ′ (η) = xℓ′ (ξ) = λx = λℓ(η).
Ceci étant valide pour tout η ∈ E nous avons bien démontré que ℓ′ = λℓ.
6
Si dg(p) ̸= 0 alors forcement µ ̸= 0 et pour λ = 1/µ on a bien
df (p) = λdg(p).
Supposons que dg(p)(⃗v ) ̸= 0 alors quite à changer ⃗v en
−1
w
⃗ = (dg(p)(⃗v )) ⃗v
qui est toujours un vecteur vérifiant df (p)(w)
⃗ = 0 on peut supposer que dg(p)(⃗v ) = 1. Posons
α = dg(p)(⃗u). Par hypothèse on dispose d’un ouvert U ⊂ Ω tel que
x ∈ U et g(x) = g(p) ⇒ f (x) ≥ f (p).
On introduit alors
O = {(s, t) ∈ R2 ; p + s⃗u + t⃗v ∈ U}
c’est l’image de l’ouvert U par l’application continue (s, t) ∈ R2 7→ p + s⃗u + t⃗v ∈ E. C’est
donc un ouvert contenant le point 0R2 = (0, 0). On introduit alors les fonctions définies sur
O par
φ(s, t) = f (p + s⃗u + t⃗v ) − f (p) et ψ(s, t) = g(p + s⃗u + t⃗v ) − g(p).
Nous avons donc l’implication
(s, t) ∈ O et ψ(s, t) = 0 ⇒ φ(s, t) ≥ 0
et donc par contraposée
(s, t) ∈ O et φ(s, t) < 0 ⇒ ψ(s, t) ̸= 0.
On dispose par ailleurs des développements limités suivant 4 :
φ(s, t) = −s + (|s| + |t|) ϵ1 (s, t) et ψ(s, t) = αs + t + (|s| + |t|) ϵ2 (s, t)
où
lim ϵ1 (s, t) = 0 et lim ϵ2 (s, t) = 0.
(s,t)→0R2 (s,t)→0R2
1
Posons ϵ = 2+|α| alors il y a un réel δ > 0 tel que
(|s| + |t|) < δ ⇒ |ϵ1 (s, t)| < ϵ.
ϵ
Alors si s > 1−ϵ |t| alors
φ(s, t) = −s + (|s| + |t|) ϵ ≤ −s(1 − ϵ) + ϵ|t| < 0
donc ψ(s, t) ̸= 0. Or l’ouvert
ϵ
∆ = (s, t) ∈ R2 ; (|s| + |t|) < δ et s > |t|
1−ϵ
4. car
∂φ ∂φ
u) = −1,
(0, 0) = df (p)(⃗ (0, 0) = df (p)(⃗v ) = 0
∂s ∂t
et
∂ψ ∂φ
(0, 0) = dg(p)(⃗
u) = α, (0, 0) = dg(p)(⃗
u) = 1.
∂s ∂t
7
est connexe. Sur cet ouvert connexe la fonction continue ψ ne s’annule donc garde un signe
ϵ 1
constant. On calcule 1−ϵ = 1+|α| donc pour τ ̸= 0 assez petit
|τ |
1 ,τ ∈ ∆.
2 + |α|
Or
|τ | α|τ |
ψ 1 ,τ = 1 + τ + |τ |ϵ3 (τ )
2 + |α| 2 + |α|
où
lim ϵ3 (τ ) = 0.
τ →0
Il y a donc un réel η > 0 tel que
1
|τ | ≤ η ⇒ ϵ3 (τ ) ≤
1 + |α|
ce qui implique que si |τ | ≤ η alors
|τ | |α| 1
ψ 1 ,τ − τ ≤ 1 + |τ | < |τ |.
2 + |α| 2 + |α|
1 + |α|
ce qui implique que pour 0 < τ ≤ η alors
|τ |
ψ 1 ,τ > 0
2 + |α|
alors que lorsque 0 > τ > −η alors
|τ |
ψ 1 ,τ < 0.
2 + |α|
Ce qui est une contradiction avec le fait que
|τ |
τ ∈] − η, 0[∪]0, η[7→ ψ 1 ,τ
2 + |α|
ne change pas de signe. Q.E.D.