0% ont trouvé ce document utile (0 vote)
5 vues83 pages

Intl

Le document traite de l'intégrale de Lebesgue, en commençant par des rappels sur les cardinaux et la dénombrabilité, suivis de définitions concernant les tribus et les mesures. Il aborde également les propriétés des fonctions mesurables et les techniques d'intégration, ainsi que la construction et l'unicité des mesures. Enfin, il explore les liens entre l'intégrale de Riemann et l'intégrale de Lebesgue, ainsi que la mesure produit.

Transféré par

oussamaaithoumane
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
5 vues83 pages

Intl

Le document traite de l'intégrale de Lebesgue, en commençant par des rappels sur les cardinaux et la dénombrabilité, suivis de définitions concernant les tribus et les mesures. Il aborde également les propriétés des fonctions mesurables et les techniques d'intégration, ainsi que la construction et l'unicité des mesures. Enfin, il explore les liens entre l'intégrale de Riemann et l'intégrale de Lebesgue, ainsi que la mesure produit.

Transféré par

oussamaaithoumane
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Intégrale de Lebesgue

T. Deheuvels
Table des matières

1 Rappels : cardinaux et dénombrabilité 9


1.1 Cardinalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Ensembles infinis, ensembles dénombrables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2 Tribus, tribu borélienne 13


2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Tribu borélienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2.1 Espace topologique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2.2 Tribu borélienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 Tribu image réciproque, tribu image . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3.1 Tribu image réciproque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3.2 Tribu image . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3.3 Lemme de transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3 Mesures 19
3.1 Définitions et exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2 Propriétés des mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.3 Mesure de Lebesgue sur Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.4 Ensembles négligeables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

4 Fonctions mesurables 25
4.1 Mesurabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.2 Montrer la mesurabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.3 Propriétés des fonctions mesurables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.4 Suites de fonctions mesurables à valeurs réelles . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.5 Approximation des fonctions mesurables à valeurs réelles . . . . . . . . . . . . . . . . . . . . 28

5 Intégrale de Lebesgue 31
5.1 Intégration des fonctions étagées positives . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.2 Intégration des fonctions mesurables positives . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.2.2 Théorème de Beppo Levi et conséquences . . . . . . . . . . . . . . . . . . . . . . . . 34
5.2.3 Inégalité de Markov et conséquences . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5.2.4 Lemme de Fatou . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3 Fonctions intégrables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3.1 L’espace L 1 (E, A , µ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3.2 Propriétés des fonctions intégrables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5.3.3 Formule de transfert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3
4 TABLE DES MATIÈRES

5.4 Théorème de convergence dominée et applications . . . . . . . . . . . . . . . . . . . . . . . . 41


5.4.1 Théorème de convergence dominée . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.4.2 Intégrales dépendant d’un paramètre . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.5 Lien entre l’intégrale de Riemann et l’intégrale de Lebesgue . . . . . . . . . . . . . . . . . . . 43
5.5.1 Intégrale de Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.5.2 Fonctions Riemann-intégrables et fonctions Lebesgue-intégrables . . . . . . . . . . . . 44

6 Construction de mesures - Unicité 47


6.1 Construction de mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
6.1.1 Mesures extérieures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
6.1.2 La mesure de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
6.2 Unicité des mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6.2.1 Lemme des classes monotones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
6.2.2 Théorème d’unicité des mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.2.3 Unicité de la mesure de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.3 Tribu complétée, mesure complétée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
6.3.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
6.3.2 Complétion de B(R) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

7 Mesure produit 57
7.1 Tribu produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.1.2 Sections . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7.2 Mesure produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.3 Théorèmes de Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

8 Changement de variable 63
8.1 Changement de variable affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
8.2 Théorème de changement de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
8.2.1 Difféomorphismes et inversion globale . . . . . . . . . . . . . . . . . . . . . . . . . . 64
8.2.2 Le théorème de changement de variables et quelques applications . . . . . . . . . . . 64

9 Espaces Lp 67
9.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
9.1.1 Espaces L p , espaces Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
9.1.2 Normes k · kp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
9.2 Inégalités de Hölder et Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
9.2.1 Inégalité de Hölder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
9.2.2 Inégalité de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
9.3 Les espaces de Banach Lpµ (E) (1 6 p 6 ∞) . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
9.3.1 Le théorème de Riesz-Fischer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
9.3.2 Lien entre convergence µ-presque partout et convergence Lpµ (E) . . . . . . . . . . . . 71
9.3.3 Théorème de convergence dominée Lp . . . . . . . . . . . . . . . . . . . . . . . . . . 72
9.4 Densité de Cc (Rd ) dans Lp (Rd ) (1 6 p < ∞) . . . . . . . . . . . . . . . . . . . . . . . . . . 72

10 Convolution et applications 75
10.1 Opérateur de translation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
10.2 Convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
10.2.1 Le cas où f, g ∈ M+ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
10.2.2 Le cas général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
10.2.3 Approximation de l’unité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
10.2.4 Régularisation par convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Introduction

Dans ce cours, deux notions essentielles et fondamentalement liées seront abordées : la notion de
mesure, et la notion d’intégration. Ces notions ont en particulier une importance capitale dans les cours
de probabilités et d’analyse fonctionnelle qui suivront.

Notion de mesure

La première question abordée est celle de la mesure : étant donné un ensemble E quelconque, comment
donner un sens à la mesure d’un sous-ensemble de E ? Quelle “place” prend une partie de E dans E ? Si
on considère une propriété particulière P sur l’ensemble E, on pourrait en répondant à ces questions
mesurer l’ensemble des points de E qui vérifient P. Si cet ensemble est de mesure nulle, on pourrait alors
donner un sens à “la propriété P est vraie presque partout dans E”.
À première vue, il semble naturel de définir une mesure sur E comme une application de P(E) dans R+
qui vérifierait µ(∅) = 0, ainsi qu’une propriété d’additivité telle que : la mesure d’une union (dénombrable)
d’ensembles deux à deux disjoints est la somme des mesures de ces ensembles. En fait, nous verrons qu’il
s’avèrera utile de définir les mesures sur un sous-ensemble A de P(E). Afin que les propriétés de la
mesure aient un sens, il convient que A ait une structure particulière. Dans la pratique, on impose que A
contienne ∅ et soit stable par passage au complémentaire et par union dénombrable : c’est la notion de
tribu.
On remarque immédiatement qu’on connait déjà des mesures :
– Le “cardinal” d’un ensemble : si A ⊂ E, µ(A) est donné par le nombre d’éléments de A si A est
un ensemble fini, et +∞ sinon. On appelle cette mesure la mesure de comptage. On se rend assez
vite compte que cette mesure est beaucoup trop imprécise dès qu’on considère des ensembles non
dénombrables : mesurer des ensembles de R de cette façon n’aurait pas beaucoup d’intérêt.
– Les probabilités : il s’agit des mesures décrites plus haut auxquelles on impose de plus que µ(Ω) = 1.
On dit que ces mesures sont de masse 1.
Nous pouvons bien sûr citer également le cas de R, ou plus généralement de Rn , pour lesquels nous
souhaitons considérer la notion de longueur, ou de volume en toute généralité. Ces notions sont en général
définies en partant de la longueur des intervalles dans R, ou du volume des pavés dans Rn . Elles ne sont
toutefois pas définies a priori pour n’importe quel sous-ensemble de R ou de Rn .
Si on s’intéresse au cas de R, la question est de savoir s’il existe une mesure λ de P(R) dans R+ telle
que pour tout intervalle I d’extrémités a, b ∈ R, λ(I) = b − a. Si on travaille avec les axiomes habituels de
la théorie des ensembles, c’est-à-dire avec l’axiome du choix, la réponse à cette question est non ! Nous
détaillerons ceci plus loin.
Nous allons donc définir une mesure qui vérifie ces propriétés sur une tribu incluse dans P(R). Pour
assurer que nous pouvons mesurer assez de parties de R, nous imposerons que cette tribu contienne
au moins les ouverts de R (donc également les fermés). Nous consacrerons une partie de ce cours à
construire proprement cette mesure, et nous nous interrogerons sur la tribu sur laquelle elle est définie. La

5
6 TABLE DES MATIÈRES

construction proposée sera valable dans Rn , ce qui définira également la notion de volume.

Lien avec l’intégration

Si on considère un ensemble E muni d’une mesure µ et un ensemble A ∈ A , il semble naturel d’associer


à la fonction 1A l’intégrale 1 · µ(A) = µ(A) :

A E

On note 1A dµ = µ(A) pour préciser que l’intégration se fait par rapport à la mesure µ. Comme il
R

est naturel de demander à l’intégrale une propriété de linéarité, on observe qu’on sait tout de suite donner
un sens à l’intégrale de fonctions du type i=1 αi 1Ai , où Ai ∈ A pour tout i :
PN

α2
α1
α3

i=1 αi 1Ai =
R PN PN
on doit avoir i=1 αi µ(Ai ). Les fonctions de ce type sont appelées les fonctions étagées.
Elles jouent dans la construction de l’intégrale de Lebesgue un rôle similaire à celui des fonctions en
escalier pour l’intégrale de Riemann. Il convient par ailleurs de noter que les fonctions en escalier sur un
intervalle de R sont exactement les fonctions étagées telles que les Ai soient tous des intervalles.

Donnons maintenant une idée de la démarche employée pour donner un sens à l’intégrale d’une fonction
f : E → R qui n’est pas nécessairement étagée. Comme nous le verrons, sous une condition dite de
mesurabilité, on peut approcher une fonction f par des fonctions étagées, que l’on sait intégrer. Une
façon de le voir est de considérer une subdivision de l’espace d’arrivée : R (à comparer avec l’intégrale de
Riemann, où on fait une subdivision de l’intervalle d’intégration) :

f
yi+1
yi
yi−1

On approche alors f par la fonction étagée i yi 1f −1 ([yi ,yi+1 [) , ce qui conduit à approcher l’intégrale
P
de
P f par−1l’intégrale de cette fonction étagée. Ceci donne la valeur approchée de −1 l’intégrale de f :
y
i i µ(f ([y , y
i i+1 [)). On note que pour que cette formule soit valide, il faut avoir f ([yi , yi+1 [) ∈ A
pour tout i. C’est une condition importante sur la fonction f , qui sera assurée par la propriété de
mesurabilité.

Il faut noter que la théorie de l’intégration de Lebesgue généralise la théorie d’intégration de Riemann :
tous les résultats propres à l’intégrale de Riemann restent vrai pour l’intégrale de Lebesgue. Nous vérifierons
ce résultat après la construction de l’intégrale de Lebesgue. En outre, la théorie de Lebesgue présente de
nombreux avantages :
TABLE DES MATIÈRES 7

– On peut intégrer davantage de fonctions. Par exemple, la fonction 1Q dont on attendrait qu’elle soit
intégrable et que son intégrale vaille 0, n’est pas Riemann-intégrable. Elle est intégrable au sens de
Lebesgue, et son intégrale est nulle.
– Les théorèmes de convergence sont vrais sous des hypothèses plus faibles. Par ailleurs, ils s’énoncent
plus simplement.
– L’intégrale de Lebesgue permet d’écrire les sommes comme des intégrales (par rapport à la mesure
de comptage). Par conséquent, tous les résultats vrais pour les intégrales le sont immédiatement
pour les séries.
– Le plus gros avantage de la théorie de Lebesgue est de permettre d’intégrer sur un ensemble différent
de R, ou Rn . les applications seront nombreuses, notamment en analyse fonctionnelle.
CHAPITRE 1

Rappels : cardinaux et dénombrabilité

1.1 Cardinalité
Définition 1.1 – On dit que deux ensembles E et F sont équipotents s’il existe une bijection de E dans
F . On note alors E ' F ou
Card E = Card F.
On dit dans ce cas que E et F ont même cardinal (attention, il ne s’agit que d’une notation !).

Remarque 1.2 – On voit immédiatement que si E, F, G sont des ensembles


 E ' E,
 si E ' F , alors F ' E,
 si E ' F et F ' G, alors E ' G.
' se comporte donc comme une relation d’équivalence (mais n’en est pas une à proprement parler puisqu’il
n’existe pas d’ensemble de tous les ensembles).

Exemples –
1. N ' 2N,
2. P(E) ' F (E, {0, 1}) = {0, 1}E : l’application A ⊂ E 7→ 1A ∈ {0, 1}E est bijective.

Notation 1.3 – Soient E et F deux ensembles. S’il existe une injection de E dans F , on notera

EF ou Card E 6 Card F

(on prendra garde aussi à cette dernière notation). Si de plus E et F ne sont pas équipotents, on notera
E ≺ F ou Card E < Card F .
De même, lorsqu’il existe une surjection de E dans F , on notera E  F ou Card E > Card F , et E  F
ou Card E > Card F lorsque de plus E et F ne sont pas équipotents.

Propriétés 1.4 –
– Si Card E 6 Card F , alors Card F > Card E.
– Si Card E > Card F , alors Card F 6 Card E (AC).

Remarque 1.5 – La démonstration du deuxième point des propriétés ci-dessus repose sur l’axiome du
choix (précisé (AC) dans l’énoncé). En fait, cet énoncé est même équivalent à l’axiome du choix.
On donne deux énoncés équivalents de l’axiome du choix :

9
10 Chapitre 1 – Rappels : cardinaux et dénombrabilité

– pour tout ensemble E non vide, il existe une fonction f : P(E) → E telle que pour tout A ⊂ E
non vide, f (A) ∈ A (une telle fonction est appelée fonction choix ),
Q
– pour toute famille (Ei )i∈I d’ensembles non vides, i∈I Ei est non vide.
Théorème 1.6 (Cantor-Bernstein) – Si E et F sont deux ensembles vérifiant Card E 6 Card F et
Card F 6 Card E, alors Card E = Card F .
Remarque 1.7 – La version duale du thérème de Cantor-Bernstein (Card E > Card F et Card F >
Card E ⇒ Card E = Card F ) peut donc se montrer en utilisant l’axiome du choix. La question de savoir
si elle est équivalente à l’axiome du choix est ouverte, mais on sait qu’on ne peut pas montrer la version
duale du théorème dans l’axiomatique de Zermelo-Fraenkel.
Proposition 1.8 – Soit E est un ensemble non vide, Card E < Card P(E).
Démonstration. Supposons qu’il existe une surjection ϕ de E dans P(E). Soit A = {x ∈ E, x 6∈ ϕ(x)}.
Comme ϕ est surjective, il existe a ∈ E tel que ϕ(a) = A. Alors :
– soit a ∈ A, alors a 6∈ ϕ(a) = A, contradiction,
– soit a 6∈ A, alors a ∈ ϕ(a) = A, contradiction.
On aboutit donc à une contradiction, et il n’existe pas de surjection de E dans P(E). En considérant
l’injection x ∈ E 7→ {x} ∈ P(E), on voit par ailleur que Card E 6 Card P(E), d’où le résultat.

1.2 Ensembles infinis, ensembles dénombrables


Définition 1.9 – On dit qu’un ensemble E est infini s’il existe une injection de N dans E (Card N 6
Card E).
Exemples –
1. R est infini : N ⊂ R donc Card N 6 Card R.
2. P(N) est infini.
Définition 1.10 – On dit qu’un ensemble E est dénombrable s’il existe une injection de E dans N
(Card E 6 Card N). Si Card E > Card N, on dit que E est non dénombrable.
Remarque 1.11 – On a la définition équivalente : E est dénombrable si et seulement si Card N > Card E
(sans l’axiome du choix).
Attention : on rencontre parfois une terminologie différente : on dit parfois que E est au plus dénombrable
si Card E 6 Card N, et que E est dénombrable si Card E = Card N.
Exemples –
1. 2N est dénombrable : n 7→ 2n est bijective.

2n si n > 0
2. Z est dénombrable : n ∈ Z 7→ est bijective.
−2n − 1 si n < 0
(n+m)(n+m+1)
3. N2 est dénombrable : (n, m) ∈ N2 7→ 2 + m est une bijection de N2 dans N.
4. Nk est dénombrable pour tout k ∈ N : par récurrence à partir du résultat pour k = 2.
5. Si E1 , . . . Ek sont des ensembles dénombrables, alors E1 × . . . × Ek est dénombrable : si pour tout
i ∈ [|1, k|], ϕi désigne une injection de Ei dans N, alors la fonction

ϕ : (x1 , . . . , xk ) ∈ E1 × . . . × Ek 7→ (ϕ1 (x1 ), . . . , ϕk (xk ))

est injective, donc Card E1 × . . . × Ek 6 Card Nk = Card N.


6. Q est dénombrable :
Q → Z×N
p
q avec p ∧ q = 1 7→ (p, q)
est injective, donc Card Q 6 Card Z × N 6 Card N.
1.2 Ensembles infinis, ensembles dénombrables 11

7. P(N) n’est pas dénombrable : Card N < Card P(N) par la proposition 1.8.
8. {0, 1}N n’est pas dénombrable : Card {0, 1}N = Card P(N).
Proposition 1.12 – Une union dénombrable d’ensembles dénombrables est dénombrable.
S
Démonstration. Soient (En )n∈N une suite d’ensembles dénombrables et E = n∈N En . Pour tout n ∈ N,
soit ϕn : N → En surjective. On introduit la fonction

ϕ : N2 → E
.
(n, m) 7→ ϕn (m)

On voit aisément que ϕ est surjective donc Card N = Card N2 > Card E, et E est dénombrable.
Théorème 1.13 – R n’est pas dénombrable.
Première démonstration. Il s’agit du célèbre procédé diagonal de Cantor. On suppose que D := [0, 1] est
dénombrable, on peut donc écrire D comme une suite : D = {xn , n ∈ N}. Pour tout n ∈ N, on note
0, x1n x2n x3n . . . une écriture décimale de xn (la suite (xkn )k peut stagner en 0 ou en 9 dans le cas où xn est
décimal). On définit alors x = 0, x1 x2 x3 . . . ∈ [0, 1] par son écriture décimale : pour tout k ∈ N,

2 si xkk = 1,

k
x =
1 sinon.

6 xn pour tout n ∈ N, donc x ∈ [0, 1] \ D, et il y a contradiction.


La construction de x assure alors que x =
Deuxième démonstration. On considère :
?
ϕ : {0, 1}N → R
P xn
(xn )n>1 7→ n>1 .
3n
La fonction ϕ est injective : soient deux suites distinctes x = (xn )n>1 et y = (yn )n>1 à valeurs dans {0, 1},
montrons que ϕ(x) 6= ϕ(y). On note n0 = min{n, xn = 6 yn }. On peut supposer que xn0 = 0 et yn0 = 1.
On a alors :

1 X yn − xn
|ϕ(y) − ϕ(x)| = n
+
3 0
n>n
3n
0

1 X yn − xn 1 X yn − xn
> − > −
3n0 n>n0
3n 3n0 n>n 3n
0

1 X 1 1 1
> − = · > 0.
3 0 n>n 3n
n 2 3n0
0

?
Alors, Card N < Card {0, 1}N 6 Card R, et R n’est pas dénombrable.
Exercice –
– Quel est le cardinal de RN ?
– Quel est le cardinal de l’ensemble O(R) des ouverts de R ?
– Quel est le cardinal des fonctions continues de R dans R ?
CHAPITRE 2

Tribus, tribu borélienne

2.1 Définitions
Soit E un ensemble. On appelle classe de parties de E tout sous-ensemble de P(E).

Définition 2.1 – On appelle tribu sur E (ou σ-algèbre) une classe de partie A ⊂ P(E) telle que :
– ∅∈A,
– si A ∈ A , alors Ac ∈ A (stabilité par complémentaire),
– si An ∈ A , n ∈ N, alors n∈N An ∈ A (stabilité par union dénombrable).
S

On dit alors que (E, A ) est un espace mesurable.

Remarque 2.2 – Par définition, une tribu A sur E est aussi stable par intersection dénombrable : si
An ∈ A , n ∈ N,
\ [ c
An = An c
∈A.
n∈N n∈N

Exemples –
1. P(E) : tribu triviale,
2. {∅, E} : tribu grossière,
3. Si A ⊂ E, {∅, A, Ac , E} est une tribu. C’est la plus petite tribu sur E contenant A.
4. A = {A ⊂ E, A dénombrable ou Ac dénomrable} est une tribu sur E.
Démonstration. Il est clair que ∅ ∈ A et que A est stable par passage au complémentaire.
Maintenant,
S si An ∈ A pour tout n ∈ N, alors soit tous les An sont dénombrables, et
A
n n est dénombrable, soit S
il existe n0 T
tel que An0 n’est pas dénombrable, auquel cas
c c c c
(An0 ) estSdénombrable, et ( n An ) = n (An ) ⊂ (An0 ) est dénombrable. Dans les
deux cas, n An ∈ A .

Remarque 2.3 – Une intersection quelconque de tribus sur E est une tribu sur E.

Définition-Proposition 2.4 – Soit C une classe de parties de E. Il existe une plus petite tribu sur E
(au sens de l’inclusion) contenant les éléments de C . On la note σ(C ) et on l’appelle tribu engendrée par
C sur E.
En d’autres termes, pour toute tribu A sur E telle que C ⊂ A , on a σ(C ) ⊂ A .

13
14 Chapitre 2 – Tribus, tribu borélienne

Démonstration. Il suffit de poser \


σ(C ) = A.
A tribu
C ⊂A

σ(C ) est bien une tribu comme intersection de tribus.

Exemple 2.5 – Si A ⊂ E, σ({A}) = {∅, A, Ac , E}.

Exercice – Quelle est la tribu engendrée par l’ensemble {{x}, x ∈ E} des singletons de E ? (voir TD)

Il arrive fréquemment lorsqu’on est confronté à une tribu engendrée par une classe de parties C qu’on
veuille démontrer qu’une propriété vérifiée par les éléments de C reste vraie pour σ(C ) tout entière. Pour
montrer une telle chose, on pourrait vouloir essayer de décrire un élément quelconque de σ(C ) à partir
d’éléments de C . Malheureusement, il n’y a pas de procédé général pour y parvenir : un élément de
σ(C ) ne peut pas toujours être décrit comme une union dénombrable d’ensembles de C , ni comme une
intersection d’union de tels ensembles, etc. La remarque suivante suggère un procédé de démonstration
bien commode pour montrer que σ(C ) continue de vérifier une propriété vraie pour C . Nous l’utiliserons
à de nombreuses reprises dans ce cours.

Remarque 2.6 – Pour montrer que tous les éléments d’une tribu A sur E engendrée par C ⊂ P(E)
vérifient une propriété (P ), il suffit de montrer que :
– B := {B ∈ A , B vérifie (P )} est une tribu,
– ∀C ∈ C , C vérifie (P ).
Comme B ⊃ C , on aura alors B ⊃ σ(C ) = A . On aura souvent recours à ce type de raisonnement pour
monter des propriétés générales sur une tribu engendrée par une classe de parties simple.

2.2 Tribu borélienne


2.2.1 Espace topologique
On introduit ci-dessous la notion de topologie d’un ensemble E. La définition est à comparer à celle de
tribu vue plus haut.

Définition 2.7 – Soit T une classe de parties de E. On dit que T est une topologie sur E si
– ∅, E ∈ T ,
– T est stable par union quelconque,
– T est stable par intersection finie.
On appelle alors ouverts de E des éléments de la topologie T , et fermés les complémentaires des ensembles
de T . On dit alors que (E, T ) est un espace topologique.

Exemple 2.8 – (R, O(R)) est un espace topologique.

Remarque 2.9 – Une intersection quelconque de topologies sur E est encore une topologie sur E. On en
déduit que si C est une classe de parties de E, il existe une plus petite topologie sur E contenant C : il
s’agit tout simplement de l’intersection des topologies sur E qui contiennent C . On l’appelle topologie
engendrée par C .

2.2.2 Tribu borélienne


Définition 2.10 – Soit (E, T ) un espace topologique. On appelle tribu borélienne et on note B(E) la
tribu engendrée par les ouverts de E :
B(E) = σ(T ).
Les éléments de B(E) sont appelés les boréliens de E.

Remarque 2.11 –  Par définition, B(E) est aussi la tribu engendrée par les fermés de E.
2.2 Tribu borélienne 15

 En général, B(E) 6= P(E). C’est par exemple le cas pour E = R. Nous verrons en effet plus loin
qu’il est facile de construire des parties de R qui ne sont pas boréliennes, en ayant recours à l’axiome
du choix. Il est en fait possible d’exhiber de telles parties sans utiliser l’axiome du choix, mais leur
construction n’est pas triviale.
En fait, on peut montrer (sans axiome du choix) le résultat plus général :

Card B(R) = Card R.

Ce résultat est assez difficile, et sa démonstration repose sur une récurrence sur les ordinaux.
On déduit donc que Card B(R) < Card P(R). Autrement dit, les boréliens occupent une place
minuscule parmi les parties de R. Dans la pratique, il sera pourtant tout à fait satisfaisant de se
limiter à travailler dans les boréliens : en témoigne la difficulté de construire des ensembles non
boréliens !

Boréliens de R, de Rd

Nous allons donner d’autres classes de parties de R ou de Rd qui engendrent les boréliens. Leur intérêt
est que leurs éléments sont plus simples que les ouverts en général. Ce point peut s’avérer très utile, en
particulier dans l’esprit de la remarque 2.6.

Proposition 2.12 – B(R) = σ {]α, β[, α < β, α, β ∈ Q}



 
= σ {] − ∞, a[, a ∈ Q} = σ {]a, +∞[, a ∈ Q}
 
= σ {] − ∞, a], a ∈ Q} = σ {[a, +∞[, a ∈ Q} .

Démonstration. — Si α, β ∈ Q et α < β, ]α, β[∈ O(R), donc σ {]α, β[, α < β, α, β ∈ Q} ⊂ B(R).


 si Ω ∈ O(R), on a Ω = {]p, q[, p, q ∈ Q, ]p, q[⊂ Ω}. On a alors


S
Réciproquement, on remarque que
Ω ∈ σ {]α, β[, α < β, α, β ∈ Q} , ce qui fournit la deuxième inclusion.
— Si a ∈ Q, ] − ∞, a[∈ O(R) donc σ {] − ∞, a[, a ∈ Q} ⊂ B(R).


D’autre part, si α, β ∈ Q,
\  1

]α, β[ = ] − ∞, β[\] − ∞, α] = ] − ∞, β[\ −∞, α +
?
n
n∈N

donc B(R) = σ {]α, β[, α < β, α, β ∈ Q} ⊂ σ {] − ∞, a[, a ∈ Q} .


 

Les trois derniers cas se traitent de la même façon.

Remarque 2.13 – On montre de manière similaire que, plus généralement, si d ∈ N? ,

B(Rd ) = σ {]a1 , b1 [× . . . ×]ad , bd [, ai , bi ∈ Q, i = 1, . . . , d} .




La propriété de stabilité par translation suivante sera utile pour définir proprement la mesure de
Lebesgue.

Proposition 2.14 – Si B ∈ B(Rd ) et a ∈ Rd , alors B + a := {x + a, x ∈ B} est un borélien de Rd .

Démonstration. Soit a ∈ Rd , on pose A = {B ∈ B(Rd ), B + a ∈ B(Rd )}. Il est clair que A contient
O(Rd ). Par ailleurs, A est une tribu sur Rd :
 ∅∈A,
 si B ∈ A , alors B c + a = (B + a)c ∈ B(Rd ),
 si Bn ∈ A , n ∈ N, alors n (Bn + a) ∈ B(R ).
S  S d
n Bn + a =

On en déduit que A ⊃ σ(O(Rd )) = B(Rd ), d’où le résultat.

Nous verrons plus loin une manière plus directe de montrer ce résultat, à l’aide de la notion de fonction
mesurable.
16 Chapitre 2 – Tribus, tribu borélienne

Boréliens de R

On commence par introduire deux nouveaux éléments −∞ et +∞, et on note

R = R ∪ {−∞, +∞}.

On prolonge ensuite l’ordre total 6 sur R en posant

−∞ 6 x 6 +∞, ∀x ∈ R.

On munit ensuite R de la topologie engendrée par O(R) ∪ {[−∞, a[, a ∈ R} ∪ {]b, +∞], b ∈ R}. On peut
alors montrer le résultat suivant.

Proposition 2.15 – B(R) = σ {[−∞, a[, a ∈ Q} = σ {]a, +∞], a ∈ Q}


 
 
= σ {[−∞, a], a ∈ Q} = σ {[a, +∞], a ∈ Q} .

2.3 Tribu image réciproque, tribu image


Soient E et F deux ensembles, et f : E → F . Pour toute classe de paties C de F , on notera

f −1 (C ) = {f −1 (C), C ∈ C }.

2.3.1 Tribu image réciproque


Définition-Proposition 2.16 – Si B est une tribu sur F , la classe de parties f −1 (B) est une tribu sur
E. On l’appelle tribu image réciproque de B par f .

Démonstration. — ∅ = f −1 (∅) ∈ f −1 (B),


— si A ∈ A , alors A = f −1 (B) avec B ∈ B, et Ac = f −1 (B c ) ∈ f −1 (B),
— si An ∈ A , n ∈ N, alors An = f −1 (Bn ) avec Bn ∈ B, et n An = f −1 −1
S S 
n Bn ∈ f (B).
Donc A est bien une tribu sur E.

Exemple 2.17 – Soient B une tribu sur E et A ⊂ E. On considère l’injection canonique i : x ∈ A 7→ x


de A dans E. Alors, la classe de parties

{i−1 (B), B ∈ B} = {A ∩ B, B ∈ B}

est une tribu sur A. On l’appelle tribu trace de B sur A.

2.3.2 Tribu image


En général, si A est une tribu sur E, la classe de parties {f (A), A ∈ A } n’est pas une tribu sur F . Par
exemple, si E = F = {0, 1}, A = {∅, E} et f : x ∈ E 7→ 0, on a f (A ) = {∅, {0}}, qui n’est pas une tribu.
On montre facilement que B = {B ⊂ F, f −1 (B) ∈ A } est une tribu sur F . En effet,
– f −1 (∅) = ∅ ∈ A , donc ∅ ∈ B,
c
– si B ∈ B, alors f −1 (B c ) = (f −1 (B)) ∈ A , donc B c ∈ B,
– si Bn ∈ B pour tout n ∈ N, alors f −1 ( n Bn ) = n f −1 (Bn ) ∈ A , donc n Bn ∈ B.
S S S

Définition 2.18 – Si A est une tribu sur E, on appelle tribu image de A par f la tribu sur F

{B ⊂ F, f −1 (B) ∈ A }.
2.3 Tribu image réciproque, tribu image 17

2.3.3 Lemme de transport


Lemme 2.19 – Soit C une classe de parties de F , on a

σ(f −1 (C )) = f −1 (σ(C )). (2.1)

Remarque 2.20 – Les deux classes de parties de (2.1) sont des tribus sur E : σ(f −1 (C )) est la tribu sur
E engendrée par la classe de parties f −1 (C ), et f −1 (σ(C )) est la tribu image réciproque de la tribu σ(C )
par f .
Démonstration. — On remarque d’abord que f −1 (C ) ⊂ f −1 (σ(C )). Comme f −1 (σ(C )) est une tribu
contenant la classe de parties f −1 (C ) ⊂, elle contient la tribu qu’elle engendre, ie σ(f −1 (C )) ⊂
f −1 (σ(C )).
— Montrons la deuxième inclusion. Il suffit de montrer que pour tout B ∈ σ(C ), f −1 (B) ∈ σ(f −1 (C )).
On note B = {B ⊂ F, f −1 (B) ∈ σ(f −1 (C ))}. B est la tribu image par f de la tribu σ(f −1 (C )).
C’est donc une tribu, et on remarque immédiatement qu’elle contient C , elle contient donc σ(C ), ce
qui achève la démonstration.
CHAPITRE 3

Mesures

3.1 Définitions et exemples


Soit (E, A ) un espace mesurable.
Définition 3.1 – On appelle mesure sur (E, A ) une application µ : A → R+ telle que :
– µ(∅) = 0,
G  X
– si An ∈ A , n ∈ N deux à deux disjoints, alors µ An = µ(An ).
n∈N n∈N
On dit alors que (E, A , µ) est un espace mesuré.
Voici quelques exemples de mesures classiques.
– Mesure nulle : µ définie par µ(A) = 0 pour tout A ∈ A est une mesure sur (E, A ) appelée mesure
nulle.
– Mesure grossière : µ définie par µ(A) = ∞ pour tout A ∈ A \ ∅ est une mesure sur (E, A ) appelée
mesure grossière.
– Mesure de comptage : m définie par

Card A si A est fini,
m(A) =
+∞ sinon,

pour tout A ⊂ E est une mesure sur (E, P(E)), appelée mesure de comptage.
– Mesure de Dirac : si x ∈ E, δx définie par

1 si x ∈ A,
δx (A) = 1A (x) =
0 sinon,

pour tout A ∈ A est une mesure sur (E, A ) appelée mesure de Dirac au point x ∈ E.
– Si µ est une mesure sur (E, A ) et B ∈ A , alors ν : A → R+ définie par ν(A) = µ(A ∩ B) pour tout
A ∈ A est aussi une mesure sur (E, A ).
Définition 3.2 (Mesures finies, mesures σ-finies) –
– On dit qu’une mesure µ est une mesure finie si µ(E) < ∞. On appelle alors µ(E) la masse de µ.
Si µ est de masse 1, on dit que µ est une mesure de probabilité sur E, et on dit que (E, A , µ) est un
espace probabilisé.

19
20 Chapitre 3 – Mesures

– On dit qu’une mesure µ est σ-finie s’il existe une suite (En )n de A telle que E =
S
n En et
µ(En ) < ∞ pour tout n.

Exemple 3.3 – La mesure de comptage mSsur (N, P(N)) est σ-finie. En effet, pour tout n ∈ N,
m([|0, n|]) = n + 1 < ∞, et on a bien sûr N = n [|0, n|].

Remarque 3.4 – Si pour tout n ∈ N, µn est une mesure sur (E, A ), alors n µn est aussi une mesure
P
sur (E, A ) (exercice).
n αn δxn est une mesure sur (E, A ). On note ainsi
P
Par exemple, si (αn )n∈N ∈ RN + et (xn )n∈N ∈ E , alors
N

P (Ω, A , P) ayant pour valeurs


que si X est une variable aléatoire réelle discrète sur un espace probabilisé
les réels xn , n ∈ N, alors on peut écrire la loi de X sous la forme PX = n αn δxn , où αn = P(X = xn )
pour tout n ∈ N.

3.2 Propriétés des mesures


Soit µ une mesure sur l’espace mesurable (E, A ).

Proposition 3.5 (Croissance) – Si A, B ∈ A avec A ⊂ B, alors µ(A) 6 µ(B) (µ est croissante). Si de


plus µ(A) < ∞, alors
µ(B \ A) = µ(B) − µ(A).

Démonstration. A et B \ A appartiennent à A et sont disjoints, donc µ(B) = µ(A) + µ(B \ A) > µ(A).
Si µ(A) < ∞, alors µ(B) − µ(A) = µ(B \ A).

Proposition 3.6 (σ-sous-additivité) – Pour toute suite (An )n∈N d’éléments de A ,


!
[ X
µ An 6 µ(An ).
n∈N n∈N

Sn−1
Démonstration. Pour tout n, on pose Bn = An \ k=0 Ak . On note que pour tout n, Bn ∈ A , et que
B n ⊂ An .
– Les Bn sont deux à deux disjoints : si m < n, Bm ⊂ Am et Bn ∩ Am = ∅, d’où Bm ∩ Bn = ∅.
F S S Sn0 −1
– n Bn = n An : si x ∈ n An , soit n0 = min{n, x ∈ An }, alors x ∈ An0 \ k=0 Ak = Bn0 . La
deuxième inclusion est évidente.
En conséquence, [  G  X X
µ An = µ Bn = µ(Bn ) 6 µ(An ).
n∈N n∈N n∈N n∈N

Proposition 3.7 (Continuité) – Soit (An )n une suite d’éléments de A .


1. Si la suite (An ) est croissante pour l’inclusion (i.e. An ⊂ An+1 pour tout n ∈ N), alors
[ 
lim µ(An ) = µ An .
n→∞
n

On dit alors que µ est “continue à gauche”.


2. Si la suite (An ) est décroissante pour l’inclusion (i.e. An ⊂ An+1 pour tout n ∈ N) et il existe n0
tel que µ(An0 ) < ∞, alors \ 
lim µ(An ) = µ An .
n→∞
n

On dit alors que µ est “continue à droite”.

Démonstration.
3.3 Mesure de Lebesgue sur Rd 21

S
1. Notons d’abord que s’il existe n0 tel que µ(An0 ) = ∞, alors µ( n An ) = ∞, et µ(An ) = ∞ à partir
d’un certain rang, d’où le résultat.
Sinon, on introduit la suite (Bn ) définie par B0 = A0 , et pour tout n > 1, Bn = An \ An−1 . Il s’agit
en fait de la même suite que celle S construiteFdans la démonstration précédente. En particulier, les
Bn sont deux à deux disjoints, et n An = n Bn . Par conséquent,
[  G  X ∞ n
X 
µ An = µ Bn = µ(Bn ) = lim µ(Ak ) − µ(Ak−1 ) + µ(A0 ) = lim µ(An ).
n→∞ n→∞
n n n=0 k=1

2. Quitte à considérer la suite (An0 +n )n∈N , on peut supposer que µ(A0 ) < ∞. Comme (A0 \ An )n est
une suite de A croissante pour l’inclusion, on peut lui appliquer le résultat précédent. On obtient
alors [   \ 
lim µ(A0 \ An ) = µ A0 \ An = µ A0 \ An .
n→∞
n n
T
Comme µ(A0 ) < ∞, on en déduit que limn µ(A0 ) − µ(An ) = µ(A0 ) − µ( n An ), ce qui donne le
résultat.

Remarque 3.8 – L’existence de n0 avec µ(An0 ) < ∞ est nécessaire : si on considère les ensembles
An = [|n, ∞[| pour n ∈ N, la suite (ATn )n est décroissante, et on a n An = ∅. Si on munit (N, P(N)) de
T
la mesure de comptage m sur N, m( n An ) = 0, mais pour tout n, m(An ) = ∞.
On peut construire un exemple semblable avec la mesure de Lebesgue en posant An = [n, ∞[.

Exercice (voir TD) – Montrer qu’une application µ : A → R+ est une mesure sur l’espace mesurable
(E, A ) si et seulement si :
(i) µ(∅) = 0,
(ii) µ est finiment additive : si A, B ∈ A et A ∩ B = ∅, alors µ(A t B) = µ(A) + µ(B),
(iii) µ est continue à gauche.

3.3 Mesure de Lebesgue sur Rd


La mesure de Lebesgue sur R a vocation à donner un sens à la notion de longueur pour les boréliens
de R, c’est-à-dire à généraliser la notion de longueur définie pour les intervalles : si I ⊂ R est un intervalle
d’extrémités a, b ∈ R, on note sa longueur

`(I) = b − a.

Par ailleurs, si I est un intervalle non borné de R, on pose `(I) = ∞.


On cherchera plus généralement à donner un sens à la notion de volume pour tout borélien de Rd , où d
est un entier quelconque. Pour ce faire, on souhaitera généraliser la notion de volume d’un pavé de Rd : si
P = I1 × . . . × Ik est un pavé de Rd , où I1 , . . . , Id sont des intervalles de R, on note son volume
d
Y
V (P ) = `(Ik ),
k=1

avec la convention V (P ) = 0 dès qu’il existe k ∈ J1, dK tel que `(Ik ) = 0.


Nous allons en fait introduire la mesure de Lebesgue sur Rd comme l’unique mesure invariante par
translation telle que la mesure du cube unité soit 1. Nous montrerons dans la proposition 3.10 que ceci
entraı̂ne que la mesure de Lebesgue généralise la notion de volume. Nous laissons temporairement de côté
la démonstration du théorème qui suit, le chapitre 6 étant consacré aux résultats généraux qui permettent
de l’établir.

Théorème 3.9 – Soit d ∈ N? . Il existe une unique mesure λd sur (Rd , B(Rd )) telle que :
– λd ([0, 1]d ) = 1,
22 Chapitre 3 – Mesures

– λd est invariante par translation, i.e.

∀x ∈ R, ∀B ∈ B(Rd ), λd (B + x) = λd (B).

On appelle λd la mesure de Lebesgue d-dimensionnelle. Dans le cas d = 1, on appelle λ1 la mesure de


Lebesgue, et on la note plus simplement λ.
Les propriétés de la mesure de Lebesgue permettent de déduire directement que la mesure de Lebesgue
de tout intervalle correspond à sa longueur. C’est l’objet de la proposition suivante.
Proposition 3.10 – Pour tout intervalle I de R, λ(I) = `(I). En particulier, λ({x}) = 0 pour tout
x ∈ R.
Démonstration. On commence par remarquer que l’invariance par translation donne que pour tout x ∈ R,
λ({x}) = λ({0}). Par ailleurs, si n ∈ N? , la croissance de la mesure donne λ({1, 12 , . . . , n1 }) 6 λ([0, 1]) = 1,
donc nλ({0}) 6 1 par additivité, et λ({0}) 6 n1 . En laissant tendre n vers ∞, on a donc λ({0}) = 0.
F 
q k−1 k
Soit q ∈ N? . On remarque que λ k=1 q[ , q [ = λ([0, 1]) = 1. Par conséquent, qλ([0, 1q [) = 1, et
λ([0, 1q [) = 1q . L’additivité donne alors que pour tout p ∈ N, λ([0, pq [) = pq . On en déduit que si a, b ∈ Q,
alors l’invariance de λ par translation implique que λ([a, b[) = λ([0, b − a[) = b − a.
Soient maintenant a, b deux réels distincts. Il existe une suite décroissante (an ) et une suite croissante
(bn ) de rationnels
S telles que limn an = a et limn bn = b. Ainsi, par continuité à gauche de λ, on a
λ(]a, b[) = λ( n ]an , bn [) = limn λ(]an , bn [) = limn bn − an = b − a.
Si maintenant I et un intervalle non borné, il existe une suite (xn ) dans I telle que limn |xn | = ∞.
On peut supposer sans perte de généralité que limn xn = ∞ et (xn ) est croissante. Alors pour tout n,
λ(I) > λ([x0 , xn ]) = xn − x0 −→ ∞.
n→∞

Remarque 3.11 – Une conséquence immédiate est que tout ensemble dénombrable D de R est de mesure
de Lebesgue nulle : tout d’abord, D est un borélien comme union dénombrable de singletons, puis
 G  X
λ(D) = λ {x} = λ({x}) = 0.
x∈D x∈D

Attention toutefois, la réciproque est fausse : il existe des boréliens de R de mesure nulleTqui ne sont
pas dénombrables. C’est le cas par exemple de l’ensemble de Cantor K, défini par K = n∈N Kn , où
K0 = [0, 1], et Kn+1 = K3n ∪ Kn3+2 pour tout n ∈ N (le vérifier en exercice !).
Plus généralement, si P est un pavé de Rd , alors λd (P ) = V (P ). Pour le voir il suffirait d’adapter la
preuve ci-dessus dans le cas d = 1. Nous verrons par ailleurs plus loin que λd peut s’interpréter comme
une mesure produit, ce qui simplifie beaucoup la preuve de ce résultat.

Régularité de la mesure de Lebesgue

Nous avons vu que bien que les ouverts engendrent les boréliens, il n’est pas aisé du tout d’exprimer
un borélien quelconque à partir d’ouverts ou de fermés. Pourtant, nous allons voir que pour n’importe
quel borélien B de Rd , on peut trouver un ouvert contenant B et un fermé inclus dans B dont la mesure
est arbitrairement proche de celle de B. Il s’agit de la propriété de régularité de la mesure de Lebesgue
sur Rd .
La propriété proprement dite est énoncée dans le théorème 3.13 ci-dessous, et repose sur le lemme
ci-dessous.
Lemme 3.12 – Soient B ∈ B(Rd ) et ε > 0. Il existe un fermé F et un ouvert Ω de Rd tels que F ⊂ B ⊂ Ω
et λd (Ω \ F ) < ε.
Démonstration. Soient n ∈ N et λnd la mesure sur (Rd , B(Rd )) définie par λnd (B) = λd (B∩] − n, n[d ) pour
tout B ∈ B(Rd ). Nous allons d’abord montrer le résultat pour la mesure λnd . Pour ce faire, on introduit la
classe de parties

B = {B ∈ B(Rd ), ∀ε > 0, ∃F fermé, ∃Ω ouvert, F ⊂ B ⊂ Ω, λnd (Ω \ F ) < ε}.


3.3 Mesure de Lebesgue sur Rd 23

Nous allons montrer que B est une tribu contenant les pavés ouverts bornés de Rd . Comme cette classe
de parties engendre B(Rd ), ceci montrera que B = B(Rd ), et donnera le résultat pour la mesure λnd .
– On remarque d’abord que ∅ ∈ B : il suffit de prendre F = Ω = ∅.
– Ensuite, si B ∈ B, alors B c ∈ B : si F et Ω sont les ensembles associés à B pour un ε > 0, alors
Ωc ⊂ B c ⊂ F c . Comme Ωc est fermé, F c est ouvert, et λnd (F c \ Ωc ) = λnd (Ω \ F ) < ε.
– Pour finir, si (Bk )k∈N est une suite d’éléments de B et ε > 0, on sait qu’on peut construire une
suite de fermés (Fk )k∈N et une suite d’ouverts (Ωk )k∈N telles que pour tout k ∈ N, Fk ⊂ Bk ⊂ Ωk et
ε
λnd (Ωk \ Fk ) < 2k+2 .
SK
On introduit ensuite l’ouvert Ω = k∈N Ωk et les fermés F K = k=0 Fk pour tout K ∈ N. On
S
remarque qu’on a alors
   [  [ 
[ X ε
λnd Ω \ FK = λnd Ω \ Fk 6 λnd Ω k \ Fk 6 λnd (Ωk \ Fk ) < .
2
K k k k∈N

On observe ensuite que, comme la suite (Ω \ FK )K∈N est décroissante et la mesure λnd est finie, on a
 \   
[ ε
lim λnd (Ω \ FK ) = λnd Ω \ FK = λnd Ω \ FK < .
K→∞ 2
K∈N K∈N

n K K
S
S conséquent, il existe K ∈ N tel que λd (Ω \ F ) < ε. Comme on a F ⊂
Par k Bk ⊂ Ω, on a bien
B
k k ∈ B.
Nous venons de montrer que B Qdest une tribu. Pour voir qu’elle contient les pavés ouvertsQd bornés, il suffit
de se donner un tel pavé P = i=1 ]ai , bi [ et un réel ε > 0, et de choisir Ω = P , et F = i=1 [ai + η, bi + η],
Qd Qd
où η ∈]0, min( bi −a
2 )[ est choisi assez petit pour avoir
i
i=1 (bi − ai ) − i=1 (bi − ai − 2η) < ε.

Nous allons maintenant en déduire le résultat pour la mesure λd . Donnons-nous B ∈ B(Rd ) et ε > 0, et
commençons par montrer qu’il existeSun ouvert Ω de Rd tel que λd (Ω \ B) < 2ε . Pour n ∈ N, on pose
Bn = B∩] − n, n[d , de sorte que B = n Bn . Le résultat précédent permet d’affirmer que pour tout n, il
ε
existe un ouvert Ωn tel que Bn ⊂ Ωn et λnd (Ωn \ Bn ) < 2n+2 . Quitte à remplacer Ωn par Ωn ∩] − n, n[,
ε
on peut
S supposer que Ω n ⊂] − n, n[, ce qui donne en fait λ(Ω n \ Bn ) < 2n+2 . En introduisant l’ouvert
Ω = n Ωn , on a donc B ⊂ Ω, et
[  X ε
λ(Ω \ B) 6 λ Ωn \ B n 6 λ(Ωn \ Bn ) < ,
n n
2

ce qui prouve l’assertion.


On peut ensuite appliquer ce dernier résultat au borélien B c pour obtenir un ouvert ω tel que B c \ ω et
λd (ω \ B c ) < 2ε . En considérant le fermé F = ω c , on a alors λd (Ω \ F ) = λd (Ω \ B) + λd (B \ F ) < ε et
F ⊂ B ⊂ Ω, ce qui achève la preuve.

Théorème 3.13 – La mesure λd est régulière, c’est-à-dire que pour tout B ∈ B(Rd ),
i. λ(B) = inf{λ(Ω), Ω ⊃ B, Ω est ouvert},
ii. λ(B) = sup{λ(K), K ⊂ B, K est compact}.

Démonstration. Si B ∈ B(Rd ) est tel que λ(B) < ∞, alors pour tout ε, le lemme 3.12 affirme qu’il existe
un ouvert Ω ⊃ B tel que λ(B) 6 λ(Ω) 6 λ(B) + ε. En passant à l’infimum sur les ouverts contenant B, et
en laissant tendre ε vers 0, on obtient i. Par ailleurs, si λ(B) = ∞, alors i. est trivialement vérifié.
De même que ci-dessus, le lemme 3.12 montre que λ(B) = sup{λ(F ), F ⊂ B, K est fermé}. Or, si F est
un fermé vérifiant F ⊂ B et Kn = F ∩ [−n, n]d pour tout n ∈ N, alors limn→∞ λd (Kn ) = λd (F ), ce qui
montre que sup{λ(F ), F ⊂ B, K est fermé} = sup{λ(K), K ⊂ B, K est compact}.

Nous verrons au chapitre 6 une autre preuve de ce résultat, basée sur la définition de la mesure de
Lebesgue.
24 Chapitre 3 – Mesures

3.4 Ensembles négligeables


Définition 3.14 – Si (E, A , µ) est un espace mesuré, on dit qu’un ensemble N ⊂ E est µ-négligeable
(ou négligeable) s’il existe A ∈ A tel que

N ⊂ A,
µ(A) = 0.

On dit qu’une propriété P sur E est vraie µ-presque partout sur E (on note µ-p.p.) si

{x ∈ E, x ne vérifie pas la propriété P} est µ-négligeable.

Lorsque le contexte est clair, on dira aussi que P est vraie presque partout (on note p.p.). À titre
d’exemples :
– la fonction 1Q est nulle λ-presque partout,
– la fonction 1[0,∞[ : R → R est continue λ-presque partout,
– la suite de fonction (1[0, n1 ] ) ?
converge λ-presque partout vers 0.
n∈N

Remarque 3.15 – Revenons sur les deux premiers exemples ci-dessus : les fonctions 1Q et 1R+ sont
toutes deux continues λ-presque partout, mais seule la première est égale presque partout à une fonction
continue (la fonction nulle). Il faudra prendre garde à ne pas confondre ces deux propriétés.

Si (E, A , µ) est un espace mesuré et A ∈ A est tel que µ(A) = 0, la propriété de croissance de la
mesure semble suggérer qu’on sait donner un sens à la mesure de tout sous-ensemble de A, et que cette
mesure devrait être nulle. En d’autres termes, tout ensemble µ-négligeable devrait avoir une mesure nulle
également. Il peut arriver cependant qu’un tel sous-ensemble n’appartienne pas à la tribu A , et ne puisse
donc être associé à une mesure. On dit alors que l’espace mesuré n’est pas complet. Nous verrons plus loin
que c’est le cas par exemple de l’espace mesuré (R, B(R), λ).
Toutefois, nous verrons au paragraphe 6.3 qu’on peut toujours introduire une tribu Afcontenant A ,
et prolonger la mesure µ en une mesure µ̃ sur (E, Af) de manière à obtenir un espace mesuré complet. De
cette façon, nous prolongerons la tribu B(R) en une tribu B(R) e qui vérifiera Card B(R)
e = Card P(R).
On appelle B(R) la tribu de Lebesgue.
e
CHAPITRE 4

Fonctions mesurables

Dans l’introduction, nous avons évoqué une condition pour pouvoir définir l’intégrale d’une fonction
f : E → R avec l’approche de la théorie de Lebesgue, où (E, A ) est un espace mesurable. La condition
que nous avons rencontrée peut se formuler de la manière suivante :

f −1 ([a, b[) ∈ A pour tous a, b ∈ R.

Il s’agit précisément de la propriété de mesurabilité de la fonction f , comme nous allons le voir. Cette
condition sera cruciale pour pouvoir associer à f une intégrale sur E.
Plus généralement, dans ce chapitre, (E, A ) et (F, B) désigneront deux espaces mesurables, et f une
fonction de E dans F . La condition de mesurabilité sur f impose que f −1 (B) ∈ A pour tout B ∈ B.
Nous allons voir comment montrer qu’une fonction donnée est mesurable, ainsi que les propriétés de ces
fonctions.

4.1 Mesurabilité
Définition 4.1 – Une fonction f : E → F est dite (A , B)-mesurable, ou plus simplement mesurable ssi
f −1 (B) ⊂ A . Autrement dit,
∀B ∈ B, f −1 (B) ∈ A .

Si les ensembles E et F sont des espaces topologiques munis de leurs tribus boréliennes respectives, on
appelle les fonctions mesurables des fonctions boréliennes.

Souvent, l’espace d’arrivée F est R, R+ , R, C, ou Rd . Dans ce cas, sauf mention contraire, il sera sous-
entendu que F est muni de sa tribu borélienne.

Exemples
 A ) → (F, B) sont mesurables : si f ≡ c ∈ F sur E tout entier, alors
– Les fonctions constantes f : (E,
∅ si c 6∈ B
pour tout B ∈ B, f −1 (B) = . Dans tous les cas, f −1 (B) ∈ A .
E si c ∈ B
– Soit A ⊂ E, alors la fonction 1A : (E, A ) → (R, B(R)) est mesurable si et seulement si A ∈ A .
Remarque 4.2 – Dans le cas où A = P(E), toutes les fonctions de (E, A ) dans (F, B) sont mesurables.
C’est le cas par exemple des suites de réels, qui peuvent être vues comme des fonctions de (N, P(N)) dans
(R, B(R)).

25
26 Chapitre 4 – Fonctions mesurables

Mesure image

Définition-Proposition 4.3 – Si f : (E, A ) → (F, B) mesurable, alors µf définie par

µf (B) = µ(f −1 (B)), pour tout B ∈ B

définit une mesure sur (F, B), qu’on appelle mesure image par f de µ.

Démonstration. On remarque tout d’abord que µf est bien définie du fait que f est mesurable, et définit
bien une application de B dans R+ . Par ailleurs, µ(f −1
F (∅)) = µ(∅) F = 0, et si (B Pn )n est une suite
d’ensembles deux à deux disjoints de B, alors µ(f ( n Bn )) = µ( n f −1 (Bn )) = n µf (Bn ), d’où le
−1

résultat.

4.2 Montrer la mesurabilité


Dans la pratique, il est difficile de montrer directement qu’une fonction f : (E, A ) → (R, B(R)) (ou
plus généralement f : (E, A ) → (F, σ(C )) avec C ⊂ P(F )) est mesurable, du fait qu’on ne peut pas
décrire simplement les éléments d’une tribu à partir des éléments d’une tribu qui l’engendre. Une telle
description est possible en ayant recours à un procédé de récurrence transfinie. Ce procédé est beaucoup
trop compliqué pour une telle tâche, et n’est pas l’objet de ce cours.
La proposition suivante montre qu’on peut se restreindre à montrer la propriété sur une classe de parties
qui engendre la tribu d’arrivée.

Proposition 4.4 – On suppose que B = σ(C ) pour C ⊂ P(F ). Alors, f : (E, A ) → (F, B) est
mesurable si et seulement si f −1 (C ) ⊂ A .

Démonstration. Il est clair que si f −1 (B) ⊂ A alors f −1 (C ) ⊂ f −1 (B) ⊂ A . D’autre part, si f −1 (C ) ⊂


A , alors σ(f −1 (C )) ⊂ A puisque A est une tribu contenant f −1 (C ). On déduit alors du le lemme 2.19
que f −1 (σ(C )) ⊂ A , soit f −1 (B) ⊂ A .

Application 4.5 – Toute fonction f : R → R monotone est mesurable.

Démonstration. Il suffit de remarquer que si I est un intervalle de R, alors f −1 (I) est un intervalle de R,
donc un borélien. Comme les boréliens de R sont engendrés par les intervalles, f est mesurable.

Dans le cas où F = R, on utilisera les notations suivantes :

{f < a} := f −1 (] − ∞, a[) {f 6 a} := f −1 (] − ∞, a]),


{f > a} := f −1 (]a, +∞[) {f > a} := f −1 ([a, +∞[),

D’après la proposition 2.12, f : (E, A ) → (R, B(R)) est mesurable si et seulement si l’une des propriétés
suivantes est vérifiée :
∀a ∈ R, {f < a} ∈ A , ∀a ∈ R, {f 6 a} ∈ A ,
∀a ∈ R, {f > a} ∈ A , ∀a ∈ R, {f > a} ∈ A .

La même remarque vaut pour le cas où l’espace d’arrivée est R : pour montrer que f : (E, A ) → (R, B(R))
est mesurable, il suffit par exemple de vérifier que {f 6 a} := f −1 ([−∞, a]) ∈ A pour tout a ∈ R.

Continuité et mesurabilité

On considère deux espaces topologiques (E, T ) et (F, S ), que l’on munit de leurs tribus boréliennes
respectives B(E) et B(F ).

Proposition 4.6 – Une fonction f : E → F continue est borélienne (i.e.(B(E), B(F ))-mesurable).

Démonstration. Comme f est continue, on sait que si Ω est un ouvert de F , alors f −1 (Ω) est un ouvert
de E, donc un borélien de E. Ainsi, f −1 (S ) ⊂ B(E), et f est borélienne d’après la proposition 4.4.
4.3 Propriétés des fonctions mesurables 27

Application 4.7 – La proposition 4.6 fournit une nouvelle démonstration de la proposition 2.14, qui
dit que la tribu B(Rd ) est stable par translation. En effet, si a ∈ Rd et f : x ∈ Rd 7→ x − a, alors
B + a = f −1 (B) ∈ B(Rd ), du fait que f est continue donc borélienne.
On dit qu’une fonction f : E → R est semi-continue inférieurement (s.c.i) si pour tout a ∈ R, l’ensemble
{f 6 a} est fermé. On dit par ailleurs que f est semi-continue supérieurement (s.c.s) si pour tout a ∈ R,
l’ensemble {f > a} est fermé.
Proposition 4.8 – Les fonctions s.c.i. et les fonctions s.c.s. sont des fonctions boréliennes.
Démonstration. C’est immédiat : pour tout a ∈ R, {f 6 a} est un borélien, donc f est mesurable.

4.3 Propriétés des fonctions mesurables


Proposition 4.9 (Composition des fonctions mesurables) – Soient (E, A ), (F, B) et (G, C ) trois espaces
mesurables. Si f : E → F et g : F → G sont mesurables, alors g ◦ f est mesurable.
−1
Démonstration. Immédiat : (g ◦ f ) (C ) = f −1 (g −1 (C )) ⊂ A car g −1 (C ) ⊂ B.
Application 4.10 – En combinant la proposition 4.6 avec la proposition 4.9, on obtient par exemple :
– si f : E → R est mesurable, alors |f | est mesurable,
– si f : E → R? est mesurable, alors f1 est mesurable, etc.
Proposition 4.11 (Couple de fonctions mesurables) – Soit f : x ∈ E 7→ (f1 (x), f2 (x)) ∈ R2 . La fonction
f est mesurable si et seulement si les fonctions f1 et f2 le sont.
Démonstration. — Supposons que f est mesurable. On a fi = πi ◦ f , où πi : (x1 , x2 ) ∈ R2 7→ xi
(i = 1, 2). Comme les fonctions πi sont continues et f est mesurable, les fi sont mesurables.
— Supposons que f1 et f2 sont mesurables. On sait que B(R2 ) = σ {I1 × I2 , I1 , I2 intervalles de R} .


On remarque que
f −1 (I1 × I2 ) = f1 −1 (I1 ) ∩ f2 −1 (I2 ) ∈ A
car les fi sont mesurables. La proposition 4.4 implique donc que f est mesurable.
Proposition 4.12 – Si f et g sont des fonctions mesurables de (E, A ) dans (R, B(R)), alors
1. αf + g est mesurable, pour tout α ∈ R,
2. f g est mesurable.
En d’autres termes, les fonctions mesurables de (E, A ) dans (R, B(R)) forment une R-algèbre.
Démonstration. 1. On peut écrire αf + g = ψ ◦ ϕ, où ϕ(x) = (f (x), g(x)) ∈ R2 pour tout x ∈ R, et
ψ(x, y) = αx + y pour tout (x, y) ∈ R2 .
La fonction ψ est continue de R2 dans R, donc elle est (B(R2 ), B(R))-mesurable. Comme f et g
sont mesurables, la proposition 4.11 implique que la fonction ϕ est mesurable. Par conséquent, la
fonction αf + g est mesurable comme composée de fonctions mesurables.
2. On raisonne de même en prenant ψ : (x, y) 7→ xy, qui est aussi continue.

Exemple 4.13 – Les fonctions de la forme i=1 αi 1Ai , où αi ∈ R et Ai ∈ A pour tout i = 1, . . . , N ,
PN
sont des fonctions mesurables, comme combinaisons linéaires de fonctions mesurables. On les appelle des
fonctions étagées.
Proposition 4.14 – Si f : (E, A ) → (C, B(C)), f est mesurable si et seulement si Re f et Im f le
sont, et les points 1. (avec α ∈ C) et 2. de la proposition 4.12 restent vrais.
Démonstration. Si Re f et Im f sont mesurables, il suffit de remarquer que Re f + iIm f = ψ ◦ ϕ, où
ϕ(x) = (Re f (x), Im f (x)) pour tout x ∈ R, et ψ(x, y) = x + iy pour tout (x, y) ∈ R2 . Comme ϕ est
mesurable, et ψ est continue donc mesurable, on obtient que f est mesurable.
Si f est mesurable, il suffit de voir que Re f = Re ◦ f et Im f = Im ◦ f . Comme Re et Im sont des
fonctions continues de C dans R, on obtient bien que Re f et Im f sont mesurables.
Les points 1. et 2. de la proposition 4.12 dans le cas présent s’obtiennent avec la même démonstration.
28 Chapitre 4 – Fonctions mesurables

4.4 Suites de fonctions mesurables à valeurs réelles


Proposition 4.15 – Soit (fn )n une suite de fonctions mesurables de (E, A ) dans (R, B(R)). Alors
1. inf n fn : x ∈ E 7→ inf n fn (x) et supn fn : x ∈ E 7→ supn fn (x) sont mesurables,
2. lim inf n fn : x ∈ E 7→ lim inf n fn (x) et lim supn fn : x ∈ E 7→ lim supn fn (x) sont mesurables,
3. Si la suite (fn )n converge simplement vers f sur E, alors f est mesurable.

Rappel. Si (an )n∈N est une suite de R, on remarque que (inf k>n ak )n est une suite croissante, et que
(supk>n ak )n est une suite décroissante. On note

lim inf an := lim inf ak = sup inf ak ,


n n→∞ k>n n∈N k>n

lim sup an := lim sup ak = inf sup ak .


n n→∞ k>n n∈N k>n

On note aussi lim et lim pour lim inf n et lim supn .


On peut montrer que lim inf n an est la plus petite valeur d’adhérence de (an )n dans R, et que lim supn an
est la plus grande valeur d’adhérence de (an )n dans R.
Exemple. lim inf n (−1)n = −1, et lim supn (−1)n = 1.
On observe également que si lim inf n an = lim supn an =: a ∈ R, alors la suite (an )n converge, et
lim an = a.
n→∞

Démonstration. 1. Soit a ∈ R, on a :
— {inf n fn < a} = n {fn < a} ∈ A car les fn sont mesurables, donc inf n fn est mesurable,
S

— {supn fn 6 a} = n {fn 6 a} ∈ A car les fn sont mesurables, donc supn fn est mesurable.
T

2. Il suffit de remarquer que lim inf n fn = supn (inf k>n fk ). Par le point précédent, les fonctions
gn := inf k>n fk sont mesurables, donc supn gn est mesurable.
De même, on remarque que lim supn fn = inf n (supk>n fk ) et on conclut de la même manière.
3. Il suffit de remarquer que si la suite (fn )n converge simplement vers f , alors f = lim inf n fn , et le
point précédent permet de conclure.

Remarque 4.16 – On peut en fait montrer un résultat plus général dans le cadre des fonctions à valeurs
dans un espace métrique F : si (fn )n est une suite de fonctions mesurables de E dans F qui converge
simplement vers une fonction f , alors f est mesurable (voir [2]). Notons par ailleurs que le résultat devient
faux dans le cadre plus général des fonctions à valeurs dans un espace topologique quelconque.

4.5 Approximation des fonctions mesurables à valeurs réelles


Dans ce paragraphe, nous allons voir que toute fonction f : E → R mesurable peut être approchée par
une suite de fonctions étagées, au sens de la convergence simple. Dans le cas où f est positive, la suite de
fonctions étagées peut être choisie croissante. Ce résultat sera fondamental dans le chapitre suivant : couplé
au théorème de convergence monotone, il fournira un moyen très simple d’étendre certaines propriétés
vérifiées par les fonctions étagées aux fonctions mesurables.

Définition 4.17 – On appelle fonction étagée sur E toute fonction mesurable ϕ : E → R qui ne prend
qu’un nombre fini de valeurs.

Notons que si ϕ : E → R est une fonction étagée, et si on note α1 , . . . , αN ses valeurs distinctes, alors
ϕ s’écrit
N
αi 1{ϕ=αi } .
X

i=1
4.5 Approximation des fonctions mesurables à valeurs réelles 29

Plus généralement, on voit immédiatement que les fonctions étagées sur E sont exactement les fonctions
de E dans R qui s’écrivent sous la forme
N
αi 1Ai , où αi ∈ R et Ai ∈ A pour tout i ∈ J1, N K.
X

i=1

Quitte à poser Ai = {ϕ = αi }, on peut par ailleurs toujours supposer que les Ai forment une partition de
E dans cette écriture. Dans la suite, on fait toujours cette hypothèse lorsqu’on écrit une fonction étagée
sous cette forme.
On note E l’ensemble des fonctions étagées de E dans R, et E+ le sous-ensemble de E formé des
fonctions à valeurs positives.

Proposition 4.18 – Soit f : E → R une fonction mesurable positive. Il existe une suite (ϕn )n∈N de
fonctions de E+ telles que
– (ϕn )n est croissante,
– pour tout x ∈ E, ϕn (x) −→ f (x).
n→∞
De plus, si f est bornée, alors la convergence de (ϕn )n∈N vers f est uniforme.

Démonstration. On pose, pour n ∈ N,


n
n2 −1
k
1 k + n1{f >n} .
X
ϕn = k+1
2n { 2n 6f < 2n }
k=0

On note d’abord que ϕn ∈ E+ pour tout n : les fonctions ϕn ont un nombre fini de valeurs, et sont
mesurables car f l’est.
– La suite (ϕn ) converge simplement vers f : si x ∈ E est tel que f (x) = ∞, alors ϕn (x) = n pour
tout n, donc ϕn (x) → ∞ = f (x). Si f (x) < ∞, alors pour n assez grand, il existe k 6 n2n − 1 tel
que k 6 2n f (x) < k + 1, donc |f (x) − ϕn (x)| = |f (x) − 2kn | 6 21n → 0.
– Montrons maintenant que la suite est croissante. Soit n ∈ N,
- si f (x) > n + 1, alors ϕn (x) = n < n + 1 = ϕn+1 (x),
- si f (x) < n, on note k l’entier tel que 2kn 6 f (x) < k+12n , on a alors ϕn (x) =
k
2n . Comme
2k 2k
f (x) > 2n+1 , on en déduit que ϕn+1 (x) > 2n+1 = ϕn (x).
k k+1
- si n 6 f (x) < n + 1, alors ϕn (x) = n, et il existe k > n2n+1 tel que 2n+1 6 f (x) < 2n+1 , donc
ϕn+1 (x) > n = ϕn (x).
1
Si f est bornée et N > kf k∞ , alors pour tout n > N , on a kf − ϕn k∞ 6 2n , ce qui montre que (ϕn )
converge uniformément vers f .

Remarque 4.19 – Dans le cas où f est seulement supposée mesurable, il existe une suite de fonctions
étagées qui converge simplement vers f . Si la fonction f est bornée, la convergence est uniforme.
Pour voir ce résultat, il suffit de modifier la construction de la suite (ϕn ) dans la preuve de la proposition
4.18, en posant
n
n2 −1
k
1 k − n1{f <−n} + n1{f >n} .
X
ϕn = k+1
n { 2n 6f < 2n }
n
2
k=−n2

Parmi les applications de ce résultat, on donne une démonstration du théorème de Lusin qui précise le
lien entre fonctions mesurables et fonctions continues. Comme nous l’avons vu au paragraphe 4.2, une
fonction continue de R dans R est toujours mesurable pour la tribu borélienne. Il va sans dire que la
réciproque est fausse : nous avons déjà rencontré des fonctions de R dans R mesurables et discontinues.
Néanmoins, le théorème suivant permet de mettre en avant un fort lien entre continuité et mesurabilité.

Théorème 4.20 (Théorème de Lusin) – Soit f : R → R mesurable. Pour tout ε > 0, il existe un fermé
F de R tel que λ(F c ) < ε et f|F est continue.
30 Chapitre 4 – Fonctions mesurables

Démonstration. On commence par prouver le résultat dans le cas où f = 1A , où A est un borélien de R.
Le lemme 3.12 donne l’existence d’un fermé F1 et d’un ouvert Ω tels que F1 ⊂ A ⊂ Ω et λ(Ω \ F1 ) < ε.
On pose F2 = Ωc , et on introduit le fermé F = F1 ∪ F2 .
Nous allons montrer que f est continue sur F . On considère x ∈ F et une suite (xn ) de F qui converge
vers x. Si x ∈ F1 , alors xn ∈ F1 à partir d’un certain rang : sinon, (xn ) admet une sous-suite dans F2
dont la limite x n’est pas dans F2 , ce qui contredit le caractère fermé de F2 . Ainsi, à partir d’un certain
rang, f (xn ) = 1 = f (x). De même, si x ∈ F2 , alors f (xn ) = 0 = f (x) à partir d’un certain rang.
On en déduit que si f est étagée, alors le théorème est vrai. En effet, si f = i=1 αi 1Ai , où les Ai sont
PN
boréliens, alors il existe des fermés F1 , . . . , FN tels que λ(Fi c ) < Nε et fi est continue sur Fi pour tout i.
TN PN
Si on pose F = i=1 Fi , alors f est continue sur F , et λ(F c ) 6 i=1 λ(Fi c ) < ε.
Supposons maintenant que f est mesurable bornée. On sait alors qu’il existe une suite (fn )n∈N? de
?
fonctions étagées qui converge uniformément vers f . Pour
c ε
T tout n ∈ N , il existe un fermé Fn tel que
λ(Fn ) < 2n et fn est continue sur Fn . En posant F = n Fn , on a f continue sur F car les fn sont
continues et convergent uniformément vers f sur F . D’autre part, λ(F c ) 6 n∈N? λ(Fn c ) < ε.
P

Maintenant, si f n’est pas bornée, on pose g = arctan. On remarque que g ◦ f est mesurable et bornée,
donc il existe un fermé F tel que g ◦ f est continue sur F et λ(F c ) < ε. Comme f = tan(g ◦ f ), on en
déduit que f est continue sur F .
Ce résultat se généralise à des espaces topologiques séparés localement compacts (voir [4]).
CHAPITRE 5

Intégrale de Lebesgue

Dans tout le chapitre, on se place sur un espace mesuré (E, A , µ), et K désigne R ou C. Nous allons
définir l’intégrale d’une fonction mesurable de E dans C, lorsqu’elle existe. Dans ce but, nous commencerons
par définir l’intégrale des fonctions étagées positives, puis des fonctions mesurables positives. La définition
de l’intégrale des fonctions intégrables à valeurs dans R ou C s’en déduira.

5.1 Intégration des fonctions étagées positives


Comme nous l’avons vu dans le chapitre précédent, toute fonction étagée ϕ ∈ E est décrite de manière
unique par son écriture
N
αi 1Ai ,
X

i=1

où α1 , . . . , αN désignent les valeurs (deux à deux distinctes) de ϕ. Notons que les ensembles Ai = {ϕ = αi }
sont bien des éléments de A , du fait que ϕ est mesurable. Nous allons définir l’intégrale des fonctions de
E+ à partir de cette écriture.

Définition 5.1 – Soit ϕ = i=1 αi 1Ai une fonction de E+ , où A1 , . . . , AN sont des éléments de A qui
PN
forment une partition de E. On définit l’intégrale de ϕ par rapport à la mesure µ par
Z N
X
ϕ dµ := αi µ(Ai ),
E i=1
R
R la convention αi µ(Ai ) = 0 si αi = 0 et µ(Ai ) = ∞. On note aussi cette quantité E ϕ(x) dµ(x),
avec
ou E ϕ(x) µ( dx). On omet parfois de mentionner E lorsque le contexte est clair.

Remarque 5.2 – La définition de ϕ dµ ne dépend pas de l’écriture ϕ = i=1 αi 1Ai choisie, où les Ai
R PN
sont dans A et forment une partition de E.
Démonstration. Soient α1 , . . . , αN les valeurs de ϕ, et Ai = {ϕ = αi }. Si ϕ = j=1 βj 1Bj , où
PM
les Bj sont dans A et forment une partition de E, alors
M
X N
X X N
X X
βj µ(Bj ) = βj µ(Bj ) = αi µ(Bj )
j=1 i=1 j, βj =αi i=1 j, βj =αi
G X
Or pour tout i ∈ J1, nK, Bj = {ϕ = αi } = Ai , donc µ(Bj ) = µ(Ai ).
j, βj =αi j, βj =αi

31
32 Chapitre 5 – Intégrale de Lebesgue

R
Remarque 5.3 – On note que si ϕ est étagée positive, alors ϕ dµ > 0.

Exemple 5.4 – 1. Mesure de Dirac : Soit x ∈ E, pour toute fonction étagée positive ϕ,
Z
ϕ dδx = ϕ(x).
E

En effet, si α1 , . . . , αN sont les valeurs distinctes de ϕ, et si ϕ(x) = αi0 , on a


Z N
X
ϕ dδx = αi δx ({ϕ = αi }) = ϕ(x).
| {z }
i=1 
 1 si i = i
0
=
 0 si i 6= i
0

2. Mesure de comptage sur N : Soit m la mesure de comptage sur (N, P(N)), si ϕ est étagée positive
sur N, alors Z X
ϕ dm = ϕ(n).
N n∈N

En effet, si ϕ a pour valeurs distinctes α1 , . . . , αN ,

X N
X X N
X X
ϕ(n) = ϕ(n) = αi 1
n∈N i=1 n∈N i=1 n∈N
ϕ(n)=αi ϕ(n)=αi

N
X Z
= αi m({ϕ = αi }) = ϕ dm.
i=1

Proposition 5.5 – Si ϕ et ψ sont deux fonctions étagées positives sur l’espace mesuré (E, A , µ),
1. ϕ + ψ ∈ E+ , et (ϕ + ψ) dµ = ϕ dµ + ψ dµ,
R R R

2. si α ∈ R+ , alors αϕ ∈ E+ et αϕ dµ = α ϕ dµ,
R R
R R
3. si ϕ 6 ψ, alors ϕ dµ 6 ψ dµ.

1. On écrit ϕ = i=1 αi 1Ai et ψ = j=1 βj 1Bj où les Ai et (resp. les Bj ) forment
PN PM
Démonstration.
une partition de E. Alors ϕ + ψ = i=1 j=1 (αi + βj )1Ai ∩Bj ,
PN PM

Z N X
X M N
X M
X M
X N
X
(ϕ + ψ) dµ = (αi + βj )µ(Ai ∩ Bj ) = αi µ(Ai ∩ Bj ) + βj µ(Ai ∩ Bj )
i=1 j=1 i=1 j=1 j=1 i=1
N
X M
FM  X FN 
= αi µ A
j=1 i ∩ Bj + βj µ i=1 Ai ∩ Bj
i=1 j=1
N
X M
X Z Z
= αi µ(Ai ) + βj µ(Bj ) = ϕ dµ + ψ dµ.
i=1 j=1

αi 1Ai est étagée positive, αϕ est étagée positive et


PN
2. Si ϕ = i=1

Z N
X N
X Z
αϕ dµ = ααi µ(Ai ) = α αi µ(Ai ) = α ϕ dµ.
i=1 i=1

3. Comme ϕ 6 ψ, la fonction ψ − ϕ est étagée positive. On a alors par le point 1,


Z Z Z Z Z
ψ dµ = (ϕ + (ψ − ϕ)) dµ = ϕ dµ + (ψ − ϕ) dµ > ϕ dµ.
5.2 Intégration des fonctions mesurables positives 33

Notation. Si ϕ est une fonction étagée positive et A ∈ A , on note


Z Z
ϕ dµ = ϕ1A dµ.
A E

Cette dernière intégrale est bien définie : on observe que ϕ1A ∈ E+ . En effet, si ϕ = i=1 αi 1Ai où les Ai
PN

sont dans A , alors ϕ1A = i=1 αi 1A∩Ai .


PN

Lemme 5.6 – Si (En )n∈N est une suite croissante de A vérifiant E = n∈N En , alors pour toute fonction
S
ϕ ∈ E+ , Z Z
ϕ dµ −→ ϕ dµ.
En n→∞ E

αi 1Ai , on a alors
PN
Démonstration. On écrit ϕ = i=1
Z N
X
ϕ dµ = αi µ(Ai ∩ En ).
En i=1
S
On observe que pour tout i ∈ J1, N K, on a µ(Ai ∩ En ) −→ µ( n Ai ∩ En ) = µ(Ai ), du fait que (Ai ∩ En )n
n→∞
est une suite croissante de A . Le résultat en découle.

5.2 Intégration des fonctions mesurables positives


5.2.1 Définition
Dans toute la suite, on note M+ l’ensembles des fonctions mesurables de (E, A ) dans (R+ , B(R+ )).
Définition 5.7 – Si f ∈ M+ , on définit l’intégrale de f par rapport à la mesure µ comme
Z Z 
f dµ = sup ϕ dµ, ϕ ∈ E+ , ϕ 6 f ∈ R+ .
E E
R
Si E f dµ < ∞, on dit que f est µ-intégrable (ou intégrable).
Si A ∈ A , on sait que f 1A ∈ M+ , et on étend donc la notation du paragraphe précédent :
Z Z
f dµ = f 1A dµ.
A E

On note que, par croissance de l’intégrale des fonctions de E+ , la définition 5.7 est compatible avec la
définition 5.1.
Remarque 5.8 – Les propriétés suivantes se déduisent immédiatement de la définition de l’intégrale.
1. (Positivité) Si f ∈ M+ , alors E f dµ > 0 : si ϕ ≡ 0, alors ϕ ∈ E+ , et ϕ 6 f .
R

2. (Croissance) Si f, g ∈ M+ et f 6 g, alors E f dµ 6 E g dµ. En effet, si ϕ ∈ E+ et ϕ 6 f , alors


R R

ϕ 6 g.
Exemples – 1. Mesure de Dirac : si x ∈ E, alors pour toute fonction f ∈ M+ , on a
Z
f dδx = f (x).
E

En effet, f dδx = sup{ϕ(x), ϕ ∈ E+ , ϕ 6 f } = f (x) : d’une part, il est évident que f dδx 6 f (x),
R R

d’autre part, ϕ = f (x)1{f >f (x)} ∈ E+ vérifiant bien ϕ 6 f , on obtient l’autre inégalité.
2. Mesure de comptage sur (N, P(N)) : pour toute fonction f : N → N, on a
Z X
f dm = f (n).
N n∈N

En effet,
34 Chapitre 5 – Intégrale de Lebesgue

toutePfonction ϕ ∈ E+ telle que ϕ 6 f , on a ϕ dm =


R P P
– pour
R n ϕ(n) 6 n f (n), donc
f dm 6 n f (n),
– pour tout nP∈ N, la fonction ϕn = f 1[|0,n|] est étagée positive, et vérifie ϕn 6 f , donc
R n R
ϕn dm = k=0 f (k) 6 f dm pour tout n, d’où le résultat.

5.2.2 Théorème de Beppo Levi et conséquences


Théorème 5.9 (Beppo Levi ) – Soit (fn )n∈N une suite croissante de fonctions mesurables positives : pour
tout n ∈ N, 0 6 fn 6 fn+1 . Alors, f := lim fn est mesurable positive, et
n→∞
Z Z
f dµ = lim fn dµ.
E n→∞ E

Le théorème de Beppo Levi est aussi appelé théorème de convergence monotone.

Démonstration. Par la proposition 4.15, f ∈ M+ .


R
RLa suite (fn )n étant croissante, on a fn 6 f pour tout n ∈ N, donc par croissance, E
fn dµ 6
E
f dµ, et en passant à la limite,
Z Z
lim fn dµ 6 f dµ.
n→∞ E E

 Montrons l’autre inégalité. Soient ϕ ∈ E+ telle que ϕ 6 f , et α ∈]0, 1[. Posons

En = {x ∈ E, fn (x) > αϕ(x)}.

On a
– pour tout n, En ⊂ En+1 ,
S
– E = n En : si x ∈ E, comme fn (x) −→ f (x) > αϕ(x), il existe n ∈ N tel que αϕ(x) 6 fn (x).
n→∞
Alors, par le lemme 5.6, on a Z Z
αϕ dµ = lim αϕ dµ.
E n→∞ En

Pour tout n ∈ N, on note que αϕ1En 6 fn et αϕ1En ∈ E+ , ce qui implique que


R R
E
αϕ dµ 6 E
fn dµ.
On en déduit que Z Z
α ϕ dµ 6 lim fn dµ.
E n→∞ E

En laissant tendre α vers 1, puis en passant au sup sur les fonctions ϕ de E+ telles que ϕ 6 f , on
obtient l’inégalité souhaitée.

Proposition 5.10 – Si f, g deux fonctions mesurables positives, alors les propriétés suivantes sont
vérifiées.
R R R
1. (Additivité) E (f + g) dµ = f dµ + g dµ.
R R
2. (Homogénéité positive) Si α > 0, alors αf dµ = α f dµ.

Démonstration. 1. On sait qu’il existe des suites croissantes (ϕn )n et (ψn )n de fonctions de M+ telles
que f = limn→∞ ϕn = f et g = limn→∞ ψn = f . Alors, (ϕn + ψn )n est une suite croissante de M+
qui converge vers f + g, et par Beppo Levi,
R R
E
(ϕn + ψn ) dµ −→ E
(f + g) dµ,
n→∞
=

R R R R
E
ϕn dµ + E
ψn dµ −→ E
f dµ + E
g dµ.
n→∞
5.2 Intégration des fonctions mesurables positives 35

2. On utilise les même notations que dans le point 1. La suite (αϕn )n est une suite croissante de M+
qui converge vers αf , donc par Beppo Levi,
R R
E
αϕn dµ −→ E
αf dµ,
n→∞

=
R R
α E
ϕn dµ −→ α E
f dµ.
n→∞

Corollaire 5.11 (Relation de Chasles) – Si f ∈ M+ et A, B ∈ A avec A ∩ B = ∅, alors


Z Z Z
f dµ = f dµ + f dµ.
AtB A B

Démonstration. On note que comme A ∩ B = ∅, on a f 1AtB = f 1A + f 1B . L’additivité de l’intégrale


donne le résultat.
Remarque 5.12 – Si f, g ∈ M+ avec f 6 g et f µ-intégrable, alors E (g − f ) dµ = E g dµ − E f dµ.
R R R

En effet, on remarque que g = f + (g − f ), et le résultat découle de l’additivité de l’intégrale sur M+ .


Remarque 5.13 – Le théorème R de Beppo Levi devient faux si la suite de fonctions est décroissante. Par
exemple, si fn = 1[n,∞[ , on a R fn dλ = ∞ pour tout n ∈ N, mais R limn fn dλ = 0.
R

En revanche, si on suppose en plus qu’il existe une fonction g µ-intégrable telle que fn 6 g pour tout
n ∈ N, alors la conclusion de Beppo Levi reste vraie. En effet, on peut appliquer le théorème de Beppo
Levi à (g − fn )n qui est bien une suite croissante de fonctions de M+ . On obtient
Z Z
lim(g − fn ) dµ = lim (g − fn ) dµ,
E n n E
R R R R
ce qui donne E
g dµ − E
limn fn dµ = E
g dµ − limn E
fn dµ.
Le résultat suivant, qui porte sur l’intégration des séries de fonctions de M+ , est équivalent au théorème
de Beppo Levi.
Proposition 5.14 – Si (fn )n∈N est une suite de fonctions mesurables positives, alors
Z X XZ
fn dµ = fn dµ.
E n∈N n∈N E

Pn
k=0 fk n est une suite croissante de M+ , donc par le théorème

Démonstration. On note que la suite
de Beppo Levi,
Z X n Z X
fk dµ −→ fk dµ,
E k=0 n→∞ E k∈N
=
n Z
X XZ
fk dµ −→ fk dµ,
E n→∞ E
k=0 k∈N

où on a utilisé l’additivité de l’intégrale des fonctions de M+ .

Mesures à densité

Proposition 5.15 – Si g ∈ M+ et pour tout A ∈ A ,


Z
ν(A) = g dµ,
A

alors ν définit une mesure sur (E, A ). On dit que ν est la mesure à densité g par rapport à la mesure µ.
Par ailleurs, si f ∈ M+ , alors Z Z
f dν = f g dµ. (5.1)
E E
36 Chapitre 5 – Intégrale de Lebesgue

Démonstration. On a bien sûr ν(∅) = 0. Par ailleurs, si (An )n est une suite d’éléments de A distincts
deux à deux, alors
G  Z X XZ
1An dµ = g 1An dµ =
X
ν An = g ν(An ),
n n∈N n∈N n∈N

par Beppo Levi, ce qui prouve que ν est bien une mesure.
On note que, par définition de ν, l’égalité (5.1) est vraie si f est une indicatrice d’élément de A . Par
additivité de l’intégrale, elle reste donc vraie si f ∈ E+ . Pour finir, si f ∈ M+ , alors il existe une suite
croissante (gn )n de fonctions de E+ qui converge simplement vers f . Comme (fn g)n est aussi une suite
croissante de fonctions mesurables, on a par Beppo Levi
Z Z
fn dν −→ f dν
n→∞

=
Z Z
fn g dµ −→ f g dµ,
n→∞

d’où le résultat.
Exemple 5.16 – Une variable aléatoire réelle X sur un espace probabilisé (Ω, A , P) suit la loi normale
(x−µ) 2
N (µ, σ) si sa loi PX est la mesure qui a pour densité la fonction x 7→ √1 e−
σ 2π
2 , ce qui donne pour
tout A ∈ B(R),
Z − (x−µ)2
e 2
PX (A) = √ dλ(x).
A σ 2π

5.2.3 Inégalité de Markov et conséquences


Lemme 5.17 (Inégalité de Markov ) – Soient f ∈ M+ et a ∈ R?+ , on a
Z
1
µ({f > a}) 6 f dµ.
a E
Démonstration. Comme f > a1{f >a} , la croissance de l’intégrale donne
Z Z
f dµ > a 1{f >a} dµ = a µ({f > a}),
E E

d’où le résultat.
Corollaire 5.18 – Si f ∈ M+ et
R
E
f dµ < ∞, alors f est finie µ-presque partout (ie µ({f = ∞}) = 0).
Démonstration. Pour tout n ∈ N? , on a
Z
1
µ({f = ∞}) 6 µ({f > n}) 6 f dµ −→ 0,
n E n→∞

par l’inégalité de Markov, d’où µ({f = ∞}) = 0.


1. Si f ∈ M+ , alors E f dµ = 0 si et seulement si f = 0 µ-p.p.
R
Corollaire 5.19 –
2. Si f, g ∈ M+ et f = g µ-p.p., alors E f dµ = E g dµ.
R R

Remarque 5.20 – Si f ∈ M+ et A ∈ A avec µ(A) = 0, alors A f dµ = 0 (car f 1A = 0 µ-p.p.).


R

1. — Supposons que f ∈ E+ et f = 0 µ-p.p. On peut alors écrire f = i=1 αi 1Ai ,


PN
Démonstration.
R PN
où µ(Ai ) = 0 dès que αi > 0. Par conséquent, E f dµ = i=1 αi µ(Ai ) = 0.
Si maintenant f ∈ M+ et f R= 0 µ-p.p., alors pour toute fonction ϕ ∈ ER+ telle que ϕ 6 f , ϕ = 0
µ-p.p., ce qui implique que E ϕ dµ = 0. On a donc bien montré que E f dµ = 0.
5.3 Fonctions intégrables 37

— Si maintenant E f dµ = 0, alors pour tout n ∈ N? , µ({f > n1 }) 6 n f dµ = 0 par l’inégalité


R R

de Markov. Par conséquent,


 [   X  
1 1
µ({f 6= 0}) = µ f> 6 µ f> = 0.
?
n ?
n
n∈N n∈N

2. Si f = g µ-p.p., alors f 1{f 6=g} et g 1{f 6=g} sont nulles µ-p.p., ce qui implique par 1. que
R
{f 6=g}
f dµ =
R
{f 6=g}
g dµ = 0. On en déduit alors que
Z Z Z Z
f dµ = f dµ = g dµ = g dµ.
E {f =g} {f =g} E

5.2.4 Lemme de Fatou


Proposition 5.21 (Lemme de Fatou) – Si (fn )n∈N est une suite de fonctions mesurables positives, alors
Z Z
lim inf fn dµ 6 lim inf fn dµ.
E n n E

Z suite (gk )k est une suite croissante de M+ , donc par le théorème


Démonstration. ZSoit gn = inf k>n fk . La
de Beppo Levi, lim gn dµ = lim gn dµ, soit
E n→∞ n→∞ E
Z Z
lim inf fn = lim inf fk dµ.
E n n→∞ E k>n
R R
Il suffit donc de montrer
R qu’on a E inf k>n
R fk dµ 6 inf k>n E fk dµ. Pour tout k0 > n, on a inf k>n fk 6 fk0 ,
ce qui implique que E inf k>n fk 6 E fk0 . Par passage à l’infimum pour k0 > n, on obtient bien le
résultat.
Remarque 5.22 – Attention, le résultat n’est valable R que pour des fonctions positives. On verra plus
loin que si fn = 1[0,1] − 1[n,n+1] , alors pour tout n, R fn dλ = 0, mais R lim inf n fn dλ = 1.
R
R R R R
Remarque 5.23 – On n’a ni E lim supn fn dµ 6 lim supn E fn dµ, ni lim supn E fn dµ 6 E lim supn fn dµ
en général.
En revanche, on a le résultat suivant : si (fn )n est une suite de M+ telle que pour tout n ∈ N, fn 6 g, où
g ∈ M+ est µ-intégrable, alors
Z Z
lim sup fn dµ > lim sup fn dµ.
E n n E

En effet, on peut appliquer le lemme de Fatou à la suite de fonctions g − fn qui appartiennent à M+ :


Z Z
lim inf (g − fn ) dµ 6 lim inf (g − fn ) dµ
E n n E
Z Z Z Z
g dµ − lim sup fn dµ 6 g dµ − lim sup fn dµ,
E E n E n E

d’où l’inégalité.

5.3 Fonctions intégrables


5.3.1 L’espace L 1 (E, A , µ)

R – Une fonction f : (E, A ) → (K, B(K)) est dite µ-intégrable (ou intégrable) si elle est
Définition 5.24
mesurable et E |f | dµ < ∞. On note

L 1 (E, A , µ) = {f : (E, A ) → (K, B(K)), f est µ-intégrable}.


38 Chapitre 5 – Intégrale de Lebesgue

L 1 (E, A , µ) est parfois seulement noté Lµ1 (E), voire L 1 (E) lorsqu’il n’y a pas d’ambiguı̈té.
On étend la définition aux fonctions à valeurs dans R, ou un sous-ensemble de K (muni de la tribu des
boréliens).
Notation. Si f : E → R est mesurable, alors on appelle respectivement partie positive et partie négative
de f les fonctions f + et f − données par

f + = max(f, 0) et f − = − min(f, 0).

On remarque que f + etf − sont positives, et mesurables comme composées d’une fonction continue et
d’une fonction mesurable. Par ailleurs, on a clairement :

f = f + − f −,
|f | = f + + f − .

On déduit de cette écriture que f est mesurable si et seulement si f + et f − le sont.


Proposition 5.25 –
1. Si f : E → R, alors
f ∈ Lµ1 (E) ⇔ f + , f − ∈ Lµ1 (E).
2. Si f : E → C, alors
f ∈ Lµ1 (E) ⇔ Re f, Im f ∈ Lµ1 (E).
Démonstration. 1. Comme |f | = f + + f − , on a
Z Z Z Z
f ± dµ 6 |f | dµ = f + dµ + f − dµ
E E E E

ce qui implique que E |f | dµ < ∞ si et seulement si E f + dµ < ∞ et E f − dµ < ∞.


R R R

p déjà que f : E → C est mesurable si et seulement si Re f et Im f le sont. Comme


2. On sait
|f | = Re f 2 + Im f 2 , on a
R )
|Re f | dµ
Z Z Z
E
R 6 |f | dµ 6 |Re f | dµ + |Im f | dµ,
E
|Im f | dµ E E E

d’où le résultat.
Définition 5.26 (Intégrale de Lebesgue) –
– Si f : (E, A ) → (R, B(R)) est µ-intégrable, on pose
Z Z Z
f dµ := f + dµ − f − dµ.
E E E

– Si f : (E, A ) → (C, B(C)) est µ-intégrable, on pose


Z Z Z
f dµ := Re f dµ + i Im f dµ.
E E E

et A ∈ A , alors f 1A ∈
Lµ1 (E) Lµ1 (E)
R R
Si f ∈ (du fait que A |f | dµ 6 E
|f | dµ < ∞). On note alors
comme précédemment Z Z
f dµ = f 1A dµ.
A E

Proposition 5.27 – Si f, g : E → K sont mesurables et f = g µ−p.p., alors

f ∈ Lµ1 (E) ⇔ g ∈ L 1 µ(E),


Z Z
et dans ce cas, f dµ = g dµ.
E E
5.3 Fonctions intégrables 39

Démonstration. Cas où f, g : E → R : comme {f + 6= g + } ⊂ {f 6= g} et {f − 6= g − } ⊂ {f = 6 g},


− − − −
fR + = g + µ−p.p.
R et f = g µ−p.p., d’où f +
et f sont µ-intégrables ssi g +
et g le sont, et dans ce cas
E
f dµ = E
g dµ.
Cas où f, g : E → C : on note que {Re f 6= Re g} ⊂ {f 6= g} et {Im R f 6= ImR g} ⊂ {f 6= g}, donc Re f et
Im f sont µ-intégrables ssi Re g et Im f le sont, et dans ce cas E f dµ = E g dµ.
En vue de la proposition 5.27, on s’autorisera à parler de l’intégrale de fonctions définies µ-presque partout,
si elles sont égales presque partout à une fonction intégrable.
Remarque 5.28 – Si f : E → R est intégrable, alors µ({f = ±∞}) = µ({|f | = ∞}) = 0, donc f est finie
µ-presque partout. Dans la suite, on se contentera donc de considérer l’intégrale de fonctions intégrables à
valeurs dans R (quitte à remplacer f par f 1{|f |<∞} ).

5.3.2 Propriétés des fonctions intégrables


Proposition 5.29 (Linéarité de l’intégrale) –
– Si f, g ∈ Lµ1 (E), alors f + g ∈ Lµ1 (E) et E (f + g) dµ = E f dµ + E g dµ.
R R R

– Si f ∈ Lµ1 (E) et α ∈ K, alors αf ∈ Lµ1 (E) et E αf dµ = α E f dµ.


R R

– Tout d’abord, si f, g ∈ Lµ1 (E), on a E |f + g| dµ 6 E |f | dµ + E |g| dµ < ∞,


R R R
Démonstration.
du fait que |f + g| 6 |f | + |g|.
On suppose d’abord K = R. On note que
+ −
f +g = (f + g) − (f + g)
f +g = f + − f − + g+ − g−
+ −
On en déduit que (f + g) + f − + g − = (f + g) + f + + g + . Comme les fonctions des membres de
gauche et de droite sont mesurables positives, on a
Z Z Z Z Z Z
+ − − − +
(f + g) dµ + f dµ + g dµ = (f + g) dµ + f dµ + g + dµ.
E E E E E E
Z Z Z Z
+ −
f + dµ − f − dµ + g + dµ − g − dµ.
R R
Donc E
(f + g) dµ − E
(f + g) dµ =
E E E E
| R
{z } | R
{z }
E
f dµ E
g dµ
R R R
Si K = C, on a E (f + g) dµ = E
(Re f + Re g) dµ + i E
(Im f + Im g) dµ, et le résultat se déduit
du point précédent.
– On note d’abord que si f ∈ Lµ1 (E) et α ∈ K, alors on a
R R
E
|αf | dµ = |α| E
|f | dµ < ∞.
Supposons K = R.
+ −
– Si α > 0, alors (αf ) = αf + et (αf ) = αf − , d’où le résultat.
+ −
– Si α < 0, alors (αf ) = −αf − et (αf ) = −αf + , d’où le résultat.
Si K = C et α = a + ib, alors
Z Z Z
αf dµ = (aRe f − bIm f ) dµ + i (aIm f + bRe f ) dµ
E E E
Z Z Z
= (a + ib) Re f dµ + i(a + ib) Im f dµ = α f dµ.
E E E

Corollaire 5.30 (Relation de Chasles) – Si A, B ∈ A et A ∩ B = ∅, alors


Z Z Z
f dµ = f dµ + f dµ.
AtB A B

Démonstration. On déduit le résultat de l’égalité f 1AtB = f 1A + f 1B et de la linéarité de l’intégrale.


40 Chapitre 5 – Intégrale de Lebesgue

R R
Proposition 5.31 (Croissance) – Si f, g : E → R sont intégrables et f 6 g, alors E f dµ 6 E g dµ.
Démonstration. On a g − f ∈ M+ , donc E (g − f ) dµ > 0. On conclut par la linéarité de l’intégrale.
R

Remarque 5.32 – Pour avoir la propriété de croissance, il suffit en fait de supposer que f 6 g µ−p.p. :
il suffit de considérer f 1{f 6g} et g 1{f 6g} au lieu de f et g.
Proposition 5.33 (Inégalité triangulaire) – Si f ∈ Lµ1 (E), alors
Z Z
f dµ 6 |f | dµ.
E E

Démonstration. – Si K = R, on a
Z Z Z Z Z Z
+ − + −
f dµ = f dµ − f dµ 6 f dµ + f dµ = |f | dµ.

R
– Si K = C, on commence par remarquer
R
que si E f dµ =R 0, l’inégalité est vérifiée. Sinon, on
R R | f dµ| | f dµ|
remarque que E f dµ = E f R E f dµ dµ. En posant α = R E f dµ , on a
E E

Z Z Z
R
f dµ = (αf ) dµ = Re (αf ) dµ car E
f dµ ∈ R
E E E
Z
6 |Re (αf )| dµ par le cas K = R
E
Z Z
6 |αf | dµ = |f | dµ.
E E

5.3.3 Formule de transfert


Soient (E, A ) et (F, B) et ϕ une fonction mesurable de E dans F . On rappelle que µϕ définie par

µϕ (B) = µ(ϕ−1 (B)), B ∈ B,

est une mesure sur (F, B) appelée mesure image de µ par ϕ.


Le lemme suivant peut-être vu comme un résultat de changement de variable.
Proposition 5.34 – [Formule de transfert] Soit f une fonction mesurable de F dans K (K = R ou C).
La fonction f est µϕ -intégrable sur F si et seulement si la fonction f ◦ ϕ est µ-intégrable sur E, et dans
ce cas on a Z Z
f ◦ ϕ dµ = f dµϕ .
E F

Démonstration. Voir TD.


Application 5.35 – On peut déjà obtenir une Rpremière formule de changement de variable très simple :
si ϕ : x ∈ R 7→ x + a, pù a ∈ R, alors R f dλ = R f (x + a) dλ(x), pour toute fonction f ∈ L 1 (R).
R

En effet, pour tout B ∈ B(R), λϕ (B) = λ(B − a) = λ(B), donc λϕ = λ, et la formule de transfert donne
le résultat.
Application 5.36 (Calcul de l’espérance d’une variable aléatoire) – Soit X une Rvariable aléatoire réelle
sur un espace probabilisé (Ω, A , P). L’espérance de X est définie par E(X) = Ω X dP. Le lemme de
transfert implique alors que Z
E(X) = x dPX (x),
R
où on a remplacé µ par P, ϕ par X et f par Id : R → R dans la formule de transfert.
N.B. : Dans le cas particulier où X est à valeurs dans N, on a bien la formule classique de l’espérance :
Z XZ X
E(X) = X dP = X dP = k P({X = k}).
E k∈N {X=k} k∈N
5.4 Théorème de convergence dominée et applications 41

5.4 Théorème de convergence dominée et applications


5.4.1 Théorème de convergence dominée
Théorème 5.37 – Soient fn , n ∈ N, et f des fonctions mesurables de E dans K telles que
(i) la suite (fn )n converge vers f µ-p.p. (i.e. fn (x) −→ f (x) pour µ-presque tout x ∈ E),
n→∞
(ii) il existe g ∈ Lµ1 (E) telle que pour tout n ∈ N, |fn | 6 g µ-p.p.
Alors, les fonctions fn , f sont intégrables, et
Z
|f − fn | dµ −→ 0.
E n→∞
R R
En particulier, E
fn dµ −→ E
f dµ.
n→∞

La démonstration repose sur l’idée donnée dans la remarque 5.23 : on note qu’il suffit de montrer
l’inégalité Z Z
lim sup |f − fn | dµ > lim sup |f − fn | dµ
E n n E
pour obtenir le résultat. D’après la remarque 5.23, il suffit de “dominer” la suite |f − fn | par une fonction
intégrable pour obtenir l’inégalité. On va voir que les hypothèses du lemme de Fatou permettent de le
faire.
Démonstration. Soit A = {x ∈ E, fn (x) −→ f (x) et ∀n ∈ N, |fn (x)| 6 g(x)}. On a
n→∞
 [  X
c
µ(A ) = µ {fn 6−→ f } ∪ {|fn | > g} 6 µ({fn 6−→ f }) + µ({|fn | > g}) = 0.
n→∞ n→∞
n∈N n∈N

On remarque que si x ∈ A, alors |f (x) − fn (x)| 6 |f (x)| + |fn (x)| 6 2g(x), ce qui implique que
1A (2g − |f − fn |) ∈ M+ . Par le lemme de Fatou, on a
Z Z
lim inf (2g − |f − fn |) dµ 6 lim inf (2g − |f − fn |) dµ ,
n n
|A R
{z } |R A
{z R }
= A
2g dµ = A
2g dµ−lim supn A
|f −fn | dµ

du fait que lim inf (2g − |f − fn |) = 2g sur A. On obtient alors


n
Z
lim sup |f − fn | dµ 6 0
n A
R R R
et lim inf n A
|f − fn | dµ = lim supn
|f − fn | dµ = 0, donc limn→∞ E |f − fn | dµ = 0.
A
R R
Remarque 5.38 – Il existe des situations où limn fn dµ = limn fn dµ, mais la suite (fn )n n’est
dominée par aucune fonction intégrable (i.e. (ii) n’est pas vraie dans le théorème de convergence dominée).
Exemple : fn = n1[ n+1
1 1
,n [ dans (R, B(R), λ).

Corollaire
P R 5.39 – Soit (fn )n P une suite de fonctions mesurables de E dans K vérifiant
n |fn | dµ < ∞. Alors, la fonction n fn est définie presque partout, µ-intégrable, et
XZ Z X
fn dµ = fn dµ.
n∈N E E n∈N

P R
Démonstration. On observe d’abord que comme n |fn | dµ < ∞, les fonctions fn sont en fait intégrables.
Par ailleurs, par Beppo Levi, on a
Z X XZ
|fn | dµ = |fn | dµ < ∞. (5.2)
E n∈N n∈N E
42 Chapitre 5 – Intégrale de Lebesgue

P P
Par conséquent, la fonction n |fn | est finie µ-presque Ppartout, donc n fn (x) converge absolument pour
µ-presque tout x ∈ E. On P en déduit que la fonction n fn P est bien définie µ-presque partout.P
On pose par exemple n fn (x) = 0 lorsque x ∈ A := { n |fn | = ∞} ∈ P A . La fonction n fn est
k=0 fk 1A )n . Par ailleurs,
n
alors
R P mesurable comme
RP limite simplePde la suite de fonctions mesurables (
| n fn | dµ 6 n |f n | < ∞, donc n fn est intégrable. Pn
On applique le théorème de convergence dominée à la suite de fonctions (gn )n , où gn = k=0 fk . En effet,
on a
P
– gn −→ n fn µ-p.p.,
n→∞P
– |gn | 6 n |fn | µ-p.p.
On en déduit que
Z X n Z X
fk dµ −→ fn dµ
E k=0 n→∞ E n∈N
= =
n
XZ XZ
fk dµ −→ fn dµ,
E n→∞ E
k=0 n∈N

d’où le résultat.

5.4.2 Intégrales dépendant d’un paramètre


Limite et continuité sous l’intégrale

On considère un espace métrique (Y, d) et une fonction f : E × Y → K. On s’intéresse à des propriétés


de limite et de continuité de la fonction
Z
F : y ∈ Y 7→ f (x, y) dµ
E

lorsqu’elle est bien définie.


Proposition 5.40 – Soit ȳ ∈ Y . On suppose qu’il existe une fonction mesurable ` : E → K telle que
(i ) pour tout y ∈ Y , x 7→ f (x, y) est mesurable,
(ii ) pour µ-presque tout x ∈ E, f (x, y) −→ `(x),
y→ȳ
(iii ) il existe g ∈ Lµ1 (E) telle que pour tout y ∈ Y ,

|(f (x, y)| 6 g(x) p.p. x.


R
Alors F est bien définie sur Y entier, et F (y) −→ E ` dµ.
y→ȳ

Démonstration. Soit (yk )k∈N une suite de Y telle que limk→∞ yk = ȳ. Pour tout k ∈ N, on pose

ϕk (x) = f (x, yk ).

Par hypothèse, les fonctions ϕk sont mesurables, la suite (ϕk ) converge µ-presque partout vers `, et pour
tout k ∈ N, |ϕk | 6 g µ-presque partout. Comme g ∈ Lµ1 (E), on peut appliquer le théorème de convergence
dominée à la suite de fonctions (ϕk ), et on obtient que
Z
F (y) −→ ` dµ.
y→ȳ E

Corollaire 5.41 (Continuité sous l’intégrale) – Soit ȳ ∈ Y . On suppose :


(i ) pour tout y ∈ Y , x 7→ f (x, y) est mesurable,
(ii ) pour presque tout x ∈ E, y 7→ f (x, y) est continue en ȳ ∈ Y ,
(iii ) il existe g ∈ Lµ1 (E) telle que pour tout y ∈ Y ,

|f (x, y)| 6 g(x) p.p. x.


5.5 Lien entre l’intégrale de Riemann et l’intégrale de Lebesgue 43

R
Alors la fonction F : y ∈ Y 7→ E
f (x, y) dµ est bien définie sur Y tout entier, et est continue en ȳ.
Démonstration. On pose ` : x ∈ E 7→ f (x, ȳ). Par hypothèse, ` est une fonction mesurable. On peut donc
appliquer le théorème précédent, qui donne
Z
F (y) −→ ` dµ = F (ȳ).
y→ȳ E

Dérivation sous l’intégrale

Soient I un intervalle non vide de R et une fonction f : E × I → R. On s’interroge maintenant sur


R entre la dérivabilité de la fonction y 7→ f (x, y) pour presque tout x ∈ E et celle de la fonction
le lien
y 7→ E f (x, y) dµ(x) lorsqu’elle existe.
Proposition 5.42 (Dérivation sous l’intégrale) – On suppose :
(i ) pour tout y ∈ I, x 7→ f (x, y) est intégrable,
(ii ) pour presque tout x ∈ E, y 7→ f (x, y) est dérivable sur I,
(iii ) il existe g ∈ Lµ1 (E) telle que pour presque tout x ∈ E,
|∂y (x, y)| 6 g(x) ∀y ∈ I,

où ∂f
R
∂y (x, ·) désigne la dérivée de la fonction y 7→ f (x, y). Alors la fonction F : y ∈ I 7→ E
f (x, y) dµ est
dérivable sur I, et pour tout y ∈ I, Z
F 0 (y) = ∂y (x, y) dµ.
E
Démonstration. Soient ȳ ∈ I et une suite (yn )n∈N de I telle que limn→∞ yn et yn 6= y pour tout [Link]
considère la suite de fonctions ϕn définie par
f (x, yn ) − f (x, ȳ)
ϕn (x) = .
yn − ȳ
On note que par hypothèse, les fonctions ϕn sont intégrables, et ϕn (x) −→ ∂y f (x, ȳ) µ-p.p. x. Par
n→∞
ailleurs, pour µ-presque tout x ∈ E, le théorème des accroissements finis donne
|ϕn (x)| 6 sup |∂y f (x, y)| 6 |g(x)|.
y∈[yn ,ȳ]

On peut alors appliquer le théorème de convergence dominée, qui donne


F (yn ) − F (ȳ)
Z Z
= ϕn (x) dµ(x) −→ ∂y f (x, y) dµ(x)
yn − ȳ E n→∞ E

et qui conclut la preuve.


Remarque 5.43 – On note que si on remplace dérivable par C 1 dans les hypothèses de la proposition
5.42, on obtient le résultat tient bien sûr toujours, et on obtient en plus que F est de Rclasse C 1 sur I. Il
suffit en effet d’appliquer le théorème de continuité sous l’intégrale à la fonction y 7→ E ∂y f (x, y) dµ(x).

5.5 Lien entre l’intégrale de Riemann et l’intégrale de Lebesgue


5.5.1 Intégrale de Riemann
On se place sur un intervalle [a, b] ⊂ R. On rappelle que ϕ : [a, b] → R est dite en escalier si elle est de
la forme ϕ = i=1 αi 1Ii , où I1 , . . . , IN sont des intervalles de [a, b]. On note Esc l’ensemble des fonctions
PN
en escalier définies sur [a, b]. Remarquons que toute fonction en escalier sur [a, b] est en particulier une
fonction étagée sur [a, b], mais l’inverse n’est pas vrai.
On définit alors naturellement l’intégrale de f = i=1 αi 1Ii ∈ Esc sur [a, b] au sens de Riemann par
PN

Z b XN Z
f (x) dx = αi `(Ii ) = f dλ.
a i=1 [a,b]
44 Chapitre 5 – Intégrale de Lebesgue

Définition 5.44 – Si f : [a, b] → R est une fonction bornée, on note


Z¯ b (Z
b
)
f (x) dx := sup ϕ(x) dx, ϕ 6 f, ϕ ∈ Esc ,
a a
(Z )
Z b b
f (x) dx := inf ϕ(x) dx, ϕ > f, ϕ ∈ Esc .
a a
¯
R¯b Rb
Si a
f (x) dx = a
f (x) dx, on dit que f est Riemann-intégrable sur [a, b], et on note
¯
Z b Z¯ b Z b
f (x) dx = f (x) dx = f (x) dx.
a a a
¯
Remarque 5.45 – On voit aisément que la définition ci-dessus est équivalente à la définition classique de
l’intégrale de Riemann par sommes de Riemann, ou encore à la définition par sommes de Darboux.

Théorème 5.46 – Si (fn )n∈N est une suite de fonctions Riemann-intégrables de [a, b] dans R qui converge
uniformément vers f , alors f est Riemann-intégrable, et
Z b Z b
f (x) dx = lim fn (x) dx.
a n→∞ a

Définition 5.47 – On appelle fonction réglée sur [a, b] toute fonction f : [a, b] → R qui est limite
uniforme d’une suite de fonctions en escalier.

On peut montrer que les fonctions réglées sur [a, b] sont exactement les fonctions qui admettent une
limite à gauche et à droite en tout point. Il est donc aisé de voir que toutes les fonctions continues, les
fonctions continues par morceaux, les fonctions monotones sont des fonctions réglées sur [a, b]. On peut
aussi montrer que les fonctions réglées ont un nombre dénombrable de discontinuités.
Une conséquence immédiate du théorème 5.46 est que toute fonction réglée est Riemann-intégrable. Il
est alors naturel de se demander si ce sont les seules. Le théorème suivant répond par la négative à cette
question, et caractérise les fonctions Riemann-intégrables sur un segment [a, b].

Théorème 5.48 (Critère de Lebesgue) – Une fonction f : [a, b] → R bornée est Riemann-intégrable si et
seulement si elle est continue λ-presque partout.

Le critère de Lebesgue permet de voir immédiatement qu’il existe des fonctions Riemann-intégrables
qui ne sont pas réglées. On peut citer l’exemple de l’indicatrice de l’ensemble de Cantor C sur [0, 1] : la
fonction est discontinue sur C qui n’est pas dénombrable, donc 1C n’est pas réglée. En revanche, 1C est
Riemann-intégrable car l’ensemble de ses points de discontinuité est C, qui est de mesure nulle. Un autre
exemple est a fonction f définie sur [0, 1] par f (x) = sin x1 si x > 0, et f (0) = 0. Elle n’est pas réglée
puisqu’elle n’admet pas de limite à droite en 0, mais elle est Riemann-intégrable puisqu’elle est continue
sur ]0, 1] qui est de mesure pleine dans [0, 1].

5.5.2 Fonctions Riemann-intégrables et fonctions Lebesgue-intégrables


Théorème 5.49 – Si f : [a, b] → R est Riemann-intégrable, alors il existe une fonction g ∈ Lλ1 ([a, b])
telle que f = g λ-presque partout, et
Z b Z
f (x) dx = g dλ.
a [a,b]

Rb
Pour toute fonction g ∈ Lλ1 ([a, b]), on notera alors sans amiguité
R
[a,b]
g dλ = a
g(x) dx.
5.5 Lien entre l’intégrale de Riemann et l’intégrale de Lebesgue 45

Démonstration. Soit (ϕn )n∈N une suite de Esc telle que pour tout n ∈ N, ϕn 6 f , et
Z Z b
ϕn dλ −→ f (x) dx.
[a,b] n→∞ a

On remarque que, quitte à remplacer ϕn par max(ϕ0 , . . . , ϕn ), on peut supposer que la suite (ϕn )n est
croissante. On introduit alors sa limite simple g, qui est mesurable comme limite simple d’une suite de
fonctions mesurables, et qui vérifie donc g 6 f .
Comme la suite (ϕn − ϕ0 )n est une suite croissante de M+ , on peut lui appliquer le théorème de Beppo
Levi. Il vient alors Z Z
(ϕn − ϕ0 ) dλ −→ (g − ϕ0 ) dλ.
[a,b] n→∞ [a,b]
Rb
Comme ϕ0 ∈ Lλ1 ([a, b]), on en déduit que
R R R
[a,b]
ϕn dλ −→ [a,b]
g dλ, et donc [a,b]
g dλ = a
f (x) dx.
n→∞
On considère maintenant une suite (ψn )n∈N de Esc telle que pour tout n ∈ N, ψn > f , et
Z Z b
ψn dλ −→ f (x) dx.
[a,b] n→∞ a

Quitte à remplacer ψn par min(ψ0 , . . . , ψn ), on peut supposer que la suite (ψn )n est décroissante. On
introduit alors sa limite simple h, qui est mesurable et vérifie h > f . On applique cette fois Beppo Levi à
la suite (ψ0 − ψn )n , et on obtient, du fait que les fonctions h, ψn , ψ0 sont intégrables (h 6 ψn 6 ψ0 pour
tout n), Z Z
ψn dλ −→ h dλ.
[a,b] n→∞ [a,b]
R Rb
On en déduit alors que [a,b]
h dλ = a
f (x) dx.
R
On remarque alors que h − g > 0, et [a,b]
(h − g) dλ = 0, donc g = h λ-presque partout. De ce fait, f = g
λ-presque partout, d’où le résultat.
Remarque 5.50 – On ne peut pas dire en général que si f est Riemann-intégrable, alors elle est intégrable
au sens de Lebesgue : il faudrait pour cela qu’elle soit mesurable, ce qui n’est pas garanti. Il peut en effet
arriver qu’une fonction soit presque partout égale à une fonction mesurable, mais ne soit pas mesurable
elle-même. Bien sûr, si on ajoute dans les hypothèses du théorème 5.49 que f est mesurable, alors la
Rb
conclusion devient sur f ∈ L 1 ([a, b]), et a f (x) dx = [a,b] f dλ.
R

Une conséquence directe du théorème 5.49 est que tous les résultats connus pour l’intégrale de Riemann
s’appliquent à l’intégrale de Lebesgue des fonctions Riemann-intégrables mesurables.
Par ailleurs, à partir de maintenant, lorsque nous travaillerons avec une fonction f : [a, b] → R Riemann-
Rb R
intégrable et mesurable, nous ne ferons plus de distinction entre les écritures a f (x) dx, [a,b] f dλ, et on
Rb
s’autorisera par exemple à écrire a f dλ.

Cas des intégrales généralisées

Théorème 5.51 – On suppose que f est une fonction mesurable de ]a, b[ dans R localement Riemann-
intégrable et d’intégrale absolument convergente. Alors, f est Lebesgue-intégrable, et
Z b Z
f (x) dx = f dλ.
a [a,b]

Démonstration. Soit (an )n∈N une suite décroissante qui converge vers a, et bn )n∈N une suite croissante
qui converge vers b. On note que pour tout n ∈ N, on a
Z Z bn
|f | dλ = |f (x)| dx.
[an ,bn ] an
46 Chapitre 5 – Intégrale de Lebesgue

Comme la suite |f |1[an ,bn ] est croissante, on peut appliquer Beppo Levi, et la convergence absolue de
l’intégrale de Riemann de f sur ]a, b[ donne alors
Z Z b
f dλ = |f (x)| dx < ∞.
[a,b] a

On en déduit que f ∈ L 1 ([a, b]). On peut donc appliquer le théorème de convergence dominée à la suite
(|f |1[an ,bn ] )n , ce qui donne
Z Z
f dλ −→ f dλ.
[an ,bn ] n→∞ [a,b]

La convergence de l’intégrale de Riemann de f sur ]a, b[ fournit alors le résultat.


CHAPITRE 6

Construction de mesures - Unicité

6.1 Construction de mesures


Cas de la mesure de Lebesgue

On cherche à définir une mesure λ sur R qui soit conforme à la notion de longueur des intervalles de
R. En d’autres termes, si I désigne l’ensemble des intervalles ouverts bornés de R, on souhaite étendre
l’application
λ : I → R+
]a, b[ 7→ b − a
à une classe plus large de parties de R, tout en imposant que le prolongement obtenu soit une mesure sur
une tribu A de R.
Plus précisément, comme détaillé dans le théorème 3.9 énoncé plus haut, on souhaite définir une mesure λ
sur R telle que :
(i) λ([0, 1]) = 1,
(ii) λ est invariante par translation.
Le résultat suivant montre qu’il est impossible de définir une telle mesure sur P(R).
Théorème 6.1 – Il n’existe pas de mesure sur (R, P(R)) vérifiant (i) et (ii).
La démonstration (voir TD) repose sur l’axiome du choix et implique en particulier l’existence de parties
de R dites “non mesurables”, c’est-à-dire qui n’appartiennent à aucune tribu de R sur laquelle on peut
définir une mesure vérifiant (i) et (ii).
Nous allons donc construire une mesure λ sur R vérifiant les propriétés (i) et (ii) sur une tribu de R
différente de P(R). Pour assurer que nous pourrons tout de même mesurer assez d’ensembles de R, nous
chercherons à construire λ sur une tribu assez large : nous imposerons qu’elle contienne les ouverts. En fait,
nous allons même la construire sur la plus petite tribu qui contient les ouverts : la tribu borélienne. Nous
verrons ensuite que cette définition se généralise à des tribus plus grandes. Toutefois, dans la pratique, il
est largement suffisant de travailler dans B(R).

6.1.1 Mesures extérieures


On commence par définir la notion de mesure extérieure, plus faible que la notion de mesure. Une
mesure extérieure sera toujours définie sur toutes les parties d’un ensemble E.
Définition 6.2 – On appelle mesure extérieure sur E une application µ? : P(E) → R+ telle que :

47
48 Chapitre 6 – Construction de mesures - Unicité

– µ? (∅) = 0,
– µ? est croissante : si A ⊂ B ⊂ E, µ? (A) 6 µ? (B),

– µ? est σ-sous-additive : si pour tout n ∈ N, An ⊂ E, alors µ? µ? (An ).
S P
n∈N An 6 n∈N
On note que la propriété de σ-sous-additivité vérifiée par les mesures extérieures est plus faible que la
propriété de σ-additivité des mesures. Par conséquent, toute mesure sur (E, P(E)) est aussi une mesure
extérieure sur E (les mesures extérieures sont toujours définies sur l’ensemble des parties).
Les propositions qui suivent permettent de voir qu’on peut restreindre toute mesure extérieure à une tribu
sur laquelle elle est σ-additive, ce qui fait d’elle une mesure sur cette tribu.
Définition 6.3 – On dit qu’un ensemble A ⊂ E est une partie µ? -mesurable ssi pour tout B ⊂ E,
µ? (B) = µ? (B ∩ A) + µ? (B \ A).
On note Mµ? l’ensemble des parties µ? -mesurables de E.
On peut voir les élements de Mµ? comme les parties de E pour lesquelles µ? “se comporte comme une
mesure”, c’est-à-dire a une propriété d’additivité. Le théorème suivant donne un sens à cette remarque.
Théorème 6.4 –
1. Mµ? est une tribu sur E.
2. µ? est une mesure sur (E, Mµ? ).
Démonstration. 1. Il est clair que ∅ ∈ Mµ? . D’autre part, si A ∈ Mµ? , alors pour tout B ⊂ E
µ? (B) = µ? (B ∩ A) + µ? (B \ A) = µ? (B \ Ac ) + µ? (B ∩ Ac ),
donc Ac ∈ Mµ? . Il reste à vérifier le dernier point. Soient (An )n∈N une suite
S d’éléments S Mµ? ,
de
? ? ?
et B ⊂ E. Par définition de la mesure extérieure, on a µ (B) 6 µ (B ∩ n An ) + µ (B\ n An ).
Montrons l’autre inégalité : on observe que
µ? (B) = µ? (B ∩ A0 ) + µ? (B\A0 )
= µ? (B ∩ A0 ) + µ? ((B\A0 ) ∩ A1 ) + µ? (B\(A0 ∪ A1 ))
= µ? (B ∩ A0 ) + µ? ((B\A0 ) ∩ A1 ) + µ? (B\(A0 ∪ A1 ) ∩ A2 ) + µ? (B\(A0 ∪ A1 ∪ A2 ))
= ...
N n−1
! ! N
!
X [ [
= µ? B\ Ak ∩ An + µ? B\ An
n=0 k=0 n=0

pour tout N ∈ N. Alors


N n−1
! ! !
X [ [
µ? (B) > µ? B\ Ak ∩ An + µ? B\ An
n=0 k=0 n∈N

par croissance de µ? . En laissant tendre N vers ∞, on obtient :


n−1
! ! !
X [ [
µ? (B) > µ? B\ Ak ∩ An + µ? B\ An
n∈N k=0 n∈N
n−1
! ! !
[ [ [
> µ? B\ Ak ∩ An + µ? B\ An .
n∈N k=0 n∈N
S Sn−1  S Sn−1  S
Comme n B\ k=0 Ak ∩ An = n B ∩ An \ k=0 Ak = B ∩ n An , la deuxième inégalité est
démontrée.
2. Seule la σ-additivité est à démontrer. P An , n? ∈ N des éléments de Mµ? deux à deux disjoints.
 Soient
Il suffit de montrer que µ?
F
A
n∈N n > n∈N µ (An ), l’autre inégalité étant vérifiée par définition
de µ? . Pour tout m ∈ N, on a :
! m
! m−1
! m
G G G X
µ? An > µ? An = µ? (Am ) + µ? An = . . . = µ? (An ).
n∈N n=0 n=0 k=0

En laissant tendre m vers ∞, on a bien l’inégalité désirée.


6.1 Construction de mesures 49

6.1.2 La mesure de Lebesgue


Comme on l’a dit précédemment, on cherche à étendre la notion de longueur pour les intervalles de
R. On remarque dans un premier temps que, par croissance de la mesure qu’on souhaite
Pdéfinir, si un
ensemble A ⊂ R vérifie A ⊂ n∈N In , où In ∈ I , alors la mesure de A sera majorée par n∈N `(In ), où
S
`(I) désigne la longueur d’un intervalle I.
Il semble donc naturel de poser
nX [ o
λ? (A) := inf `(In ), A ⊂ In , In ∈ I ∀n ∈ N ,
n∈N n∈N

pour tout A ⊂ R.
Remarque 6.5 – On ne peut pas faire la même construction en prenant des intervalles inclus dans A et
en prenant le sup. Une telle construction donnerait par exemple une mesure nulle à R \ Q qui ne contient
aucun intervalle non vide.
Remarque 6.6 – On peut remplacer I dans la définition de la mesure de Lebesgue par l’ensemble des
intervalles bornés, ou encore par l’ensemble des intervalles.
Proposition 6.7 – λ? est une mesure extérieure sur R.
Démonstration. Tout d’abord, il est clair que λ? (∅) = 0. D’autre part, si A ⊂ B, alors si In ∈ I , n ∈ N,
[ [
B⊂ In ⇒ A ⊂ In ,
n∈N n∈N

donc λ? (B) > λ? (A).


Soit maintenant (Ak )k∈N une suite de parties de R. Posons ε > 0, et pour chaque k ∈ N, prenons une
suite d’intervalles (Ink )n de I telle que
X ε
`(Ink ) 6 λ? (Ak ) + k+1 .
2
n∈N

Alors (Ink )(k,n)∈N2 est un recouvrement dénombrable de Ak par des éléments de I , et


S
k∈N
!
?
[ X X ε  X
λ Ak 6 `(Ink ) 6 λ? (Ak ) + = λ? (Ak ) + ε.
2k+1
k∈N (k,n)∈N2 k∈N k∈N

Comme l’inégalité tient pour tout ε > 0, on obtient bien l’inégalité souhaitée en laissant tendre ε vers
0.
Proposition 6.8 –
1. λ? ([0, 1]) = 1,
2. λ? est invariante par translation.
Démonstration.
1. Pour commencer, λ? ([0, 1]) 6 1 : pour tout ε > 0, [0, 1] ⊂] − ε, 1 + ε[ donc λ? ([0, 1]) 6 1 + 2ε pour
tout ε > 0, on obtient l’inégalité en laissant tendreSε vers 0.
Montrons l’autreSninégalité. Supposons que [0, 1] ⊂ i∈N ]ai , bi [. Par compacité, il existe un entier n
tel que [0, 1] ⊂ i=0 ]ai , bi [.
Soit i1 tel que 0 ∈]ai1 , bi1 [. Si bi1 ∈ [0, 1], il existe i2 tel que bi1 ∈]ai2 , bi2 [. On répète ensuite
l’opération pour construire les ik suivants avec bik−1 ∈]aik , bik [, jusqu’à obtenir biN > 1 (le fait qu’il
y a un nombre fini d’intervalles ]ai , bi [ assure l’existence de N ). Par conséquent,

X N
X N
X
bi − ai > bik − aik > (bik − bik−1 ) + bi1 − ai1 = biN − ai1 > 1.
i∈N k=1 k=2
50 Chapitre 6 – Construction de mesures - Unicité

2. Il est clair que λ? est invariante par translation : si A ⊂ R et x ∈ R,


X X X
λ? (A) = inf `(In ) = inf `(Jn − x) = inf `(Jn ) = λ? (A + x).
)∈I N
(InS (Jn )∈I N (Jn )∈I N
A⊂ n In n∈N S
A+x⊂ n Jn n∈N S
A+x⊂ n Jn n∈N

Par le paragraphe précédent, le Théorème 6.7 montre alors que λ? est une mesure sur la tribu Mλ? de
ses ensembles mesurables, qui vérifie bien les propriétés (i ) et (ii ). Il reste à vérifier que la tribu Mλ?
contient les ensembles qui nous intéressent, c’est-à-dire les boréliens de R.

Proposition 6.9 – La tribu Mλ? contient B(R).

Démonstration. Comme Mλ? est une tribu, il suffit de montrer qu’elle contient une classe qui engendre les
boréliens. Par exemple, il suffit de montrer que pour tout a ∈ R, ] − ∞, a] ∈ Mλ? . Soit donc I =] − ∞, a],
on souhaite montrer que pour tout B ⊂ R, λ? (B) = λ? (B ∩ I) + λ? (B \ I). On sait par sous-additivité de
λ? que
λ? (B) 6 λ? (B ∩ I) + λ? (B \ I),
montrons la deuxième inégalité. Pour ce faire, on considère une suite (In ) = (]an , bn [) de I telle que
B ⊂ n In , et on pose ε > 0. On note que les intervalles ] min(ai , a), min(bi , a) + 2εn [ recouvrent B ∩ I, et
S
que les intervalles ] max(ai , a), max(bi , a)[ recouvrent B \ I. Ainsi,
X X
λ? (B ∩ I) + λ? (B \ I) 6 (min(bn , a) − min(an , a)) + 2ε + (max(bn , a) − max(an , a))
n∈N n∈N
X
= (min(bn , a) + max(bn , a)) − (max(an , a) + min(an , a)) + 2ε
n∈N
X
= (bn − an ) + 2ε
n∈N

Finalement, en laissant tendre ε vers 0, on obtient que λ? (B ∩ I) + λ? (B \ I) 6 n∈N (bn − an ), et on


P
obtient le résultat en passant à l’inf sur les recouvrements dénombrables de B par des éléments de I .

Remarque 6.10 – On peut définir de manière similaire la mesure de Lebesgue de dimension d > 2, en
définissant d’abord la mesure extérieure λ?d par
nX [ o
λ?d (A) = inf V (Pn ), A ⊂ Pn , (Pn )n ∈ P N ,
n∈N n∈N

pour tout A ⊂ Rd , où P désigne l’ensemble des pavés ouverts bornés de Rd . On remarque que la définition
reste la même si P désigne l’ensemble des pavés ouverts de Rd , ou même plus généralement l’ensemble
des pavés de Rd .
On peut ensuite montrer comme ci-dessus que λ?d définit une mesure λd sur B(Rd ), qui vérifie les propriétés
souhaitées :
(i ) λd ([0, 1]d ) = 1,
(ii ) λd est invariante par translation.
Il convient de remarquer qu’on peut aussi construire les mesures de Lebesgue d-dimensionnelles comme
des mesures produits, à partir de la mesure de Lebesgue sur R. Nous détaillerons cette construction au
chapitre 7.

Nous pouvons utiliser la définition de la mesure extérieure de Lebesgue pour proposer une nouvelle
preuve de la régularité de la mesure de Lebesgue. Le résultat ci-dessous concerne λ?d et est valable pour
tout élément de Mλ?d . Il est donc plus fort que le résultat de régularité du chapitre 3.

Lemme 6.11 – Si A ∈ Mλ?d et ε > 0, il existe un fermé F et un ouvert Ω de Rd tels que F ⊂ A ⊂ Ω et


λd (Ω \ F ) < ε.
6.2 Unicité des mesures 51

Démonstration. On remarque d’abord qu’il suffit de montrer que pour tout ε > 0, on peut trouver un
ouvert Ω de Rd tel que A ⊂ Ω et λ?d (Ω \ A) < 2ε . En effet, on pourra alors appliquer le résultat à Ac pour
obtenir un ouvert ω tel que Ac ⊂ ω et λ?d (ω \ Ac ) < 2ε . Ainsi, en introduisant le fermé F = ω c , on aura
bien F ⊂ A ⊂ Ω, et λd (Ω \ F ) 6 λ?d (Ω \ A) + λ?d (A \ F ) < ε.
On suppose
S d’abord
?
Pque λd (A) < ?∞. La définition de λ?d donne l’existence d’une suite (Pn )n de P telle
que A ⊂ n Pn et n V (Pn ) < λd (A) + 2n+2 . Si on considère l’ouvert Ω = n Pn , on a alors A ⊂ Ω, et
ε
S

X ε
λd (Ω) 6 λd (Pn ) < λ?d (A) + .
n
2

Comme A ∈ Mλ?d , on a λ?d (Ω \ A) = λ?d (Ω) − λ?d (Ω ∩ A) = λ?d (Ω) − λ?d (A) < 2ε .
Si maintenant λ?d (A) = ∞, on pose An = A ∩ [−n, n]d pour tout n ∈ N. Il existe alors
S une suite d’ouverts
ε
(Ωn )n telle que An ⊂ Ωn et λ?d (Ωn \ An ) < 2n+2 pour tout n. On a donc A ⊂ Ω := n Ωn , et
[  X ε
λ?d (Ω \ A) 6 λ?d Ω n \ An 6 λ?d (Ωn \ An ) < ,
n n
2

ce qui conclut.

Remarque 6.12 – On peut en fait montrer que la réciproque du lemme 6.1.2 est vraie : une partie A de
Rd est Lebesgue-mesurable si et seulement si pour tout ε > 0, il existe un ouvert Ω et un fermé F tels que
F ⊂ A ⊂ Ω et λd (Ω \ F ) < ε.
Démonstration. Il suffit de montrer la réciproque du lemme 6.1.2. On se ramène donc à prouver
que si B ⊂ Rd , alors λ?d (B) > λ?d (B ∩ A) + λ?d B \ A). On se donne ε > 0, et un ouvert Ω de
Rd tel que A ⊂ Ω et λ?d (Ω \ A) < ε. Ainsi,

λ?d (B ∩ A) + λ?d (B \ A) 6 λ?d (B ∩ Ω) + λ?d (B \ Ω) + λ?d (Ω \ A) 6 λ?d (B) + ε,

du fait que Ω ∈ Mλ?d . En laissant tendre ε vers 0, on obtient le résultat.

On en déduit du lemme la régularité de la mesure extérieure de Lebesgue de la même manière qu’on a


déduit le théorème 3.13 du lemme 3.12.

Théorème 6.13 – Pour tout A ∈ Mλ?d ,


1. λ?d (A) = inf{λd (Ω), Ω ouvert, A ⊂ Ω},
2. λ?d (A) = sup{λd (K), K compact, K ⊂ A}.

Remarque 6.14 – On déduit du théorème 6.13 que pour toute partie A ∈ Mλ?d , il existe des boréliens
B1 , B2 ∈ B(Rd ) tels que B1 ⊂ A ⊂ B2 et λd (B1 ) = λ?d (A) = λd (B2 ).

6.2 Unicité des mesures


La question de la caractérisation des mesures se pose naturellement : lorsqu’on fixe une mesure sur
une classe de parties C d’un ensemble E, définit-on une unique mesure sur σ(C ) ?
On constate aisément que la réponse est non. Par exemple, si E = {0, 1} et C = {{0}}, on note que
σ(C ) = P(E). Si µ est la mesure nulle sur (E, P(E)) et ν la seule mesure sur (E, P(E)) telle que
ν({0}) = 0 et ν({1}) = 1, alors µ et ν coı̈ncident sur C , mais ne sont pas égales. En fait, on peut même
construire des exemples où les deux mesures ont même masse : si E = {0, 1, 2, 3} et C = {{0, 1}, {0, 2}},
alors on a toujours σ(C ) = P(E). On note qu’il suffit de définir la mesure des singletons de E pour définir
de manière unique une mesure sur (E, P(E)). Si µ et ν sont les mesures vérifiant

A {0} {1} {2} {3}


µ(A) 1 0 0 1
ν(A) 0 1 1 0
52 Chapitre 6 – Construction de mesures - Unicité

alors µ(E) = ν(E) = 2, µ et ν coı̈ncident sur C , mais µ et ν ne sont pas égales.


Toutefois, le résultat devient vrai si C est stable par intersection finie, et si l’on fixe la masse de la
mesure, comme nous le verrons dans le théorème 6.19 d’unicité des mesures.
La preuve de ce théorème fait appel à un raisonnement par classe monotone, c’est donc l’occasion
d’introduire ici ce type de raisonnement, qu’il est utile de connaı̂tre. Lorsqu’on souhaite démontrer qu’une
classe de parties est une tribu, il est parfois plus aisé de montrer que cette classe de partie est une classe
monotone. Comme nous le verrons, la structure de classe monotone est comparable à celle de tribu,
mais elle n’impose la stabilité par union dénombrable que pour les unions croissantes. Il reste alors à
se demander sous quelles hypothèses une classe monotone est en fait une tribu. Ou plutôt, sous quelles
hypothèses sur une classe de parties C la classe monotone engendrée par C est une tribu : c’est l’objet du
lemme des classes monotones.
Dans le cadre du théorème d’unicité des mesures, on souhaite naturellement montrer que, sous les
bonnes hypothèses sur C , la classe de parties

M = {A ∈ A , µ(A) = ν(A)}

est une tribu (elle contiendra alors σ(C ) = A ). On remarque qu’il n’est pas évident
S de montrer
S que M
est stable par union dénombrable, mais qu’il est très aisé de montrer que µ( n An ) = ν( n An ) si la
suite (An )n d’éléments de M est supposée croissante. Cette observation permet de montrer que M a une
structure de classe monotone, et le lemme des classes monotones permet de conclure.

6.2.1 Lemme des classes monotones


Définition 6.15 – On appelle classe monotone sur E une classe de parties M telle que
— E ∈ M,
— si A, B ∈ M et A ⊂ B, alors B \ A ∈ M (stabilité par différence),
— si (An )n∈N est une suite croissante de M , alors n An ∈ M (stabilité par union dénombrable
S
croissante).
Remarque 6.16 – Toute tribu sur E est une classe monotone sur E.
Lemme 6.17 – Une classe monotone M sur E stable par intersection finie (i.e. A, B ∈ M ⇒ A∩B ∈ M )
est une tribu sur E.
Démonstration. On commence par remarquer que ∅ = E \ E donc ∅ ∈ M , etSsi A ∈ M , alors Ac =
n
E \ A ∈ M . On considère maintenant une suite (An )n∈N de M , et on pose Bn = k=0 Ak . Comme M est
stable par intersection finie et par passage au complémentaire, M est aussi stable
S par union finie, donc
pour tout n ∈ N, Bn ∈ M . Comme la suite (Bn )n est croissante, on a n An = n Bn ∈ M . On a bien
S
montré que M est une tribu.
On remarque qu’une intersection quelconque de classes monotones sur E est aussi une classe monotone sur
E. Pour toute classe de parties C de E, il existe alors une plus petite classe monotone sur E contenant C .
On l’appelle classe monotone engendrée par C , et on la note m(C ) :
\
m(C ) = {M , M classe monotone sur E, C ⊂ M }.

Lemme 6.18 (Lemme des classes monotones) – Soit C une classe de parties de E stable par intersection
finie. On a alors
σ(C ) = m(C ).
Démonstration. Comme σ(C ) est une classe monotone contenant C , on a immédiatement σ(C ) ⊃ m(C ).
Pour obtenir l’autre inclusion, il suffit de montrer que m(C ) est une tribu. Le lemme 6.17 assure qu’il
suffit de montrer que m(C ) est stable par intersection finie. Commençons par montrer que

∀C ∈ C , ∀B ∈ m(C ), C ∩ B ∈ m(C ). (6.1)

Il suffit de montrer que M1 := {B ∈ m(C ), ∀C ∈ C , C ∩ B ∈ m(C )} est une classe monotone. Comme
C ⊂ M1 par hypothèse, on aura alors M1 = m(C ), ce qui donne (6.1).
6.2 Unicité des mesures 53

— Pour tout C ∈ C , on a C ∩ E = E = C ∈ m(C ) donc E ∈ M1 .


— Si B1 , B2 ∈ M1 avec B1 ⊂ B2 , alors pour tout C ∈ C , C ∩ (B2 \ B1 ) = (C ∩ B2 ) \ (C ∩ B1 ) ∈ m(C )
donc B2 \ B1 ∈ M1 .

S de M1 , alors pour
— Si (Bn )n estSune suite croissante S tout C ∈ C , C ∩ Bn est une suite croissante de
m(C ) donc n C ∩ Bn = C ∩ n Bn ∈ m(C ), et n Bn ∈ M1 .
Pour montrer que m(C ) est stable par intersection finie, c’est-à-dire

∀A ∈ m(C ), ∀B ∈ m(C ), A ∩ B ∈ m(C ),

il suffit de montrer que M2 := {A ∈ m(C ), ∀B ∈ m(C ), A ∩ B ∈ m(C )} est une classe monotone
contenant C . On montre aisément comme ci-dessus que M2 est une classe monotone. Par ailleurs, (6.1)
exprime que M2 contient C , d’où le résultat.

6.2.2 Théorème d’unicité des mesures


Théorème 6.19 (Théorème d’unicité des mesures) – Soient µ et ν deux mesures sur un espace mesurable
(E, A ). Supposons que µ et ν coı̈ncident sur une classe C ⊂ A stable par intersection finie contenant E,
et qui engendre A : σ(C ) = A . Alors :
1. si µ et ν sont finies, on a µ = ν,
2. s’il existe une suite croissante de parties En ∈ C telles que µ(En ) < ∞ et E =
S
n En , on a µ = ν.

Remarque 6.20 – On note que si la propriété 2 du Théorème d’unicité est vérifiée, alors les mesures µ et
ν sont en particulier σ-finies.

Démonstration. 1. On pose
M := {A ∈ A , µ(A) = ν(A)}.
On remarque que M est une classe monotone :
— µ(E) = ν(E) car E ∈ C , donc E ∈ M ,
— si A, B ∈ M avec A ⊂ B, alors µ(B \ A) = µ(B) − µ(A) = ν(B) − ν(A) = ν(B \ A), du fait
que µ et ν sont finies, donc B \ A ∈ M ,
— si (A
S n )n est S de M alors la continuité à gauche de µ et ν implique que
 uneSsuite croissante
µ n An = ν n A n , donc n An ∈ M .
Comme M contient C par hypothèse, on a donc M ⊃ m(C ) = σ(C ) = A , par le lemme des classes
monotones, ce qui prouve que µ = ν sur A .
2. Pour tout n ∈ N, on définit les mesures µn et νn sur (E, A ) par

µn (A) := µ(A ∩ En ), νn (A) := ν(A ∩ En ).

Pour tout n ∈ N, les mesures µn et νn sont donc des mesures finies. Par ailleurs, si C ∈ C , on a alors
C ∩ En ∈ C , et µn (C) = νn (C). On S déduit alors du point 1 que µn = νn sur A . Si A ∈ A , comme
la suite (A ∩ En )n est croissante et n En = E, la continuité à gauche de µ et ν implique que

µ(A) = lim µ(A ∩ En ) = lim µn (A) = lim νn (A) = lim ν(A ∩ En ) = ν(A),
n→∞ n→∞ n→∞ n→∞

ce qui achève la preuve.

6.2.3 Unicité de la mesure de Lebesgue


Comme nous l’avons vu au chapitre 3, si µ est une mesure invariante par translation sur (R, B(R)) et
telle que µ([0, 1]) = 1, alors pour tout intervalle I de R,

µ(I) = `(I).
54 Chapitre 6 – Construction de mesures - Unicité

On déduit alors qu’il existe au plus une mesure λ sur (R, B(R)) invariante par translation et telle que
λ([0, 1]) = 1. En effet, si λ et λ0 satisfont ces propriétés, alors elles coı̈ncident sur la classe I des intervalles.
Or, la classe I est stable par intersection finie, elle contient R tout entier, et elle engendre la tribu B(R).
On peut donc appliquer le point 2 du théorème d’unicité en prenant En =] − n, n[.
On montre l’unicité de la mesure de Lebesgue d-dimensionnelle λd sur (Rd , B(Rd )) de manière analogue,
en montrant que λd fixe la mesure des ensembles de la classe P des pavés de Rd . Comme P est stable
d
par intersection finie et contient Rd , on peut raisonner de la même manière en posant En = ] − n, n[ .
On retiendra pour la suite qu’une mesure sur (Rd , B(Rd )) qui coı̈ncide avec λd sur P est en fait égale à
λd .

6.3 Tribu complétée, mesure complétée


6.3.1 Généralités
Soit (E, A , µ) un espace mesuré. On rappelle qu’un ensemble N ⊂ E est dit µ-négligeable s’il existe
A ∈ A tel que N ⊂ A et µ(A) = 0. On note
Nµ = {N ⊂ E, E est µ-négligeable}.
Remarque 6.21 – On remarque que Nµ est stable par union dénombrable. En effet, si (Nn )n∈N est
une de Nµ , on sait
S suite S S que pourP tout n ∈ N, il existe An ∈ A tel que µ(An ) = 0 et Nn ⊂ An . Ainsi,
n Nn ⊂ n An , et µ( n An ) 6 n µ(An ) = 0.

Définition 6.22 – Si Nµ ⊂ A , on dit que l’espace mesuré (E, A , µ) est complet.


Définition-Proposition 6.23 – On appelle tribu complétée de A la tribu
A¯ = {B ∪ N, B ∈ A , N ∈ Nµ }.
Démonstration. Montrons que A¯ est une tribu sur E :
— ∅ ∈ A ∩ Nµ donc ∅ ∈ A¯.
— Supposons B ∪ N ∈ A¯. On sait alors qu’il existe A ∈ A tel que N ⊂ A et µ(A) = 0, d’où
(B ∪ N )c = (B c \ A) ∪ ((A \ N ) ∩ B c ). Comme A \ N ∩ B c ⊂ A, on a bien (B ∪ N )c ∈ A¯.
— Si Bn ∪ Nn ∈ A¯ pour tout n, alors n (Bn ∪ Nn ) = n Bn ∪ n Nn ∈ A¯ car n Nn ∈ Nµ .
S S S S

Si B ∪ N ∈ A¯, où B ∈ A et N ∈ Nµ , on pose


µ̄(B ∪ N ) = µ(B).
La définition de µ̄ ne dépend pas de l’écriture B ∪ N , B ∈ A , N ∈ Nµ choisie : si B ∪ N = B 0 ∪ N 0 ∈ A¯,
alors on a
B ⊂ B ∪ N ⊂ B ∪ A,
B 0 ⊂ B 0 ∪ N 0 ⊂ B 0 ∪ A0 ,
avec A, A0 ∈ A et µ(A) = µ(A0 ) = 0. On en déduit que µ(B) 6 µ(B 0 ∪ A0 ) = µ(B 0 ), et de même
µ(B 0 ) 6 µ(B), d’où µ̄(B ∪ N ) = µ̄(B 0 ∪ N 0 ).
Proposition 6.24 –
1. µ̄ est une mesure sur A¯, qui prolonge la mesure µ.
2. L’espace mesuré (E, A¯, µ̄) est complet.
Démonstration. 1. Tout d’abord, il est clair que µ̄ prolonge la mesure µ : si B ∈ A , µ̄(B) = µ̄(B ∪ ∅) =
µ(B). En particulier, µ̄(∅) = 0. Pour montrer que µ̄ est une mesure, il reste à montrer la σ-additivité :
si pour tout n ∈ N, Bn ∪ Nn ∈ A¯ avec Bn ∈ A , Nn ∈ Nµ , et les Bn ∪ Nn sont deux à deux disjoints,
alors
F  F F  F  P P
µ̄ n (Bn ∪ Nn ) = µ̄ n Bn ∪ n Nn = µ n Bn = n µ(Bn ) = n µ̄(Bn ∪ Nn ),

car n Nn ∈ Nµ .
F
6.3 Tribu complétée, mesure complétée 55

2. Il suffit de montrer que Nµ̄ ⊂ Nµ . En effet, on aura alors Nµ̄ ⊂ Nµ ⊂ A¯, ce qui montre que
(E, A¯, µ̄) est complet. Pour voir ça, on remarque que si N ∈ Nµ̄ , alors N ⊂ B ∪ N 0 où B ∈ A ,
N 0 ∈ Nµ et µ̄(B ∪ N 0 ) = 0. Il existe donc A0 ∈ A tel que N 0 ⊂ A0 et µ(A0 ) = 0. On a donc

N ⊂ B ∪ N 0 ⊂ B ∪ A0 .

Comme 0 = µ̄(B ∪ N 0 ) = µ(B), on a µ(B ∪ A0 ) = 0, ce qui implique que N ∈ Nµ .

6.3.2 Complétion de B(R)


Définition 6.25 – On appelle tribu de Lebesgue la tribu B(R) complétée de la tribu B(R) pour la
mesure de Lebesgue. On la note L (R).
On appelle encore mesure de Lebesgue la mesure λ̄ complétée de la mesure de Lebesgue λ. On la note
généralement aussi λ.

Théorème 6.26 – 1. La tribu Mλ? des parties mesurables pour la mesure extérieure λ? coı̈ncide avec
la tribu L (R).
2. La mesure λ̄ coı̈ncide avec λ? sur Mλ? = L (R).
Démonstration. 1. Commençons par montrer que si N ∈ Nλ , alors N est λ∗ -mesurable. On sait qu’il
existe A ∈ A tel que N ⊂ A et λ(A) = 0, donc si B ⊂ R, alors λ? (B ∩ N ) 6 λ? (A) = 0 et
λ? (B \ N ) 6 λ? (B). On en déduit que

λ? (B ∩ N ) + λ? (B \ N ) 6 λ? (B).

L’autre inégalité découle de la σ-sous-additivité de λ? , donc on a bien montré que Nλ ⊂ Mλ? .


Comme B(R) ⊂ Mλ? , on obtient immédiatement que L (R) ⊂ Mλ? .
Supposons maintenant que A ∈ Mλ? . Par la régularité de la mesure de Lebesgue, on sait qu’il existe un
borélien B de R tel que B ⊂ A et λ(B) = λ? (A). Comme B ∈ Mλ? , on a λ? (A) = λ? (B) + λ? (A \ B),
ce qui donne λ? (A \ B) = 0. Toujours par régularité de la mesure de Lebesgue, il existe un borélien C
tel que A\B et λ(C) = λ? (B \A) = 0. On en déduit donc que A\B ∈ Nλ , et A = B ∪(A\B) ∈ L (R).
2. Soient B ∈ B(R) et N ∈ Nλ . On a

λ? (B) 6 λ? (B ∪ N ) 6 λ? (B) + λ? (N ).

On a λ? (N ) = 0 car N ⊂ A avec A ∈ B(R) et λ(A) = 0, donc λ? (N ) 6 λ? (A) = 0. On en déduit


que
λ? (B ∪ N ) = λ? (B) = λ(B) = λ̄(B ∪ N ),
d’où λ? = λ̄ sur L (R) = Mλ? .
Proposition 6.27 – La tribu de Lebesgue L (R) a même cardinal que P(R).
Démonstration. L’ensemble de Cantor C ⊂ [0, 1] est compact donc borélien, il vérifie λ(C) = 0, et il est
équipotent à R. Par conséquent, Card P(C) = Card P(R). Comme P(C) ⊂ Nλ ⊂ L (R), on a

Card P(R) = Card P(C) 6 Card L (R),

donc comme L (R) ⊂ P(R), Card P(R) = Card L (R).


Remarque 6.28 – Ce résultat est à comparer avec celui de la remarque 2.11 : la tribu B(R) est a
même cardinal que celui de R. On voit donc par un argument de cardinal qu’il existe des ensembles
Lebesgue-mesurables qui ne sont pas des boréliens. Il en existe même énormément, malgré la difficulté à
en expliciter.
CHAPITRE 7

Mesure produit

Dans ce chapitre, on se penche sur l’intégrale d’une fonction de deux variables f : E × F → K, où
(E, A , µ) et (F, B, ν) sont deux espaces mesurés. On cherche à comparer les intégrales
Z Z  Z Z 
f (x, y) dν(y) dµ(x) et f (x, y) dµ(x) dν(y),
E F F E

lorsqu’elles ont un sens. À condition de définir une tribu et une mesureR adaptées sur E × F , notées
respectivement A ⊗ B et µ ⊗ ν, on peut s’intéresser aussi à l’intégrale E×F f dµ ⊗ ν, lorsqu’elle a un
sens.
Le but de ce chapitre est de donner un cadre dans lequel ces trois intégrales ont un sens, et
Z Z  Z Z  Z
f (x, y) dν(y) dµ(x) = f (x, y) dµ(x) dν(y) = f (x, y) dµ ⊗ ν(x, y).
E F F E E×F

7.1 Tribu produit


Dans la suite, on note
A × B := {A × B, A ∈ A , B ∈ B}.
On se convainc aisément que A × B n’est pas une tribu en général : A × B n’est ni stable par
complémentaire, ni stable par union dénombrable. Nous allons définir la tribu produit A ⊗ B comme la
tribu engendrée par A × B.

7.1.1 Définition
Définition 7.1 – On appelle tribu produit de A et B la tribu A ⊗ B sur l’espace E × F définie par

A ⊗ B = σ(A × B).

On étend la définition au produit de k tribus A1 , . . . , Ak sur les espaces respectifs E1 , . . . , Ek :

A1 ⊗ . . . ⊗ Ak = σ ({A1 × . . . × Ak , Ai ∈ Ai pour tout i ∈ {1, . . . , k}}) .

Proposition 7.2 (Associativité de ⊗) – Si A , B, et C sont des tribus respectivement sur E, F et G,


alors
A ⊗ (B ⊗ C ) = (A ⊗ B) ⊗ C = A ⊗ B ⊗ C .

57
58 Chapitre 7 – Mesure produit

Démonstration. Nous allons montrer que A ⊗ (B ⊗ C ) = A ⊗ B ⊗ C , l’autre égalité se montre de la même


manière. Remarquons d’abord que A × B × C ⊂ A ⊗ (B ⊗ C ), ce qui donne A ⊗ B ⊗ C ⊂ A ⊗ (B ⊗ C ).
Il reste à montrer l’autre inclusion : on considère A ∈ A , et on note

X = {X ∈ B ⊗ C , A × X ∈ A ⊗ B ⊗ C }.

On note qu’il est évident que B × C ∈ X . Par ailleurs, X est une tribu :
– ∅ ∈ X car A × ∅ = ∅,
c
– si X ∈ X , alors on remarque que A × X c = (A × X) ∩ A × F × G ∈ A ⊗ B ⊗ C ,
– si (Xn )n est une suite de X , alors A × n X = n A × Xn ∈ A ⊗ B ⊗ C .
S S

On en déduit que X = B ⊗ C , ce qui montre que A × X ∈ A × B × C dès que A ∈ A et X ∈ B ⊗ C ,


et conclut donc la preuve.

Proposition 7.3 – On appelle π1 et π2 les projections canoniques sur E et F , i.e.

π1 : (x, y) 7→ x,
.
π2 : (x, y) 7→ y.

1. Les projections π1 et π2 sont respectivement (A ⊗ B, A ) et (A ⊗ B, B)-mesurables.


2. La tribu A ⊗ B est la plus petite tribu sur E × F rendant les projections mesurables. En d’autres
termes, si T est une tribu sur E × F tel que π1 et π2 sont respectivement (T , A ) et (T , B)-
mesurables, alors A ⊗ B ⊂ T .

Démonstration. 1. Soient A ∈ A et B ∈ B, on a π1 −1 (A) = A × F ∈ A ⊗ B et π2 −1 (B) = E × B ∈


A ⊗ B, donc π1 et π2 sont mesurables.
2. Supposons que π1 et π2 soient respectivement (T , A ) et (T , B)-mesurables. Si A × B ∈ A × B,
alors A × B = π1 −1 (A) ∩ π2 −1 (B) ∈ T , donc A × B ⊂ T , ce qui donne A ⊗ B ⊂ T .

Cas de B(Rd )

Proposition 7.4 – On a B(R2 ) = B(R) ⊗ B(R).

Démonstration. — Les projections π1 : (x, y) 7→ x et π2 : (x, y) 7→ y sont continues, donc (B(R2 ), B(R))-
mesurables. La proposition 7.3 implique alors que B(R) ⊗ B(R) ⊂ B(R2 ).
— On a B(R2 ) = σ({I × J, I, J intervalles de R}) ⊂ σ(B(R) × B(R)) = B(R) ⊗ B(R).

La même démonstration dans Rd donne en fait

B(Rd ) = B(R) ⊗ . . . ⊗ B(R).

7.1.2 Sections
Définition 7.5 – Si C ⊂ E × F , on définit les ensembles :

Cx = {y ∈ F, (x, y) ∈ C} pour tout x ∈ E,


C y = {x ∈ E, (x, y) ∈ C} pour tout y ∈ F, .

On appelle sections les ensembles Cx et C y .

Remarque 7.6 – 1. Si C ∈ A ⊗ B et (x, y) ∈ E × F , alors 1C (x, y) = 1Cx (y) = 1C y (x).


2. Si C = A × B ∈ A × B, alors pour tous x ∈ E et y ∈ F , on a
 
B si x ∈ A A si y ∈ B
Cx = , et C y = .
∅ sinon ∅ sinon

Proposition 7.7 – Si C ∈ A ⊗ B, alors pour tout x ∈ E, Cx ∈ B, et pour tout y ∈ F , C y ∈ A .


7.2 Mesure produit 59

Démonstration. On se contente de montrer que Cx ∈ B pour tout C ∈ A ⊗ B, le cas de C y étant similaire.


Si x ∈ E, on remarque que Tx := {C ∈ A ⊗ B, Cx ∈ B} est une tribu sur E × F :
– ∅x = ∅ ∈ B,
c
– si C ∈ Tx , alors (C c )x = (Cx ) ∈ B,
– si (Cn )n est une suite de Tx , alors ( n Cn )x = n (Cn )x ∈ B.
S S

Par ailleurs, la remarque 7.6 implique que A × B ⊂ Tx . On en conclut donc que Tx = A ⊗ B, d’où le
résultat.
Remarque 7.8 – Par la remarque 7.6, si C = A × B ∈ A × B, alors on a ν(Cx ) = ν(B)1A (x) pour tout
x ∈ E, et µ(C y ) = µ(A)1B (y) pour tout y ∈ B.
Corollaire 7.9 – Soit f : (E × F, A ⊗ B) → (G, D) mesurable. On définit

fx : y ∈ F 7→ f (x, y), pour tout x ∈ E,


f y : x ∈ E 7→ f (x, y), pour tout y ∈ F.

Pour tous x ∈ E et y ∈ F , fx est (B, D)-mesurable, et f y est (A , D)-mesurable.


Démonstration. Soit D ∈ D, on remarque que fx −1 (D) = {y ∈ F, (x, y) ∈ f −1 (D)} = f −1 (D)x ∈ B car
−1 y
f −1 (D) ∈ A ⊗ B. De même, on a (f y ) (D) = f −1 (D) ∈ A .
Remarque 7.10 – Attention : la réciproque est fausse. Il existe des fonctions non mesurables dont les
fonctions coordonnées sont mesurables.
Lemme 7.11 – On suppose que µ et ν sont σ-finies et C ∈ A ⊗ B. Alors les fonctions x ∈ E 7→ ν(Cx ) et
y ∈ F 7→ µ(C y ) sont mesurables.
Démonstration. On se contente de montrer que x 7→ ν(Cx ) est mesurable, la mesurabilité de la seconde
fonction s’obtenant de la même façon.
On commence par supposer que les mesures sont finies. On pose

M = {C ∈ A ⊗ B, x 7→ ν(Cx ) est mesurable}.

Nous allons montrer que M est une classe monotone qui contient A × B, ce qui donnera directement le
résultat. Tout d’abord, si C = A × B ∈ A × B, alors ν(Cx ) = ν(B)1A (x), et x 7→ ν(Cx ) est mesurable
du fait que A ∈ A . Par ailleurs, M est une classe monotone :
— on vient de voir que E × F ∈ M ,
— si C ∈ M , alors ν(C c x ) = ν(Cx c ) = ν(F ) − ν(Cx ), qui est bien une fonction mesurable de x, comme
somme de deux fonctions mesurables,
— si (Cn )n est une suite croissante de M , alors ν(( n Cn )x ) = ν( n (Cn )x ) = limn→∞ ν((Cn )x ), qui
S S
est mesurable comme limite simple de fonctions mesurables.
Si les mesures ne sont pas finies, il existe une suite croissantes (Fn )n de B telles que n Fn = F ,
S
et ν(Fn ) < ∞ pour tout n. On définit la mesure νn sur (F, B) par νn (B) = ν(B ∩ Fn ). On a alors
ν(Cx ) = limn→∞ νn (Cx ), qui est une fonction mesurable de x comme limite de fonctions mesurables, car
νn est une mesure finie.

7.2 Mesure produit


Théorème 7.12 – Soient µ et ν deux mesures σ-finies sur (E, A ) et (F, B). Il existe une unique mesure
µ ⊗ ν sur (E × F, A ⊗ B) telle que pour tout A × B ∈ A × B,

µ ⊗ ν(A × B) = µ(A)ν(B). (7.1)

De plus, µ ⊗ ν est σ-finie, et pour tout C ∈ A ⊗ B,


Z Z
µ ⊗ ν(C) = ν(Cx ) dµ(x) = µ(C y ) dν(y). (7.2)
E F
60 Chapitre 7 – Mesure produit

• On pose, pour C ∈ A ⊗ B, µ ⊗ ν(C) = E ν(Cx ) dµ(x). Le lemme 7.11 implique


R
Démonstration.
que µ ⊗ ν est bien définie. Par ailleurs, c’est bien une mesure sur (E × F, A ⊗ B) :
R
— µ ⊗ ν(∅) = E ν(∅x ) dµ(x) = 0,
∈ A ⊗ B sont deux
F F
— si les ensembles
F CRn P P à deux disjoints, comme ( n Cn )x = n (Cn )x , on a
µ ⊗ ν( n Cn ) = E n ν((Cn )x ) = n µ ⊗ ν(Cn ) par Beppo Levi.
Par ailleurs, si A × B ∈ A × B, alors la remarque 7.6 implique que ν((A × B)x ) = ν(B)1A (x), d’où
Z
µ ⊗ ν(A × B) = ν(B)1A (x) dµ(x) = µ(A)ν(B).
E

• Montrons maintenant que µ ⊗ ν est l’unique mesure sur (E × F, A ⊗ B) qui vérifie (7.1). Si m est
une autre mesure vérifiant ces propriétés, alors µ ⊗ ν et m coı̈ncident sur A × B, qui est stable par
intersection finie, et contient E × F . Si (En )n et (Fn )n sont les suites de A et B exprimant que µ ν
sont σ-finies, alors pour tout n ∈ N,

µ ⊗ ν(En × Fn ) = m(En × Fn ) = µ(En )ν(Fn ) < ∞. (7.3)

Les hypothèses du théorème d’unicité des mesures sont donc vérifiées, et µ ⊗ ν = m, d’où l’unicité.
On remarque que (7.3) donne de plus que µ ⊗ ν est σ-finie.
• On vérifie comme ci-dessus que C ∈ A ⊗ B 7→ F µ(C y ) dν(y) définit bien une mesure sur
R

(E × F, A ⊗ B), et que pour tout A × B ∈ A × B, on a


Z
µ((A × B)y ) dν(y) = µ(A)ν(B).
F

µ(C y ) dν(y) pour tout C ∈ A ⊗ B, ce qui conclut la


R
L’unicité nous donne alors que µ ⊗ ν(C) = F
preuve.

On remarque immédiatement que si µ, ν, ξ sont des mesures sur trois espaces mesurables σ-finis (E, A ),
(F, B) et (G, C ), alors les mesures (µ ⊗ ν) ⊗ ξ et µ ⊗ (ν ⊗ ξ) coı̈ncident sur A × B × C , elles sont donc
égales. On note par fois µ ⊗ ν ⊗ ξ.

Proposition 7.13 – La mesure λ ⊗ . . . ⊗ λ coı̈ncide avec la mesure de Lebesgue λd sur (Rd , B(Rd )).
| {z }
d

Démonstration. Pour d ∈ N? , on note λd = λ ⊗ . . . ⊗ λ. On raisonne par récurrence sur d.


| {z }
d
— Il est clair que le résultat est vrai pour d = 1.
Qd
— Supposons que λd−1 = λd−1 . Alors, pour tout pavé P = k=1 Ik , où les Ik sont des intervalles de R,
on a !
d−1
Y Yd
d
λ (P ) = λd−1 Ik λ(Id ) = λ(Ik ) = λd (P ).
k=1 k=1

Comme λd et λd coı̈ncident sur les pavé de Rd , le théorème d’unicité de la mesure de Lebesgue sur
Rd permet de conclure.

7.3 Théorèmes de Fubini


Le théorème suivant exprime que, lorsque les mesures µ et ν sont σ-finies et la fonction f est mesurable
positive sur (E × F, A ⊗ B), les intégrales introduites en début de chapitre ont toujours un sens, et sont
toujours égales.

Théorème 7.14 (Fublini-Tonelli ) – Si (E, A , µ) et (F, B, ν) sont σ-finis, et si f : (E × F, A ⊗ B) → R+


est mesurable, alors
7.3 Théorèmes de Fubini 61

R R
1. les fonctions x 7→ F
f (x, y) dν(y) et y 7→ E
f (x, y) dµ(x) sont mesurables,
2. on a l’égalité
Z Z Z  Z Z 
f dµ ⊗ ν = f (x, y) dν(y) dµ(x) = f (x, y) dµ(x) dν(y).
E×F E F F E

Démonstration. — On commence par supposer que f est de la forme 1C , où C ∈ A ⊗ B. Le lemme


7.11 implique alors le point 1., et (7.2) donne exactement le point 2. On en déduit par linéarité de
l’intégrale que le résultat est vrai lorsque f ∈ E+ (E × F ).
— Traitons maintenant le cas général. On sait qu’il existe une suite croissante (fn )n∈N de fonctions de
E+ (E × F ) qui converge simplement vers f . Pour tout x ∈ E, ((fn )x )n est une suite croissante de
fonctions mesurables, donc Beppo Levi implique que
Z Z
f (x, y) dν(y) = lim fn (x, y) dν(y).
F n→∞ F
R
Ainsi, la fonction x 7→ F f (x, y)
R dν(y) est mesurable comme limite simple de fonctions mesurables.
On montre de même que y 7→ E f (x, y) dµ(x) est mesurable en appliquant Beppo Levi à la suite
(fn )y n∈N pour y ∈ F .
R
Les fonctions x 7→ F fn (x, y) dν(y) forment une suite croissante de fonctions mesurables. On utilise
à nouveau Beppo Levi, qui donne
Z Z  Z Z 
fn (x, y) dν(y) dµ(x) −→ f (x, y) dν(y) dµ(x)
E F n→∞ E F
=

Z Z
fn (x, y) dµ ⊗ ν(x, y) −→ f (x, y) dµ ⊗ ν(x, y),
E×F n→∞ E×F

d’où la première égalité. On montre la seconde de la même manière.


Remarque 7.15 – L’hypothèse µ et ν σ-finies est cruciale. On pose par exemple E = (R, B(R), λ)
et F = (R, P(R), m) où m est la mesure de comptage, et C = {(x, x), x ∈ R}. Comme C est fermé,
C ∈ B(R2 ) = B(R) ⊗ B(R) ⊂ B(R) ⊗ P(R), donc 1C est B(R) ⊗ P(R)-mesurable. Pourtant on a
Z Z  Z
1C (x, y) dm(y) dλ(x) = m({x}) dλ(x) = ∞,
R R R
Z Z  Z
1C (x, y) dλ(x) dm(y) = λ({y}) dm(y) = 0.
R R R

Exemple 7.16 – Si (E, A , µ) est un espace mesuré σ-fini et f : E → R+ est mesurable, alors
Z Z
f dµ = µ({f > t}) dt.
E R+

En effet, {(t, x) ∈ R+ × E, f (x) > t} ∈ B(R+ ) ⊗ A car il se récrit {f ◦ π1 − π2 > 0}. On peut donc
appliquer Fubini-Tonelli :
Z Z Z Z Z Z
µ({f > t}) dt = 1{f >t} (x) dµ(x) dt = 1[0,f (x)] (t) dt dµ(x) = f (x) dµ(x).
R+ R+ E E R+ E

Théorème 7.17 (Fubini ) – Si (E, A , µ) et (F, B, ν) sont σ-finis, et si f ∈ Lµ⊗ν


1
(E × F ), alors
1. on a fx : x 7→ f (x, y) ∈ Lµ1 (E) ν-p.p. y, et f y : y 7→ f (x, y) ∈ Lν1 (F ) µ-p.p. x,
2. on a y 7→ E f (x, y) dµ(x) ∈ Lν1 (F ), et x 7→ F f (x, y) dν(y) ∈ Lµ1 (E),
R R

3. on a l’égalité
Z Z Z  Z Z 
f dµ ⊗ ν = f (x, y) dν(y) dµ(x) = f (x, y) dµ(x) dν(y). (7.4)
E×F E F F E
62 Chapitre 7 – Mesure produit

Démonstration. 1. Comme f est A ⊗ B-mesurable, Fubini-Tonelli permet d’écrire


Z Z  Z
|f (x, y)| dµ(x) dν(y) = f dµ ⊗ ν < ∞. (7.5)
F E E×F

On en déduit que pour ν-presque tout y ∈ F , E |f (x, y)| dµ(x) < ∞, ce qui donne que f y ∈ Lµ1 (E).
R

De même, on obtient que fx ∈ Lν1 (F ) pour µ-presque tout x ∈ E.


2. Par inégalité triangulaire, on déduit de (7.5) que y 7→ E f (x, y) dµ(x) ∈ Lν1 (F ), de même pour
R

l’autre fonction.
3. Si f est à valeurs dans R, on sait par Fubini-Tonelli que f + et f − vérifient (7.4). On en déduit alors
l’égalité pour f .
Si f est à valeurs dans C, on sait par ce qui précède que Re f et Im f vérifient (7.4), on en déduit
l’égalité pour f .

Remarque 7.18 – L’hypothèse d’intégrabilité de f pour la mesure produit est cruciale. Par exemple,
Z 1 Z 1 ! Z 1 Z 1 !
x2 − y 2 π x2 − y 2 π
dy dx = , mais dx dy = − .
(x 2 + y 2 )2 4 (x 2 + y 2 )2 4
0 0 0 0

R R  R R 
Il faut retenir qu’il ne suffit pas que les intégrales E F f (x, y) dν(y) dµ(x) et F F f (x, y) dµ(x) dν(y)
existent et soient finies pour qu’on puisse changer l’ordre d’intégration sans changer la valeur de l’intégrale.
CHAPITRE 8

Changement de variable

Pour calculer l’intégrale d’une fonction f : Rd → Rd sur un ouvert V ⊂ Rd , il peut être utile de
“transporter” l’intégrale sur un ouvert U de Rd difféomorphe à V . À titre d’exemple, lorsqu’on veut intégrer
sur Rd une fonction f radiale, c’est-à-dire que f (x) ne dépend que de kxk, on peut souhaiter faire un
changement de variable polaire, de manière à séparer les variables.
Pour ce faire, la formule de transfert de la proposition 5.34 suggère que nous devons expliciter la
mesure image de λd par ϕ, où ϕ désigne le C 1 -difféomorphisme entre U et V .

8.1 Changement de variable affine


Lemme 8.1 – Soient A ∈ G`d (R) et b ∈ Rd et ϕ : x ∈ Rd 7→ Ax + b. Alors

1
(λd )ϕ = λd ,
| det A|

où (λd )ϕ désigne la mesure image de λd par ϕ.

Démonstration. Tout d’abord, on remarque que (λd )ϕ (B) = λd (A−1 B − A−1 b) = λd (A−1 B) pour tout
B ∈ B(Rd ). Par conséquent, on peut supposer sans perte de généralité que b = 0.
On remarque ensuite que la mesure (λd )ϕ est invariante par translation : si B ∈ B(Rd ) et a ∈ Rd , alors

(λd )ϕ (B + a) = λd (A−1 B + A−1 a) = λd (A−1 B) = (λd )ϕ (B).

(λd )ϕ
L’unicité de la mesure de Lebesgue implique alors que λd coı̈ncide sur B(Rd ) avec (λd )ϕ ([0,1]d )
.
En d’autres termes, il existe γ > 0 tel que (λd )ϕ (B) = γλd (B) pour tout B ∈ B(Rd ). Il reste à montrer
−1
que γ = | det A| .
— Supposons que A ∈ Od (R), i.e. A est orthogonale, et considérons le borélien B = {x ∈ Rd , kxk =
1}. Comme A−1 ∈ O(Rd ), on a bien sûr A−1 B = B, ce qui donne que (λd )ϕ (B) = λd (B), et
γ = 1 = | det A|−1 .
— Supposons maintenant que A ∈ Sd++ (R), i.e. A est symétrique définie positive. On sait alors qu’il
existe P ∈ Od (R) et une matrice diagonale D telles que A = tP DP . On considère alors le borélien
B = tP D−1 [0, 1]d , et on remarque que λd (A−1 B) = λd (tP [0, 1]d ) = λd ([0, 1]d ) = 1, d’après le point
Qd −1
précédent. Par ailleurs, λd (B) = λd (D−1 [0, 1]d ) = λd ( i=1 [0, α1i ]) = (α1 . . . αd ) , où les αi sont les
−1
valeurs propres de A. Finalement, γ = | det A| .

63
64 Chapitre 8 – Changement de variable

— Si maintenant A est quelconque dans G`d (R), la décomposition polaire de A donne l’existence de
Q ∈ Od (R) et S ∈ Sd++ (R) telles que A = QS. Ainsi, les points précédents donnent que pour
−1 −1
tout B ∈ B(Rd ), λd (S −1 Q−1 B) = | det S| λd (Q−1 B) = | det S| λd (B). On obtient donc que
−1 −1
γ = | det S| = | det A| , du fait que det A = det Q det S = det S.
Corollaire 8.2 – Si A ∈ G`d (R) et b ∈ Rd , alors pour toute fonction f ∈ L 1 (Rd ), on a
Z Z
f (y) dy = f (Ax + b)| det A| dx.
Rd Rd

Démonstration. Il suffit d’appliquer la formule de transfert en exprimant (λd )ϕ à l’aide du lemme 8.1.

8.2 Théorème de changement de variable


8.2.1 Difféomorphismes et inversion globale
On considère deux ouverts U et V de Rd et ϕ une fonction de U dans V . On rappelle que si ϕ est
différentiable en un point x ∈ U , alors on appelle matrice jacobienne de ϕ en x la matrice associée à
l’application dϕx dans la base canonique de Rd , et on la note Jϕ (x) :
h i
Jϕ (x) = ∂f
∂x1 (x) . . . ∂f
∂xd (x) ∈ Md (R).

Rappelons également que la fonction ϕ est de classe C 1 sur l’ouvert U si et seulement si ses dérivées
partielles existent sur U tout entier, et sont continues.
On dit par ailleurs que ϕ est un C 1 -difféomorphisme de U dans V si ϕ est bijective de U dans V , de
classe C 1 sur U , et de réciproque C 1 sur V .

Nous rappelons ici le théorème d’inversion globale, qui est un outil essentiel pour montrer efficacement
qu’une application d’un ouvert de Rd vers un ouvert de Rd est un C 1 -difféomorphisme.
Théorème 8.3 – La fonction ϕ : U → Rd est un C 1 -difféomorphisme de U dans son image ϕ(U ) si et
seulement si
— ϕ est injective sur U ,
— ϕ est de classe C 1 sur U ,
— pour tout x ∈ U , Jϕ (x) ∈ G`d (R).

8.2.2 Le théorème de changement de variables et quelques applications


Théorème 8.4 – Si ϕ est un C 1 -difféomorphisme entre deux ouverts U et V de Rd , alors
— pour toute fonction borélienne f : U → R+ ,
Z Z
f (y) dλd (y) = f ◦ ϕ(x) | det Jϕ (x)| dλd (x), (8.1)
V U

— pour toute fonction borélienne f : U → K, f ∈ L 1 (V ) si et seulement si f ◦ ϕ | det Jϕ | ∈ L 1 (U ), et


dans ce cas, (8.1) est vérifiée.

Application : changement de variable polaire

Pour intégrer une fonction définie sur un ouvert de R2 , il arrive qu’on souhaite repérer un point du
plan par ses coordonnées polaires. C’est le cas notamment lorsque la fonction est radiale, c’est-à-dire
qu’elle s’écrit comme une fonction de kxk. Pour ce faire, on introduit

ϕ : R?+ ×] − π, π[ → R2 \ D
(r, θ) 7→ (r cos θ, r sin θ),
8.2 Théorème de changement de variable 65

où D = R− × {0}. On note d’abord qu’il est clair que ϕ est C 1 , et bijective de R?+ ×] − π, π[ dans R2 \ D.
Par ailleurs, pour tout (r, θ) ∈ R?+ ×] − π, π[,

| det Jϕ (r, θ)| = r cos2 θ + r sin2 θ = r.

On déduit alors du théorème d’inversion globale que ϕ est un C 1 -difféomorphisme de R?+ ×] − π, π[ vers
R2 \ D. Le théorème de changement de variable assure alors que pour toute fonction f ∈ L 1 (R2 ),
Z Z Z
f (x, y) dλ2 (x, y) = f (x, y) dλ2 (x, y) = f (r cos θ, r sin θ)r dλ2 (r, θ),
R2 R2 \D R?
+ ×]−π,π[

du fait que λ2 (D) = 0. On peut ensuite utiliser le théorème de Fubini pour obtenir la formulation
Z Z Z ∞Z π
f (x, y) dx dy = f (r cos θ, r sin θ)r dr dθ.
R R 0 −π

Application : changement de variable sphérique

Pour intégrer une fonction définie sur un ouvert de R3 , il arrive qu’on souhaite repérer les points de
l’espace par leurs coordonnées sphériques. On introduit alors

Φ : R?+ ×] − π, π[×]0, π[ → R2 \ P
(r, θ, ϕ) 7→ (r sin ϕ cos θ, r sin ϕ sin θ, r cos ϕ),

où P = R− × {0} × R. La fonction Φ est C 1 , et bijective de R?+ ×] − π, π[×]0, π[ dans R2 \ P . Par ailleurs,
pour tout (r, θ, ϕ) ∈ R?+ ×] − π, π[×]0, π2[,

| det Jϕ (r, θ, ϕ)| = r2 sin ϕ.

On déduit alors du théorème d’inversion globale que Φ est un C 1 -difféomorphisme de R?+ ×] − π, π[×]0, π[
vers R2 \ P . Le théorème de changement de variable assure alors que pour toute fonction f ∈ L 1 (R3 ),
Z Z Z
f dλ3 = f (x, y, z) dλ3 (x, y, z) = f (Φ(r, θ, ϕ))r2 sin ϕ dλ3 (r, θ, ϕ),
R2 R2 \P R?
+ ×]−π,π[×]0,π[

du fait que λ3 (P ) = 0. Par Fubini, ceci se reformule


Z Z Z Z ∞Z π Z π
f (x, y, z) dx dy dz = f (r sin ϕ cos θ, r sin ϕ sin θ, r cos ϕ)r2 sin ϕ dr dθ dϕ.
R R R 0 −π 0
CHAPITRE 9

Espaces Lp

9.1 Définitions
On se place sur un espace mesuré (E, A , µ).

9.1.1 Espaces L p , espaces Lp


Définition 9.1 – On définit

L p (E, A , µ) = {f : E → K, f mesurable, |f |p dµ < ∞} pour p ∈]0, ∞[,


R
E

L ∞ (E, A , µ) = {f : E → K, f mesurable, ∃ C > 0, |f | 6 C µ-p.p.},

où K = R ou C. On note aussi ces espaces Lµp (E), L p (E), voire L p lorsque le contexte est clair.
Les fonctions de L ∞ (E) sont aussi appelées les fonctions essentiellement bornées.
Soit m est la mesure de comptage sur (N, P(N)). Pour p ∈]0, ∞[, on note
 X 
p
` (N) := Lm (N) = (un )n∈N ∈ K ,
p p N
|un | < ∞ .
n∈N

Proposition 9.2 – Soit p ∈]0, ∞], l’espace Lµp (E) est un sous-espace vectoriel de l’espace F (E, K).
Démonstration. On suppose d’abord p < ∞. On a bien sûr 0 ∈ L p (E). Par ailleurs, si f, g ∈ L p (E), on
remarque que
p p p p p
|f + g| 6 (|f | + |g|) 6 2p (max(|f |, |g|)) 6 2p (|f | + |g| ) .
p p R p
|f | Rdxµ + |g| dxµ < ∞, et f + g ∈ L p (E). Pour finir, si

On en déduit que |f + g|R dµ 6 2p
R R
p p p
f ∈ L p (E) et α ∈ K, alors |αf | dµ = |α| |f | dµ < ∞, donc αf ∈ L p (E).
Considérons maintenant le cas où p = ∞. On a bien sûr 0 ∈ L ∞ (E). Par ailleurs, si f, g ∈ L ∞ (E), on
sait qu’il existe C > 0 tel que |f | 6 C et |g| 6 C µ-presque partout, ce qui implique que |f + g| 6 2C
µ-p.p., et f + g ∈ L p (E). Si α ∈ K, on a de plus |αf | 6 |α|C, donc αf ∈ L ∞ (E).
Remarque 9.3 – Si 0 < p 6 ∞, alors {f : E → K, f = 0 µ-p.p.} est un sous-espace vectoriel de Lµp (E).
Définition 9.4 – Soit p ∈ [0, ∞], on introduit l’espace

Lp (E, A , µ) := L p (E, A , µ) / {f : E → K, f = 0 µ-p.p.}.

On note aussi Lpµ (E), Lp (E), voire Lp lorsque le contexte est clair.

67
68 Chapitre 9 – Espaces Lp

Remarque 9.5 – On peut définir l’espace Lpµ (E) de manière équivalente en posant Lpµ (E) = Lµp (E)/ ∼,
où ∼ désigne la relation d’équivalence sur Lµp (E) définie par

f ∼g si et seulement si f = g µ-p.p.

Les éléments de Lpµ (E) sont donc des classes d’équivalence de fonctions de Lµp (E) égales µ-p.p. :

f¯ = {g ∈ Lµp (E), f = g µ-p.p.}.

Dans la pratique, on fait l’abus d’écriture consistant à identifier un élément de Lpµ (E) à un de ses
représentants. Par extension, on dira qu’un élément de Lpµ (E) vérifie une propriété (P ) si l’un de ses
représentants vérifie (P ). On dira par exemple que f¯ ∈ Lpµ (E) est continue s’il existe g ∈ Lµp (E) continue
telle que f ∼ g, c’est-à-dire si f est presque partout égale à une fonction continue (on prendra garde à ne
pas confondre avec f est continue presque partout !).
La définition de Lpµ (E) lui confère une structure de K-espace vectoriel, muni des lois

αf¯ := αf , et f¯ + ḡ := f + g,

où f, g ∈ Lpµ (E) et α ∈ K.


Remarque 9.6 – En général, si p < q, on n’a ni Lpµ (E) ⊂ Lqµ (E), ni Lqµ (E) ⊂ Lpµ (E). En effet,
• √1
x
1]0,1] ∈ L1 (R) \ L2 (R),
• 1
x 1[1,∞[ ∈ L2 (R) \ L1 (R).
La proposition suivante montre en revanche que ces inclusions sont vraies dans certains cas particuliers
Proposition 9.7 – 1. Si µ(E) < ∞ et 0 < p 6 q 6 ∞, alors Lqµ (E) ⊂ Lpµ (E).
2. Si 0 < p 6 q 6 ∞, alors `p ⊂ `q .
Démonstration. 1. Si f ∈ Lqµ (E), on a
Z Z Z Z
p p p q
|f | dµ = |f | dµ + |f | dµ 6 µ(E) + |f | dµ < ∞,
E {|f |<1} {|f |>1} E
| {z } | {z }
6 {|f |>1} |f |q dµ
R
6 µ({|f |<1})

donc f ∈ Lpµ (E).


2. Si u = (un )n∈N ∈ `p (N), il existe N ∈ N tel que |un | < 1 pour tout n > N . On en déduit que

X N
X X N
X X
q q p q p
|un | 6 |un | + |un | 6 |un | + |un | < ∞,
n∈N n=0 n>N n=0 n∈N

et u ∈ `q (N).

9.1.2 Normes k · kp
Pour f : E → K mesurable, on note
Z 1/p
• pour 0 < p < ∞, kf kp = |f |p dµ ,
E
• kf k∞ = inf{C > 0, |f | 6 C µ-p.p.}, avec la convention kf k∞ = ∞ si {C > 0, |f | 6 C µ-p.p.} = ∅,
c’est-à-dire si f 6∈ Lµ∞ (E).
Lemme 9.8 – Si f, g : E → K mesurables et f = g µ-p.p., alors pour tout p ∈]0, ∞], kf kp = kgkp .
Démonstration. Si p < ∞, on a |f |p = |g|p µ-presque partout, donc kf kp = kgkp . Si maintenant p = ∞,
on remarque que pour tout C > 0, µ({|f | > C}) = µ({|g| > C), donc kf k∞ = kgk∞ .
9.2 Inégalités de Hölder et Minkowski 69

Remarque 9.9 – On déduit du lemme 9.8 qu’une fonction mesurable f : E → K est dans l’espace Lpµ (E)
si et seulement si kf kp < ∞.
Remarque 9.10 – Si f ∈ C (Rd ), alors kf k∞ = supx∈Rd |f (x)|.
Lemme 9.11 – Si f ∈ L∞ (E), alors |f | 6 kf k∞ µ-presque partout.
Démonstration. Par définition de l’infimum, |f | 6 kf k∞ + n1 µ-presque partout, 
pour tout n ∈ N? .Comme
[ 1
({|f | > kf k∞ + n1 })n∈N? est une suite croissante de A et {|f | > kf k∞ } = |f | > kf k∞ + , on a
n>0
n
 
1
µ({|f | > kf k∞ }) = lim µ |f | > kf k∞ + = 0.
n→∞ n
Proposition 9.12 – S’il existe p0 ∈]0, ∞[ tel que f ∈ Lpµ0 (E), alors kf k∞ = lim kf kp .
p→∞

9.2 Inégalités de Hölder et Minkowski


9.2.1 Inégalité de Hölder
1 1
Définition 9.13 – Si p, q ∈ [1, ∞], on dit que p et q sont des exposants conjugués si p + q = 1.
Théorème 9.14 (Inégalité de Hölder ) – Soient f, g : E → K deux fonctions mesurables, et p, q ∈ [1, ∞]
deux exposants conjugués.
1. Si f et g sont à valeurs dans R+ , alors
Z
f g dµ 6 kf kp kgkq . (9.1)
E

2. Si f ∈ L (E) et g ∈ L (E), alors f g ∈ L1 (E), et


p q

kf gk1 6 kf kp kgkq . (9.2)


Démonstration. 1. On commence par remarquer que si p = ∞ et q = 1, alors f 6 kf k∞ , et l’inégalité
triangulaire donne l’inégalité de Hölder. On peut donc supposer que p, q < ∞.
On note ensuite que si kf kp = 0 ou kgkq = 0, alors f g est nulle µ-presque partout, et l’inégalité est
trivialement vérifiée. Sinon, on remarque que la concavité du logarithme implique que pour tous
u, v > 0,
1 1 1 1
u p v q 6 u + v. (9.3)
p q
Par ailleurs, l’inégalité reste trivialement vraie lorsque u = 0 ou v = 0. On applique alors l’inégalité
p q
avec u = fkf(x)
kp et v = g(x)
kgkqq pour tout x ∈ E, puis on intègre sur E. On obtient alors
p
!
1 fp 1 gq
Z Z
fg
dµ 6 + dµ = 1,
E kf kp kgkq E p kf kpp q kgkqq
d’où l’inégalité de Hölder.
2. Il suffit d’appliquer (9.1) aux fonctions |f | et |g|.
Remarque 9.15 – Le cas particulier p = q = 2 permet de retrouver l’inégalité de Cauchy-Schwarz : si
f, g ∈ L2µ (E), alors
Z
f ḡ dµ 6 kf k2 kgk2 .
E
Remarque 9.16 – La stricte concavité de la fonction logarithme fournit immédiatement le cas d’égalité
p
g(x)q
dans l’inégalité de convexité (9.3) : il y a égalité si et seulement si fkf(x)
kp = kgkq .
p q

On en déduit le cas d’égalité de l’inégalité de Hölder quand p, q < ∞ : il y a égalité dans (9.2) si et
seulement s’il existe α, β non tous deux nuls tels que
α|f |p = β|g|q µ-presque partout.
70 Chapitre 9 – Espaces Lp

9.2.2 Inégalité de Minkowski


Théorème 9.17 (Inégalité de Minkowski ) – Soit p ∈ [1, ∞]. Si f, g ∈ Lp (E), alors f + g ∈ Lp (E), et

kf + gkp 6 kf kp + kgkp . (9.4)

Démonstration. On commence par traiter le cas où p = ∞. Comme on sait que |f | 6 kf k∞ et |g| 6 kgk∞
µ-presque partout, on a |f + g| 6 |f | + |g| 6 kf k∞ + kgk∞ µ-presque partout, ce qui donne (9.4).
p p−1
Supposons maintenant que p ∈ [1, ∞[. Comme |f + g| 6 (|f | + |g|)|f + g| , on obtient que
Z Z Z
p p−1 p−1
|f + g| dµ 6 |f | |f + g| dµ + |g| |f + g| dµ.
E E E

On applique alors l’inégalité de Hölder dans la première intégrale aux fonctions |f | et |f + g|, avec les
exposants conjugués p et p−1
p . On fait de même dans la deuxième intégrale avec les fonctions |g| et |f + g|
et les mêmes exposants conjugués. On obtient
Z Z Z p−1 Z Z p−1
p p p p p
|f + g| dµ 6 |f | dµ |f + g| + |g| dµ |f + g| . (9.5)
E E E E E

p p p−1 p p−1
Ceci se récrit kf + gkp 6 kf kp kf + gkp + kgkp kf + gkp , ce qui donne (9.4) en divisant par
p−1
kf + gkp lorsque kf + gkp 6= 0. Dans le cas où kf + gkp = 0, l’inégalité est trivialement vérifiée.
Remarque 9.18 – En examinant le cas d’égalité dans l’inégalité (9.5), on montre aisément que l’inégalité
de Minkowski est une égalité
– si et seulement si f = 0 µ-presque partout ou g = αf pour un certain α > 0 dans le cas où p > 1,
– si et seulement si f ḡ > 0 µ-presque partout dans le cas p = 1.
Corollaire 9.19 (Inégalité de Minkowski généralisée) – Soient (fn )n∈N une suite de fonctions mesurables
positives et p ∈ [1, ∞]. On a
X X
fn 6 kfn kp .
n∈N p n∈N
Pn
Démonstration. Comme ( k=0 fk )n∈N est une suite croissante de fonctions mesurables positives, le
Pn p R Pn p R P p P p
théorème de Beppo Levi donne que k k=0 fk kp = | k=0 fk | dµ −→ k∈N fk dµ = k k∈N fk kp .
n→∞
Comme le théorème de Minkowski donne
n
X n
X
fk 6 kfk kp ,
k=0 p k=0

on déduit alors l’inégalité de Minkowski généralisée en passant à la limite pour n → ∞ dans l’inégalité
ci-dessus.
Proposition 9.20 – Si p ∈ [1, ∞], alors (Lpµ (E), k · kp ) est un espace vectoriel normé.
Démonstration. Il suffit de montrer que k · kp définit une norme sur Lpµ (E). Supposons d’abord que p < ∞,
– si kf kp = 0, alors f = 0 µ-presque partout, donc f = 0 dans Lpµ (E),
– il est clair que si α ∈ K, alors kαf kp = |α|kf kp ,
– l’inégalité triangulaire est assurée par l’inégalité de Minkowski.
Considérons maintenant le cas p = ∞,
– si kf k∞ = 0, alors |f | 6 0 donc f = 0 µ-presque partout, et f = 0 dans L∞ µ (E),
– si α ∈ K, alors |αf | 6 |α|kf k∞ µ-presque partout, donc kαf k∞ 6 |α|kf k∞ ; d’autre part,
1 1
|f | = |α| |αf | 6 |α| kαf k∞ , donc |α|kf k∞ 6 kαf k∞ ,
– l’inégalité triangulaire est assurée par l’inégalité de Minkowski.
9.3 Les espaces de Banach Lpµ (E) (1 6 p 6 ∞) 71

9.3 Les espaces de Banach Lpµ (E) (1 6 p 6 ∞)


9.3.1 Le théorème de Riesz-Fischer
Théorème 9.21 (Riesz-Fischer ) – Si 1 6 p 6 ∞, l’espace vectoriel normé (Lpµ (E), k · kp ) est complet.
Démonstration. On commence par supposer que p < ∞, et on considère une suite (fn )n∈N de Cauchy
dans Lp (E). On peut alors extraire de (fn )n une sous-suite (fϕ(n) )n∈N telle que pour tout n ∈ N,
1
kfϕ(n+1) − fϕ(n) kp < .
2n
En effet, on sait qu’il existe N0 tel que kfn − fm kp < 1 pour tous n, m > N0 , et on construit ensuite Nk
par récurrence en remarquant qu’il existe Nk > Nk−1 tel que kfn − fm kp < 21k . On pose alors ϕ(k) = Nk
pour tout k ∈ N? .
Par l’inégalité de Minkowski généralisée, on a alors
X X
|fϕ(n+1) − fϕ(n) | 6 kfϕ(n+1) − fϕ(n) kp < ∞.
n∈N p n∈N
P
On en déduit donc que la série n∈N (fϕ(n+1) − fϕ(n) ) converge absolument µ-presque partout, et on peut
finalement définir µ-presque partout la fonction
X
f = (fϕ(n+1) − fϕ(n) ) + fϕ(0) .
n∈N

En appliquant à nouveau l’inégalité de Minkowski généralisée, on obtient que f ∈ Lp (E). Par ailleurs, si
n ∈ N, on a
∞ ∞ ∞
X X X 1
kf − fϕ(n) kp = (fϕ(k+1) − fϕ(k) ) 6 kfϕ(k+1) − fϕ(k) kp 6 −→ 0.
2k n→∞
k=n p k=n k=n

Ainsi, (fn )n est une suite de Cauchy dans Lp (E) qui admet une valeur d’adhérence f , donc elle converge
vers f dans Lp (E).
Si maintenant p = ∞, on s’appuie sur la complétude de l’espace Fb (E, K) des fonctions bornées de E
dans K = R ou C. Soit (fn )n∈N une suite de Cauchy dans L∞ (E). On pose
\ \
A= {|fn | 6 kfn k∞ } ∩ {|fn − fm | 6 kfn − fm k∞ },
n∈N n,m∈N

et on remarque que µ(Ac ) = 0. Ainsi, la suite (fn 1A )n∈N est une suite de Cauchy dans Fb (E, K), donc
elle converge dans Fb (E, K) vers une fonction f . Finalement, on a alors
kfn − f k∞ = kfn 1A − f k∞ −→ 0,
n→∞

d’où le résultat.

9.3.2 Lien entre convergence µ-presque partout et convergence Lpµ (E)


En général, la convergence dans Lpµ (E) n’implique pas la convergence µ-presque partout. Par exemple,
on peut considérer la suite de fonction (fn )n
f0 = 1[0,1] , f1 = 1[0, 12 ] , f2 = 1[ 21 ,1] , f3 = 1[0, 14 ] , f4 = 1[ 14 , 21 ] , etc.,

de sorte que λ(suppfn ) −→ 0, donc kfn kp −→ 0, mais pour presque tout x ∈ [0, 1], lim inf n fn (x) = 0
n→∞ n→∞
et lim supn fn (x) = 1, donc (fn (x))n ne converge pas.
En revanche, la démonstration du théorème de Riesz-Ficher permet d’affirmer que le résultat est vrai
si on s’autorise à considérer une sous-suite de (fn )n .
72 Chapitre 9 – Espaces Lp

Proposition 9.22 – Si p ∈ [1, ∞[, et (fn )n est une suite de Lpµ (E) qui converge dans Lpµ (E) vers une
fonction f ∈ Lpµ (E), alors il existe une sous-suite (fϕ(n) )n telle que
fϕ(n) −→ f µ-p.p..
n→∞

Démonstration. Comme la suite (fn )n converge dans Lpµ (E), elle est en particulier de Cauchy dans
Lpµ (E). On peut donc construire une sous-suite (fϕ(n) )n comme dans la démonstration du théorème de
Riesz-Fischer qui converge µ-presque partout vers la fonction
X
g = (fϕ(n+1) − fϕ(n) ) + fϕ(0) ∈ Lpµ (E).
n∈N

La démonstration du théorème 9.21 donne par ailleurs que (fn )n converge vers g dans Lpµ (E). Par unicité
de la limite dans Lpµ (E), on a donc f = g, ce qui conclut la preuve.

9.3.3 Théorème de convergence dominée Lp


Théorème 9.23 (Théorème de convergence dominée Lp ) – Soit p ∈ [1, ∞[. Soient (fn )n une suite de
fonctions de Lpµ (E) et f une fonction mesurable telles que
– fn −→ f µ-presque partout,
n→∞
– il existe g ∈ Lpµ (E) telle que pour tout n, |fn | 6 g µ-presque partout,
alors kf − fn kp −→ 0.
n→∞
p
Démonstration. T à la suite |f − fn | . On remarque
On va appliquer le théorème de convergence dominée
d’abord que |f | 6 g µ-presque partout : en effet, |f | 6 g sur A = n {|fn | 6 g} ∩ {fn −→ f }, dont le
n→∞
complémentaire est de mesure nulle. Par ailleurs, on note que
– |f − fn |p −→ 0 µ-presque partout,
n→∞
p
– |f − fn |p 6 (|f | + |fn |) 6 (2g)p sur A, donc µ-presque partout.
R p
Le théorème de convergence dominée implique alors que E |f − fn | dµ −→ 0, ce qui conclut.
n→∞

9.4 Densité de Cc (Rd ) dans Lp (Rd ) (1 6 p < ∞)


On appelle Cc (Rd ) l’espace des fonctions continues sur Rd , nulle en dehors d’un compact de Rd .
Théorème 9.24 – Soit p ∈ [1, ∞[, Cc (Rd ) est dense dans (Lp (Rd ), k · kp ). Autrement dit, si f ∈ Lp (Rd )
et ε > 0, alors il existe ϕ ∈ Cc (Rd ) telle que kf − ϕkp < ε.
Remarque 9.25 – Le théorème 9.24 devient faux si p = ∞. En effet, il est clair que
 
k·k∞
Cc (Rd ) = f ∈ L∞ (Rd ), f continue et f (x) −→ 0 .
kxk→∞

Commençons par énoncer et démonter un premier lemme.


Lemme 9.26 – On a
k·kp
E1 = Lp (Rd ),
où E 1 = {ϕ : E → R, ϕ est étagée et intégrable}.
Démonstration. Soient f ∈ Lp (Rd ) et ε > 0, nous allons montrer qu’il existe une fonction ϕ ∈ E 1 telle
que kf − ϕk 6 ε, ce qui montrera le lemme.
— Commençons par examiner le cas où f est à valeurs dans R+ . Dans ce cas, on sait qu’il existe une
suite croissante (fn )n de E+ qui converge simplement vers f . Comme kfn kp 6 kf kp pour tout n,
on en déduit que les fn sont intégrables. Par ailleurs, comme fn 6 f , on déduit du théorème de
convergence dominée Lp que kf − fn kp −→ 0. Pour n assez grand, on a bien kf − fn kp 6 ε.
n→∞
9.4 Densité de Cc (Rd ) dans Lp (Rd ) (1 6 p < ∞) 73

— Si maintenant f est à valeurs dans R, on sait par le point précédent qu’il existe ϕ, ψ ∈ E 1 telles que
kf + − ϕk 6 2ε et |f − − ψk 6 2ε . On a alors kf − (ϕ − ψ)kp 6 ε.
— Si f est à valeurs complexes, on sait par le point précédent qu’il existe ϕ, ψ ∈ E 1 telles que
kRe f − ϕk 6 2ε et |Im f − ψk 6 2ε . On a alors kf − (ϕ + iψ)kp 6 ε.
k·kp
Démonstration (dans le cas d = 1). D’après le lemme 9.26, il suffit de montrer que E 1 ⊂ Cc (R) . En
k·kp k·kp
p
effet, on aura alors L (R) = E1⊂ Cc (R) , ce qui conclura la preuve.
Soient f ∈ E et ε > 0. Montrons qu’il existe ϕ ∈ Cc (R) telle que kf − ϕkp 6 ε.
1

— On considère f = 1I où I est un intervalle de R. On pose ϕn = (1 − n d(x, I)) ∈ Cc (R). On a alors


+

2
 p1
kf − ϕn kp = n(p+1) −→ 0, d’où le résultat dans ce cas.
n→∞
— Si maintenant f = 1Ω où Ω est un ouvert de R, on sait que Ω = k∈N Ik où les Ik sont des intervalles
F
de R deux à deux disjoints. Par ailleurs, les Ik sont bornés car λ(Ik ) 6 λ(Ω) < ∞ du fait que
1Ω ∈ Lp (R).
Comme k=1 1Ik −→ 1Ω µ-p.p. et 1Ω ∈ Lp (R) (car λ(Ω) < ∞), on a 1Ω − k=1 1Ik p −→ 0
Pn Pn
n→∞ n→∞
par convergence dominée Lp . Il existe donc n tel que 1Ω − k=1 1Ik p 6 2ε .
Pn

Pour tout k ∈ N, il existe ϕk ∈ Cc (R) telle que k1Ik − ϕk kp 6 2k+2


ε
. On a alors
n n n
1 Ik (ϕk − 1Ik )
X X X
f− ϕk 6 f− + (9.6)
k=1 p k=1 p k=1 p
| {z } | {z }
n
6 ε
k1Ik −ϕk kp 6 ε
P
2 6 2
k=1

Pn
Comme k=1 ϕk ∈ Cc (R), on a bien le résultat dans ce cas.
— Si f = 1B , où B ∈ B(R), on sait par la régularité de la mesure de Lebesgue qu’il existe un ouvert Ω
de R contenant B tel que λ(Ω \ B) 6 2ε . Par ailleurs, il existe ϕ ∈ Cc (R) telle que k1Ω − ϕkp 6 2ε .
p

On a donc
kf − ϕkp 6 λ(Ω \ B) p + k1Ω − ϕkp 6 ε.
1

— Examinons maintenant le cas général où f = i=1 αi 1Ai avec αi > 0 pour tout i. Pour tout i, il
PN

existe ϕi ∈ Cc (R) telle que k1Ai − ϕkp 6 |αiε|N , et Minkowski donne kf − i=1 αi ϕi kp 6 ε.
PN

Adaptation au cas où d est quelconque : Dans le cas où d est quelconque, La démonstration s’adapte au
cas où d est quelconque en faisant les remarques suivantes :
— On peut approcher 1P où P est un pavé borné par la suite de fonction de Cc (Rd ) donnée par
+
ϕn = (1 − nd(x, P )) .
— Si Ω est un ouvert de Rd de mesure finie, on ne peut S
pas l’écrire comme union disjointe dénombrable
de pavés bornés. En revanche, on peut écrire Ω = k Pk , où les Pk sont des pavés bornés. On a
donc comme précédemment
f − 1Snk=0 Pk p −→ 0,
n→∞

1
Sn
et il existe n tel que f − Sn
k=0 Pk p
6 2ε . Par ailleurs, on remarque que k=0 Pk peut s’écrire
FNn
comme union disjointe de pavés bornés k=0 Qk , à un ensemble λd -négligeable près. Par conséquent,
1Sn
k=0 Pk
= 1 FNn λ
Qk d
k=0
-presque partout. On peut alors conclure comme en (9.6).
CHAPITRE 10

Convolution et applications

La convolution est un outil de régularisation des fonctions, dont nous allons nous servir en particulier
pour montrer la densité des fonctions Cc∞ (Rd ) dans les espaces Lp (Rd ) pour p ∈ [1, ∞[.
Pour comprendre la définition de la convolution de deux fonctions, il faut imaginer qu’on souhaite
approcher une fonction f ∈ Lp (Rd ) sur un voisinage de x ∈ Rd par une fonction plus R régulière sur ce
voisinage. Par exemple, si on dispose d’une fonction ϕ ∈ Cc∞ (Rd ), positive, telle que Rd ϕ(x) dx = 1 et
ϕ = 0 en dehors de B(0, 1), on peut souhaiter remplacer f (x) par
Z
f (y)ϕ(x − y) dy,
Rd

qui est en fait une moyenne de f autour de x. Lorsqu’il existe, cet objet s’appelle la convolution de f et ϕ
au point x, et on le note f ? ϕ(x).

ϕ(x − ·)

ϕ
|
x

Nous allons nous intéresser aux différents cadres dans lesquels la convolution de deux fonctions est
bien définie, ainsi qu’à ses propriétés de régularisation le cas échéant.

75
76 Chapitre 10 – Convolution et applications

10.1 Opérateur de translation


Si f : Rd → K et a ∈ Rd , on définit

τa f : x ∈ Rd 7→ f (x − a).

Proposition 10.1 – Si a ∈ Rd et p ∈ [1, ∞], alors τa définit une isométrie de Lp (Rd ) dans Lp (Rd ).
Démonstration. On remarque d’abord que si f = g λd -presque partout, alors

λd ({τa f 6= τa g}) = λd ({f 6= g} + a) = λd ({f 6= g}) = 0,

donc τa f = τa g λd -presque partout, et τa est bien définie de Lp (Rd ) dans Lp (Rd ).


Par ailleurs, si p < ∞ et f ∈ Lp (Rd ), alors on a immédiatement |τa f (x)|p dx = |f (y)|p dy en effectuant
R R

le changement de variable y = x − a.
Si p = ∞, on conclut immédiatement en remarquant que pour tout C > 0, |f | > C µ-p.p. si et seulement
si |τa f | > C µ-p.p.
Théorème 10.2 – Si p ∈ [1, ∞[ et f ∈ Lp (Rd ), alors

kτa f − f kp −→ 0.
kak→0

Démonstration. — On suppose d’abord que f ∈ Cc (Rd ). Il existe donc R > 0 tel que f ≡ 0 sur
B(0, R)c . Soit (an )n une suite de Rd qui tend vers 0. Pour n assez grand, on a alors kan k 6 R, et
f (x − an ) − f (x) = 0 pour tout x ∈ B(0, 2R)c . Ainsi,
Z Z
p
|f (x − an ) − f (x)| dx = |f (x − an ) − f (x)|p .
Rd B(0,2R)

On note que
– par continuité de f , |f (x − an ) − f (x)|p −→ 0 pour tout x ∈ B(0, 2R),
n→∞
– pour tout n, |f (x − an ) − f (x)| 6 2kf k∞ et x 7→ 2kf k∞ ∈ Lp (B(0, 2R)),
on peut appliquer le théorème de convergence dominée Lp , qui donne
p
kτan f − f kp −→ 0,
n→∞

d’où le résultat.
— Si maintenant f ∈ Lp (Rd ) et ε > 0, on sait qu’il existe une fonction ϕ ∈ Cc (Rd ) telle que kf −ϕkp 6 3ε .
Par le point précédent, si kak est assez petit, on a kτa ϕ − ϕkp 6 3ε . On a alors

kτa f − f kp 6 kτa f − τa ϕkp + kτa ϕ − ϕkp + kf − ϕkp 6 ε,


| {z } | {z } | {z }
ε
= kf −ϕkp 6 3 6 ε 6 ε
3 3

d’où le résultat.
Remarque 10.3 – Le résultat devient faux si p = ∞ : par exemple, si f = 1[0,1] ∈ L∞ (R), on a
kτa f − f k∞ = 1 dès que a 6= 0.

10.2 Convolution
10.2.1 Le cas où f, g ∈ M+
Définition 10.4 – Soient f, g : Rd → R+ deux fonctions boréliennes. On définit la convolution de f et
de g comme la fonction Z
f ? g : x ∈ Rd 7→ f (x − y)g(y) dy.
Rd
10.2 Convolution 77

On note que pour tout x ∈ Rd , la fonction y 7→ f (x − y)g(y) est borélienne comme produit de fonctions
boréliennes, donc la fonction f ? g est bien définie sur Rd .
Proposition 10.5 – Si f, g ∈ M+ , alors f ? g est borélienne, positive, et
Z Z  Z 
f ? g dλd = f dλd g dλd .
Rd Rd Rd

Démonstration. Les fonctions (x, y) ∈ R2d 7→ x − y et (x, y) ∈ R2d 7→ y sont continues donc boréliennes.
Par composition et produit de fonctions boréliennes, la fonction (x, y) ∈ R2d 7→ f (x − y)g(y) est donc
borélienne. Par le théorème de Fubini-Tonelli, f ? g est borélienne, et on a
Z Z Z  Z  Z 
f ? g(x) dx = f (x − y) dx g(y) dy = f (z) dz g(y) dy ,
Rd Rd Rd Rd Rd

par le changement de variable z = x − y. Par ailleurs, f ? g est positive car f et g le sont.


Proposition 10.6 – Si f, g ∈ M+ , alors la convolution f ? g a les propriétés suivantes :
1. f ? g = g ? f ,
2. si h ∈ M+ , (f ? g) ? h = f ? (g ? h),
3. {f ? g 6= 0} ⊂ {f 6= 0} + {g 6= 0}.
R
Démonstration. 1. Il suffit de faire le changement de variable z = x − y dans l’intégrale Rd
f (x −
y)g(y) dy.

2. Soit x ∈ Rd . On a (f ? g) ? h(x) = Rd Rd f (z)g(x − y − z) dz h(y) dy. Les mêmes arguments que
R R

dans la preuve de la proposition 10.5 montrent que la fonction (y, z) 7→ f (z)g(x − y − z)h(y) est
mesurable. Le théorème de Fubini-Tonelli donne alors
Z Z  Z
(f ? g) ? h(x) = g(x − z − y)h(y) dy f (z) dz = f (z) (g ? h)(x − z) dz = f ? (g ? h)(x).
Rd Rd Rd

3. Raisonnons par contraposée : supposons que x 6∈ {f 6= 0} + {g 6= 0}. Ceci se récrit : pour tout
6 0}, x−y 6∈ {f 6= 0}, c’est-à-dire f (x−y) = 0. Finalement, pour tout y ∈ Rd , f (x−y)g(y) = 0,
y ∈ {g =
ce qui donne f ? g(x) = 0 et conclut la preuve.
Exemple 10.7 – Si f = 1[− 12 , 21 ] , alors

 0
 si x 6 −1,
λ([− 21 , x + 12 ]) = x + 1
  
1 1 1 1 
si − 1 6 x 6 0,
f ? f (x) = λ − , ∩ x − ,x + =
2 2 2 2 
 λ([x − 21 , 12 ]) = 1 − x si 0 6 x 6 1,
0 si x > 1.

On constate dès cet exemple l’effet régularisant de la convolution : f ? f est continue alors que f ne l’est
pas.

10.2.2 Le cas général


On s’intéresse aux différents cadre qui permettent de définir la convolution de deux fonctions boréliennes
f et g de Rd dans K comme Z
f ? g(x) = f (x − y)g(y) dy.
Rd
On observe tout d’abord que, pour les mêmes raison que précédemment, la fonction y 7→ f (x − y)g(y) est
borélienne pour tout x ∈ Rd . Une condition nécessaire et suffisante pour pouvoir définir la convolution de
f et g en un point x ∈ Rd est donc que |f | ? |g|(x) < ∞.
Le théorème qui suit met déjà en évidence le caractère régularisant de la convolution : il suffit que
f ∈ Lp (Rd ) et g ∈ Lq (Rd ) où p et q sont conjugués pour que la convolution existe et soit uniformément
continue sur Rd .
78 Chapitre 10 – Convolution et applications

Théorème 10.8 (Convolution Lp -Lq ) – Soient p, q ∈ [1, ∞] deux exposants conjugués, si f ∈ Lp (Rd ) et
g ∈ Lq (Rd ), alors f ? g est définie sur Rd , uniformément continue et

|f ? g| 6 kf kp kgkq . (10.1)

Démonstration. On suppose sans perte de généralité que p < ∞. Si x ∈ Rd , alors l’inégalité de Hölder
donne Z 1/p Z 1/q
Z
p q
|f (x − y)g(y)| dy 6 |f (x − y)| dy |g(y)| dy = kf kp kgkq .
Rd Rd Rd

Ainsi, f ? g est définie sur Rd , et (10.1) est vérifiée.


Par ailleurs, pour tout x ∈ Rd , on a
Z
f ? g(x + a) − f ? g(x) = (f (x + a − y) − f (x − y))g(y) dy
d
ZR
= (τ−a f − f )(x − y)g(y) dy = (τ−a f − f ) ? g(x).
Rd

Ainsi, ce qui précède implique que |f ? g(x + a) − f ? g(x)| 6 kτ−a f − f kp kgkq .


Comme le théorème 10.2 assure que kτ−a f − f kp −→ 0, on obtient que |f ? g(x + a) − f ? g(x)| −→ 0
kak→0 kak→0
indépendamment de x, ce qui assure la continuité uniforme de f ? g.

Corollaire 10.9 – Si f, g ∈ Cc (Rd ), alors f ? g existe sur Rd et f ? g ∈ Cc (Rd ).

Démonstration. Le théorème 10.8 assure l’existence et la continuité de f ? g, et le point 3 de la proposition


10.6 adapté au cas de fonction à valeurs dans K donne que f ? g est à support compact.

Théorème 10.10 (Convolution Lp -L1 ) – Soit p ∈ [1, ∞[. Si f ∈ Lp (Rd ) et g ∈ L1 (Rd ), alors f ? g est
définie presque partout sur Rd , f ? g ∈ Lp (Rd ). De plus,

kf ? gkp 6 kf kp kgk1 .

Démonstration. Soient f ∈ Lp (Rd ) et g ∈ L1 (Rd ). On remarque que si q ∈ [1, ∞] est l’exposant conjugué
p
à p, c’est-à-dire q = p−1 ,
Z Z
1 1
|f (x − y)g(y)| dy = |f (x − y)g(y) p | |g(y)| q dy
Rd Rd
Z  p1 p−1
p
= |f (x − y)| |g(y)| dy kgk1 p ,
Rd

par l’inégalité de Hölder. On en déduit alors que


Z Z Z 
p p−1
(|f | ? |g|(x)) dx 6 |f (x − y)|p |g(y)| dy dx kgk1
R d R d R d
Z Z 
p p−1 p p
= |f (x − y)| dx |g(y)| dy kgk1 = kf kp kgk1 ,
R d d
| R {z }
=kf kp
p

p
par le théorème de Fubini-Tonelli, qu’on peut appliquer du fait que (x, y) ∈ R2d 7→ |f (x − y)| |g(y)|
est mesurable. On en déduit que |f | ? |g| < ∞ presque partout, donc f ? g existe presque partout. Par
ailleurs, ce qui précède donne que (x, y) 7→ f (x − y)g(y) est intégrable sur R2d donc, par le théorème de
Fubini, f ? g est presque partout égale à une fonction borélienne. On conclut en remarquant que l’inégalité
triangulaire donne Z Z
p p p p
|f ? g(x)| dx 6 (|f | ? |g|) dx 6 kf kp kgk1 .
Rd Rd
10.2 Convolution 79

Théorème 10.11 – L’espace vectoriel L1 (Rd ) muni de la loi ? donnée par la convolution forme une
K-algèbre commutative, qui n’a pas d’unité, c’est-à-dire qu’il n’existe pas de fonction ϕ ∈ L1 (Rd ) telle que
f ? ϕ = f pour toute fonction f ∈ L1 (Rd ).
Démonstration. On montre aisément que ? est distributive par rapport à la loi +. Par ailleurs, on voit
qu’elle est commutative par un changement de variable. Pour finir, on voit que la loi ? est associative
en appliquant Fubini comme dans la proposition 10.6, après avoir appliqué Fubini-Tonelli à la fonction
(y, z) 7→ f (z)g(x − y − z)h(y).
Montrons maintenant qu’il n’existe pas d’unité pour la loi ?. On suppose que ϕ ∈ L1 (Rd ) est telle que
f ? ϕ = f presque partout pour toute fonction f ∈ L1 (Rd ), et on considère la suite (fn )n∈N de L1 (Rd )
2
définie par fn (x) = e−nkxk pour tout x ∈ Rd . Le théorème de convergence dominée donne que
Z
fn ? ϕ(0) = fn (y)ϕ(y) dy −→ 0. (10.2)
Rd n→∞

En effet, la suite (fn ϕ)n converge vers la fonction nulle presque partout, et pour tout n ∈ N, |fn ϕ| 6 ϕ
presque partout.
Par ailleurs, on remarque que pour tout n ∈ N, comme fn ∈ L∞ (Rd ), la fonction fn ? ϕ est continue sur
Rd . Ainsi, comme fn et fn ? ϕ sont égales presque partout, elles sont finalement égales sur tout Rd (sinon,
elle sont distinctes sur un intervalle non vide, ce qui est impossible). En particulier, fn ? ϕ(0) = 1 pour
tout n ∈ N, ce qui contredit (10.2)

10.2.3 Approximation de l’unité


Comme nous l’avons vu dans le théorème 10.11, il n’existe pas d’unité dans L1 (Rd ) associée à la
loi de convolution ?. L’examen de la condition f ? ϕ = f dans L1 (Rd ) pour toute fonction f ∈ L1 (Rd )
suggère que ϕ devrait avoir un support réduit à {0}, mais devrait vérifier kϕk1 > 0, sinon f ? ϕ = 0 pour
toute fonction f . Il est clair que ceci est impossible pour une fonction de L1 (Rd ). On peut en revanche
introduire des suites de fonctions qui tendent à se comporter comme une unité pour la loi ?. Bien sûr ces
suites ne convergent vers aucune fonction de L1 (Rd ), mais nous verrons plus bas qu’elles fournissent des
approximations pour les fonctions de Lp (Rd ).
Définition 10.12 – On appelle approximation de l’unité une suite (ϕn )n∈N de L1 (Rd ) telle que
◦ pour tout n ∈ N, ϕn > 0 presque partout,
R
◦ pour tout n ∈ N, Rd ϕn (x) dx = 1,
R
◦ pour tout δ > 0, B(0,δ)c ϕn (x) dx −→ 0.
n→∞

Remarque 10.13 – Pour construire une approximation de l’unité, il suffit de disposer d’une fonction
ϕ ∈ L1 (Rd ) positive presque partout, et telle que Rd ϕ(x) dx = 1, et de poser ϕn (x) = nd ϕ(nx). En effet,
R

les fonctions ϕn sont clairement positives presque partout, et


R R
– Rd ϕn (x) dx = Rd ϕ(y) dy = 1 pour tout n ∈ N avec le changement de variable y = nx,
– le même changement de variable donne que si δ > 0,
Z Z
ϕn (x) dx = ϕ(y) dy −→ 0,
B(0,δ)c B(0,nδ)c n→∞

par le théorème de convergence dominée.


Théorème 10.14 – Soit (ϕn )n∈N une approximation de l’unité. Si f ∈ Lp (Rd ), alors pour tout n ∈ N,
f ? ϕn ∈ Lp (Rd ), et
kf ? ϕn − f kp −→ 0.
n→∞
d
Démonstration. On note que si x ∈ R ,
Z Z  p1
p
|f ? ϕn (x) − f (x)| 6 |f (x − y) − f (x)|ϕn (y) dy 6 |f (x − y) − f (x)| ϕn (y) dy
Rd Rd
80 Chapitre 10 – Convolution et applications

R
par l’inégalité de Hölder, du fait que ϕn (y) dy = 1. On en déduit que
Rd
Z Z Z 
p p
|f ? ϕn (x) − f (x)| dx 6 |f (x − y) − f (x)| ϕn (y) dy dx.
Rd Rd Rd

p
Comme la fonction (x, y) ∈ R2d 7→ |f (x − y) − f (x)| ϕn (y) est mesurable, Fubini-Tonelli donne que
Z Z Z  Z
p p p
|f ? ϕn (x) − f (x)| dx 6 |f (x − y) − f (x)| dx ϕn (y) dy = kτy f − f kp ϕn (y) dy.
Rd Rd Rd Rd

p
Si ε > 0, le théorème 10.2 donne l’existence de δ > 0 tel que si kyk 6 δ, alors kτy f − f kp 6 2ε . Alors,
Z Z Z
p p p
|f ? ϕn (x) − f (x)| dx 6 kτy f − f kp
ϕn (y) dy + kτy f − f kp ϕn (y) dy
Rd B(0,δ) B(0,δ)c
Z
ε p
6 + (2kf kp ) ϕn (y) dy
2 B(0,δ)c
6 ε

lorsque n est assez grand, du fait que (ϕn )n est une approximation de l’unité.

Théorème 10.15 – Si (ϕn )n∈N est une approximation de l’unité et f ∈ L∞ (Rd ) est uniformément
continue sur Rd , alors
kf ? ϕn − f k∞ −→ 0.
n→∞

Démonstration. Soient ε et δ > 0 tel que si ky − xk < δ, alors |f (y) − f (x)| < 2ε . Il suffit de reprendre la
démonstration précédente : pour tout x ∈ Rd ,
Z
|f ? ϕn (x) − f (x)| 6 |f (x − y) − f (x)|ϕn (y) dy
Rd
Z Z
= |f (x − y) − f (x)|ϕn (y) dy + |f (x − y) − f (x)|ϕn (y) dy
B(0,δ) B(0,δ)c
Z
ε
6 + 2kf k∞ ϕn (y) dy 6 ε
2 B(0,δ)c

pour n assez grand.

Remarque 10.16 – Dans le cas ponctuel où f ∈ L∞ (Rd ) est continue en un point x̄ ∈ Rd , la démonstration
du théorème 10.15 donne que f ? ϕn (x) −→ f (x̄).
x→x̄

10.2.4 Régularisation par convolution


Théorème 10.17 – Soient f ∈ L1 (Rd ) et ϕ ∈ Cc1 (Rd ), alors f ? ϕ ∈ C 1 (Rd ), et pour tout i ∈ J1, . . . , dK,

∂xi (f ? ϕ) = f ? ∂xi ϕ.

Démonstration. On note (e1 , . . . , ed ) la base canonique de Rd . On fixe x ∈ Rd , et on remarque que


∂xi (f (y)ϕ(x − y)) = ψ 0 (0), où ψ : t ∈ R 7→ f (y)ϕ(x + tei − y). On utilise le théorème de dérivation sous
l’intégrale :
– pour presque tout y ∈ Rd , la fonction t ∈ R 7→ f (y)ϕ(x + tei − y) est de classe C 1 ,
– comme pour tout t ∈ R, on a |f (y)ϕ(x + tei − y)| 6 |f (y)|kϕk∞ , la fonction y 7→ f (y)ϕ(x + tei − y)
est intégrable sur Rd ,
– pour tout x ∈ Rd , on a |f (y)∂xi ϕ(x − y)| 6 |f (y)| k∂xi ϕk∞ .
On déduit alors que ∂xi (f ? ϕ) existe en tout point x ∈ Rd , et est continue sur Rd , ce qui donne que f ? ϕ
est de classe C 1 sur Rd . D’autre part, on obtient que pour tout i ∈ J1, dK, ∂xi (f ? ϕ) = f ? ∂xi ϕ.
10.2 Convolution 81

Remarque 10.18 – Une récurrence immédiate donne alors que si f ∈ L1 (Rd ) et ϕ ∈ Cck (Rd ), alors
f ? ϕ ∈ C k (Rd ), et pour tout opérateur différentiel d’ordre k, on a

D(f ? ϕ) = f ? (Dϕ).

Remarque 10.19 – On constate aisément qu’on peut en fait supposer que f ∈ L1loc (Rd ) dans le théorème
10.17 sans changer la conclusion, où L1loc (Rd ) désigne l’espace des fonctions mesurables intégrables sur
tout compact de Rd . En particulier, le point 1 de la proposition 9.7 implique que pour tout p ∈ [1, ∞],
Lp (Rd ) ⊂ L1loc (Rd ), donc le résultat tient pour les fonctions de Lp (Rd ).
Définition 10.20 – On appelle suite régularisante une approximation de l’unité (ϕn )n∈N telle que pour
tout n ∈ N, ϕn ∈ Cc∞ (Rd ).
Exemple 10.21 – On introduit la fonction ψ : Rd → R définie par
( 1
− 1−kxk
ψ(x) = e 2
si kxk < 1
0 sinon

ψ
pour tout x ∈ Rd . On pose ensuite ϕ = R , et ϕn : x 7→ nd ϕ(nx) pour tout n ∈ N. On montre
R d ψ dλ d
alors que la suite (ϕn )n∈N ainsi obtenue est une suite régularisante.

Théorème 10.22 – Pour tout p ∈ [1, ∞[, l’espace Cc∞ (Rd ) est dense dans (Lp (Rd ), k · kp ).

Démonstration. On commence par supposer que f ∈ Cc (Rd ), et on considère une suite régularisante
(ϕn )n∈N . On sait alors que pour tout n ∈ N, f ? ϕn ∈ Cc (Rd ). Par ailleurs, le théorème 10.17 donne que
f ? ϕn ∈ Cc∞ (Rd ). Pour finir, le théorème 10.14 implique que kf ? ϕn − f kp −→ 0.
n→∞
Si maintenant f ∈ Lp (Rd ) et ε > 0, on sait qu’il existe ϕ ∈ Cc (Rd ) telle que kf − ϕkp 6 2ε . Par ailleurs,
le point précédent donne l’existence de ψ ∈ Cc∞ (Rd ) telle que kϕ − ψkp 6 2ε . On déduit donc que
kf − ψkp 6 ε, ce qui conclut.

Application 10.23 (Lemme d’Urysohn) – Si K est un compact de Rd et Ω un ouvert de Rd tel que


K ⊂ Ω, alors il existe une fonction f ∈ Cc∞ (Rd ) telle que f ≡ 1 sur K et f ≡ 0 sur Ωc .
Théorème 10.24 – L’espace Cc∞ (Rd ) est dense dans (Cc (Rd ), k · k∞ ).

Démonstration. Il suffit de remarquer que si f ∈ Cc (Rd ) et (ϕn )n∈N est une suite régularisante, alors
f ? ϕn ∈ Cc∞ (Rd ) pour tout n ∈ N, et le théorème 10.15 donne que kf ? ϕn − f k∞ −→ 0, du fait que f
n→∞
est uniformément continue.
Bibliographie

[1] M. Briane and G. Pagès. Théorie de l’intégration, 3ème ed. Vuibert, 2004.
[2] R.M. Dudley. Real Analysis and Probability. Cambridge University Press, 2002.
[3] J. Gapaillard. Intégration pour la licence. Masson, 1997.
[4] W. Rudin. Analyse réelle et complexe, 3ème ed. Dunod, 2009.

Vous aimerez peut-être aussi