Intl
Intl
T. Deheuvels
Table des matières
3 Mesures 19
3.1 Définitions et exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2 Propriétés des mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.3 Mesure de Lebesgue sur Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.4 Ensembles négligeables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4 Fonctions mesurables 25
4.1 Mesurabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.2 Montrer la mesurabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.3 Propriétés des fonctions mesurables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.4 Suites de fonctions mesurables à valeurs réelles . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.5 Approximation des fonctions mesurables à valeurs réelles . . . . . . . . . . . . . . . . . . . . 28
5 Intégrale de Lebesgue 31
5.1 Intégration des fonctions étagées positives . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.2 Intégration des fonctions mesurables positives . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.2.2 Théorème de Beppo Levi et conséquences . . . . . . . . . . . . . . . . . . . . . . . . 34
5.2.3 Inégalité de Markov et conséquences . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5.2.4 Lemme de Fatou . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3 Fonctions intégrables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3.1 L’espace L 1 (E, A , µ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3.2 Propriétés des fonctions intégrables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5.3.3 Formule de transfert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3
4 TABLE DES MATIÈRES
7 Mesure produit 57
7.1 Tribu produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.1.2 Sections . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7.2 Mesure produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.3 Théorèmes de Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
8 Changement de variable 63
8.1 Changement de variable affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
8.2 Théorème de changement de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
8.2.1 Difféomorphismes et inversion globale . . . . . . . . . . . . . . . . . . . . . . . . . . 64
8.2.2 Le théorème de changement de variables et quelques applications . . . . . . . . . . . 64
9 Espaces Lp 67
9.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
9.1.1 Espaces L p , espaces Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
9.1.2 Normes k · kp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
9.2 Inégalités de Hölder et Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
9.2.1 Inégalité de Hölder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
9.2.2 Inégalité de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
9.3 Les espaces de Banach Lpµ (E) (1 6 p 6 ∞) . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
9.3.1 Le théorème de Riesz-Fischer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
9.3.2 Lien entre convergence µ-presque partout et convergence Lpµ (E) . . . . . . . . . . . . 71
9.3.3 Théorème de convergence dominée Lp . . . . . . . . . . . . . . . . . . . . . . . . . . 72
9.4 Densité de Cc (Rd ) dans Lp (Rd ) (1 6 p < ∞) . . . . . . . . . . . . . . . . . . . . . . . . . . 72
10 Convolution et applications 75
10.1 Opérateur de translation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
10.2 Convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
10.2.1 Le cas où f, g ∈ M+ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
10.2.2 Le cas général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
10.2.3 Approximation de l’unité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
10.2.4 Régularisation par convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Introduction
Dans ce cours, deux notions essentielles et fondamentalement liées seront abordées : la notion de
mesure, et la notion d’intégration. Ces notions ont en particulier une importance capitale dans les cours
de probabilités et d’analyse fonctionnelle qui suivront.
Notion de mesure
La première question abordée est celle de la mesure : étant donné un ensemble E quelconque, comment
donner un sens à la mesure d’un sous-ensemble de E ? Quelle “place” prend une partie de E dans E ? Si
on considère une propriété particulière P sur l’ensemble E, on pourrait en répondant à ces questions
mesurer l’ensemble des points de E qui vérifient P. Si cet ensemble est de mesure nulle, on pourrait alors
donner un sens à “la propriété P est vraie presque partout dans E”.
À première vue, il semble naturel de définir une mesure sur E comme une application de P(E) dans R+
qui vérifierait µ(∅) = 0, ainsi qu’une propriété d’additivité telle que : la mesure d’une union (dénombrable)
d’ensembles deux à deux disjoints est la somme des mesures de ces ensembles. En fait, nous verrons qu’il
s’avèrera utile de définir les mesures sur un sous-ensemble A de P(E). Afin que les propriétés de la
mesure aient un sens, il convient que A ait une structure particulière. Dans la pratique, on impose que A
contienne ∅ et soit stable par passage au complémentaire et par union dénombrable : c’est la notion de
tribu.
On remarque immédiatement qu’on connait déjà des mesures :
– Le “cardinal” d’un ensemble : si A ⊂ E, µ(A) est donné par le nombre d’éléments de A si A est
un ensemble fini, et +∞ sinon. On appelle cette mesure la mesure de comptage. On se rend assez
vite compte que cette mesure est beaucoup trop imprécise dès qu’on considère des ensembles non
dénombrables : mesurer des ensembles de R de cette façon n’aurait pas beaucoup d’intérêt.
– Les probabilités : il s’agit des mesures décrites plus haut auxquelles on impose de plus que µ(Ω) = 1.
On dit que ces mesures sont de masse 1.
Nous pouvons bien sûr citer également le cas de R, ou plus généralement de Rn , pour lesquels nous
souhaitons considérer la notion de longueur, ou de volume en toute généralité. Ces notions sont en général
définies en partant de la longueur des intervalles dans R, ou du volume des pavés dans Rn . Elles ne sont
toutefois pas définies a priori pour n’importe quel sous-ensemble de R ou de Rn .
Si on s’intéresse au cas de R, la question est de savoir s’il existe une mesure λ de P(R) dans R+ telle
que pour tout intervalle I d’extrémités a, b ∈ R, λ(I) = b − a. Si on travaille avec les axiomes habituels de
la théorie des ensembles, c’est-à-dire avec l’axiome du choix, la réponse à cette question est non ! Nous
détaillerons ceci plus loin.
Nous allons donc définir une mesure qui vérifie ces propriétés sur une tribu incluse dans P(R). Pour
assurer que nous pouvons mesurer assez de parties de R, nous imposerons que cette tribu contienne
au moins les ouverts de R (donc également les fermés). Nous consacrerons une partie de ce cours à
construire proprement cette mesure, et nous nous interrogerons sur la tribu sur laquelle elle est définie. La
5
6 TABLE DES MATIÈRES
construction proposée sera valable dans Rn , ce qui définira également la notion de volume.
A E
On note 1A dµ = µ(A) pour préciser que l’intégration se fait par rapport à la mesure µ. Comme il
R
est naturel de demander à l’intégrale une propriété de linéarité, on observe qu’on sait tout de suite donner
un sens à l’intégrale de fonctions du type i=1 αi 1Ai , où Ai ∈ A pour tout i :
PN
α2
α1
α3
i=1 αi 1Ai =
R PN PN
on doit avoir i=1 αi µ(Ai ). Les fonctions de ce type sont appelées les fonctions étagées.
Elles jouent dans la construction de l’intégrale de Lebesgue un rôle similaire à celui des fonctions en
escalier pour l’intégrale de Riemann. Il convient par ailleurs de noter que les fonctions en escalier sur un
intervalle de R sont exactement les fonctions étagées telles que les Ai soient tous des intervalles.
Donnons maintenant une idée de la démarche employée pour donner un sens à l’intégrale d’une fonction
f : E → R qui n’est pas nécessairement étagée. Comme nous le verrons, sous une condition dite de
mesurabilité, on peut approcher une fonction f par des fonctions étagées, que l’on sait intégrer. Une
façon de le voir est de considérer une subdivision de l’espace d’arrivée : R (à comparer avec l’intégrale de
Riemann, où on fait une subdivision de l’intervalle d’intégration) :
f
yi+1
yi
yi−1
On approche alors f par la fonction étagée i yi 1f −1 ([yi ,yi+1 [) , ce qui conduit à approcher l’intégrale
P
de
P f par−1l’intégrale de cette fonction étagée. Ceci donne la valeur approchée de −1 l’intégrale de f :
y
i i µ(f ([y , y
i i+1 [)). On note que pour que cette formule soit valide, il faut avoir f ([yi , yi+1 [) ∈ A
pour tout i. C’est une condition importante sur la fonction f , qui sera assurée par la propriété de
mesurabilité.
Il faut noter que la théorie de l’intégration de Lebesgue généralise la théorie d’intégration de Riemann :
tous les résultats propres à l’intégrale de Riemann restent vrai pour l’intégrale de Lebesgue. Nous vérifierons
ce résultat après la construction de l’intégrale de Lebesgue. En outre, la théorie de Lebesgue présente de
nombreux avantages :
TABLE DES MATIÈRES 7
– On peut intégrer davantage de fonctions. Par exemple, la fonction 1Q dont on attendrait qu’elle soit
intégrable et que son intégrale vaille 0, n’est pas Riemann-intégrable. Elle est intégrable au sens de
Lebesgue, et son intégrale est nulle.
– Les théorèmes de convergence sont vrais sous des hypothèses plus faibles. Par ailleurs, ils s’énoncent
plus simplement.
– L’intégrale de Lebesgue permet d’écrire les sommes comme des intégrales (par rapport à la mesure
de comptage). Par conséquent, tous les résultats vrais pour les intégrales le sont immédiatement
pour les séries.
– Le plus gros avantage de la théorie de Lebesgue est de permettre d’intégrer sur un ensemble différent
de R, ou Rn . les applications seront nombreuses, notamment en analyse fonctionnelle.
CHAPITRE 1
1.1 Cardinalité
Définition 1.1 – On dit que deux ensembles E et F sont équipotents s’il existe une bijection de E dans
F . On note alors E ' F ou
Card E = Card F.
On dit dans ce cas que E et F ont même cardinal (attention, il ne s’agit que d’une notation !).
Exemples –
1. N ' 2N,
2. P(E) ' F (E, {0, 1}) = {0, 1}E : l’application A ⊂ E 7→ 1A ∈ {0, 1}E est bijective.
Notation 1.3 – Soient E et F deux ensembles. S’il existe une injection de E dans F , on notera
(on prendra garde aussi à cette dernière notation). Si de plus E et F ne sont pas équipotents, on notera
E ≺ F ou Card E < Card F .
De même, lorsqu’il existe une surjection de E dans F , on notera E F ou Card E > Card F , et E F
ou Card E > Card F lorsque de plus E et F ne sont pas équipotents.
Propriétés 1.4 –
– Si Card E 6 Card F , alors Card F > Card E.
– Si Card E > Card F , alors Card F 6 Card E (AC).
Remarque 1.5 – La démonstration du deuxième point des propriétés ci-dessus repose sur l’axiome du
choix (précisé (AC) dans l’énoncé). En fait, cet énoncé est même équivalent à l’axiome du choix.
On donne deux énoncés équivalents de l’axiome du choix :
9
10 Chapitre 1 – Rappels : cardinaux et dénombrabilité
– pour tout ensemble E non vide, il existe une fonction f : P(E) → E telle que pour tout A ⊂ E
non vide, f (A) ∈ A (une telle fonction est appelée fonction choix ),
Q
– pour toute famille (Ei )i∈I d’ensembles non vides, i∈I Ei est non vide.
Théorème 1.6 (Cantor-Bernstein) – Si E et F sont deux ensembles vérifiant Card E 6 Card F et
Card F 6 Card E, alors Card E = Card F .
Remarque 1.7 – La version duale du thérème de Cantor-Bernstein (Card E > Card F et Card F >
Card E ⇒ Card E = Card F ) peut donc se montrer en utilisant l’axiome du choix. La question de savoir
si elle est équivalente à l’axiome du choix est ouverte, mais on sait qu’on ne peut pas montrer la version
duale du théorème dans l’axiomatique de Zermelo-Fraenkel.
Proposition 1.8 – Soit E est un ensemble non vide, Card E < Card P(E).
Démonstration. Supposons qu’il existe une surjection ϕ de E dans P(E). Soit A = {x ∈ E, x 6∈ ϕ(x)}.
Comme ϕ est surjective, il existe a ∈ E tel que ϕ(a) = A. Alors :
– soit a ∈ A, alors a 6∈ ϕ(a) = A, contradiction,
– soit a 6∈ A, alors a ∈ ϕ(a) = A, contradiction.
On aboutit donc à une contradiction, et il n’existe pas de surjection de E dans P(E). En considérant
l’injection x ∈ E 7→ {x} ∈ P(E), on voit par ailleur que Card E 6 Card P(E), d’où le résultat.
7. P(N) n’est pas dénombrable : Card N < Card P(N) par la proposition 1.8.
8. {0, 1}N n’est pas dénombrable : Card {0, 1}N = Card P(N).
Proposition 1.12 – Une union dénombrable d’ensembles dénombrables est dénombrable.
S
Démonstration. Soient (En )n∈N une suite d’ensembles dénombrables et E = n∈N En . Pour tout n ∈ N,
soit ϕn : N → En surjective. On introduit la fonction
ϕ : N2 → E
.
(n, m) 7→ ϕn (m)
On voit aisément que ϕ est surjective donc Card N = Card N2 > Card E, et E est dénombrable.
Théorème 1.13 – R n’est pas dénombrable.
Première démonstration. Il s’agit du célèbre procédé diagonal de Cantor. On suppose que D := [0, 1] est
dénombrable, on peut donc écrire D comme une suite : D = {xn , n ∈ N}. Pour tout n ∈ N, on note
0, x1n x2n x3n . . . une écriture décimale de xn (la suite (xkn )k peut stagner en 0 ou en 9 dans le cas où xn est
décimal). On définit alors x = 0, x1 x2 x3 . . . ∈ [0, 1] par son écriture décimale : pour tout k ∈ N,
2 si xkk = 1,
k
x =
1 sinon.
1 X yn − xn
|ϕ(y) − ϕ(x)| = n
+
3 0
n>n
3n
0
1 X yn − xn 1 X yn − xn
> − > −
3n0 n>n0
3n 3n0 n>n 3n
0
1 X 1 1 1
> − = · > 0.
3 0 n>n 3n
n 2 3n0
0
?
Alors, Card N < Card {0, 1}N 6 Card R, et R n’est pas dénombrable.
Exercice –
– Quel est le cardinal de RN ?
– Quel est le cardinal de l’ensemble O(R) des ouverts de R ?
– Quel est le cardinal des fonctions continues de R dans R ?
CHAPITRE 2
2.1 Définitions
Soit E un ensemble. On appelle classe de parties de E tout sous-ensemble de P(E).
Définition 2.1 – On appelle tribu sur E (ou σ-algèbre) une classe de partie A ⊂ P(E) telle que :
– ∅∈A,
– si A ∈ A , alors Ac ∈ A (stabilité par complémentaire),
– si An ∈ A , n ∈ N, alors n∈N An ∈ A (stabilité par union dénombrable).
S
Remarque 2.2 – Par définition, une tribu A sur E est aussi stable par intersection dénombrable : si
An ∈ A , n ∈ N,
\ [ c
An = An c
∈A.
n∈N n∈N
Exemples –
1. P(E) : tribu triviale,
2. {∅, E} : tribu grossière,
3. Si A ⊂ E, {∅, A, Ac , E} est une tribu. C’est la plus petite tribu sur E contenant A.
4. A = {A ⊂ E, A dénombrable ou Ac dénomrable} est une tribu sur E.
Démonstration. Il est clair que ∅ ∈ A et que A est stable par passage au complémentaire.
Maintenant,
S si An ∈ A pour tout n ∈ N, alors soit tous les An sont dénombrables, et
A
n n est dénombrable, soit S
il existe n0 T
tel que An0 n’est pas dénombrable, auquel cas
c c c c
(An0 ) estSdénombrable, et ( n An ) = n (An ) ⊂ (An0 ) est dénombrable. Dans les
deux cas, n An ∈ A .
Remarque 2.3 – Une intersection quelconque de tribus sur E est une tribu sur E.
Définition-Proposition 2.4 – Soit C une classe de parties de E. Il existe une plus petite tribu sur E
(au sens de l’inclusion) contenant les éléments de C . On la note σ(C ) et on l’appelle tribu engendrée par
C sur E.
En d’autres termes, pour toute tribu A sur E telle que C ⊂ A , on a σ(C ) ⊂ A .
13
14 Chapitre 2 – Tribus, tribu borélienne
Exercice – Quelle est la tribu engendrée par l’ensemble {{x}, x ∈ E} des singletons de E ? (voir TD)
Il arrive fréquemment lorsqu’on est confronté à une tribu engendrée par une classe de parties C qu’on
veuille démontrer qu’une propriété vérifiée par les éléments de C reste vraie pour σ(C ) tout entière. Pour
montrer une telle chose, on pourrait vouloir essayer de décrire un élément quelconque de σ(C ) à partir
d’éléments de C . Malheureusement, il n’y a pas de procédé général pour y parvenir : un élément de
σ(C ) ne peut pas toujours être décrit comme une union dénombrable d’ensembles de C , ni comme une
intersection d’union de tels ensembles, etc. La remarque suivante suggère un procédé de démonstration
bien commode pour montrer que σ(C ) continue de vérifier une propriété vraie pour C . Nous l’utiliserons
à de nombreuses reprises dans ce cours.
Remarque 2.6 – Pour montrer que tous les éléments d’une tribu A sur E engendrée par C ⊂ P(E)
vérifient une propriété (P ), il suffit de montrer que :
– B := {B ∈ A , B vérifie (P )} est une tribu,
– ∀C ∈ C , C vérifie (P ).
Comme B ⊃ C , on aura alors B ⊃ σ(C ) = A . On aura souvent recours à ce type de raisonnement pour
monter des propriétés générales sur une tribu engendrée par une classe de parties simple.
Définition 2.7 – Soit T une classe de parties de E. On dit que T est une topologie sur E si
– ∅, E ∈ T ,
– T est stable par union quelconque,
– T est stable par intersection finie.
On appelle alors ouverts de E des éléments de la topologie T , et fermés les complémentaires des ensembles
de T . On dit alors que (E, T ) est un espace topologique.
Remarque 2.9 – Une intersection quelconque de topologies sur E est encore une topologie sur E. On en
déduit que si C est une classe de parties de E, il existe une plus petite topologie sur E contenant C : il
s’agit tout simplement de l’intersection des topologies sur E qui contiennent C . On l’appelle topologie
engendrée par C .
Remarque 2.11 – Par définition, B(E) est aussi la tribu engendrée par les fermés de E.
2.2 Tribu borélienne 15
En général, B(E) 6= P(E). C’est par exemple le cas pour E = R. Nous verrons en effet plus loin
qu’il est facile de construire des parties de R qui ne sont pas boréliennes, en ayant recours à l’axiome
du choix. Il est en fait possible d’exhiber de telles parties sans utiliser l’axiome du choix, mais leur
construction n’est pas triviale.
En fait, on peut montrer (sans axiome du choix) le résultat plus général :
Ce résultat est assez difficile, et sa démonstration repose sur une récurrence sur les ordinaux.
On déduit donc que Card B(R) < Card P(R). Autrement dit, les boréliens occupent une place
minuscule parmi les parties de R. Dans la pratique, il sera pourtant tout à fait satisfaisant de se
limiter à travailler dans les boréliens : en témoigne la difficulté de construire des ensembles non
boréliens !
Boréliens de R, de Rd
Nous allons donner d’autres classes de parties de R ou de Rd qui engendrent les boréliens. Leur intérêt
est que leurs éléments sont plus simples que les ouverts en général. Ce point peut s’avérer très utile, en
particulier dans l’esprit de la remarque 2.6.
Démonstration. — Si α, β ∈ Q et α < β, ]α, β[∈ O(R), donc σ {]α, β[, α < β, α, β ∈ Q} ⊂ B(R).
D’autre part, si α, β ∈ Q,
\ 1
]α, β[ = ] − ∞, β[\] − ∞, α] = ] − ∞, β[\ −∞, α +
?
n
n∈N
La propriété de stabilité par translation suivante sera utile pour définir proprement la mesure de
Lebesgue.
Démonstration. Soit a ∈ Rd , on pose A = {B ∈ B(Rd ), B + a ∈ B(Rd )}. Il est clair que A contient
O(Rd ). Par ailleurs, A est une tribu sur Rd :
∅∈A,
si B ∈ A , alors B c + a = (B + a)c ∈ B(Rd ),
si Bn ∈ A , n ∈ N, alors n (Bn + a) ∈ B(R ).
S S d
n Bn + a =
Nous verrons plus loin une manière plus directe de montrer ce résultat, à l’aide de la notion de fonction
mesurable.
16 Chapitre 2 – Tribus, tribu borélienne
Boréliens de R
R = R ∪ {−∞, +∞}.
−∞ 6 x 6 +∞, ∀x ∈ R.
On munit ensuite R de la topologie engendrée par O(R) ∪ {[−∞, a[, a ∈ R} ∪ {]b, +∞], b ∈ R}. On peut
alors montrer le résultat suivant.
f −1 (C ) = {f −1 (C), C ∈ C }.
{i−1 (B), B ∈ B} = {A ∩ B, B ∈ B}
Définition 2.18 – Si A est une tribu sur E, on appelle tribu image de A par f la tribu sur F
{B ⊂ F, f −1 (B) ∈ A }.
2.3 Tribu image réciproque, tribu image 17
Remarque 2.20 – Les deux classes de parties de (2.1) sont des tribus sur E : σ(f −1 (C )) est la tribu sur
E engendrée par la classe de parties f −1 (C ), et f −1 (σ(C )) est la tribu image réciproque de la tribu σ(C )
par f .
Démonstration. — On remarque d’abord que f −1 (C ) ⊂ f −1 (σ(C )). Comme f −1 (σ(C )) est une tribu
contenant la classe de parties f −1 (C ) ⊂, elle contient la tribu qu’elle engendre, ie σ(f −1 (C )) ⊂
f −1 (σ(C )).
— Montrons la deuxième inclusion. Il suffit de montrer que pour tout B ∈ σ(C ), f −1 (B) ∈ σ(f −1 (C )).
On note B = {B ⊂ F, f −1 (B) ∈ σ(f −1 (C ))}. B est la tribu image par f de la tribu σ(f −1 (C )).
C’est donc une tribu, et on remarque immédiatement qu’elle contient C , elle contient donc σ(C ), ce
qui achève la démonstration.
CHAPITRE 3
Mesures
pour tout A ⊂ E est une mesure sur (E, P(E)), appelée mesure de comptage.
– Mesure de Dirac : si x ∈ E, δx définie par
1 si x ∈ A,
δx (A) = 1A (x) =
0 sinon,
pour tout A ∈ A est une mesure sur (E, A ) appelée mesure de Dirac au point x ∈ E.
– Si µ est une mesure sur (E, A ) et B ∈ A , alors ν : A → R+ définie par ν(A) = µ(A ∩ B) pour tout
A ∈ A est aussi une mesure sur (E, A ).
Définition 3.2 (Mesures finies, mesures σ-finies) –
– On dit qu’une mesure µ est une mesure finie si µ(E) < ∞. On appelle alors µ(E) la masse de µ.
Si µ est de masse 1, on dit que µ est une mesure de probabilité sur E, et on dit que (E, A , µ) est un
espace probabilisé.
19
20 Chapitre 3 – Mesures
– On dit qu’une mesure µ est σ-finie s’il existe une suite (En )n de A telle que E =
S
n En et
µ(En ) < ∞ pour tout n.
Exemple 3.3 – La mesure de comptage mSsur (N, P(N)) est σ-finie. En effet, pour tout n ∈ N,
m([|0, n|]) = n + 1 < ∞, et on a bien sûr N = n [|0, n|].
Remarque 3.4 – Si pour tout n ∈ N, µn est une mesure sur (E, A ), alors n µn est aussi une mesure
P
sur (E, A ) (exercice).
n αn δxn est une mesure sur (E, A ). On note ainsi
P
Par exemple, si (αn )n∈N ∈ RN + et (xn )n∈N ∈ E , alors
N
Démonstration. A et B \ A appartiennent à A et sont disjoints, donc µ(B) = µ(A) + µ(B \ A) > µ(A).
Si µ(A) < ∞, alors µ(B) − µ(A) = µ(B \ A).
Sn−1
Démonstration. Pour tout n, on pose Bn = An \ k=0 Ak . On note que pour tout n, Bn ∈ A , et que
B n ⊂ An .
– Les Bn sont deux à deux disjoints : si m < n, Bm ⊂ Am et Bn ∩ Am = ∅, d’où Bm ∩ Bn = ∅.
F S S Sn0 −1
– n Bn = n An : si x ∈ n An , soit n0 = min{n, x ∈ An }, alors x ∈ An0 \ k=0 Ak = Bn0 . La
deuxième inclusion est évidente.
En conséquence, [ G X X
µ An = µ Bn = µ(Bn ) 6 µ(An ).
n∈N n∈N n∈N n∈N
Démonstration.
3.3 Mesure de Lebesgue sur Rd 21
S
1. Notons d’abord que s’il existe n0 tel que µ(An0 ) = ∞, alors µ( n An ) = ∞, et µ(An ) = ∞ à partir
d’un certain rang, d’où le résultat.
Sinon, on introduit la suite (Bn ) définie par B0 = A0 , et pour tout n > 1, Bn = An \ An−1 . Il s’agit
en fait de la même suite que celle S construiteFdans la démonstration précédente. En particulier, les
Bn sont deux à deux disjoints, et n An = n Bn . Par conséquent,
[ G X ∞ n
X
µ An = µ Bn = µ(Bn ) = lim µ(Ak ) − µ(Ak−1 ) + µ(A0 ) = lim µ(An ).
n→∞ n→∞
n n n=0 k=1
2. Quitte à considérer la suite (An0 +n )n∈N , on peut supposer que µ(A0 ) < ∞. Comme (A0 \ An )n est
une suite de A croissante pour l’inclusion, on peut lui appliquer le résultat précédent. On obtient
alors [ \
lim µ(A0 \ An ) = µ A0 \ An = µ A0 \ An .
n→∞
n n
T
Comme µ(A0 ) < ∞, on en déduit que limn µ(A0 ) − µ(An ) = µ(A0 ) − µ( n An ), ce qui donne le
résultat.
Remarque 3.8 – L’existence de n0 avec µ(An0 ) < ∞ est nécessaire : si on considère les ensembles
An = [|n, ∞[| pour n ∈ N, la suite (ATn )n est décroissante, et on a n An = ∅. Si on munit (N, P(N)) de
T
la mesure de comptage m sur N, m( n An ) = 0, mais pour tout n, m(An ) = ∞.
On peut construire un exemple semblable avec la mesure de Lebesgue en posant An = [n, ∞[.
Exercice (voir TD) – Montrer qu’une application µ : A → R+ est une mesure sur l’espace mesurable
(E, A ) si et seulement si :
(i) µ(∅) = 0,
(ii) µ est finiment additive : si A, B ∈ A et A ∩ B = ∅, alors µ(A t B) = µ(A) + µ(B),
(iii) µ est continue à gauche.
`(I) = b − a.
Théorème 3.9 – Soit d ∈ N? . Il existe une unique mesure λd sur (Rd , B(Rd )) telle que :
– λd ([0, 1]d ) = 1,
22 Chapitre 3 – Mesures
∀x ∈ R, ∀B ∈ B(Rd ), λd (B + x) = λd (B).
Remarque 3.11 – Une conséquence immédiate est que tout ensemble dénombrable D de R est de mesure
de Lebesgue nulle : tout d’abord, D est un borélien comme union dénombrable de singletons, puis
G X
λ(D) = λ {x} = λ({x}) = 0.
x∈D x∈D
Attention toutefois, la réciproque est fausse : il existe des boréliens de R de mesure nulleTqui ne sont
pas dénombrables. C’est le cas par exemple de l’ensemble de Cantor K, défini par K = n∈N Kn , où
K0 = [0, 1], et Kn+1 = K3n ∪ Kn3+2 pour tout n ∈ N (le vérifier en exercice !).
Plus généralement, si P est un pavé de Rd , alors λd (P ) = V (P ). Pour le voir il suffirait d’adapter la
preuve ci-dessus dans le cas d = 1. Nous verrons par ailleurs plus loin que λd peut s’interpréter comme
une mesure produit, ce qui simplifie beaucoup la preuve de ce résultat.
Nous avons vu que bien que les ouverts engendrent les boréliens, il n’est pas aisé du tout d’exprimer
un borélien quelconque à partir d’ouverts ou de fermés. Pourtant, nous allons voir que pour n’importe
quel borélien B de Rd , on peut trouver un ouvert contenant B et un fermé inclus dans B dont la mesure
est arbitrairement proche de celle de B. Il s’agit de la propriété de régularité de la mesure de Lebesgue
sur Rd .
La propriété proprement dite est énoncée dans le théorème 3.13 ci-dessous, et repose sur le lemme
ci-dessous.
Lemme 3.12 – Soient B ∈ B(Rd ) et ε > 0. Il existe un fermé F et un ouvert Ω de Rd tels que F ⊂ B ⊂ Ω
et λd (Ω \ F ) < ε.
Démonstration. Soient n ∈ N et λnd la mesure sur (Rd , B(Rd )) définie par λnd (B) = λd (B∩] − n, n[d ) pour
tout B ∈ B(Rd ). Nous allons d’abord montrer le résultat pour la mesure λnd . Pour ce faire, on introduit la
classe de parties
Nous allons montrer que B est une tribu contenant les pavés ouverts bornés de Rd . Comme cette classe
de parties engendre B(Rd ), ceci montrera que B = B(Rd ), et donnera le résultat pour la mesure λnd .
– On remarque d’abord que ∅ ∈ B : il suffit de prendre F = Ω = ∅.
– Ensuite, si B ∈ B, alors B c ∈ B : si F et Ω sont les ensembles associés à B pour un ε > 0, alors
Ωc ⊂ B c ⊂ F c . Comme Ωc est fermé, F c est ouvert, et λnd (F c \ Ωc ) = λnd (Ω \ F ) < ε.
– Pour finir, si (Bk )k∈N est une suite d’éléments de B et ε > 0, on sait qu’on peut construire une
suite de fermés (Fk )k∈N et une suite d’ouverts (Ωk )k∈N telles que pour tout k ∈ N, Fk ⊂ Bk ⊂ Ωk et
ε
λnd (Ωk \ Fk ) < 2k+2 .
SK
On introduit ensuite l’ouvert Ω = k∈N Ωk et les fermés F K = k=0 Fk pour tout K ∈ N. On
S
remarque qu’on a alors
[ [
[ X ε
λnd Ω \ FK = λnd Ω \ Fk 6 λnd Ω k \ Fk 6 λnd (Ωk \ Fk ) < .
2
K k k k∈N
On observe ensuite que, comme la suite (Ω \ FK )K∈N est décroissante et la mesure λnd est finie, on a
\
[ ε
lim λnd (Ω \ FK ) = λnd Ω \ FK = λnd Ω \ FK < .
K→∞ 2
K∈N K∈N
n K K
S
S conséquent, il existe K ∈ N tel que λd (Ω \ F ) < ε. Comme on a F ⊂
Par k Bk ⊂ Ω, on a bien
B
k k ∈ B.
Nous venons de montrer que B Qdest une tribu. Pour voir qu’elle contient les pavés ouvertsQd bornés, il suffit
de se donner un tel pavé P = i=1 ]ai , bi [ et un réel ε > 0, et de choisir Ω = P , et F = i=1 [ai + η, bi + η],
Qd Qd
où η ∈]0, min( bi −a
2 )[ est choisi assez petit pour avoir
i
i=1 (bi − ai ) − i=1 (bi − ai − 2η) < ε.
Nous allons maintenant en déduire le résultat pour la mesure λd . Donnons-nous B ∈ B(Rd ) et ε > 0, et
commençons par montrer qu’il existeSun ouvert Ω de Rd tel que λd (Ω \ B) < 2ε . Pour n ∈ N, on pose
Bn = B∩] − n, n[d , de sorte que B = n Bn . Le résultat précédent permet d’affirmer que pour tout n, il
ε
existe un ouvert Ωn tel que Bn ⊂ Ωn et λnd (Ωn \ Bn ) < 2n+2 . Quitte à remplacer Ωn par Ωn ∩] − n, n[,
ε
on peut
S supposer que Ω n ⊂] − n, n[, ce qui donne en fait λ(Ω n \ Bn ) < 2n+2 . En introduisant l’ouvert
Ω = n Ωn , on a donc B ⊂ Ω, et
[ X ε
λ(Ω \ B) 6 λ Ωn \ B n 6 λ(Ωn \ Bn ) < ,
n n
2
Théorème 3.13 – La mesure λd est régulière, c’est-à-dire que pour tout B ∈ B(Rd ),
i. λ(B) = inf{λ(Ω), Ω ⊃ B, Ω est ouvert},
ii. λ(B) = sup{λ(K), K ⊂ B, K est compact}.
Démonstration. Si B ∈ B(Rd ) est tel que λ(B) < ∞, alors pour tout ε, le lemme 3.12 affirme qu’il existe
un ouvert Ω ⊃ B tel que λ(B) 6 λ(Ω) 6 λ(B) + ε. En passant à l’infimum sur les ouverts contenant B, et
en laissant tendre ε vers 0, on obtient i. Par ailleurs, si λ(B) = ∞, alors i. est trivialement vérifié.
De même que ci-dessus, le lemme 3.12 montre que λ(B) = sup{λ(F ), F ⊂ B, K est fermé}. Or, si F est
un fermé vérifiant F ⊂ B et Kn = F ∩ [−n, n]d pour tout n ∈ N, alors limn→∞ λd (Kn ) = λd (F ), ce qui
montre que sup{λ(F ), F ⊂ B, K est fermé} = sup{λ(K), K ⊂ B, K est compact}.
Nous verrons au chapitre 6 une autre preuve de ce résultat, basée sur la définition de la mesure de
Lebesgue.
24 Chapitre 3 – Mesures
On dit qu’une propriété P sur E est vraie µ-presque partout sur E (on note µ-p.p.) si
Lorsque le contexte est clair, on dira aussi que P est vraie presque partout (on note p.p.). À titre
d’exemples :
– la fonction 1Q est nulle λ-presque partout,
– la fonction 1[0,∞[ : R → R est continue λ-presque partout,
– la suite de fonction (1[0, n1 ] ) ?
converge λ-presque partout vers 0.
n∈N
Remarque 3.15 – Revenons sur les deux premiers exemples ci-dessus : les fonctions 1Q et 1R+ sont
toutes deux continues λ-presque partout, mais seule la première est égale presque partout à une fonction
continue (la fonction nulle). Il faudra prendre garde à ne pas confondre ces deux propriétés.
Si (E, A , µ) est un espace mesuré et A ∈ A est tel que µ(A) = 0, la propriété de croissance de la
mesure semble suggérer qu’on sait donner un sens à la mesure de tout sous-ensemble de A, et que cette
mesure devrait être nulle. En d’autres termes, tout ensemble µ-négligeable devrait avoir une mesure nulle
également. Il peut arriver cependant qu’un tel sous-ensemble n’appartienne pas à la tribu A , et ne puisse
donc être associé à une mesure. On dit alors que l’espace mesuré n’est pas complet. Nous verrons plus loin
que c’est le cas par exemple de l’espace mesuré (R, B(R), λ).
Toutefois, nous verrons au paragraphe 6.3 qu’on peut toujours introduire une tribu Afcontenant A ,
et prolonger la mesure µ en une mesure µ̃ sur (E, Af) de manière à obtenir un espace mesuré complet. De
cette façon, nous prolongerons la tribu B(R) en une tribu B(R) e qui vérifiera Card B(R)
e = Card P(R).
On appelle B(R) la tribu de Lebesgue.
e
CHAPITRE 4
Fonctions mesurables
Dans l’introduction, nous avons évoqué une condition pour pouvoir définir l’intégrale d’une fonction
f : E → R avec l’approche de la théorie de Lebesgue, où (E, A ) est un espace mesurable. La condition
que nous avons rencontrée peut se formuler de la manière suivante :
Il s’agit précisément de la propriété de mesurabilité de la fonction f , comme nous allons le voir. Cette
condition sera cruciale pour pouvoir associer à f une intégrale sur E.
Plus généralement, dans ce chapitre, (E, A ) et (F, B) désigneront deux espaces mesurables, et f une
fonction de E dans F . La condition de mesurabilité sur f impose que f −1 (B) ∈ A pour tout B ∈ B.
Nous allons voir comment montrer qu’une fonction donnée est mesurable, ainsi que les propriétés de ces
fonctions.
4.1 Mesurabilité
Définition 4.1 – Une fonction f : E → F est dite (A , B)-mesurable, ou plus simplement mesurable ssi
f −1 (B) ⊂ A . Autrement dit,
∀B ∈ B, f −1 (B) ∈ A .
Si les ensembles E et F sont des espaces topologiques munis de leurs tribus boréliennes respectives, on
appelle les fonctions mesurables des fonctions boréliennes.
Souvent, l’espace d’arrivée F est R, R+ , R, C, ou Rd . Dans ce cas, sauf mention contraire, il sera sous-
entendu que F est muni de sa tribu borélienne.
Exemples
A ) → (F, B) sont mesurables : si f ≡ c ∈ F sur E tout entier, alors
– Les fonctions constantes f : (E,
∅ si c 6∈ B
pour tout B ∈ B, f −1 (B) = . Dans tous les cas, f −1 (B) ∈ A .
E si c ∈ B
– Soit A ⊂ E, alors la fonction 1A : (E, A ) → (R, B(R)) est mesurable si et seulement si A ∈ A .
Remarque 4.2 – Dans le cas où A = P(E), toutes les fonctions de (E, A ) dans (F, B) sont mesurables.
C’est le cas par exemple des suites de réels, qui peuvent être vues comme des fonctions de (N, P(N)) dans
(R, B(R)).
25
26 Chapitre 4 – Fonctions mesurables
Mesure image
définit une mesure sur (F, B), qu’on appelle mesure image par f de µ.
Démonstration. On remarque tout d’abord que µf est bien définie du fait que f est mesurable, et définit
bien une application de B dans R+ . Par ailleurs, µ(f −1
F (∅)) = µ(∅) F = 0, et si (B Pn )n est une suite
d’ensembles deux à deux disjoints de B, alors µ(f ( n Bn )) = µ( n f −1 (Bn )) = n µf (Bn ), d’où le
−1
résultat.
Proposition 4.4 – On suppose que B = σ(C ) pour C ⊂ P(F ). Alors, f : (E, A ) → (F, B) est
mesurable si et seulement si f −1 (C ) ⊂ A .
Démonstration. Il suffit de remarquer que si I est un intervalle de R, alors f −1 (I) est un intervalle de R,
donc un borélien. Comme les boréliens de R sont engendrés par les intervalles, f est mesurable.
D’après la proposition 2.12, f : (E, A ) → (R, B(R)) est mesurable si et seulement si l’une des propriétés
suivantes est vérifiée :
∀a ∈ R, {f < a} ∈ A , ∀a ∈ R, {f 6 a} ∈ A ,
∀a ∈ R, {f > a} ∈ A , ∀a ∈ R, {f > a} ∈ A .
La même remarque vaut pour le cas où l’espace d’arrivée est R : pour montrer que f : (E, A ) → (R, B(R))
est mesurable, il suffit par exemple de vérifier que {f 6 a} := f −1 ([−∞, a]) ∈ A pour tout a ∈ R.
Continuité et mesurabilité
On considère deux espaces topologiques (E, T ) et (F, S ), que l’on munit de leurs tribus boréliennes
respectives B(E) et B(F ).
Proposition 4.6 – Une fonction f : E → F continue est borélienne (i.e.(B(E), B(F ))-mesurable).
Démonstration. Comme f est continue, on sait que si Ω est un ouvert de F , alors f −1 (Ω) est un ouvert
de E, donc un borélien de E. Ainsi, f −1 (S ) ⊂ B(E), et f est borélienne d’après la proposition 4.4.
4.3 Propriétés des fonctions mesurables 27
Application 4.7 – La proposition 4.6 fournit une nouvelle démonstration de la proposition 2.14, qui
dit que la tribu B(Rd ) est stable par translation. En effet, si a ∈ Rd et f : x ∈ Rd 7→ x − a, alors
B + a = f −1 (B) ∈ B(Rd ), du fait que f est continue donc borélienne.
On dit qu’une fonction f : E → R est semi-continue inférieurement (s.c.i) si pour tout a ∈ R, l’ensemble
{f 6 a} est fermé. On dit par ailleurs que f est semi-continue supérieurement (s.c.s) si pour tout a ∈ R,
l’ensemble {f > a} est fermé.
Proposition 4.8 – Les fonctions s.c.i. et les fonctions s.c.s. sont des fonctions boréliennes.
Démonstration. C’est immédiat : pour tout a ∈ R, {f 6 a} est un borélien, donc f est mesurable.
On remarque que
f −1 (I1 × I2 ) = f1 −1 (I1 ) ∩ f2 −1 (I2 ) ∈ A
car les fi sont mesurables. La proposition 4.4 implique donc que f est mesurable.
Proposition 4.12 – Si f et g sont des fonctions mesurables de (E, A ) dans (R, B(R)), alors
1. αf + g est mesurable, pour tout α ∈ R,
2. f g est mesurable.
En d’autres termes, les fonctions mesurables de (E, A ) dans (R, B(R)) forment une R-algèbre.
Démonstration. 1. On peut écrire αf + g = ψ ◦ ϕ, où ϕ(x) = (f (x), g(x)) ∈ R2 pour tout x ∈ R, et
ψ(x, y) = αx + y pour tout (x, y) ∈ R2 .
La fonction ψ est continue de R2 dans R, donc elle est (B(R2 ), B(R))-mesurable. Comme f et g
sont mesurables, la proposition 4.11 implique que la fonction ϕ est mesurable. Par conséquent, la
fonction αf + g est mesurable comme composée de fonctions mesurables.
2. On raisonne de même en prenant ψ : (x, y) 7→ xy, qui est aussi continue.
Exemple 4.13 – Les fonctions de la forme i=1 αi 1Ai , où αi ∈ R et Ai ∈ A pour tout i = 1, . . . , N ,
PN
sont des fonctions mesurables, comme combinaisons linéaires de fonctions mesurables. On les appelle des
fonctions étagées.
Proposition 4.14 – Si f : (E, A ) → (C, B(C)), f est mesurable si et seulement si Re f et Im f le
sont, et les points 1. (avec α ∈ C) et 2. de la proposition 4.12 restent vrais.
Démonstration. Si Re f et Im f sont mesurables, il suffit de remarquer que Re f + iIm f = ψ ◦ ϕ, où
ϕ(x) = (Re f (x), Im f (x)) pour tout x ∈ R, et ψ(x, y) = x + iy pour tout (x, y) ∈ R2 . Comme ϕ est
mesurable, et ψ est continue donc mesurable, on obtient que f est mesurable.
Si f est mesurable, il suffit de voir que Re f = Re ◦ f et Im f = Im ◦ f . Comme Re et Im sont des
fonctions continues de C dans R, on obtient bien que Re f et Im f sont mesurables.
Les points 1. et 2. de la proposition 4.12 dans le cas présent s’obtiennent avec la même démonstration.
28 Chapitre 4 – Fonctions mesurables
Rappel. Si (an )n∈N est une suite de R, on remarque que (inf k>n ak )n est une suite croissante, et que
(supk>n ak )n est une suite décroissante. On note
Démonstration. 1. Soit a ∈ R, on a :
— {inf n fn < a} = n {fn < a} ∈ A car les fn sont mesurables, donc inf n fn est mesurable,
S
— {supn fn 6 a} = n {fn 6 a} ∈ A car les fn sont mesurables, donc supn fn est mesurable.
T
2. Il suffit de remarquer que lim inf n fn = supn (inf k>n fk ). Par le point précédent, les fonctions
gn := inf k>n fk sont mesurables, donc supn gn est mesurable.
De même, on remarque que lim supn fn = inf n (supk>n fk ) et on conclut de la même manière.
3. Il suffit de remarquer que si la suite (fn )n converge simplement vers f , alors f = lim inf n fn , et le
point précédent permet de conclure.
Remarque 4.16 – On peut en fait montrer un résultat plus général dans le cadre des fonctions à valeurs
dans un espace métrique F : si (fn )n est une suite de fonctions mesurables de E dans F qui converge
simplement vers une fonction f , alors f est mesurable (voir [2]). Notons par ailleurs que le résultat devient
faux dans le cadre plus général des fonctions à valeurs dans un espace topologique quelconque.
Définition 4.17 – On appelle fonction étagée sur E toute fonction mesurable ϕ : E → R qui ne prend
qu’un nombre fini de valeurs.
Notons que si ϕ : E → R est une fonction étagée, et si on note α1 , . . . , αN ses valeurs distinctes, alors
ϕ s’écrit
N
αi 1{ϕ=αi } .
X
i=1
4.5 Approximation des fonctions mesurables à valeurs réelles 29
Plus généralement, on voit immédiatement que les fonctions étagées sur E sont exactement les fonctions
de E dans R qui s’écrivent sous la forme
N
αi 1Ai , où αi ∈ R et Ai ∈ A pour tout i ∈ J1, N K.
X
i=1
Quitte à poser Ai = {ϕ = αi }, on peut par ailleurs toujours supposer que les Ai forment une partition de
E dans cette écriture. Dans la suite, on fait toujours cette hypothèse lorsqu’on écrit une fonction étagée
sous cette forme.
On note E l’ensemble des fonctions étagées de E dans R, et E+ le sous-ensemble de E formé des
fonctions à valeurs positives.
Proposition 4.18 – Soit f : E → R une fonction mesurable positive. Il existe une suite (ϕn )n∈N de
fonctions de E+ telles que
– (ϕn )n est croissante,
– pour tout x ∈ E, ϕn (x) −→ f (x).
n→∞
De plus, si f est bornée, alors la convergence de (ϕn )n∈N vers f est uniforme.
On note d’abord que ϕn ∈ E+ pour tout n : les fonctions ϕn ont un nombre fini de valeurs, et sont
mesurables car f l’est.
– La suite (ϕn ) converge simplement vers f : si x ∈ E est tel que f (x) = ∞, alors ϕn (x) = n pour
tout n, donc ϕn (x) → ∞ = f (x). Si f (x) < ∞, alors pour n assez grand, il existe k 6 n2n − 1 tel
que k 6 2n f (x) < k + 1, donc |f (x) − ϕn (x)| = |f (x) − 2kn | 6 21n → 0.
– Montrons maintenant que la suite est croissante. Soit n ∈ N,
- si f (x) > n + 1, alors ϕn (x) = n < n + 1 = ϕn+1 (x),
- si f (x) < n, on note k l’entier tel que 2kn 6 f (x) < k+12n , on a alors ϕn (x) =
k
2n . Comme
2k 2k
f (x) > 2n+1 , on en déduit que ϕn+1 (x) > 2n+1 = ϕn (x).
k k+1
- si n 6 f (x) < n + 1, alors ϕn (x) = n, et il existe k > n2n+1 tel que 2n+1 6 f (x) < 2n+1 , donc
ϕn+1 (x) > n = ϕn (x).
1
Si f est bornée et N > kf k∞ , alors pour tout n > N , on a kf − ϕn k∞ 6 2n , ce qui montre que (ϕn )
converge uniformément vers f .
Remarque 4.19 – Dans le cas où f est seulement supposée mesurable, il existe une suite de fonctions
étagées qui converge simplement vers f . Si la fonction f est bornée, la convergence est uniforme.
Pour voir ce résultat, il suffit de modifier la construction de la suite (ϕn ) dans la preuve de la proposition
4.18, en posant
n
n2 −1
k
1 k − n1{f <−n} + n1{f >n} .
X
ϕn = k+1
n { 2n 6f < 2n }
n
2
k=−n2
Parmi les applications de ce résultat, on donne une démonstration du théorème de Lusin qui précise le
lien entre fonctions mesurables et fonctions continues. Comme nous l’avons vu au paragraphe 4.2, une
fonction continue de R dans R est toujours mesurable pour la tribu borélienne. Il va sans dire que la
réciproque est fausse : nous avons déjà rencontré des fonctions de R dans R mesurables et discontinues.
Néanmoins, le théorème suivant permet de mettre en avant un fort lien entre continuité et mesurabilité.
Théorème 4.20 (Théorème de Lusin) – Soit f : R → R mesurable. Pour tout ε > 0, il existe un fermé
F de R tel que λ(F c ) < ε et f|F est continue.
30 Chapitre 4 – Fonctions mesurables
Démonstration. On commence par prouver le résultat dans le cas où f = 1A , où A est un borélien de R.
Le lemme 3.12 donne l’existence d’un fermé F1 et d’un ouvert Ω tels que F1 ⊂ A ⊂ Ω et λ(Ω \ F1 ) < ε.
On pose F2 = Ωc , et on introduit le fermé F = F1 ∪ F2 .
Nous allons montrer que f est continue sur F . On considère x ∈ F et une suite (xn ) de F qui converge
vers x. Si x ∈ F1 , alors xn ∈ F1 à partir d’un certain rang : sinon, (xn ) admet une sous-suite dans F2
dont la limite x n’est pas dans F2 , ce qui contredit le caractère fermé de F2 . Ainsi, à partir d’un certain
rang, f (xn ) = 1 = f (x). De même, si x ∈ F2 , alors f (xn ) = 0 = f (x) à partir d’un certain rang.
On en déduit que si f est étagée, alors le théorème est vrai. En effet, si f = i=1 αi 1Ai , où les Ai sont
PN
boréliens, alors il existe des fermés F1 , . . . , FN tels que λ(Fi c ) < Nε et fi est continue sur Fi pour tout i.
TN PN
Si on pose F = i=1 Fi , alors f est continue sur F , et λ(F c ) 6 i=1 λ(Fi c ) < ε.
Supposons maintenant que f est mesurable bornée. On sait alors qu’il existe une suite (fn )n∈N? de
?
fonctions étagées qui converge uniformément vers f . Pour
c ε
T tout n ∈ N , il existe un fermé Fn tel que
λ(Fn ) < 2n et fn est continue sur Fn . En posant F = n Fn , on a f continue sur F car les fn sont
continues et convergent uniformément vers f sur F . D’autre part, λ(F c ) 6 n∈N? λ(Fn c ) < ε.
P
Maintenant, si f n’est pas bornée, on pose g = arctan. On remarque que g ◦ f est mesurable et bornée,
donc il existe un fermé F tel que g ◦ f est continue sur F et λ(F c ) < ε. Comme f = tan(g ◦ f ), on en
déduit que f est continue sur F .
Ce résultat se généralise à des espaces topologiques séparés localement compacts (voir [4]).
CHAPITRE 5
Intégrale de Lebesgue
Dans tout le chapitre, on se place sur un espace mesuré (E, A , µ), et K désigne R ou C. Nous allons
définir l’intégrale d’une fonction mesurable de E dans C, lorsqu’elle existe. Dans ce but, nous commencerons
par définir l’intégrale des fonctions étagées positives, puis des fonctions mesurables positives. La définition
de l’intégrale des fonctions intégrables à valeurs dans R ou C s’en déduira.
i=1
où α1 , . . . , αN désignent les valeurs (deux à deux distinctes) de ϕ. Notons que les ensembles Ai = {ϕ = αi }
sont bien des éléments de A , du fait que ϕ est mesurable. Nous allons définir l’intégrale des fonctions de
E+ à partir de cette écriture.
Définition 5.1 – Soit ϕ = i=1 αi 1Ai une fonction de E+ , où A1 , . . . , AN sont des éléments de A qui
PN
forment une partition de E. On définit l’intégrale de ϕ par rapport à la mesure µ par
Z N
X
ϕ dµ := αi µ(Ai ),
E i=1
R
R la convention αi µ(Ai ) = 0 si αi = 0 et µ(Ai ) = ∞. On note aussi cette quantité E ϕ(x) dµ(x),
avec
ou E ϕ(x) µ( dx). On omet parfois de mentionner E lorsque le contexte est clair.
Remarque 5.2 – La définition de ϕ dµ ne dépend pas de l’écriture ϕ = i=1 αi 1Ai choisie, où les Ai
R PN
sont dans A et forment une partition de E.
Démonstration. Soient α1 , . . . , αN les valeurs de ϕ, et Ai = {ϕ = αi }. Si ϕ = j=1 βj 1Bj , où
PM
les Bj sont dans A et forment une partition de E, alors
M
X N
X X N
X X
βj µ(Bj ) = βj µ(Bj ) = αi µ(Bj )
j=1 i=1 j, βj =αi i=1 j, βj =αi
G X
Or pour tout i ∈ J1, nK, Bj = {ϕ = αi } = Ai , donc µ(Bj ) = µ(Ai ).
j, βj =αi j, βj =αi
31
32 Chapitre 5 – Intégrale de Lebesgue
R
Remarque 5.3 – On note que si ϕ est étagée positive, alors ϕ dµ > 0.
Exemple 5.4 – 1. Mesure de Dirac : Soit x ∈ E, pour toute fonction étagée positive ϕ,
Z
ϕ dδx = ϕ(x).
E
2. Mesure de comptage sur N : Soit m la mesure de comptage sur (N, P(N)), si ϕ est étagée positive
sur N, alors Z X
ϕ dm = ϕ(n).
N n∈N
X N
X X N
X X
ϕ(n) = ϕ(n) = αi 1
n∈N i=1 n∈N i=1 n∈N
ϕ(n)=αi ϕ(n)=αi
N
X Z
= αi m({ϕ = αi }) = ϕ dm.
i=1
Proposition 5.5 – Si ϕ et ψ sont deux fonctions étagées positives sur l’espace mesuré (E, A , µ),
1. ϕ + ψ ∈ E+ , et (ϕ + ψ) dµ = ϕ dµ + ψ dµ,
R R R
2. si α ∈ R+ , alors αϕ ∈ E+ et αϕ dµ = α ϕ dµ,
R R
R R
3. si ϕ 6 ψ, alors ϕ dµ 6 ψ dµ.
1. On écrit ϕ = i=1 αi 1Ai et ψ = j=1 βj 1Bj où les Ai et (resp. les Bj ) forment
PN PM
Démonstration.
une partition de E. Alors ϕ + ψ = i=1 j=1 (αi + βj )1Ai ∩Bj ,
PN PM
Z N X
X M N
X M
X M
X N
X
(ϕ + ψ) dµ = (αi + βj )µ(Ai ∩ Bj ) = αi µ(Ai ∩ Bj ) + βj µ(Ai ∩ Bj )
i=1 j=1 i=1 j=1 j=1 i=1
N
X M
FM X FN
= αi µ A
j=1 i ∩ Bj + βj µ i=1 Ai ∩ Bj
i=1 j=1
N
X M
X Z Z
= αi µ(Ai ) + βj µ(Bj ) = ϕ dµ + ψ dµ.
i=1 j=1
Z N
X N
X Z
αϕ dµ = ααi µ(Ai ) = α αi µ(Ai ) = α ϕ dµ.
i=1 i=1
Cette dernière intégrale est bien définie : on observe que ϕ1A ∈ E+ . En effet, si ϕ = i=1 αi 1Ai où les Ai
PN
Lemme 5.6 – Si (En )n∈N est une suite croissante de A vérifiant E = n∈N En , alors pour toute fonction
S
ϕ ∈ E+ , Z Z
ϕ dµ −→ ϕ dµ.
En n→∞ E
αi 1Ai , on a alors
PN
Démonstration. On écrit ϕ = i=1
Z N
X
ϕ dµ = αi µ(Ai ∩ En ).
En i=1
S
On observe que pour tout i ∈ J1, N K, on a µ(Ai ∩ En ) −→ µ( n Ai ∩ En ) = µ(Ai ), du fait que (Ai ∩ En )n
n→∞
est une suite croissante de A . Le résultat en découle.
On note que, par croissance de l’intégrale des fonctions de E+ , la définition 5.7 est compatible avec la
définition 5.1.
Remarque 5.8 – Les propriétés suivantes se déduisent immédiatement de la définition de l’intégrale.
1. (Positivité) Si f ∈ M+ , alors E f dµ > 0 : si ϕ ≡ 0, alors ϕ ∈ E+ , et ϕ 6 f .
R
ϕ 6 g.
Exemples – 1. Mesure de Dirac : si x ∈ E, alors pour toute fonction f ∈ M+ , on a
Z
f dδx = f (x).
E
En effet, f dδx = sup{ϕ(x), ϕ ∈ E+ , ϕ 6 f } = f (x) : d’une part, il est évident que f dδx 6 f (x),
R R
d’autre part, ϕ = f (x)1{f >f (x)} ∈ E+ vérifiant bien ϕ 6 f , on obtient l’autre inégalité.
2. Mesure de comptage sur (N, P(N)) : pour toute fonction f : N → N, on a
Z X
f dm = f (n).
N n∈N
En effet,
34 Chapitre 5 – Intégrale de Lebesgue
On a
– pour tout n, En ⊂ En+1 ,
S
– E = n En : si x ∈ E, comme fn (x) −→ f (x) > αϕ(x), il existe n ∈ N tel que αϕ(x) 6 fn (x).
n→∞
Alors, par le lemme 5.6, on a Z Z
αϕ dµ = lim αϕ dµ.
E n→∞ En
En laissant tendre α vers 1, puis en passant au sup sur les fonctions ϕ de E+ telles que ϕ 6 f , on
obtient l’inégalité souhaitée.
Proposition 5.10 – Si f, g deux fonctions mesurables positives, alors les propriétés suivantes sont
vérifiées.
R R R
1. (Additivité) E (f + g) dµ = f dµ + g dµ.
R R
2. (Homogénéité positive) Si α > 0, alors αf dµ = α f dµ.
Démonstration. 1. On sait qu’il existe des suites croissantes (ϕn )n et (ψn )n de fonctions de M+ telles
que f = limn→∞ ϕn = f et g = limn→∞ ψn = f . Alors, (ϕn + ψn )n est une suite croissante de M+
qui converge vers f + g, et par Beppo Levi,
R R
E
(ϕn + ψn ) dµ −→ E
(f + g) dµ,
n→∞
=
R R R R
E
ϕn dµ + E
ψn dµ −→ E
f dµ + E
g dµ.
n→∞
5.2 Intégration des fonctions mesurables positives 35
2. On utilise les même notations que dans le point 1. La suite (αϕn )n est une suite croissante de M+
qui converge vers αf , donc par Beppo Levi,
R R
E
αϕn dµ −→ E
αf dµ,
n→∞
=
R R
α E
ϕn dµ −→ α E
f dµ.
n→∞
En revanche, si on suppose en plus qu’il existe une fonction g µ-intégrable telle que fn 6 g pour tout
n ∈ N, alors la conclusion de Beppo Levi reste vraie. En effet, on peut appliquer le théorème de Beppo
Levi à (g − fn )n qui est bien une suite croissante de fonctions de M+ . On obtient
Z Z
lim(g − fn ) dµ = lim (g − fn ) dµ,
E n n E
R R R R
ce qui donne E
g dµ − E
limn fn dµ = E
g dµ − limn E
fn dµ.
Le résultat suivant, qui porte sur l’intégration des séries de fonctions de M+ , est équivalent au théorème
de Beppo Levi.
Proposition 5.14 – Si (fn )n∈N est une suite de fonctions mesurables positives, alors
Z X XZ
fn dµ = fn dµ.
E n∈N n∈N E
Pn
k=0 fk n est une suite croissante de M+ , donc par le théorème
Démonstration. On note que la suite
de Beppo Levi,
Z X n Z X
fk dµ −→ fk dµ,
E k=0 n→∞ E k∈N
=
n Z
X XZ
fk dµ −→ fk dµ,
E n→∞ E
k=0 k∈N
Mesures à densité
alors ν définit une mesure sur (E, A ). On dit que ν est la mesure à densité g par rapport à la mesure µ.
Par ailleurs, si f ∈ M+ , alors Z Z
f dν = f g dµ. (5.1)
E E
36 Chapitre 5 – Intégrale de Lebesgue
Démonstration. On a bien sûr ν(∅) = 0. Par ailleurs, si (An )n est une suite d’éléments de A distincts
deux à deux, alors
G Z X XZ
1An dµ = g 1An dµ =
X
ν An = g ν(An ),
n n∈N n∈N n∈N
par Beppo Levi, ce qui prouve que ν est bien une mesure.
On note que, par définition de ν, l’égalité (5.1) est vraie si f est une indicatrice d’élément de A . Par
additivité de l’intégrale, elle reste donc vraie si f ∈ E+ . Pour finir, si f ∈ M+ , alors il existe une suite
croissante (gn )n de fonctions de E+ qui converge simplement vers f . Comme (fn g)n est aussi une suite
croissante de fonctions mesurables, on a par Beppo Levi
Z Z
fn dν −→ f dν
n→∞
=
Z Z
fn g dµ −→ f g dµ,
n→∞
d’où le résultat.
Exemple 5.16 – Une variable aléatoire réelle X sur un espace probabilisé (Ω, A , P) suit la loi normale
(x−µ) 2
N (µ, σ) si sa loi PX est la mesure qui a pour densité la fonction x 7→ √1 e−
σ 2π
2 , ce qui donne pour
tout A ∈ B(R),
Z − (x−µ)2
e 2
PX (A) = √ dλ(x).
A σ 2π
d’où le résultat.
Corollaire 5.18 – Si f ∈ M+ et
R
E
f dµ < ∞, alors f est finie µ-presque partout (ie µ({f = ∞}) = 0).
Démonstration. Pour tout n ∈ N? , on a
Z
1
µ({f = ∞}) 6 µ({f > n}) 6 f dµ −→ 0,
n E n→∞
2. Si f = g µ-p.p., alors f 1{f 6=g} et g 1{f 6=g} sont nulles µ-p.p., ce qui implique par 1. que
R
{f 6=g}
f dµ =
R
{f 6=g}
g dµ = 0. On en déduit alors que
Z Z Z Z
f dµ = f dµ = g dµ = g dµ.
E {f =g} {f =g} E
d’où l’inégalité.
R – Une fonction f : (E, A ) → (K, B(K)) est dite µ-intégrable (ou intégrable) si elle est
Définition 5.24
mesurable et E |f | dµ < ∞. On note
L 1 (E, A , µ) est parfois seulement noté Lµ1 (E), voire L 1 (E) lorsqu’il n’y a pas d’ambiguı̈té.
On étend la définition aux fonctions à valeurs dans R, ou un sous-ensemble de K (muni de la tribu des
boréliens).
Notation. Si f : E → R est mesurable, alors on appelle respectivement partie positive et partie négative
de f les fonctions f + et f − données par
On remarque que f + etf − sont positives, et mesurables comme composées d’une fonction continue et
d’une fonction mesurable. Par ailleurs, on a clairement :
f = f + − f −,
|f | = f + + f − .
d’où le résultat.
Définition 5.26 (Intégrale de Lebesgue) –
– Si f : (E, A ) → (R, B(R)) est µ-intégrable, on pose
Z Z Z
f dµ := f + dµ − f − dµ.
E E E
et A ∈ A , alors f 1A ∈
Lµ1 (E) Lµ1 (E)
R R
Si f ∈ (du fait que A |f | dµ 6 E
|f | dµ < ∞). On note alors
comme précédemment Z Z
f dµ = f 1A dµ.
A E
R R
Proposition 5.31 (Croissance) – Si f, g : E → R sont intégrables et f 6 g, alors E f dµ 6 E g dµ.
Démonstration. On a g − f ∈ M+ , donc E (g − f ) dµ > 0. On conclut par la linéarité de l’intégrale.
R
Remarque 5.32 – Pour avoir la propriété de croissance, il suffit en fait de supposer que f 6 g µ−p.p. :
il suffit de considérer f 1{f 6g} et g 1{f 6g} au lieu de f et g.
Proposition 5.33 (Inégalité triangulaire) – Si f ∈ Lµ1 (E), alors
Z Z
f dµ 6 |f | dµ.
E E
Démonstration. – Si K = R, on a
Z Z Z Z Z Z
+ − + −
f dµ = f dµ − f dµ 6 f dµ + f dµ = |f | dµ.
R
– Si K = C, on commence par remarquer
R
que si E f dµ =R 0, l’inégalité est vérifiée. Sinon, on
R R | f dµ| | f dµ|
remarque que E f dµ = E f R E f dµ dµ. En posant α = R E f dµ , on a
E E
Z Z Z
R
f dµ = (αf ) dµ = Re (αf ) dµ car E
f dµ ∈ R
E E E
Z
6 |Re (αf )| dµ par le cas K = R
E
Z Z
6 |αf | dµ = |f | dµ.
E E
En effet, pour tout B ∈ B(R), λϕ (B) = λ(B − a) = λ(B), donc λϕ = λ, et la formule de transfert donne
le résultat.
Application 5.36 (Calcul de l’espérance d’une variable aléatoire) – Soit X une Rvariable aléatoire réelle
sur un espace probabilisé (Ω, A , P). L’espérance de X est définie par E(X) = Ω X dP. Le lemme de
transfert implique alors que Z
E(X) = x dPX (x),
R
où on a remplacé µ par P, ϕ par X et f par Id : R → R dans la formule de transfert.
N.B. : Dans le cas particulier où X est à valeurs dans N, on a bien la formule classique de l’espérance :
Z XZ X
E(X) = X dP = X dP = k P({X = k}).
E k∈N {X=k} k∈N
5.4 Théorème de convergence dominée et applications 41
La démonstration repose sur l’idée donnée dans la remarque 5.23 : on note qu’il suffit de montrer
l’inégalité Z Z
lim sup |f − fn | dµ > lim sup |f − fn | dµ
E n n E
pour obtenir le résultat. D’après la remarque 5.23, il suffit de “dominer” la suite |f − fn | par une fonction
intégrable pour obtenir l’inégalité. On va voir que les hypothèses du lemme de Fatou permettent de le
faire.
Démonstration. Soit A = {x ∈ E, fn (x) −→ f (x) et ∀n ∈ N, |fn (x)| 6 g(x)}. On a
n→∞
[ X
c
µ(A ) = µ {fn 6−→ f } ∪ {|fn | > g} 6 µ({fn 6−→ f }) + µ({|fn | > g}) = 0.
n→∞ n→∞
n∈N n∈N
On remarque que si x ∈ A, alors |f (x) − fn (x)| 6 |f (x)| + |fn (x)| 6 2g(x), ce qui implique que
1A (2g − |f − fn |) ∈ M+ . Par le lemme de Fatou, on a
Z Z
lim inf (2g − |f − fn |) dµ 6 lim inf (2g − |f − fn |) dµ ,
n n
|A R
{z } |R A
{z R }
= A
2g dµ = A
2g dµ−lim supn A
|f −fn | dµ
Corollaire
P R 5.39 – Soit (fn )n P une suite de fonctions mesurables de E dans K vérifiant
n |fn | dµ < ∞. Alors, la fonction n fn est définie presque partout, µ-intégrable, et
XZ Z X
fn dµ = fn dµ.
n∈N E E n∈N
P R
Démonstration. On observe d’abord que comme n |fn | dµ < ∞, les fonctions fn sont en fait intégrables.
Par ailleurs, par Beppo Levi, on a
Z X XZ
|fn | dµ = |fn | dµ < ∞. (5.2)
E n∈N n∈N E
42 Chapitre 5 – Intégrale de Lebesgue
P P
Par conséquent, la fonction n |fn | est finie µ-presque Ppartout, donc n fn (x) converge absolument pour
µ-presque tout x ∈ E. On P en déduit que la fonction n fn P est bien définie µ-presque partout.P
On pose par exemple n fn (x) = 0 lorsque x ∈ A := { n |fn | = ∞} ∈ P A . La fonction n fn est
k=0 fk 1A )n . Par ailleurs,
n
alors
R P mesurable comme
RP limite simplePde la suite de fonctions mesurables (
| n fn | dµ 6 n |f n | < ∞, donc n fn est intégrable. Pn
On applique le théorème de convergence dominée à la suite de fonctions (gn )n , où gn = k=0 fk . En effet,
on a
P
– gn −→ n fn µ-p.p.,
n→∞P
– |gn | 6 n |fn | µ-p.p.
On en déduit que
Z X n Z X
fk dµ −→ fn dµ
E k=0 n→∞ E n∈N
= =
n
XZ XZ
fk dµ −→ fn dµ,
E n→∞ E
k=0 n∈N
d’où le résultat.
Démonstration. Soit (yk )k∈N une suite de Y telle que limk→∞ yk = ȳ. Pour tout k ∈ N, on pose
ϕk (x) = f (x, yk ).
Par hypothèse, les fonctions ϕk sont mesurables, la suite (ϕk ) converge µ-presque partout vers `, et pour
tout k ∈ N, |ϕk | 6 g µ-presque partout. Comme g ∈ Lµ1 (E), on peut appliquer le théorème de convergence
dominée à la suite de fonctions (ϕk ), et on obtient que
Z
F (y) −→ ` dµ.
y→ȳ E
R
Alors la fonction F : y ∈ Y 7→ E
f (x, y) dµ est bien définie sur Y tout entier, et est continue en ȳ.
Démonstration. On pose ` : x ∈ E 7→ f (x, ȳ). Par hypothèse, ` est une fonction mesurable. On peut donc
appliquer le théorème précédent, qui donne
Z
F (y) −→ ` dµ = F (ȳ).
y→ȳ E
où ∂f
R
∂y (x, ·) désigne la dérivée de la fonction y 7→ f (x, y). Alors la fonction F : y ∈ I 7→ E
f (x, y) dµ est
dérivable sur I, et pour tout y ∈ I, Z
F 0 (y) = ∂y (x, y) dµ.
E
Démonstration. Soient ȳ ∈ I et une suite (yn )n∈N de I telle que limn→∞ yn et yn 6= y pour tout [Link]
considère la suite de fonctions ϕn définie par
f (x, yn ) − f (x, ȳ)
ϕn (x) = .
yn − ȳ
On note que par hypothèse, les fonctions ϕn sont intégrables, et ϕn (x) −→ ∂y f (x, ȳ) µ-p.p. x. Par
n→∞
ailleurs, pour µ-presque tout x ∈ E, le théorème des accroissements finis donne
|ϕn (x)| 6 sup |∂y f (x, y)| 6 |g(x)|.
y∈[yn ,ȳ]
Z b XN Z
f (x) dx = αi `(Ii ) = f dλ.
a i=1 [a,b]
44 Chapitre 5 – Intégrale de Lebesgue
Théorème 5.46 – Si (fn )n∈N est une suite de fonctions Riemann-intégrables de [a, b] dans R qui converge
uniformément vers f , alors f est Riemann-intégrable, et
Z b Z b
f (x) dx = lim fn (x) dx.
a n→∞ a
Définition 5.47 – On appelle fonction réglée sur [a, b] toute fonction f : [a, b] → R qui est limite
uniforme d’une suite de fonctions en escalier.
On peut montrer que les fonctions réglées sur [a, b] sont exactement les fonctions qui admettent une
limite à gauche et à droite en tout point. Il est donc aisé de voir que toutes les fonctions continues, les
fonctions continues par morceaux, les fonctions monotones sont des fonctions réglées sur [a, b]. On peut
aussi montrer que les fonctions réglées ont un nombre dénombrable de discontinuités.
Une conséquence immédiate du théorème 5.46 est que toute fonction réglée est Riemann-intégrable. Il
est alors naturel de se demander si ce sont les seules. Le théorème suivant répond par la négative à cette
question, et caractérise les fonctions Riemann-intégrables sur un segment [a, b].
Théorème 5.48 (Critère de Lebesgue) – Une fonction f : [a, b] → R bornée est Riemann-intégrable si et
seulement si elle est continue λ-presque partout.
Le critère de Lebesgue permet de voir immédiatement qu’il existe des fonctions Riemann-intégrables
qui ne sont pas réglées. On peut citer l’exemple de l’indicatrice de l’ensemble de Cantor C sur [0, 1] : la
fonction est discontinue sur C qui n’est pas dénombrable, donc 1C n’est pas réglée. En revanche, 1C est
Riemann-intégrable car l’ensemble de ses points de discontinuité est C, qui est de mesure nulle. Un autre
exemple est a fonction f définie sur [0, 1] par f (x) = sin x1 si x > 0, et f (0) = 0. Elle n’est pas réglée
puisqu’elle n’admet pas de limite à droite en 0, mais elle est Riemann-intégrable puisqu’elle est continue
sur ]0, 1] qui est de mesure pleine dans [0, 1].
Rb
Pour toute fonction g ∈ Lλ1 ([a, b]), on notera alors sans amiguité
R
[a,b]
g dλ = a
g(x) dx.
5.5 Lien entre l’intégrale de Riemann et l’intégrale de Lebesgue 45
Démonstration. Soit (ϕn )n∈N une suite de Esc telle que pour tout n ∈ N, ϕn 6 f , et
Z Z b
ϕn dλ −→ f (x) dx.
[a,b] n→∞ a
On remarque que, quitte à remplacer ϕn par max(ϕ0 , . . . , ϕn ), on peut supposer que la suite (ϕn )n est
croissante. On introduit alors sa limite simple g, qui est mesurable comme limite simple d’une suite de
fonctions mesurables, et qui vérifie donc g 6 f .
Comme la suite (ϕn − ϕ0 )n est une suite croissante de M+ , on peut lui appliquer le théorème de Beppo
Levi. Il vient alors Z Z
(ϕn − ϕ0 ) dλ −→ (g − ϕ0 ) dλ.
[a,b] n→∞ [a,b]
Rb
Comme ϕ0 ∈ Lλ1 ([a, b]), on en déduit que
R R R
[a,b]
ϕn dλ −→ [a,b]
g dλ, et donc [a,b]
g dλ = a
f (x) dx.
n→∞
On considère maintenant une suite (ψn )n∈N de Esc telle que pour tout n ∈ N, ψn > f , et
Z Z b
ψn dλ −→ f (x) dx.
[a,b] n→∞ a
Quitte à remplacer ψn par min(ψ0 , . . . , ψn ), on peut supposer que la suite (ψn )n est décroissante. On
introduit alors sa limite simple h, qui est mesurable et vérifie h > f . On applique cette fois Beppo Levi à
la suite (ψ0 − ψn )n , et on obtient, du fait que les fonctions h, ψn , ψ0 sont intégrables (h 6 ψn 6 ψ0 pour
tout n), Z Z
ψn dλ −→ h dλ.
[a,b] n→∞ [a,b]
R Rb
On en déduit alors que [a,b]
h dλ = a
f (x) dx.
R
On remarque alors que h − g > 0, et [a,b]
(h − g) dλ = 0, donc g = h λ-presque partout. De ce fait, f = g
λ-presque partout, d’où le résultat.
Remarque 5.50 – On ne peut pas dire en général que si f est Riemann-intégrable, alors elle est intégrable
au sens de Lebesgue : il faudrait pour cela qu’elle soit mesurable, ce qui n’est pas garanti. Il peut en effet
arriver qu’une fonction soit presque partout égale à une fonction mesurable, mais ne soit pas mesurable
elle-même. Bien sûr, si on ajoute dans les hypothèses du théorème 5.49 que f est mesurable, alors la
Rb
conclusion devient sur f ∈ L 1 ([a, b]), et a f (x) dx = [a,b] f dλ.
R
Une conséquence directe du théorème 5.49 est que tous les résultats connus pour l’intégrale de Riemann
s’appliquent à l’intégrale de Lebesgue des fonctions Riemann-intégrables mesurables.
Par ailleurs, à partir de maintenant, lorsque nous travaillerons avec une fonction f : [a, b] → R Riemann-
Rb R
intégrable et mesurable, nous ne ferons plus de distinction entre les écritures a f (x) dx, [a,b] f dλ, et on
Rb
s’autorisera par exemple à écrire a f dλ.
Théorème 5.51 – On suppose que f est une fonction mesurable de ]a, b[ dans R localement Riemann-
intégrable et d’intégrale absolument convergente. Alors, f est Lebesgue-intégrable, et
Z b Z
f (x) dx = f dλ.
a [a,b]
Démonstration. Soit (an )n∈N une suite décroissante qui converge vers a, et bn )n∈N une suite croissante
qui converge vers b. On note que pour tout n ∈ N, on a
Z Z bn
|f | dλ = |f (x)| dx.
[an ,bn ] an
46 Chapitre 5 – Intégrale de Lebesgue
Comme la suite |f |1[an ,bn ] est croissante, on peut appliquer Beppo Levi, et la convergence absolue de
l’intégrale de Riemann de f sur ]a, b[ donne alors
Z Z b
f dλ = |f (x)| dx < ∞.
[a,b] a
On en déduit que f ∈ L 1 ([a, b]). On peut donc appliquer le théorème de convergence dominée à la suite
(|f |1[an ,bn ] )n , ce qui donne
Z Z
f dλ −→ f dλ.
[an ,bn ] n→∞ [a,b]
On cherche à définir une mesure λ sur R qui soit conforme à la notion de longueur des intervalles de
R. En d’autres termes, si I désigne l’ensemble des intervalles ouverts bornés de R, on souhaite étendre
l’application
λ : I → R+
]a, b[ 7→ b − a
à une classe plus large de parties de R, tout en imposant que le prolongement obtenu soit une mesure sur
une tribu A de R.
Plus précisément, comme détaillé dans le théorème 3.9 énoncé plus haut, on souhaite définir une mesure λ
sur R telle que :
(i) λ([0, 1]) = 1,
(ii) λ est invariante par translation.
Le résultat suivant montre qu’il est impossible de définir une telle mesure sur P(R).
Théorème 6.1 – Il n’existe pas de mesure sur (R, P(R)) vérifiant (i) et (ii).
La démonstration (voir TD) repose sur l’axiome du choix et implique en particulier l’existence de parties
de R dites “non mesurables”, c’est-à-dire qui n’appartiennent à aucune tribu de R sur laquelle on peut
définir une mesure vérifiant (i) et (ii).
Nous allons donc construire une mesure λ sur R vérifiant les propriétés (i) et (ii) sur une tribu de R
différente de P(R). Pour assurer que nous pourrons tout de même mesurer assez d’ensembles de R, nous
chercherons à construire λ sur une tribu assez large : nous imposerons qu’elle contienne les ouverts. En fait,
nous allons même la construire sur la plus petite tribu qui contient les ouverts : la tribu borélienne. Nous
verrons ensuite que cette définition se généralise à des tribus plus grandes. Toutefois, dans la pratique, il
est largement suffisant de travailler dans B(R).
47
48 Chapitre 6 – Construction de mesures - Unicité
– µ? (∅) = 0,
– µ? est croissante : si A ⊂ B ⊂ E, µ? (A) 6 µ? (B),
– µ? est σ-sous-additive : si pour tout n ∈ N, An ⊂ E, alors µ? µ? (An ).
S P
n∈N An 6 n∈N
On note que la propriété de σ-sous-additivité vérifiée par les mesures extérieures est plus faible que la
propriété de σ-additivité des mesures. Par conséquent, toute mesure sur (E, P(E)) est aussi une mesure
extérieure sur E (les mesures extérieures sont toujours définies sur l’ensemble des parties).
Les propositions qui suivent permettent de voir qu’on peut restreindre toute mesure extérieure à une tribu
sur laquelle elle est σ-additive, ce qui fait d’elle une mesure sur cette tribu.
Définition 6.3 – On dit qu’un ensemble A ⊂ E est une partie µ? -mesurable ssi pour tout B ⊂ E,
µ? (B) = µ? (B ∩ A) + µ? (B \ A).
On note Mµ? l’ensemble des parties µ? -mesurables de E.
On peut voir les élements de Mµ? comme les parties de E pour lesquelles µ? “se comporte comme une
mesure”, c’est-à-dire a une propriété d’additivité. Le théorème suivant donne un sens à cette remarque.
Théorème 6.4 –
1. Mµ? est une tribu sur E.
2. µ? est une mesure sur (E, Mµ? ).
Démonstration. 1. Il est clair que ∅ ∈ Mµ? . D’autre part, si A ∈ Mµ? , alors pour tout B ⊂ E
µ? (B) = µ? (B ∩ A) + µ? (B \ A) = µ? (B \ Ac ) + µ? (B ∩ Ac ),
donc Ac ∈ Mµ? . Il reste à vérifier le dernier point. Soient (An )n∈N une suite
S d’éléments S Mµ? ,
de
? ? ?
et B ⊂ E. Par définition de la mesure extérieure, on a µ (B) 6 µ (B ∩ n An ) + µ (B\ n An ).
Montrons l’autre inégalité : on observe que
µ? (B) = µ? (B ∩ A0 ) + µ? (B\A0 )
= µ? (B ∩ A0 ) + µ? ((B\A0 ) ∩ A1 ) + µ? (B\(A0 ∪ A1 ))
= µ? (B ∩ A0 ) + µ? ((B\A0 ) ∩ A1 ) + µ? (B\(A0 ∪ A1 ) ∩ A2 ) + µ? (B\(A0 ∪ A1 ∪ A2 ))
= ...
N n−1
! ! N
!
X [ [
= µ? B\ Ak ∩ An + µ? B\ An
n=0 k=0 n=0
pour tout A ⊂ R.
Remarque 6.5 – On ne peut pas faire la même construction en prenant des intervalles inclus dans A et
en prenant le sup. Une telle construction donnerait par exemple une mesure nulle à R \ Q qui ne contient
aucun intervalle non vide.
Remarque 6.6 – On peut remplacer I dans la définition de la mesure de Lebesgue par l’ensemble des
intervalles bornés, ou encore par l’ensemble des intervalles.
Proposition 6.7 – λ? est une mesure extérieure sur R.
Démonstration. Tout d’abord, il est clair que λ? (∅) = 0. D’autre part, si A ⊂ B, alors si In ∈ I , n ∈ N,
[ [
B⊂ In ⇒ A ⊂ In ,
n∈N n∈N
Comme l’inégalité tient pour tout ε > 0, on obtient bien l’inégalité souhaitée en laissant tendre ε vers
0.
Proposition 6.8 –
1. λ? ([0, 1]) = 1,
2. λ? est invariante par translation.
Démonstration.
1. Pour commencer, λ? ([0, 1]) 6 1 : pour tout ε > 0, [0, 1] ⊂] − ε, 1 + ε[ donc λ? ([0, 1]) 6 1 + 2ε pour
tout ε > 0, on obtient l’inégalité en laissant tendreSε vers 0.
Montrons l’autreSninégalité. Supposons que [0, 1] ⊂ i∈N ]ai , bi [. Par compacité, il existe un entier n
tel que [0, 1] ⊂ i=0 ]ai , bi [.
Soit i1 tel que 0 ∈]ai1 , bi1 [. Si bi1 ∈ [0, 1], il existe i2 tel que bi1 ∈]ai2 , bi2 [. On répète ensuite
l’opération pour construire les ik suivants avec bik−1 ∈]aik , bik [, jusqu’à obtenir biN > 1 (le fait qu’il
y a un nombre fini d’intervalles ]ai , bi [ assure l’existence de N ). Par conséquent,
X N
X N
X
bi − ai > bik − aik > (bik − bik−1 ) + bi1 − ai1 = biN − ai1 > 1.
i∈N k=1 k=2
50 Chapitre 6 – Construction de mesures - Unicité
Par le paragraphe précédent, le Théorème 6.7 montre alors que λ? est une mesure sur la tribu Mλ? de
ses ensembles mesurables, qui vérifie bien les propriétés (i ) et (ii ). Il reste à vérifier que la tribu Mλ?
contient les ensembles qui nous intéressent, c’est-à-dire les boréliens de R.
Démonstration. Comme Mλ? est une tribu, il suffit de montrer qu’elle contient une classe qui engendre les
boréliens. Par exemple, il suffit de montrer que pour tout a ∈ R, ] − ∞, a] ∈ Mλ? . Soit donc I =] − ∞, a],
on souhaite montrer que pour tout B ⊂ R, λ? (B) = λ? (B ∩ I) + λ? (B \ I). On sait par sous-additivité de
λ? que
λ? (B) 6 λ? (B ∩ I) + λ? (B \ I),
montrons la deuxième inégalité. Pour ce faire, on considère une suite (In ) = (]an , bn [) de I telle que
B ⊂ n In , et on pose ε > 0. On note que les intervalles ] min(ai , a), min(bi , a) + 2εn [ recouvrent B ∩ I, et
S
que les intervalles ] max(ai , a), max(bi , a)[ recouvrent B \ I. Ainsi,
X X
λ? (B ∩ I) + λ? (B \ I) 6 (min(bn , a) − min(an , a)) + 2ε + (max(bn , a) − max(an , a))
n∈N n∈N
X
= (min(bn , a) + max(bn , a)) − (max(an , a) + min(an , a)) + 2ε
n∈N
X
= (bn − an ) + 2ε
n∈N
Remarque 6.10 – On peut définir de manière similaire la mesure de Lebesgue de dimension d > 2, en
définissant d’abord la mesure extérieure λ?d par
nX [ o
λ?d (A) = inf V (Pn ), A ⊂ Pn , (Pn )n ∈ P N ,
n∈N n∈N
pour tout A ⊂ Rd , où P désigne l’ensemble des pavés ouverts bornés de Rd . On remarque que la définition
reste la même si P désigne l’ensemble des pavés ouverts de Rd , ou même plus généralement l’ensemble
des pavés de Rd .
On peut ensuite montrer comme ci-dessus que λ?d définit une mesure λd sur B(Rd ), qui vérifie les propriétés
souhaitées :
(i ) λd ([0, 1]d ) = 1,
(ii ) λd est invariante par translation.
Il convient de remarquer qu’on peut aussi construire les mesures de Lebesgue d-dimensionnelles comme
des mesures produits, à partir de la mesure de Lebesgue sur R. Nous détaillerons cette construction au
chapitre 7.
Nous pouvons utiliser la définition de la mesure extérieure de Lebesgue pour proposer une nouvelle
preuve de la régularité de la mesure de Lebesgue. Le résultat ci-dessous concerne λ?d et est valable pour
tout élément de Mλ?d . Il est donc plus fort que le résultat de régularité du chapitre 3.
Démonstration. On remarque d’abord qu’il suffit de montrer que pour tout ε > 0, on peut trouver un
ouvert Ω de Rd tel que A ⊂ Ω et λ?d (Ω \ A) < 2ε . En effet, on pourra alors appliquer le résultat à Ac pour
obtenir un ouvert ω tel que Ac ⊂ ω et λ?d (ω \ Ac ) < 2ε . Ainsi, en introduisant le fermé F = ω c , on aura
bien F ⊂ A ⊂ Ω, et λd (Ω \ F ) 6 λ?d (Ω \ A) + λ?d (A \ F ) < ε.
On suppose
S d’abord
?
Pque λd (A) < ?∞. La définition de λ?d donne l’existence d’une suite (Pn )n de P telle
que A ⊂ n Pn et n V (Pn ) < λd (A) + 2n+2 . Si on considère l’ouvert Ω = n Pn , on a alors A ⊂ Ω, et
ε
S
X ε
λd (Ω) 6 λd (Pn ) < λ?d (A) + .
n
2
Comme A ∈ Mλ?d , on a λ?d (Ω \ A) = λ?d (Ω) − λ?d (Ω ∩ A) = λ?d (Ω) − λ?d (A) < 2ε .
Si maintenant λ?d (A) = ∞, on pose An = A ∩ [−n, n]d pour tout n ∈ N. Il existe alors
S une suite d’ouverts
ε
(Ωn )n telle que An ⊂ Ωn et λ?d (Ωn \ An ) < 2n+2 pour tout n. On a donc A ⊂ Ω := n Ωn , et
[ X ε
λ?d (Ω \ A) 6 λ?d Ω n \ An 6 λ?d (Ωn \ An ) < ,
n n
2
ce qui conclut.
Remarque 6.12 – On peut en fait montrer que la réciproque du lemme 6.1.2 est vraie : une partie A de
Rd est Lebesgue-mesurable si et seulement si pour tout ε > 0, il existe un ouvert Ω et un fermé F tels que
F ⊂ A ⊂ Ω et λd (Ω \ F ) < ε.
Démonstration. Il suffit de montrer la réciproque du lemme 6.1.2. On se ramène donc à prouver
que si B ⊂ Rd , alors λ?d (B) > λ?d (B ∩ A) + λ?d B \ A). On se donne ε > 0, et un ouvert Ω de
Rd tel que A ⊂ Ω et λ?d (Ω \ A) < ε. Ainsi,
Remarque 6.14 – On déduit du théorème 6.13 que pour toute partie A ∈ Mλ?d , il existe des boréliens
B1 , B2 ∈ B(Rd ) tels que B1 ⊂ A ⊂ B2 et λd (B1 ) = λ?d (A) = λd (B2 ).
M = {A ∈ A , µ(A) = ν(A)}
est une tribu (elle contiendra alors σ(C ) = A ). On remarque qu’il n’est pas évident
S de montrer
S que M
est stable par union dénombrable, mais qu’il est très aisé de montrer que µ( n An ) = ν( n An ) si la
suite (An )n d’éléments de M est supposée croissante. Cette observation permet de montrer que M a une
structure de classe monotone, et le lemme des classes monotones permet de conclure.
Lemme 6.18 (Lemme des classes monotones) – Soit C une classe de parties de E stable par intersection
finie. On a alors
σ(C ) = m(C ).
Démonstration. Comme σ(C ) est une classe monotone contenant C , on a immédiatement σ(C ) ⊃ m(C ).
Pour obtenir l’autre inclusion, il suffit de montrer que m(C ) est une tribu. Le lemme 6.17 assure qu’il
suffit de montrer que m(C ) est stable par intersection finie. Commençons par montrer que
Il suffit de montrer que M1 := {B ∈ m(C ), ∀C ∈ C , C ∩ B ∈ m(C )} est une classe monotone. Comme
C ⊂ M1 par hypothèse, on aura alors M1 = m(C ), ce qui donne (6.1).
6.2 Unicité des mesures 53
S de M1 , alors pour
— Si (Bn )n estSune suite croissante S tout C ∈ C , C ∩ Bn est une suite croissante de
m(C ) donc n C ∩ Bn = C ∩ n Bn ∈ m(C ), et n Bn ∈ M1 .
Pour montrer que m(C ) est stable par intersection finie, c’est-à-dire
il suffit de montrer que M2 := {A ∈ m(C ), ∀B ∈ m(C ), A ∩ B ∈ m(C )} est une classe monotone
contenant C . On montre aisément comme ci-dessus que M2 est une classe monotone. Par ailleurs, (6.1)
exprime que M2 contient C , d’où le résultat.
Remarque 6.20 – On note que si la propriété 2 du Théorème d’unicité est vérifiée, alors les mesures µ et
ν sont en particulier σ-finies.
Démonstration. 1. On pose
M := {A ∈ A , µ(A) = ν(A)}.
On remarque que M est une classe monotone :
— µ(E) = ν(E) car E ∈ C , donc E ∈ M ,
— si A, B ∈ M avec A ⊂ B, alors µ(B \ A) = µ(B) − µ(A) = ν(B) − ν(A) = ν(B \ A), du fait
que µ et ν sont finies, donc B \ A ∈ M ,
— si (A
S n )n est S de M alors la continuité à gauche de µ et ν implique que
uneSsuite croissante
µ n An = ν n A n , donc n An ∈ M .
Comme M contient C par hypothèse, on a donc M ⊃ m(C ) = σ(C ) = A , par le lemme des classes
monotones, ce qui prouve que µ = ν sur A .
2. Pour tout n ∈ N, on définit les mesures µn et νn sur (E, A ) par
Pour tout n ∈ N, les mesures µn et νn sont donc des mesures finies. Par ailleurs, si C ∈ C , on a alors
C ∩ En ∈ C , et µn (C) = νn (C). On S déduit alors du point 1 que µn = νn sur A . Si A ∈ A , comme
la suite (A ∩ En )n est croissante et n En = E, la continuité à gauche de µ et ν implique que
µ(A) = lim µ(A ∩ En ) = lim µn (A) = lim νn (A) = lim ν(A ∩ En ) = ν(A),
n→∞ n→∞ n→∞ n→∞
µ(I) = `(I).
54 Chapitre 6 – Construction de mesures - Unicité
On déduit alors qu’il existe au plus une mesure λ sur (R, B(R)) invariante par translation et telle que
λ([0, 1]) = 1. En effet, si λ et λ0 satisfont ces propriétés, alors elles coı̈ncident sur la classe I des intervalles.
Or, la classe I est stable par intersection finie, elle contient R tout entier, et elle engendre la tribu B(R).
On peut donc appliquer le point 2 du théorème d’unicité en prenant En =] − n, n[.
On montre l’unicité de la mesure de Lebesgue d-dimensionnelle λd sur (Rd , B(Rd )) de manière analogue,
en montrant que λd fixe la mesure des ensembles de la classe P des pavés de Rd . Comme P est stable
d
par intersection finie et contient Rd , on peut raisonner de la même manière en posant En = ] − n, n[ .
On retiendra pour la suite qu’une mesure sur (Rd , B(Rd )) qui coı̈ncide avec λd sur P est en fait égale à
λd .
car n Nn ∈ Nµ .
F
6.3 Tribu complétée, mesure complétée 55
2. Il suffit de montrer que Nµ̄ ⊂ Nµ . En effet, on aura alors Nµ̄ ⊂ Nµ ⊂ A¯, ce qui montre que
(E, A¯, µ̄) est complet. Pour voir ça, on remarque que si N ∈ Nµ̄ , alors N ⊂ B ∪ N 0 où B ∈ A ,
N 0 ∈ Nµ et µ̄(B ∪ N 0 ) = 0. Il existe donc A0 ∈ A tel que N 0 ⊂ A0 et µ(A0 ) = 0. On a donc
N ⊂ B ∪ N 0 ⊂ B ∪ A0 .
Théorème 6.26 – 1. La tribu Mλ? des parties mesurables pour la mesure extérieure λ? coı̈ncide avec
la tribu L (R).
2. La mesure λ̄ coı̈ncide avec λ? sur Mλ? = L (R).
Démonstration. 1. Commençons par montrer que si N ∈ Nλ , alors N est λ∗ -mesurable. On sait qu’il
existe A ∈ A tel que N ⊂ A et λ(A) = 0, donc si B ⊂ R, alors λ? (B ∩ N ) 6 λ? (A) = 0 et
λ? (B \ N ) 6 λ? (B). On en déduit que
λ? (B ∩ N ) + λ? (B \ N ) 6 λ? (B).
λ? (B) 6 λ? (B ∪ N ) 6 λ? (B) + λ? (N ).
Mesure produit
Dans ce chapitre, on se penche sur l’intégrale d’une fonction de deux variables f : E × F → K, où
(E, A , µ) et (F, B, ν) sont deux espaces mesurés. On cherche à comparer les intégrales
Z Z Z Z
f (x, y) dν(y) dµ(x) et f (x, y) dµ(x) dν(y),
E F F E
lorsqu’elles ont un sens. À condition de définir une tribu et une mesureR adaptées sur E × F , notées
respectivement A ⊗ B et µ ⊗ ν, on peut s’intéresser aussi à l’intégrale E×F f dµ ⊗ ν, lorsqu’elle a un
sens.
Le but de ce chapitre est de donner un cadre dans lequel ces trois intégrales ont un sens, et
Z Z Z Z Z
f (x, y) dν(y) dµ(x) = f (x, y) dµ(x) dν(y) = f (x, y) dµ ⊗ ν(x, y).
E F F E E×F
7.1.1 Définition
Définition 7.1 – On appelle tribu produit de A et B la tribu A ⊗ B sur l’espace E × F définie par
A ⊗ B = σ(A × B).
57
58 Chapitre 7 – Mesure produit
X = {X ∈ B ⊗ C , A × X ∈ A ⊗ B ⊗ C }.
On note qu’il est évident que B × C ∈ X . Par ailleurs, X est une tribu :
– ∅ ∈ X car A × ∅ = ∅,
c
– si X ∈ X , alors on remarque que A × X c = (A × X) ∩ A × F × G ∈ A ⊗ B ⊗ C ,
– si (Xn )n est une suite de X , alors A × n X = n A × Xn ∈ A ⊗ B ⊗ C .
S S
π1 : (x, y) 7→ x,
.
π2 : (x, y) 7→ y.
Cas de B(Rd )
Démonstration. — Les projections π1 : (x, y) 7→ x et π2 : (x, y) 7→ y sont continues, donc (B(R2 ), B(R))-
mesurables. La proposition 7.3 implique alors que B(R) ⊗ B(R) ⊂ B(R2 ).
— On a B(R2 ) = σ({I × J, I, J intervalles de R}) ⊂ σ(B(R) × B(R)) = B(R) ⊗ B(R).
7.1.2 Sections
Définition 7.5 – Si C ⊂ E × F , on définit les ensembles :
Par ailleurs, la remarque 7.6 implique que A × B ⊂ Tx . On en conclut donc que Tx = A ⊗ B, d’où le
résultat.
Remarque 7.8 – Par la remarque 7.6, si C = A × B ∈ A × B, alors on a ν(Cx ) = ν(B)1A (x) pour tout
x ∈ E, et µ(C y ) = µ(A)1B (y) pour tout y ∈ B.
Corollaire 7.9 – Soit f : (E × F, A ⊗ B) → (G, D) mesurable. On définit
Nous allons montrer que M est une classe monotone qui contient A × B, ce qui donnera directement le
résultat. Tout d’abord, si C = A × B ∈ A × B, alors ν(Cx ) = ν(B)1A (x), et x 7→ ν(Cx ) est mesurable
du fait que A ∈ A . Par ailleurs, M est une classe monotone :
— on vient de voir que E × F ∈ M ,
— si C ∈ M , alors ν(C c x ) = ν(Cx c ) = ν(F ) − ν(Cx ), qui est bien une fonction mesurable de x, comme
somme de deux fonctions mesurables,
— si (Cn )n est une suite croissante de M , alors ν(( n Cn )x ) = ν( n (Cn )x ) = limn→∞ ν((Cn )x ), qui
S S
est mesurable comme limite simple de fonctions mesurables.
Si les mesures ne sont pas finies, il existe une suite croissantes (Fn )n de B telles que n Fn = F ,
S
et ν(Fn ) < ∞ pour tout n. On définit la mesure νn sur (F, B) par νn (B) = ν(B ∩ Fn ). On a alors
ν(Cx ) = limn→∞ νn (Cx ), qui est une fonction mesurable de x comme limite de fonctions mesurables, car
νn est une mesure finie.
• Montrons maintenant que µ ⊗ ν est l’unique mesure sur (E × F, A ⊗ B) qui vérifie (7.1). Si m est
une autre mesure vérifiant ces propriétés, alors µ ⊗ ν et m coı̈ncident sur A × B, qui est stable par
intersection finie, et contient E × F . Si (En )n et (Fn )n sont les suites de A et B exprimant que µ ν
sont σ-finies, alors pour tout n ∈ N,
Les hypothèses du théorème d’unicité des mesures sont donc vérifiées, et µ ⊗ ν = m, d’où l’unicité.
On remarque que (7.3) donne de plus que µ ⊗ ν est σ-finie.
• On vérifie comme ci-dessus que C ∈ A ⊗ B 7→ F µ(C y ) dν(y) définit bien une mesure sur
R
On remarque immédiatement que si µ, ν, ξ sont des mesures sur trois espaces mesurables σ-finis (E, A ),
(F, B) et (G, C ), alors les mesures (µ ⊗ ν) ⊗ ξ et µ ⊗ (ν ⊗ ξ) coı̈ncident sur A × B × C , elles sont donc
égales. On note par fois µ ⊗ ν ⊗ ξ.
Proposition 7.13 – La mesure λ ⊗ . . . ⊗ λ coı̈ncide avec la mesure de Lebesgue λd sur (Rd , B(Rd )).
| {z }
d
Comme λd et λd coı̈ncident sur les pavé de Rd , le théorème d’unicité de la mesure de Lebesgue sur
Rd permet de conclure.
R R
1. les fonctions x 7→ F
f (x, y) dν(y) et y 7→ E
f (x, y) dµ(x) sont mesurables,
2. on a l’égalité
Z Z Z Z Z
f dµ ⊗ ν = f (x, y) dν(y) dµ(x) = f (x, y) dµ(x) dν(y).
E×F E F F E
Z Z
fn (x, y) dµ ⊗ ν(x, y) −→ f (x, y) dµ ⊗ ν(x, y),
E×F n→∞ E×F
Exemple 7.16 – Si (E, A , µ) est un espace mesuré σ-fini et f : E → R+ est mesurable, alors
Z Z
f dµ = µ({f > t}) dt.
E R+
En effet, {(t, x) ∈ R+ × E, f (x) > t} ∈ B(R+ ) ⊗ A car il se récrit {f ◦ π1 − π2 > 0}. On peut donc
appliquer Fubini-Tonelli :
Z Z Z Z Z Z
µ({f > t}) dt = 1{f >t} (x) dµ(x) dt = 1[0,f (x)] (t) dt dµ(x) = f (x) dµ(x).
R+ R+ E E R+ E
3. on a l’égalité
Z Z Z Z Z
f dµ ⊗ ν = f (x, y) dν(y) dµ(x) = f (x, y) dµ(x) dν(y). (7.4)
E×F E F F E
62 Chapitre 7 – Mesure produit
On en déduit que pour ν-presque tout y ∈ F , E |f (x, y)| dµ(x) < ∞, ce qui donne que f y ∈ Lµ1 (E).
R
l’autre fonction.
3. Si f est à valeurs dans R, on sait par Fubini-Tonelli que f + et f − vérifient (7.4). On en déduit alors
l’égalité pour f .
Si f est à valeurs dans C, on sait par ce qui précède que Re f et Im f vérifient (7.4), on en déduit
l’égalité pour f .
Remarque 7.18 – L’hypothèse d’intégrabilité de f pour la mesure produit est cruciale. Par exemple,
Z 1 Z 1 ! Z 1 Z 1 !
x2 − y 2 π x2 − y 2 π
dy dx = , mais dx dy = − .
(x 2 + y 2 )2 4 (x 2 + y 2 )2 4
0 0 0 0
R R R R
Il faut retenir qu’il ne suffit pas que les intégrales E F f (x, y) dν(y) dµ(x) et F F f (x, y) dµ(x) dν(y)
existent et soient finies pour qu’on puisse changer l’ordre d’intégration sans changer la valeur de l’intégrale.
CHAPITRE 8
Changement de variable
Pour calculer l’intégrale d’une fonction f : Rd → Rd sur un ouvert V ⊂ Rd , il peut être utile de
“transporter” l’intégrale sur un ouvert U de Rd difféomorphe à V . À titre d’exemple, lorsqu’on veut intégrer
sur Rd une fonction f radiale, c’est-à-dire que f (x) ne dépend que de kxk, on peut souhaiter faire un
changement de variable polaire, de manière à séparer les variables.
Pour ce faire, la formule de transfert de la proposition 5.34 suggère que nous devons expliciter la
mesure image de λd par ϕ, où ϕ désigne le C 1 -difféomorphisme entre U et V .
1
(λd )ϕ = λd ,
| det A|
Démonstration. Tout d’abord, on remarque que (λd )ϕ (B) = λd (A−1 B − A−1 b) = λd (A−1 B) pour tout
B ∈ B(Rd ). Par conséquent, on peut supposer sans perte de généralité que b = 0.
On remarque ensuite que la mesure (λd )ϕ est invariante par translation : si B ∈ B(Rd ) et a ∈ Rd , alors
(λd )ϕ
L’unicité de la mesure de Lebesgue implique alors que λd coı̈ncide sur B(Rd ) avec (λd )ϕ ([0,1]d )
.
En d’autres termes, il existe γ > 0 tel que (λd )ϕ (B) = γλd (B) pour tout B ∈ B(Rd ). Il reste à montrer
−1
que γ = | det A| .
— Supposons que A ∈ Od (R), i.e. A est orthogonale, et considérons le borélien B = {x ∈ Rd , kxk =
1}. Comme A−1 ∈ O(Rd ), on a bien sûr A−1 B = B, ce qui donne que (λd )ϕ (B) = λd (B), et
γ = 1 = | det A|−1 .
— Supposons maintenant que A ∈ Sd++ (R), i.e. A est symétrique définie positive. On sait alors qu’il
existe P ∈ Od (R) et une matrice diagonale D telles que A = tP DP . On considère alors le borélien
B = tP D−1 [0, 1]d , et on remarque que λd (A−1 B) = λd (tP [0, 1]d ) = λd ([0, 1]d ) = 1, d’après le point
Qd −1
précédent. Par ailleurs, λd (B) = λd (D−1 [0, 1]d ) = λd ( i=1 [0, α1i ]) = (α1 . . . αd ) , où les αi sont les
−1
valeurs propres de A. Finalement, γ = | det A| .
63
64 Chapitre 8 – Changement de variable
— Si maintenant A est quelconque dans G`d (R), la décomposition polaire de A donne l’existence de
Q ∈ Od (R) et S ∈ Sd++ (R) telles que A = QS. Ainsi, les points précédents donnent que pour
−1 −1
tout B ∈ B(Rd ), λd (S −1 Q−1 B) = | det S| λd (Q−1 B) = | det S| λd (B). On obtient donc que
−1 −1
γ = | det S| = | det A| , du fait que det A = det Q det S = det S.
Corollaire 8.2 – Si A ∈ G`d (R) et b ∈ Rd , alors pour toute fonction f ∈ L 1 (Rd ), on a
Z Z
f (y) dy = f (Ax + b)| det A| dx.
Rd Rd
Démonstration. Il suffit d’appliquer la formule de transfert en exprimant (λd )ϕ à l’aide du lemme 8.1.
Rappelons également que la fonction ϕ est de classe C 1 sur l’ouvert U si et seulement si ses dérivées
partielles existent sur U tout entier, et sont continues.
On dit par ailleurs que ϕ est un C 1 -difféomorphisme de U dans V si ϕ est bijective de U dans V , de
classe C 1 sur U , et de réciproque C 1 sur V .
Nous rappelons ici le théorème d’inversion globale, qui est un outil essentiel pour montrer efficacement
qu’une application d’un ouvert de Rd vers un ouvert de Rd est un C 1 -difféomorphisme.
Théorème 8.3 – La fonction ϕ : U → Rd est un C 1 -difféomorphisme de U dans son image ϕ(U ) si et
seulement si
— ϕ est injective sur U ,
— ϕ est de classe C 1 sur U ,
— pour tout x ∈ U , Jϕ (x) ∈ G`d (R).
Pour intégrer une fonction définie sur un ouvert de R2 , il arrive qu’on souhaite repérer un point du
plan par ses coordonnées polaires. C’est le cas notamment lorsque la fonction est radiale, c’est-à-dire
qu’elle s’écrit comme une fonction de kxk. Pour ce faire, on introduit
ϕ : R?+ ×] − π, π[ → R2 \ D
(r, θ) 7→ (r cos θ, r sin θ),
8.2 Théorème de changement de variable 65
où D = R− × {0}. On note d’abord qu’il est clair que ϕ est C 1 , et bijective de R?+ ×] − π, π[ dans R2 \ D.
Par ailleurs, pour tout (r, θ) ∈ R?+ ×] − π, π[,
On déduit alors du théorème d’inversion globale que ϕ est un C 1 -difféomorphisme de R?+ ×] − π, π[ vers
R2 \ D. Le théorème de changement de variable assure alors que pour toute fonction f ∈ L 1 (R2 ),
Z Z Z
f (x, y) dλ2 (x, y) = f (x, y) dλ2 (x, y) = f (r cos θ, r sin θ)r dλ2 (r, θ),
R2 R2 \D R?
+ ×]−π,π[
du fait que λ2 (D) = 0. On peut ensuite utiliser le théorème de Fubini pour obtenir la formulation
Z Z Z ∞Z π
f (x, y) dx dy = f (r cos θ, r sin θ)r dr dθ.
R R 0 −π
Pour intégrer une fonction définie sur un ouvert de R3 , il arrive qu’on souhaite repérer les points de
l’espace par leurs coordonnées sphériques. On introduit alors
Φ : R?+ ×] − π, π[×]0, π[ → R2 \ P
(r, θ, ϕ) 7→ (r sin ϕ cos θ, r sin ϕ sin θ, r cos ϕ),
où P = R− × {0} × R. La fonction Φ est C 1 , et bijective de R?+ ×] − π, π[×]0, π[ dans R2 \ P . Par ailleurs,
pour tout (r, θ, ϕ) ∈ R?+ ×] − π, π[×]0, π2[,
On déduit alors du théorème d’inversion globale que Φ est un C 1 -difféomorphisme de R?+ ×] − π, π[×]0, π[
vers R2 \ P . Le théorème de changement de variable assure alors que pour toute fonction f ∈ L 1 (R3 ),
Z Z Z
f dλ3 = f (x, y, z) dλ3 (x, y, z) = f (Φ(r, θ, ϕ))r2 sin ϕ dλ3 (r, θ, ϕ),
R2 R2 \P R?
+ ×]−π,π[×]0,π[
Espaces Lp
9.1 Définitions
On se place sur un espace mesuré (E, A , µ).
où K = R ou C. On note aussi ces espaces Lµp (E), L p (E), voire L p lorsque le contexte est clair.
Les fonctions de L ∞ (E) sont aussi appelées les fonctions essentiellement bornées.
Soit m est la mesure de comptage sur (N, P(N)). Pour p ∈]0, ∞[, on note
X
p
` (N) := Lm (N) = (un )n∈N ∈ K ,
p p N
|un | < ∞ .
n∈N
Proposition 9.2 – Soit p ∈]0, ∞], l’espace Lµp (E) est un sous-espace vectoriel de l’espace F (E, K).
Démonstration. On suppose d’abord p < ∞. On a bien sûr 0 ∈ L p (E). Par ailleurs, si f, g ∈ L p (E), on
remarque que
p p p p p
|f + g| 6 (|f | + |g|) 6 2p (max(|f |, |g|)) 6 2p (|f | + |g| ) .
p p R p
|f | Rdxµ + |g| dxµ < ∞, et f + g ∈ L p (E). Pour finir, si
On en déduit que |f + g|R dµ 6 2p
R R
p p p
f ∈ L p (E) et α ∈ K, alors |αf | dµ = |α| |f | dµ < ∞, donc αf ∈ L p (E).
Considérons maintenant le cas où p = ∞. On a bien sûr 0 ∈ L ∞ (E). Par ailleurs, si f, g ∈ L ∞ (E), on
sait qu’il existe C > 0 tel que |f | 6 C et |g| 6 C µ-presque partout, ce qui implique que |f + g| 6 2C
µ-p.p., et f + g ∈ L p (E). Si α ∈ K, on a de plus |αf | 6 |α|C, donc αf ∈ L ∞ (E).
Remarque 9.3 – Si 0 < p 6 ∞, alors {f : E → K, f = 0 µ-p.p.} est un sous-espace vectoriel de Lµp (E).
Définition 9.4 – Soit p ∈ [0, ∞], on introduit l’espace
On note aussi Lpµ (E), Lp (E), voire Lp lorsque le contexte est clair.
67
68 Chapitre 9 – Espaces Lp
Remarque 9.5 – On peut définir l’espace Lpµ (E) de manière équivalente en posant Lpµ (E) = Lµp (E)/ ∼,
où ∼ désigne la relation d’équivalence sur Lµp (E) définie par
f ∼g si et seulement si f = g µ-p.p.
Les éléments de Lpµ (E) sont donc des classes d’équivalence de fonctions de Lµp (E) égales µ-p.p. :
Dans la pratique, on fait l’abus d’écriture consistant à identifier un élément de Lpµ (E) à un de ses
représentants. Par extension, on dira qu’un élément de Lpµ (E) vérifie une propriété (P ) si l’un de ses
représentants vérifie (P ). On dira par exemple que f¯ ∈ Lpµ (E) est continue s’il existe g ∈ Lµp (E) continue
telle que f ∼ g, c’est-à-dire si f est presque partout égale à une fonction continue (on prendra garde à ne
pas confondre avec f est continue presque partout !).
La définition de Lpµ (E) lui confère une structure de K-espace vectoriel, muni des lois
αf¯ := αf , et f¯ + ḡ := f + g,
X N
X X N
X X
q q p q p
|un | 6 |un | + |un | 6 |un | + |un | < ∞,
n∈N n=0 n>N n=0 n∈N
et u ∈ `q (N).
9.1.2 Normes k · kp
Pour f : E → K mesurable, on note
Z 1/p
• pour 0 < p < ∞, kf kp = |f |p dµ ,
E
• kf k∞ = inf{C > 0, |f | 6 C µ-p.p.}, avec la convention kf k∞ = ∞ si {C > 0, |f | 6 C µ-p.p.} = ∅,
c’est-à-dire si f 6∈ Lµ∞ (E).
Lemme 9.8 – Si f, g : E → K mesurables et f = g µ-p.p., alors pour tout p ∈]0, ∞], kf kp = kgkp .
Démonstration. Si p < ∞, on a |f |p = |g|p µ-presque partout, donc kf kp = kgkp . Si maintenant p = ∞,
on remarque que pour tout C > 0, µ({|f | > C}) = µ({|g| > C), donc kf k∞ = kgk∞ .
9.2 Inégalités de Hölder et Minkowski 69
Remarque 9.9 – On déduit du lemme 9.8 qu’une fonction mesurable f : E → K est dans l’espace Lpµ (E)
si et seulement si kf kp < ∞.
Remarque 9.10 – Si f ∈ C (Rd ), alors kf k∞ = supx∈Rd |f (x)|.
Lemme 9.11 – Si f ∈ L∞ (E), alors |f | 6 kf k∞ µ-presque partout.
Démonstration. Par définition de l’infimum, |f | 6 kf k∞ + n1 µ-presque partout,
pour tout n ∈ N? .Comme
[ 1
({|f | > kf k∞ + n1 })n∈N? est une suite croissante de A et {|f | > kf k∞ } = |f | > kf k∞ + , on a
n>0
n
1
µ({|f | > kf k∞ }) = lim µ |f | > kf k∞ + = 0.
n→∞ n
Proposition 9.12 – S’il existe p0 ∈]0, ∞[ tel que f ∈ Lpµ0 (E), alors kf k∞ = lim kf kp .
p→∞
On en déduit le cas d’égalité de l’inégalité de Hölder quand p, q < ∞ : il y a égalité dans (9.2) si et
seulement s’il existe α, β non tous deux nuls tels que
α|f |p = β|g|q µ-presque partout.
70 Chapitre 9 – Espaces Lp
Démonstration. On commence par traiter le cas où p = ∞. Comme on sait que |f | 6 kf k∞ et |g| 6 kgk∞
µ-presque partout, on a |f + g| 6 |f | + |g| 6 kf k∞ + kgk∞ µ-presque partout, ce qui donne (9.4).
p p−1
Supposons maintenant que p ∈ [1, ∞[. Comme |f + g| 6 (|f | + |g|)|f + g| , on obtient que
Z Z Z
p p−1 p−1
|f + g| dµ 6 |f | |f + g| dµ + |g| |f + g| dµ.
E E E
On applique alors l’inégalité de Hölder dans la première intégrale aux fonctions |f | et |f + g|, avec les
exposants conjugués p et p−1
p . On fait de même dans la deuxième intégrale avec les fonctions |g| et |f + g|
et les mêmes exposants conjugués. On obtient
Z Z Z p−1 Z Z p−1
p p p p p
|f + g| dµ 6 |f | dµ |f + g| + |g| dµ |f + g| . (9.5)
E E E E E
p p p−1 p p−1
Ceci se récrit kf + gkp 6 kf kp kf + gkp + kgkp kf + gkp , ce qui donne (9.4) en divisant par
p−1
kf + gkp lorsque kf + gkp 6= 0. Dans le cas où kf + gkp = 0, l’inégalité est trivialement vérifiée.
Remarque 9.18 – En examinant le cas d’égalité dans l’inégalité (9.5), on montre aisément que l’inégalité
de Minkowski est une égalité
– si et seulement si f = 0 µ-presque partout ou g = αf pour un certain α > 0 dans le cas où p > 1,
– si et seulement si f ḡ > 0 µ-presque partout dans le cas p = 1.
Corollaire 9.19 (Inégalité de Minkowski généralisée) – Soient (fn )n∈N une suite de fonctions mesurables
positives et p ∈ [1, ∞]. On a
X X
fn 6 kfn kp .
n∈N p n∈N
Pn
Démonstration. Comme ( k=0 fk )n∈N est une suite croissante de fonctions mesurables positives, le
Pn p R Pn p R P p P p
théorème de Beppo Levi donne que k k=0 fk kp = | k=0 fk | dµ −→ k∈N fk dµ = k k∈N fk kp .
n→∞
Comme le théorème de Minkowski donne
n
X n
X
fk 6 kfk kp ,
k=0 p k=0
on déduit alors l’inégalité de Minkowski généralisée en passant à la limite pour n → ∞ dans l’inégalité
ci-dessus.
Proposition 9.20 – Si p ∈ [1, ∞], alors (Lpµ (E), k · kp ) est un espace vectoriel normé.
Démonstration. Il suffit de montrer que k · kp définit une norme sur Lpµ (E). Supposons d’abord que p < ∞,
– si kf kp = 0, alors f = 0 µ-presque partout, donc f = 0 dans Lpµ (E),
– il est clair que si α ∈ K, alors kαf kp = |α|kf kp ,
– l’inégalité triangulaire est assurée par l’inégalité de Minkowski.
Considérons maintenant le cas p = ∞,
– si kf k∞ = 0, alors |f | 6 0 donc f = 0 µ-presque partout, et f = 0 dans L∞ µ (E),
– si α ∈ K, alors |αf | 6 |α|kf k∞ µ-presque partout, donc kαf k∞ 6 |α|kf k∞ ; d’autre part,
1 1
|f | = |α| |αf | 6 |α| kαf k∞ , donc |α|kf k∞ 6 kαf k∞ ,
– l’inégalité triangulaire est assurée par l’inégalité de Minkowski.
9.3 Les espaces de Banach Lpµ (E) (1 6 p 6 ∞) 71
En appliquant à nouveau l’inégalité de Minkowski généralisée, on obtient que f ∈ Lp (E). Par ailleurs, si
n ∈ N, on a
∞ ∞ ∞
X X X 1
kf − fϕ(n) kp = (fϕ(k+1) − fϕ(k) ) 6 kfϕ(k+1) − fϕ(k) kp 6 −→ 0.
2k n→∞
k=n p k=n k=n
Ainsi, (fn )n est une suite de Cauchy dans Lp (E) qui admet une valeur d’adhérence f , donc elle converge
vers f dans Lp (E).
Si maintenant p = ∞, on s’appuie sur la complétude de l’espace Fb (E, K) des fonctions bornées de E
dans K = R ou C. Soit (fn )n∈N une suite de Cauchy dans L∞ (E). On pose
\ \
A= {|fn | 6 kfn k∞ } ∩ {|fn − fm | 6 kfn − fm k∞ },
n∈N n,m∈N
et on remarque que µ(Ac ) = 0. Ainsi, la suite (fn 1A )n∈N est une suite de Cauchy dans Fb (E, K), donc
elle converge dans Fb (E, K) vers une fonction f . Finalement, on a alors
kfn − f k∞ = kfn 1A − f k∞ −→ 0,
n→∞
d’où le résultat.
de sorte que λ(suppfn ) −→ 0, donc kfn kp −→ 0, mais pour presque tout x ∈ [0, 1], lim inf n fn (x) = 0
n→∞ n→∞
et lim supn fn (x) = 1, donc (fn (x))n ne converge pas.
En revanche, la démonstration du théorème de Riesz-Ficher permet d’affirmer que le résultat est vrai
si on s’autorise à considérer une sous-suite de (fn )n .
72 Chapitre 9 – Espaces Lp
Proposition 9.22 – Si p ∈ [1, ∞[, et (fn )n est une suite de Lpµ (E) qui converge dans Lpµ (E) vers une
fonction f ∈ Lpµ (E), alors il existe une sous-suite (fϕ(n) )n telle que
fϕ(n) −→ f µ-p.p..
n→∞
Démonstration. Comme la suite (fn )n converge dans Lpµ (E), elle est en particulier de Cauchy dans
Lpµ (E). On peut donc construire une sous-suite (fϕ(n) )n comme dans la démonstration du théorème de
Riesz-Fischer qui converge µ-presque partout vers la fonction
X
g = (fϕ(n+1) − fϕ(n) ) + fϕ(0) ∈ Lpµ (E).
n∈N
La démonstration du théorème 9.21 donne par ailleurs que (fn )n converge vers g dans Lpµ (E). Par unicité
de la limite dans Lpµ (E), on a donc f = g, ce qui conclut la preuve.
— Si maintenant f est à valeurs dans R, on sait par le point précédent qu’il existe ϕ, ψ ∈ E 1 telles que
kf + − ϕk 6 2ε et |f − − ψk 6 2ε . On a alors kf − (ϕ − ψ)kp 6 ε.
— Si f est à valeurs complexes, on sait par le point précédent qu’il existe ϕ, ψ ∈ E 1 telles que
kRe f − ϕk 6 2ε et |Im f − ψk 6 2ε . On a alors kf − (ϕ + iψ)kp 6 ε.
k·kp
Démonstration (dans le cas d = 1). D’après le lemme 9.26, il suffit de montrer que E 1 ⊂ Cc (R) . En
k·kp k·kp
p
effet, on aura alors L (R) = E1⊂ Cc (R) , ce qui conclura la preuve.
Soient f ∈ E et ε > 0. Montrons qu’il existe ϕ ∈ Cc (R) telle que kf − ϕkp 6 ε.
1
2
p1
kf − ϕn kp = n(p+1) −→ 0, d’où le résultat dans ce cas.
n→∞
— Si maintenant f = 1Ω où Ω est un ouvert de R, on sait que Ω = k∈N Ik où les Ik sont des intervalles
F
de R deux à deux disjoints. Par ailleurs, les Ik sont bornés car λ(Ik ) 6 λ(Ω) < ∞ du fait que
1Ω ∈ Lp (R).
Comme k=1 1Ik −→ 1Ω µ-p.p. et 1Ω ∈ Lp (R) (car λ(Ω) < ∞), on a 1Ω − k=1 1Ik p −→ 0
Pn Pn
n→∞ n→∞
par convergence dominée Lp . Il existe donc n tel que 1Ω − k=1 1Ik p 6 2ε .
Pn
Pn
Comme k=1 ϕk ∈ Cc (R), on a bien le résultat dans ce cas.
— Si f = 1B , où B ∈ B(R), on sait par la régularité de la mesure de Lebesgue qu’il existe un ouvert Ω
de R contenant B tel que λ(Ω \ B) 6 2ε . Par ailleurs, il existe ϕ ∈ Cc (R) telle que k1Ω − ϕkp 6 2ε .
p
On a donc
kf − ϕkp 6 λ(Ω \ B) p + k1Ω − ϕkp 6 ε.
1
— Examinons maintenant le cas général où f = i=1 αi 1Ai avec αi > 0 pour tout i. Pour tout i, il
PN
existe ϕi ∈ Cc (R) telle que k1Ai − ϕkp 6 |αiε|N , et Minkowski donne kf − i=1 αi ϕi kp 6 ε.
PN
Adaptation au cas où d est quelconque : Dans le cas où d est quelconque, La démonstration s’adapte au
cas où d est quelconque en faisant les remarques suivantes :
— On peut approcher 1P où P est un pavé borné par la suite de fonction de Cc (Rd ) donnée par
+
ϕn = (1 − nd(x, P )) .
— Si Ω est un ouvert de Rd de mesure finie, on ne peut S
pas l’écrire comme union disjointe dénombrable
de pavés bornés. En revanche, on peut écrire Ω = k Pk , où les Pk sont des pavés bornés. On a
donc comme précédemment
f − 1Snk=0 Pk p −→ 0,
n→∞
1
Sn
et il existe n tel que f − Sn
k=0 Pk p
6 2ε . Par ailleurs, on remarque que k=0 Pk peut s’écrire
FNn
comme union disjointe de pavés bornés k=0 Qk , à un ensemble λd -négligeable près. Par conséquent,
1Sn
k=0 Pk
= 1 FNn λ
Qk d
k=0
-presque partout. On peut alors conclure comme en (9.6).
CHAPITRE 10
Convolution et applications
La convolution est un outil de régularisation des fonctions, dont nous allons nous servir en particulier
pour montrer la densité des fonctions Cc∞ (Rd ) dans les espaces Lp (Rd ) pour p ∈ [1, ∞[.
Pour comprendre la définition de la convolution de deux fonctions, il faut imaginer qu’on souhaite
approcher une fonction f ∈ Lp (Rd ) sur un voisinage de x ∈ Rd par une fonction plus R régulière sur ce
voisinage. Par exemple, si on dispose d’une fonction ϕ ∈ Cc∞ (Rd ), positive, telle que Rd ϕ(x) dx = 1 et
ϕ = 0 en dehors de B(0, 1), on peut souhaiter remplacer f (x) par
Z
f (y)ϕ(x − y) dy,
Rd
qui est en fait une moyenne de f autour de x. Lorsqu’il existe, cet objet s’appelle la convolution de f et ϕ
au point x, et on le note f ? ϕ(x).
ϕ(x − ·)
ϕ
|
x
Nous allons nous intéresser aux différents cadres dans lesquels la convolution de deux fonctions est
bien définie, ainsi qu’à ses propriétés de régularisation le cas échéant.
75
76 Chapitre 10 – Convolution et applications
τa f : x ∈ Rd 7→ f (x − a).
Proposition 10.1 – Si a ∈ Rd et p ∈ [1, ∞], alors τa définit une isométrie de Lp (Rd ) dans Lp (Rd ).
Démonstration. On remarque d’abord que si f = g λd -presque partout, alors
le changement de variable y = x − a.
Si p = ∞, on conclut immédiatement en remarquant que pour tout C > 0, |f | > C µ-p.p. si et seulement
si |τa f | > C µ-p.p.
Théorème 10.2 – Si p ∈ [1, ∞[ et f ∈ Lp (Rd ), alors
kτa f − f kp −→ 0.
kak→0
Démonstration. — On suppose d’abord que f ∈ Cc (Rd ). Il existe donc R > 0 tel que f ≡ 0 sur
B(0, R)c . Soit (an )n une suite de Rd qui tend vers 0. Pour n assez grand, on a alors kan k 6 R, et
f (x − an ) − f (x) = 0 pour tout x ∈ B(0, 2R)c . Ainsi,
Z Z
p
|f (x − an ) − f (x)| dx = |f (x − an ) − f (x)|p .
Rd B(0,2R)
On note que
– par continuité de f , |f (x − an ) − f (x)|p −→ 0 pour tout x ∈ B(0, 2R),
n→∞
– pour tout n, |f (x − an ) − f (x)| 6 2kf k∞ et x 7→ 2kf k∞ ∈ Lp (B(0, 2R)),
on peut appliquer le théorème de convergence dominée Lp , qui donne
p
kτan f − f kp −→ 0,
n→∞
d’où le résultat.
— Si maintenant f ∈ Lp (Rd ) et ε > 0, on sait qu’il existe une fonction ϕ ∈ Cc (Rd ) telle que kf −ϕkp 6 3ε .
Par le point précédent, si kak est assez petit, on a kτa ϕ − ϕkp 6 3ε . On a alors
d’où le résultat.
Remarque 10.3 – Le résultat devient faux si p = ∞ : par exemple, si f = 1[0,1] ∈ L∞ (R), on a
kτa f − f k∞ = 1 dès que a 6= 0.
10.2 Convolution
10.2.1 Le cas où f, g ∈ M+
Définition 10.4 – Soient f, g : Rd → R+ deux fonctions boréliennes. On définit la convolution de f et
de g comme la fonction Z
f ? g : x ∈ Rd 7→ f (x − y)g(y) dy.
Rd
10.2 Convolution 77
On note que pour tout x ∈ Rd , la fonction y 7→ f (x − y)g(y) est borélienne comme produit de fonctions
boréliennes, donc la fonction f ? g est bien définie sur Rd .
Proposition 10.5 – Si f, g ∈ M+ , alors f ? g est borélienne, positive, et
Z Z Z
f ? g dλd = f dλd g dλd .
Rd Rd Rd
Démonstration. Les fonctions (x, y) ∈ R2d 7→ x − y et (x, y) ∈ R2d 7→ y sont continues donc boréliennes.
Par composition et produit de fonctions boréliennes, la fonction (x, y) ∈ R2d 7→ f (x − y)g(y) est donc
borélienne. Par le théorème de Fubini-Tonelli, f ? g est borélienne, et on a
Z Z Z Z Z
f ? g(x) dx = f (x − y) dx g(y) dy = f (z) dz g(y) dy ,
Rd Rd Rd Rd Rd
dans la preuve de la proposition 10.5 montrent que la fonction (y, z) 7→ f (z)g(x − y − z)h(y) est
mesurable. Le théorème de Fubini-Tonelli donne alors
Z Z Z
(f ? g) ? h(x) = g(x − z − y)h(y) dy f (z) dz = f (z) (g ? h)(x − z) dz = f ? (g ? h)(x).
Rd Rd Rd
3. Raisonnons par contraposée : supposons que x 6∈ {f 6= 0} + {g 6= 0}. Ceci se récrit : pour tout
6 0}, x−y 6∈ {f 6= 0}, c’est-à-dire f (x−y) = 0. Finalement, pour tout y ∈ Rd , f (x−y)g(y) = 0,
y ∈ {g =
ce qui donne f ? g(x) = 0 et conclut la preuve.
Exemple 10.7 – Si f = 1[− 12 , 21 ] , alors
0
si x 6 −1,
λ([− 21 , x + 12 ]) = x + 1
1 1 1 1
si − 1 6 x 6 0,
f ? f (x) = λ − , ∩ x − ,x + =
2 2 2 2
λ([x − 21 , 12 ]) = 1 − x si 0 6 x 6 1,
0 si x > 1.
On constate dès cet exemple l’effet régularisant de la convolution : f ? f est continue alors que f ne l’est
pas.
Théorème 10.8 (Convolution Lp -Lq ) – Soient p, q ∈ [1, ∞] deux exposants conjugués, si f ∈ Lp (Rd ) et
g ∈ Lq (Rd ), alors f ? g est définie sur Rd , uniformément continue et
|f ? g| 6 kf kp kgkq . (10.1)
Démonstration. On suppose sans perte de généralité que p < ∞. Si x ∈ Rd , alors l’inégalité de Hölder
donne Z 1/p Z 1/q
Z
p q
|f (x − y)g(y)| dy 6 |f (x − y)| dy |g(y)| dy = kf kp kgkq .
Rd Rd Rd
Théorème 10.10 (Convolution Lp -L1 ) – Soit p ∈ [1, ∞[. Si f ∈ Lp (Rd ) et g ∈ L1 (Rd ), alors f ? g est
définie presque partout sur Rd , f ? g ∈ Lp (Rd ). De plus,
kf ? gkp 6 kf kp kgk1 .
Démonstration. Soient f ∈ Lp (Rd ) et g ∈ L1 (Rd ). On remarque que si q ∈ [1, ∞] est l’exposant conjugué
p
à p, c’est-à-dire q = p−1 ,
Z Z
1 1
|f (x − y)g(y)| dy = |f (x − y)g(y) p | |g(y)| q dy
Rd Rd
Z p1 p−1
p
= |f (x − y)| |g(y)| dy kgk1 p ,
Rd
p
par le théorème de Fubini-Tonelli, qu’on peut appliquer du fait que (x, y) ∈ R2d 7→ |f (x − y)| |g(y)|
est mesurable. On en déduit que |f | ? |g| < ∞ presque partout, donc f ? g existe presque partout. Par
ailleurs, ce qui précède donne que (x, y) 7→ f (x − y)g(y) est intégrable sur R2d donc, par le théorème de
Fubini, f ? g est presque partout égale à une fonction borélienne. On conclut en remarquant que l’inégalité
triangulaire donne Z Z
p p p p
|f ? g(x)| dx 6 (|f | ? |g|) dx 6 kf kp kgk1 .
Rd Rd
10.2 Convolution 79
Théorème 10.11 – L’espace vectoriel L1 (Rd ) muni de la loi ? donnée par la convolution forme une
K-algèbre commutative, qui n’a pas d’unité, c’est-à-dire qu’il n’existe pas de fonction ϕ ∈ L1 (Rd ) telle que
f ? ϕ = f pour toute fonction f ∈ L1 (Rd ).
Démonstration. On montre aisément que ? est distributive par rapport à la loi +. Par ailleurs, on voit
qu’elle est commutative par un changement de variable. Pour finir, on voit que la loi ? est associative
en appliquant Fubini comme dans la proposition 10.6, après avoir appliqué Fubini-Tonelli à la fonction
(y, z) 7→ f (z)g(x − y − z)h(y).
Montrons maintenant qu’il n’existe pas d’unité pour la loi ?. On suppose que ϕ ∈ L1 (Rd ) est telle que
f ? ϕ = f presque partout pour toute fonction f ∈ L1 (Rd ), et on considère la suite (fn )n∈N de L1 (Rd )
2
définie par fn (x) = e−nkxk pour tout x ∈ Rd . Le théorème de convergence dominée donne que
Z
fn ? ϕ(0) = fn (y)ϕ(y) dy −→ 0. (10.2)
Rd n→∞
En effet, la suite (fn ϕ)n converge vers la fonction nulle presque partout, et pour tout n ∈ N, |fn ϕ| 6 ϕ
presque partout.
Par ailleurs, on remarque que pour tout n ∈ N, comme fn ∈ L∞ (Rd ), la fonction fn ? ϕ est continue sur
Rd . Ainsi, comme fn et fn ? ϕ sont égales presque partout, elles sont finalement égales sur tout Rd (sinon,
elle sont distinctes sur un intervalle non vide, ce qui est impossible). En particulier, fn ? ϕ(0) = 1 pour
tout n ∈ N, ce qui contredit (10.2)
Remarque 10.13 – Pour construire une approximation de l’unité, il suffit de disposer d’une fonction
ϕ ∈ L1 (Rd ) positive presque partout, et telle que Rd ϕ(x) dx = 1, et de poser ϕn (x) = nd ϕ(nx). En effet,
R
R
par l’inégalité de Hölder, du fait que ϕn (y) dy = 1. On en déduit que
Rd
Z Z Z
p p
|f ? ϕn (x) − f (x)| dx 6 |f (x − y) − f (x)| ϕn (y) dy dx.
Rd Rd Rd
p
Comme la fonction (x, y) ∈ R2d 7→ |f (x − y) − f (x)| ϕn (y) est mesurable, Fubini-Tonelli donne que
Z Z Z Z
p p p
|f ? ϕn (x) − f (x)| dx 6 |f (x − y) − f (x)| dx ϕn (y) dy = kτy f − f kp ϕn (y) dy.
Rd Rd Rd Rd
p
Si ε > 0, le théorème 10.2 donne l’existence de δ > 0 tel que si kyk 6 δ, alors kτy f − f kp 6 2ε . Alors,
Z Z Z
p p p
|f ? ϕn (x) − f (x)| dx 6 kτy f − f kp
ϕn (y) dy + kτy f − f kp ϕn (y) dy
Rd B(0,δ) B(0,δ)c
Z
ε p
6 + (2kf kp ) ϕn (y) dy
2 B(0,δ)c
6 ε
lorsque n est assez grand, du fait que (ϕn )n est une approximation de l’unité.
Théorème 10.15 – Si (ϕn )n∈N est une approximation de l’unité et f ∈ L∞ (Rd ) est uniformément
continue sur Rd , alors
kf ? ϕn − f k∞ −→ 0.
n→∞
Démonstration. Soient ε et δ > 0 tel que si ky − xk < δ, alors |f (y) − f (x)| < 2ε . Il suffit de reprendre la
démonstration précédente : pour tout x ∈ Rd ,
Z
|f ? ϕn (x) − f (x)| 6 |f (x − y) − f (x)|ϕn (y) dy
Rd
Z Z
= |f (x − y) − f (x)|ϕn (y) dy + |f (x − y) − f (x)|ϕn (y) dy
B(0,δ) B(0,δ)c
Z
ε
6 + 2kf k∞ ϕn (y) dy 6 ε
2 B(0,δ)c
Remarque 10.16 – Dans le cas ponctuel où f ∈ L∞ (Rd ) est continue en un point x̄ ∈ Rd , la démonstration
du théorème 10.15 donne que f ? ϕn (x) −→ f (x̄).
x→x̄
∂xi (f ? ϕ) = f ? ∂xi ϕ.
Remarque 10.18 – Une récurrence immédiate donne alors que si f ∈ L1 (Rd ) et ϕ ∈ Cck (Rd ), alors
f ? ϕ ∈ C k (Rd ), et pour tout opérateur différentiel d’ordre k, on a
D(f ? ϕ) = f ? (Dϕ).
Remarque 10.19 – On constate aisément qu’on peut en fait supposer que f ∈ L1loc (Rd ) dans le théorème
10.17 sans changer la conclusion, où L1loc (Rd ) désigne l’espace des fonctions mesurables intégrables sur
tout compact de Rd . En particulier, le point 1 de la proposition 9.7 implique que pour tout p ∈ [1, ∞],
Lp (Rd ) ⊂ L1loc (Rd ), donc le résultat tient pour les fonctions de Lp (Rd ).
Définition 10.20 – On appelle suite régularisante une approximation de l’unité (ϕn )n∈N telle que pour
tout n ∈ N, ϕn ∈ Cc∞ (Rd ).
Exemple 10.21 – On introduit la fonction ψ : Rd → R définie par
( 1
− 1−kxk
ψ(x) = e 2
si kxk < 1
0 sinon
ψ
pour tout x ∈ Rd . On pose ensuite ϕ = R , et ϕn : x 7→ nd ϕ(nx) pour tout n ∈ N. On montre
R d ψ dλ d
alors que la suite (ϕn )n∈N ainsi obtenue est une suite régularisante.
Théorème 10.22 – Pour tout p ∈ [1, ∞[, l’espace Cc∞ (Rd ) est dense dans (Lp (Rd ), k · kp ).
Démonstration. On commence par supposer que f ∈ Cc (Rd ), et on considère une suite régularisante
(ϕn )n∈N . On sait alors que pour tout n ∈ N, f ? ϕn ∈ Cc (Rd ). Par ailleurs, le théorème 10.17 donne que
f ? ϕn ∈ Cc∞ (Rd ). Pour finir, le théorème 10.14 implique que kf ? ϕn − f kp −→ 0.
n→∞
Si maintenant f ∈ Lp (Rd ) et ε > 0, on sait qu’il existe ϕ ∈ Cc (Rd ) telle que kf − ϕkp 6 2ε . Par ailleurs,
le point précédent donne l’existence de ψ ∈ Cc∞ (Rd ) telle que kϕ − ψkp 6 2ε . On déduit donc que
kf − ψkp 6 ε, ce qui conclut.
Démonstration. Il suffit de remarquer que si f ∈ Cc (Rd ) et (ϕn )n∈N est une suite régularisante, alors
f ? ϕn ∈ Cc∞ (Rd ) pour tout n ∈ N, et le théorème 10.15 donne que kf ? ϕn − f k∞ −→ 0, du fait que f
n→∞
est uniformément continue.
Bibliographie
[1] M. Briane and G. Pagès. Théorie de l’intégration, 3ème ed. Vuibert, 2004.
[2] R.M. Dudley. Real Analysis and Probability. Cambridge University Press, 2002.
[3] J. Gapaillard. Intégration pour la licence. Masson, 1997.
[4] W. Rudin. Analyse réelle et complexe, 3ème ed. Dunod, 2009.