Intl 1
Intl 1
T. Deheuvels
Table des matières
3 Mesures 15
3.1 Définitions et exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2 Propriétés des mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.3 Mesure de Lebesgue sur Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.4 Ensembles négligeables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4 Fonctions mesurables 21
4.1 Mesurabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.2 Montrer la mesurabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.3 Propriétés des fonctions mesurables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.4 Suites de fonctions mesurables à valeurs réelles . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.5 Approximation des fonctions mesurables à valeurs réelles . . . . . . . . . . . . . . . . . . . . 24
5 Intégrale de Lebesgue 27
5.1 Intégration des fonctions étagées positives . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.2 Intégration des fonctions mesurables positives . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.2.2 Théorème de Beppo Levi et conséquences . . . . . . . . . . . . . . . . . . . . . . . . 30
5.2.3 Inégalité de Markov et conséquences . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.2.4 Lemme de Fatou . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.3 Fonctions intégrables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.3.1 L’espace L 1 (E, A , µ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.3.2 Propriétés des fonctions intégrables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5.3.3 Formule de transfert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2
TABLE DES MATIÈRES 3
Dans ce cours, deux notions essentielles et fondamentalement liées seront abordées : la notion de
mesure, et la notion d’intégration. Ces notions ont en particulier une importance capitale dans les cours
de probabilités et d’analyse fonctionnelle qui suivront.
Notion de mesure
La première question abordée est celle de la mesure : étant donné un ensemble E quelconque, comment
donner un sens à la mesure d’un sous-ensemble de E ? Quelle “place” prend une partie de E dans E ? Si
on considère une propriété particulière P sur l’ensemble E, on pourrait en répondant à ces questions
mesurer l’ensemble des points de E qui vérifient P. Si cet ensemble est de mesure nulle, on pourrait alors
donner un sens à “la propriété P est vraie presque partout dans E”.
À première vue, il semble naturel de définir une mesure sur E comme une application de P(E) dans R+
qui vérifierait µ(∅) = 0, ainsi qu’une propriété d’additivité telle que : la mesure d’une union (dénombrable)
d’ensembles deux à deux disjoints est la somme des mesures de ces ensembles. En fait, nous verrons qu’il
s’avèrera utile de définir les mesures sur un sous-ensemble A de P(E). Afin que les propriétés de la
mesure aient un sens, il convient que A ait une structure particulière. Dans la pratique, on impose que A
contienne ∅ et soit stable par passage au complémentaire et par union dénombrable : c’est la notion de
tribu.
On remarque immédiatement qu’on connait déjà des mesures :
– Le “cardinal” d’un ensemble : si A ⊂ E, µ(A) est donné par le nombre d’éléments de A si A est
un ensemble fini, et +∞ sinon. On appelle cette mesure la mesure de comptage. On se rend assez
vite compte que cette mesure est beaucoup trop imprécise dès qu’on considère des ensembles non
dénombrables : mesurer des ensembles de R de cette façon n’aurait pas beaucoup d’intérêt.
– Les probabilités : il s’agit des mesures décrites plus haut auxquelles on impose de plus que µ(Ω) = 1.
On dit que ces mesures sont de masse 1.
Nous pouvons bien sûr citer également le cas de R, ou plus généralement de Rn , pour lesquels nous
souhaitons considérer la notion de longueur, ou de volume en toute généralité. Ces notions sont en général
définies en partant de la longueur des intervalles dans R, ou du volume des pavés dans Rn . Elles ne sont
toutefois pas définies a priori pour n’importe quel sous-ensemble de R ou de Rn .
Si on s’intéresse au cas de R, la question est de savoir s’il existe une mesure λ de P(R) dans R+ telle
que pour tout intervalle I d’extrémités a, b ∈ R, λ(I) = b − a. Si on travaille avec les axiomes habituels de
la théorie des ensembles, c’est-à-dire avec l’axiome du choix, la réponse à cette question est non ! Nous
détaillerons ceci plus loin.
Nous allons donc définir une mesure qui vérifie ces propriétés sur une tribu incluse dans P(R). Pour
assurer que nous pouvons mesurer assez de parties de R, nous imposerons que cette tribu contienne
au moins les ouverts de R (donc également les fermés). Nous consacrerons une partie de ce cours à
construire proprement cette mesure, et nous nous interrogerons sur la tribu sur laquelle elle est définie. La
4
TABLE DES MATIÈRES 5
construction proposée sera valable dans Rn , ce qui définira également la notion de volume.
A E
On note 1A dµ = µ(A) pour préciser que l’intégration se fait par rapport à la mesure µ. Comme il
R
est naturel de demander à l’intégrale une propriété de linéarité, on observe qu’on sait tout de suite donner
un sens à l’intégrale de fonctions du type i=1 αi 1Ai , où Ai ∈ A pour tout i :
PN
α2
α1
α3
i=1 αi 1Ai =
R PN PN
on doit avoir i=1 αi µ(Ai ). Les fonctions de ce type sont appelées les fonctions étagées.
Elles jouent dans la construction de l’intégrale de Lebesgue un rôle similaire à celui des fonctions en
escalier pour l’intégrale de Riemann. Il convient par ailleurs de noter que les fonctions en escalier sur un
intervalle de R sont exactement les fonctions étagées telles que les Ai soient tous des intervalles.
Donnons maintenant une idée de la démarche employée pour donner un sens à l’intégrale d’une fonction
f : E → R qui n’est pas nécessairement étagée. Comme nous le verrons, sous une condition dite de
mesurabilité, on peut approcher une fonction f par des fonctions étagées, que l’on sait intégrer. Une
façon de le voir est de considérer une subdivision de l’espace d’arrivée : R (à comparer avec l’intégrale de
Riemann, où on fait une subdivision de l’intervalle d’intégration) :
f
yi+1
yi
yi−1
On approche alors f par la fonction étagée i yi 1f −1 ([yi ,yi+1 [) , ce qui conduit à approcher l’intégrale
P
de
P f par−1l’intégrale de cette fonction étagée. Ceci donne la valeur approchée de −1 l’intégrale de f :
y
i i µ(f ([y , y
i i+1 [)). On note que pour que cette formule soit valide, il faut avoir f ([yi , yi+1 [) ∈ A
pour tout i. C’est une condition importante sur la fonction f , qui sera assurée par la propriété de
mesurabilité.
Il faut noter que la théorie de l’intégration de Lebesgue généralise la théorie d’intégration de Riemann :
tous les résultats propres à l’intégrale de Riemann restent vrai pour l’intégrale de Lebesgue. Nous vérifierons
ce résultat après la construction de l’intégrale de Lebesgue. En outre, la théorie de Lebesgue présente de
nombreux avantages :
6 TABLE DES MATIÈRES
– On peut intégrer davantage de fonctions. Par exemple, la fonction 1Q dont on attendrait qu’elle soit
intégrable et que son intégrale vaille 0, n’est pas Riemann-intégrable. Elle est intégrable au sens de
Lebesgue, et son intégrale est nulle.
– Les théorèmes de convergence sont vrais sous des hypothèses plus faibles. Par ailleurs, ils s’énoncent
plus simplement.
– L’intégrale de Lebesgue permet d’écrire les sommes comme des intégrales (par rapport à la mesure
de comptage). Par conséquent, tous les résultats vrais pour les intégrales le sont immédiatement
pour les séries.
– Le plus gros avantage de la théorie de Lebesgue est de permettre d’intégrer sur un ensemble différent
de R, ou Rn . les applications seront nombreuses, notamment en analyse fonctionnelle.
CHAPITRE 1
1.1 Cardinalité
Définition 1.1 – On dit que deux ensembles E et F sont équipotents s’il existe une bijection de E dans
F . On note alors E ' F ou
Card E = Card F.
On dit dans ce cas que E et F ont même cardinal (attention, il ne s’agit que d’une notation !).
Exemples –
1. N ' 2N,
2. P(E) ' F (E, {0, 1}) = {0, 1}E : l’application A ⊂ E 7→ 1A ∈ {0, 1}E est bijective.
Notation 1.3 – Soient E et F deux ensembles. S’il existe une injection de E dans F , on notera
(on prendra garde aussi à cette dernière notation). Si de plus E et F ne sont pas équipotents, on notera
E ≺ F ou Card E < Card F .
De même, lorsqu’il existe une surjection de E dans F , on notera E F ou Card E > Card F , et E F
ou Card E > Card F lorsque de plus E et F ne sont pas équipotents.
Propriétés 1.4 –
– Si Card E 6 Card F , alors Card F > Card E.
– Si Card E > Card F , alors Card F 6 Card E (AC).
Remarque 1.5 – La démonstration du deuxième point des propriétés ci-dessus repose sur l’axiome du
choix (précisé (AC) dans l’énoncé). En fait, cet énoncé est même équivalent à l’axiome du choix.
On donne deux énoncés équivalents de l’axiome du choix :
7
8 Chapitre 1 – Rappels : cardinaux et dénombrabilité
– pour tout ensemble E non vide, il existe une fonction f : P(E) → E telle que pour tout A ⊂ E
non vide, f (A) ∈ A (une telle fonction est appelée fonction choix ),
Q
– pour toute famille (Ei )i∈I d’ensembles non vides, i∈I Ei est non vide.
Théorème 1.6 (Cantor-Bernstein) – Si E et F sont deux ensembles vérifiant Card E 6 Card F et
Card F 6 Card E, alors Card E = Card F .
Remarque 1.7 – La version duale du thérème de Cantor-Bernstein (Card E > Card F et Card F >
Card E ⇒ Card E = Card F ) peut donc se montrer en utilisant l’axiome du choix. La question de savoir
si elle est équivalente à l’axiome du choix est ouverte, mais on sait qu’on ne peut pas montrer la version
duale du théorème dans l’axiomatique de Zermelo-Fraenkel.
Proposition 1.8 – Soit E est un ensemble non vide, Card E < Card P(E).
Démonstration. Supposons qu’il existe une surjection ϕ de E dans P(E). Soit A = {x ∈ E, x 6∈ ϕ(x)}.
Comme ϕ est surjective, il existe a ∈ E tel que ϕ(a) = A. Alors :
– soit a ∈ A, alors a 6∈ ϕ(a) = A, contradiction,
– soit a 6∈ A, alors a ∈ ϕ(a) = A, contradiction.
On aboutit donc à une contradiction, et il n’existe pas de surjection de E dans P(E). En considérant
l’injection x ∈ E 7→ {x} ∈ P(E), on voit par ailleur que Card E 6 Card P(E), d’où le résultat.
7. P(N) n’est pas dénombrable : Card N < Card P(N) par la proposition 1.8.
8. {0, 1}N n’est pas dénombrable : Card {0, 1}N = Card P(N).
Proposition 1.12 – Une union dénombrable d’ensembles dénombrables est dénombrable.
S
Démonstration. Soient (En )n∈N une suite d’ensembles dénombrables et E = n∈N En . Pour tout n ∈ N,
soit ϕn : N → En surjective. On introduit la fonction
ϕ : N2 → E
.
(n, m) 7→ ϕn (m)
On voit aisément que ϕ est surjective donc Card N = Card N2 > Card E, et E est dénombrable.
Théorème 1.13 – R n’est pas dénombrable.
Première démonstration. Il s’agit du célèbre procédé diagonal de Cantor. On suppose que D := [0, 1] est
dénombrable, on peut donc écrire D comme une suite : D = {xn , n ∈ N}. Pour tout n ∈ N, on note
0, x1n x2n x3n . . . une écriture décimale de xn (la suite (xkn )k peut stagner en 0 ou en 9 dans le cas où xn est
décimal). On définit alors x = 0, x1 x2 x3 . . . ∈ [0, 1] par son écriture décimale : pour tout k ∈ N,
2 si xkk = 1,
k
x =
1 sinon.
1 X yn − xn
|ϕ(y) − ϕ(x)| = n
+
3 0
n>n
3n
0
1 X yn − xn 1 X yn − xn
> − > −
3n0 n>n0
3n 3n0 n>n 3n
0
1 X 1 1 1
> − = · > 0.
3 0 n>n 3n
n 2 3n0
0
?
Alors, Card N < Card {0, 1}N 6 Card R, et R n’est pas dénombrable.
Exercice –
– Quel est le cardinal de RN ?
– Quel est le cardinal de l’ensemble O(R) des ouverts de R ?
– Quel est le cardinal des fonctions continues de R dans R ?
CHAPITRE 2
2.1 Définitions
Soit E un ensemble. On appelle classe de parties de E tout sous-ensemble de P(E).
Définition 2.1 – On appelle tribu sur E (ou σ-algèbre) une classe de partie A ⊂ P(E) telle que :
– ∅∈A,
– si A ∈ A , alors Ac ∈ A (stabilité par complémentaire),
– si An ∈ A , n ∈ N, alors n∈N An ∈ A (stabilité par union dénombrable).
S
Remarque 2.2 – Par définition, une tribu A sur E est aussi stable par intersection dénombrable : si
An ∈ A , n ∈ N,
\ [ c
An = An c
∈A.
n∈N n∈N
Exemples –
1. P(E) : tribu triviale,
2. {∅, E} : tribu grossière,
3. Si A ⊂ E, {∅, A, Ac , E} est une tribu. C’est la plus petite tribu sur E contenant A.
4. A = {A ⊂ E, A dénombrable ou Ac dénomrable} est une tribu sur E.
Démonstration. Il est clair que ∅ ∈ A et que A est stable par passage au complémentaire.
Maintenant,
S si An ∈ A pour tout n ∈ N, alors soit tous les An sont dénombrables, et
A
n n est dénombrable, soit S
il existe n0 T
tel que An0 n’est pas dénombrable, auquel cas
c c c c
(An0 ) estSdénombrable, et ( n An ) = n (An ) ⊂ (An0 ) est dénombrable. Dans les
deux cas, n An ∈ A .
Remarque 2.3 – Une intersection quelconque de tribus sur E est une tribu sur E.
Définition-Proposition 2.4 – Soit C une classe de parties de E. Il existe une plus petite tribu sur E
(au sens de l’inclusion) contenant les éléments de C . On la note σ(C ) et on l’appelle tribu engendrée par
C sur E.
En d’autres termes, pour toute tribu A sur E telle que C ⊂ A , on a σ(C ) ⊂ A .
10
2.2 Tribu borélienne 11
Exercice – Quelle est la tribu engendrée par l’ensemble {{x}, x ∈ E} des singletons de E ? (voir TD)
Il arrive fréquemment lorsqu’on est confronté à une tribu engendrée par une classe de parties C qu’on
veuille démontrer qu’une propriété vérifiée par les éléments de C reste vraie pour σ(C ) tout entière. Pour
montrer une telle chose, on pourrait vouloir essayer de décrire un élément quelconque de σ(C ) à partir
d’éléments de C . Malheureusement, il n’y a pas de procédé général pour y parvenir : un élément de
σ(C ) ne peut pas toujours être décrit comme une union dénombrable d’ensembles de C , ni comme une
intersection d’union de tels ensembles, etc. La remarque suivante suggère un procédé de démonstration
bien commode pour montrer que σ(C ) continue de vérifier une propriété vraie pour C . Nous l’utiliserons
à de nombreuses reprises dans ce cours.
Remarque 2.6 – Pour montrer que tous les éléments d’une tribu A sur E engendrée par C ⊂ P(E)
vérifient une propriété (P ), il suffit de montrer que :
– B := {B ∈ A , B vérifie (P )} est une tribu,
– ∀C ∈ C , C vérifie (P ).
Comme B ⊃ C , on aura alors B ⊃ σ(C ) = A . On aura souvent recours à ce type de raisonnement pour
monter des propriétés générales sur une tribu engendrée par une classe de parties simple.
Définition 2.7 – Soit T une classe de parties de E. On dit que T est une topologie sur E si
– ∅, E ∈ T ,
– T est stable par union quelconque,
– T est stable par intersection finie.
On appelle alors ouverts de E des éléments de la topologie T , et fermés les complémentaires des ensembles
de T . On dit alors que (E, T ) est un espace topologique.
Remarque 2.9 – Une intersection quelconque de topologies sur E est encore une topologie sur E. On en
déduit que si C est une classe de parties de E, il existe une plus petite topologie sur E contenant C : il
s’agit tout simplement de l’intersection des topologies sur E qui contiennent C . On l’appelle topologie
engendrée par C .
Remarque 2.11 – Par définition, B(E) est aussi la tribu engendrée par les fermés de E.
12 Chapitre 2 – Tribus, tribu borélienne
En général, B(E) 6= P(E). C’est par exemple le cas pour E = R. Nous verrons en effet plus loin
qu’il est facile de construire des parties de R qui ne sont pas boréliennes, en ayant recours à l’axiome
du choix. Il est en fait possible d’exhiber de telles parties sans utiliser l’axiome du choix, mais leur
construction n’est pas triviale.
En fait, on peut montrer (sans axiome du choix) le résultat plus général :
Ce résultat est assez difficile, et sa démonstration repose sur une récurrence sur les ordinaux.
On déduit donc que Card B(R) < Card P(R). Autrement dit, les boréliens occupent une place
minuscule parmi les parties de R. Dans la pratique, il sera pourtant tout à fait satisfaisant de se
limiter à travailler dans les boréliens : en témoigne la difficulté de construire des ensembles non
boréliens !
Boréliens de R, de Rd
Nous allons donner d’autres classes de parties de R ou de Rd qui engendrent les boréliens. Leur intérêt
est que leurs éléments sont plus simples que les ouverts en général. Ce point peut s’avérer très utile, en
particulier dans l’esprit de la remarque 2.6.
Démonstration. — Si α, β ∈ Q et α < β, ]α, β[∈ O(R), donc σ {]α, β[, α < β, α, β ∈ Q} ⊂ B(R).
D’autre part, si α, β ∈ Q,
\ 1
]α, β[ = ] − ∞, β[\] − ∞, α] = ] − ∞, β[\ −∞, α +
?
n
n∈N
La propriété de stabilité par translation suivante sera utile pour définir proprement la mesure de
Lebesgue.
Démonstration. Soit a ∈ Rd , on pose A = {B ∈ B(Rd ), B + a ∈ B(Rd )}. Il est clair que A contient
O(Rd ). Par ailleurs, A est une tribu sur Rd :
∅∈A,
si B ∈ A , alors B c + a = (B + a)c ∈ B(Rd ),
si Bn ∈ A , n ∈ N, alors n (Bn + a) ∈ B(R ).
S S d
n Bn + a =
Nous verrons plus loin une manière plus directe de montrer ce résultat, à l’aide de la notion de fonction
mesurable.
2.3 Tribu image réciproque, tribu image 13
Boréliens de R
R = R ∪ {−∞, +∞}.
−∞ 6 x 6 +∞, ∀x ∈ R.
On munit ensuite R de la topologie engendrée par O(R) ∪ {[−∞, a[, a ∈ R} ∪ {]b, +∞], b ∈ R}. On peut
alors montrer le résultat suivant.
f −1 (C ) = {f −1 (C), C ∈ C }.
{i−1 (B), B ∈ B} = {A ∩ B, B ∈ B}
Définition 2.18 – Si A est une tribu sur E, on appelle tribu image de A par f la tribu sur F
{B ⊂ F, f −1 (B) ∈ A }.
14 Chapitre 2 – Tribus, tribu borélienne
Remarque 2.20 – Les deux classes de parties de (2.1) sont des tribus sur E : σ(f −1 (C )) est la tribu sur
E engendrée par la classe de parties f −1 (C ), et f −1 (σ(C )) est la tribu image réciproque de la tribu σ(C )
par f .
Démonstration. — On remarque d’abord que f −1 (C ) ⊂ f −1 (σ(C )). Comme f −1 (σ(C )) est une tribu
contenant la classe de parties f −1 (C ) ⊂, elle contient la tribu qu’elle engendre, ie σ(f −1 (C )) ⊂
f −1 (σ(C )).
— Montrons la deuxième inclusion. Il suffit de montrer que pour tout B ∈ σ(C ), f −1 (B) ∈ σ(f −1 (C )).
On note B = {B ⊂ F, f −1 (B) ∈ σ(f −1 (C ))}. B est la tribu image par f de la tribu σ(f −1 (C )).
C’est donc une tribu, et on remarque immédiatement qu’elle contient C , elle contient donc σ(C ), ce
qui achève la démonstration.
CHAPITRE 3
Mesures
pour tout A ⊂ E est une mesure sur (E, P(E)), appelée mesure de comptage.
– Mesure de Dirac : si x ∈ E, δx définie par
1 si x ∈ A,
δx (A) = 1A (x) =
0 sinon,
pour tout A ∈ A est une mesure sur (E, A ) appelée mesure de Dirac au point x ∈ E.
– Si µ est une mesure sur (E, A ) et B ∈ A , alors ν : A → R+ définie par ν(A) = µ(A ∩ B) pour tout
A ∈ A est aussi une mesure sur (E, A ).
Définition 3.2 (Mesures finies, mesures σ-finies) –
– On dit qu’une mesure µ est une mesure finie si µ(E) < ∞. On appelle alors µ(E) la masse de µ.
Si µ est de masse 1, on dit que µ est une mesure de probabilité sur E, et on dit que (E, A , µ) est un
espace probabilisé.
15
16 Chapitre 3 – Mesures
– On dit qu’une mesure µ est σ-finie s’il existe une suite (En )n de A telle que E =
S
n En et
µ(En ) < ∞ pour tout n.
Exemple 3.3 – La mesure de comptage mSsur (N, P(N)) est σ-finie. En effet, pour tout n ∈ N,
m([|0, n|]) = n + 1 < ∞, et on a bien sûr N = n [|0, n|].
Remarque 3.4 – Si pour tout n ∈ N, µn est une mesure sur (E, A ), alors n µn est aussi une mesure
P
sur (E, A ) (exercice).
n αn δxn est une mesure sur (E, A ). On note ainsi
P
Par exemple, si (αn )n∈N ∈ RN + et (xn )n∈N ∈ E , alors
N
Démonstration. A et B \ A appartiennent à A et sont disjoints, donc µ(B) = µ(A) + µ(B \ A) > µ(A).
Si µ(A) < ∞, alors µ(B) − µ(A) = µ(B \ A).
Sn−1
Démonstration. Pour tout n, on pose Bn = An \ k=0 Ak . On note que pour tout n, Bn ∈ A , et que
B n ⊂ An .
– Les Bn sont deux à deux disjoints : si m < n, Bm ⊂ Am et Bn ∩ Am = ∅, d’où Bm ∩ Bn = ∅.
F S S Sn0 −1
– n Bn = n An : si x ∈ n An , soit n0 = min{n, x ∈ An }, alors x ∈ An0 \ k=0 Ak = Bn0 . La
deuxième inclusion est évidente.
En conséquence, [ G X X
µ An = µ Bn = µ(Bn ) 6 µ(An ).
n∈N n∈N n∈N n∈N
Démonstration.
3.3 Mesure de Lebesgue sur Rd 17
S
1. Notons d’abord que s’il existe n0 tel que µ(An0 ) = ∞, alors µ( n An ) = ∞, et µ(An ) = ∞ à partir
d’un certain rang, d’où le résultat.
Sinon, on introduit la suite (Bn ) définie par B0 = A0 , et pour tout n > 1, Bn = An \ An−1 . Il s’agit
en fait de la même suite que celle S construiteFdans la démonstration précédente. En particulier, les
Bn sont deux à deux disjoints, et n An = n Bn . Par conséquent,
[ G X ∞ n
X
µ An = µ Bn = µ(Bn ) = lim µ(Ak ) − µ(Ak−1 ) + µ(A0 ) = lim µ(An ).
n→∞ n→∞
n n n=0 k=1
2. Quitte à considérer la suite (An0 +n )n∈N , on peut supposer que µ(A0 ) < ∞. Comme (A0 \ An )n est
une suite de A croissante pour l’inclusion, on peut lui appliquer le résultat précédent. On obtient
alors [ \
lim µ(A0 \ An ) = µ A0 \ An = µ A0 \ An .
n→∞
n n
T
Comme µ(A0 ) < ∞, on en déduit que limn µ(A0 ) − µ(An ) = µ(A0 ) − µ( n An ), ce qui donne le
résultat.
Remarque 3.8 – L’existence de n0 avec µ(An0 ) < ∞ est nécessaire : si on considère les ensembles
An = [|n, ∞[| pour n ∈ N, la suite (ATn )n est décroissante, et on a n An = ∅. Si on munit (N, P(N)) de
T
la mesure de comptage m sur N, m( n An ) = 0, mais pour tout n, m(An ) = ∞.
On peut construire un exemple semblable avec la mesure de Lebesgue en posant An = [n, ∞[.
Exercice (voir TD) – Montrer qu’une application µ : A → R+ est une mesure sur l’espace mesurable
(E, A ) si et seulement si :
(i) µ(∅) = 0,
(ii) µ est finiment additive : si A, B ∈ A et A ∩ B = ∅, alors µ(A t B) = µ(A) + µ(B),
(iii) µ est continue à gauche.
`(I) = b − a.
Théorème 3.9 – Soit d ∈ N? . Il existe une unique mesure λd sur (Rd , B(Rd )) telle que :
– λd ([0, 1]d ) = 1,
18 Chapitre 3 – Mesures
∀x ∈ R, ∀B ∈ B(Rd ), λd (B + x) = λd (B).
Remarque 3.11 – Une conséquence immédiate est que tout ensemble dénombrable D de R est de mesure
de Lebesgue nulle : tout d’abord, D est un borélien comme union dénombrable de singletons, puis
G X
λ(D) = λ {x} = λ({x}) = 0.
x∈D x∈D
Attention toutefois, la réciproque est fausse : il existe des boréliens de R de mesure nulleTqui ne sont
pas dénombrables. C’est le cas par exemple de l’ensemble de Cantor K, défini par K = n∈N Kn , où
K0 = [0, 1], et Kn+1 = K3n ∪ Kn3+2 pour tout n ∈ N (le vérifier en exercice !).
Plus généralement, si P est un pavé de Rd , alors λd (P ) = V (P ). Pour le voir il suffirait d’adapter la
preuve ci-dessus dans le cas d = 1. Nous verrons par ailleurs plus loin que λd peut s’interpréter comme
une mesure produit, ce qui simplifie beaucoup la preuve de ce résultat.
Nous avons vu que bien que les ouverts engendrent les boréliens, il n’est pas aisé du tout d’exprimer
un borélien quelconque à partir d’ouverts ou de fermés. Pourtant, nous allons voir que pour n’importe
quel borélien B de Rd , on peut trouver un ouvert contenant B et un fermé inclus dans B dont la mesure
est arbitrairement proche de celle de B. Il s’agit de la propriété de régularité de la mesure de Lebesgue
sur Rd .
La propriété proprement dite est énoncée dans le théorème 3.13 ci-dessous, et repose sur le lemme
ci-dessous.
Lemme 3.12 – Soient B ∈ B(Rd ) et ε > 0. Il existe un fermé F et un ouvert Ω de Rd tels que F ⊂ B ⊂ Ω
et λd (Ω \ F ) < ε.
Démonstration. Soient n ∈ N et λnd la mesure sur (Rd , B(Rd )) définie par λnd (B) = λd (B∩] − n, n[d ) pour
tout B ∈ B(Rd ). Nous allons d’abord montrer le résultat pour la mesure λnd . Pour ce faire, on introduit la
classe de parties
Nous allons montrer que B est une tribu contenant les pavés ouverts bornés de Rd . Comme cette classe
de parties engendre B(Rd ), ceci montrera que B = B(Rd ), et donnera le résultat pour la mesure λnd .
– On remarque d’abord que ∅ ∈ B : il suffit de prendre F = Ω = ∅.
– Ensuite, si B ∈ B, alors B c ∈ B : si F et Ω sont les ensembles associés à B pour un ε > 0, alors
Ωc ⊂ B c ⊂ F c . Comme Ωc est fermé, F c est ouvert, et λnd (F c \ Ωc ) = λnd (Ω \ F ) < ε.
– Pour finir, si (Bk )k∈N est une suite d’éléments de B et ε > 0, on sait qu’on peut construire une
suite de fermés (Fk )k∈N et une suite d’ouverts (Ωk )k∈N telles que pour tout k ∈ N, Fk ⊂ Bk ⊂ Ωk et
ε
λnd (Ωk \ Fk ) < 2k+2 .
SK
On introduit ensuite l’ouvert Ω = k∈N Ωk et les fermés F K = k=0 Fk pour tout K ∈ N. On
S
remarque qu’on a alors
[ [
[ X ε
λnd Ω \ FK = λnd Ω \ Fk 6 λnd Ω k \ Fk 6 λnd (Ωk \ Fk ) < .
2
K k k k∈N
On observe ensuite que, comme la suite (Ω \ FK )K∈N est décroissante et la mesure λnd est finie, on a
\
[ ε
lim λnd (Ω \ FK ) = λnd Ω \ FK = λnd Ω \ FK < .
K→∞ 2
K∈N K∈N
n K K
S
S conséquent, il existe K ∈ N tel que λd (Ω \ F ) < ε. Comme on a F ⊂
Par k Bk ⊂ Ω, on a bien
B
k k ∈ B.
Nous venons de montrer que B Qdest une tribu. Pour voir qu’elle contient les pavés ouvertsQd bornés, il suffit
de se donner un tel pavé P = i=1 ]ai , bi [ et un réel ε > 0, et de choisir Ω = P , et F = i=1 [ai + η, bi + η],
Qd Qd
où η ∈]0, min( bi −a
2 )[ est choisi assez petit pour avoir
i
i=1 (bi − ai ) − i=1 (bi − ai − 2η) < ε.
Nous allons maintenant en déduire le résultat pour la mesure λd . Donnons-nous B ∈ B(Rd ) et ε > 0, et
commençons par montrer qu’il existeSun ouvert Ω de Rd tel que λd (Ω \ B) < 2ε . Pour n ∈ N, on pose
Bn = B∩] − n, n[d , de sorte que B = n Bn . Le résultat précédent permet d’affirmer que pour tout n, il
ε
existe un ouvert Ωn tel que Bn ⊂ Ωn et λnd (Ωn \ Bn ) < 2n+2 . Quitte à remplacer Ωn par Ωn ∩] − n, n[,
ε
on peut
S supposer que Ω n ⊂] − n, n[, ce qui donne en fait λ(Ω n \ Bn ) < 2n+2 . En introduisant l’ouvert
Ω = n Ωn , on a donc B ⊂ Ω, et
[ X ε
λ(Ω \ B) 6 λ Ωn \ B n 6 λ(Ωn \ Bn ) < ,
n n
2
Théorème 3.13 – La mesure λd est régulière, c’est-à-dire que pour tout B ∈ B(Rd ),
i. λ(B) = inf{λ(Ω), Ω ⊃ B, Ω est ouvert},
ii. λ(B) = sup{λ(K), K ⊂ B, K est compact}.
Démonstration. Si B ∈ B(Rd ) est tel que λ(B) < ∞, alors pour tout ε, le lemme 3.12 affirme qu’il existe
un ouvert Ω ⊃ B tel que λ(B) 6 λ(Ω) 6 λ(B) + ε. En passant à l’infimum sur les ouverts contenant B, et
en laissant tendre ε vers 0, on obtient i. Par ailleurs, si λ(B) = ∞, alors i. est trivialement vérifié.
De même que ci-dessus, le lemme 3.12 montre que λ(B) = sup{λ(F ), F ⊂ B, K est fermé}. Or, si F est
un fermé vérifiant F ⊂ B et Kn = F ∩ [−n, n]d pour tout n ∈ N, alors limn→∞ λd (Kn ) = λd (F ), ce qui
montre que sup{λ(F ), F ⊂ B, K est fermé} = sup{λ(K), K ⊂ B, K est compact}.
Nous verrons au chapitre 6 une autre preuve de ce résultat, basée sur la définition de la mesure de
Lebesgue.
20 Chapitre 3 – Mesures
On dit qu’une propriété P sur E est vraie µ-presque partout sur E (on note µ-p.p.) si
Lorsque le contexte est clair, on dira aussi que P est vraie presque partout (on note p.p.). À titre
d’exemples :
– la fonction 1Q est nulle λ-presque partout,
– la fonction 1[0,∞[ : R → R est continue λ-presque partout,
– la suite de fonction (1[0, n1 ] ) ?
converge λ-presque partout vers 0.
n∈N
Remarque 3.15 – Revenons sur les deux premiers exemples ci-dessus : les fonctions 1Q et 1R+ sont
toutes deux continues λ-presque partout, mais seule la première est égale presque partout à une fonction
continue (la fonction nulle). Il faudra prendre garde à ne pas confondre ces deux propriétés.
Si (E, A , µ) est un espace mesuré et A ∈ A est tel que µ(A) = 0, la propriété de croissance de la
mesure semble suggérer qu’on sait donner un sens à la mesure de tout sous-ensemble de A, et que cette
mesure devrait être nulle. En d’autres termes, tout ensemble µ-négligeable devrait avoir une mesure nulle
également. Il peut arriver cependant qu’un tel sous-ensemble n’appartienne pas à la tribu A , et ne puisse
donc être associé à une mesure. On dit alors que l’espace mesuré n’est pas complet. Nous verrons plus loin
que c’est le cas par exemple de l’espace mesuré (R, B(R), λ).
Toutefois, nous verrons au paragraphe 6.3 qu’on peut toujours introduire une tribu Afcontenant A ,
et prolonger la mesure µ en une mesure µ̃ sur (E, Af) de manière à obtenir un espace mesuré complet. De
cette façon, nous prolongerons la tribu B(R) en une tribu B(R) e qui vérifiera Card B(R)
e = Card P(R).
On appelle B(R) la tribu de Lebesgue.
e
CHAPITRE 4
Fonctions mesurables
Dans l’introduction, nous avons évoqué une condition pour pouvoir définir l’intégrale d’une fonction
f : E → R avec l’approche de la théorie de Lebesgue, où (E, A ) est un espace mesurable. La condition
que nous avons rencontrée peut se formuler de la manière suivante :
Il s’agit précisément de la propriété de mesurabilité de la fonction f , comme nous allons le voir. Cette
condition sera cruciale pour pouvoir associer à f une intégrale sur E.
Plus généralement, dans ce chapitre, (E, A ) et (F, B) désigneront deux espaces mesurables, et f une
fonction de E dans F . La condition de mesurabilité sur f impose que f −1 (B) ∈ A pour tout B ∈ B.
Nous allons voir comment montrer qu’une fonction donnée est mesurable, ainsi que les propriétés de ces
fonctions.
4.1 Mesurabilité
Définition 4.1 – Une fonction f : E → F est dite (A , B)-mesurable, ou plus simplement mesurable ssi
f −1 (B) ⊂ A . Autrement dit,
∀B ∈ B, f −1 (B) ∈ A .
Si les ensembles E et F sont des espaces topologiques munis de leurs tribus boréliennes respectives, on
appelle les fonctions mesurables des fonctions boréliennes.
Souvent, l’espace d’arrivée F est R, R+ , R, C, ou Rd . Dans ce cas, sauf mention contraire, il sera sous-
entendu que F est muni de sa tribu borélienne.
Exemples
A ) → (F, B) sont mesurables : si f ≡ c ∈ F sur E tout entier, alors
– Les fonctions constantes f : (E,
∅ si c 6∈ B
pour tout B ∈ B, f −1 (B) = . Dans tous les cas, f −1 (B) ∈ A .
E si c ∈ B
– Soit A ⊂ E, alors la fonction 1A : (E, A ) → (R, B(R)) est mesurable si et seulement si A ∈ A .
Remarque 4.2 – Dans le cas où A = P(E), toutes les fonctions de (E, A ) dans (F, B) sont mesurables.
C’est le cas par exemple des suites de réels, qui peuvent être vues comme des fonctions de (N, P(N)) dans
(R, B(R)).
21
22 Chapitre 4 – Fonctions mesurables
Mesure image
définit une mesure sur (F, B), qu’on appelle mesure image par f de µ.
Démonstration. On remarque tout d’abord que µf est bien définie du fait que f est mesurable, et définit
bien une application de B dans R+ . Par ailleurs, µ(f −1
F (∅)) = µ(∅) F = 0, et si (B Pn )n est une suite
d’ensembles deux à deux disjoints de B, alors µ(f ( n Bn )) = µ( n f −1 (Bn )) = n µf (Bn ), d’où le
−1
résultat.
Proposition 4.4 – On suppose que B = σ(C ) pour C ⊂ P(F ). Alors, f : (E, A ) → (F, B) est
mesurable si et seulement si f −1 (C ) ⊂ A .
Démonstration. Il suffit de remarquer que si I est un intervalle de R, alors f −1 (I) est un intervalle de R,
donc un borélien. Comme les boréliens de R sont engendrés par les intervalles, f est mesurable.
D’après la proposition 2.12, f : (E, A ) → (R, B(R)) est mesurable si et seulement si l’une des propriétés
suivantes est vérifiée :
∀a ∈ R, {f < a} ∈ A , ∀a ∈ R, {f 6 a} ∈ A ,
∀a ∈ R, {f > a} ∈ A , ∀a ∈ R, {f > a} ∈ A .
La même remarque vaut pour le cas où l’espace d’arrivée est R : pour montrer que f : (E, A ) → (R, B(R))
est mesurable, il suffit par exemple de vérifier que {f 6 a} := f −1 ([−∞, a]) ∈ A pour tout a ∈ R.
Continuité et mesurabilité
On considère deux espaces topologiques (E, T ) et (F, S ), que l’on munit de leurs tribus boréliennes
respectives B(E) et B(F ).
Proposition 4.6 – Une fonction f : E → F continue est borélienne (i.e.(B(E), B(F ))-mesurable).
Démonstration. Comme f est continue, on sait que si Ω est un ouvert de F , alors f −1 (Ω) est un ouvert
de E, donc un borélien de E. Ainsi, f −1 (S ) ⊂ B(E), et f est borélienne d’après la proposition 4.4.
4.3 Propriétés des fonctions mesurables 23
Application 4.7 – La proposition 4.6 fournit une nouvelle démonstration de la proposition 2.14, qui
dit que la tribu B(Rd ) est stable par translation. En effet, si a ∈ Rd et f : x ∈ Rd 7→ x − a, alors
B + a = f −1 (B) ∈ B(Rd ), du fait que f est continue donc borélienne.
On dit qu’une fonction f : E → R est semi-continue inférieurement (s.c.i) si pour tout a ∈ R, l’ensemble
{f 6 a} est fermé. On dit par ailleurs que f est semi-continue supérieurement (s.c.s) si pour tout a ∈ R,
l’ensemble {f > a} est fermé.
Proposition 4.8 – Les fonctions s.c.i. et les fonctions s.c.s. sont des fonctions boréliennes.
Démonstration. C’est immédiat : pour tout a ∈ R, {f 6 a} est un borélien, donc f est mesurable.
On remarque que
f −1 (I1 × I2 ) = f1 −1 (I1 ) ∩ f2 −1 (I2 ) ∈ A
car les fi sont mesurables. La proposition 4.4 implique donc que f est mesurable.
Proposition 4.12 – Si f et g sont des fonctions mesurables de (E, A ) dans (R, B(R)), alors
1. αf + g est mesurable, pour tout α ∈ R,
2. f g est mesurable.
En d’autres termes, les fonctions mesurables de (E, A ) dans (R, B(R)) forment une R-algèbre.
Démonstration. 1. On peut écrire αf + g = ψ ◦ ϕ, où ϕ(x) = (f (x), g(x)) ∈ R2 pour tout x ∈ R, et
ψ(x, y) = αx + y pour tout (x, y) ∈ R2 .
La fonction ψ est continue de R2 dans R, donc elle est (B(R2 ), B(R))-mesurable. Comme f et g
sont mesurables, la proposition 4.11 implique que la fonction ϕ est mesurable. Par conséquent, la
fonction αf + g est mesurable comme composée de fonctions mesurables.
2. On raisonne de même en prenant ψ : (x, y) 7→ xy, qui est aussi continue.
Exemple 4.13 – Les fonctions de la forme i=1 αi 1Ai , où αi ∈ R et Ai ∈ A pour tout i = 1, . . . , N ,
PN
sont des fonctions mesurables, comme combinaisons linéaires de fonctions mesurables. On les appelle des
fonctions étagées.
Proposition 4.14 – Si f : (E, A ) → (C, B(C)), f est mesurable si et seulement si Re f et Im f le
sont, et les points 1. (avec α ∈ C) et 2. de la proposition 4.12 restent vrais.
Démonstration. Si Re f et Im f sont mesurables, il suffit de remarquer que Re f + iIm f = ψ ◦ ϕ, où
ϕ(x) = (Re f (x), Im f (x)) pour tout x ∈ R, et ψ(x, y) = x + iy pour tout (x, y) ∈ R2 . Comme ϕ est
mesurable, et ψ est continue donc mesurable, on obtient que f est mesurable.
Si f est mesurable, il suffit de voir que Re f = Re ◦ f et Im f = Im ◦ f . Comme Re et Im sont des
fonctions continues de C dans R, on obtient bien que Re f et Im f sont mesurables.
Les points 1. et 2. de la proposition 4.12 dans le cas présent s’obtiennent avec la même démonstration.
24 Chapitre 4 – Fonctions mesurables
Rappel. Si (an )n∈N est une suite de R, on remarque que (inf k>n ak )n est une suite croissante, et que
(supk>n ak )n est une suite décroissante. On note
Démonstration. 1. Soit a ∈ R, on a :
— {inf n fn < a} = n {fn < a} ∈ A car les fn sont mesurables, donc inf n fn est mesurable,
S
— {supn fn 6 a} = n {fn 6 a} ∈ A car les fn sont mesurables, donc supn fn est mesurable.
T
2. Il suffit de remarquer que lim inf n fn = supn (inf k>n fk ). Par le point précédent, les fonctions
gn := inf k>n fk sont mesurables, donc supn gn est mesurable.
De même, on remarque que lim supn fn = inf n (supk>n fk ) et on conclut de la même manière.
3. Il suffit de remarquer que si la suite (fn )n converge simplement vers f , alors f = lim inf n fn , et le
point précédent permet de conclure.
Remarque 4.16 – On peut en fait montrer un résultat plus général dans le cadre des fonctions à valeurs
dans un espace métrique F : si (fn )n est une suite de fonctions mesurables de E dans F qui converge
simplement vers une fonction f , alors f est mesurable. Notons par ailleurs que le résultat devient faux
dans le cadre plus général des fonctions à valeurs dans un espace topologique quelconque.
Définition 4.17 – On appelle fonction étagée sur E toute fonction mesurable ϕ : E → R qui ne prend
qu’un nombre fini de valeurs.
Notons que si ϕ : E → R est une fonction étagée, et si on note α1 , . . . , αN ses valeurs distinctes, alors
ϕ s’écrit
N
αi 1{ϕ=αi } .
X
i=1
4.5 Approximation des fonctions mesurables à valeurs réelles 25
Plus généralement, on voit immédiatement que les fonctions étagées sur E sont exactement les fonctions
de E dans R qui s’écrivent sous la forme
N
αi 1Ai , où αi ∈ R et Ai ∈ A pour tout i ∈ J1, N K.
X
i=1
Quitte à poser Ai = {ϕ = αi }, on peut par ailleurs toujours supposer que les Ai forment une partition de
E dans cette écriture. Dans la suite, on fait toujours cette hypothèse lorsqu’on écrit une fonction étagée
sous cette forme.
On note E l’ensemble des fonctions étagées de E dans R, et E+ le sous-ensemble de E formé des
fonctions à valeurs positives.
Proposition 4.18 – Soit f : E → R une fonction mesurable positive. Il existe une suite (ϕn )n∈N de
fonctions de E+ telles que
– (ϕn )n est croissante,
– pour tout x ∈ E, ϕn (x) −→ f (x).
n→∞
De plus, si f est bornée, alors la convergence de (ϕn )n∈N vers f est uniforme.
On note d’abord que ϕn ∈ E+ pour tout n : les fonctions ϕn ont un nombre fini de valeurs, et sont
mesurables car f l’est.
– La suite (ϕn ) converge simplement vers f : si x ∈ E est tel que f (x) = ∞, alors ϕn (x) = n pour
tout n, donc ϕn (x) → ∞ = f (x). Si f (x) < ∞, alors pour n assez grand, il existe k 6 n2n − 1 tel
que k 6 2n f (x) < k + 1, donc |f (x) − ϕn (x)| = |f (x) − 2kn | 6 21n → 0.
– Montrons maintenant que la suite est croissante. Soit n ∈ N,
- si f (x) > n + 1, alors ϕn (x) = n < n + 1 = ϕn+1 (x),
- si f (x) < n, on note k l’entier tel que 2kn 6 f (x) < k+12n , on a alors ϕn (x) =
k
2n . Comme
2k 2k
f (x) > 2n+1 , on en déduit que ϕn+1 (x) > 2n+1 = ϕn (x).
k k+1
- si n 6 f (x) < n + 1, alors ϕn (x) = n, et il existe k > n2n+1 tel que 2n+1 6 f (x) < 2n+1 , donc
ϕn+1 (x) > n = ϕn (x).
1
Si f est bornée et N > kf k∞ , alors pour tout n > N , on a kf − ϕn k∞ 6 2n , ce qui montre que (ϕn )
converge uniformément vers f .
Remarque 4.19 – Dans le cas où f est seulement supposée mesurable, il existe une suite de fonctions
étagées qui converge simplement vers f . Si la fonction f est bornée, la convergence est uniforme.
Pour voir ce résultat, il suffit de modifier la construction de la suite (ϕn ) dans la preuve de la proposition
4.18, en posant
n
n2 −1
k
1 k − n1{f <−n} + n1{f >n} .
X
ϕn = k+1
n { 2n 6f < 2n }
n
2
k=−n2
Parmi les applications de ce résultat, on donne une démonstration du théorème de Lusin qui précise le
lien entre fonctions mesurables et fonctions continues. Comme nous l’avons vu au paragraphe 4.2, une
fonction continue de R dans R est toujours mesurable pour la tribu borélienne. Il va sans dire que la
réciproque est fausse : nous avons déjà rencontré des fonctions de R dans R mesurables et discontinues.
Néanmoins, le théorème suivant permet de mettre en avant un fort lien entre continuité et mesurabilité.
Théorème 4.20 (Théorème de Lusin) – Soit f : R → R mesurable. Pour tout ε > 0, il existe un fermé
F de R tel que λ(F c ) < ε et f|F est continue.
26 Chapitre 4 – Fonctions mesurables
Démonstration. On commence par prouver le résultat dans le cas où f = 1A , où A est un borélien de R.
Le lemme 3.12 donne l’existence d’un fermé F1 et d’un ouvert Ω tels que F1 ⊂ A ⊂ Ω et λ(Ω \ F1 ) < ε.
On pose F2 = Ωc , et on introduit le fermé F = F1 ∪ F2 .
Nous allons montrer que f est continue sur F . On considère x ∈ F et une suite (xn ) de F qui converge
vers x. Si x ∈ F1 , alors xn ∈ F1 à partir d’un certain rang : sinon, (xn ) admet une sous-suite dans F2
dont la limite x n’est pas dans F2 , ce qui contredit le caractère fermé de F2 . Ainsi, à partir d’un certain
rang, f (xn ) = 1 = f (x). De même, si x ∈ F2 , alors f (xn ) = 0 = f (x) à partir d’un certain rang.
On en déduit que si f est étagée, alors le théorème est vrai. En effet, si f = i=1 αi 1Ai , où les Ai sont
PN
boréliens, alors il existe des fermés F1 , . . . , FN tels que λ(Fi c ) < Nε et fi est continue sur Fi pour tout i.
TN PN
Si on pose F = i=1 Fi , alors f est continue sur F , et λ(F c ) 6 i=1 λ(Fi c ) < ε.
Supposons maintenant que f est mesurable bornée. On sait alors qu’il existe une suite (fn )n∈N? de
?
fonctions étagées qui converge uniformément vers f . Pour
c ε
T tout n ∈ N , il existe un fermé Fn tel que
λ(Fn ) < 2n et fn est continue sur Fn . En posant F = n Fn , on a f continue sur F car les fn sont
continues et convergent uniformément vers f sur F . D’autre part, λ(F c ) 6 n∈N? λ(Fn c ) < ε.
P
Maintenant, si f n’est pas bornée, on pose g = arctan. On remarque que g ◦ f est mesurable et bornée,
donc il existe un fermé F tel que g ◦ f est continue sur F et λ(F c ) < ε. Comme f = tan(g ◦ f ), on en
déduit que f est continue sur F .
Ce résultat se généralise à des espaces topologiques séparés localement compacts.
CHAPITRE 5
Intégrale de Lebesgue
Dans tout le chapitre, on se place sur un espace mesuré (E, A , µ), et K désigne R ou C. Nous allons
définir l’intégrale d’une fonction mesurable de E dans C, lorsqu’elle existe. Dans ce but, nous commencerons
par définir l’intégrale des fonctions étagées positives, puis des fonctions mesurables positives. La définition
de l’intégrale des fonctions intégrables à valeurs dans R ou C s’en déduira.
i=1
où α1 , . . . , αN désignent les valeurs (deux à deux distinctes) de ϕ. Notons que les ensembles Ai = {ϕ = αi }
sont bien des éléments de A , du fait que ϕ est mesurable. Nous allons définir l’intégrale des fonctions de
E+ à partir de cette écriture.
Définition 5.1 – Soit ϕ = i=1 αi 1Ai une fonction de E+ , où A1 , . . . , AN sont des éléments de A qui
PN
forment une partition de E. On définit l’intégrale de ϕ par rapport à la mesure µ par
Z N
X
ϕ dµ := αi µ(Ai ),
E i=1
R
R la convention αi µ(Ai ) = 0 si αi = 0 et µ(Ai ) = ∞. On note aussi cette quantité E ϕ(x) dµ(x),
avec
ou E ϕ(x) µ( dx). On omet parfois de mentionner E lorsque le contexte est clair.
Remarque 5.2 – La définition de ϕ dµ ne dépend pas de l’écriture ϕ = i=1 αi 1Ai choisie, où les Ai
R PN
sont dans A et forment une partition de E.
Démonstration. Soient α1 , . . . , αN les valeurs de ϕ, et Ai = {ϕ = αi }. Si ϕ = j=1 βj 1Bj , où
PM
les Bj sont dans A et forment une partition de E, alors
M
X N
X X N
X X
βj µ(Bj ) = βj µ(Bj ) = αi µ(Bj )
j=1 i=1 j, βj =αi i=1 j, βj =αi
G X
Or pour tout i ∈ J1, nK, Bj = {ϕ = αi } = Ai , donc µ(Bj ) = µ(Ai ).
j, βj =αi j, βj =αi
27
28 Chapitre 5 – Intégrale de Lebesgue
R
Remarque 5.3 – On note que si ϕ est étagée positive, alors ϕ dµ > 0.
Exemple 5.4 – 1. Mesure de Dirac : Soit x ∈ E, pour toute fonction étagée positive ϕ,
Z
ϕ dδx = ϕ(x).
E
2. Mesure de comptage sur N : Soit m la mesure de comptage sur (N, P(N)), si ϕ est étagée positive
sur N, alors Z X
ϕ dm = ϕ(n).
N n∈N
X N
X X N
X X
ϕ(n) = ϕ(n) = αi 1
n∈N i=1 n∈N i=1 n∈N
ϕ(n)=αi ϕ(n)=αi
N
X Z
= αi m({ϕ = αi }) = ϕ dm.
i=1
Proposition 5.5 – Si ϕ et ψ sont deux fonctions étagées positives sur l’espace mesuré (E, A , µ),
1. ϕ + ψ ∈ E+ , et (ϕ + ψ) dµ = ϕ dµ + ψ dµ,
R R R
2. si α ∈ R+ , alors αϕ ∈ E+ et αϕ dµ = α ϕ dµ,
R R
R R
3. si ϕ 6 ψ, alors ϕ dµ 6 ψ dµ.
1. On écrit ϕ = i=1 αi 1Ai et ψ = j=1 βj 1Bj où les Ai et (resp. les Bj ) forment
PN PM
Démonstration.
une partition de E. Alors ϕ + ψ = i=1 j=1 (αi + βj )1Ai ∩Bj ,
PN PM
Z N X
X M N
X M
X M
X N
X
(ϕ + ψ) dµ = (αi + βj )µ(Ai ∩ Bj ) = αi µ(Ai ∩ Bj ) + βj µ(Ai ∩ Bj )
i=1 j=1 i=1 j=1 j=1 i=1
N
X M
FM X FN
= αi µ A
j=1 i ∩ Bj + βj µ i=1 Ai ∩ Bj
i=1 j=1
N
X M
X Z Z
= αi µ(Ai ) + βj µ(Bj ) = ϕ dµ + ψ dµ.
i=1 j=1
Z N
X N
X Z
αϕ dµ = ααi µ(Ai ) = α αi µ(Ai ) = α ϕ dµ.
i=1 i=1
Cette dernière intégrale est bien définie : on observe que ϕ1A ∈ E+ . En effet, si ϕ = i=1 αi 1Ai où les Ai
PN
Lemme 5.6 – Si (En )n∈N est une suite croissante de A vérifiant E = n∈N En , alors pour toute fonction
S
ϕ ∈ E+ , Z Z
ϕ dµ −→ ϕ dµ.
En n→∞ E
αi 1Ai , on a alors
PN
Démonstration. On écrit ϕ = i=1
Z N
X
ϕ dµ = αi µ(Ai ∩ En ).
En i=1
S
On observe que pour tout i ∈ J1, N K, on a µ(Ai ∩ En ) −→ µ( n Ai ∩ En ) = µ(Ai ), du fait que (Ai ∩ En )n
n→∞
est une suite croissante de A . Le résultat en découle.
On note que, par croissance de l’intégrale des fonctions de E+ , la définition 5.7 est compatible avec la
définition 5.1.
Remarque 5.8 – Les propriétés suivantes se déduisent immédiatement de la définition de l’intégrale.
1. (Positivité) Si f ∈ M+ , alors E f dµ > 0 : si ϕ ≡ 0, alors ϕ ∈ E+ , et ϕ 6 f .
R
ϕ 6 g.
Exemples – 1. Mesure de Dirac : si x ∈ E, alors pour toute fonction f ∈ M+ , on a
Z
f dδx = f (x).
E
En effet, f dδx = sup{ϕ(x), ϕ ∈ E+ , ϕ 6 f } = f (x) : d’une part, il est évident que f dδx 6 f (x),
R R
d’autre part, ϕ = f (x)1{f >f (x)} ∈ E+ vérifiant bien ϕ 6 f , on obtient l’autre inégalité.
2. Mesure de comptage sur (N, P(N)) : pour toute fonction f : N → N, on a
Z X
f dm = f (n).
N n∈N
En effet,
30 Chapitre 5 – Intégrale de Lebesgue
On a
– pour tout n, En ⊂ En+1 ,
S
– E = n En : si x ∈ E, comme fn (x) −→ f (x) > αϕ(x), il existe n ∈ N tel que αϕ(x) 6 fn (x).
n→∞
Alors, par le lemme 5.6, on a Z Z
αϕ dµ = lim αϕ dµ.
E n→∞ En
En laissant tendre α vers 1, puis en passant au sup sur les fonctions ϕ de E+ telles que ϕ 6 f , on
obtient l’inégalité souhaitée.
Proposition 5.10 – Si f, g deux fonctions mesurables positives, alors les propriétés suivantes sont
vérifiées.
R R R
1. (Additivité) E (f + g) dµ = f dµ + g dµ.
R R
2. (Homogénéité positive) Si α > 0, alors αf dµ = α f dµ.
Démonstration. 1. On sait qu’il existe des suites croissantes (ϕn )n et (ψn )n de fonctions de M+ telles
que f = limn→∞ ϕn = f et g = limn→∞ ψn = f . Alors, (ϕn + ψn )n est une suite croissante de M+
qui converge vers f + g, et par Beppo Levi,
R R
E
(ϕn + ψn ) dµ −→ E
(f + g) dµ,
n→∞
=
R R R R
E
ϕn dµ + E
ψn dµ −→ E
f dµ + E
g dµ.
n→∞
5.2 Intégration des fonctions mesurables positives 31
2. On utilise les même notations que dans le point 1. La suite (αϕn )n est une suite croissante de M+
qui converge vers αf , donc par Beppo Levi,
R R
E
αϕn dµ −→ E
αf dµ,
n→∞
=
R R
α E
ϕn dµ −→ α E
f dµ.
n→∞
En revanche, si on suppose en plus qu’il existe une fonction g µ-intégrable telle que fn 6 g pour tout
n ∈ N, alors la conclusion de Beppo Levi reste vraie. En effet, on peut appliquer le théorème de Beppo
Levi à (g − fn )n qui est bien une suite croissante de fonctions de M+ . On obtient
Z Z
lim(g − fn ) dµ = lim (g − fn ) dµ,
E n n E
R R R R
ce qui donne E
g dµ − E
limn fn dµ = E
g dµ − limn E
fn dµ.
Le résultat suivant, qui porte sur l’intégration des séries de fonctions de M+ , est équivalent au théorème
de Beppo Levi.
Proposition 5.14 – Si (fn )n∈N est une suite de fonctions mesurables positives, alors
Z X XZ
fn dµ = fn dµ.
E n∈N n∈N E
Pn
k=0 fk n est une suite croissante de M+ , donc par le théorème
Démonstration. On note que la suite
de Beppo Levi,
Z X n Z X
fk dµ −→ fk dµ,
E k=0 n→∞ E k∈N
=
n Z
X XZ
fk dµ −→ fk dµ,
E n→∞ E
k=0 k∈N
Mesures à densité
alors ν définit une mesure sur (E, A ). On dit que ν est la mesure à densité g par rapport à la mesure µ.
Par ailleurs, si f ∈ M+ , alors Z Z
f dν = f g dµ. (5.1)
E E
32 Chapitre 5 – Intégrale de Lebesgue
Démonstration. On a bien sûr ν(∅) = 0. Par ailleurs, si (An )n est une suite d’éléments de A distincts
deux à deux, alors
G Z X XZ
1An dµ = g 1An dµ =
X
ν An = g ν(An ),
n n∈N n∈N n∈N
par Beppo Levi, ce qui prouve que ν est bien une mesure.
On note que, par définition de ν, l’égalité (5.1) est vraie si f est une indicatrice d’élément de A . Par
additivité de l’intégrale, elle reste donc vraie si f ∈ E+ . Pour finir, si f ∈ M+ , alors il existe une suite
croissante (gn )n de fonctions de E+ qui converge simplement vers f . Comme (fn g)n est aussi une suite
croissante de fonctions mesurables, on a par Beppo Levi
Z Z
fn dν −→ f dν
n→∞
=
Z Z
fn g dµ −→ f g dµ,
n→∞
d’où le résultat.
Exemple 5.16 – Une variable aléatoire réelle X sur un espace probabilisé (Ω, A , P) suit la loi normale
(x−µ) 2
N (µ, σ) si sa loi PX est la mesure qui a pour densité la fonction x 7→ √1 e−
σ 2π
2 , ce qui donne pour
tout A ∈ B(R),
Z − (x−µ)2
e 2
PX (A) = √ dλ(x).
A σ 2π
d’où le résultat.
Corollaire 5.18 – Si f ∈ M+ et
R
E
f dµ < ∞, alors f est finie µ-presque partout (ie µ({f = ∞}) = 0).
Démonstration. Pour tout n ∈ N? , on a
Z
1
µ({f = ∞}) 6 µ({f > n}) 6 f dµ −→ 0,
n E n→∞
2. Si f = g µ-p.p., alors f 1{f 6=g} et g 1{f 6=g} sont nulles µ-p.p., ce qui implique par 1. que
R
{f 6=g}
f dµ =
R
{f 6=g}
g dµ = 0. On en déduit alors que
Z Z Z Z
f dµ = f dµ = g dµ = g dµ.
E {f =g} {f =g} E
d’où l’inégalité.
R – Une fonction f : (E, A ) → (K, B(K)) est dite µ-intégrable (ou intégrable) si elle est
Définition 5.24
mesurable et E |f | dµ < ∞. On note
L 1 (E, A , µ) est parfois seulement noté Lµ1 (E), voire L 1 (E) lorsqu’il n’y a pas d’ambiguı̈té.
On étend la définition aux fonctions à valeurs dans R, ou un sous-ensemble de K (muni de la tribu des
boréliens).
Notation. Si f : E → R est mesurable, alors on appelle respectivement partie positive et partie négative
de f les fonctions f + et f − données par
On remarque que f + etf − sont positives, et mesurables comme composées d’une fonction continue et
d’une fonction mesurable. Par ailleurs, on a clairement :
f = f + − f −,
|f | = f + + f − .
d’où le résultat.
Définition 5.26 (Intégrale de Lebesgue) –
– Si f : (E, A ) → (R, B(R)) est µ-intégrable, on pose
Z Z Z
f dµ := f + dµ − f − dµ.
E E E
et A ∈ A , alors f 1A ∈
Lµ1 (E) Lµ1 (E)
R R
Si f ∈ (du fait que A |f | dµ 6 E
|f | dµ < ∞). On note alors
comme précédemment Z Z
f dµ = f 1A dµ.
A E
R R
Proposition 5.31 (Croissance) – Si f, g : E → R sont intégrables et f 6 g, alors E f dµ 6 E g dµ.
Démonstration. On a g − f ∈ M+ , donc E (g − f ) dµ > 0. On conclut par la linéarité de l’intégrale.
R
Remarque 5.32 – Pour avoir la propriété de croissance, il suffit en fait de supposer que f 6 g µ−p.p. :
il suffit de considérer f 1{f 6g} et g 1{f 6g} au lieu de f et g.
Proposition 5.33 (Inégalité triangulaire) – Si f ∈ Lµ1 (E), alors
Z Z
f dµ 6 |f | dµ.
E E
Démonstration. – Si K = R, on a
Z Z Z Z Z Z
+ − + −
f dµ = f dµ − f dµ 6 f dµ + f dµ = |f | dµ.
R
– Si K = C, on commence par remarquer
R
que si E f dµ =R 0, l’inégalité est vérifiée. Sinon, on
R R | f dµ| | f dµ|
remarque que E f dµ = E f R E f dµ dµ. En posant α = R E f dµ , on a
E E
Z Z Z
R
f dµ = (αf ) dµ = Re (αf ) dµ car E
f dµ ∈ R
E E E
Z
6 |Re (αf )| dµ par le cas K = R
E
Z Z
6 |αf | dµ = |f | dµ.
E E
En effet, pour tout B ∈ B(R), λϕ (B) = λ(B − a) = λ(B), donc λϕ = λ, et la formule de transfert donne
le résultat.
Application 5.36 (Calcul de l’espérance d’une variable aléatoire) – Soit X une Rvariable aléatoire réelle
sur un espace probabilisé (Ω, A , P). L’espérance de X est définie par E(X) = Ω X dP. Le lemme de
transfert implique alors que Z
E(X) = x dPX (x),
R
où on a remplacé µ par P, ϕ par X et f par Id : R → R dans la formule de transfert.
N.B. : Dans le cas particulier où X est à valeurs dans N, on a bien la formule classique de l’espérance :
Z XZ X
E(X) = X dP = X dP = k P({X = k}).
E k∈N {X=k} k∈N
5.4 Théorème de convergence dominée et applications 37
La démonstration repose sur l’idée donnée dans la remarque 5.23 : on note qu’il suffit de montrer
l’inégalité Z Z
lim sup |f − fn | dµ > lim sup |f − fn | dµ
E n n E
pour obtenir le résultat. D’après la remarque 5.23, il suffit de “dominer” la suite |f − fn | par une fonction
intégrable pour obtenir l’inégalité. On va voir que les hypothèses du lemme de Fatou permettent de le
faire.
Démonstration. Soit A = {x ∈ E, fn (x) −→ f (x) et ∀n ∈ N, |fn (x)| 6 g(x)}. On a
n→∞
[ X
c
µ(A ) = µ {fn 6−→ f } ∪ {|fn | > g} 6 µ({fn 6−→ f }) + µ({|fn | > g}) = 0.
n→∞ n→∞
n∈N n∈N
On remarque que si x ∈ A, alors |f (x) − fn (x)| 6 |f (x)| + |fn (x)| 6 2g(x), ce qui implique que
1A (2g − |f − fn |) ∈ M+ . Par le lemme de Fatou, on a
Z Z
lim inf (2g − |f − fn |) dµ 6 lim inf (2g − |f − fn |) dµ ,
n n
|A R
{z } |R A
{z R }
= A
2g dµ = A
2g dµ−lim supn A
|f −fn | dµ
Corollaire
P R 5.39 – Soit (fn )n P une suite de fonctions mesurables de E dans K vérifiant
n |fn | dµ < ∞. Alors, la fonction n fn est définie presque partout, µ-intégrable, et
XZ Z X
fn dµ = fn dµ.
n∈N E E n∈N
P R
Démonstration. On observe d’abord que comme n |fn | dµ < ∞, les fonctions fn sont en fait intégrables.
Par ailleurs, par Beppo Levi, on a
Z X XZ
|fn | dµ = |fn | dµ < ∞. (5.2)
E n∈N n∈N E
38 Chapitre 5 – Intégrale de Lebesgue
P P
Par conséquent, la fonction n |fn | est finie µ-presque Ppartout, donc n fn (x) converge absolument pour
µ-presque tout x ∈ E. On P en déduit que la fonction n fn P est bien définie µ-presque partout.P
On pose par exemple n fn (x) = 0 lorsque x ∈ A := { n |fn | = ∞} ∈ P A . La fonction n fn est
k=0 fk 1A )n . Par ailleurs,
n
alors
R P mesurable comme
RP limite simplePde la suite de fonctions mesurables (
| n fn | dµ 6 n |f n | < ∞, donc n fn est intégrable. Pn
On applique le théorème de convergence dominée à la suite de fonctions (gn )n , où gn = k=0 fk . En effet,
on a
P
– gn −→ n fn µ-p.p.,
n→∞P
– |gn | 6 n |fn | µ-p.p.
On en déduit que
Z X n Z X
fk dµ −→ fn dµ
E k=0 n→∞ E n∈N
= =
n
XZ XZ
fk dµ −→ fn dµ,
E n→∞ E
k=0 n∈N
d’où le résultat.
Démonstration. Soit (yk )k∈N une suite de Y telle que limk→∞ yk = ȳ. Pour tout k ∈ N, on pose
ϕk (x) = f (x, yk ).
Par hypothèse, les fonctions ϕk sont mesurables, la suite (ϕk ) converge µ-presque partout vers `, et pour
tout k ∈ N, |ϕk | 6 g µ-presque partout. Comme g ∈ Lµ1 (E), on peut appliquer le théorème de convergence
dominée à la suite de fonctions (ϕk ), et on obtient que
Z
F (y) −→ ` dµ.
y→ȳ E
R
Alors la fonction F : y ∈ Y 7→ E
f (x, y) dµ est bien définie sur Y tout entier, et est continue en ȳ.
Démonstration. On pose ` : x ∈ E 7→ f (x, ȳ). Par hypothèse, ` est une fonction mesurable. On peut donc
appliquer le théorème précédent, qui donne
Z
F (y) −→ ` dµ = F (ȳ).
y→ȳ E
où ∂f
R
∂y (x, ·) désigne la dérivée de la fonction y 7→ f (x, y). Alors la fonction F : y ∈ I 7→ E
f (x, y) dµ est
dérivable sur I, et pour tout y ∈ I, Z
F 0 (y) = ∂y (x, y) dµ.
E
Démonstration. Soient ȳ ∈ I et une suite (yn )n∈N de I telle que limn→∞ yn et yn 6= y pour tout [Link]
considère la suite de fonctions ϕn définie par
f (x, yn ) − f (x, ȳ)
ϕn (x) = .
yn − ȳ
On note que par hypothèse, les fonctions ϕn sont intégrables, et ϕn (x) −→ ∂y f (x, ȳ) µ-p.p. x. Par
n→∞
ailleurs, pour µ-presque tout x ∈ E, le théorème des accroissements finis donne
Z b N
X Z
f (x) dx = αi `(Ii ) = f dλ.
a i=1 [a,b]
Définition 5.47 – On appelle fonction réglée sur [a, b] toute fonction f : [a, b] → R qui est limite
uniforme d’une suite de fonctions en escalier.
On peut montrer que les fonctions réglées sur [a, b] sont exactement les fonctions qui admettent une
limite à gauche et à droite en tout point. Il est donc aisé de voir que toutes les fonctions continues, les
fonctions continues par morceaux, les fonctions monotones sont des fonctions réglées sur [a, b]. On peut
aussi montrer que les fonctions réglées ont un nombre dénombrable de discontinuités.
Une conséquence immédiate du théorème 5.46 est que toute fonction réglée est Riemann-intégrable. Il
est alors naturel de se demander si ce sont les seules. Le théorème suivant répond par la négative à cette
question, et caractérise les fonctions Riemann-intégrables sur un segment [a, b].
Théorème 5.48 (Critère de Lebesgue) – Une fonction f : [a, b] → R bornée est Riemann-intégrable si et
seulement si elle est continue λ-presque partout.
Le critère de Lebesgue permet de voir immédiatement qu’il existe des fonctions Riemann-intégrables
qui ne sont pas réglées. On peut citer l’exemple de l’indicatrice de l’ensemble de Cantor C sur [0, 1] : la
fonction est discontinue sur C qui n’est pas dénombrable, donc 1C n’est pas réglée. En revanche, 1C est
Riemann-intégrable car l’ensemble de ses points de discontinuité est C, qui est de mesure nulle. Un autre
exemple est a fonction f définie sur [0, 1] par f (x) = sin x1 si x > 0, et f (0) = 0. Elle n’est pas réglée
puisqu’elle n’admet pas de limite à droite en 0, mais elle est Riemann-intégrable puisqu’elle est continue
sur ]0, 1] qui est de mesure pleine dans [0, 1].
Rb
Pour toute fonction g ∈ Lλ1 ([a, b]), on notera alors sans amiguité
R
[a,b]
g dλ = a
g(x) dx.
Démonstration. Soit (ϕn )n∈N une suite de Esc telle que pour tout n ∈ N, ϕn 6 f , et
Z Z b
ϕn dλ −→ f (x) dx.
[a,b] n→∞ a
On remarque que, quitte à remplacer ϕn par max(ϕ0 , . . . , ϕn ), on peut supposer que la suite (ϕn )n est
croissante. On introduit alors sa limite simple g, qui est mesurable comme limite simple d’une suite de
fonctions mesurables, et qui vérifie donc g 6 f .
Comme la suite (ϕn − ϕ0 )n est une suite croissante de M+ , on peut lui appliquer le théorème de Beppo
Levi. Il vient alors Z Z
(ϕn − ϕ0 ) dλ −→ (g − ϕ0 ) dλ.
[a,b] n→∞ [a,b]
Rb
Lλ1 ([a, b]),
R R R
Comme ϕ0 ∈ on en déduit que [a,b]
ϕn dλ −→ [a,b]
g dλ, et donc [a,b]
g dλ = a
f (x) dx.
n→∞
On considère maintenant une suite (ψn )n∈N de Esc telle que pour tout n ∈ N, ψn > f , et
Z Z b
ψn dλ −→ f (x) dx.
[a,b] n→∞ a
Quitte à remplacer ψn par min(ψ0 , . . . , ψn ), on peut supposer que la suite (ψn )n est décroissante. On
introduit alors sa limite simple h, qui est mesurable et vérifie h > f . On applique cette fois Beppo Levi à
la suite (ψ0 − ψn )n , et on obtient, du fait que les fonctions h, ψn , ψ0 sont intégrables (h 6 ψn 6 ψ0 pour
tout n), Z Z
ψn dλ −→ h dλ.
[a,b] n→∞ [a,b]
R Rb
On en déduit alors que [a,b]
h dλ = a
f (x) dx.
R
On remarque alors que h − g > 0, et [a,b]
(h − g) dλ = 0, donc g = h λ-presque partout. De ce fait, f = g
λ-presque partout, d’où le résultat.
Remarque 5.50 – On ne peut pas dire en général que si f est Riemann-intégrable, alors elle est intégrable
au sens de Lebesgue : il faudrait pour cela qu’elle soit mesurable, ce qui n’est pas garanti. Il peut en effet
arriver qu’une fonction soit presque partout égale à une fonction mesurable, mais ne soit pas mesurable
elle-même. Bien sûr, si on ajoute dans les hypothèses du théorème 5.49 que f est mesurable, alors la
Rb
conclusion devient sur f ∈ L 1 ([a, b]), et a f (x) dx = [a,b] f dλ.
R
Une conséquence directe du théorème 5.49 est que tous les résultats connus pour l’intégrale de Riemann
s’appliquent à l’intégrale de Lebesgue des fonctions Riemann-intégrables mesurables.
Par ailleurs, à partir de maintenant, lorsque nous travaillerons avec une fonction f : [a, b] → R Riemann-
Rb R
intégrable et mesurable, nous ne ferons plus de distinction entre les écritures a f (x) dx, [a,b] f dλ, et on
Rb
s’autorisera par exemple à écrire a f dλ.
Théorème 5.51 – On suppose que f est une fonction mesurable de ]a, b[ dans R localement Riemann-
intégrable et d’intégrale absolument convergente. Alors, f est Lebesgue-intégrable, et
Z b Z
f (x) dx = f dλ.
a [a,b]
Démonstration. Soit (an )n∈N une suite décroissante qui converge vers a, et bn )n∈N une suite croissante
qui converge vers b. On note que pour tout n ∈ N, on a
Z Z bn
|f | dλ = |f (x)| dx.
[an ,bn ] an
42 Chapitre 5 – Intégrale de Lebesgue
Comme la suite |f |1[an ,bn ] est croissante, on peut appliquer Beppo Levi, et la convergence absolue de
l’intégrale de Riemann de f sur ]a, b[ donne alors
Z Z b
f dλ = |f (x)| dx < ∞.
[a,b] a
On en déduit que f ∈ L 1 ([a, b]). On peut donc appliquer le théorème de convergence dominée à la suite
(|f |1[an ,bn ] )n , ce qui donne
Z Z
f dλ −→ f dλ.
[an ,bn ] n→∞ [a,b]
On cherche à définir une mesure λ sur R qui soit conforme à la notion de longueur des intervalles de
R. En d’autres termes, si I désigne l’ensemble des intervalles ouverts bornés de R, on souhaite étendre
l’application
λ : I → R+
]a, b[ 7→ b − a
à une classe plus large de parties de R, tout en imposant que le prolongement obtenu soit une mesure sur
une tribu A de R.
Plus précisément, comme détaillé dans le théorème 3.9 énoncé plus haut, on souhaite définir une mesure λ
sur R telle que :
(i) λ([0, 1]) = 1,
(ii) λ est invariante par translation.
Le résultat suivant montre qu’il est impossible de définir une telle mesure sur P(R).
Théorème 6.1 – Il n’existe pas de mesure sur (R, P(R)) vérifiant (i) et (ii).
La démonstration (voir TD) repose sur l’axiome du choix et implique en particulier l’existence de parties
de R dites “non mesurables”, c’est-à-dire qui n’appartiennent à aucune tribu de R sur laquelle on peut
définir une mesure vérifiant (i) et (ii).
Nous allons donc construire une mesure λ sur R vérifiant les propriétés (i) et (ii) sur une tribu de R
différente de P(R). Pour assurer que nous pourrons tout de même mesurer assez d’ensembles de R, nous
chercherons à construire λ sur une tribu assez large : nous imposerons qu’elle contienne les ouverts. En fait,
nous allons même la construire sur la plus petite tribu qui contient les ouverts : la tribu borélienne. Nous
verrons ensuite que cette définition se généralise à des tribus plus grandes. Toutefois, dans la pratique, il
est largement suffisant de travailler dans B(R).
43
44 Chapitre 6 – Construction de mesures - Unicité
– µ? (∅) = 0,
– µ? est croissante : si A ⊂ B ⊂ E, µ? (A) 6 µ? (B),
– µ? est σ-sous-additive : si pour tout n ∈ N, An ⊂ E, alors µ? µ? (An ).
S P
n∈N An 6 n∈N
On note que la propriété de σ-sous-additivité vérifiée par les mesures extérieures est plus faible que la
propriété de σ-additivité des mesures. Par conséquent, toute mesure sur (E, P(E)) est aussi une mesure
extérieure sur E (les mesures extérieures sont toujours définies sur l’ensemble des parties).
Les propositions qui suivent permettent de voir qu’on peut restreindre toute mesure extérieure à une tribu
sur laquelle elle est σ-additive, ce qui fait d’elle une mesure sur cette tribu.
Définition 6.3 – On dit qu’un ensemble A ⊂ E est une partie µ? -mesurable ssi pour tout B ⊂ E,
µ? (B) = µ? (B ∩ A) + µ? (B \ A).
On note Mµ? l’ensemble des parties µ? -mesurables de E.
On peut voir les élements de Mµ? comme les parties de E pour lesquelles µ? “se comporte comme une
mesure”, c’est-à-dire a une propriété d’additivité. Le théorème suivant donne un sens à cette remarque.
Théorème 6.4 –
1. Mµ? est une tribu sur E.
2. µ? est une mesure sur (E, Mµ? ).
Démonstration. 1. Il est clair que ∅ ∈ Mµ? . D’autre part, si A ∈ Mµ? , alors pour tout B ⊂ E
µ? (B) = µ? (B ∩ A) + µ? (B \ A) = µ? (B \ Ac ) + µ? (B ∩ Ac ),
donc Ac ∈ Mµ? . Il reste à vérifier le dernier point. Soient (An )n∈N une suite
S d’éléments S Mµ? ,
de
? ? ?
et B ⊂ E. Par définition de la mesure extérieure, on a µ (B) 6 µ (B ∩ n An ) + µ (B\ n An ).
Montrons l’autre inégalité : on observe que
µ? (B) = µ? (B ∩ A0 ) + µ? (B\A0 )
= µ? (B ∩ A0 ) + µ? ((B\A0 ) ∩ A1 ) + µ? (B\(A0 ∪ A1 ))
= µ? (B ∩ A0 ) + µ? ((B\A0 ) ∩ A1 ) + µ? (B\(A0 ∪ A1 ) ∩ A2 ) + µ? (B\(A0 ∪ A1 ∪ A2 ))
= ...
N n−1
! ! N
!
X [ [
= µ? B\ Ak ∩ An + µ? B\ An
n=0 k=0 n=0
pour tout A ⊂ R.
Remarque 6.5 – On ne peut pas faire la même construction en prenant des intervalles inclus dans A et
en prenant le sup. Une telle construction donnerait par exemple une mesure nulle à R \ Q qui ne contient
aucun intervalle non vide.
Remarque 6.6 – On peut remplacer I dans la définition de la mesure de Lebesgue par l’ensemble des
intervalles bornés, ou encore par l’ensemble des intervalles.
Proposition 6.7 – λ? est une mesure extérieure sur R.
Démonstration. Tout d’abord, il est clair que λ? (∅) = 0. D’autre part, si A ⊂ B, alors si In ∈ I , n ∈ N,
[ [
B⊂ In ⇒ A ⊂ In ,
n∈N n∈N
Comme l’inégalité tient pour tout ε > 0, on obtient bien l’inégalité souhaitée en laissant tendre ε vers
0.
Proposition 6.8 –
1. λ? ([0, 1]) = 1,
2. λ? est invariante par translation.
Démonstration.
1. Pour commencer, λ? ([0, 1]) 6 1 : pour tout ε > 0, [0, 1] ⊂] − ε, 1 + ε[ donc λ? ([0, 1]) 6 1 + 2ε pour
tout ε > 0, on obtient l’inégalité en laissant tendreSε vers 0.
Montrons l’autreSninégalité. Supposons que [0, 1] ⊂ i∈N ]ai , bi [. Par compacité, il existe un entier n
tel que [0, 1] ⊂ i=0 ]ai , bi [.
Soit i1 tel que 0 ∈]ai1 , bi1 [. Si bi1 ∈ [0, 1], il existe i2 tel que bi1 ∈]ai2 , bi2 [. On répète ensuite
l’opération pour construire les ik suivants avec bik−1 ∈]aik , bik [, jusqu’à obtenir biN > 1 (le fait qu’il
y a un nombre fini d’intervalles ]ai , bi [ assure l’existence de N ). Par conséquent,
X N
X N
X
bi − ai > bik − aik > (bik − bik−1 ) + bi1 − ai1 = biN − ai1 > 1.
i∈N k=1 k=2
46 Chapitre 6 – Construction de mesures - Unicité
Par le paragraphe précédent, le Théorème 6.7 montre alors que λ? est une mesure sur la tribu Mλ? de
ses ensembles mesurables, qui vérifie bien les propriétés (i ) et (ii ). Il reste à vérifier que la tribu Mλ?
contient les ensembles qui nous intéressent, c’est-à-dire les boréliens de R.
Démonstration. Comme Mλ? est une tribu, il suffit de montrer qu’elle contient une classe qui engendre les
boréliens. Par exemple, il suffit de montrer que pour tout a ∈ R, ] − ∞, a] ∈ Mλ? . Soit donc I =] − ∞, a],
on souhaite montrer que pour tout B ⊂ R, λ? (B) = λ? (B ∩ I) + λ? (B \ I). On sait par sous-additivité de
λ? que
λ? (B) 6 λ? (B ∩ I) + λ? (B \ I),
montrons la deuxième inégalité. Pour ce faire, on considère une suite (In ) = (]an , bn [) de I telle que
B ⊂ n In , et on pose ε > 0. On note que les intervalles ] min(ai , a), min(bi , a) + 2εn [ recouvrent B ∩ I, et
S
que les intervalles ] max(ai , a), max(bi , a)[ recouvrent B \ I. Ainsi,
X X
λ? (B ∩ I) + λ? (B \ I) 6 (min(bn , a) − min(an , a)) + 2ε + (max(bn , a) − max(an , a))
n∈N n∈N
X
= (min(bn , a) + max(bn , a)) − (max(an , a) + min(an , a)) + 2ε
n∈N
X
= (bn − an ) + 2ε
n∈N
Remarque 6.10 – On peut définir de manière similaire la mesure de Lebesgue de dimension d > 2, en
définissant d’abord la mesure extérieure λ?d par
nX [ o
λ?d (A) = inf V (Pn ), A ⊂ Pn , (Pn )n ∈ P N ,
n∈N n∈N
pour tout A ⊂ Rd , où P désigne l’ensemble des pavés ouverts bornés de Rd . On remarque que la définition
reste la même si P désigne l’ensemble des pavés ouverts de Rd , ou même plus généralement l’ensemble
des pavés de Rd .
On peut ensuite montrer comme ci-dessus que λ?d définit une mesure λd sur B(Rd ), qui vérifie les propriétés
souhaitées :
(i ) λd ([0, 1]d ) = 1,
(ii ) λd est invariante par translation.
Il convient de remarquer qu’on peut aussi construire les mesures de Lebesgue d-dimensionnelles comme
des mesures produits, à partir de la mesure de Lebesgue sur R. Nous détaillerons cette construction au
prochain chapitre.
Nous pouvons utiliser la définition de la mesure extérieure de Lebesgue pour proposer une nouvelle
preuve de la régularité de la mesure de Lebesgue. Le résultat ci-dessous concerne λ?d et est valable pour
tout élément de Mλ?d . Il est donc plus fort que le résultat de régularité du chapitre 3.
Démonstration. On remarque d’abord qu’il suffit de montrer que pour tout ε > 0, on peut trouver un
ouvert Ω de Rd tel que A ⊂ Ω et λ?d (Ω \ A) < 2ε . En effet, on pourra alors appliquer le résultat à Ac pour
obtenir un ouvert ω tel que Ac ⊂ ω et λ?d (ω \ Ac ) < 2ε . Ainsi, en introduisant le fermé F = ω c , on aura
bien F ⊂ A ⊂ Ω, et λd (Ω \ F ) 6 λ?d (Ω \ A) + λ?d (A \ F ) < ε.
On suppose
S d’abord
?
Pque λd (A) < ?∞. La définition de λ?d donne l’existence d’une suite (Pn )n de P telle
que A ⊂ n Pn et n V (Pn ) < λd (A) + 2n+2 . Si on considère l’ouvert Ω = n Pn , on a alors A ⊂ Ω, et
ε
S
X ε
λd (Ω) 6 λd (Pn ) < λ?d (A) + .
n
2
Comme A ∈ Mλ?d , on a λ?d (Ω \ A) = λ?d (Ω) − λ?d (Ω ∩ A) = λ?d (Ω) − λ?d (A) < 2ε .
Si maintenant λ?d (A) = ∞, on pose An = A ∩ [−n, n]d pour tout n ∈ N. Il existe alors
S une suite d’ouverts
ε
(Ωn )n telle que An ⊂ Ωn et λ?d (Ωn \ An ) < 2n+2 pour tout n. On a donc A ⊂ Ω := n Ωn , et
[ X ε
λ?d (Ω \ A) 6 λ?d Ω n \ An 6 λ?d (Ωn \ An ) < ,
n n
2
ce qui conclut.
Remarque 6.12 – On peut en fait montrer que la réciproque du lemme 6.1.2 est vraie : une partie A de
Rd est Lebesgue-mesurable si et seulement si pour tout ε > 0, il existe un ouvert Ω et un fermé F tels que
F ⊂ A ⊂ Ω et λd (Ω \ F ) < ε.
Démonstration. Il suffit de montrer la réciproque du lemme 6.1.2. On se ramène donc à prouver
que si B ⊂ Rd , alors λ?d (B) > λ?d (B ∩ A) + λ?d B \ A). On se donne ε > 0, et un ouvert Ω de
Rd tel que A ⊂ Ω et λ?d (Ω \ A) < ε. Ainsi,
Remarque 6.14 – On déduit du théorème 6.13 que pour toute partie A ∈ Mλ?d , il existe des boréliens
B1 , B2 ∈ B(Rd ) tels que B1 ⊂ A ⊂ B2 et λd (B1 ) = λ?d (A) = λd (B2 ).
M = {A ∈ A , µ(A) = ν(A)}
est une tribu (elle contiendra alors σ(C ) = A ). On remarque qu’il n’est pas évident
S de montrer
S que M
est stable par union dénombrable, mais qu’il est très aisé de montrer que µ( n An ) = ν( n An ) si la
suite (An )n d’éléments de M est supposée croissante. Cette observation permet de montrer que M a une
structure de classe monotone, et le lemme des classes monotones permet de conclure.
Lemme 6.18 (Lemme des classes monotones) – Soit C une classe de parties de E stable par intersection
finie. On a alors
σ(C ) = m(C ).
Démonstration. Comme σ(C ) est une classe monotone contenant C , on a immédiatement σ(C ) ⊃ m(C ).
Pour obtenir l’autre inclusion, il suffit de montrer que m(C ) est une tribu. Le lemme 6.17 assure qu’il
suffit de montrer que m(C ) est stable par intersection finie. Commençons par montrer que
Il suffit de montrer que M1 := {B ∈ m(C ), ∀C ∈ C , C ∩ B ∈ m(C )} est une classe monotone. Comme
C ⊂ M1 par hypothèse, on aura alors M1 = m(C ), ce qui donne (6.1).
6.2 Unicité des mesures 49
S de M1 , alors pour
— Si (Bn )n estSune suite croissante S tout C ∈ C , C ∩ Bn est une suite croissante de
m(C ) donc n C ∩ Bn = C ∩ n Bn ∈ m(C ), et n Bn ∈ M1 .
Pour montrer que m(C ) est stable par intersection finie, c’est-à-dire
il suffit de montrer que M2 := {A ∈ m(C ), ∀B ∈ m(C ), A ∩ B ∈ m(C )} est une classe monotone
contenant C . On montre aisément comme ci-dessus que M2 est une classe monotone. Par ailleurs, (6.1)
exprime que M2 contient C , d’où le résultat.
Remarque 6.20 – On note que si la propriété 2 du Théorème d’unicité est vérifiée, alors les mesures µ et
ν sont en particulier σ-finies.
Démonstration. 1. On pose
M := {A ∈ A , µ(A) = ν(A)}.
On remarque que M est une classe monotone :
— µ(E) = ν(E) car E ∈ C , donc E ∈ M ,
— si A, B ∈ M avec A ⊂ B, alors µ(B \ A) = µ(B) − µ(A) = ν(B) − ν(A) = ν(B \ A), du fait
que µ et ν sont finies, donc B \ A ∈ M ,
— si (A
S n )n est S de M alors la continuité à gauche de µ et ν implique que
uneSsuite croissante
µ n An = ν n A n , donc n An ∈ M .
Comme M contient C par hypothèse, on a donc M ⊃ m(C ) = σ(C ) = A , par le lemme des classes
monotones, ce qui prouve que µ = ν sur A .
2. Pour tout n ∈ N, on définit les mesures µn et νn sur (E, A ) par
Pour tout n ∈ N, les mesures µn et νn sont donc des mesures finies. Par ailleurs, si C ∈ C , on a alors
C ∩ En ∈ C , et µn (C) = νn (C). On S déduit alors du point 1 que µn = νn sur A . Si A ∈ A , comme
la suite (A ∩ En )n est croissante et n En = E, la continuité à gauche de µ et ν implique que
µ(A) = lim µ(A ∩ En ) = lim µn (A) = lim νn (A) = lim ν(A ∩ En ) = ν(A),
n→∞ n→∞ n→∞ n→∞
µ(I) = `(I).
50 Chapitre 6 – Construction de mesures - Unicité
On déduit alors qu’il existe au plus une mesure λ sur (R, B(R)) invariante par translation et telle que
λ([0, 1]) = 1. En effet, si λ et λ0 satisfont ces propriétés, alors elles coı̈ncident sur la classe I des intervalles.
Or, la classe I est stable par intersection finie, elle contient R tout entier, et elle engendre la tribu B(R).
On peut donc appliquer le point 2 du théorème d’unicité en prenant En =] − n, n[.
On montre l’unicité de la mesure de Lebesgue d-dimensionnelle λd sur (Rd , B(Rd )) de manière analogue,
en montrant que λd fixe la mesure des ensembles de la classe P des pavés de Rd . Comme P est stable
d
par intersection finie et contient Rd , on peut raisonner de la même manière en posant En = ] − n, n[ .
Nµ = {N ⊂ E, E est µ-négligeable}.
Remarque 6.21 – On remarque que Nµ est stable par union dénombrable. En effet, si (Nn )n∈N est
une de Nµ , on sait
S suite S S que pour P tout n ∈ N, il existe An ∈ A tel que µ(An ) = 0 et Nn ⊂ An . Ainsi,
n Nn ⊂ n A n , et µ( n A n ) 6 n µ(An ) = 0.
A¯ = {B ∪ N, B ∈ A , N ∈ Nµ }.
µ̄(B ∪ N ) = µ(B).
car n Nn ∈ Nµ .
F
6.3 Tribu complétée, mesure complétée 51
2. Il suffit de montrer que Nµ̄ ⊂ Nµ . En effet, on aura alors Nµ̄ ⊂ Nµ ⊂ A¯, ce qui montre que
(E, A¯, µ̄) est complet. Pour voir ça, on remarque que si N ∈ Nµ̄ , alors N ⊂ B ∪ N 0 où B ∈ A ,
N 0 ∈ Nµ et µ̄(B ∪ N 0 ) = 0. Il existe donc A0 ∈ A tel que N 0 ⊂ A0 et µ(A0 ) = 0. On a donc
N ⊂ B ∪ N 0 ⊂ B ∪ A0 .
Théorème 6.26 – 1. La tribu Mλ? des parties mesurables pour la mesure extérieure λ? coı̈ncide avec
la tribu L (R).
2. La mesure λ̄ coı̈ncide avec λ? sur Mλ? = L (R).
Démonstration. 1. Commençons par montrer que si N ∈ Nλ , alors N est λ∗ -mesurable. On sait qu’il
existe A ∈ A tel que N ⊂ A et λ(A) = 0, donc si B ⊂ R, alors λ? (B ∩ N ) 6 λ? (A) = 0 et
λ? (B \ N ) 6 λ? (B). On en déduit que
λ? (B ∩ N ) + λ? (B \ N ) 6 λ? (B).
λ? (B) 6 λ? (B ∪ N ) 6 λ? (B) + λ? (N ).