Probabilité et Espérance conditionnelle
Dans ce chapitre, (Ω, F, P) désignera un espace probabilisé et G sera une sous-tribu de F. Nous
donnerons pour simplifier la notion d’espérance conditionnelle en dimension 1 (variables aléatoires
réelles). Bien entendu, tout ceci se généralise sans peine au cas multidimmensionnel (vecteurs
aléatoires).
1 Introduction : variables aléatoires discrètes
On se donne deux variables aléatoires discrètes X et Z à valeurs dans Z à support fini. L’idée
intuitive de probabilité conditionnelle nous amène à prendre pour valeur de la “probabilité de
{X = i} sachant {Z = j}” la quantité suivante
P(X = i, Z = j)
P(X = i|Z = j) =
P(Z = j)
pour j appartenant au support de Z. Si j n’appartient pas au support de Z, cette définition n’a
pas de sens. Par suite, l’espérance de X sachant {Z = j} sera définie comme
X
E(X|Z = j) = iP(X = i|Z = j)
i∈Z
Définissons maintenant l’espérance conditionnelle de X sachant Z comme la variable aléatoire
Y (ω) = E(X|Z)(ω) donnée par
X
Y (ω) = 11Z −1 ({j}) (ω)E(X|Z = j)
j
En particulier, si ω n’appartient pas au support de Z, Y (ω) = 0.
1) Remarquons que pour tout borélien B ∈ σ(Z), c’est-à-dire B ⊂ P(Z −1 ({z}) ; z ∈ Support(Z)),
on a
E(Y 11B ) = E(X11B )
2) Y est σ(Z) mesurable.
La question qui se pose est de savoir comment généraliser cette notion d’espérance condition-
nelle lorsque Z n’est pas à valeurs discrètes. En particulier, on remarqura que si Z est à densité,
l’événement {Z = z} est pour tout réel z de probabilité nulle si bien que la définition même de
probabilité conditionnelle devient délicate. La première idéee consisterait à approximer l’événement
{Z = z} par limε→0 {Z ∈ (z − ε; z + ε)} et l’on peut effectivement procéder ainsi mais cela devient
assez vite compliqué. On va procéder tout autrement.
1
2 Théorème d’existence et d’unicité
Théorème 2.1. [Existence] Soit X une variable aléatoire sur (Ω, F, P) intégrable et 11G une sous-
tribu de F. Il existe une variable aléatoire Y telle que :
1) Y est G-mesurable.
2) E(|Y |) < +∞.
3) ∀G ∈ G, E(11G Y ) = E(11G X).
[Unicité] De plus, si Ỹ est une autre variable aléatoire vérifiant ces trois propriétés alors Y = Ỹ
P p.s. On parlera alors de Y comme (d’une version) de l’espérance conditionnelle et on la notera
E(X|G).
Avant d’entamer la preuve de l’existence de l’espérance conditionnelle, faisons quelques re-
marques.
Notations 1) Quand on considère au lieu de G la tribu engendrée par une variable aléatoire Z (resp.
une famille de variables aléatoires (Zi )i∈I ), il est d’usage de noter l’espérance conditionnelle de X
sachant σ(Z) par E(X|Z) (resp. E(X|Zi , i ∈ I)).
On remarquera que E(X|Z) est σ(Z)-mesurable donc elle s’écrit sous la forme f (Z) où f est une
certaine fonction borélienne.
Remarque 2.1. Si l’on veut prouver 3), on peut se restreindre à montrer l’égalité pour des G
qui appartiennent à un π-système contenant Ω et générant G (Théorème de la classe monotone/
machine standard : Un sous espace vectoriel des focntions mesurables bornées stable par limite
croissante et contenant les indicatrices des éléments d’un π système générateur contient toutes les
fonctions mesurables bornées). D’autre part, si on a 3), par le théorème de la classe monotone, on
a aussi que
E(E(X|G)U ) = E(XU )
pour toute variable aléatoire U qui est G-mesurables bornée.
Démonstration. (du théorème (2.1)).Dans la démonstration, nous aurons besoin de considérer
les espaces quotients L2 (Ω, G, P) et L2 (Ω, F, P). On a bien sûr l’inclusion triviale L2 (Ω, G, P) ⊂
L2 (Ω, F, P). Cette inclusion passe au quotient puisque si X, Y ∈ L2 (Ω, G, P) définissent le même
élément dans L2 (Ω, G, P), c’est que {Y 6= X} ∈ G est de P probabilité nulle donc que X et
Y définissent aussi le même élément dans L2 (Ω, F, P). D’autre part, L2 (Ω, G, P) est fermé dans
L2 (Ω, F, P).
Existence : On commence par traiter le cas où X admet un moment d’ordre 2. L2 (Ω, G, P) est
un sev complet de L2 (Ω, F, P) pour la norme k · k2 dérivant du produit-scalaire noté < ·, · >. On
désigne alors par Y la projection orthogonale de X sur L2 (Ω, G, P). Par définition de la projection
orhogonale,
∀Z ∈ L2 (Ω, G, P), < X − Y, Z >= 0
donc E(X11G ) = E(Y 11G ) pour tout G ∈ G. Ceci prouve l’existence de l’espérance conditionnelle
pour les variables aléatoires ayant des moments d’ordre 2. Passons maintenant au cas général.
Soit X ∈ L1 (Ω, F, P). En l’écrivant comme différence de sa partie positive et de sa partie négative :
X = X + − X − , il est clair que l’on peut se ramener au cas où X est positive. On suppose donc
maintenant que X est positive. Soit pour tout entier n, Xn = X ∧ n ∈ L2 . On peut donc par ce
2
qui précède prendre son espérance conditionnelle par rapport à G, Yn = E(Xn |G). D’autre part, Xn
tend simplement en croissant vers X et on va voir que de même, (Yn )n tend en croissant vers une
certaine limite Y .
Lemme 2.1. 0 ≤ Yn ≤ Yn+1 , P p.s.
Démonstration. On prouve que si U ≥ 0 admet un moment d’ordre 2 alors W = E(U |G) ≥ 0.
Si P(W < 0) > 0 alors il existe n tel que P(W < −1/n) > 0 et {W < −1/n} ∈ G donc
0 ≤ E(U 11W <−1/n ) = E(W 11W <−1/n ) ≤ −1/n
ce qui est exclu.
On en déduit immédiatement le lemme (par linéarité de l’espérance conditionnelle sur L2 (Ω, F, P)).
On pose Y = lim sup Yn qui est G-mesurable. Pour tout G ∈ G,
E(Y 11G ) = lim E(Yn 11G ) par convergence monotone
n→∞
= lim E(Xn 11G )
n→∞
= E(X11G ) par convergence monotone
En particulier, avec G = Ω, E(Y ) = E(X) < +∞.
Unicité : Soit Y et Ỹ deux variables aléatoires vérifiant 1), 2) et 3). On veut montrer que Y = Ỹ ,
P presque sûrement. On a donc :
∀G ∈ G, E(11G (Y − Ỹ )) = 0
Si P(Y = Ỹ ) < 1 alors quitte à permuter Y et Ỹ , on a
P(Y > Ỹ ) > 0
Or limn→∞ P(Y − Ỹ > 1/n) = P(Y > Ỹ ) et il existe donc n tel que P(Y − Ỹ > 1/n) > 0. Mais
Gn = {Y − Ỹ > 1/n} ∈ G par 1) donc
1
E(11Gn (Y − Ỹ )) = 0 ⇒ P(Y − Ỹ > 1/n) ≤ 0 : exclu
n
Ceci conclut la preuve de l’unicité et du théorème.
Proposition 2.1. L’espérance conditionnelle est une forme linéaire positive qui vérifie les pro-
priétés suivantes
(i) Emboitement Si H est une sous-tribu de G, alors
E(E(X|G)|H) = E(X|H), p.s.
3
(j) ”Sortir ce qui est connu” Si Z est G-mesurable et bornée, alors
E(ZX|G) = ZE(X|G), p.s.
(k) Rôle de l’indépendance Si H est indépendant de σ(σ(X), G), alors
E(X|σ(G, H)) = E(X|G), p.s.
En particulier, si X est indépendant de H, alors E(X|H) = E(X).
Remarque 2.2. 1) Quand on considère au lieu de G la tribu engendrée par une variable aléatoire Z
(resp. une famille de variables aléatoires (Zi )i∈I ), il est d’usage de noter l’espérance conditionnelle
de X sachant σ(Z) par E(X|Z) (resp. E(X|Zi , i ∈ I)).
On remarquera que E(X|Z) est σ(Z)-mesurable donc elle s’écrit sous la forme f (Z) où f est une
certaine fonction borélienne.
2.1 Variables à densité
Soit X et Z deux variables aléatoires réelles (pour simplifier les écritures) telles qu’elles aient
une
R densité jointe fX,Z (x, z). ROn rappelle que X (resp. Z) a alors une densité notée fZ (z) =
fX,Z (x, z)dx (resp. fX (x) = fX,Z (x, z)dz). On pose alors
fX,Z (x, z)
fX|Z (x|z) = 11fZ (z)6=0
fZ (z)
Soit h une fonction borélienne (bornée pour simplifier) ; quelle est l’espérance conditionnelle de
h(X) sachant Z ?
Si g est une fonction borélienne bornée, par le théorème de Fubini, on a la suite d’égalités suivantes :
Z
E(h(X)g(Z)) = h(x)g(z)fX,Z (x, z)dxdz
Z
= g(z)fZ (z)fX|Z (x, z)h(x)dxdz
R2
Z Z
= g(z)fZ (z) fX|Z (x, z)h(x)dx
R R
= E(g(Z)θ(Z))
R
où θ(z) = R fX|Z (x, z)h(x)dx.
On a donc prouvé que
Z
E(h(X)|Z)(ω) = θ(Z(ω)) = fX|Z (x, Z(ω))h(x)dx
R
2.2 Variables discrètes
En se reportant à la section 1, on vérifiera sans peine que si X et Z sont deux variables aléatoires
discrètes à valeurs dans Z, on a :
!
X X
E(X|Z) = j 11Z=i P(X = j|Z = i)
j i
4
Le terme X
j11{Z=i} P(X = j|Z = i)
j
est souvent noté
E(X|Z = i)
3 Noyaux et lois conditionnelles
Ce paragraphe est tiré de Ouvrard Tome II et donné sans la démonstration des propriétés. On s’y
reportera pour de plus amples détails (mais ce qui est ici doit être su). La notion de loi condition-
nelle est plus profonde que celle d’espérance conditionnelle qui n’est d’ailleurs que “l’espérance par
rapport à la loi conditionnelle”.
(E, E) et (F, F) sont deux espaces probabilisés (qui seront ici en fait des (Rk , B(Rk ))).
Définition 3.1. ν : E × F → [0, 1] est un noyau (ou probabilité) de transition si il satisfait :
1. ∀x ∈ E, ν(x, ·) est une probabilité sur (F, F).
2. ∀B ∈ F, ν(·, B) est E-mesurable.
Définition 3.2. Si X ∈ Rd et Y ∈ Rk sont deux variables aléatoires, on appelle loi conditionnelle
de Y sachant X un noyau ν sur (Rd × B(Rk )) tel que :
P(X,Y ) = PX · ν
c’est-à-dire Z
P(X ∈ A; Y ∈ B) = ν(x, B)PX (dx)
x∈A
On notera, et ce n’est qu’une notation, un tel noyau ν de la manière suivante :
ν(x, B) = P(Y ∈ B|X = x) ou ν(x, B) = PY (B|X = x)
Remarquer par exemple que si X est à densité, {X = x} est un ensemble de probabilité nulle. Il
est donc hors de question de la définir par :
P(Y ∈ B; X = x)
P(Y ∈ B|X = x) =
P(X = x)
Cependant cette formule est vraie dans le cas où P(X = x) 6= 0.
Il reste à savoir quand on a l’existence de lois conditionnelles. La réponse à cette question est
apportée par le théorème non trivial suivant.
Théorème 3.1. : théorème de Jirina
Si X et Y sont deux variables aléatoires à valeurs dans des (Rk , B(Rk )) alors il existe toujours une
loi conditionnelle de Y sachant X.
Le théorème suivant est une généralisation du théorème de Fubini dans le cadre conditionnel.
5
Théorème 3.2. Soit (X, Y ) une variable aléatoire à valeurs dans un espace probabilisable quel-
conque (E × F, E ⊗ F) telle qu’existe une loi conditionnelle P(Y ∈ ·|X = ·) de Y sachant X. Soit f
une application mesurable de l’espace probabilisable
R (E × F, E ⊗ F) dans (R̄, B(R̄)).
a) Si f est positive, l’application x → F f (x, y)dPY (dy|X = x) est E-mesurable et on a :
Z Z Z
f (x, y)P(X,Y ) (dxdy) = f (x, y)PY (dy|X = x) PX (dx)
E×F E F
b) Si f est de signe quelconque et P(X,Y ) -intégrable, pour PX presque tout x, l’application par-
tielle
R f (x, ·) est PY (·|X = x)-intégrable, et l’application définie PX -presque sûrement par x →
F f (x, y)dPY (dy|X = x) est PX -intégrable et l’égalité précédente est encore vraie.
Il est alors aisé d’établir le corrolaire suivant.
Proposition 3.1. (Propriété de transfert conditionnel)
Si X ∈ Rp et Y ∈ Rk sont deux variables aléatoires et f : Rp+k → Rq borélienne, alors
P(f (X, Y ) ∈ ·|X = x) = P(f (x, Y ) ∈ ·|X = x)
En particulier, si X et Y sont indépendantes, on a
P(f (X, Y ) ∈ ·|X = x) = P(f (x, Y ) ∈ ·)
Terminons par une définition avant de faire le lien avec l’espérance conditionnelle.
Définition 3.3. Soit Y une variable aléatoire et (X1 , . . . , Xn ) une suite finie de variables aléatoires.
On dira que relativement à Y = y les variables aléatoires (X1 , . . . , Xn ) ont pour loi µy (probabilité
sur Rn dépendant de y) ssi il existe une loi conditionnelle de (X1 , . . . , Xn ) relativement à Y telle
que PY p.s.
P(X1 ,...,Xn ) (·|Y = y) = µy (·)
En particulier, on dira que (X1 , . . . , Xn ) sont indépendantes conditionnellement à Y = y ssi la loi
conditionnelle de (X1 , . . . , Xn ) relativement à Y est une loi produit.
L’espérance conditionnelle de la variable aléatoire X relativement à une autre variable aléatoire
Y est Z
E(X|Y )(ω) = xdPX (dx|Y = Y (ω))
R
Il suffit en effet de remarquer que la fonction définie par le membre de droite vérifie les propriétés
caractéristiques de l’espérance conditionnelle. L’espérance conditionnelle apparaı̂t donc comme
“l’espérance relativement à la loi conditionnelle”.
Exercice 3.1. Une poule pond N oeufs, N suivant une loi de Poisson de paramètre λ, c’est-à-dire
n
fN (n) = P(N = n) = e−λ λn! . Chaque oeuf éclôt avec probabilité p, indépendamment des autres
oeufs. On note q = 1 − p. Soit K le nombre de poussins. Notre but est de calculer, puis d’interpréter
les valeurs de E(K|N ), E(K) et E(N |K).
1) Montrer que P(K = k|N = n) = Cnk pk (1 − p)n−k et que E(K|N ) = pN. En déduire que
E(K) = pλ. Interpréter.
6
2) Si vous ne l’avez jamais vue, montrer la règle de Bayes (disposer d’un moyen mnémotechnique
pour s’en souvenir).
P(B|A)P(A)
P(A|B) = .
P(B)
3) En utilisant la règle de Bayes, montrer que si n ≥ k,
(qλ)n−k −qλ
P(N = n|K = k) = e .
(n − k)!
Conclure que E(N |K) = K + qλ. Interpréter.
Solution de 1) Le loi du nombre de poussins K sachant le nombre d’oeufs N égale à n est la loi
binomiale de paramètre (n, p).
Solution de 3).
P(K = k | N = n)P(N = n)
P(N = n | K = k) = =
P(K = k)
λ −λ
Cnk pk (1 − p)n−k ( n! )e (qλ)n−k −qλ
m = e .
k pk (1 − p)m−k ( λ )e−λ (n − k)!
P
m≥k Cm m!
Donc
X (qλ)n−k
E(N |K = k) = n e−qλ = k + qλ.
(n − k)!
n≥k
Donc E(N |K) = K +qλ. On a E(N ) = λ, EK = pλ. A titre de vérification des résultats, remarquer
que
λ = EN = E(E(N |K)) = E(K + qλ) = pλ + qλ = λ.
L’espérance du nombre d’oeufs sachant le nombre d’oeufs éclos est égale à la somme du nombre,
connu, d’oeufs éclos, K, plus l’espérance du nombre d’oeufs non éclos, soit qλ.
Exercice 3.2. Preuve de la formule générale caractérisant l’espérance conditionnelle
dans le cas discret On considère deux v.a. discrètes X et Y et on définit
X
φ(x) := P(Y = y|X = x), Z := φ(X).
y
Montrer que Z vérifie
E(Zg(X)) = E(Y g(X)) (3.1)
pour toute fonction g telle que les deux espérances existent. Montrer qu’il y a une unique fonction
ψ telle que Z = ψ(X) vérifie (4.1).
Donc Z = φ(X) = E(Y |X).
Solution :
X X
E(E(Y |X)g(X)) = yg(x)fY |X (y|x)fX (x) = yg(x)fX,Y (x, y) = E(Y g(X)).
x x,y
Unicité : soit Z = ψ(X) vérifiant (4.1). On choisit g(X) = 11X=x0 . Cela donne
X X
ψ(x0 )P(X = x0 ) = y11x=x0 P(X = x; Y = y) = yP(X = x0 ; Y = x).
x,y y
7
Donc X
ψ(x0 ) = yP(Y = y|X = x0 ),
y
ce qui est bien la définition.
Exercice 3.3. (Grimmett-Stirzaker, exercice 3.7.7 p. 69). Une usine produit n lampes. Chacune
est défectueuse avec probabilité φ. On teste chaque lampe pour détecter un éventuel défaut. La
probabilité de détecter le défaut quand il est présent est δ. On note X le nombre d’ampoules
defectueuses et Y le nombre d’ampoules détectées comme defectueuses. Montrer que
nφ(1 − δ) + (1 − φ)Y
E(X|Y ) = .
1 − φδ
Solution : Une lampe non detectée défecteuse est en réalité défectueuse avec probabilité π =
φ(1−δ)
1−φδ .Donc le nombre de lampes défectueuses sachant Y suit une binomiale B(n − Y, π) et a pour
(n−Y )(phi(1−δ))
moyenne 1−φδ . Donc
(n − Y )φ(1 − δ)
E(X|Y ) = Y + .
1 − φδ
Exercice 3.4. Les propriétés fondamentales : les lire (Williams, Probability with mar-
tingales p. 88 et la dernière page) Soit (Ω, F, P) un espace de probabilité. On suppose que
X, F-mesurable, vérifie E|X| < ∞. G et H sont des sous-tribus de F. On rappelle qu’il existe une
unique v.a. G-mesurable et sommable, notée E(X|G) telle que
Z Z
∀G ∈ G, E(X|G)dP = XdP. (3.2)
G G
(L’unicité est vraie modulo un ensemble de mesure nulle). De manière plus condensée :
∀G ∈ G, E(E(X|G); G) = E(X; G),
R
où E(X; G) = G XdP.
Montrer les propriétés suivantes :
(a) On pose Y = E(X|G), alors E(Y ) = E(X).
(b) Si X est G-mesurable, alors E(X|G) = X p.p.
(c) Linéarité E(aX1 + a2 X2 |G) = a1 E(X1 |G) + a2 E(X2 |G), p.p.
(d) Positivité Si X ≥ 0, alors E(X|G) ≥ 0, p.p.
(e) C-Convergence monotone Si 0 ≤ Xn ↑ X, alors E(Xn |G) ↑ E(X|G), p.p.
(f) C-Fatou Si Xn ≥ 0, alors E(lim inf Xn |G) ≤ lim inf E(Xn |G), p.p.
(g) C-Convergence dominée Si ∀n |Xn (ω)| ≤ V (ω), EV < ∞ et Xn → X p.p., alors
E(|Xn − X| |G) → 0, p.p.
(Par Jensen juste après, on déduit que E(Xn |G) → E(X |G), p.p.
8
(h) C-Jensen Si c : R → R est convexe et E|c(X)| < ∞, alors
E(c(X)|G) ≥ c(E(X|G)), p.p.
Corollaire : ||E(X|G)||p ≤ ||X||p .
(i) Emboitement Si H est une sous-tribu de G, alors
E(E(X|G)|H) = E(X|H), p.p.
(j) ”Sortir ce qui est connu” Si Z est G-mesurable et bornée, alors
E(ZX|G) = ZE(X|G), p.p. .
0
Généralisations : encore vrai si X ∈ Lp et Z ∈ Lp , ou si X ∈ (mF)+ , Z ∈ (mG)+ , E(X) < ∞ et
E(ZX) < ∞.
(k) Rôle de l’indépendance Si H est indépendant de σ(σ(X), G), alors
E(X|σ(G, H)) = E(X|G), p.p.
En particulier, si X est indépendant de H, alors E(X|H) = E(X).
Indications :
(a) Provient de la relation fondamentale (4.2) appliquée à G = Ω.
(b) Découle de l’unicité de la fonction G-mesurable satisfaisant (4.2), i.e. de l’unicité de l’espérance
conditionnelle.
(c) De même (expliquer !).
(d) Considérer l’ensemble G = {E(X|G) < − n1 } et appliquer la relation fondamentale.
(e) Poser Y = lim sup E(Xn |G), montrer qu’elle est G-mesurable, qu’elle est la limite presque partout
des E(Xn |G). Montrer que limn E(E(Xn |G); G) = E(Y ; G) et conclure.
(f ) Reprendre la démonstration qui dérive le lemme de Fatou du théorème de converge monotone
pour déduire C-Fatou de C-convergence monotone. (Poser Yn = E(Xn , G), puis Zn = inf k≥n Yn
et lui appliquer C-monotone.)
(g) Reprendre la démonstration qui déduit le théorème de convergence monotone du lemme de Fatou
pour déduire C-convergence dominée de C-Fatou.
(h)
(h1) Soit c : R → R convexe. Montrer qu’il existe une suite dénombrable (an , bn )n ∈ R2 telle
que
c(x) = sup(an x + bn ), x ∈ R.
n
(Remarquer que c est continue, d’épigraphe donc fermé, et utiliser par exemple Hahn-Banach : Il
y a un hyperplan séparant tout point n’appartenant pas à un convexe fermé de ce convexe).
(h2) Déduire que
E(c(X)|G) ≥ an E(X|G) + bn
9
et conclure. Pour montrer l’extension de (h), prendre c(x) = |x|p .
(i) Remaquer que pour tout H ∈ H, E(11H X) = E(11H E(X | G)) puisque H ∈ G. Donc par unicité,
0 = E(X − E(11H E(X | G) | H)).
(j) La propriété est linéaire : Appliquer la ”machine standard”, c’est-à-dire montrer que la propriété
est vraie quand Z est une fonction indicatrice d’élément G de G, puis une fonction en escalier posi-
tive, puis une fonction G-mesurable positive quelconque, puis une fonction G-mesurable quelconque
telle que E(|ZX|) < ∞. Vérifier que la preuve s’applique aux généralisations indiquées.
(k) Supposer s.p.d.g. que X ≥ 0 et E(X) < ∞.
(k1) Montrer que si G ∈ G et H ∈ H, alors
E(X; G ∩ H) = E(X11G )P(H).
(k2) Poser Y = E(X|G). Montrer que
E((Y 11G )11H ) = E(Y 11G )P(H).
(k3) Déduire que les mesures F → E(X; F ) et F → E(Y ; F ) définies sur σ(G, H) coı̈ncident sur
le π-système des ensembles de la forme G ∩ H (G ∈ H), H ∈ H) et donc sur σ(G, H). Conclure.
Exercice 3.5. Comprendre de quoi on parle
Soit (Ω, F, P) un espace de probabilité et A1 , . . . , An une partition de Ω en ensembles mesurables
et G la sous-tribu engendrée par ces ensembles. Décrire cette tribu et calculer E(X|G), pour X
F-mesurable.
Exercice 3.6. Lois de Bernoulli et uniforme (Ouvrard Tome II Ex. 11.2 p.171)
Soient n variables aléatoires X1 , X2 , . . . , Xn indépendantes de même loi de Bernoulli de paramètre
P∈
p (0, 1). On note X le vecteur aléatoire X = (X1 , X2 , . . . , Xn ) à valeurs dans {0, 1}n et Sn =
n
i=1 Xi . Montrer que conditionnellementPn à Sn = s, le vecteur X est réparti selon une loi uniforme
sur l’hyperplan {(k1 , k2 , . . . , kn )| i=1 ki = s} pour 0 ≤ s ≤ n.
Exercice 3.7. Application importante
Soient X1 , X2 , . . . Xn des variables aléatoires i.i.d. sommables et Sn = X1 + . . . + Xn . On va
Sn
montrer que E(X1 |Sn ) = · · · = E(Xn |Sn ) = . On pose
n
Gn = σ(Sn , Sn+1 , . . . ) = σ(Sn , Xn+1 , Xn+2 , . . . ).
1) Montrer en utilisant (k) que
E(X1 |Gn ) = E(X1 |Sn ).
2) Montrer que E(X1 |Sn ) = · · · = E(Xn |Sn ).
(On montrera que pour tout borélien B, E(X1 ; Sn ∈ B) = · · · = E(Xn ; Sn ∈ B).)
3) En déduire que
1 1
E(X1 |Sn ) = · · · = E(Xn |Sn ) = E(X1 + · · · + Xn |Sn ) = Sn .
n n
10
Exercice 3.8. Densités conditionnelles 1
Théorème 3.3. rappel (Williams, Probability with martinagles, p. 87) et application :
Brémaud P., Introduction aux probabilités : Modélisation des phénomènes aléatoires p. 212.
R Soient X et Z deux v.a. qui ont une densité de probabilité jointe fX,Z (x, z). Alors fZ (z) =
R fX,Z (x, z)dx est une densité de probabilité pour Z. On définit la densité conditionnelle fX|Z de
X sachant Z par
fX,Z (x, z)
fX|Z (x|z) := si fZ (z) 6= 0, = 0 sinon.
fZ (z)
On pose alors Z
g(z) := h(x)fX|Z (x|z)dx.
R
Alors l’espérance conditionnelle de h(X) sachant σ(Z) est égale à g(Z) :
Z
E(h(X)|σ(Z)) = g(Z) = h(x)fX|Z (x|Z)dx.
R
Soient X, Y, Z trois variables aléatoires réelles telles que
1) X est uniformément répartie sur [0, 1] ;
2) Sachant que X = x, Y admet une densité conditionnelle fY |X (y|x) donnée par
(
(y − x)e−(y−x) si y > x
fY |X (y|x) =
0 sinon
3) Sachant que X = x et Y = y, Z admet une densité conditionnelle fZ|(X,Y ) (z|(x, y)) définie par
(
(y − x)e−z(y−x) si z > 0
fZ|(X,Y ) (z|(x, y)) =
0 sinon
pour (x, y) ∈ A = (x, y) ∈ R2 |x ∈ [0, 1] et y > x .
1) Montrer que (X, Y, Z) admet une densité sur R3 donnée par
f(X,Y,Z) (x, y, z) = (y − x)2 e−(y−x)(z+1) 11B (x, y, z)
où B = (x, y, z) ∈ R3 |x ∈ [0, 1], y > x, z > 0 .
2) Montrer que la loi de Z est donnée par la densité
2
fZ (z) = 11z>0
(z + 1)3
3) Montrer que la loi conditionnelle de (X, Y ) sachant Z = z est donnée par la densité conditionnelle
1
f(X,Y )|Z ((x, y)|z) = (z + 1)3 (y − x)2 e−(y−x)(z+1) 11A (x, y)
2
11
√ √
4) Calculer E( Y − X|Z = z), puis E( Y − X).
5) On pose U = Y − X et V = Z(Y − X). Montrer que (X, U, V ) admet pour densité
f(X,U,V ) (x, u, v) = 11[0,1] (x)ue−u 11u>0,v>0
6) X, U, V sont-elles indépendantes ?
Exercice 3.9. Densités conditionnelles 2
Soient X1 , . . . , Xn des variables aléatoires i.i.d. de densité commune f (x) et de fonction de
Rx
répartition F (x) = −∞ f (u)du. On pose
Y = max(X1 , . . . , Xn ) et Z = min(X1 , . . . , Xn ).
1) En remarquant que FY,Z (y, z) = P(Y ≤ y) − P(Y ≤ y, Z > z), montrer que
FY,Z (y, z) = F (y)n − (F (y) − F (z))n si y ≥ z,
et FY,Z (y, z) = F (y)n si y < z.
2) En déduire que
fY,Z (y, z) = n(n − 1)(F (y) − F (z))n−2 f (y)f (z)11y ≥ z.
3) En déduire une formule intégrale pour E(Z|Y ).
4) Si les Xn sont équiréparties sur [0, 1], en déduire que
(y − z)n−2
fZ|Y (z, y) = (n − 1) 110≤z≤y≤1 .
yn
Exercice 3.10. Processus de Poisson (Ouvrard, exercice 11.3, pp. 171-177)
Soit (Wn )n∈N∗ une suite croissante de variables aléatoires positives telles que W0 = 0. Soit, pour
n ∈ N∗ , la variable aléatoire Tn = Wn − Wn−1 . On suppose que les variables aléatoires Tn forment
une famille de variables aléatoires indépendantes de même loi exponentielle exp(λ) où λ est un réel
strictement positif. On pose X0 = 0 et pour tout t > 0,
X
Xt = 1{Wn ≤t}
n∈N∗
La famille de variables aléatoires (Xt )t∈R+ est appelée processus de Poisson d’intensité λ.
1) Montrer que P presque sûrement t → Xt est une fonction càdlàg (continue à droite avec des
limites à gauches) croissante et que les points de discontinuités sont les Wn .
2) Soit s, t tels que 0 ≤ s < t. Calculer l’intégrale définie pour tout n ∈ N∗ par
Z n
In (s, t) = 1(s≤x1 ≤...≤xn ≤t) dx1 . . . dxn
R
12
3) a) Calculer pour tout n ∈ N∗ et toute famille (fj )j∈{1,...,n de fonctions positives mesurables
bornées sur R la quantité
n
Y
E 1(Xt =n) fj (Wj )
j=1
En déduire la loi de Xt et une loi conditionnelle de (W1 , . . . , Wn ) sachant {Xt = n}.
b) En utilisant la loi des Ti et leur indépendance, montrer que
!
Yn Z Yn Xj
E 1(Xt =n) fj (Wj ) = 1 Pn
( ti ≤t)∩( n+1 ti >t)
P fj ti
i=1 i=1
j=1 (R+ )n+1 j=1 i=1
n+1
!
X
× λn+1 exp −λ ti dt1 . . . dtn+1
i=1
Cette formule démontre alors deux choses. D’une part l’indépendance des variables aléatoires
(Xti+1 − Xti )i=0,...,k−1 et d’autre part que la loi de Xt − Xs est une loi de Poisson de paramètre
λ(t − s).
4) Soient α1 , α2 , . . . , αk des entiers positifs quelconques. Notons n leur somme. On pose lj =
α1 + . . . + αj . En utilisant la question précédente, montrer
h i
P ∩kj=1 (Xtj − Xtj−1 = αj )) = λn exp(−λt)ψ(t1 , . . . , tk )
où
Z k−1
Y
Ψ(t1 , . . . , tk ) = 1(wl ≤tj )∩(wlj+1 >tj ) × 1(0≤w1 ≤w2 ...≤wn ≤t) dw1 . . . dwn
j
Rn j=1
En déduire
k
h i Y (λ(tj − tj−1 ))αj
P ∩kj=1 (Xtj − Xtj−1 = αj ) = exp(−λ(tj − tj−1 ))
αj !
j=1
Solutions :
2) On pourra soit procéder par récurrence comme Ouvrard, soit remarquer que si Sn désigne le
groupe des permutations sur {1, . . . , n}, on a
Z
∀σ ∈ Sn , In (s, t) = 1(s≤xσ(1) ≤...≤xσ(n) ≤t) dx1 . . . dxn
Rn
et X
1(s≤xσ(1) ≤...≤xσ(n) ≤t) = 1(x1 ,...,xn )∈[s,t]n .
σ∈Sn
3) a) Commencer par remarquer que Pk {Xt = n} = {Wn ≤ t} ∩ {Wn+1 > t} et remplacer dans
la quantité à calculer les Wk par i=1 Ti . b) Faire le changement de variables w1 = t1 , w2 =
13
t1 + t2 , . . . , wn+1 = t1 + . . . + tn+1 et en déduire
n
Y
E 1(Xt =n) fj (Wj ) = λn exp(−λt)
j=1
Z n
Y
× fj (wj )1(0≤w1 ≤w2 ...≤wn ≤t) dw1 . . . dwn
Rn j=1
En faisant dans cette formule, fj = 1, montrer que Xt suit une loi de Poisson de paramètre λt. En
déduire que (W1 , . . . , Wn ) admet une densité conditionnelle sachant (Xt = n) donnée par
n!
f(W1 ,...,Wn ) (w1 , . . . , wn |Xt = n) = 1 (loi de Dirichlet)
tn (0≤w1 ≤w2 ...≤wn ≤t)
14