0% ont trouvé ce document utile (0 vote)
2 vues6 pages

Espérance Conditionnelle et Conditionnement

Le chapitre présente la notion de conditionnement en probabilités, en introduisant l'espérance conditionnelle par rapport à une tribu, ainsi que ses propriétés et applications. Il décrit comment calculer l'espérance conditionnelle pour des variables aléatoires, tant dans les cas discrets que continus, en utilisant des lois conditionnelles. Des exemples illustrent les concepts, notamment l'espérance conditionnelle de variables indépendantes et la loi conditionnelle associée.

Transféré par

moussahamadmoussa1
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
2 vues6 pages

Espérance Conditionnelle et Conditionnement

Le chapitre présente la notion de conditionnement en probabilités, en introduisant l'espérance conditionnelle par rapport à une tribu, ainsi que ses propriétés et applications. Il décrit comment calculer l'espérance conditionnelle pour des variables aléatoires, tant dans les cas discrets que continus, en utilisant des lois conditionnelles. Des exemples illustrent les concepts, notamment l'espérance conditionnelle de variables indépendantes et la loi conditionnelle associée.

Transféré par

moussahamadmoussa1
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

CHAPITRE 1

Notion de conditionnement

Résumé. Les notions de conditionnement (discret ou continu) par rap-


port à un événement, une variable aléatoire, plusieurs variables aléa-
toires, etc. sont généralisées par la notion unique d’espérance condition-
nelle par rapport à une tribu. Ainsi, pour toute variable intégrable X et
toute sous-tribu A de la tribu définissant l’espace de probabilité, il existe
une unique variable A-mesurable E[X|A] qui est l’espérance condition-
nelle de X sachant la tribu A. D’un point de vue pratique, pour calculer
l’espérance conditionnelle d’une variable aléatoire X sachant une autre
variable Y , on passe par le calcul de la loi conditionnelle de X sachant Y ,
qui donne ensuite par intégration toutes les espérances conditionnelles
E[f (X)|Y ] pour f mesurable bornée. Cette loi conditionnelle est don-
née soit par un rapport de probabilités dans le cas discret, soit par un
rapport de densités dans le cas continu.

On note en général (⌦, B, P) un espace de probabilité ; ainsi, ⌦ est un ensemble, B est


une tribu sur cet ensemble, et P : B ! [0, 1] est une mesure de probabilité. On utilise
des lettres calligraphiques F, G, . . . pour des sous-tribus de B ; et des lettres capitales
X, Y, . . . pour des variables aléatoires sur (⌦, B, P), c’est-à-dire des fonctions mesurables
X : (⌦, B) 7! (X, BX ) à valeurs dans un autre espace mesurable (le plus souvent, R muni
de la tribu des boréliens, ou Z muni de la tribu de l’ensemble des parties). La loi d’une
variable X est l’image de P par X, c’est-à-dire la mesure de probabilité sur (X, BX ) donnée
par PX [B] = P[X 1 (B)].

1. Espérance conditionnelle
De la même façon que la notion la plus générale d’indépendance est l’indépendance
de tribus, la bonne notion de conditionnement est la conditionnement par rapport à une
sous-tribu A ⇢ B. Dans ce qui suit, on fixe donc une telle sous-tribu. On peut s’imaginer
par exemple que
A = (X1 , . . . , Xr )
est l’ensemble des événements associés à des observations Xi , i.e., la plus petite sous-tribu
de B qui contient toutes les parties (Xi ) 1 (B) avec B mesurable dans l’espace d’arrivée
de Xi , 1  i  r. On souhaite alors donner un sens à
“ l’espérance d’une variable aléatoire X sachant ces observations X1 , . . . , Xr ”,
1
2 1. NOTION DE CONDITIONNEMENT

qui s’écrirait comme fonction mesurable f (X1 , . . . , Xr ) de ces observations X1 , . . . , Xr .


Dans le cas d’une sous-tribu générale A, l’espérance conditionnelle d’une variable X sa-
chant (toutes les réalisations d’événements dans) A se doit de même d’être une fonction
A-mesurable.
Théorème 1.1 (Espérance conditionnelle). Soit X 2 L1 (⌦, B, P), et A ⇢ B une sous-
tribu. Il existe une unique variable aléatoire dans L1 (⌦, A, P) (donc, A-mesurable), notée
E[X|A], telle que pour toute fonction bornée et A-mesurable Y ,
E[XY ] = E[E[X|A] Y ]. (?)
L’équation (?) est la propriété caractéristique de l’espérance conditionnelle, le membre de
droite de cette identité étant l’espérance d’une fonction A-mesurable.
L’unicité du théorème s’entend à modification sur un ensemble de mesure nulle près,
donc au sens presque sûr. D’autre part, en utilisant la propriété caractéristique, on montre
sans difficulté que l’espérance conditionnelle partage de nombreuses propriétés avec l’espé-
rance simple, en particulier : la linéarité, la positivité, les inégalités liées à la convexité, les
théorèmes de convergence, etc. (notons que l’espérance simple est le cas particulier de l’es-
pérance conditionnelle par rapport à la tribu triviale A = {;, ⌦}). D’autres conséquences
importantes et immédiates de la propriété caractéristique sont :
(1) pour toute variable X, E[X|A] est intégrable d’espérance E[E[X|A]] = E[X].
(2) si X est A-mesurable, alors E[X|A] = X.
(3) inversement, si X est indépendante de A, alors E[X|A] = E[X].
(4) conditionnements successifs : si A1 ⇢ A2 sont deux sous-tribus de B, alors
E[E[X|A2 ]|A1 ] = E[X|A1 ] pour toute variable intégrable X.

Exemple. Si A = (Z) est la tribu engendrée par une variable aléatoire Z, alors
les fonctions mesurables pour A sont exactement les fonctions mesurables f (Z) de Z, et
notant dans ce cas E[X| (Z)] = E[X|Z], on a, pour toute fonction mesurable bornée f ,
E[Xf (Z)] = E[E[X|Z] f (Z)],
le membre de droite de l’identité étant l’espérance d’une fonction de Z (il existe g mesu-
rable telle que E[X|Z] = g(Z)).

Exemple. Supposons que A = (A) = {;, A, Ac , ⌦} est la tribu engendrée par un


événement de probabilité comprise strictement entre 0 et 1, et comparons l’espérance
conditionnelle E[X|A] à la notion plus simple
E[X A ] E[X A ]
E[X|A] = = .
E[ A ] P[A]
Les fonctions A-mesurables sont exactement les combinaisons linéaires de A et de Ac ,
donc E[X|A] doit être une combinaison de ces fonctions. On peut alors vérifier que
E[X|A] A + E[X|Ac ] Ac

vérifie la propriéte caractéristique (?), donc est l’espérance conditionnelle de X sachant


la tribu A.
2. CONDITIONNEMENT DISCRET 3

Il existe une formule qui généralise simultanément les propriétés (2) et (3) énoncées
précédemment. Soit X une variable A-mesurable, et Y une variable indépendante de A.
Lors du calcul de l’espérance conditionnelle par rapport à A d’une fonction de X et de
Y , tout ce qui dépend de X est laissé tel quel, et tout ce qui dépend de Y est intégré
contre la loi de Y . Ainsi, si f (X, Y ) est une fonction mesurable bornée avec X variable
A-mesurable et Y variable A-indépendante, alors
Z
E[f (X, Y )|A] = f (X, y) PY (dy).
Y

D’autre part, la notion d’espérance conditionnelle est définie plus simplement dans
L2 (⌦, B, P). En effet, pour toute variable X 2 L2 (⌦, B, P), l’espérance conditionnelle
E[X|A] est la projection orthogonale de X sur L2 (⌦, A, P), et pour toute variable Y 2
L2 (⌦, A, P),
E[XY ] = E[E[X|A] Y ].
Cette interprétation fournit ipso facto une preuve de l’existence de l’espérance condition-
nelle pour des variables de carré intégrable, et la densité de L2 (⌦, B, P) dans L1 (⌦, B, P)
mène ensuite au théorème 1.1. On peut également définir l’espérance conditionnelle dans
le cadre des variables aléatoires positives (sans hypothèse d’intégrabilité), par exemple
par application du théorème de convergence monotone.

2. Conditionnement discret
Dans le cas discret, il est fréquent de manipuler simplement des probabilités condi-
tionnelles d’événements P[A|B] = E[ A |B] = P[A\B] P[B]
. Une propriété importante de ces
quantités est la formule des probabilités totales :
r
X
P[B] = P[B|Ai ] P[Ai ]
i=1

si ⌦ = A1 tA2 t· · ·tAr est un système complet d’événements ; et son corollaire, la formule


de Bayes, qui permet d’inverser le rôle joué par des événements lors d’un conditionnement :
P[Ai \ B] P[B|Ai ] P[Ai ]
P[Ai |B] = = Pr .
P[B] j=1 P[B|Aj ] P[Aj ]

Voyons maintenant comment calculer en pratique des espérances conditionnelles dans


le cas discret. Plus précisément, considérons deux variables X et Y à valeurs dans Z, et
voyons comment calculer E[X|Y ]. Pour les mêmes raisons que lors du conditionnement
par rapport à un événement, on a :
X
E[X|Y ] = E[X|Y = k] Y =k ,
k2Z
P[Y =k]6=0
4 1. NOTION DE CONDITIONNEMENT

qui est bien une fonction de Y , à savoir la fonction


(
E[X Y =k ]
P[Y =k]
si P[Y = k] > 0;
k 7!
0 si P[Y = k] = 0.
Exemple. Soient X et Y deux variables indépendantes suivant une loi Poisson de
paramètre 1, et Z = X + Y , qui suit une loi de Poisson de paramètre 2. L’espérance
conditionnelle de X sachant Z = k est :
Xk
E[X Z=k ]
E[X|Z = k] = = e2 2 k k! j P[X = j] P[Y = k j]
P[Z = k] j=0
k
X k 1
X
k k! k (k 1)! k
=2 j = k2 = ,
j=0
j! (k j)! j=0
j! (k j 1)! 2

donc E[X|Z] = Z
2
.

Pour donner une meilleure explication de l’exemple précédent, il est utile d’introduire
la notion de loi conditionnelle. Soient X et Y deux variables aléatoires sur un espace
(⌦, B, P), à valeurs dans des espaces (X, BX ) et (Y, BY ), qu’on suppose polonais (métri-
sables complets et séparables). L’application
f 7! E[f (X)|Y ]
est une fonctionnelle linéaire positive de f ; on s’attend donc à pouvoir la représenter par
une mesure de probabilité, qui serait aléatoire et Y -mesurable.
Théorème 1.2 (Loi conditionnelle). Il existe une unique application mesurable
Y ! P(X, BX )
y 7! ⌫(·, y)
appelée loi conditionnelle de X sachant Y , telle que pour toute fonction f : X ! R
mesurable bornée, Z
E[f (X)|Y ] = f (x) ⌫(dx, Y ).
X
On note souvent ⌫(dx, Y ) = PX|Y (dx). Dans le cas discret, la loi conditionnelle est donnée
par la fonction ⌫(x, y) = E[ X=x | Y =y ].

Exemple. Revenons à l’exemple précédent, et calculons la loi conditionnelle de X


sachant Z. Pour tous j  k,
P[X = j] P[Y = k j] k!
E[ X=j | Z=k ] = =2 k .
P[Z = k] j! (k j)!
Ainsi, sachant Z = k, X suit une loi binomiale B(k, 12 ). Autrement dit,
✓ ◆
1
PX|Z = B Z, .
2
P
On retrouve bien en particulier E[X|Z] = x x B(Z, 12 )(x) = Z2 .
3. CONDITIONNEMENT CONTINU 5

3. Conditionnement continu
Dans le cas continu, on peut également calculer l’espérance conditionnelle, et plus
généralement la loi conditionnelle d’une variable réelle X sachant une autre variable réele
Y , si l’on connaît la loi jointe du couple (X, Y ), donnée par une densité de probabilité
f (x, y) dx dy (les raisonnements
R qui suivent s’adaptent sans problème au cas de variables
vectorielles). Soit g(y) = R f (x, y) dx ; c’est la densité de la variable Y . Au vu du cas
discret et par analogie, il est naturel de poser
( R x f (x,Y ) dx
R
si g(Y ) > 0;
E[X|Y ] = g(Y )
0 si g(Y ) = 0.

Il s’agit bien d’une fonction mesurable de Y , et elle vérifie bien la propriété caractéristique
(?), donc c’est effectivement E[X|Y ]. Plus généralement, la loi conditionnelle de X sachant
Y est donnée par
(
f (x,Y ) dx
si g(Y ) > 0;
PX|Y (dx) = g(Y )
0 (dx) si g(Y ) = 0,
le deuxième cas étant simplement une convention pratique (la loi conditionnelle est définie
à un ensemble de mesure nulle près).

Exemple. Considérons p une gaussienne standard (X, Y ) de dimension 2, et calculons


la loi de X sachant R = X 2 + Y 2 . La densité de R est donnée par
Z ⇣p ⌘ x2 +y2 Z 1
1 r2
E[f (R)] = f 2
x +y e2 2 dx dy = f (r) e 2 r dr,
2⇡ R2 r=0

r2
elle est donc donnée
p par g(r) p= r e 2 pour r > 0, et 0 sinon. D’autre part, le jacobien
2 2
de (x, y) 7! (x, x2 + y 2 ) est r r x , et chaque couple (x, r) avec r 6= 0 est atteint 2 fois,
donc, la densité du couple (X, R) est
r2
e 2 r
f (x, r) = p 0|x|r dx dr.
⇡ r2 x2
La loi conditionnelle de X sachant R est donc
(
p|X|Rdx si R > 0;
PX|R (dx) = ⇡ R 2 x2
0 (dx) si R  0,

c’est-à-dire une version de la loi de l’arcsinus dépendant continuement de R. On en déduit


par exemple la valeur de
Z R Z
⇥ ⇤ |x| 2R ⇡/2 2R
E |X| R = p dx = sin ✓ d✓ = .
R ⇡ R
2 x 2 ⇡ 0 ⇡
6 1. NOTION DE CONDITIONNEMENT

Exemple. Soit (Nt )t2N un processus de Poisson d’intensité 1. Ceci veut dire qu’il
existe des variables aléatoires E1 , . . . , Ek , . . . indépendantes de loi exponentielle x>0 e x dx
telles que si
S1 = E 1 ;
S2 = E 1 + E 2 ;
.. ..
. .
Sk = E 1 + · · · + E k
alors les variables Sk déterminent les temps des sauts de Nt : Nt = k sur l’intervalle
k t
[Sk , Sk+1 ). Les lois marginales de Nt sont alors des variables de Poisson : P[Nt = k] = t k!e .

Fixons un entier k, et déterminons la loi de (S1 , . . . , Sk 1 ) sachant Sk . La loi jointe de


(S1 , . . . , Sk ) est donnée par la densité :
e1 +···+ek sk
e1 >0,...,ek >0 e de1 · · · dek = 0s1 ···sk e ds1 · · · dsk .
La loi de Sk est donc donnée par intégration par rapport aux k 1 premières variables :
k 1
(sk )
e sk dsk
(k 1)!
ce qui constitue une loi (k, 1). Par conséquent, la loi conditionnelle de (S1 , . . . , Sk 1 )
sachant Sk est
Sk
0s1 ···Sk e ds1 . . . dsk 1
(Sk )k 1
ds1 . . . dsk 1 = (k 1)! 0s1 ···sk 1 Sk
,
e Sk (Sk )k 1
(k 1)!

c’est-à-dire que c’est la loi uniforme sur le simplexe {0  s1  · · ·  sk 1  Sk }. C’est


l’une des manifestations du phénomène d’absence de mémoire des processus de Poisson.

Références. On trouvera un traitement plus complet de la notion de probabilité et d’es-


pérance conditionnelle dans
(1) P. Billingsley, Probability and Measure, 3rd edition, Wiley, 1995 ; §33-34.
(2) R. Durrett, Probability : Theory and Examples, 4th edition, Cambridge University
Press, 2010 ; §5.1.
On s’est ici inspiré du traitement proposé par ce second ouvrage.

Vous aimerez peut-être aussi