Variance conditionnelle des vecteurs aléatoires
Variance conditionnelle des vecteurs aléatoires
2024/2025
Faculté de Mathématiques L2 SD, Probabilités 2
Introduction
L’étude des phénomènes aléatoires ne se limite pas à l’analyse d’une seule variable : dans de
nombreux domaines, plusieurs grandeurs aléatoires interviennent simultanément. Par exemple, on
peut s’intéresser au poids et à la taille d’un individu, aux températures mesurées dans différentes
villes, ou encore aux rendements de plusieurs actifs financiers.
Ces grandeurs sont modélisées par des vecteurs aléatoires, c’est-à-dire des ensembles de va-
riables aléatoires considérées simultanément. Généralement, de nombreuses études en probabilités
et en statistiques mettent en jeu plusieurs variables aléatoires, et nous nous intéressons à leurs lois
conjointes, marginales, conditionnelles, ainsi qu’aux relations de dépendance ou d’indépendance
entre elles.
La notion de variable aléatoire à plusieurs dimensions intervient dès qu’on souhaite me-
surer différentes grandeurs numériques dépendant de l’issue d’une même expérience aléatoire. Voici
quelques exemples :
— Lors de l’observation d’une population, on peut mesurer l’âge, la taille, le poids, . . .de chaque
individu, formant ainsi un vecteur d’observations aléatoires.
— En suivant la trajectoire d’une particule évoluant dans le plan ou dans l’espace, on peut
s’intéresser à sa position aléatoire déterminée par un vecteur de coordonnées aléatoires
dépendant du temps.
Cette partie du cours est consacrée à la généralisation en dimension d des notions intro-
duites dans le cadre unidimensionnel (variables aléatoires réelles, fonction de répartition, espérance,
variance, convergence. . .). Cette généralisation nécessite une nouvelle manière de décrire la loi de
probabilité d’une variable aléatoire vectorielle et d’adapter les autres notions fondamentales.
Une question essentielle en applications est celle de l’existence d’un lien entre les composantes
d’un vecteur aléatoire :
— Ces composantes sont-elles indépendantes ?
— Sinon, comment mesurer leur dépendance ?
— Peut-on prédire la réalisation d’une composante à partir d’une autre ?
Certaines notions vues en dimension 1 se transposent directement, d’autres nécessitent des
ajustements. Nous introduirons également des outils spécifiques tels que la matrice de variance-
covariance, l’espérance conditionnelle vectorielle ou encore la variance conditionnelle.
X T = (X1 , X2 , . . . , Xd )
1 Vecteurs aléatoires
Définition 1.1. On appelle variable aléatoire à valeurs dans Rd (ou vecteur aléatoire de
dimension d) toute application
X −1 (B) := {ω ∈ Ω | X(ω) ∈ B} ∈ A.
Autrement dit, X est mesurable, c’est-à-dire que l’image réciproque de tout borélien est un événe-
ment (un élément de A).
Définition 1.2 (Définition 4.2). Un vecteur aléatoire X à valeurs dans Rd est formé de d
variables aléatoires réelles, appelées les composantes de X. On l’écrit sous la forme :
X1
X2
T
X= .. , X = (X1 , X2 , . . . , Xd ).
.
Xd
Les variables aléatoires X1 , X2 , . . . , Xd sont appelées les variables aléatoires marginales de X.
Les réalisations possibles de X sont notées :
x = (x1 , x2 , . . . , xd ),
Définition 1.3 ( (Loi conjointe d’un vecteur aléatoire)). La mesure de probabilité PX ainsi définie
est appelée loi de probabilité (ou loi conjointe) du vecteur aléatoire X. On dit que X suit la
loi PX (ou a pour loi conjointe PX ).
Remarque 1.2. La loi conjointe du vecteur X détermine les lois marginales. Néanmoins, la réci-
proque est en général fausse.
Définition 1.5. L’ensemble des valeurs possibles du vecteur aléatoire X est appelé ensemble de
définition (ou support) de X.
FX (x) := P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xd ≤ xd ).
Il existe deux types de vecteurs aléatoires : les vecteurs aléatoires discrets et les vecteurs
aléatoires continus.
Définition 1.7 (Définition 4.7 (Loi d’un vecteur discret)). La loi d’un vecteur aléatoire discret X
(fonction de masse de X) est donnée par :
PX (x) := P (X1 = x1 , X2 = x2 , . . . , Xd = xd ).
Définition 1.8 ( (Fonction de densité d’un vecteur absolument continu)). La densité fX d’un
vecteur aléatoire absolument continu X est définie (si elle existe) comme la dérivée d’ordre d de la
fonction de répartition conjointe :
∂ d FX (x)
fX (x) := .
∂x1 ∂x2 . . . ∂xd
Définition 2.1 (Support). Le support D du couple (X, Y ) est constitué d’un nombre fini ou
dénombrable de points de R2 .
Définition 2.2 (Loi conjointe). La loi conjointe (ou loi de probabilité) du couple (X, Y ) est donnée
par une suite de réels positifs ou nuls (pij )i∈I,j∈J tels que :
pij = P (X = xi , Y = yj ),
Alors :
X(Ω) = {0, 1, 2}, Y (Ω) = {1, 2, 3, 4, 5, 6}.
Le support est :
D = {(0, 1), (0, 3), (0, 5), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 2), (2, 4), (2, 6)}.
La loi conjointe et les lois marginales peuvent être résumées dans un tableau de contingence.
X\Y 1 2 3 4 5 6 Pi.
1 3 5 9
0 36
0 36
0 36
0 36
2 2 4 4 6 18
1 0 36 36 36 36 36 36
1 3 5 9
2 0 36
0 36
0 36 36
1 3 5 7 9 11
P.j 36 36 36 36 36 36
1
Définition 2.5 (Loi conditionnelle). La loi conditionnelle de X sachant Y = yj est donnée par :
pij
P (X = xi | Y = yj ) = , si p.j > 0.
p.j
De même, la loi conditionnelle de Y sachant X = xi est donnée par :
pij
P (Y = yj | X = xi ) = , si pi. > 0.
pi.
p05 5/36 5 4
P (X = 0 | Y = 5) = = = , P (X = 1 | Y = 5) = , P (X = 2 | Y = 5) = 0.
p5 9/36 9 9
Définition 2.6 (Somme de deux variables aléatoires discrètes indépendantes). Soient X et Y deux
variables aléatoires discrètes indépendantes et Z = X + Y . La loi de Z est donnée par :
X
P (Z = z) = P (X = x)P (Y = z − x).
x∈X(Ω)
Exemple 2.5 (Somme de deux lois de Poisson). Soient X ∼ P(λ) et Y ∼ P(µ) deux variables
aléatoires indépendantes. Alors S = X + Y suit la loi de Poisson de paramètre λ + µ : Comme X
et Y sont indépendantes, on a :
k k k
X X e−λ λi e−µ µk−i X λi µk−i
P (S = k) = P (X+Y = k) = P (X = i)P (Y = k−i) = = e−(λ+µ) .
i=0 i=0
i! (k − i)! i=0
i!(k − i)!
Ainsi :
+ µ)k
−(λ+µ) (λ
P (S = k) = e .
k!
Donc S = X + Y suit la loi de Poisson de paramètre λ + µ, c’est-à-dire S ∼ P(λ + µ).
Définition 3.2 (Couple aléatoire absolument continu). Un couple aléatoire (X, Y ) est dit abso-
lument continu si sa fonction de répartition FX,Y est continue à droite et à gauche par rapport
à chacune des variables, et possède des dérivées partielles secondes sur un support non vide D.
Définition 3.3 (Densité conjointe). On appelle fonction de densité de probabilité (ou densité
conjointe) d’un couple aléatoire absolument continu (X, Y ) toute application
fX,Y : R2 → R définie par :
∂ 2 FX,Y (x, y)
fX,Y (x, y) = , pour (x, y) ∈ D,
∂x ∂y
Exemple 3.2. Considérons un couple aléatoire (X, Y ) ayant pour densité conjointe :
4xy si 0 ≤ x ≤ 1, 0 ≤ y ≤ 1,
fX,Y (x, y) =
0 ailleurs.
Alors fX,Y est bien une densité car :
ZZ Z 1 Z 1
fX,Y (x, y) dx dy = 4xy dy dx = 1.
R2 0 0
Exemple 3.3. Considérons fX,Y (x, y) = 31 ⊮[0,1] (x)⊮[1,2] (y). Il s’agit bien d’une densité car :
Z Z
1
fX,Y (x, y) dx dy = ⊮[0,1] (x)⊮[1,2] (y) dx dy
R2 R2 3
1 1 2
Z Z
= 1 dy dx
3 0 1
1 1
Z
= (2 − 1) dx
3 0
1 1
Z
= 1 dx
3 0
1
= × 1 = 1.
3
Proposition 3.1. (Fonction de répartition conjointe) La fonction de répartition conjointe FX,Y (x, y)
vérifie les propriétés suivantes :
Z x Z y
FX,Y (x, y) = P (X ≤ x et Y ≤ y) = fX,Y (u, v) du dv.
−∞ −∞
Exemple 3.5. Soit FX,Y (x, y) = (1 − e−2x )(1 − e−3y ) pour x ≥ 0 et y ≥ 0, et 0 sinon.
Nous obtenons les fonctions de répartition marginales suivantes :
- Pour FX (x) :
- Pour FY (y) :
d d
FY (y) = FY (y) = lim FX,Y (x, y) .
dy dy x→∞
Exemple 3.6. Soit fX,Y la densité conjointe du couple (X, Y ), donnée par :
4xy si 0 ≤ x ≤ 1, 0 ≤ y ≤ 1,
fX,Y (x, y) =
0 sinon.
On obtient les densités marginales en intégrant la densité conjointe :
Z 1 Z 1
1
fX (x) = 4xy dy = 4x y dy = 4x × = 2x, 0 ≤ x ≤ 1.
0 0 2
Z 1 Z 1
1
fY (y) = 4xy dx = 4y x dx = 4y × = 2y, 0 ≤ y ≤ 1.
0 0 2
Définition 3.6. (Lois conditionnelles)
La densité conditionnelle de Y sachant X = x est définie par :
fX,Y (x, y)
fY |X (y) = pour fX (x) > 0.
fX (x)
De même, la densité conditionnelle de X sachant Y = y est :
fX,Y (x, y)
fX|Y (x) = pour fY (y) > 0.
fY (y)
Exemple 3.7. Soit la densité conjointe :
fZ (z) = λ2 ze−λz , z ≥ 0.
4 Indépendance
Définition 4.1. Les variables aléatoires X1 , X2 , . . . , Xd sont dites mutuellement indépendantes
si, et seulement si, pour tout (x1 , x2 , . . . , xd ) ∈ Rd , on a :
d
Y
P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xd ≤ xd ) = P (Xi ≤ xi ).
i=1
d
Y
FX (x1 , x2 , . . . , xd ) = FXi (xi ).
i=1
— Cas continu :
d
Y
fX (x1 , x2 , . . . , xd ) = fXi (xi ).
i=1
Exemple 4.1. Exemple 5.1. Considérons le couple (X, Y ) de loi donnée par la densité :
1
fX,Y (x, y) = 1 1 (x, y).
3 [0,1]×[0, 2 ]
Les densités marginales sont alors :
Z 1/2 Z 1/2
1 1
fX (x) = fX,Y (x, y) dy = dy = , 0 ≤ x ≤ 1,
0 0 3 6
et Z 1 Z 1
1 1 1
fY (y) = fX,Y (x, y) dx = dx = , 0≤y≤ .
0 0 3 3 2
On a :
1 1 1
fX,Y (x, y) = fX (x)fY (y) = × = .
6 3 18
Mais on remarque que :
1 1
̸= = fX (x)fY (y).
fX,Y (x, y) =
3 18
Ainsi, X et Y ne sont pas indépendantes.
Exemple 4.3. Soit (X1 , X2 , X3 ) un triplet de variables aléatoires dont la loi conjointe est donnée
par :
1 , si (x , x , x ) ∈ D,
1 2 3
P (X1 = x1 , X2 = x2 , X3 = x3 ) = 4
0, sinon,
avec
et
1 , pour tout (x , x ) ∈ {(0, 0), (1, 1), (1, 0), (0, 1)},
i j
P (Xi = xi , Xj = xj ) = 4
0, sinon.
On observe que :
Exemple 4.4. Soit (X1 , X2 , X3 , X4 ) un quadruplet de variables aléatoires dont la densité conjointe
est donnée par :
8x x x , si 0 ≤ x ≤ 1, x = 1 − x − x − x , x ≥ 0,
1 2 3 i 4 1 2 3 4
fX1 ,X2 ,X3 ,X4 (x1 , x2 , x3 , x4 ) =
0, sinon.
5 Changement de variables
Soient X1 , X2 , . . . , Xd des variables aléatoires ayant une densité conjointe connue fX1 ,X2 ,...,Xd (x1 , x2 , . . . , xd ).
On considère une transformation :
On suppose que :
— Les fonctions gi sont de classe C 1 (possèdent des dérivées partielles continues).
— Le jacobien :
∂g ∂g1 ∂g1
1
∂x ∂x2
... ∂xd
∂g21 ∂g2 ∂g2
∂x1 ∂x2
... ∂xd
J(x1 , x2 , . . . , xd ) = det
.. .. .. .. ̸= 0
. . . .
∂gd ∂gd ∂gd
∂x1 ∂x2
... ∂xd
fY1 ,Y2 ,...,Yd (y1 , y2 , . . . , yd ) = fX1 ,X2 ,...,Xd (x1 , x2 , . . . , xd ) · |J(x1 , x2 , . . . , xd )|−1
où xi = hi (y1 , . . . , yd ).
Exemple 5.1. Soit (X, Y ) un couple de variables aléatoires absolument continues de densité
fX,Y (x, y). On pose :
U = X + Y, V = X − Y.
Exprimons la densité de (U, V ) en fonction de celle de (X, Y ).
On a les relations inverses :
U +V U −V
, x= y= .
2 2
Le jacobien de la transformation est :
! !
∂x ∂x 1 1
∂u ∂v 2 2
1
J = det ∂y ∂y = det 1
=− .
∂u ∂v 2
− 21 2
Ainsi :
1
|J| = .
2
La densité de (U, V ) est donnée par :
u+v u−v 1
fU,V (u, v) = fX,Y , · .
2 2 2
Alors :
1 si 0 ≤ u+v
≤ 1, 0 ≤ u−v
≤1
2 2 2
fU,V (u, v) =
0 sinon.
Les conditions sur u et v deviennent :
u+v u−v
0≤ ≤ 1 et 0 ≤ ≤1
2 2
⇐⇒ 0 ≤ u + v ≤ 2 et 0 ≤ u − v ≤ 2.
6.1 Espérance E
Propriétés 6.1. Soient X et Y deux variables aléatoires réelles. Alors :
Remarque 6.1. Les propriétés de l’espérance mathématique pour les vecteurs aléatoires découlent
directement de celles de l’espérance mathématique des variables aléatoires.
Définition 7.2 (Matrice de covariance). La matrice de covariance (ou matrice de dispersion) d’un
vecteur aléatoire X = (X1 , X2 , . . . , Xd )T est définie par :
Remarque 7.2.
1. La matrice CX généralise la notion de variance.
2. Elle est carrée, symétrique et semi-définie positive.
3. Si les variables Xi sont indépendantes, la matrice CX est diagonale.
1 0 0 2
3 1 0
3 1
|3| = 3, = 8, 1 3 0 = 16
1 3
0 0 2
Tous les mineurs principaux sont strictement positifs, donc CV est définie positive, et en particulier
semi-définie positive.
On en conclut que CV est bien une matrice de covariance.
Définition 7.3 (Transformation affine d’un vecteur aléatoire). Soient A ∈ Rp×d une matrice et
b ∈ Rp un vecteur. Si Y = AX + b, alors :
E(Y ) = AE(X) + b
CY = ACX AT
Calcul de l’espérance de Y :
! ! ! ! ! !
2 0 1 5 2 5 7
E(Y ) = AE(X) + b = + = + =
1 3 2 −1 6 −1 5
Donc : ! !
7 16 14
E(Y ) = , CY =
5 14 28
Remarque 8.1. La fonction x 7→ E(Y | X = x) est une fonction réelle appelée fonction de
régression. Lorsque X est une variable aléatoire, E(Y | X) est aussi une variable aléatoire,
appelée espérance conditionnelle de Y sachant X.
X =Y +Z
Alors X ∼ P(λ + µ). On s’intéresse à la loi de Y sachant que X = n, pour un entier n ∈ N.
1. Déterminer la loi conditionnelle de Y sachant X = n, c’est-à-dire donner l’expression de
P(Y = k | X = n), pour k ∈ {0, 1, . . . , n}.
2. En déduire l’espérance conditionnelle E(Y | X = n), puis exprimer l’espérance condition-
nelle E(Y | X) comme fonction de la variable aléatoire X.
Solution
Soient Y ∼ P(λ) et Z ∼ P(µ) deux variables aléatoires indépendantes, de lois de Poisson
respectives de paramètres λ et µ. On pose X = Y + Z, alors X ∼ P(λ + µ).
P(Y = k , X = n)
P(Y = k | X = n) = .
P(X = n)
Or, X = Y + Z, donc nous avons :
λ
E(Y | X = n) = n · .
λ+µ
λ
E(Y | X) = X · .
λ+µ
Cela signifie que E(Y | X) est une fonction de X et donc une variable aléatoire.
Exercice 2
Soit (X, Y ) un couple aléatoire ayant une densité uniforme sur le triangle :
Corrigé
Soit (X, Y ) un couple aléatoire ayant une densité uniforme sur le triangle
1. Densités marginales :
— Pour X, on intègre par rapport à y :
Z x
fX (x) = 2 dy = 2x · 1(0,1) (x).
0
4. Fonction de régression :
X
E(Y | X) = .
2
Démonstration (cas absolument continu). Supposons que (X, Y ) admet une densité conjointefX,Y (x, y),
et que la densité marginale de X est fX (x). Alors :
Z ∞
E[E(Y | X)] = E(Y | X = x)fX (x) dx
Z−∞
Z ∞
∞
= y · fY |X=x (y) dy fX (x) dx
−∞ −∞
Z ∞Z ∞
fX,Y (x, y)
= y· · fX (x) dy dx
−∞ −∞ fX (x)
Z ∞Z ∞
= y · fX,Y (x, y) dy dx
−∞ −∞
Z ∞ Z ∞
= fX,Y (x, y) dx y dy
−∞ −∞
Z ∞
= y · fY (y) dy = E(Y )
−∞
Définition 9.1 (Variances conditionnelles). La variance conditionnelle est donnée par la formule
suivante :
De même, Var(Y | X = x) est une variable aléatoire, étant fonction de X, on peut calculer son
espérance.
Théorème (2) (Théorème de la variance totale). Soit (X, Y ) un couple aléatoire, alors :