0% ont trouvé ce document utile (0 vote)
8 vues22 pages

Variance conditionnelle des vecteurs aléatoires

Le chapitre 4 traite des vecteurs aléatoires, qui modélisent des ensembles de variables aléatoires interagissant simultanément, comme le poids et la taille d'un individu. Il introduit des concepts clés tels que la loi conjointe, les lois marginales, et la fonction de répartition conjointe, tout en établissant des définitions et des propriétés essentielles pour comprendre les relations entre ces variables. Des exemples pratiques illustrent l'application de ces notions dans des contextes variés, comme le lancer de dés ou l'analyse de données d'une population.

Transféré par

khoulabensaadi
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
8 vues22 pages

Variance conditionnelle des vecteurs aléatoires

Le chapitre 4 traite des vecteurs aléatoires, qui modélisent des ensembles de variables aléatoires interagissant simultanément, comme le poids et la taille d'un individu. Il introduit des concepts clés tels que la loi conjointe, les lois marginales, et la fonction de répartition conjointe, tout en établissant des définitions et des propriétés essentielles pour comprendre les relations entre ces variables. Des exemples pratiques illustrent l'application de ces notions dans des contextes variés, comme le lancer de dés ou l'analyse de données d'une population.

Transféré par

khoulabensaadi
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

U.S.T.H.B.

2024/2025
Faculté de Mathématiques L2 SD, Probabilités 2

Chapitre 4 : Vecteurs Aléatoires

Introduction
L’étude des phénomènes aléatoires ne se limite pas à l’analyse d’une seule variable : dans de
nombreux domaines, plusieurs grandeurs aléatoires interviennent simultanément. Par exemple, on
peut s’intéresser au poids et à la taille d’un individu, aux températures mesurées dans différentes
villes, ou encore aux rendements de plusieurs actifs financiers.
Ces grandeurs sont modélisées par des vecteurs aléatoires, c’est-à-dire des ensembles de va-
riables aléatoires considérées simultanément. Généralement, de nombreuses études en probabilités
et en statistiques mettent en jeu plusieurs variables aléatoires, et nous nous intéressons à leurs lois
conjointes, marginales, conditionnelles, ainsi qu’aux relations de dépendance ou d’indépendance
entre elles.
La notion de variable aléatoire à plusieurs dimensions intervient dès qu’on souhaite me-
surer différentes grandeurs numériques dépendant de l’issue d’une même expérience aléatoire. Voici
quelques exemples :
— Lors de l’observation d’une population, on peut mesurer l’âge, la taille, le poids, . . .de chaque
individu, formant ainsi un vecteur d’observations aléatoires.
— En suivant la trajectoire d’une particule évoluant dans le plan ou dans l’espace, on peut
s’intéresser à sa position aléatoire déterminée par un vecteur de coordonnées aléatoires
dépendant du temps.
Cette partie du cours est consacrée à la généralisation en dimension d des notions intro-
duites dans le cadre unidimensionnel (variables aléatoires réelles, fonction de répartition, espérance,
variance, convergence. . .). Cette généralisation nécessite une nouvelle manière de décrire la loi de
probabilité d’une variable aléatoire vectorielle et d’adapter les autres notions fondamentales.
Une question essentielle en applications est celle de l’existence d’un lien entre les composantes
d’un vecteur aléatoire :
— Ces composantes sont-elles indépendantes ?
— Sinon, comment mesurer leur dépendance ?
— Peut-on prédire la réalisation d’une composante à partir d’une autre ?
Certaines notions vues en dimension 1 se transposent directement, d’autres nécessitent des
ajustements. Nous introduirons également des outils spécifiques tels que la matrice de variance-
covariance, l’espérance conditionnelle vectorielle ou encore la variance conditionnelle.

L. Adjoudj ... ...


Page 1
Notations
Dans ce cours, un vecteur aléatoire X de dimension d sera représenté par un vecteur colonne :
 
X1
 X2 
 
X=  .. 

 .
Xd

Le vecteur transposé sera noté X T et correspondra à un vecteur ligne :

X T = (X1 , X2 , . . . , Xd )

Le symbole T , placé à droite des matrices ou vecteurs, désignera l’opérateur de transposition.

1 Vecteurs aléatoires
Définition 1.1. On appelle variable aléatoire à valeurs dans Rd (ou vecteur aléatoire de
dimension d) toute application

X : (Ω, A, P) → (Rd , B(Rd ))

définie pour tout ω ∈ Ω par :

X(ω) = (X1 (ω), X2 (ω), . . . , Xd (ω))

telle que, pour tout borélien B ∈ B(Rd ), on ait :

X −1 (B) := {ω ∈ Ω | X(ω) ∈ B} ∈ A.

Autrement dit, X est mesurable, c’est-à-dire que l’image réciproque de tout borélien est un événe-
ment (un élément de A).

Définition 1.2 (Définition 4.2). Un vecteur aléatoire X à valeurs dans Rd est formé de d
variables aléatoires réelles, appelées les composantes de X. On l’écrit sous la forme :
 
X1
 X2 
 
T
X=  ..  , X = (X1 , X2 , . . . , Xd ).

 . 
Xd
Les variables aléatoires X1 , X2 , . . . , Xd sont appelées les variables aléatoires marginales de X.
Les réalisations possibles de X sont notées :

x = (x1 , x2 , . . . , xd ),

où xi est une réalisation (valeur) de Xi .


Pour d = 2, X = (X1 , X2 ) est appelé un couple aléatoire.

L. Adjoudj ... ...


Page 2
Exemples :
1. On lance deux dés équilibrés. On note :
— X1 : le chiffre obtenu par le premier dé.
— X2 : la somme des deux chiffres.
— X3 : le maximum des deux chiffres.
Alors X = (X1 , X2 , X3 ) est un vecteur aléatoire.
2. On prélève au hasard un groupe de TD d’algèbre et on mesure la taille et le poids des
étudiants de ce groupe. On note :
— X1 : la taille en cm.
— X2 : le poids en kg.
Alors X = (X1 , X2 ) est un vecteur aléatoire (couple aléatoire).

Proposition 1.1. Soit X : (Ω, A, P) → (Rd , B(Rd )) un vecteur aléatoire de dimension d. On


définit l’application :
PX : B(Rd ) → [0, 1]
par :
PX (B) := P(X −1 (B)), ∀B ∈ B(Rd ).
Alors PX est une mesure de probabilité sur (Rd , B(Rd )).

Définition 1.3 ( (Loi conjointe d’un vecteur aléatoire)). La mesure de probabilité PX ainsi définie
est appelée loi de probabilité (ou loi conjointe) du vecteur aléatoire X. On dit que X suit la
loi PX (ou a pour loi conjointe PX ).

Définition 1.4 ( (Lois marginales)). La loi de la variable aléatoire Xi (1 ≤ i ≤ d) est appelée la


loi marginale de Xi , et est notée PXi .

Remarque 1.1. Tout sous-vecteur aléatoire de dimension strictement inférieure à d, extrait de


X, est appelé vecteur aléatoire marginal.
Par exemple, X1 ,..., Xd−1 et Xd sont chacun des marginales de X, mais aussi (X1 , X2 ) et (X1 , Xd−1 )
sont des vecteurs aléatoires marginaux.
Plus généralement, un vecteur X = (X1 , X2 , . . . , Xd ) possède d lois marginales unidimensionnelles,
d!
ainsi que Cd2 = 2!(d−2)! = d(d−1)
2
lois marginales bidimensionnelles, etc.

Remarque 1.2. La loi conjointe du vecteur X détermine les lois marginales. Néanmoins, la réci-
proque est en général fausse.

Définition 1.5. L’ensemble des valeurs possibles du vecteur aléatoire X est appelé ensemble de
définition (ou support) de X.

Définition 1.6 ( (Fonction de répartition conjointe)). On appelle fonction de répartition


conjointe de X la fonction FX : Rd → [0, 1] définie par :

FX (x) := P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xd ≤ xd ).

L. Adjoudj ... ...


Page 3
Propriétés 1.1. La fonction de répartition FX satisfait les propriétés suivantes :
1. 0 ≤ FX (x) ≤ 1 pour tout x ∈ Rd .
2. FX est croissante et continue à droite en chacun de ses arguments x1 , x2 , . . . , xd .
3. FX (x) → 0 si l’un des xi → −∞ ; et FX (x) → 1 si tous les xi → +∞.

Remarque 1.3. 1. La fonction de répartition conjointe FX caractérise la loi conjointe de X.


2. Les fonctions de répartition conjointes sont peu utilisées directement en pratique.

Il existe deux types de vecteurs aléatoires : les vecteurs aléatoires discrets et les vecteurs
aléatoires continus.

Définition 1.7 (Définition 4.7 (Loi d’un vecteur discret)). La loi d’un vecteur aléatoire discret X
(fonction de masse de X) est donnée par :

PX (x) := P (X1 = x1 , X2 = x2 , . . . , Xd = xd ).

Définition 1.8 ( (Fonction de densité d’un vecteur absolument continu)). La densité fX d’un
vecteur aléatoire absolument continu X est définie (si elle existe) comme la dérivée d’ordre d de la
fonction de répartition conjointe :
∂ d FX (x)
fX (x) := .
∂x1 ∂x2 . . . ∂xd

2 Couple aléatoire discret


Soit (X, Y ) un couple de variables aléatoires discrètes, où X(Ω) = {xi , i ∈ I} et Y (Ω) =
{yj , j ∈ J}.

Définition 2.1 (Support). Le support D du couple (X, Y ) est constitué d’un nombre fini ou
dénombrable de points de R2 .

Définition 2.2 (Loi conjointe). La loi conjointe (ou loi de probabilité) du couple (X, Y ) est donnée
par une suite de réels positifs ou nuls (pij )i∈I,j∈J tels que :

pij = P (X = xi , Y = yj ),

avec la condition de normalisation : XX


pij = 1.
i∈I j∈J

Exemple 2.1 (Loi trinômiale). Soit n ∈ N∗ et deux paramètres px , py ≥ 0 tels que px + py ≤ 1. La


loi trinômiale T (n; px , py ) est la loi du couple (X, Y ) définie par :

n!
pix pjy (1 − px − py )n−i−j si i + j ≤ n,


pij = i!j!(n − i − j)!
0

sinon.

L. Adjoudj ... ...


Page 4
Exemple 2.2. Soient p ∈ (0, 1) et λ > 0. Considérons le couple de variables aléatoires (X, Y ) à
valeurs dans {0, 1} × N dont la loi est donnée par :
e−λ λk
p00 = 1 − p, p1k = p pour tout k ∈ N,
k!
et
pjk = 0 pour les autres valeurs de (j, k).

Définition 2.3 (Fonction de répartition conjointe). La fonction de répartition conjointe du couple


(X, Y ) est définie par :
X X
FX,Y (x, y) = P (X ≤ x, Y ≤ y) = pij .
i∈I,xi ≤x j∈J,yj ≤y

Définition 2.4 (Lois marginales). La loi marginale de X est donnée par :


X
pi. = P (X = xi ) = pij , i ∈ I.
j∈J

De même, la loi marginale de Y est donnée par :


X
p.j = P (Y = yj ) = pij , j ∈ J.
i∈I

Exemple 2.3. On jette deux dés équilibrés. On note :

X = nombre de dés pairs obtenus, Y = maximum des valeurs obtenues.

Alors :
X(Ω) = {0, 1, 2}, Y (Ω) = {1, 2, 3, 4, 5, 6}.
Le support est :

D = {(0, 1), (0, 3), (0, 5), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 2), (2, 4), (2, 6)}.

La loi conjointe et les lois marginales peuvent être résumées dans un tableau de contingence.

X\Y 1 2 3 4 5 6 Pi.
1 3 5 9
0 36
0 36
0 36
0 36
2 2 4 4 6 18
1 0 36 36 36 36 36 36
1 3 5 9
2 0 36
0 36
0 36 36
1 3 5 7 9 11
P.j 36 36 36 36 36 36
1

Définition 2.5 (Loi conditionnelle). La loi conditionnelle de X sachant Y = yj est donnée par :
pij
P (X = xi | Y = yj ) = , si p.j > 0.
p.j
De même, la loi conditionnelle de Y sachant X = xi est donnée par :
pij
P (Y = yj | X = xi ) = , si pi. > 0.
pi.

L. Adjoudj ... ...


Page 5
Exemple 2.4. Pour l’exemple des dés, on a par exemple :

p05 5/36 5 4
P (X = 0 | Y = 5) = = = , P (X = 1 | Y = 5) = , P (X = 2 | Y = 5) = 0.
p5 9/36 9 9

Définition 2.6 (Somme de deux variables aléatoires discrètes indépendantes). Soient X et Y deux
variables aléatoires discrètes indépendantes et Z = X + Y . La loi de Z est donnée par :
X
P (Z = z) = P (X = x)P (Y = z − x).
x∈X(Ω)

Exemple 2.5 (Somme de deux lois de Poisson). Soient X ∼ P(λ) et Y ∼ P(µ) deux variables
aléatoires indépendantes. Alors S = X + Y suit la loi de Poisson de paramètre λ + µ : Comme X
et Y sont indépendantes, on a :
k k k
X X e−λ λi e−µ µk−i X λi µk−i
P (S = k) = P (X+Y = k) = P (X = i)P (Y = k−i) = = e−(λ+µ) .
i=0 i=0
i! (k − i)! i=0
i!(k − i)!

En utilisant la formule du binôme de Newton :


k
X λi µk−i (λ + µ)k
= .
i=0
i!(k − i)! k!

Ainsi :
+ µ)k
−(λ+µ) (λ
P (S = k) = e .
k!
Donc S = X + Y suit la loi de Poisson de paramètre λ + µ, c’est-à-dire S ∼ P(λ + µ).

3 Couple aléatoire absolument continu


Définition 3.1 (Support). Le support d’un couple aléatoire continu (X, Y ) est une partie de R2 ,
notée D = X(Ω) × Y (Ω) ⊆ R2 .

Définition 3.2 (Couple aléatoire absolument continu). Un couple aléatoire (X, Y ) est dit abso-
lument continu si sa fonction de répartition FX,Y est continue à droite et à gauche par rapport
à chacune des variables, et possède des dérivées partielles secondes sur un support non vide D.

Définition 3.3 (Densité conjointe). On appelle fonction de densité de probabilité (ou densité
conjointe) d’un couple aléatoire absolument continu (X, Y ) toute application
fX,Y : R2 → R définie par :

∂ 2 FX,Y (x, y)
fX,Y (x, y) = , pour (x, y) ∈ D,
∂x ∂y

et fX,Y (x, y) = 0 sinon.

L. Adjoudj ... ...


Page 6
Exemple 3.1. Soit FX,Y la fonction de répartition d’un couple (X, Y ) définie par :



 0 si x ≤ 0 ou y ≤ 0,
 2
 y16 (2x2 − y 2 ) si 0 ≤ y ≤ x ≤ 2,




2
FX,Y (x, y) = y16 (8 − y 2 ) si 0 ≤ y ≤ 2, x ≥ y,

x4

si 0 < x ≤ y, x ≤ 2,




 16

1 si x ≥ 2, y ≥ 2.

Alors la densité conjointe est donnée par :



 xy si 0 ≤ y ≤ x ≤ 2,
2
fX,Y (x, y) =
0 sinon.
Propriétés 3.1 (Propriétés de la densité conjointe). La densité conjointe fX,Y vérifie les propriétés
suivantes :
1. fX,Y (x, y) ≥ 0 pour tout (x, y) ∈ R2 ;
2. fX,Y est continue sur R2 (éventuellement discontinue sur un ensemble de mesure nulle) ;
3. La densité est normalisée : ZZ
fX,Y (x, y) dx dy = 1;
R2
4. Pour tout a ≤ b, c ≤ d :
Z bZ d
P (a ≤ X ≤ b, c ≤ Y ≤ d) = fX,Y (x, y) dy dx.
a c

Exemple 3.2. Considérons un couple aléatoire (X, Y ) ayant pour densité conjointe :

4xy si 0 ≤ x ≤ 1, 0 ≤ y ≤ 1,
fX,Y (x, y) =
0 ailleurs.
Alors fX,Y est bien une densité car :
ZZ Z 1 Z 1
fX,Y (x, y) dx dy = 4xy dy dx = 1.
R2 0 0

Exemple 3.3. Considérons fX,Y (x, y) = 31 ⊮[0,1] (x)⊮[1,2] (y). Il s’agit bien d’une densité car :
Z Z
1
fX,Y (x, y) dx dy = ⊮[0,1] (x)⊮[1,2] (y) dx dy
R2 R2 3
1 1 2
Z Z
= 1 dy dx
3 0 1
1 1
Z
= (2 − 1) dx
3 0
1 1
Z
= 1 dx
3 0
1
= × 1 = 1.
3

L. Adjoudj ... ...


Page 7
Ainsi, fX,Y (x, y) est une densité.

Proposition 3.1. (Fonction de répartition conjointe) La fonction de répartition conjointe FX,Y (x, y)
vérifie les propriétés suivantes :
Z x Z y
FX,Y (x, y) = P (X ≤ x et Y ≤ y) = fX,Y (u, v) du dv.
−∞ −∞

Exemple 3.4. Soit fX,Y (x, y) = e−(x+y) pour x ≥ 0 et y ≥ 0, et 0 sinon.


La fonction de répartition conjointe est donnée par :
Z x Z y
FX,Y (x, y) = e−(u+v) du dv.
0 0
Nous calculons cette double intégrale :
Z x Z y 
−(u+v)
FX,Y (x, y) = e dv du.
0 0
En résolvant l’intégrale intérieure par rapport à v :
Z x  −v y
Z x
−u
e−u 1 − e−y du.

= e −e 0 du =
0 0
En résolvant l’intégrale extérieure par rapport à u :
Z x
−y
e−u du = 1 − e−y 1 − e−x .
  
= 1−e
0
Ainsi, la fonction de répartition conjointe est :

FX,Y (x, y) = 1 − e−x 1 − e−y ,


 
x ≥ 0, y ≥ 0.

Définition 3.4. (Fonctions de répartition marginales)


La loi marginale de X possède la fonction de répartition FX donnée par :

FX (x) = lim FX,Y (x, y).


y→∞

De même, la loi marginale de Y possède la fonction de répartition FY donnée par :

FY (y) = lim FX,Y (x, y).


x→∞

Exemple 3.5. Soit FX,Y (x, y) = (1 − e−2x )(1 − e−3y ) pour x ≥ 0 et y ≥ 0, et 0 sinon.
Nous obtenons les fonctions de répartition marginales suivantes :
- Pour FX (x) :

FX (x) = lim FX,Y (x, y) = 1 − e−2x , x ≥ 0.


y→∞

- Pour FY (y) :

L. Adjoudj ... ...


Page 8
FY (y) = lim FX,Y (x, y) = 1 − e−3y , y ≥ 0.
x→∞

Définition 3.5. (Densité marginale)


La loi marginale de X possède la densité FX (x) définie par :
 
d d
FX (x) = FX (x) = lim FX,Y (x, y) .
dx dx y→∞

De même, la loi marginale de Y possède la densité FY (y) définie par :

d d  
FY (y) = FY (y) = lim FX,Y (x, y) .
dy dy x→∞
Exemple 3.6. Soit fX,Y la densité conjointe du couple (X, Y ), donnée par :

4xy si 0 ≤ x ≤ 1, 0 ≤ y ≤ 1,
fX,Y (x, y) =
0 sinon.
On obtient les densités marginales en intégrant la densité conjointe :
Z 1 Z 1
1
fX (x) = 4xy dy = 4x y dy = 4x × = 2x, 0 ≤ x ≤ 1.
0 0 2
Z 1 Z 1
1
fY (y) = 4xy dx = 4y x dx = 4y × = 2y, 0 ≤ y ≤ 1.
0 0 2
Définition 3.6. (Lois conditionnelles)
La densité conditionnelle de Y sachant X = x est définie par :

fX,Y (x, y)
fY |X (y) = pour fX (x) > 0.
fX (x)
De même, la densité conditionnelle de X sachant Y = y est :

fX,Y (x, y)
fX|Y (x) = pour fY (y) > 0.
fY (y)
Exemple 3.7. Soit la densité conjointe :

fX,Y (x, y) = x + y pour 0 ≤ x ≤ 1, 0 ≤ y ≤ 1,


et fX,Y (x, y) = 0 sinon.
Calculons la densité marginale de X :
Z 1
1
fX (x) = (x + y) dy = x + , 0 ≤ x ≤ 1.
0 2
Ensuite, la densité conditionnelle de Y sachant X = x est :

L. Adjoudj ... ...


Page 9
fX,Y (x, y) x+y
fY |X (y) = = , 0 ≤ y ≤ 1.
fX (x) x + 21

Définition 3.7. (Somme de deux variables aléatoires continues indépendantes)


Soient X et Y deux variables indépendantes admettant des densités fX et fY , et soit Z = X +Y .
Alors Z admet une densité fZ donnée par la formule de convolution :
Z +∞
fZ (z) = fX (x)fY (z − x) dx, ∀z ∈ R.
−∞

On dit que fZ est le produit de convolution de fX et fY .

Exemple 3.8. (Somme de deux variables indépendantes exponentielles)


Soient X et Y deux variables aléatoires indépendantes de loi exponentielle de paramètre λ > 0 :

fX (x) = λe−λx pour x ≥ 0; fY (y) = λe−λy pour y ≥ 0.


Nous voulons calculer la densité de Z = X + Y :
Z z Z z
fZ (z) = fX (x)fY (z − x) dx = λe−λx λe−λ(z−x) dx.
0 0
En simplifiant :
Z z
2 −λz
=λ e dx = λ2 ze−λz .
0
Ainsi, la densité de Z est donnée par :

fZ (z) = λ2 ze−λz , z ≥ 0.

4 Indépendance
Définition 4.1. Les variables aléatoires X1 , X2 , . . . , Xd sont dites mutuellement indépendantes
si, et seulement si, pour tout (x1 , x2 , . . . , xd ) ∈ Rd , on a :

d
Y
P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xd ≤ xd ) = P (Xi ≤ xi ).
i=1

Autrement dit, en termes de fonction de répartition :

d
Y
FX (x1 , x2 , . . . , xd ) = FXi (xi ).
i=1

Définition 4.2. Les variables aléatoires X1 , X2 , . . . , Xd sont mutuellement indépendantes si, et


seulement si :

L. Adjoudj ... ...


Page 10
— Cas discret :
d
Y
P (X1 = x1 , X2 = x2 , . . . , Xd = xd ) = P (Xi = xi ).
i=1

— Cas continu :
d
Y
fX (x1 , x2 , . . . , xd ) = fXi (xi ).
i=1

Exemple 4.1. Exemple 5.1. Considérons le couple (X, Y ) de loi donnée par la densité :

1
fX,Y (x, y) = 1 1 (x, y).
3 [0,1]×[0, 2 ]
Les densités marginales sont alors :
Z 1/2 Z 1/2
1 1
fX (x) = fX,Y (x, y) dy = dy = , 0 ≤ x ≤ 1,
0 0 3 6
et Z 1 Z 1
1 1 1
fY (y) = fX,Y (x, y) dx = dx = , 0≤y≤ .
0 0 3 3 2
On a :

1 1 1
fX,Y (x, y) = fX (x)fY (y) = × = .
6 3 18
Mais on remarque que :

1 1
̸= = fX (x)fY (y).
fX,Y (x, y) =
3 18
Ainsi, X et Y ne sont pas indépendantes.

Exemple 4.2. Considérons le couple (X, Y ) de loi donnée par la densité :



2e−x e−2y , x ≥ 0, y ≥ 0,
fX,Y (x, y) =
0, sinon.
Les densités marginales sont :
Z +∞ Z +∞
−x −2y −x 1
fX (x) = 2e e dy = 2e e−2y dy = 2e−x × = e−x , x ≥ 0.
0 0 2
Z +∞ Z +∞
−x −2y −2y
fY (y) = 2e e dx = 2e e−x dx = 2e−2y × 1 = 2e−2y , y ≥ 0.
0 0
Calculons le produit des densités marginales :

fX (x)fY (y) = e−x 2e−2y = 2e−x e−2y .


 

L. Adjoudj ... ...


Page 11
Comparons avec la densité conjointe :

fX,Y (x, y) = 2e−x e−2y .


On a fX,Y (x, y) = fX (x)fY (y), donc X et Y sont indépendantes.

Exemple 4.3. Soit (X1 , X2 , X3 ) un triplet de variables aléatoires dont la loi conjointe est donnée
par :

 1 , si (x , x , x ) ∈ D,
1 2 3
P (X1 = x1 , X2 = x2 , X3 = x3 ) = 4
0, sinon,
avec

D = {(0, 0, 0), (1, 1, 0), (1, 0, 1), (0, 1, 1)}.


On a :

 1 , si x = 0 ou x = 1,
i i
P (Xi = xi ) = 2
0, sinon.

et

 1 , pour tout (x , x ) ∈ {(0, 0), (1, 1), (1, 0), (0, 1)},
i j
P (Xi = xi , Xj = xj ) = 4
0, sinon.

On observe que :

P (Xi = xi , Xj = xj ) = P (Xi = xi )P (Xj = xj ),


donc X1 , X2 , X3 sont deux à deux indépendantes.
En revanche,

P (X1 = x1 , X2 = x2 , X3 = x3 ) ̸= P (X1 = x1 )P (X2 = x2 )P (X3 = x3 ),


donc X1 , X2 , X3 ne sont pas mutuellement indépendantes.

Exemple 4.4. Soit (X1 , X2 , X3 , X4 ) un quadruplet de variables aléatoires dont la densité conjointe
est donnée par :


8x x x , si 0 ≤ x ≤ 1, x = 1 − x − x − x , x ≥ 0,
1 2 3 i 4 1 2 3 4
fX1 ,X2 ,X3 ,X4 (x1 , x2 , x3 , x4 ) =
0, sinon.

Cette densité est bien définie car :

L. Adjoudj ... ...


Page 12
Z 1 Z 1−x1 Z 1−x1 −x2
8x1 x2 x3 dx3 dx2 dx1 = 1.
0 0 0
On peut montrer que les densités marginales sont :

fX1 (x1 ) = 4x1 (1 − x1 )2 , 0 ≤ x1 ≤ 1,

fX2 (x2 ) = 4x2 (1 − x2 )2 , 0 ≤ x2 ≤ 1,

fX3 (x3 ) = 4x3 (1 − x3 )2 , 0 ≤ x3 ≤ 1.


De même, on obtient les densités marginales bivariées :

fX1 ,X2 (x1 , x2 ) = 4x1 x2 (1 − x1 − x2 ), 0 ≤ x1 + x2 ≤ 1.


On constate que :

fX1 ,X2 (x1 , x2 ) ̸= fX1 (x1 )fX2 (x2 ),


donc X1 et X2 **ne sont pas indépendantes**.
En revanche, si l’on considère les paires (X1 , X4 ), (X2 , X4 ), on peut vérifier que ces paires ne
sont pas indépendantes non plus.
Ainsi, les variables X1 , X2 , X3 , X4 **ne sont pas mutuellement indépendantes, ni deux à deux
indépendantes**.

5 Changement de variables
Soient X1 , X2 , . . . , Xd des variables aléatoires ayant une densité conjointe connue fX1 ,X2 ,...,Xd (x1 , x2 , . . . , xd ).
On considère une transformation :

Y1 = g1 (X1 , X2 , . . . , Xd ), Y2 = g2 (X1 , X2 , . . . , Xd ), ..., Yd = gd (X1 , X2 , . . . , Xd ).

On suppose que :
— Les fonctions gi sont de classe C 1 (possèdent des dérivées partielles continues).
— Le jacobien :
 ∂g ∂g1 ∂g1

1
∂x ∂x2
... ∂xd
 ∂g21 ∂g2 ∂g2 
 ∂x1 ∂x2
... ∂xd 

J(x1 , x2 , . . . , xd ) = det 
 .. .. .. ..  ̸= 0
 . . . . 
∂gd ∂gd ∂gd
∂x1 ∂x2
... ∂xd

L. Adjoudj ... ...


Page 13
— Le système yi = gi (x1 , . . . , xd ) admet une solution unique xi = hi (y1 , . . . , yd ).
Alors, la densité conjointe de (Y1 , Y2 , . . . , Yd ) est donnée par la formule :

fY1 ,Y2 ,...,Yd (y1 , y2 , . . . , yd ) = fX1 ,X2 ,...,Xd (x1 , x2 , . . . , xd ) · |J(x1 , x2 , . . . , xd )|−1
où xi = hi (y1 , . . . , yd ).

Exemple 5.1. Soit (X, Y ) un couple de variables aléatoires absolument continues de densité
fX,Y (x, y). On pose :

U = X + Y, V = X − Y.
Exprimons la densité de (U, V ) en fonction de celle de (X, Y ).
On a les relations inverses :

U +V U −V
, x= y= .
2 2
Le jacobien de la transformation est :
! !
∂x ∂x 1 1
∂u ∂v 2 2
1
J = det ∂y ∂y = det 1
=− .
∂u ∂v 2
− 21 2
Ainsi :

1
|J| = .
2
La densité de (U, V ) est donnée par :
 
u+v u−v 1
fU,V (u, v) = fX,Y , · .
2 2 2

Supposons que X et Y soient indépendantes et uniformes sur [0, 1] :



1 si (x, y) ∈ [0, 1]2
fX,Y (x, y) =
0 sinon.

Alors :

1 si 0 ≤ u+v
≤ 1, 0 ≤ u−v
≤1
2 2 2
fU,V (u, v) =
0 sinon.
Les conditions sur u et v deviennent :

u+v u−v
0≤ ≤ 1 et 0 ≤ ≤1
2 2
⇐⇒ 0 ≤ u + v ≤ 2 et 0 ≤ u − v ≤ 2.

L. Adjoudj ... ...


Page 14
6 Caractéristiques numériques
Nous commençons par des relations entre variables aléatoires, nécessaires à l’étude des vecteurs
aléatoires et intéressantes en elles-mêmes dans les applications.

6.1 Espérance E
Propriétés 6.1. Soient X et Y deux variables aléatoires réelles. Alors :

E(X + Y ) = E(X) + E(Y ).


De plus, pour tout k, ℓ ∈ N, on a :
X X


 xk y ℓ PX,Y (x, y), (cas discret)
k ℓ x y
E[X Y ] = Z +∞ Z +∞
xk y ℓ fX,Y (x, y) dx dy, (cas continu).



−∞ −∞

Si X et Y sont indépendantes, alors :

E(XY ) = E(X) E(Y ).

6.2 Covariance Cov


Définition 6.1. La covariance de X et Y , si elle existe, est définie par :

Cov(X, Y ) = E [(X − E(X))(Y − E(Y ))] = E(XY ) − E(X) E(Y ).

Propriétés 6.2. Pour toutes variables aléatoires X, Y, Z et a, b, c, d ∈ R, on a :


1. Cov(X, X) = Var(X) ≥ 0,
2. Cov(X, Y ) = Cov(Y, X),
3. Var(X + Y ) = Var(X) + 2 Cov(X, Y ) + Var(Y ),
4. Var ( ni=1 Xi ) = ni=1 Var(Xi ) + 2 1≤i<j≤n Cov(Xi , Xj ),
P P P

5. Cov(X + Z, Y ) = Cov(X, Y ) + Cov(Z, Y ),


6. Cov(X, Y + Z) = Cov(X, Y ) + Cov(X, Z),
7. Cov(aX + b, cY + d) = ac Cov(X, Y ).

6.3 Coefficient de corrélation ρ


Définition 6.2. Soient X et Y deux variables aléatoires de variances finies. Leur coefficient de
corrélation, s’il existe, est le nombre :

L. Adjoudj ... ...


Page 15
Cov(X, Y )
ρ(X, Y ) =
σX σY
où σX est l’écart-type de X et σY celui de Y .

Propriétés 6.3. Pour toutes variables aléatoires X, Y et réels a, b, c, d, on a :


1. −1 ≤ ρ(X, Y ) ≤ 1,
2. ρ(X, X) = 1, ρ(X, −X) = −1,
3. ρ(aX + b, cY + d) = ρ(X, Y ) si ac > 0.

Propriétés 6.4. Si X et Y sont indépendantes, alors :


1. E(XY ) = E(X) E(Y ),
2. Cov(X, Y ) = 0,
3. Var(X + Y ) = Var(X) + Var(Y ),
4. ρ(X, Y ) = 0.

Remarque 6.1. Les propriétés de l’espérance mathématique pour les vecteurs aléatoires découlent
directement de celles de l’espérance mathématique des variables aléatoires.

7 Espérance et covariance d’un vecteur aléatoire


Définition 7.1 (Espérance d’un vecteur aléatoire). L’espérance (ou vecteur moyen) d’un vecteur
aléatoire X = (X1 , X2 , . . . , Xd )T est définie par le vecteur des espérances marginales :
 
E(X1 )
E(X2 )
 
mX = E(X) =  . 
 .. 

E(Xd )

Exemple 7.1. Soit X = (X1 , X2 , X3 )T un vecteur de variables aléatoires indépendantes, de den-


sités :
fX1 (x) = 2e−2x , fX2 (x) = 3e−3x , fX3 (x) = 4e−4x , x ≥ 0
Ces lois sont exponentielles de paramètres respectifs 2, 3 et 4. On a :
1 1 1
E(X1 ) = , E(X2 ) = , E(X3 ) =
2 3 4
Donc :  
1
2
1
E(X) = 3
1
4

L. Adjoudj ... ...


Page 16
Remarque 7.1. Si E(X) = 0d , on dit que le vecteur aléatoire X est centré.

Définition 7.2 (Matrice de covariance). La matrice de covariance (ou matrice de dispersion) d’un
vecteur aléatoire X = (X1 , X2 , . . . , Xd )T est définie par :

CX = Var(X) = E (X − E(X))(X − E(X))T = E[XX T ] − E(X)E(X)T


 

Sous forme matricielle :


 
Var(X1 ) Cov(X1 , X2 ) · · · Cov(X1 , Xd )
Cov(X2 , X1 ) Var(X2 ) · · · Cov(X2 , Xd )
 
CX =  .. .. .. .. 

 . . . .


Cov(Xd , X1 ) Cov(Xd , X2 ) ··· Var(Xd )

Remarque 7.2.
1. La matrice CX généralise la notion de variance.
2. Elle est carrée, symétrique et semi-définie positive.
3. Si les variables Xi sont indépendantes, la matrice CX est diagonale.

Exemple 7.2. Considérons le vecteur gaussien V = (X, Y, Z)T de moyenne :


   
1 3 1 0
mV = 1 et de matrice de covariance CV = 1 3 0
   

1 0 0 2

Montrons que CV est bien une matrice de covariance.


Symétrie : la matrice est manifestement symétrique.
Définie positive : calculons les mineurs principaux :

3 1 0
3 1
|3| = 3, = 8, 1 3 0 = 16
1 3
0 0 2

Tous les mineurs principaux sont strictement positifs, donc CV est définie positive, et en particulier
semi-définie positive.
On en conclut que CV est bien une matrice de covariance.

Définition 7.3 (Transformation affine d’un vecteur aléatoire). Soient A ∈ Rp×d une matrice et
b ∈ Rp un vecteur. Si Y = AX + b, alors :

E(Y ) = AE(X) + b
CY = ACX AT

L. Adjoudj ... ...


Page 17
Exemple 7.3. Soit X = (X1 , X2 )T un vecteur aléatoire tel que :
! !
1 4 1
E(X) = et CX =
2 1 2

Considérons la transformation affine Y = AX + b avec :


! !
2 0 5
A= , b=
1 3 −1

Calcul de l’espérance de Y :
! ! ! ! ! !
2 0 1 5 2 5 7
E(Y ) = AE(X) + b = + = + =
1 3 2 −1 6 −1 5

Calcul de la matrice de covariance de Y :


! ! ! !
2 0 4 1 2 1 16 14
CY = ACX AT = =
1 3 1 2 0 3 14 28
| 
{z  }
8 2 
= 
7 7

Donc : ! !
7 16 14
E(Y ) = , CY =
5 14 28

8 Espérance conditionnelle et variance conditionnelle


Définition 8.1 (Espérance conditionnelle). On définit l’espérance conditionnelle de Y sachant
X = x, notée E(Y | X = x), comme l’espérance de Y prise par rapport à sa loi conditionnelle
sachant X = x.

— Dans le cas d’une loi absolument continue, on a :


Z +∞ Z +∞
fX,Y (x, y)
E(Y | X = x) = yfY |X (y | x) dy = y dy
−∞ −∞ fX (x)

— Dans le cas d’une loi discrète, on a :


X X P(X = x, Y = y)
E(Y | X = x) = y P(Y = y | X = x) = y
y∈Y y∈Y
P(X = x)

Remarque 8.1. La fonction x 7→ E(Y | X = x) est une fonction réelle appelée fonction de
régression. Lorsque X est une variable aléatoire, E(Y | X) est aussi une variable aléatoire,
appelée espérance conditionnelle de Y sachant X.

L. Adjoudj ... ...


Page 18
Exercice 1
Soient Y ∼ P(λ) et Z ∼ P(µ) deux variables aléatoires indépendantes, de lois de Poisson
respectives de paramètres λ > 0 et µ > 0. On pose :

X =Y +Z
Alors X ∼ P(λ + µ). On s’intéresse à la loi de Y sachant que X = n, pour un entier n ∈ N.
1. Déterminer la loi conditionnelle de Y sachant X = n, c’est-à-dire donner l’expression de
P(Y = k | X = n), pour k ∈ {0, 1, . . . , n}.
2. En déduire l’espérance conditionnelle E(Y | X = n), puis exprimer l’espérance condition-
nelle E(Y | X) comme fonction de la variable aléatoire X.

Solution
Soient Y ∼ P(λ) et Z ∼ P(µ) deux variables aléatoires indépendantes, de lois de Poisson
respectives de paramètres λ et µ. On pose X = Y + Z, alors X ∼ P(λ + µ).

1. Loi conditionnelle de Y sachant X = n


On a :

P(Y = k , X = n)
P(Y = k | X = n) = .
P(X = n)
Or, X = Y + Z, donc nous avons :

P(Y = k et X = n) = P(Y = k, Y + Z = n).


Puisque Y et Z sont indépendantes :

P(Y = k , Y + Z = n) = P(Y = k)P(Z = n − k).

Nous savons que Y ∼ P(λ) et Z ∼ P(µ), donc :

λk e−λ µn−k e−µ


P(Y = k) = , P(Z = n − k) = .
k! (n − k)!
Ainsi,

λk e−λ µn−k e−µ


P(Y = k , X = n) = · .
k! (n − k)!
De plus, P(X = n) est la probabilité que la somme de Y et Z prenne la valeur n, c’est-à-dire :

L. Adjoudj ... ...


Page 19
(λ + µ)n e−(λ+µ)
P(X = n) = .
n!
La probabilité conditionnelle est donc :

λk e−λ µn−k e−µ


k!
· (n−k)!
P(Y = k | X = n) = (λ+µ)n e−(λ+µ)
n!
k
n! · λ · µ e−(λ+µ)
n−k
1
= · −(λ+µ) · .
k!(n − k)! e (λ + µ)n
Cela revient à :
 k  n−k
λ µ
P(Y = k | X = n) = Cnk .
λ+µ λ+µ
 
λ
Ainsi, Y | X = n ∼ B n, λ+µ .

2. Espérance conditionnelle de Y sachant X = n


L’espérance conditionnelle E(Y | X = n) pour une variable aléatoire suivant une loi binomiale
λ
B(n, p) est donnée par n · p. Ici, p = λ+µ , donc :

λ
E(Y | X = n) = n · .
λ+µ

Espérance conditionnelle E(Y | X)


λ
Puisque E(Y | X = n) = n · λ+µ , et que X est une variable aléatoire, l’espérance conditionnelle
de Y sachant X est :

λ
E(Y | X) = X · .
λ+µ
Cela signifie que E(Y | X) est une fonction de X et donc une variable aléatoire.

Exercice 2
Soit (X, Y ) un couple aléatoire ayant une densité uniforme sur le triangle :

T = (x, y) ∈ R2 : 0 < y < x < 1 .




On note fX,Y la densité conjointe de (X, Y ).


1. Déterminer la densité conjointe fX,Y (x, y).
2. En déduire les densités marginales fX (x) et fY (y).

L. Adjoudj ... ...


Page 20
3. Déterminer la densité conditionnelle fY |X=x (y).
4. Calculer l’espérance conditionnelle E(Y | X = x).
5. En déduire la fonction de régression E(Y | X).

Corrigé
Soit (X, Y ) un couple aléatoire ayant une densité uniforme sur le triangle

T = (x, y) ∈ R2 : 0 < y < x < 1 .




La densité conjointe est alors donnée par :

fX,Y (x, y) = 2 · 1T (x, y),

où 1T désigne la fonction indicatrice de l’ensemble T .

1. Densités marginales :
— Pour X, on intègre par rapport à y :
Z x
fX (x) = 2 dy = 2x · 1(0,1) (x).
0

— Pour Y , on intègre par rapport à x :


Z 1
fY (y) = 2 dx = 2(1 − y) · 1(0,1) (y).
y

2. Densité conditionnelle de Y sachant X = x :

fX,Y (x, y) 2 · 1(0,x) (y) 1


fY |X=x (y) = = = · 1(0,x) (y).
fX (x) 2x x

3. Espérance conditionnelle de Y sachant X = x :


x x
1 x2
Z Z
1 1 x
E(Y | X = x) = y · dy = · y dy = · = .
0 x x 0 x 2 2

4. Fonction de régression :

X
E(Y | X) = .
2

L. Adjoudj ... ...


Page 21
9 Théorème de l’espérance totale
Théorème (1) (Théorème de l’espérance totale). Soit Y une variable aléatoire intégrable. Alors
la variable E(Y | X) est également intégrable, et on a :

E[E(Y | X)] = E(Y )

Démonstration (cas absolument continu). Supposons que (X, Y ) admet une densité conjointefX,Y (x, y),
et que la densité marginale de X est fX (x). Alors :

Z ∞
E[E(Y | X)] = E(Y | X = x)fX (x) dx
Z−∞
Z ∞
∞ 
= y · fY |X=x (y) dy fX (x) dx
−∞ −∞
Z ∞Z ∞
fX,Y (x, y)
= y· · fX (x) dy dx
−∞ −∞ fX (x)
Z ∞Z ∞
= y · fX,Y (x, y) dy dx
−∞ −∞
Z ∞ Z ∞ 
= fX,Y (x, y) dx y dy
−∞ −∞
Z ∞
= y · fY (y) dy = E(Y )
−∞

Exemple : On calcule l’espérance de l’espérance conditionnelle. Pour l’exercice précédent,


λ λ λ
E[E(Y | X)] = E(X · )= E(X) = (λ + µ) = E(Y ).
λ+µ λ+µ λ+µ

Définition 9.1 (Variances conditionnelles). La variance conditionnelle est donnée par la formule
suivante :

Var(Y | X = x) = E[(Y − E(Y | X = x))2 | X = x] = E[Y 2 | X = x] − (E[Y | X = x])2 .

De même, Var(Y | X = x) est une variable aléatoire, étant fonction de X, on peut calculer son
espérance.

Théorème (2) (Théorème de la variance totale). Soit (X, Y ) un couple aléatoire, alors :

E[Var(Y | X)] + Var(E(Y | X)) = Var(Y ).

L. Adjoudj ... ...


Page 22

Vous aimerez peut-être aussi