0% ont trouvé ce document utile (0 vote)
2 vues46 pages

Chap 1

Le cours de Probabilités et Simulations, dirigé par Mohamed El Arrouchi, couvre les bases de la théorie des probabilités et de la modélisation probabiliste à travers divers chapitres, y compris les mesures de probabilité et la convergence des variables aléatoires. Les objectifs incluent la compréhension des concepts fondamentaux, la manipulation des lois de probabilité et l'utilisation du logiciel R pour des simulations. L'évaluation repose sur des devoirs, projets, travaux pratiques et un examen final, avec une attention particulière à l'assiduité.

Transféré par

anas.glioula
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
2 vues46 pages

Chap 1

Le cours de Probabilités et Simulations, dirigé par Mohamed El Arrouchi, couvre les bases de la théorie des probabilités et de la modélisation probabiliste à travers divers chapitres, y compris les mesures de probabilité et la convergence des variables aléatoires. Les objectifs incluent la compréhension des concepts fondamentaux, la manipulation des lois de probabilité et l'utilisation du logiciel R pour des simulations. L'évaluation repose sur des devoirs, projets, travaux pratiques et un examen final, avec une attention particulière à l'assiduité.

Transféré par

anas.glioula
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Licence MID/Semestre 5

Probabilités et Simulations
Mohamed El Arrouchi

Département de Mathématiques-FSK

Email : [Link]@[Link]
Google Classroom : aakovjtk

Année Universitaire 2025-2026


Plan du cours

Chap.1 : Mesures de probabilité (3 séances)


Chap.2 : Indépendance (2 séances)
Chap.3 : Convergence de suites de variables aléatoires (3 séances)
Chap.4 : Probabilités et espérances conditionnelles (3 séances)
Chap.5 : Simulation de lois avec le logiciel R (2 séances )

El Arrouchi 2 / 46
Objectifs du cours

Comprendre le problème de la modélisation probabiliste et acquérir les premières notions


fondamentales de la théorie des probabilités.
Fournir un modèle mathématique pour une "expérience aléatoire".
Fournir les notions de base du calcul de probabilités et des lois usuelles qui interviennent
dans des problèmes réels sur lesquelles repose l’inférence statistique.
Connaître, savoir manipuler et simuler avec aisance ces lois usuelles.
Se familiariser avec différents modes de convergence d’une suite de variables aléatoires
réelles, comprendre les formulations rigoureuses des théorèmes de convergence et savoir les
appliquer dans différents contextes.

El Arrouchi 3 / 46
Références

Slides : résumé de cours (peu d’exemple, peu d’explications, donc prendre des notes !),
et travaux dirigés.
Pour aller plus loin :
▶ J-F. Le Gall. Intégration, Probabilités, Processus aléatoires,
https ://[Link]/ jflegall/[Link]
▶ Jean-Yves Ouvrard. Probabilités. Tomes 1 et 2. Cassini, 2008.
▶ Rick Durrett. Probability : theory and examples. 4th Edition, Cambridge series in statistical
and probabilitic Mathematics, 2010.

El Arrouchi 4 / 46
Modalités d’évaluation

Devoirs+Projets+TP+Bonus (D)
Examen (E)
 
Note finale = max E , E +D
2
.

NB : L’assiduité est prise en compte.

El Arrouchi 5 / 46
Chapitre 1 : Mesures de probabilité
Notion d’expérience aléatoire
Les probabilités vont nous servir à modéliser une expérience aléatoire, c’est-à-dire un
phénomène dont le résultat ne peut être prévu avec une totale certitude.
Une expérience aléatoire se décrit mathématiquement par la donnée d’un ensemble Ω
(univers ou ensemble fondamental ) dont les éléments notés ω sont les résultats (ou
issues) possibles de l’expérience (appelés événements élémentaires).
Un événement aléatoire peut être représenté par une partie de Ω. Il sera toujours
représenté par l’ensemble des résultats ω pour lesquels il est réalisé. Le contraire de
l’événement A correspond au complémentaire de A dans Ω, noté Ac = Ā := Ω \ A.
L’événement A ou B correspond à la réunion A ∪ B. L’événement A et B correspond à
l’intersection A ∩ B. L’événement A implique l’événement B si A ⊂ B. L’événement
impossible sera noté ∅ et l’événement certain sera noté Ω. A et B sont incompatibles si
A ∩ B = ∅.
A priori il pourrait sembler naturel de considérer que toute partie de Ω représente un
événement, mais cela n’est possible que si Ω est dénombrable. Pour des espaces plus
grands, Ω = R (ou Rd ou un espace métrique E ) on a besoin de la notion de tribu.
El Arrouchi 6 / 46
Tribus
Pour un ensemble X , on note P(X ) = {A : A ⊂ X } l’ensemble de ses parties.
Définition
A ⊂ P(Ω) est une tribu (ou σ-algèbre) sur Ω si
1 Ω ∈ A;
2 A ∈ A ⇒ Ac ∈ A (stabilité par passage au complémentaire) ;
[
3 A0 , A1 , A2 , · · · ∈ A ⇒ An ∈ A (stabilité par réunion dénombrable).
n⩾0
Le couple (Ω, A) s’appelle un espace mesurable (probabilisable).

Remarque
Par passage au complémentaire une tribu est aussi stable par intersection dénombrable.
Si la stabilité par réunion dénombrable est remplacée par la stabilité par réunion finie, on
définit alors une algèbre. Toute tribu est une algèbre.
Les éléments de la tribu A sont appelées « mesurables (événements) ».
El Arrouchi 7 / 46
Exemples
La plus petite tribu est {∅, Ω} (tribu grossière), la plus grande est P(Ω) (tribu totale).
La famille des ouverts de Rd n’est pas une tribu.
Une réunion de deux tribus n’est pas une tribu en général.
Une intersection d’un nombre quelconque de tribus est une tribu.

En général il n’est pas facile de décrire tous les éléments d’une tribu ; on utilise le plus souvent
leurs générateurs.
Définition
Soit M ⊂ P(Ω). La tribu σ(M) engendrée par M est la plus petite tribu contenant M ; elle
est donc l’intersection de toutes les tribus contenant M (cette intersection est non vide car
P(Ω) est une tribu contenant M).

Exemple
Soit A un sous-ensemble de Ω. La tribu σ({A}) = {∅, A, Ā, Ω}.
El Arrouchi 8 / 46
Définition
Si Ω = E est un espace topologique , on appelle tribu borélienne, notée B(E ), la tribu engendrée par
les ouverts de E . Tout élément de cette tribu est appelé borélien.

Remarque
La tribu borélienne est aussi engendrée par les fermés. Sur Rd , la tribu borélienne coincide avec la tribu engendrée
Qd Qd
par les pavés ouverts ]a , bi [ ou les pavés ouverts semi-infinis ds i=1 ] − ∞, ai [ ou les pavés fermés semi-infinis
i=1 i
Qd
i=1
] − ∞, ai ], avec −∞ < ai < bi < +∞,

On peut se demander si B(R) = P(R). La réponse est non (Axiome du choix).


En général, lorsque Ω est dénombrable, une bonne tribu à considérer est P(Ω) et pour un espace topologique, c’est la
tribu borélienne.

Définition
Soient (Ω1 , A1 ), (Ω2 , A2 ) deux espaces mesurables. On appelle "rectangle" de Ω1 × Ω2 tout ensemble de
la forme A1 × A2 avec A1 ∈ A1 et A2 ∈ A2 . L’ensemble des rectangles est noté
A1 × A2 := {A1 × A2 : A1 ∈ A1 , A2 ∈ A2 }. La tribu engendrée par l’ensemble des rectangles est notée
A1 ⊗ A2 := σ(A1 × A2 ). On dit que A1 ⊗ A2 est la tribu produit de Ω1 × Ω2 .
El Arrouchi 9 / 46
Exemple : B(R2 ) = B(R) ⊗ B(R) := B(R)⊗2 .
Sa preuve est basée sur le fait que tout ouvert de R2 peut s’écrire comme une réunion dénombrable de
rectangles d’intervalles ouverts. Plus généralement, on montre que B(Rn ) = B(R)⊗n .

Définition (Application mesurable)


Soient (Ω, A), (Ω′ , A′ ) deux espaces mesurables. On dit qu’une application f : Ω → Ω′ est mesurable
(par rapport aux tribus A, A′ ) si ∀B ∈ A′ , f −1 (B) := {x ∈ Ω : f (x ) ∈ B} ∈ A. Lorsque les deux espaces
de départ et d’arrivée sont des espaces topologiques (métriques) munis de leurs tribus boréliennes la
fonction est appelée borélienne.

Exemples
La fonction 1A est mesurable si et seulement si A est mesurable ( A ∈ A).
Lorsqu’on travaille avec les tribus boréliennes, les fonctions f : Ω → Ω′ continues sont mesurables.
Les applications mesurables sont stables par la plupart des opérations : addition, multiplication,
multiplication par un scalaire, inverse, quotient, composition, max, min, sup, inf, limite simple, etc.

Une fonction f : Rd → Rd est borélienne si, et seulement si ses composantes le sont.
El Arrouchi 10 / 46
Remarque
Il sera très souvent utile de considérer des fonctions à valeurs dans la droite réelle achevée
R = R ∪ {−∞, +∞} = [−∞, +∞], ou dans R+ = R+ ∪ {+∞} = [0, +∞].
R (et R+ ) est un espace métrique compact. On peut donc définir sa tribu borélienne. En
fait, B(R) est composée des ensembles de la forme A, A ∪ {−∞}, A ∪ {+∞} et
A ∪ {−∞, +∞} pour A ∈ B(R).
Ainsi, une fonction f : Ω → R est mesurable si et seulement si f −1 ({−∞}), f −1 ({+∞})
et f −1 (A) sont des ensembles mesurables pour tout A ∈ B(R).
Une fonction mesurable f : Ω → R est donc mesurable aussi en tant que fonction
f : Ω → R.

Définition
Soient (Ω′ , A′ ) un espace mesurable et f : Ω → Ω′ . On appelle tribu engendrée par f (sur Ω)
la plus petite tribu qui rend f mesurable : σ(f ) := {f −1 (A′ ) : A′ ∈ A′ } = f −1 (A′ ).

Remarque : Dire que f : (Ω, A) → (Ω′ , A′ ) est mesurable revient à dire que σ(f ) ⊂ A.
El Arrouchi 11 / 46
Définition(Mesure)
Soit (Ω, A) un espace mesurable. On appelle mesure (positive) toute application
µ : A → R+ = [0, +∞] telle que
1 µ(∅) = 0
2 si (An )n∈N est une suite dénombrable d’éléments de A deux à deux disjoints, alors
X
µ( ∪ An ) = µ(An ) (σ-additivité).
n⩾0
n⩾0
Le triplet (Ω, A, µ) s’appelle un espace mesuré.
- Si µ(Ω) < +∞, la mesure µ est dite bornée (finie).
- Si il existe une suite (Ωn )n∈N ) d’éléments de A telle que Ω = ∪ Ωn et µ(Ωn ) < +∞, on dit
n⩾0
que la mesure µ est σ-finie.

El Arrouchi 12 / 46
Exemples
Soit ω ∈ Ω, alors δω (A) = 1A (ω) définit une mesure sur (Ω, P(Ω)) appelée mesure (masse) de
Dirac en ω.

Card(A) si A est fini,
Sur (Ω, P(Ω)), la mesure de comptage µ est définie par : µ(A) =
+∞ si A est infini.
Considérons Rd (d ∈ N∗ ) muni de sa tribu borélienne B(Rd ) ; on sait que B(Rd ) est engendrée par
d
Y
la famille C de tous les pavés C de la forme C = ]ai , bi ] où ai < bi , ai , bi ∈ R. Il existe alors une
i=1  
d d
d
Q Q
unique mesure positive σ-finie λd sur B(R ) telle que λd ]ai , bi ] = (bi − ai ).
i=1 i=1
λd est appelée mesure de Lebesgue sur Rd . Elle est invariante par translation (i.e.,
λd (A + x ) = λd (A), ∀x ∈ Rd , ∀A ∈ B(Rd )) et elle est homogène de degré d (i.e.,
λd (tA) = |t|d λd (A), ∀t ∈ R, ∀A ∈ B(Rd )).
Soit (Ω, A, µ) un espace mesuré. Soit (Ω′ , A′ ) un espace mesurable. Soit f : Ω → Ω′ mesurable.
L’application µf : A′ → [0, +∞] définie par µf (A′ ) = µ(f −1 (A′ )) est une mesure appelée mesure
image de µ par f .
El Arrouchi 13 / 46
Exemple(Mesure produit)
Soient (Ω, A, µ) et (Ω′ , A′ , ν) deux espaces mesurés σ-finis. Il existe une unique mesure µ ⊗ ν
sur (Ω × Ω′ , A ⊗ A′ ) telle que, pour tous A ∈ A, A′ ∈ A′ ,

µ ⊗ ν(A × A′ ) = µ(A)ν(A′ ),

avec la convention 0 × ∞ = 0. Cette mesure est σ-finie, appelée mesure produit (tensoriel)
de µ et ν.

Remarque
Le produit tensoriel de mesure est associatif, i.e., (µ1 ⊗ µ2 ) ⊗ µ3 = µ1 ⊗ (µ2 ⊗ µ3 ).

Exercice(Mesures discrètes)
Soit (Ω, A) un espace mesurable. Soient (ωn )n⩾0 une suite
X de points de Ω et (αn )n⩾0 une suite
+
à valeurs dans R . Pour tout A ∈ A, on pose µ(A) = αn δωn (A). Montrer que l’application
n⩾0
µ : A → R+ est une mesure positive. Tout point ωn tel que αn > 0 est appelé atome de µ.
El Arrouchi 14 / 46
Intégration par rapport à une mesure
Soit (Ω, A, µ) un espace mesuré.
Définition
Une fonction f mesurable de (Ω, A) dans (R, B(R)) est dite étagée si elle ne prend qu’un nombre fini de
n
X
valeurs. Si α1 , ..., αn les n valeurs distinctes prises par f , alors f se réécrit f (x ) = αi 1Ai (x ) où, pour
i=1
tout i, Ai = f −1 (αi ) (écriture canonique de f ).

Remarque. Les fonctions en escalier sur R sont étagées (c’est le cas où les Ai sont des intervalles),
mais la réciproque est fausse, par exemple f = 1Q .

Définition. Soit f une fonction étagée positive (αi ⩾ 0).


Z n
X
On appelle intégrale de f par rapport à µ le nombre dans R+ définit par fdµ := αi µ(Ai ), avec
i=1
la convention R0 × ∞ = 0 dans le cas où αi = 0 et µ(Ai ) = ∞. Une fonction positive étagée f est dite
intégrable si fdµ < +∞.
El Arrouchi 15 / 46
Remarque.
p
P
Une autre écriture f = βi 1Bi , où les Bi sont 2 à 2 disjoints, donne la même intégrale. Par
i=1
exemple : 21]0,1[ (x ) + 1[1,2] (x ) = 1]0,2] (x ) + 1]0,1[ (x ).
R
1A dµ = µ(A), pour tout A ∈ A.
Z Z
Définition. Soit f : Ω → R+ mesurable. L’intégrale de f par rapport à µ est f dµ := sup hdµ.
h étagée
0⩽h⩽f

Définition. Soit f : Ω → R mesurable et on note f + = max(f , 0) et f − = max(−f , 0).


Z Z Z Z
On dit que f est µ-intégrable si |f |dµ < ∞. On pose alors fdµ := f − dµ − f − dµ.
On note L1 (Ω, A, µ) l’ensemble des fonctions µ-intégrables.
R R R R R
Notation : on note parfois fdµ = Ω f (ω)dµ(ω) = Ω f (ω)µ(dω) et A fdµ = f 1A dµ, ∀A ∈ A.

Proposition. L1 (Ω, A, µ) est un espace vectoriel sur R et f 7→ fdµ est une forme linéaire croissante.
R

El Arrouchi 16 / 46
Théorèmes limites
Théorème (Théorème de convergence monotone de Beppo-Lévy)
Soit (fn )n⩾0 une suite croissante de fonctions mesurables positives de Ω → [0, +∞], i.e.,
0 ⩽ fn ⩽ fn+1 pour tout n ∈ N. Alors f = lim fn = sup fn est mesurable positive et
n→+∞ n∈N
Z Z
lim fn dµ = fdµ.
n→+∞

Corollaire
Soit (fn )n⩾0 une suite de fonctions mesurables positives de Ω → [0, +∞]. Alors

Z X ∞ Z
X
fn dµ = fn dµ.
n=0 n=0

Théorème (Lemme de Fatou)


Z Z
Soit (fn )n⩾0 une suite de fonctions mesurables positives. On a lim inf fn dµ ⩽ lim inf fn dµ.
n→+∞ n→+∞

El Arrouchi 17 / 46
Définition (Presque-partout, presque-sûre)
On dit qu’une propriété est vraie µ-presque-partout ou µ-presque-sûrement, en abrégé µ-p.p.
ou µ-p.s., lorsqu’elle est vraie en dehors d’un ensemble mesurable de mesure nulle.

Exemple
L’écriture "0 ⩽ fn ↑ f µ − p.p." signifie qu’il existe un ensemble N ∈ A tel que µ(N) = 0 et tel
que pour tout ω ∈ Ω \ N, fn (ω) est une suite positive croissante convergeant vers f (ω).

Théorème (Théorème de convergence dominée, Lebesgue)


Soit (fn )n⩾0 une suite de fonctions mesurables dans L1 (Ω, A, µ). On suppose
il existe f : Ω → R mesurable telle que fn (ω) → f (ω) pour µ-presque tout ω ∈ Ω ;
il existe g : Ω → R+ mesurable et intégrable telle que, ∀n ∈ N, |fn | ⩽ g µ − p.p.
Z Z Z
Alors f ∈ L1 (Ω, A, µ), et on a lim fn dµ = fdµ et lim |fn − f |dµ = 0.
n→+∞ n→+∞

El Arrouchi 18 / 46
Théorème (Continuité sous le signe intégral)
Soient (Ω, A, µ) un espace mesuré, (E , d) un espace métrique et f une fonction définie sur Ω × E à valeurs réelles ou
complexes. On suppose que
1 pour µ-presque tout x ∈ Ω, la fonction a 7→ f (x , a) est continue sur E ;
2 pour tout a ∈ E , la fonction x 7→ f (x , a) est mesurable sur (Ω, A) ;
3 ∃g : Ω → [0, +∞) mesurable et µ-intégrable telle que, ∀a ∈ E , |f (x , a)| ⩽ g(x ) µ-p.p..
R
Alors, la fonction F : E → R (ou C), F (a) = f (x , a) dµ(x ) est bien définie et continue sur E .

Théorème (Dérivation sous le signe intégral)


Soient (Ω, A, µ) un espace mesuré, I un intervalle ouvert de R et f une fonction définie sur Ω × I à valeurs réelles ou
complexes. On suppose que
1 pour µ-presque tout x ∈ Ω, la fonction a 7→ f (x , a) est dérivable sur I ;
2 pour tout a ∈ I, la fonction x 7→ f (x , a) est µ-intégrable ;
∂f
3 ∃g : Ω → [0, +∞) mesurable et µ-intégrable telle que, pour tout a ∈ I, ∂a
(x , a) ⩽ g(x ) µ-p.p..
∂f
R
Alors, pour tout a ∈ I, x 7→ ∂a
(x , a) est µ-intégrable. De plus, la fonction F : a 7→ f (x , a) dµ(x ) est dérivable sur I et
R Ω
∂f
F ′ (a) = (x , a) dµ(x ), ∀a ∈ I.
Ω ∂a

El Arrouchi 19 / 46
Le lemme qui suit établit que toute fonction mesurable (positive) peut être approchée par une limite
simple de fonctions étagées. Il jouera un rôle essentiel dans la suite : pour démontrer telle ou telle
propriété de l’intégrale, il suffira dans un premier temps de la démontrer pour des fonctions étagées
positives, et dans un deuxième temps de choisir une suite de fonctions étagées approchant les fonctions
de départ, en passant à la limite grâce au théorème de Beppo-Lévi.
Lemme
Toute fonction mesurable f à valeurs dans R+ est limite croissante simple de fonctions étagées positives.

Exemple. Soit µ =
P
αn δωn une mesure discrète sur (Ω, A).
n⩾0

R ∞
P
Si f : Ω → R+ une fonction mesurable, alors fdµ = αn f (ωn ). D’où,
n=0

P R ∞
P
f : Ω → R est µ-intégrable ⇔ αn |f (ωn )| < ∞, et dans ce cas, fdµ = αn f (ωn ).
n=0 n=0
Cas
R particulier :
- fdδx = f (x ), pour tout x ∈ Ω.
R ∞
P
- Si Ω = N et µ=mesure de comptage, alors, pour toute fonction mesurable positive fdµ = f (n).
n=0

El Arrouchi 20 / 46
Théorème (Riemann intégrabilité sur un segment⇒ Lebesgue intégrabilité)
Si f est Riemann intégrable sur [a, b], alors f est Lebesgue intégrable sur [a, b] et les intégrales ont
R Rb
même valeur : [a,b] fdλ = a f (x )dx .

Théorème (Critère de Lebesgue)


Une fonction f : [a, b] → R bornée est intégrable au sens de Riemann si et seulement si il existe
N ⊂ [a, b] de mesure de Lebesgue nulle tel que f est continue en tout x ∈ [a, b] \ N. Dans ce cas, il y a
Rb R
coincidence entre les deux intégrables : a f (x )dx = f 1[a,b] dλ.

Théorème (Riemann absolue convergence ⇒ Lebesgue intégrabilité)


Si f : I → R (I intervalle non nécessairement fermé, non nécessairement borné) admet une intégrale de
Riemann
R généralisée
R absolument convergente sur I, alors f est aussi Lebesgue intégrable sur I :
I
f dλ = I
f (x )dx .

Notation : Étant donné


R que lesR intégrales de Riemann et de Lebesgue sont égales dans la plupart des
cas, on pourra noter I f dλ = I f (x )dx , même si f n’est pas intégrable au sens de Riemann, sans
confusion possible.
El Arrouchi 21 / 46
Définition. Soient µ et ν deux mesures sur (Ω, A). On dit que
ν est absolument continue par rapport à µ (notation ν ≪ µ) si
∀A ∈ A, µ(A) = 0 ⇒ ν(A) = 0.
ν est étrangère à µ (notation ν ⊥ µ) s’il existe N ∈ A tel que µ(N) = 0 et ν(N c ) = 0.

Théorème (Radon-Nikodym)
Soient (Ω, A, µ) un espace mesuré σ-fini et ν une mesure finie sur A. Il y a équivalence entre
(i) ν ≪ µ ;
(ii) il existe f : (Ω, A) → (R+ , B(R+ )) ∈ L1 (µ) telle que ν(A) = A fdµ pour tout A ∈ A.
R

De plus, f est unique (à une égalité µ-presque partout près), on l’appelle densité (ou dérivée

de Radon-Nikodym) de ν par rapport à µ et on la note f = dµ (on note parfois ν = f .µ).

Remarque. Le résultat est faux si on ne suppose plus que µ est σ-finie.


Exercice. Soient (Ω, A, µ) un espace mesuré σ-fini et ν une mesure sur (Ω, A) telle que ν ≪ µ.

Z Z
Montrer que, pour toute fonction mesurable positive g, on a gdν = g dµ.

El Arrouchi 22 / 46
Théorème (Fubini-Tonelli). Soient (Ω, A, µ) et (Ω′ , A′ , µ′ ) deux espaces mesurés σ-finis.
Soit f : Ω × Ω′ → [0, +∞] mesurable positive. Alors,
les fonctions x 7→ Ω′ f (x , y )µ′ (dy ) et y 7→ Ω f (x , y )µ(dx ) sont respectivement A-mesurable et
R R

A′ -mesurable.
les égalités suivantes ont lieu dans R+ :
Z Z Z  Z Z 
f (x , y )µ ⊗ µ′ (dx , dy ) = f (x , y )µ′ (dy ) µ(dx ) = f (x , y )µ(dx ) µ′ (dy ).
Ω×Ω′ Ω Ω′ Ω′ Ω

Théorème (Fubini-Lebesgue). Soit f ∈ L1 (Ω × Ω′ , A ⊗ A′ , µ ⊗ µ′ ). Alors,


pour Rpresque tout x ∈ Ω, la fonction y 7→ f (x , y ) est dans L1 (µ′ ) ; de plus la fonction
x 7→ Ω′ f (x , y )µ′ (dy ), définie µ-p.p., est µ-intégrable.
pour Rpresque tout y ∈ Ω′ , la fonction x 7→ f (x , y ) est dans L1 (µ) ; de plus la fonction
y 7→ Ω f (x , y )µ(dx ), définie µ′ -p.p., est µ′ -intégrable.
Z Z Z  Z Z 
′ ′
Enfin, f (x , y )µ ⊗ µ (dx , dy ) = f (x , y )µ (dy ) µ(dx ) = f (x , y )µ(dx ) µ′ (dy ).
Ω×Ω′ Ω Ω′ Ω′ Ω
El Arrouchi 23 / 46
Définition(Espace probabilisé)
On appelle espace probabilisé ((on dit aussi parfois espace de probabilité) un espace mesuré
(Ω, A, P) où la mesure P est telle que P(Ω) = 1. On dit alors que P est une mesure de
probabilité (et c’est pour cela qu’on la note P).
La modélisation probabiliste consiste à décrire une expérience a priori aléatoire par la donnée d’un espace
probabilisé (Ω, A, P). Intuitivement, les éléments de Ω, parfois appelés événements élémentaires ,
correspondent aux issues possibles d’une expérience aléatoire donnée, et les parties mesurables A ∈ A
sont appelés des événements. La quantité P(A) désigne la probabilité que l’événement A soit observé. On
dit que l’événement A est presque sûr si P(A) = 1.

Exemple
L’exemple le plus fréquent et le plus élémentaire d’expérience aléatoire consiste à choisir uniformément
un élément dans un ensemble Ω fini (équiprobabilité). Un choix naturel d’espace de probabilités adapté
1 X
est de considérer (Ω, 2Ω , P) où P est la mesure uniforme sur Ω, définie par P = δω , soit
card(Ω)
ω∈Ω
card(A) nombre de cas favorables
encore, P(A) = = , ∀A ⊂ Ω.
card(Ω) nombre de cas possibles
El Arrouchi 24 / 46
Exemples
δf +δp
Pile-ou-face équilibré correspond à Ω = {p, f }, avec A = {∅, {p}, {f }, Ω} et P = 2
(mesure de Bernoulli).
Un lancer de n pièces successivement est modélisé par l’espace produit Ω = {p, f }n , muni
de la tribu des parties 2Ω et de la mesure uniforme P({ω1 , ω2 , ..., ωn }) = 21n , qui est aussi la
mesure produit des mesures de Bernoulli.
un lancer de dé équilibré à 6 faces peut être modélisé en posant Ω = {1, 2, 3, 4, 5, 6},
6
1X
A = 2Ω et P la mesure uniforme sur Ω : P = δi , et n lancers successifs correspondent
6 i=1
à l’espace produit n fois.
Une infinité de lancers de pièces ?
Un lancer d’un petit caillou au hasard sur un carrelage de côté 1 peut être modélisé par
Ω = [0, 1]2 (si on regarde sa position dans le carreau où il se trouve), A = B(Ω) et
P(A) = λ2 (A) pour A ∈ A (sous l’équiprobabilité).

El Arrouchi 25 / 46
Propriétés. Soit (Ω, A, P) un espace probabilisé et (An )n∈N∗ une suite d’événements.
1 Croissance : A1 ⊂ A2 ⇒ P(A1 ) ⩽PP(A2 ) ; 4 Continuité monotone séquentielle :
2 Sous-additivité : P( ∪ ∗ An ) ⩽ P(An ) ; ▶ Si An ⊂ An+1 pour tout n ∈ N∗ , alors
n∈N n∈N∗
n n
P P( ∪ ∗ An ) = lim P(An ) ;
3 Formule de Pioncaré : P( ∪ Ai ) = Ai + n∈N n→∞

n
i=1 i=1 ▶ Si An ⊃ An+1 pour tout n ∈ N∗ , alors
(−1)k+1 P( ∩ ∗ An ) = lim P(An ).
P P
P (Ai1 ∩ Ai2 ∩ ... ∩ Aik ) ; n∈N n→∞
k=1 1⩽i1 <i2 <...<ik ⩽n

Définition (Probabilité conditionnelle). Soit B ∈ A tel que P(B) > 0.


P(A ∩ B)
L’application A 7→ P(A|B) := est une probabilité sur (Ω, A) appelée probabilité conditionnelle relative à B ou
P(B)
encore probabilité sachant B.

Proposition. Soit (Ai )i∈I une partition au plus dénombrable d’événements de Ω telle que P(Ai ) > 0. Alors, ∀B ∈ A :
P P
▶ P(B) = P(Ai ∩ B) = P(Ai )PAi (B|Ai ). (Formule de probabilités totales)
i∈I i∈I
P(Aj )P(B|Aj )
▶ Si P(B) > 0, alors pour tout j ∈ I, P(Aj |B) = P . (Formule de Bayes)
P(Ai )P(B|Ai )
i∈I
El Arrouchi 26 / 46
Définition(Variable aléatoire)
On appelle variable aléatoire toute application mesurable X d’un espace probabilisé (Ω, A, P)
dans un espace mesurable (E , E). On dit alors que X est à valeurs dans E .
En général, une variable aléatoire est à valeurs réelles, si (E , E) = (R, B(R)).
Si (E , E) = (Rd , B(Rd )), on parle de vecteur aléatoire de dimension d. Dans ce cas, on
peut écrire X = (X1 , ..., Xd ) où Xi : (Ω, A) → (R, B(R)) est une variable aléatoire appelée
i-ème marginale.
Si (E , E) = (R2 , B(R2 )), on parle en particulier de couple aléatoire.
Si (E , E) = (RN , B(RN )), on parle de suite aléatoire.
On notera v.a. pour « variable aléatoire » et v.a.r. pour « variable aléatoire réelle »(variable
aléatoire à valeurs dans R).

Exemple(Le dé à 6 faces)
On pose Ω = {1, 2, ..., 6}, A = P(Ω) et P la mesure uniforme sur Ω. De même, on pose
(E , E) = (Ω, A). Alors l’application X : Ω → E qui à ω ∈ Ω associe X (ω) = ω est une variable
aléatoire. Elle modélise l’expérience le lancé d’un dé équilibré.
El Arrouchi 27 / 46
Proposition
Pour qu’une fonction X : (Ω, A) → (E , σ(C)) soit mesurable, il suffit que X −1 (C) ⊂ A.
X : (Ω, A) → Rd est un vecteur aléatoire réel si et seulement si pour tout
t ∈ Rd , {X ⩽ t} ∈ A.

Définition(Loi)
Soit X : (Ω, A, P) → (E , E) une variable aléatoire. On appelle loi de X la mesure image de P
par X . C’est donc la mesure de probabilité PX sur (E , E) définie par
PX (A) = P(X −1 (A)) = P({ω ∈ Ω : X (ω) ∈ A}), pour A ∈ A.
On dit encore que X suit la loi de probabilité PX , et on peut noter X ∼ PX .
Si X = (X1 , ..., Xd ) est un vecteur aléatoire, on parle de la loi conjointe (ou jointe) de X .
Notation : on utilisera en général la notation {X ∈ A} = X −1 (A), de sorte que la définition s’écrit
PX (A) = P(X ∈ A).
Remarque. Soit Q une mesure de probabilité sur (E , E). Il existe toujours un espace de probabilité
(Ω, A, P) et une variable aléatoire X : (Ω, A, P) → (E , E) telle que PX = Q (il suffit de prendre
(Ω, A, P) = (E , E, Q) et pour X l’application identité de Ω).
El Arrouchi 28 / 46
Variables aléatoires discrètes
Si X est à valeurs dans un ensemble au plus dénombrable E (on parle P de variable P aléatoire discrète),
muni de la tribu 2E , alors on a, ∀A ⊂ E , PX (A) = PX ( ∪ {x }) = PX ({x }) = P(X = x ). La loi de
x ∈A x ∈A x ∈A
P
X est alors PX = P(X = x )δx . Ainsi, déterminer la loi d’une v.a. discrète, revient à déterminer toutes
x ∈E
les probabilités P(X = x ) pour x ∈ E .

Variables aléatoires à densité


Une variable aléatoire X à valeurs dans (Rd , B(Rd )) est dite à densité si PX est absolument continue
par rapport à la mesure de Lebesgue λ (PX ≪ λd ). Dans ce cas, le théorèmeR de Radon-Nikodym montre
qu’il existe une fonction borélienne fX = dP d +
dλd : R → R telle que PX (A) = A fX (x )dx . On a en
X

particulier Rd fX (x )dx = P(X ∈ Rd ) = 1. La fonction fX , qui est unique à un ensemble de mesure de


R

Lebesgue nulle près, est appelée la densité de (la loi de) X .


Rb
Si d = 1, on a en particulier, pour tous a ⩽ b, P(a ⩽ X ⩽ b) = a fX (x )dx .
d
RRemarque. On peut montrer que si f est une fonction borélienne positive p.p. sur R et telle
Rd
f (x )dx = 1, alors il existe un espace de probabilité (Ω, A, P) et une variable aléatoire X dont la loi
admet f pour densité.
El Arrouchi 29 / 46
Proposition
La loi d’un vecteur aléatoire à densité est caractérisée par sa densité de probabilité : si X et Y sont deux
vecteurs aléatoires de Rd de densités respectives fX et fY alors X et Y ont même loi si et seulement si
fX = fY λd -p.p..

Proposition (loi marginales). Soit X = (X1 , ..., Xd ) un vecteur aléatoire réel à densité fX .
Alors, pour tout i = 1, ..., d, la marginale Xi est une v.a.r. à densité fXi de Xi donnée par
Z
fXi (x ) = fX (x1 , ..., xi−1 , x , xi+1 , ..., xd )λd−1 (dx1 , ..., dxi−1 , dxi+1 , ..., dxd ).
Rd−1

Théorème(Changement de variables). Soit g un difféomorphisme d’un ouvert S ⊂ Rd sur un ouvert T .


Pour toute fonction h : S → R+ borélienne (ou S → R λd -intégrable),  on a 

∂gi
h(x )dλd (x ) = T h(g −1 (y )) Jg −1 (y ) dλd (y ), où Jg (x ) = det
R R
S ∂xj est le jacobien de g.
1⩽i,j⩽d
En particulier, si X un v.a. à valeurs dans S de densité fX , alors le v.a. Y = g(X ) a pour densité la
fonction fY (y ) = fX (g −1 (y )) Jg −1 (y ) 1T (y ).

El Arrouchi 30 / 46
Définition (Fonction de répartition)
Soit X = (X1 , ..., Xd ) : Ω, A, P) → (Rd , B(Rd )) un v.a.r. de dimension d (d ⩾ 1). On appelle fonction
de répartition (f.r.) du vecteur aléatoire X la fonction définie de Rd dans [0, 1] par :
FX (x1 , ..., xd ) = PX (] − ∞, x1 ] × ...×] − ∞, xd ]) = P(X1 ⩽ x1 , ..., Xd ⩽ xd ).

Proposition. Soit X = (X1 , ..., Xd ) un v.a.r. de dimension d (d ⩾ 1) de f.r. FX .


1 0 ⩽ FX (x ) ⩽ 1 pour tout x ∈ Rd ;
2 Si x , y ∈ Rd , x ⩽ y (i.e. xi ⩽ yi , pour tout i = 1, ..., d), FX (x ) ⩽ FX (y ) ;
3 FX est continue à droite en chacun de ces arguments x1 , ..., xn ;
4 FX (x1 , ..., xd ) → 1 qd (x1 , ..., xd ) → (+∞, ..., +∞) et FX (x1 , ..., xd ) → 0 qd xi → −∞ (i fixé) ;
5 ∀i, FXi (x ) = lim FX (x1 , ..., xd ) = FX (+∞, ..., +∞, xi , +∞, ..., +∞).
x1 ,...,xi−1 ,xi+1 ,...,xd →+∞

Proposition
Pour toute fonction F : R → [0, 1] vérifiant les propriétés 1,2,3 et 4 ci-dessus (d=1), il existe une v.a.r.
X telle que FX = F .
El Arrouchi 31 / 46
Proposition. Deux vecteurs aléatoires X , Y ∈ Rd ont même loi si et seulement si FX = FY .

Proposition. Soit X = (X1 , ..., Xd ) un v.a.r. de dimension d (d ⩾ 1) de f.r. FX .


∂PX ∂ d FX
Si FX ∈ C d (Rd , [0, 1]), alors PX ≪ λd avec fX = ∂λd = ∂x1 ...∂xd λd − p.p..

Proposition. Soit X une v.a.r. à densité f .


Rx
Alors FX (x ) = −∞
f (t)dt est continue sur R, dérivable p.p. et FX′ = f p.p..

Exercice
Soit X une v.a.r. avec DX = {x ∈ R : P(X = x ) = FX (x ) − FX (x − ) > 0} l’ensemble de ses points de
discontinuités. Montrer que DX est au plus dénombrable.
Si DX = ∅, on dit que la loi de X est diffuse.

Remarque
Une loi absolument continue est diffuse, la réciproque est fausse. Il existe des v.a.r. dont la loi de
probabilité n’est ni diffuse ni discrète.
El Arrouchi 32 / 46
Espérance mathématique
Définition
Soit X une v.a.r. On appelle espérance de X , notée E(X ) la quantité
Z
E(X ) = X (ω)P(dω)

qui est bien définie dans les cas suivants


X ⩾ 0 (et dans ce cas E(X ) ∈ [0, +∞])
R
X de signe quelconque et Ω |X (ω)|P(dω) < ∞ .
On dit que X est intégrable si E(|X |) < ∞, et on note dans ce cas X ∈ L1 (Ω, A, P).
Si X = (X1 , ..., Xd ) est un vecteur aléatoire dont toutes les composantes sont intégrables, on note E(X )
le vecteur E(X ) = (E(X1 ), ..., E(Xd )).

Remarque. Pour tout A ∈ A, E(1A ) = P(A). Si X ⩾ 0 p.s., alors EX = 0 ⇔ X = 0 p.s..


E(X ) s’interprète généralement comme la moyenne de la v.a. X . Dans le cas particulier où Ω est fini et P
est uniforme, E(X ) est bien la moyenne au sens usuel des valeurs prises par X (moyenne arithmétique).
El Arrouchi 33 / 46
Proposition(Linéarité) Soient X et Y deux v.a.r. intégrables de dimension resp. d1 et d2 .
Soit b ∈ Rm , A ∈ Mm,d1 (R) et B ∈ Mm,d2 (R). On a E(AX + BY + b) = AE(X ) + BE(X ) + b.

Théorème (de transport)


Soit X un v.a. défini sur (Ω, A, P) à valeurs dans (Rd , B(Rd )) et soit ϕ une fonction borélienne
de Rd dans R. AlorsR
ϕ(X ) est intégrable si et seulement si ϕ est PX -intégrable, c’est-à-dire
E(|ϕ(X )|) < ∞ ⇔ Rd |ϕ(x )|PX (dx ) < ∞.
Si tel est le cas, Z
E(ϕ(X )) = ϕ(x )PX (dx ). (∗)
Rd
R
En particulier, lorsque X est intégrable, E(X ) = R ϕ(x )PX (dx ).

Remarque. La formule (*) reste vraie si ϕ est borélienne positive ou borélienne bornée.
Définition
Soit p un réel tel que p ⩾ 1. On dit qu’une variable aléatoire réelle X appartient à l’espace
p p p 1/p = ( Ω X dP)1/p .
p
R
L (Ω, A, P) si E(|X | ) < ∞. Dans ce cas, on note ∥ X ∥p = (E(X ))
El Arrouchi 34 / 46
Dé[Link] une variable aléatoire X dans Lp (Ω, A, P), on appelle
moment d’ordre p le réel : E(X p ). moment centré d’ordre p le réel :
moment absolu d’ordre p le réel : E(|X | ). p E((X − E(X ))p ).

[Link] p et q deux réels tels que p ⩾ 1 et q ⩾ 1.


Si p ⩽ q, alors ∥ X ∥p ⩽∥ X ∥q et donc Lq (Ω, A, P) ⊂ Lp (Ω, A, P).
1
Si p + q1 = 1 et toutes v.a. X et Y respectivement dans Lp (Ω, A, P) et Lq (Ω, A, P), alors
∥ XY ∥1 ⩽∥ X ∥p ∥ Y ∥q . (Inégalité de Hölder) (Inégalité de Schwartz si p = q = 2)
Si X et Y sont deux v.a. éléments de Lp (Ω, A, P), alors X + Y ∈ Lp (Ω, A, P) et
∥ X + Y ∥p ⩽∥ X ∥p + ∥ Y ∥p . (Inégalité de Minkowski)

Remarque. On définit l’espace quotient Lp (Ω, A, P) = Lp (Ω, A, P)/ ∼p.s. où ∼p.s. désigne la relation
d’équivalence " X ∼p.s. Y si et seulement si X = Y p.s.".
Un élément X de Lp s’identifie à un représentant de la classe de tous les Y ∈ Lp tels que X = Y p.s..
On peut montrer que, pour tout p ⩾ 1, l’espace vectoriel normé (Lp (Ω, A, P), ∥ . ∥p ) est un espace de
Banach, et en particulier, L2 est un espace de Hilbert pour le produit scalaire <X,Y>= E(XY ).
El Arrouchi 35 / 46
Définition
On appelle variance d’une v.a.r. X dans L2 , son moment centré d’ordre 2, i.e.,
Var (X ) := E((X − EX )2 ) = EX 2 − E2 X . p
L’écart-type de X est la racine carrée de sa variance σX = Var (X ).

Propriétés. Soit X une v.a.r. dans L2 . On a


∀(a, b) ∈ R2 , Var (aX + b) = a2 Var (X ) ; Var (X ) = inf E(X − a)2 .
a∈R
Var (X ) = 0 ⇔ X est constante p.s. ;
X −EX
Terminologie. La v.a.r. σX est appelée v.a.r. centrée réduite associée à X .

Proposition. Soient X une v.a.r., φ : R → R une fonction convexe et ε ∈ R+


∗.
Si X , φ(X ) ∈ L1 , alors φ(EX ) ⩽ E(φ(X )). (Inégalité de Jensen)
E|X |
Si X ∈ L1 , alors P(|X | ⩾ ε) ⩽ ε . (Inégalité de Markov)
Var (X )
Si X ∈ L2 , alors P(|X − EX | ⩾ ε) ⩽ ε2
. (Inégalité de Bienaymé-Tchebychev)

El Arrouchi 36 / 46
Définition
Soient les v.a.r. X , Y ∈ L2 (Ω, A, P). On définit la covariance de X et Y par
Cov (X , Y ) := E((X − EX )(Y − EY )) = E(XY ) − EX EY .
On définit également le coefficient de corrélation linéaire de X et Y par ρ(X , Y ) = √ Cov (X ,Y ) .
Var (X )Var (Y )
Si X = (X1 , ..., Xd ) est un v.a. dans Rd dont toutes les composantes sont dans L2 (Ω, A, P), la matrice
de Variance-Covariance de X est définie par
ΣX := E X − EX )(X − EX )T = (Cov (Xi , Xj ))1⩽i,j⩽d ∈ Md (R).

Remarque. Rappelons que nous utilisons la notation des vecteurs en colonne.


Propriétés
1 Cov (X , X ) = Var (X ) ; 4 Par l’inégalité de Cauchy-Schwarz, on voit
2 (X , Y ) → Cov (X , Y ) est une application que |ρ(X , Y )| ⩽ 1, avec égalité si et
bilinéaire ; seulement si Y est une fonction affine de X
(i.e., Y = aX + b pour a, b ∈ R) ;
3 Si Z1 , ..., Zn sont des v.a.r. de carré
intégrables,
 n  on na
P P Pn 5 La matrice ΣX est symétrique définie positive
Var Zi = Var (Zi ) + 2 Cov (Zi , Zj ) ;
i=1 i=1 1⩽i<j⩽n
et pour toute A ∈ Mn,d (R), ΣAX = AΣX AT .
El Arrouchi 37 / 46
Théorème
Soit X et Y des v.a. à valeurs dans Rd . Les propriétés suivantes sont équivalentes :
1 X et Y ont même loi,
2 pour toute fonction borélienne positive h : Rd → R+ , E(h(X )) = E(h(Y )),
3 pour toute fonction continue bornée h : Rd → R, E(h(X )) = E(h(Y )),
4 pour toute fonction continue à support compact h : Rd → R, E(h(X )) = E(h(Y )).

Définition. (Fonction caractéristique)


Soit X = (X1 , ..., Xd ) un vecteur aléatoire sur (Ω, A, P) à valeurs dans Rd . On appelle fonction
caractéristique de X (ou transformée deFourier  de sa loi) la fonction φX : Rd → C définie par
d
P
i tX
i<t,X >  i=1 i i  R
φX (t) = φX (t1 , ..., td ) := E(e ) = E e  = Rd e i<t,x > PX (dx ).

P i<t,x >
Remarque. Si X est à valeurs dans un ensemble au plus dénombrable E , alors φX (t) = e P(X = x ).
R i<t,x > x ∈E
Si X est à densité f par rapport à λd , alors φX (t) = e f (x )dx .
Rd
El Arrouchi 38 / 46
Proposition. Soit X un v.a. dans Rd . Alors sa fonction caractéristique vérifie :
|φX (t)| ⩽ 1 et φX (0) = 1. φX est de type positif, i.e.,
φX (−t) = φX (t). ∀n ∈ N∗ , ∀(t1 , ..., tn ) ∈ Rd , ∀(z1 , ..., zn ) ∈
n
Cn ,
P
φX est uniformément continue. φX (tk − tj )zk zj ⩾ 0.
j,k=1
si A ∈ Mp,d (R) et B ∈ Rp alors
φAX +B (t) = e i<t,B> φX (AT t), ∀t ∈ Rp . φX caractérise la loi de X .

Théorème (Bochner)
Soit φ : R → C une fonction continue en 0, φ(0) = 1 et de type positif. Alors φ est la fonction
caractéristique d’une variable aléatoire sur R.

Théorème (Inversion de Fourier)


Soit φ une fonction caractéristique intégrable par rapport à la mesure de Lebesgue sur Rd . Alors φ est la
fonction caractéristique d’un vecteur aléatoire X admettant la densité continue bornée donnée par
Z
1
f (x ) = e −i<t,x > φ(t)dt, x ∈ Rd .
(2π)d Rd
El Arrouchi 39 / 46
Proposition. Soit X = (X1 , ..., Xd ) un vecteur aléatoire réel.
Si X admet un moment d’ordre 1, alors φX est de classe C 1 et E(X ) = −i∇φX (0).
Si X admet un moment d’ordre 2, alors φX est de classe C 2 et
Cov (Xi , Xj ) = −∂ij2 φX (0) + ∂i φX (0)∂j φX (0).
si X admet un moment d’ordre p, alors φX est de classe C p et pour tout α = (α1 , ..., αd ) ∈ Nd tel
que |α| = α1 + ... + αd ⩽ p, E (X1α1 ...Xdαd ) = i −|α| ∂1α1 ...∂dαd φX (0).

Exercice
Soit X une variable aléatoire réelle. Si φX est p fois dérivable en 0, p ∈ N∗ , alors X admet des moments
d’ordres plus petits ou égaux à 2[p/2].

Exemple
1 Soit X une v.a.r. telle que PX = (1 − p)δ0 + pδ1 (p ∈]0, 1[). Alors φX (t) = 1 − p + pe it .
2 2
2 Soit X une v.a.r. telle que dPX (x ) = √1 e −x /2 dx , ∀x ∈ R. Alors φX (t) = e −t /2
.

3 Soit X une v.a.r. telle que dPX (x ) = λe −λx 1R+∗ (x )dx (λ > 0). Alors φX (t) = λ
λ−it .
El Arrouchi 40 / 46
D’autres fonctions que la fonction caractéristique caractérisent la loi d’une variable aléatoire. Lorsque la v.a. est à valeurs
entières, on utilise la fonction génératrice.

Définition. (Fonction génératrice)


Soit X une v.a. à valeurs dans N (ou bien dans un sous-ensemble E ⊂ N : dans ce dernier cas, on étend X à une fonction
dans N en imposant que P(X = k) = 0 pour k ∈ / E ). La fonction génératrice de X , notée GX , est définie pour tout

P
s ∈ [−1, 1] par GX (s) := E(s X ) = P(X = k)s k .
k=0

Proposition. Pour toute v.a. X ∈ N, sa fonction génératrice GX satisfait les propriétés suivantes.
(k)
G (0)
1 GX est continue sur [−1, 1], de classe C ∞ sur ] − 1, 1[ et P(X = k) = X
k!
, ∀k ∈ N.
2 GX caractérise la loi de X .
(p)
3 Si X admet un moment d’ordre p si et seulement si GX admet une limite à gauche en 1. Alors,
(p)
GX (1− ) = E(X (X − 1)...(X − p + 1)).

Exemple. ps p
P
Soit X une v.a. telle que PX = p(1 − p)k−1 δk (p ∈ ]0,1[). Alors GX (s) = 1−(1−p)s
, GX′ (s) = (1−(1−p)s)2
k⩾1
2p(1−p) 1 2(1−p) 1 1 1−p
et GX′′ (s) = (1−(1−p)s)3
. Donc EX = GX′ (1) = p
, Var (X ) = GX′′ (1) + GX′ (1) − (GX′ (1))2 = p
+ p
− p2
= p2
.

El Arrouchi 41 / 46
Lois usuelles

Loi uniforme discrète U (x1 , . . . , xr ), r ∈ N
Une v.a. X suit la loi uniforme U (x1 , . . . , xr ) si X (Ω) = {x1 , . . . , xr } et P (X = xj ) = 1/r , j = 1, . . . , r .
Cette loi modélise une expérience à r issues possibles, chacune ayant la même probabilité 1/r .
2 irt
−1
Lorsque la loi est U(1, . . . , r ) : EX = r +1
2 , Var (X ) = r 12 , φX (t) = 1r e it 1−e1−e it .

Loi de Bernoulli B(1, p), p ∈]0, 1[


Une v.a. X suit la loi de Bernoulli B(1, p) si X (Ω) = {0, 1} avec P(X = 0) = 1 − p et P(X = 1) = p.
Cette loi modélise une expérience à deux issues possibles (succès et échec) dont la probabilité de succès
vaut p. Cette experience est appelée épreuve de Bernoulli. Le nombre de succès X obtenu au cours de
cette expérience suit alors la loi de Bernoulli de paramètre p.
EX = p, Var (X ) = p(1 − p), φX (t) = 1 − p + pe it .

Loi binomiale B(n, p), n ∈ N∗ , p ∈]0, 1[


Une v.a. X suit la loi binomiale B(n, p) si P(X = k) = kn p k (1 − p)n−k , pour k ∈ X (Ω) = [[0, n]].


Cette loi modélise le nombre de succès X obtenus au cours de n expériences de Bernoulli indépendantes,n
chacune ayant une probabilité p de succès. EX = np, Var (X ) = np(1 − p), φX (t) = 1 − p + pe it .
El Arrouchi 42 / 46
Loi géométrique G(p), p ∈]0, 1[
P(X = k) = p(1 − p)k−1 , k ∈ X (Ω) = N∗ . Cette loi modélise la loi du rang du premier succès
dans une suite d’expériences de Bernoulli indépendantes, chacune ayant une probabilité p de
pe it
succès. EX = p1 , Var (X ) = 1−p
p2
, φX (t) = 1−(1−p)e it .

Loi de Poisson P(λ), λ > 0


k
P(X = k) = e −λ λk! , k ∈ X (Ω) = N. EX = Var (X ) = λ, φX (t) = exp λ e it − 1 .


Si n > 30 et np < 5, on peut approcher une loi B(n, p) par une loi P(np).

Loi hypergéométrique H(N, m, n)


Une urne contient N boules, dont m blanches. On tire n boules, sans remise, et on note X le
nombre de boules blanches obtenues. Alors X suit la loi hypergéométrique H(N, m, n), donnée
(m)(N−m)
par P(X = k) = k Nn−k , k ∈ X (Ω) = [[max{0, n − (N − m)}, min{n, m}]].
(n)
EX = n m
N , Var (X ) = nm N−m N−n
N N N−1 .
Si N > 10n, on peut approcher une loi H(N, m, n) par une loi B(n, m/N).
El Arrouchi 43 / 46
Loi multinomiale M (n, p1 , . . . , pd )
n!
P ((X1 , . . . , Xd ) = (n1 , . . . , nd )) = n1 !...n p n1 . . . pdnd , n1 + · · · + nd = n.
d! 1
E (X1 , . . . , Xd ) = (np1 , . . . , np! d) , Var (Xi ) = npi (1 − pi ) , Cov (Xi , Xj ) = −npi pj (i ̸= j),
n
d
pj e itj pj .
P
φX (t1 , . . . , td ) =
j=1
La loi multinomiale est celle du vecteur des résultats d’une suite d’épreuves répétées indépendantes ayant
chacune d issues possibles de probabilités respectives p1 , ..., pd . Par exemple, considérons 20 tirages
d’une boule avec remise dans une urne contenant 1 boule bleue, 3 jaunes, 4 rouges et 2 vertes. Notons
X = (X1 , X2 , X3 , X4 ) où Xi est le nombre de boules de la couleur i en numérotant les couleurs par ordre
1 3 4 2
alphabétique (b, j, r , v ). On a (p1 , p2 , p3 , p4 ) = ( 10 , 10 , 10 , 10 ). La probabilité d’obtenir en 20 tirages 3
bleues, 5 jaunes, 10 rouges et 2 vertes est P(X = (3, 5, 10, 2)) ≈ 0, 004745.

Loi uniforme U(B), B ∈ B(Rd )


1 1
f (x ) = λd (B) 1B (x ). En particulier, la loi uniforme U([a, b]) a pour densité f (x ) = b−a 1[a,b] (x ), avec
2
x −a a+b (b−a) e itb −e ita
FX (x ) = b−a 1[a,b] (x ) + 1]b,∞[ (x ), EX = 2 , Var (X ) = 12 et φX (t) = it(b−a) .

El Arrouchi 44 / 46
Loi exponentielle E(λ), λ > 0
f (x ) = λe −λx 1[0,+∞[ (x ), avec FX (x ) = (1 − e −λx )1R+∗ (x ), EX = λ1 , Var (X ) = 1
λ2 , φX (t) = λ
λ−it .
Propriété d’absence de mémoire : P(X ⩾ t + s | X ⩾ s) = P(X > t), ∀t ⩾ 0.

Loi de Laplace
f (x ) = 12 e −|x | , EX = 0, Var (X ) = 1, φX (t) = 1
1+t 2 .

Loi gamma γ(a, λ), a > 0, λ > 0


 a
λa a−1 −λx
f (x ) = Γ(p) x e 1]0,+∞[ (x ), EX = λa , Var (X ) = a
λ2 , φX (t) = λ
λ−it .

Loi beta β(a, b), a > 0, b > 0


x a−1 (1−x )b−1 B(a+1,b) ab
f (x ) = B(a,b) 1[0,1] (x ), EX = B(a,b) , Var (X ) = (a+b)2 (a+b+1) . (B(a, b) = Γ(a)Γ(b)/Γ(a + b))

Loi de Cauchy C(a), a > 0


f (x ) = a
π(a2 +x 2 ) . Pas d’espérance, pas de variance finie, φX (t) = e −a|t| .
El Arrouchi 45 / 46
Loi de chi-deux à n degrés de liberté χ2 (n), n ∈ N∗
n/2
( 12 ) n x
f (x ) = Γ( n2 )
x 2 −1 e − 2 1]0,+∞[ (x ). EX = n, Var (X ) = 2n, φX (t) = 1
(1−2it)n/2
. Cette loi est tabulée.

Loi de Student à n degrés de liberté T (n), n ∈ N∗


Γ( n+1 )
 − n+1
√ 2 n x2 2 n
f (x ) = πnΓ( 2 )
1+ n , EX = 0 si n > 1 et Var (X ) = n−2 si n > 2. Cette loi est tabulée.

Loi de Gauss (ou normale) N (µ, σ 2 ), µ ∈ R, σ > 0


2 2
−µ)2 σ t
 
f (x ) = √ 1
2
exp − (x2σ 2 . EX = µ, Var (X ) = σ 2 , φX (t) = e iµt− 2 et X σ−µ ∼ N (0, 1).
2πσ
Si n > 30, np > 5 et n(1 − p) > 5, alors on peut approcher une loi B(n, p) par une loi N (np, np(1 − p)).

Si λ est assez grand, on a cette approximation P(λ) ≈ N (λ, λ). La loi normale centrée réduite N (0, 1) est tabulée.

Loi de Gauss (ou normale) multidimensionnelle Nd (m, Σ), m ∈ Rd , Σ ∈ Md (R)(inversible)


1 T Σ−1 (x −m) 1 T
f (x ) = d
1
√ e − 2 (x −m) , x ∈ Rd . EX = m, ΣX = Σ, φX (t) = e i<m,t>− 2 t Σt
.
(2π) 2 det Σ
El Arrouchi 46 / 46

Vous aimerez peut-être aussi