Introduction aux probabilités et événements
Introduction aux probabilités et événements
fr
Vous avez toute liberté pour télécharger, imprimer, photocopier ce cours et le diffuser gratuitement. Toute diffusion à
titre onéreux ou utilisation commerciale est interdite sans accord de l'auteur.
Si vous êtes le gestionnaire d'un site sur Internet, vous avez le droit de créer un lien de votre site vers mon site, à
condition que ce lien soit accessible librement et gratuitement. Vous ne pouvez pas télécharger les fichiers de mon site
pour les installer sur le vôtre.
1- Univers
On considère une expérience aléatoire (ou épreuve) dont le résultat (ou l'issue, ou la réalisation)
appartient à un ensemble , appelé univers. Le choix de suppose une modélisation de
l'expérience réalisée. peut être :
fini . Exemples :
Lancer un dé et lire le numéro sorti : = {1, 2, 3, 4, 5, 6}.
Jouer au loto : est par exemple l'ensemble de toutes les combinaisons possibles de 5 éléments
49
parmi 49. Il possède 5 éléments, soit 1 906 884.
Lancer une pièce : = {Pile, Face}
Ces ensembles font l'objet de ce chapitre.
infini dénombrable. On désigne ainsi les ensembles en bijection avec N. En général, = N lui-
même. On peut également choisir un tel lorsque le nombre de résultats est fini, mais borné par un
nombre inconnu. Les ensembles finis ou dénombrables sont appelés ensembles discrets. Exemples :
Lancer une pièce jusqu'à ce qu'il apparaisse P. Au choix, ou bien = {FnP | n N} où FnP
désigne un suite de n Faces suivi d'un Pile ; ou bien = N si on considère le résultat comme le
nombre de lancers.
Compter le nombre de voitures passant au péage de l'autoroute à Fontainebleau entre le 30 Juillet
0 h et le 1 Août 24 h. = N.
Prendre un épi de blé et compter le nombre de grains. = N.
Se promener aléatoirement sur un axe de la façon suivante : i) On lance une pièce. Si elle tombe
sur Pile, on avance d'une unité, sinon on recule d'une unité. ii) On relance la pièce. Si elle tombe
sur Pile, on s'arrête. Sinon on recommence à l'étape i). Le résultat de l'épreuve est l'abscisse
obtenue lorqu'on s'arrête. = Z.
Ces ensembles font l'objet du chapitre L2/[Link].
2- Evénement
a) Définition
On appelle événement une partie A de .
A n'est autre qu'un ensemble de résultats, inclus dans l'ensemble de tous les résultats possibles.
L'ensemble des événements est donc l'ensemble des parties de , noté P().
EXEMPLES :
Tirer au dé un nombre pair. A = {2, 4, 6}.
Tirer au loto cinq nombres successifs. A = {(1, 2, 3, 4, 5) , (2, 3, 4 ,5, 6) , ... , (45, 46, 47, 48,
49)}.
Lancer une pièce et tomber sur Face. A = {Face}.
L'événement A est réalisé si l'issue de l'épreuve appartient à A. En reprenant les trois exemples ci-
dessus, donnons des exemples d'épreuves en indiquant respectivement si l'événement A est réalisé :
4 A est réalisé
(2, 3, 5, 7, 8) A est non réalisé
Face A est réalisé
s'appelle événement certain. En effet, par définition, l'issue de l'épreuve appartient à et est
toujours réalisé au cours d'une épreuve. Pour une raison opposée, est appelé événement
impossible.
Un événement élémentaire est constitué d'un singleton. Il est réduit à un élément. est la réunion
des événements élémentaires.
Réunion : A B est réalisé si et seulement si A ou B est réalisé, ("ou" est pris au sens inclusif,
c'est-à-dire que A et B peuvent être réalisés simultanément)
–
Complémentaire : Ac, parfois noté A, est l'ensemble des éléments de qui ne sont pas dans A.
Cet événement est réalisé si et seulement si A n'est pas réalisé. Pour cela, on l'appelle l'événement
contraire de A. A et Ac sont incompatibles. On notera les propriétés suivantes dont la
démonstration est laissée au lecteur :
(A B)c = Ac Bc
(A B)c = Ac Bc
(Ac)c = A
On pourra vérifier que, I étant une famille d'indices quelconque, on a :
( Ai)c = Aic
iI iI
( Ai)c = Aic
iI iI
Différence : A – B ou A \ B est l'ensemble des éléments de A qui ne sont pas dans B. (B n'est pas
nécessairement inclus dans A). Cet événement est réalisé si et seulement si A est réalisé, mais pas
B. On notera que :
A – B = A Bc
A – B et B sont incompatibles.
On observe que les mêmes situations sont désignées par des mots différents suivant que l'on parle
d'ensembles ou d'événements. Cela est dû au fait que, historiquement, les probabilités se sont
développées indépendamment de la théorie des ensembles, à partir du XVIIème. La théorie des
ensembles date de la fin du XIXème, et ce n'est qu'à partir du début du XXème que les probabilités
ont connu un essor important, grâce au développement des théories des ensembles et de
l'intégration. Voici un résumé de la correspondance entre le vocabulaire des ensembles et celui des
probabilités.
ENSEMBLES PROBABILITES
partie A de événement A de l'univers
ensemble événement certain
ensemble vide événement impossible
singleton {x} événement élémentaire {x}
ensembles disjoints événements incompatibles
complémentaire événement contraire
partition système complet d'événements
3- Espace probabilisé
a) Equiprobabilité
Soit = {x1, x2, ... , xn}. On définit une loi équiprobable sur , ou une loi uniforme, en posant
que la probabilité est la même pour tous les événements élémentaires. La probabilité de l'événement
certain étant égale à 1, cela nous amène à définir :
1
P({xi}) =
n
Card(A)
P(A) = pour tout événement A (nombre de cas favorables sur nombre de cas
Card()
possibles), où Card(A) désigne le nombre d'éléments de A.
EXEMPLES :
1
Pour un dé équilibré, on posera P({x}) = pour x {1, 2, 3, 4, 5, 6}
6
1
Pour une pièce équilibrée, P({Pile}) = P({Face}) =
2
1
Au loto P({x}) = pour chaque combinaison x de 5 chiffres parmi 49.
1 906 884
Le choix de l'équiprobabilité relève d'une modélisation d'une situation où une symétrie parfaite joue
un rôle important (pièce ou dé parfaitement symétrique, boules jouant des rôles équivalents).
b) Probabilité quelconque
Plus généralement, on peut définir une probabilité quelconque sur = {x1, ..., xn} à partir de la
probabilité des événements élémentaires. On se donne n valeurs p1, ..., pn éléments de [0, 1] tels que
n
pi = 1, et on pose pi = P({xi}) pour tout élément xi de . Pour toute partie A de , on pose :
i=1
n
P(A) = pi = pi 1A(xi)
i tel que xi A i=1
n
La condition pi = 1 est imposée, de facon que :
i=1
n
P() = 1 = pi
i=1
EXEMPLE :
Pour une pièce truquée, on posera : P({Pile}) = p et P({Face}) = q = 1 – p, p [0, 1]
c) Définition abstraite
Les probabilités précédentes vérifient la propriété suivante : si A et B sont deux événements
incompatibles (i.e. deux parties disjointes de ), alors P(A B) = P(A) + P(B). En effet :
n
P(A B) = pi 1A B(xi)
i=1
n
= pi (1A(xi) + 1B(xi)) car A et B sont disjoints
i=1
n n
= pi 1A(xi) + pi 1B(xi)
i=1 i=1
= P(A) + P(B)
DEFINITION
Soit un univers fini. On appelle probabilité sur une application P de P() dans [0, 1] telle
que :
P() = 1
Pour tout A , B , A B = P(A B) = P(A) + P(B)
(, P) s'appelle alors espace probabilisé.
Cette définition sera généralisée de manière légèrement différente pour un univers infini dans le
chapitre L2/[Link].
Dans le cas fini, on généralise aussitôt la deuxième propriété à une réunion finie quelconque. Pour
toute famille (Ai)iI d'événements incompatibles, indicée par I ensemble fini, on a :
P( Ai) = P(Ai)
iI iI
Cela se montre par récurrence sur le nombre d'éléments de I. Si I est réduit à un seul élément, la
relation est triviale. Si I possède deux éléments, la relation résulte de la définition d'une probabilité.
Supposons la propriété vérifiée pour les ensembles d'indices de cardinal p. Soit I un ensemble
d'indice de cardinal p + 1. Soit j un élément quelconque de I, soit J = I – {j}, soit A = Ai et
iJ
B = Aj. A et B sont disjoints, et :
P( Ai) = P(A B) = P(A) + P(B) = P( Ai) + P(Aj)
iI iJ
= P(Ai)
iI
La définition abstraite d'une probabilité permet de retrouver la définition par somme des
probabilités des événements élémentaires. En effet, si on note = {x1, ..., xn}, et si on pose pi =
P({xi}), alors :
x
A = i tel que
iA
{xi} union disjointe
PROPOSITION :
i) P() = 0
ii) Pour tout événement A et B, P(A B) = P(A) + P(B) – P(A B).
iii) Pour tout événement A, P(Ac) = 1 – P(A)
iv) Pour tout événement A et B tel que A soit inclus dans B, on a :
P(A) P(B) et P(B – A) = P(B) – P(A)
Démonstration :
Nous donnons les démonstrations en utilisant la définition abstraite des probabilités. On peut
également les vérifier en recourant à la définition des probabilités comme somme finie de
probabilités élémentaires, mais ces propriétés sont également valides dans un espace probabilisé
infini, où la probabilité n'est pas nécessairement définie de cette façon.
II : Probabilités conditionnelles
1- Exemples
1
On lance un dé. Il sort un nombre pair. Quelle est la probabilité d'avoir sorti un 2 ? Réponse : .
3
En moyenne, sur 15 tirages, 8 donnent un nombre pair, et sur ces 8, 3 tirages donnent le 2. On est
3
donc amené à poser la probabilité cherchée égale à .
8
Avec le dé ci-dessus, quelle est la probabilité de sortir un nombre pair, sachant qu'il est sorti un
nombre supérieur ou égal à 3 ? Sur 15 tirages, en moyenne 10 donnent un nombre supérieur ou égal
1
à 3, et sur ces 10, 5 donnent un nombre pair. La probabilité cherchée est donc .
2
Quelle est la probabilité de sortir un nombre pair, sachant qu'il est sorti un nombre supérieur ou égal
à 2 ? Sur 15 tirages, en moyenne 13 donnent un nombre supérieur ou égal à 2, et sur ces 13, 8
8
donnent un nombre pair. La probabilité cherchée est donc .
13
Si l'on appelle A l'événement "tirer un nombre pair" et B l'événement tirer un nombre supérieur ou
égal à 3 (respectivement 2), on remarque que la probabilité de A sachant que B est réalisé a été
P(A B)
calculée comme étant égale à . Cette situation est à rapprocher de la loi équiprobable sur
P(B)
un ensemble fini, où l'on calcule le quotient du nombre de cas favorable sur le nombre de cas
possibles. Ici, on calcule le quotient de la probabilité de l'événement cherché P(A B) sur la
probabilité de l'univers relatif P(B).
DEFINITION
Soit B un événement de probabilité non nulle, d'un espace probabilisé (, P). On définit la loi de
probabilité sachant B (ou conditionnelle par rapport à B) par :
PB : P() [0,1]
P(A B)
A PB(A) =
P(B)
Les propriétés i) à iv) du I-4) s'appliquent donc également aux probabilités conditionnelles.
La probabilité PB est concentrée sur B. En effet, PB(B) = 1, ou encore PB(Bc) = 0.
EXEMPLE :
Dans un groupe d'individus, il y a :
des fumeurs B
des non-fumeurs Bc
des hommes A
des femmes Ac
(On rappelle que fumer nuit gravement à la santé).
On donne :
1
i) P(B) = il s'agit de la proportion de fumeurs parmi la population totale (Cette
4
probabilité est très imprécise. En fait, elle varie fortement avec l'âge. Si elle est de 0,4 pour les
individus à 20 ans, elle n'est plus que de 0,2 à 60 ans).
1
ii) P(A) = il s'agit de la proportion d'hommes dans la population totale
2
3
iii) PB(A) = il s'agit de la proportion d'hommes parmi les personnes qui fument
5
Calculer P(A B), P(Ac B), P(A Bc), P(Ac Bc), PB(Ac), PA(B), PA(Bc), PBc(A), PBc(Ac),
PAc(B), PAc(Bc) et interpréter les résultats obtenus.
Réponses :
1 3 3
iv) P(A B) = P(B) PB(A) = = (proportion de personnes masculines et qui fument, parmi
4 5 20
la population totale)
1 3 7
v) P(A Bc) = P(A) – P(A B) = – = (proportion de personnes masculines et qui ne
2 20 20
fument pas, parmi la population totale)
1 3 1
vi) P(Ac B) = P(B) – P(A B) = – = (proportion de personnes féminines et qui fument,
4 20 10
parmi la population totale)
1 1 2
vii) P(Ac Bc) = P(Ac) – P(Ac B) = 1 – P(A) – P(Ac B) = 1 – – =
2 10 5
1 7 2
ou bien = 1 – P(B) – P(A Bc) = 1 – – = (proportion de personnes féminines et
4 20 5
qui ne fument pas, parmi la population totale).
hommes A femmes Ac
3 1 2 5 1
fumeurs B = =
20 10 20 20 4
7 2 8 15 3
non fumeurs Bc = =
20 5 20 20 4
10 1 10 1
= =
20 2 20 2
EXEMPLE :
une urne contient a boules blanches et b boules noires. On effectue des tirages avec remise.
Lorsqu'on tire une boule noire, on la remplace par une boule blanche. Quelle est la probabilité de
tirer n boules noires de suite ?
Démonstration :
(Ai)1in formant un système complet d'événements, on a :
= Ai
n
union disjointe.
i=1
D'où P(B) = P( B)
= P(( Ai) B)
n
i=1
n
= P(Ai) PAi(B)
i=1
II peut paraître étonnant que la probabilité que la pièce défectueuse provienne de la troisième usine
soit si faible, alors que cette usine est de mauvaise qualité, mais elle n'intervient que fort peu sur le
marché. Par contre, la probabilité que la pièce défectueuse provienne de la première usine est très
forte, car elle a presque le monopole de fabrication, malgré la qualité de sa fabrication.
...
PAn(B)
P(An)
An Bc
La probabilité d'être passé par Ai sachant qu'on est arrivé en B est le quotient de la probabilité du i-
ème chemin sur la somme des probabilités de tous les chemins menant à B (un analogue du nombre
de cas favorables sur le nombre de cas possibles). Cela donne la formule de Bayes :
P(B Ai) P(Ai) PAi(B)
PB(Ai) = =
n
P(B)
P(Aj) PAj(B)
j=1
5- Evénements indépendants
DEFINITION
Deux événements A et B sont dits indépendants si P(A B) = P(A) P(B).
La justification de cette définition est la suivante. Si P(B) est non nul, et si A et B sont
indépendants, alors on doit s'attendre à ce que P(A) et PB(A) soient égales. En effet, l'indépendance
de A et B a pour conséquence que la connaissance de la réalisation de B n'a aucune influence sur
P(A B)
celle de A. Or P(A) = PB(A) P(A) = , d'où la définition.
P(B)
EXEMPLE :
On considère généralement que les tirages successifs avec une pièce, un dé ou au loto sont
indépendants. Les tirages précédents n'ont aucune influence sur les tirages suivants. Si la pièce est
1
équilibrée, il y aura toujours une probabilité de tirer Pile. En particulier, le fait d'avoir joué toutes
2
les semaines au loto depuis sa création sans jamais gagner n'augmente pas ses chances de gagner au
prochain tirage (cela ne les diminue pas non plus d'ailleurs).
DEFINITION
Plusieurs événements A1, A2, ..., An sont indépendants si, pour toute sous-famille de p événements
Ai1, Ai2, ... , Aip (les indices i1, ..., ip étant distincts), on a :
P(Ai1 Ai2 ... Aip) = P(Ai1)P(Ai2)...P(Aip)
Insistons sur le fait que la propriété doit être vérifiée pour TOUTE sous-famille de p événements.
On ne peut se contenter de vérifier l'indépendance des événements deux à deux.
EXEMPLE :
On lance deux dés. On considère les événements suivants :
A : le lancer du premier dé est pair
B : le lancer du deuxième dé est pair
C : la somme des deux lancers est paire
II est clair que les événements A et B, issus de deux dés différents sont indépendants, et que les trois
événements A, B et C ne le sont pas. En effet la réalisation de A et B entraîne celle de C. Or :
1
P(A) = P(B) = P(C) = (Pour P(C), réfléchir un peu)
2
1
P(A B) = = P(A C) = P(B C)
4
En effet, les trois événements A B, B C et A C sont identiques. Ainsi les événements sont
indépendants deux à deux. On a également :
1
P(A B C) =
4
car A B C = A B. C n'apporte rien de plus. Donc, les trois événements ne sont pas
indépendants, bien qu'ils le soient deux à deux.
6- Probabilité produit
On considère n univers finis i, 1 i n. On réalise alors n expériences aléatoires xi supposées
indépendantes, la i-ème ayant son issue dans i. Cela revient à faire une épreuve unique
(x1, x2, ..., xn) dont l'issue appartient à l'espace = 1 2 ... n. Cet espace s'appelle l'espace
produit des i. C'est un espace fini. Si i est munie d'une probabilité Pi, il est possible de munir
d'une probabilité P définie de la façon naturelle suivante :
P({(x1, x2, ..., xn)}) = Pl{{x1}) P2({x2}) ... Pn({xn})
P s'appelle la probabilité produit des Pi.
EXEMPLES :
On lance un dé, et on tire une carte d'un jeu de 32 cartes. Alors, 1 = {1, 2, 3, 4, 5, 6},
2 = {c | c est une carte d'un jeu de 32 cartes}. est l'ensemble des couples formés d'un lancer de
1 1
dé et d'un tirage de cartes : = {(d, c) | d 1, c 2}. On a P1({d}) = , et P2({c}) = . D'où
6 32
1
P({c, d}) = .
192
On lance un dé n fois, (ou bien n dés). Tous les espaces i sont égaux à {Pile, Face}.
1
= {Pile, Face}n. Toutes les lois Pi sont les mêmes : Pi({Pile}) = = Pi({Face}). Pour chaque x
2
l
élément de , on a P({x}) = n.
2
EXEMPLES :
On lance un dé. On gagne un franc s'il tombe sur 5 ou 6, et on perd un franc sinon. Soit X le gain.
On a = {1, 2, 3, 4, 5, 6}, et X est une application de dans R définie par :
X(l) = X(2) = X(3) = X(4) = –1
X(5) = X(6) = 1
2 1 4 2
La probabilité que le gain soit 1 est ou ; la probabilité qu'il soit –1 est ou . Initialement nous
6 3 6 3
avons une probabilité P sur , or nous voyons que, naturellement, nous en déduisons une sur
{–1, 1} = X(). Cette dernière probabilité s'appelle loi de X et sera notée PX (ne pas confondre la
notation avec celle d'une probabilité conditionnelle).
On lance deux dés. Soit X la somme des numéros tirés. On a ici comme espace probabilisé 2,
où = {1, 2, 3, 4, 5, 6}, muni de la loi uniforme. X peut prendre les valeurs {2, 3, 4, 5, 6, ..., 11,
12}. Chercher la loi de X, c'est chercher la probabilité de sortie de chacun de ces totaux. Le lecteur
vérifiera que l'on a :
k 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
PX({k})
36 36 36 36 36 36 36 36 36 36 36
2
Par exemple, P({3}) = car, sur les 36 sorties possibles des deux dés, seules les sorties (1, 2) et
36
(2, 1) ont pour somme 3.
On a donc défini une probabilité PX sur {2, 3, 4, ..., 12}. Par exemple, la probabilité que X
16
appartienne à A = {6, 7, 8} est . Une curiosité : si les deux dés portent respectivement les
36
numéros {1, 2, 2, 3, 3, 4} et {1, 3, 4, 5, 6, 8} (dés de Sicherman), on obtiendra exactement la même
probabilité PX pour la somme des deux dés. On peut jouer avec ces deux dés au lieu de deux dés
normaux sans jamais voir la différence (pourvu qu'on se limite à faire la somme des deux dés).
Regardons, dans les exemples précédents, comment calculer PX(A), pour A inclus dans X(), ou
plus généralement, pour un intervalle A de R. On réalise des expériences (tirer un dé, ou deux dés,
...) dont le résultat est dans . On applique X à , et on regarde si X() appartient à A ou non. Le
premier cas correspond à l'événement recherché. La probabilité PX(A) de cet événement est donc
égal à la probabilité de l'ensemble des tels que X() appartienne à A. Or { | X() A} n'est
autre que l'image réciproque de A par X, X–1(A).
DEFINITION
Soit X une variable aléatoire définie sur un espace probabilisé (, P) et A une partie de X(). On
définit la loi de X par :
PX(A) = P(X–1(A)) = P({ | X() A})
PROPOSITION
La loi PX d'une variable aléatoire définie sur un espace probabilisé (, P) est une loi de probabilité
sur X().
Démonstration :
II faut vérifier les trois propriétés des probabilités.
i) II est clair que PX est à valeurs dans [0, 1], puisque c'est le cas de P.
ii) PX(X()) = P(X–1(X())) = P() = 1
iii) Soit A et B deux événements disjoints de X(). Alors PX(A B) = P(X–1(A B)). Or :
X–1(A B) = { | X() A B}
= { | X() A} { | X() B}
= X–1(A) X–1(B)
donc :
PX(A B)) = P(X–1(A) X–1(B))
Par ailleurs, A et B étant disjoints, il en est de même de X–1(A) et X–1(B) puisqu'un élément
commun à ces deux parties serait tel que X() A B qui est vide. Donc :
PX(A B)) = P(X–1(A)) + P(X–1(B)) = PX(A) + PX(B)
On abrège PX(A) = P(X–1(A)) = P({ | X() A}) en P(X A). De même, si x est un élément de
E, P(X = x) désigne P({ | X() = x) = P(X–1({x})) = PX({x}). Comme toute probabilité sur un
espace fini, les valeurs P(X = x) = PX({x}) définissent sans ambiguïté la probabilité PX sur X().
Enfin, dans le cas d'une variable aléatoire réelle, on note, pour tout x réel :
P(X x) = P({ | X() x) = P(X–1(]–, x])) = PX(]–, x] X())
La variable aléatoire X permet de transférer la probabilité P sur en une probabilité PX sur X().
Considérons maintenant une variable aléatoire X de dans un ensemble E, et une application f de E
dans un ensemble F.
X permet de transférer la probabilité P sur en une probabilité PX sur X(). (X(), PX) devient
alors un espace probabilisé et f une variable aléatoire sur X() à valeurs dans F. f permet donc de
transférer la probabilité PX en une probabilité sur f(X()).
Y = f o X est une variable aléatoire définie sur à valeurs dans F, qui transfère la probabilité P
de en une probabilité PY sur Y() = f(X())
Vérifions que les deux procédés donnent le même résultat. Pour toute partie A de Y(), on a :
PY(A) = P(Y–1(A))
Or Y–1(A) = X–1(f –1(A)) car :
Y–1(A) Y() A f(X()) A X() f–1(A) X–1(f –1(A))
Donc :
PY(A) = P(X–1(f–1(A))) = PX(f–1(A))
et cette dernière est bien la probabilité définie sur f(X()) par le premier procédé. On note
habituellement Y = f(X) au lieu de f o X.
EXEMPLE :
On lance une pièce. Si on tombe sur P, on gagne un franc (G = l), sinon on perd un franc
(G = – l). La variable X = G2 est une variable certaine, égale à l.
b) Loi de Bernoulli
La loi de Bernoulli est la loi notée B(p) d'une variable aléatoire qui ne prend que deux valeurs,
habituellement 0 ou 1. Par exemple, si on lance une pièce, le fait de tomber sur Pile attribue à X la
valeur 0, et sur Face, la valeur 1. On a :
P(X = 1) = p
P(X = 0) = 1 – p
Généralement, la valeur 1 de X est appelée succès, et la valeur 0 échec. p est élément de ]0, 1[. Si
p = 0 ou 1, on retrouve une loi certaine.
c) Loi binomiale
La loi binomiale est la loi des variables aléatoires suivantes :
On lance n pièces. On compte le nombre de Piles.
On tire avec remise n boules d'une urne contenant des boules blanches et des boules noires. On
compte le nombre de boules blanches tirées.
Schéma général : on répète n expériences de Bernoulli indépendantes, et on compte le nombre X
de succès. Si Xi est le résultat 0 ou 1 de la i-ème expérience, 1 i n, alors X est la somme des Xi.
On a :
n
PX({k}) = P(X = k) = k pk (1 – p)n–k
n
représente en effet le nombre de combinaisons de k éléments parmi n, correspondant aux k
k
succès. La probabilité de chacune de ces combinaisons est pk (1 – p)n–k.
Cette loi dépend des deux paramètres n et p et est notée B(n, p). La loi B(1, p) est identique à la loi
de Bernoulli B(p).
d) Loi hypergéométrique
La loi binomiale, intervenant lors des tirages avec remise, peut également parfois servir
d'approximation lors de tirages sans remise. Considérons le cas de tirages de n boules sans remise
dans une urne contenant N boules, dont m blanches. La loi de la variable aléatoire X égale au
nombre de boules blanches tirées se trouve en calculant le quotient du nombre de tirages favorables
sur le nombre de tirages possibles. k est un entier pouvant varier de Max(0, m + n – N) à Min(m, n).
m N – m
PX({k}) = P(X = k) =
k n–k m! n! (N – m)! (N – n)!
=
N k! (m – k)! (n – k)! (N – m – n + k)! N!
n
Curieusement, cette expression est symétrique en n et m. Cette symétrie s'explique aisément si l'on
imagine l'expérience suivante : une urne contient N boules. Deux personnes sont en présence. La
première personne en choisit m sur lesquelles elle dessine une marque personnelle. Puis elle les
remet dans l'urne. La deuxième personne en choisit alors n sur lesquelles elle dessine une marque
différente de la première personne. On examine alors les N boules. Quelle est la probabilité qu'il y
en ait k disposant des deux marques ? Il s'agit de la loi précédente (dite loi hypergéométrique). Il
est évident que l'expérience donne la même loi si on permute les deux personnes, c'est-à-dire si on
échange le rôle de n et m.
Remarquons par ailleurs que la formule P(X = k) = 1 donne la relation non triviale suivante :
k
m N–m N
k n – k = n
k
qu'on pourra justifier directement en remarquant que le membre de gauche peut aussi exprimer le
nombre de façons de choisir une partie de n éléments dans un ensemble à N éléments. Pour une
valeur quelconque de k, on en prend k parmi m boules particulières et n – k parmi celles qui restent.
Cette loi intervient également dans les sondages de n personnes différentes, dans une population
totale de N personnes, dont m possèdent un caractère donné. On dénombre le nombre k de
personnes dans l'échantillon choisi ayant le dit caractère.
Lorsque le nombre N de boules est de plus en plus grand, on peut s'attendre à ce qu'un tirage sans
remise donne à peu près le même résultat qu'un tirage avec remise car il est de moins en moins
probable de tirer deux fois la même boule. La loi hypergéométrique doit donc permettre de retrouver
m
une loi binomiale. Cherchons donc la limite de P(X = k) lorsque N tend vers l'infini et (proportion
N
de boules blanches) tend vers p, élément de [0,1]. On a :
m! n! (N – m)! (N – n)!
P(X = k) =
k! (m – k)! (n – k)! (N – m – n + k)! N!
n m! (N – m)! (N – n)!
= k
(m – k)! (N – m – n + k)! N!
n (N – m)(N – m – 1)...(N – m – n + k + 1) m(m – l)...(m – k + 1)
= k
N(N – l)(N – 2)...(N – n + k + 1) (N – n + k)... (N – n + 1)
Le terme général du premier quotient vaut, pour r variant de 0 à n – k – 1 :
N – m – r 1 – m/N – r/N
=
N–r 1 – r/N
r m
or r est borné donc tend vers 0, et est supposé tendre vers p. La limite de chacun de ces termes
N N
est donc 1 – p, et ils sont au nombre de n – k. On prouve de même que chacun des termes du second
n
quotient tend vers p, et ils sont au nombre de k. La limite de P(X = k) est donc k pk (1 – p)n–k,
terme général de la loi binomiale de paramètres n et p.
Cette propriété explique que, dans le cas d'un sondage où n est, en France, de l'ordre de 1000, alors
que N est de l'ordre de 60 000 000, bien que ne procédant pas a priori à des tirages avec remise, la
loi en présence est considérée comme une loi binomiale.
EXEMPLE :
46% des gens sont de groupe sanguin O. Sur 10 000 personnes, on en prend 20. Quelle est la
probabilité d'en trouver 9 de groupe O ? Si on considère qu'on est dans le cadre d'une loi binomiale
B(20, 46 ), alors :
100
20
P(X = 9) = 9 0.469 0.5411 0,17634
alors que la valeur donnée par la loi hypergéométrique est 0,17651.
3- Espérance et variance
a) Espérance
On considère une loi de probabilité d'une variable aléatoire réelle X à valeur dans {xi, i I} où I est
fini. Soit pi la probabilité PX({xi}) = P(X = xi). On s'intéresse à la valeur moyenne de X. On peut
s'attendre à ce que, sur un grand nombre d'expérience, X prenne la valeur xi avec une fréquence de
plus en plus proche de pi. Il est donc naturel de poser, comme valeur moyenne de X, la quantité :
EXEMPLE :
Soit X la somme de deux dés. La loi de X est la suivante :
k 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
P(X = k)
36 36 36 36 36 36 36 36 36 36 36
On remarquera que la définition de E(X) ne fait intervenir que les valeurs que prend X et sa loi PX
sur R, et que l'on peut oublier totalement l'espace sur lequel est défini X. Nous pouvons
cependant donner une expression de E(X) faisant intervenir et la loi de probabilité P sur .
En effet, soit x1, x2, ..., xn les valeurs que prend X. Alors les images réciproques X–1({x1}),
X–1({x2}), ..., X–1({xn}) forment un système complet d'événements de : ils sont disjoints (car un
élément ne peut avoir deux images différentes) et leur réunion est (car tout admet comme
image l'un des xi). La somme sur peut donc se calculer en sommant d'abord sur X–1({x1}), puis
sur X–1({x2}), ..., puis sur X–1({xn}), et en faisant la somme de ces n totaux :
n
X() P({}) = X() P({})
i=1 X–1({x })
i
D'autre part, lorsque appartient à X–1({xi}), par définition, X() est égal à xi. D'où :
n n
X() P({}) = xi P({}) = xi P({})
i=1 X–1({x }) i=1 X–1({xi})
i
n n
= xi P(X–1({xi}) = xi P(X = xi) = E(X)
i=1 i=1
TEHOREME DE TRANSFERT
Soit X : {xi, i I} = X() une variable aléatoire définie sur l'espace probabilisé (, P) et
f : X() R une fonction. Alors f o X (notée également f(X)) est une variable aléatoire dont
l'espérance se calcule de la façon suivante, au moyen de la loi de X :
Autrement dit, l'espérance de la variable aléatoire f(X) définie sur l'espace probabilisé (, P) est
égale à l'espérance de f, vue comme variable aléatoire définie sur l'espace probabilisé (X(), PX)
muni de la loi de X qui vérifie PX({xi}) = P(X = xi).
Démonstration :
Elle est analogue à la démarche suivie précédemment :
n n
E(f(X)) = f(X()) P({}) = f(xi) P({}) = f(xi) P({})
i=1 X–1({x }) i=1 X–1({xi})
i
n n
= f(xi) P(X–1({xi}) = f(xi) P(X = xi)
i=1 i=1
L'intérêt de cette formule est qu'il est inutile de rechercher la loi de f(X) pour calculer son espérance.
La loi de X suffit.
EXEMPLE :
Soit X la somme de deux dés. La loi de X est la suivante :
k 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
P(X = k)
36 36 36 36 36 36 36 36 36 36 36
Cherchons l'espérance de (X – 7)2. La formule démontrée permet d'écrire :
1 2 3 4 1 35
E((X – 7)2) = 52 + 42 + 32 + 12 + ... + 52 =
36 36 36 36 36 6
Cette quantité mesure la dispersion de X autour de sa valeur moyenne et s'appelle variance de X.
PROPOSITION
L'espérance possède les propriétés suivantes :
i) a R, b R, X et Y variables aléatoires sur (, P), on a :
E(aX + bY) = aE(X) + bE(Y).
Autrement dit, l'espérance est un opérateur linéaire sur l'espace vectoriel des variables aléatoires.
ii) X 0 E(X) 0
ii bis) X Y E(X) E(Y)
iii) E(X) E( X )
iv) E(XY) E(X2) E(Y2)
v) Si X est une variable certaine égale à k, alors E(X) = k
Démonstration :
i) et ii) se déduisent facilement du fait que E(X) = X() P({}), expression linéaire par
De v), on déduit que toute variable aléatoire X – E(X) a une espérance nulle. Une telle variable,
d'espérance nulle, est dite centrée.
b) Variance
On mesure la dispersion de la variable aléatoire X autour de son espérance E(X) = en calculant la
quantité E((X – )2). Il s'agit de la variance de X, notée V(X). Si l'on développe cette quantité, on
obtient :
V(X) = E((X – )2)
= E(X2 – 2X + 2)
= E(X2) – 2E(X) + E(2)
= E(X2) – 22 + 2 car E(X) = et E(2) = 2.
X – E(X)
La variable aléatoire a une espérance nulle, et sa variance vaut 1. On dit qu'elle est
(X)
centrée réduite.
c) Lois usuelles
Variable certaine :
Soit X = k une variable certaine égale à k. Le lecteur vérifiera sans difficulté que E(X) = k,
E(X2) = k2, et V(X) = 0.
Réciproquement, il sera prouvé dans la paragraphe suivant que, si X admet une variance nulle, alors,
il existe k tel que P(X = k) = 1.
Variable de Bernoulli :
Elle admet la loi suivante :
X 0 1
PX 1–p p
On a donc : E(X) = p = E(X2) (en effet, X2 = X). D'où V(X) = p – p2 = p(l – p) = pq avec q = 1 – p
Un exemple fréquent de variable de Bernoulli est celui des fonctions indicatrices. Soit (, P) un
espace probabilisé, et A un événement. On considère la variable aléatoire définie de la façon
suivante :
1A : {0, 1}
0 si A
1 si A
Cette variable aléatoire est la fonction indicatrice de la partie A. La loi de 1A est une loi de Bernoulli
de paramètre p, avec :
p = P(1A = 1)
= P({ , 1A() = 1})
= P(A)
Alors, E(1A) = P(A)
Voici quelques règles de calcul des fonctions indicatrices, dont la vérification est laissée au lecteur :
1 = 1
1 = 0
1AB = 1A 1B
1Ac = 1 – 1A
1A\B = 1A – 1A 1B
1 – 1A B = (1 – 1A)(1 – 1B)
1AB = 1A + 1B – 1A B = Max(1A, 1B)
L'avant-dernière formule se généralise aisément à une réunion quelconque de n parties A1, ..., An, de
la façon suivante :
1 – 1Ai = (1 – 1A1)(1 – 1A2)...(1 – 1An)
En effet :
n n
1 – 1Ai = 1 (Ai)c = 1A c = 1A c = (1 – 1Ai)
i i=1 i i=1
Cela permet de démontrer la formule dite de Poincaré en développant le membre de droite, qui
donne la probabilité d'une union quelconque d'événements :
i=1
P(Ai Aj An) – ...
i i<j i<j<k
+ (–1)m–1 P(Ai1 Ai2 ... Aim) + ... + (–1)n–1 P(A1 A2 ... An)
i1<i2<...<im
Card(A)
Si P est donné par P(A) = , on obtient :
Card()
i=1
Card(Ai Aj An) – ...
i i<j i<j<k
Loi binomiale :
Soit X1 , ..., Xn n variables aléatoires de Bernoulli indépendantes (i.e. les événements correspondant
ces variables sont indépendants), à valeur dans {0, 1}, de même paramètre p. Alors la somme
n
X = Xi suit une loi binomiale B(n, p). X est égal au nombre de succès des n expériences.
i=1
Rappelons que :
E(Xi) = p
V(Xi) = p(l – p)
On en déduit que :
n
E(X) = E(Xi) = np
i=1
Par ailleurs, il est démontré plus bas au IV que la variance d'une somme de variables aléatoires
indépendantes est égale à la somme des variances. D'où :
n
V(X) = V(Xi) = np(l – p)
i=1
Loi hypergéométrique :
On reprend le modèle de l'urne de N boules dont m blanches. La variable X donnant le nombre de
boules blanches lors d'un tirage sans remise de n boules suit une loi hypergéométrique de
m
paramètres N, m, n. Notons p = la proportion initiale de boules blanches. Lors du premier tirage,
N
la probabilité de tirer une boule blanche est p. Curieusement, cette probabilité est la même à chaque
tirage, même si celui-ci se fait sans remise. Soit en effet i 1. Supposons que l'on ait tiré i boules,
i < N, et que parmi celles-ci, il y ait eu k blanches (événement Ak). Quelle est la probabilité de tirer
une boule blanche au (i + 1)-ème tirage (événement B) ? On a la probabilité conditionnelle
suivante :
m–k
P(B | Ak) = puisqu'il reste m – k blanches parmi N – i boules
N–i
m N – m
P(Ak) =
k i–k
nombre de tirages favorables sur nombre de tirages possibles
N
i
La formule des probabilités totales donne le résultat annoncé :
m N – m
P(B) = P(B | Ak) P(Ak) =
k i–k m–k
N N–i
k k
i
m – 1 N – m
m k i–k m
= = =p
N k N – 1 N
i
m – 1 N – m
car
k i–k
= 1 (somme d'une loi de probabilité hypergéométrique de paramètres N – 1,
N – 1
k
i
m – 1, i).
Par conséquent, si, comme pour la loi binomiale, on note Xi la variable aléatoire valant 1 si le i-ème
tirage est une boule blanche et 0 sinon, alors :
E(Xi) = p
n
X = Xi
i=1
nm
donc E(X) = np =
N
L'espérance est identique à celle de la loi binomiale.
Par contre la variance de la loi hypergéométrique est différente de celle de la loi binomiale car, pour
i < j, les événements Xi = 1 et Xj = 1 ne sont pas indépendants. On a :
P(Xi = 1, Xj = 1) = P(Xj = 1 | Xi = 1) P(Xi = 1)
m m–1
On a vu que P(Xi = 1) = p = . Quant à P(Xj = 1 | Xi = 1), elle vaut car, si on suppose qu'une
N N–1
blanche a été tirée au i-ème tirage, on peut supprimer ce tirage et supposer que les autres tirages sont
effectués sans remise dans une urne de N – 1 boules contenant m – 1 blanches. La probabilité de
m–1
tirer une boule blanche lors d'un tirage j donné est dans ce cas . On a alors :
N–1
mm–1
E(XiXj) = P(XiXj = 1) = P(Xi = 1, Xj = 1) =
NN–1
n n
X2 = Xi2 + 2 XiXj = Xi + 2 XiXj car Xi2 = Xi
i=1 i<j i=1 i<j
nm n m m – 1
E(X2) = + 2 2
N NN–1
nm n m m – 1 nm 2 mn(N – n)(N – m)
V(X) = + 2 2 –( ) =
N NN–1 N N2(N – 1)
N–n
= np(1 – p)
N–1
La variance de la loi hypergéométrique est légèrement inférieure à la variance np(1 – p) de la loi
binomiale.
(n – 1)! 1
l'espérance des Xi. Or P(Xi) = = car il y a (n – 1)! permutations satisfaisant (i) = i, sur
n! n
n
1
n! permutations au total. Donc E(Xi) = et E(X) = E(Xi) = 1. En moyenne, le nombre de points
n i=1
n
= E(Xi2) + E(XiXj)
i=1 ij
1 1
=n + n(n – 1)
n n(n – 1)
=2
donc V(X) = E(X2) – E(X)2 = 2 – 1 = 1.
La loi de X, non évidente, peut être trouvée en utilisant le nombre an de permutations sans point fixe
de [[ 1, n ]] (ou dérangements). Un exercice de L1/[Link] établit la formule :
n
(–1)k
an = n!
k=0 k!
On en déduit que :
1 n
P(X = r) = an–r
n! r
choisir les r points fixes, puis une permutation
sans point fixe sur les n – r éléments restants
1 n–r (–1)k
=
r! k=0 k!
Si on calcule l'espérance de X en utilisant cette loi, on obtient :
n n–r
(–1)k
E(X) = k!(r – 1)!
r=1 k=0
n–1 n–1–r
(–1)k
= en changeant d'indice r r – 1
r=0 k=0 k!r!
n–1 n–1–k
(–1)k
= en permutant les sommes
k=0 r=0 k!r!
n–1 n–1–k k
(–1)
On en déduit la formule non évidente k!r! = 1. Plusieurs autres démonstrations de cette
k=0 r=0
4- Inégalité de Bienaymé-Tchebychev
PROPOSITION
Soit X une variable aléatoire d'espérance et d'écart-type , et soit un réel strictement positif.
2
Alors : P( X – ) 2
Démonstration :
Soit l'espace probabilisé sur lequel s'applique X. Posons Y = X – . On a 2 = V(X) = E(Y2).
Notons 1Y la fonction indicatrice de l'ensemble { , Y() }. Alors, on a :
Y2 2 1Y
En effet, pour tout de :
ou bien Y() et l'inégalité ci-dessus donne bien le même résultat, puisqu'alors
1Y() = 1
ou bien Y() < , est l'inégalité ci-dessus donne Y() 0, puisque 1Y() = 0.
Dans tous les cas, l'inégalité est vérifiée. On en déduit que :
2 = E(Y2) E(2 1Y) = 2 E(1Y) = 2 P(Y )
D'où la proposition.
Cette inégalité permet d'évaluer la probabilité de s'écarter de sa moyenne. Son avantage certain est
qu'elle ne dépend pas de la loi de X. Cette loi peut être ignorée. Son inconvénient est que la
1
majoration est grossière. Pour une loi binomiale B(20, ) et = 3, on a 2 = 5, = 10 et l'inégalité
2
de Bienaymé-Tchebychev donne :
5
P( X – 10 3) 0,56
9
alors que le calcul donne P( X – 10 3) 0,26
Notons que l'argument utilisé sur la variable aléatoire Y2 se généralise à n'importe quelle variable
aléatoire Z positive ou nulle sous la forme :
a > 0, E(Z) a P(Z a) (inégalité de Markov)
en remarquant que Z a 1Za et en prenant l'espérance des deux membres.
APPLICATIONS :
Si X 0 et E(X) = 0, alors P(X = 0) = 1.
En effet, pour tout a > 0, l'inégalité de Markov donne 0 a P(X a), donc P(X a) = 0. Donc en
prenant pour a la plus petite valeur strictement positive susceptible d'être prise par X, on obtient
P(X > 0) = 0 et par passage au complémentaire, P(X = 0) = 1.
Si V(X) = 0, alors il existe tel que P(X = ) = 1.
En effet, l'inégalité de Bienaymé-Tchebychev donne P( X – ) = 0 pour tout > 0, ce qui
permet de conclure que P( X – > 0) = 0 comme ci-dessus, et par passage au complémentaire,
P(X = ) = 1.
Dans le premier cas, on dit que X est presque sûrement nulle (ou presque partout nul), dans le
second, que X est presque sûrement constante.
Soit une suite de variables aléatoires indépendantes Xi, 1 i n de même loi, d'espérance et
X + ... + Xn
d'écart-type . Appliquons l'inégalité de Bienaymé-Tchebychev à Zn = 1 . On a E(Zn) =
n
et :
V(X1 + ... + Xn)
V(Zn) =
n2
V(X1) + ... + V(Xn)
= voir IV, avec les Xi variables aléatoires indépendantes
n2
2
=
n
Donc :
2
P( Zn – ) 2
n
quantité qui tend vers 0 quand n tend vers l'infini. Cela exprime que la probabilité que Zn
appartienne à l'intervalle ] – , + [ tend vers 1 quand n tend vers l'infini, et ceci, quel que soit le
nombre choisi. Cette propriété s'appelle la loi faible des grands nombres.
5- Espérance conditionnelle
Soit (, P) un espace probabilisé et X une variable aléatoire réelle définie sur . Soit B un
événement de probabilité non nulle. On peut alors définir sur une probabilité conditionnelle PB.
On appelle espérance conditionnelle de X selon l'événement B l'espérance de X en utilisant la loi
de probabilité PB. On la note E(X | B).
EXEMPLE :
On considère un dé pipé ayant les probabilités de sortie suivantes.
1 2 3 4 5 6
2 3 2 2 3 3
15 15 15 15 15 15
Démonstration :
On a :
n
E(X) = X() P({}) = X() P({})
i=1 Ai
n
= X() PAi({}) P(Ai)
i=1 Ai
n
= P(Ai) X() PAi({})
i=1 Ai
n
= P(Ai) X() PAi({}) car si Ai, PAi({}) = 0
i=1
n
= P(Ai) E(X | Ai)
i=1
EXEMPLES :
Si on reprend l'exemple précédent du dé pipé, avec A1 = B = "tirer un nombre pair",
A2 = Bc = "tirer un nombre impair", et X la variable aléatoire donnant le numéro tiré lors d'un
lancer, on a :
8
P(A1) =
15
7
P(A2) =
15
E(X | A1) = 4
23
E(X | A2) =
7
Donc :
8 7 23 32 + 23 55 11
P(A1) E(X | A1) + P(A2) E(X | A2) = 4 + = = = = E(X)
15 15 7 15 15 3
On considère une urne contenant n boules numérotées de 1 à n. On en tire sans remise un nombre
Y, variable aléatoire. On calcule la somme X des boules tirées. Exprimons E(X) en fonction de
i si on a tiré la boule n°i n
E(Y). Posons Xi = 0 sinon
. On a donc X = Xi. Si on tire m boules, la
i=1
m
probabilité qu'une boule donnée soit tirée est . Par conséquent :
n
m
P(Xi = i | Y = m) =
n
im
donc E(Xi | Y = m) =
n
n n
im n + 1
E(X | Y = m) = E(Xi | Y = m) = = m
i=1 i=1 n 2
n n
n+1 n+1
donc E(X) = E(X | Y = m) P(Y = m) = 2 mP(Y = m) = 2 E(Y)
m=0 m=0
n+1
On notera que, si Y est la variable aléatoire certaine m, alors E(X) = m, et que, dans le cas
2
général, tout se passe comme si Y était la variable aléatoire certaine égale à son espérance.
1- Définition
On considère un espace probabilisé (, P) et deux variables aléatoires réelles X et Y définies sur .
(X, Y) est un couple de variables aléatoires. C'est l'application de à valeurs dans R2, définie
naturellement par :
(X(), Y()) R2
Si X est à valeurs dans {xi, i I} et Y à valeurs dans {yj, j J} où I et J sont deux ensembles finis,
alors (X, Y) est à valeurs dans {(xi, yj), (i, j) I J}. Pour déterminer la loi du couple, dite loi
conjointe, il suffit donc de donner la probabilité des événements élémentaires P(X = xi Y = yj)
noté également P(X = xi, Y = yj). Quant à la probabilité d'une partie A quelconque de R2, on aura,
comme pour toute variable aléatoire sur un espace fini :
P((X, Y) A) = P({ | (X(), Y )) A}
EXEMPLE :
On lance deux dés, X est le plus grand numéro tiré, Y le plus petit. Quelle est la loi conjointe ?
On la présentera sous la forme d'un tableau à double entrée.
X Y 1 2 3 4 5 6 loi de X
1 1/36 0 0 0 0 0 1/36
2 2/36 1/36 0 0 0 0 3/36
3 2/36 2/36 1/36 0 0 0 5/36
4 2/36 2/36 2/36 1/36 0 0 7/36
5 2/36 2/36 2/36 2/36 1/36 0 9/36
6 2/36 2/36 2/36 2/36 2/36 1/36 11/36
loi de Y 11/36 9/36 7/36 5/36 3/36 1/36 total 1
La convention est ici de mettre les valeurs prises par X dans la première colonne et celles prises par
Y dans la première ligne. On prendra garde qu'on aurait pu prendre la convention inverse, ce qui
aurait conduit à inverser le rôle des lignes et des colonnes dans toute la suite de ce paragraphe.
2- Lois marginales
Un couple étant donné, on appelle lois marginales les lois de X et de Y. Les lois marginales ont été
indiquées dans l'exemple précédent. On remarque qu'elles se trouvent facilement à partir de la loi
conjointe par addition des lignes ou des colonnes. En effet :
X = xi j, (X, Y) = (xi, yj)
donc { | X() = xi} = { | X() = xi, Y() = yj}. Donc :
jJ
P(X = xi) = P(X = xi,Y = yj} (somme des termes de la ligne i).
jJ
De même,
On remarquera que la connaissance des lois marginales ne permet pas de reconstituer la loi du
couple. On possède moins d'informations.
EXEMPLE :
Considérons un couple (X, Y) dont la loi conjointe est donnée par le tableau suivant :
X Y 0 1 loi X
0 p 1/2 – p 1/2
1 1/2 – p p 1/2
loi de Y 1/2 1/2 total 1
1
Quelle que soit la valeur de p, entre 0 et , la loi conjointe admet les mêmes lois marginales.
2
3- Lois conditionnelles
Soit (X, Y) un couple de variables aléatoires sur . On suppose l'événement Y = yj réalisé. On peut
alors munir de la loi conditionnelle PY=yj. La loi de X sur cet espace s'appelle loi de X sachant
Y = yj. On a donc :
P(X = xi,Y = yj)
PY=yj(X = xi) = P(X = xi | Y = yj) =
P(Y = yj)
La loi de X sachant Y = yj se trouve donc en divisant la j-ème colonne par P(Y = yj), qui n'est autre
que la somme de cette j-ème colonne. Le calcul peut être fait pour toutes les valeurs de yj, et le
résultat présenté sous la forme d'un tableau à double entrée. On pourrait également chercher la loi de
Y sachant que X = xi.
Dans le cas du tirage de deux dés, où X représente le plus grand tirage et Y le plus petit, on obtient :
Loi de Y 1 2 3 4 5 6
sachant que
X=1 1 0 0 0 0 0
X=2 2/3 1/3 0 0 0 0
X=3 2/5 2/5 1/5 0 0 0
X=4 2/7 2/7 2/7 1/7 0 0
X=5 2/9 2/9 2/9 2/9 1/9 0
X=6 2/11 2/11 2/11 2/11 2/11 1/11
La loi de Y sachant que X = i se lit dans la i-ème ligne.
Les lois conditionnelles présentent l'intérêt suivant. Si l'on connaît la loi de Y et les lois
conditionnelles de X sachant Y, alors on peut reconstituer la loi du couple. En effet :
P(X = xi,Y = yj) = P(Y = yj) PY=yj(X = xi)
4- Variables indépendantes
a) Cas de deux variables
Deux variables aléatoires X et Y à valeurs respectivement dans {xi, i I} et {yj, j J}, sont dites
indépendantes si, pour tout événement A et B :
P(X A, Y B) = P(X A) P(Y B)
En particulier, pour tout i et tout j, les événements X = xi et Y = yj sont indépendants. On a donc :
i I, j J, P(X = xi, Y = yj) = P(X = xi) P(Y = yj)
Connaissant les lois marginales, on est alors capable de reconstituer la loi du couple. Les lois
conditionnelles de X sachant Y = yj sont identiques à la loi de X.
Réciproquement, il suffit de vérifier les indépendances des événements X = xi et Y = yj pour
conclure à l'indépendance de X et Y, car :
P(X A, Y B) = P(X = xi, Y = yj)
xiA,yjB
= P(X A) P(Y B)
donc, X et Y sont bien indépendantes.
EXEMPLES :
Soit (X, Y) un couple à valeurs dans [[ 1, n ]] [[ 1, n ]] . On pose :
i
P(X = i,Y = j) = C
j
où C est une constante telle que la somme des probabilités soit égale à 1. Les variables sont-elles
indépendantes ?
La loi de X est :
n n
i
P(X = i) = P(X = i, Y = j) = C = CK i
j=1 j=1 j
n
1
où K = . C et K sont reliés par la relation suivante :
j=1 j
n n
n(n + 1)
1 = P(X = i) = CK i = CK
i=1 i=1 2
La loi de Y est :
n n
i C n C n(n + 1) 1
P(Y = j) = P(X = i, Y = j) = C = i = =
i=1 i=1 j j i=1 j 2 Kj
On a donc bien :
Ci
P(X = i) P(Y = j) = = P(X = i,Y = j).
j
En fait, on peut prévoir l'indépendance des variables si la loi conjointe est de la forme suivante :
P(X = i,Y = j) = f(i)g(j)
où f et g sont deux fonctions.
D'où P(X = i) P(Y = j) = FG f(i)g(j) = f(i)g(j) = P(X = i,Y = j) et les variables sont bien
indépendantes. Cette propriété apparaît dans le tableau donnant la loi du couple quand les lignes (ou
les colonnes) sont proportionnelles entre elles.
PROPOSITION
Soit X : R et Y : R deux variables aléatoires indépendantes. Alors pour toute fonction f
et g de R dans R, f(X) et g(Y) sont indépendantes.
Démonstration :
Pour toute valeur ui et vj que peuvent prendre f(X) et g(Y), on a :
P(f(X) = ui, g(Y) = vj) = P(X f –1(ui), Y g–1(vj))
= P(X f –1(ui)) P(Y g–1(vj))
= P(f(X) = ui) P(g(Y) = vj)
b) Cas de n variables
n variables aléatoires X1, X2, ... Xn à valeurs respectivement dans E1 = {xi1, i1 I1}, ...,
En = {xin, in In}, sont dites indépendantes si, pour tout événement A1 de E1, ..., An de En les
événements X1 A1, ..., Xn An sont indépendants, ou, de manière équivalente, si pour tout i1, ...,
tout in, les événements X1 = xi1, ..., Xn = xin sont indépendants. Il suffit de vérifier que :
i1 I1, ..., in In, P(X1 = xi1, ..., Xn = xin) = P(X1 = xi1) ...P(Xn = xin)
car une relation analogue sera vérifiée pour toute sous-famille d'événements en sommant de manière
adéquate les indices.
Si X1, X2, ... Xn sont indépendantes, on peut vérifier les propriétés suivantes :
i) Toute sous-famille extraite de (X1, ..., Xn) est indépendante
ii) si f est une fonction de E1 ... Ek et g une fonction de Ek+1 ... En à valeurs dans R, alors les
deux variables aléatoires Y = f(X1, ..., Xk) et Z = g(Xk+1, ..., Xn) sont indépendantes.
a) Cas du produit XY :
On souhaite calculer E(XY), connaissant la loi du couple (X, Y). On a :
Nous reprenons ci-dessous un raisonnement comparable à celui que nous avons tenu pour une seule
variable aléatoire dans III.3). Soient x1, x2 , ..., xn les valeurs que prend X et y1, y2, ..., ym les valeurs
prises par Y. Alors les images réciproques X–1({x1}), X–1({x2}), ..., X–1({xn}) forment un système
complet d'événements de : ils sont disjoints (car un élément ne peut avoir deux images
différentes) et leur réunion est (car tout admet comme image l'un des xi) . Il en est de même de
Y–1({y1}), Y–1({y2}), ..., Y–1({ym}). Et il en est encore de même de la famille X–1({xi}) Y–1({yj}),
1 i n, 1 j m. On peut calculer la somme sur en sommant d'abord sur chaque
X–1({xi}) Y–1({yj}), puis en faisant la somme de ces n m totaux :
D'autre part, lorsque appartient à X–1({xi}) Y–1({yj}), par définition, X() est égal à xi et Y() à
yj. D'où :
= xi yj P({})
i,j X–1({xi}) Y–1({yj})
Ainsi :
= E(X)E(Y)
EXEMPLE :
1
Soit 0 < p < . On considère un couple (X, Y) de variables aléatoires dont la loi est donnée par le
2
tableau ci-dessous :
X Y 0 1 loi de X
0 p 1/2 – p 1/2
1 1/2 – p p 1/2
loi de Y 1/2 1/2 total 1
1
XY suit une loi de Bernoulli de paramètre p. Donc E(XY) = p. Mais E(X) = E(Y) = , donc
2
1
E(X)E(Y) = , différent de p en général.
4
On prendra garde que la proposition énonce une implication et non une équivalence. Il est tout à fait
possible que E(XY) = E(X)E(Y) sans que X et Y soient indépendantes.
EXEMPLE :
On dispose de trois urnes. On y place trois boules au hasard. X est le nombre de boules dans
l'urne 1, et Y est le nombre d'urnes vides. On vérifiera que la loi conjointe est :
X Y 0 1 2 loi de X
0 0 6/27 2/27 8/27
1 6/27 6/27 0 12/27
2 0 6/27 0 6/27
3 0 0 1/27 1/27
loi de Y 2/9 6/9 1/9 total 1
Par exemple, X = 0 et Y = 1 signifie que l'urne 1 seule est vide, et il y a 6 façons sur 27 possibles de
répartir les trois boules dans les urnes 2 et 3, avec au moins une boule dans ces deux urnes (deux
façons de choisir l'urne qui ne possèdera qu'une boule, et trois façons de choisir la dite boule).
On a :
12 6 1
E(X) = 1 +2 +3 =1
27 27 27
6 1 8
E(Y) = 1 + 2 =
9 9 9
6 6 1 24 8
E(XY) = 1 +2 +6 = = = E(X)E(Y)
27 27 27 27 9
Pourtant, X et Y ne sont pas indépendantes.
(Reprendre la démonstration pour le produit XY, en remplaçant X()Y() par h(X(), Y()) et xiyj
par h(xi, yj).
Dans le cas de deux variables aléatoires indépendantes, on a :
E(f(X) g(Y)) = f(xi) g(yj) P(X = xi) P(Y = yj) = E(f(X)) E(g(Y))
i,j
ce qui découle également directement du fait que f(X) et g(Y) sont deux variables aléatoires
indépendantes, et que l'espérance d'un produit de variables aléatoires indépendantes est le produit
des espérances.
EXEMPLES :
X et Y deux variables aléatoires indépendantes de même loi de Bernouilli de paramètre p :
P(X + Y = 0) = P(X = 0) P(Y = 0) = (1 – p)2
P(X + Y = 1) = P(X = 0) P(Y = 1) + P(X = 1) P(Y = 0) = 2(l – p)p
P(X + Y = 2) = P(X = 1) P(Y = 1) = p2.
On reconnaît une loi binomiale B(2, p), ce qui n'est pas surprenant puisque la loi B(2, p) est
précisément définie comme la loi de la somme de deux variables de Bernoulli indépendantes de
même paramètre p.
On généralise ce résultat à la somme de deux variables aléatoires indépendantes suivant une loi
binomiale de même paramètre. Soit X de loi B(n, p) et Y de loi B(m, p) deux variables aléatoires
indépendantes. Alors X + Y admet pour loi une loi B(n + m, p). En effet :
n m
= r pr (1 – p)n–r k – r pk–r (1 – p)m–k+r
r
n m
= r k – r pk (1 – p)n+m–k
r
n m n + m n + m
Or r k – r = k . En effet, k est le nombre de parties de k éléments parmi n + m
r
et on peut aussi dénombrer ce nombre de parties de la façon suivante : choisit r éléments parmi n, et
k – r parmi m. On obtient finalement :
n + m
P(X + Y = k) = k pk (1 – p)n+m–k
qui est bien la loi binomiale annoncée. Ce résultat est parfaitement compréhensible si on imagine
que X est le nombre de Pile en n lancers, et Y le nombre de P en m autres lancers. Alors, X + Y est
le nombre de Pile en n + m lancers.
7- Covariance
On s'intéresse à la variance d'un somme :
V(X + Y) = E( (X + Y – E(X) –E(Y))2 )
= E((X – E(X))2 + (Y – E(Y))2 + 2(X –E(X))(Y – E(Y)) )
= V(X) + V(Y) + 2 E((X – E(X))(Y – E(Y)))
On pose alors la covariance de X et Y comme égale à :
cov(X,Y) = E((X – E(X))(Y – E(Y)))
D'où :
V(X + Y) = V(X) + V(Y) + 2 cov(X,Y)
Cette formule est à rapprocher de ce qui ce passe sur R avec : (x + y)2 = x2 + y2 + 2xy. Le rôle du
double produit est joué ici par la covariance.
PROPOSITION
La covariance vérifie les propriétés suivantes :
i) cov(X, X) = V(X)
ii) cov(X,Y) = E(XY) – E(X)E(Y)
iii) (X,Y) cov(X,Y) est bilinéaire symétrique.
iv) cov(X,Y) V(X) V(Y)
v) X et Y indépendantes cov(X, Y) = 0
vi) X et Y indépendantes V(X + Y) = V(X) + V(Y)
Démonstration :
i) est évident, d'après les définitions de la variance et de la covariance.
ii) se montre en développant cov(X,Y) :
cov(X, Y) = E((X – E(X))(Y – E(Y)))
= E(XY – XE(Y) – YE(X) + E(X)E(Y))
= E(XY) – E(XE(Y)) – E(YE(X)) + E(E(X)E(Y))
= E(XY) – E(Y)E(X) – E(X)E(Y) + E(X)E(Y)
= E(XY) – E(X)E(Y)
iii) La vérification est laissée au lecteur.
iv) résulte du fait qu'une forme bilinéaire symétrique positive vérifie l'inégalité de Schwarz.
v) Si X et Y sont indépendantes, alors E(XY) = E(X)E(Y). La propriété v) en résulte.
vi) est clairement équivalente à v), car en général, V(X + Y) = V(X) + V(Y) + 2 cov(X,Y).
cov(X,Y)
On définit le coefficient de corrélation de X et Y comme étant égal à (X, Y) = . Ce
V(X) V(Y)
nombre est compris entre –1 et 1, d'après la relation iv). Il joue un rôle analogue à celui du cosinus
pour deux vecteurs.
Si X et Y sont indépendantes, alors le coefficient de corrélation est nul. On dit que les variables sont
non corrélées. On prendra garde que cette condition n'est pas équivalente à l'indépendance de X et
Y (pas plus que le fait que E(XY) = E(X)E(Y) n'entraîne l'indépendance de X et de Y).
EXEMPLE :
Soit un couple de variables aléatoires ayant la loi suivante :
1
P(X = –1, Y = 0) = ,
2
1
P(X = 1, Y = 1) = ,
4
1
P(X = 1, Y = –1) =
4
On a :
1
P(X = –1) = P(X = 1) = donc E(X) = 0,
2
1
P(XY = 0) =
2
1
P(XY = 1) =
4
1
P(XY = – 1) = donc E(XY) = 0
4
donc cov(X, Y) = 0.
1
Cependant les variables aléatoires ne sont pas indépendantes puisque P(X = – 1, Y = 0) = alors
2
1
que P(X = –1)P(Y = 0) = .
4
Exercices
1- Enoncés
Exo.1) Titus et Bérénice jouent aux dés. Le dé de Titus est équilibré. Le dé de Bérénice a une
1–p
probabilité p de tomber sur le chiffre 6 et une probabilité de tomber sur chacun des autres
5
chiffres. Le jeu se joue en un lancer de dé pour chaque joueur, le gagnant étant celui qui sort le plus
grand chiffre. En cas d'égalité la partie est nulle. Quelle est la probabilité que la partie soit nulle ?
1
Que Titus gagne ? Que Bérénice gagne ? Vérifier que, si p > , Bérénice a plus de chance de gagner
6
que Titus.
Exo.2) Dans un groupe de n personnes, quelle est la probabilité que deux personnes au moins aient
leur anniversaire le même jour ? (on ne tient pas compte des années bissextiles). Pour quelle valeur
1
de n cette probabilité dépasse-t-elle ?
2
Exo.3) On dispose de trois roulettes A, B, C disposant chacune de trois secteurs numérotés comme
suit :
A B C
1 9 2 7 3 8
5 6 4
Quand on lance une de ces roulettes, chaque secteur a la même probabilité d'être sélectionné. Titus
choisit une des roulettes à sa guise, puis Bérénice prend la roulette suivante dans l'ordre
A B C A. Chacun fait tourner sa propre roulette. Le gagnant est celui qui tire le plus grand
nombre. Quelle est la roulette que doit choisir de préférence Titus ?
Exo.4) Dans une loterie, il y a 1000 billets dont 2 sont gagnants. Combien en prendre pour avoir une
5
probabilité de posséder au moins un billet gagnant supérieure à ?
100
Exo.5) Soit n un entier strictement positif. On considère un jeu de dominos, chaque domino étant
constitué d'une paire de nombres entiers (éventuellement égaux) de 1 à n. Si i j, le domino (i, j) est
identique au domino (j, i).
a) Combien y a-t-il de tels dominos ?
b) On en prend deux. Quelle est la probabilité qu'ils portent un nombre commun ?
Exo.6) a) Dans une urne, on dispose 2n boules numérotées de 1 à 2n. On en tire une première boule
que l'on remet dans l'urne, puis on en tire une deuxième. Quelle est la probabilité que la somme des
deux numéros tirés soit pair ? Même question si le tirage est effectué sans remise.
b) Dans une urne, on dispose 3n boules numérotées de 1 à 3n. On en tire trois avec remise de
chaque boule tirée. Quelle est la probabilité que la somme des deux numéros tirés soit un multiple
de 3 ? Même question si le tirage est effectué sans remise.
Exo.7) On donne ci-dessous plusieurs problèmes datant des débuts du calcul des probabilités, et
proposés par Christian Huygens, De ratiociniis in ludo aleae (1657)1 :
a) Proposition XI : "Trouver en combien de fois l'on peut accepter de jeter deux 6 avec deux
dés". En version moderne : on lance deux dés n fois de suite. Quelle est la probabilité que l'un des
lancers au moins donne un double 6 ? Quelle valeur donner à n pour que cette probabilité dépasse
1
?
2
b) Proposition XII. "Trouver le nombre de dés avec lequel on peut accepter de jeter deux 6
du premier coup". En version moderne : On lance n dés. Quelle est la probabilité d'obtenir au moins
1
deux 6 ? Quelle valeur donner à n pour que cette probabilité dépasse ?
2
c) Deuxième problème. "Trois joueurs, A, B et C prennent 12 jetons dont 4 blancs et 8
noirs ; ils jouent à cette condition que celui gagnera qui aura le premier, en choisissant à
l'aveuglette, tiré un jeton blanc, et que A choisira le premier, B ensuite, puis C, puis de nouveau A
et, ainsi de suite, à tour de rôle. On demande le rapport de leurs chances".
1
Voir le texte original en ligne : [Link] et pages suivantes.
d) Troisième problème. "A parie contre B, que de 40 cartes, dont 10 de chaque couleur, il en
tirera 4 de manière à en avoir une de chaque couleur. On trouve dans ce cas que la chance de A est à
celle de B comme 1000 est à 8139".
e) Quatrième problème. "On prend 12 jetons, dont 4 blancs et 8 noirs. A parie contre B que
parmi 7 jetons qu'il en tirera à l'aveuglette, il se trouvera 3 blancs. On demande le rapport de la
chance de A à celle de B".
Exo.8) En 2010, en France, la proportion de naissances issues d'une fécondation in vitro (FIV) était
de 1,5%. Parmi les naissances issues d'une FIV, 18% sont des naissances de jumeaux, contre 2%
pour l'ensemble de toutes les naissances. Quelle est la probabilité que deux jumeaux nés en 2010,
pris au hasard, soient issus d'une FIV ?
Exo.9) On met en œuvre un test détectant une maladie qui touche 1 personne sur 145 dans la
population visée. Lors d'un test de dépistage, la probabilité qu'un individu atteint ait un test positif
est de 0,96 (les 4% restants sont appelés faux négatifs). La probabilité qu'un individu non atteint ait
un test négatif est 0,94 (les 6% restants sont appelés faux positifs). On teste un individu quelconque
de la population visée. On observe que le test est positif. Quelle est la probabilité qu'il soit atteint
par la maladie ?
Exo.10) Soient A, B et C trois événements dans un espace probabilisé (, P). Montrer que :
a) A et B indépendants A et Bc indépendants
P(A B C) = P(A) P(B C)
b) A et B sont indépendants
P(A B Cc) = P(A) P(B Cc)
c) P(A B) P(Ac Bc) = P(A Bc) P(Ac B) A et B sont des événements
indépendants.
Exo.11) Au casino, un joueur décide de jouer à la roulette tant qu'il n'a pas gagné, tout en se limitant
à un maximum de N parties. On note p la probabilité qu'il gagne à chaque partie et X le nombre de
parties qu'il joue.
N
a) Donner P(X = n) pour n < N, puis pour n = N. Vérifier que P(X = n) = 1.
n=1
b) Calculer et simplifier l'espérance E(X) et vérifier le résultat obtenu dans les cas N = 1,
N = 2, ou p tendant vers 0.
Exo.12) On considère une urne de N boules dont n sont blanches. On tire les boules une par une
sans remise jusqu'à avoir tiré toutes les boules blanches. Soit X le nombre de boules ainsi tirées.
Donner la loi de X et son espérance.
Exo.13) On considère une urne contenant n boules. On tire n boules avec remise. On peut donc tirer
plusieurs fois la même boule. Soit X le nombre de boules distinctes tirées au bout des n tirages.
a) Donner l'expression de E(X) ainsi qu'un équivalent de cette quantité quand n tend vers
+.
b) Donner la loi de X.
Exo.14) On considère un groupe de n personnes. Chaque personne envoie une lettre à une des n – 1
autres personnes choisie au hasard suivant une loi uniforme.
a) Combien existe-t-il de répartitions possibles d'envois ?
b) On considère une personne donnée. Soit X le nombre de lettres qu'elle reçoit. Quelle est la
loi de X ? Son espérance ? Sa variance ?
c) Pour tout entier naturel k, déterminer k = lim P(X = k). Vérifier que k = 1.
n k=0
Exo.15) Soit un réel élément de ]0, 1[ et n un entier strictement positif. On désigne par n(1 + )
le plus grand entier inférieur ou égal à n(1 + ), et par n(1 – ) le plus petit entier supérieur ou
égal à n(1 – ). Montrer, en utilisant une inégalité de Bienaymé-Tchebychev, que :
n(1+)
2n
(1 – 12 ) 4n
k=n(1–)
k 2 n
Exo.16) Un appareil, prévu pour fonctionner pendant une durée T, est formé de n composants. Ces
composants sont disposés en parallèle de façon à réduire le risque de panne globale de l'appareil. On
cherche à déterminer n pour minimiser le coût de fonctionnement de l'appareil pendant la durée T
donnée. Plus précisément, chaque composant coûte un prix égal à a. La probabilité qu'un composant
tombe en panne pendant la durée T est p, le risque de panne étant indépendant d'un composant à
l'autre. Le système complet tombe en panne quand tous ses composants sont défectueux. Dans ce
cas, la panne du système au cours de la durée T entraîne un préjudice dont le coût est égal à b.
Déterminer la valeur de n en fonction de a, b, p pour que l'espérance du coût pendant la durée T soit
le plus petit possible.
1 1
Applications numériques : a = 1, b = 1000, p = , puis a = 1, b = 100 000, p =
100 100
Exo.18) Soit Sn le groupe symétrique, dont les éléments sont les permutations de [[ 1, n ]] . On
définit sur Sn une loi de probabilité uniforme et on note Xn la variable aléatoire telle que, pour tout
élément de Sn, Xn() est égale au nombre de cycles de la permutation (voir
L1/[Link]). Par exemple, pour n = 5 et définie par (1) = 4, (2) = 3, (3) = 2,
(4) = 1, (5) = 5, il y a trois cycles : {1, 4}, {2, 3} et {5}. Donc X() = 3. Si est définie par
(1) = 4, (2) = 1, (3) = 5, (4) = 2, (5) = 3, il y a deux cycles : {1, 4, 2} et {3, 5}. Donc
X() = 2.
a) Donner une expression de l'espérance de Xn. Pour cela, on pourra déterminer une relation
entre Xn+1 et Xn, en définissant les permutations de [[ 1, n + 1 ]] à partir des permutations de
[[ 1, n ]] , soit en ajoutant le cycle constitué du seul élément {n + 1}, soit en insérant l'élément n + 1
parmi un cycle de . On en déduira ensuite une relation entre E(Xn+1) et E(Xn).
b) Donner une expression de la variance de Xn.
Exo.19) Dans un jeu, on dispose de n cartes portant chacune un nombre entier positif différent. Les
nombres en question sont inconnus du joueur. Un animateur bat les cartes (les permutations des
cartes ainsi obtenues sont équiprobables), puis les retourne une par une devant le joueur de façon à
ce que celui-ci voit le nombre indiqué. Celui-ci arrête l'animateur à son gré et gagne un prix dont le
montant est égal au nombre figurant sur la dernière carte retournée.
a) Un joueur décide d'arrêter l'animateur à un rang quelconque, le rang étant choisi avec une
loi uniforme sur [[ 1, n ]]. Quelle est la probabilité qu'il tombe sur la carte portant le plus grand
nombre ?
b) Un autre joueur se donne un entier m < n, laisse passer les m premières cartes, note le
maximum de ces m cartes puis arrête l'animateur à la première carte qui suit dont le nombre est
supérieur à ce maximum (si elle existe, sinon il désigne la dernière carte). On note :
Ek l'événément "La carte portant le plus grand nombre se trouve au rang k",
Fk l'événement "La carte ayant le nombre maximal parmi les cartes de rang 1 à k est l'une des
m premières",
G l'événement "Le joueur choisit la carte portant le plus grand nombre".
Donner P(Ek), P(Fk), P(Ek Fk–1), P(G | Ek), et enfin P(G).
m
Donner un équivalent de P(G) quand n et m tendent vers l'infini de façon que tende vers un réel
n
élément de ]0, 1[. Comment choisir pour que ce résultat soit le plus grand possible ?
Exo.20) Une société démarche n clients potentiels par téléphone. Soit p ]0,1[ la probabilité,
supposée identique pour tous, qu'un client contacté réponde. Le fait qu'un client réponde est
indépendant de ce que font les autres clients. Soit X le nombre de clients qui ont répondu à la
société.
a) Quelle est la loi de X et son espérance E(X) ?
b) Peu de temps après, la société tente de nouveau de contacter les clients qui n'ont pas
répondu la première fois. Si X = k, il y a donc n – k clients à démarcher. Soit q (éventuellement
différente de p) la probabilité qu'un client contacté pour la deuxième fois réponde. Soit Y le nombre
de clients qui répondent. Quelle est la loi de Y, conditionnelle à l'événement X = k, et son
espérance, notée E(Y | X = k) ?
c) Quelle est la loi du couple (X, Y) ?
d) Quelle est la loi marginale de Y ? Quelle est son espérance E(Y) ? Vérifier que :
n
E(Y) = E(Y | X = k)P(X = k)
k=0
Exo.21) Soit n un entier strictement positif. On considère l'ensemble constitué des points (i, j) de
Z2 tels que 0 i n – j . On définit sur une probabilité P uniforme et on considère sur les
deux variables aléatoires X et Y suivantes : X(i, j) = i et Y(i, j) = j.
a) Déterminer la loi de X, la loi de Y, E(X), E(Y), E( Y ). Donner un équivalent de E(X) et
de E( Y ) quand n tend vers l'infini.
b) Pour tout j, déterminer la loi conditionnelle de X relativement à l'événement Y = j, ainsi
n
que son espérance, que l'on notera E(X | Y = j). Vérifier que E(X) = E(X | Y = j)P(Y = j).
j=–n
Exo.23) a) n personnes se répartissent au hasard dans trois pièces. Soit Xi le nombre de personnes
dans la pièce i. Donner la loi des Xi, celle de X1 + X2, et calculer le coefficient de corrélation
(X1, X2).
b) On lance un dé n fois. Soit X1 (respectivement X2) le nombre de fois où le chiffre 1
(respectivement le nombre de 2) sort. Calculer le coefficient de corrélation (X1, X2).
c) Soient X1, ..., Xm des variables aléatoires ayant même variance non nulle V(Xi) = 2, et
1
même covariance cov(Xi, Xj) = 2 (i j). Montrer que – .
m–1
d) Justifier que le a) et le b) relèvent du c).
Exo.24) Soit X de loi binomiale B(N, p), n un entier inférieur ou égal à N, et Y une variable
aléatoire telle que, pour tout m élément de [[ 0, N ]] , et tout k tel que 0 k m, et 0 n – k N – m :
m N – m
P(Y = k | X = m) =
k n–k
N
n
Autrement dit, la loi de Y conditionnellement à l'événement X = m et la loi hypergéométrique de
paramètres N, m, n.
a) Déterminer la loi de Y.
b) Déterminer P(X = m + k | Y = k)
c) Considérant N objets, on les prend un par un et on dispose une marque sur chacun d'eux
avec une probabilité p. Puis on en prend n au hasard sans remise et on compte combien sont
marqués. Utiliser cette situation pour interpréter le a) et le b).
2- Solutions
1–p 1 1 1
Sol.1) P(nulle) = 5 +p =
5 6 6 6
6
1 1–p 1 56 1–p 1–p
P(Titus gagne) = 6 (k – 1) 5 = 6 2 5 = 2 . Le calcul est fait en considérant
k=2
1 p 1–p 1
P(Bérénice gagne) > P(Titus gagne) + > p>
3 2 2 6
Sol.2) Cherchons plutôt la probabilité que les anniversaires soient tous différents :
365 364 ... (365 – n + 1)
365n
365 364 ... (365 – n + 1) 1
Donc la probabilité cherchée est 1 – . Elle dépasse pour n = 23.
365n 2
Autrement dit, dans une classe de 23 élèves ou plus, il y a plus d'une chance sur deux que deux
élèves aient leur anniversaire le même jour.
1 3 4
Sol.3) Si Titus choisit A, la probabilité qu'il gagne est + =
9 9 9
2 2 4
S'il choisit B, la probabilité qu'il gagne est + =
9 9 9
1 1 2 4
S'il choisit C, la probabilité qu'il gagne est + + =
9 9 9 9
Le choix de la roulette n'a aucune importance, et il n'y a pas de roulette plus favorable qu'une autre.
Quelle que soit la roulette choisie par Titus, Bérénice a plus de chance de gagner que lui.
Sol.6) a) Avec remise, la probabilité est celle de tirer une deuxième boule de parité donnée (celle de
1
la première boule) parmi 2n. C'est .
2
Sans remise, le tirage peut s'opérer comme suit. On tire une première boule portant le numéro a1. Il
reste 2n – 1 boules dont n – 1 ont la même parité que a1 et n une parité différente. La probabilité est
n–1
.
2n – 1
b) Avec remise, la probabilité est celle de tirer la troisième boule parmi 3n de façon que la valeur de
cette troisième boule modulo 3 soit donnée (opposée à la somme des valeurs des deux premières
1
boules). C'est .
3
Sans remise, le tirage peut s'opérer comme suit. On tire une première boule portant le numéro a1. Il
reste 3n – 1 boules dont n – 1 ont le même reste modulo 3 que a1 et 2n un reste différent. On tire
ensuite une boule portant le numéro a2. Il y a deux cas :
n–1
ou bien a2 a même reste que a1 (cas qui se produit avec une probabilité ) et il reste 3n – 2
3n – 1
boules dont n – 2 ont le même reste. On souhaite que la troisième boule a3 ait ce reste, ce qui arrive
n–2
avec une probabilité .
3n – 2
2n
ou bien a2 a un reste différent de celui de a1 (cas qui se produit avec une probabilité ). Il reste
3n – 1
3n – 2 boules, dont n – 1 ont même reste que a1, n – 1 même reste que a2, n un reste différent. C'est
n
parmi ces dernières qu'on doit tirer a3, ce qui arrive avec une probabilité .
3n – 2
La formule des probabilités totales donne :
n–1 n–2 2n n 3n2 – 3n + 2
+ =
3n – 1 3n – 2 3n – 1 3n – 2 (3n – 1)(3n – 2)
1
Sol.7) a) La probabilité de sortir un double 6 en lançant deux dés est . La probabilité de ne jamais
36
35
obtenir un double 6 en n lancers est ( )n. La probabilité d'obtenir au moins un double 6 est
36
35 n 1 ln(2)
1 – ( ) . On dépasse pour n 24.605 donc n = 25 convient.
36 2 36
ln( )
35
5 5n–1
b) La probabilité de ne sortir aucun 6 est ( )n et la probabilité d'en sortir un seul est n n . Donc la
6 6
n–1
5 5
probabilité demandée est 1 – ( )n – n n . Pour n = 9, on obtient 0.457..., et pour n = 10, on obtient
6 6
0.515.... Donc n = 10 convient.
Sol.9) On applique la formule de Bayes. Soit A l'événement "être atteint par la maladie", et B
l'évènement "réagir positivement au test".
On a, selon les hypothèses données :
P(B | A) = 0,96
P(Bc | Ac) = 0,94 donc P(B | Ac) = 0,06 (faux positifs)
1 144
P(A) = donc P(Ac) =
145 145
On demande P(A | B) :
P(A B) P(B | A) P(A) 0,96 1
P(A | B) = = = =
P(B) P(B | A) P(A) + P(B | Ac) P(Ac) 0,96 + 0,06 144 10
Cet exercice illustre la difficulté d'application des tests de dépistage. Appliqués sur une population
trop grande dans laquelle la proportion de malades est faible, la plupart des tests positifs
proviennent de faux positifs.
N N+1
1–x
On calcule la première somme en partant de xn = 1 – x qu'on dérive :
n=0
N
– (N + 1)xN(1 – x) + 1 – xN+1 1 + NxN+1 – (N + 1)xN
nxn–1 = (1 – x)2
=
(1 – x)2
n=1
Donc :
1 + N(1 – p)N+1 – (N + 1)(1 – p)N
E(X) = + N(1 – p)N
p
1 + N(1 – p)N+1 – (N + 1)(1 – p)N + Np(1 – p)N
=
p
1 + N(1 – p) – (N + 1)(1 – p)N – N(1 – p)N+1 + N(1 – p)N
N+1
=
p
N
1 – (1 – p)
=
p
Pour N = 1, on a X = 1 et E(X) = 1.
Pour N = 2, on a P(X = 1) = p et P(X = 2) = 1 – p donc E(X) = 2 – p.
Si p tend vers 0, E(X) tend vers N.
Sol.12) Tirons toutes les boules une par une en notant pour chacune d'elle son rang de tirage. On
obtient ainsi une numérotation des N boules de 1 à N et X et le rang le plus élevé correspondant à
une boule blanche. Le problème est alors équivalent au suivant : parmi les N entiers de 1 à N, on
choisit une partie de n éléments et on note X le plus grand élément choisi (au lieu de fixer les boules
blanches et de choisir un tirage aléatoire, on fixe le tirage et ce sont n boules qu'on colorie
N
aléatoirement en blanc). Dans cette configuration, le nombre de parties possibles est n et le
k – 1
nombre de parties satisfaisant l'événement X = k est n – 1 (la partie comprend l'élément k et n – 1
éléments plus petits). Donc :
k – 1
P(X = k) =
n – 1
N
n
k – 1 k N + 1
N
E(X) = k =n
=n
N
n – 1 n n + 1 n(N + 1)
=
N k=n N N n+1
k=n
n n n
N
k N + 1
On a utilisé la formule n = n + 1 vue dans L1/[Link].
k=n
E(X) = n(1 – (1 – )n) = n(1 – exp(nln(1 – 1/n)) = n(1 – exp(–1 + o(1)) n(1 – )
1 1
n e
b) On prendra garde que les Xi ne sont pas indépendantes et donc que X ne suit pas une loi
binomiale. L'univers constitué de tous les tirages possibles est l'ensemble des fonctions f de
[[ 1, n ]] dans [[ 1, n ]] , où f(i) est le numéro de la boule tirée au i-ème tirage, et son cardinal est nn.
Dire que X = k, c'est dire que f prend k valeurs distinctes, donc est une application surjective de
[[ 1, n ]] sur une partie constituée de k éléments. Si on note (n, k) le nombre de surjections d'un
n
ensemble à n éléments sur un ensemble à k éléments, il y a k (n, k) telles applications (choix de
k éléments parmi n choix d'une surjection sur ces k éléments). Donc :
n (n, k)
P(X = k) = k
nn
Une expression explicite de (n, k) est donnée en annexe de L1/[Link]. On peut alors
retrouver l'expression de E(X) à partir de la loi de X, mais à l'issue de calculs assez longs (en
particulier, il conviendra de permuter de signes de sommation).
Sol.14) a) (n – 1)n.
1
b) Il s'agit d'une loi binomiale B(n – 1, ).
n–1
E(X) = 1
1 1 n–2
V(X) = (n – 1) (1 – )=
n–1 n–1 n–1
n 1 1 n–k n(n – 1)...(n – k + 1) 1 1 n–k
c) P(X = k) = k (1 – ) = (1 – )
(n – 1)k
n–1 k! (n – 1)k
n–1
k –1
n 1k (1 – 1 )n–1 e quand n tend vers l'infini
k! n n–1 k!
e–1
Nous verrons dans L2/[Link] que les valeurs k = définissent une loi de probabilité sur
k!
–1
l'ensemble infini N appelée loi de Poisson de paramètre 1. On a k = e = 1 car
1
k! = e.
k!
k=0 k=0 k=0
Voir L1/[Link].
1
Sol.15) Soit X une variable aléatoire suivant une loi binomiale B(2n, ). On a :
2
n(1+)
2n 1
2n = P(n(1 – ) X n(1 + )) = P( X – n n) = 1 – P( X – n > n)
k 2
k=n(1–)
2n
précédente donne une évaluation grossière de la concentration des valeurs de k dans l'intervalle
1
[n(1 – ), n(1 + )]. Elle ne présente d'intérêt que si > . Par exemple, pour n = 20 et = 0.6,
2n
n(1+)
2n
vaut 1.099 1012, alors que (1 – 12 ) 4n = 1.023 1012.
k=n(1–)
k 2 n
Sol.16) Le coût vaut na s'il y a au moins un composant en marche à l'issue de la durée garantie, et
na + b si tous les composants tombent en panne. Donc l'espérance du coût est :
En = na + bpn
On étudie le sens de variation de la suite (En) :
a a
En+1 – En = a + bpn(p – 1) 0 bpn ln(b) + nln(p) ln( )
1–p 1–p
a
ln( )
b(1 – p)
n
ln(p)
a
ln( )
b(1 – p)
Donc le minimum de l'espérance est obtenu pour + 1.
ln(p)
Applications numériques : On trouve n = 2, puis n = 3.
1
= (n + 1)Xn() où la somme porte sur tous les éléments Sn et qu'il
(n + 1)!
1
Sol.19) a)
n
1
b) P(Ek) =
n
m
P(Fk) =
k
m
P(Ek Fk–1) = P(Fk–1 | Ek) P(Ek) = P(Fk–1) P(Ek) =
n(k – 1)
car le fait de savoir que la carte portant le plus grand nombre se trouve en k ne modifie en rien la
probabilité que la carte ayant le nombre maximal parmi celles de rang 1 à k – 1 se trouve en telle ou
telle position. Ainsi, les événement Ek et Fk–1 sont indépendants.
On peut aussi dénombrer le nombre de cas favorables réalisant l'événement Ek Fk–1 :
placer la carte portant le plus grand nombre (1 choix) au rang k,
n – 1
choisir k – 1 cartes parmi les n – 1 qui restent ( k – 1 choix),
choisir l'emplacement entre 1 et m qui accueillera la carte ayant le nombre maximal parmi
celles de rang 1 à k – 1 (m choix possibles),
placer la carte ayant le nombre maximal parmi le paquet des k – 1 cartes sélectionnées à
l'emplacement précédemment choisi, et placer les k – 2 autres cartes au hasard aux places restantes
((k – 2)! choix),
placer les n – k cartes non utilisées au hasard après la k-ème ((n – k)! choix).
n – 1 (n – 1)! m
Cela donne k – 1 m (k – 2)! (n – k)! = cas favorables. D'où la probabilité cherchée
(k – 1)
en divisant par n!.
P(F | E ) = P(F ) = m si k > m
P(G | Ek) =
k–1 k k–1
k–1
0 sinon
n n
m m n–1 1
P(G) = P(G | Ek) P(Ek) = =
k=m+1 k=m+1 n(k – 1) n k=m k
n–1
1
On peut donner un équivalent de au moyen d'encadrement par des intégrales :
k=m k
Cet exercice est parfois présenté de façon assez cynique sous le vocable problème du recrutement.
n
On a n candidats pour un poste, de valeurs différentes. On passe en revue m d'entre eux, avec m .
e
On prend le premier candidat qui suit les m premiers et qui est meilleur que ceux-ci, ou le dernier si
le meilleur de tous était dans les m premiers. La probabilité de recruter ainsi le meilleur de tous est
1
de l'ordre de .
e
n
n–r n – r
= r (1 – p)r qr k pk(1 – p)n–r–k(1 – q)n–k–r
k=0
n
= r (1 – p)r qr (p + (1 – p)(1 – q))n–r
n
= r (q – pq)r (1 – q + qp)n–r
Il s'agit d'une loi binomiale B(n, q – qp), ce qui peut s'expliquer directement comme suit. Pour être
comptabilisé dans Y, le client doit subir un échec lors du premier appel (probabilité 1 – p) et un
succès lors du second appel (probabilité q), soit une probabilité totale de (1 – p)q. On effectue alors
n expériences de Bernoulli sur chaque client, avec une probabilité de succès (1 – p)q.
E(Y) = nq(1 – p)
n n
n
et E(Y | X = k)P(X = k) = (n – k)q k pk (1 – p)n–k
k=0 k=0
n–1
n–1
= nq(1 – p) k pk (1 – p)n–1–k
k=0
s
e) P(X + Y = s) = P(X + Y = s | X = k) P(X = k)
k=0
s
= P(Y = s – k | X = k) P(X = k)
k=0
s
n – k n
= s – k qs–k (1 – q)n–s k pk (1 – p)n–k
k=0
s
n!
= k!(s – k)!(n – s)! qs–k (1 – q)n–s pk (1 – p)n–k
k=0
n s s
= s k qs–k (1 – q)n–s pk (1 – p)n–k
k=0
n s
s
= s (1 – q)n–s (1 – p)n–s k qs–k pk (1 – p)s–k
k=0
n
= s (1 – q)n–s (1 – p)n–s (p + q(1 – p))s
n
= s (1 – q)n–s (1 – p)n–s (p + q – qp)s
Il s'agit d'une loi binomiale B(n, 1 – (1 – p)(1 – q)). On peut la trouver directement en observant que
la probabilité que chaque client contacté réponde à l'un des deux appels est 1 – (1 – p)(1 – q).
E(X + Y) = n(1 – (1 – p)(1 – q)) = n(p + q – pq)
= E(X) + E(Y) en cohérence avec les questions précédentes.
f) X + Y + Z suit une loi B(n, 1 – (1 – p)(1 – q)(1 – r)). Son espérance est :
n(1 – (1 – p)(1 – q)(1 – r))
...
...
...
2n + 1 – 2i
Pour 0 i n, P(X = i) = . 2n + 1 – 2i est le nombre de points sur la colonne i.
(n + 1)2
n+1– j
Pour – n j n, P(Y = j) = . n + 1 – j est le nombre de points sur la ligne j.
(n + 1)2
n
2n + 1 – 2i (2n + 1)n n(2n + 1) n(2n + 1) n
E(X) = i = – =
i=0 (n + 1)2 2(n + 1) 3(n + 1) 6(n + 1) 3
n n+1– j
E(Y) = j (n + 1)2 = 0
j=–n
n n+1– j n
n+1–j n(2n + 1) n2 + 2n n
E( Y ) = j =2j = n – =
j=–n (n + 1)2 j=1 (n + 1)2 3(n + 1) 3(n + 1) 3
P(X = i, Y = j) 1
b) P(X = i | Y = j) = = , loi uniforme sur [[ 0, n – j ]]
P(Y = j) n+1– j
n– j
i n– j
E(X | Y = j) = =
2
i=0 n+1– j
n n n– j n+1– j
E(X | Y = j)P(Y = j) = 2 (n + 1)2
j=–n j=–n
n 1 2 n
n + 1 – j n 1 2 n + 1
= + 2
=
+ 2
2 n + 1 (n + 1) j=1 2 2 n + 1 (n + 1) 3
n 1 n(n – 1) n(2n + 1)
= + = = E(X)
2 n + 1 3(n + 1) 6(n + 1)
n– j n– Y
c) f(Y)(i, j) = f(Y(i, j)) = f(j) = E(X | Y = j) = donc f(Y) = et son espérance est :
2 2
n 1 n n + 2n 2n2 + n
2
E(f(Y)) = – E( Y ) = – = = E(X)
2 2 2 6(n + 1) 6(n + 1)
Pour montrer que E((X – f(Y))g(Y)) = 0, linéarité, puisque g(Y) = g(j) 1Y=j, il suffit de le montrer
j
pour toute fonction g(Y) de la forme 1Y=j. Pour une telle fonction :
E((X – f(Y))g(Y)) = E((X – f(Y)) 1Y=j)
= E((X – f(j)) 1Y=j)
= E(X 1Y=j) – f(j) P(Y = j)
n
= E(X 1Y=j | Y = k) P(Y = k) – f(j) P(Y = j)
k=–n
Sol.22) En raisonnant sur les variables Xi – et Z – , on se ramène au cas où toutes les variables
sont centrées. On a alors, pour tout i :
X1 X n–1 X X
E((Xi – Z)2) = E((– – ... – i–1 + Xi – i+1 – ... – n)2)
n n n n n
X1 Xi–1 n – 1 Xi+1 Xn
= V(– – ... – + Xi – – ... – )
n n n n n
X X n–1 X X
= V( 1) + ... V( i–1) + V( Xi) + V( i+1) + ... + V( n)
n n n n n
car les variables sont indépendantes
n–1 (n – 1)2 2 n – 1 2
= 2 2 + = indépendant de i
n n2 n
1 n
donc E((Xi – Z)2) = 2.
n – 1 i=1
Certaines calculatrices, dotées de fonctions statistiques, proposent deux manières de calculer l'écart-
1 n
type d'une liste (x1, ..., xn) de valeurs. Ayant calculé m = xi, elles proposent de prendre :
n i=1
1 n
ou bien
n i=1
(xi – m)2
1 n
ou bien (xi – m)2
n – 1 i=1
Le premier cas s'applique si on dispose d'une liste complète des données. Si une variable aléatoire X
1 n
prend les valeurs x1, ..., xn de façon équiprobable, m n'est autre que E(X),
n i=1
(xi – m)2 vaut V(X) et
estimation de 2, au sens un tirage de n autres valeurs donnerait un résultat différent, avec
1 n
cependant en moyenne la valeur de 2 cherchée. L'utilisation de la formule
n i=1
(Xi – Z)2 donnerait
1
Sol.23) a) La loi de Xi est une loi binomiale B(n, ). Comme X1 + X2 = n – X3, on a :
3
n 1 2 n 1 2
P(X1 + X2 = k) = P(X3 = n – k) = n – k n–k ( )k = k n–k ( )k
3 3 3 3
qui est une loi binomiale B(n, 2). On peut aussi dire que X1 + X2 est le résultat de n expériences
3
indépendantes de Bernoulli où le succès consiste à entrer dans les pièces 1 ou 2, avec une
2
probabilité . En particulier :
3
1 2 2n
V(Xi) = n = = V(X1 + X2)
3 3 9
Comme V(X1 + X2) = V(X1) + V(X2) + 2cov(X1, X2), on en déduit :
n
cov(X1, X2) = –
9
n
9 1
et (X1, X2) = – =–
2n 2
9
1 n 5n
b) X1 et X2 suivent des lois binomiales B(n, ), donc E(X1) = E(X2) = , et V(X1) = V(X2) = . Par
6 6 36
1
ailleurs, la loi de X1 sachant que X2 = k est une loi binomiale B(n – k, ), donc :
5
k(n – k)
E(X1X2 | X2 = k) = E(X1k | X2 = k) = k E(X1 | X2 = k) =
5
n
et E(X1X2) = E(X1X2 | X2 = k) P(X2 = k)
k=0
n
k(n – k)
= 5
P(X2 = k)
k=0
X (n – X2)
= E( 2 )
5
1
= (nE(X2) – E(X22))
5
1
= (nE(X2) – V(X2) – E(X2)2)
5
1 n2 5n n2
= ( – – )
5 6 36 36
n2 – n
=
36
n
donc cov(X1, X2) = E(X1X2) – E(X1)E(X2) = –
36
On peut aussi calculer E(X1X2) à partir des formules :
n n – k 1 4
P(X1 = k, X2 = l) = k l k+l ( )n–k–l
6 6
n n – k 1 4
et E(X1X2) = k l kl k+l ( )n–k–l
k,l 6 6
mais c'est assez fastidieux.
2
On peut aussi dire que X1 + X2 suit une loi binomiale B(n,
) (on répète n expériences
6
2
indépendantes de Bernoulli où le succès consiste à tirer 1 ou 2, avec une probabilité ), donc :
6
1 1 2n 5n n
cov(X1, X2) = (V(X1 + X2) – V(X1) – V(X2)) = ( – ) = –
2 2 9 18 36
Finalement, on en déduit que :
n
36 1
(X1, X2) = – =–
5n 5
36
c) On a :
m
0 V(X1 + ... + Xm) = V(Xi) + cov(Xi, Xj) = m2 + m(m – 1)2
i=1 ij
d'où le résultat.
1 1
d) Le a) est une application directe du c) avec m = 3. On a précisément = – =– dans ce
2 m–1
cas, car X1 + X2 + X3 est la variable certaine n dont la variance est nulle, et le calcul de c) donne
alors une égalité.
Le b) relève aussi du c) en notant Xi le nombre de fois où le chiffre i est sorti, 1 i 6. On a donc
6
1
ici m = 6. On retrouve l'égalité = – en remarquant que, là aussi, Xi = n de variance nulle, donc
5 i=1
m N – m
k n – k N pm (1 – p)N–m
N–n+k
= m
N
m=k
n
N–n+k
m! (N – m)! N! n! (N – n)!
= k! (m – k)! (n – k)! (N – m – n + k)! m! (N – m)! N! pm (1 – p)N–m
m=k
N–n+k
n! (N – n)!
= k! (m – k)! (n – k)! (N – m – n + k)! pm (1 – p)N–m
m=k
n N–n+k N – n
= k m – k pm (1 – p)N–m
m=k
n N–n N – n
= k m pm+k (1 – p)N–m–k
m=0
en changeant d'indice m – k m
n N–n
N – n
= k pk (1 – p)n–k m pm (1 – p)N–n–m
m=0
on reconnaît un binôme de Newton
n n
= k pk (1 – p)n–k (p + 1 – p)N–n = k pk (1 – p)n–k
Y suit une loi B(n, p).
b) On utilise la formule Bayes :
P(Y = k | X = m + k) P(X = m + k)
P(X = m + k | Y = k) =
P(Y = k)
m + k N – m – k N m+k
p (1 – p)N–m–k
k n – k m + k
=
N n k
p (1 – p)n–k
n k
(m + k)! (N – m – k)! N! n! (N – n)! k! (n – k)!
= pm (1 – p)N–m–n
k! m! (n – k)! (N – m – n)! (m + k)! (N – m – k)! N! n!
(N – n)!
= pm (1 – p)N–m–n
m! (N – m – n)!
N – n
= m pm (1 – p)N–m–n
c) X est le nombre d'objets marqués. Y est le nombre d'objets marqués parmi ceux choisis. Si on
choisit d'abord les objets, puis qu'on les marque ensuite, on voit qu'on obtient bien comme loi de Y
une loi B(n, p).
Sachant qu'il y a k objets marqués parmi les n choisis, la probabilité qu'il y en ait en tout m + k
marqués est la probabilité qu'il y ait m marqués parmi les N – n non choisis, d'où la loi B(N – n, p).