Cours Probabilité
Cours Probabilité
Processus Stochastiques
1
Type your text
Chapitre 1 : Chaınes de Markov
Type your text
1 Introduction 1
1.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Quelques exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1 Le jeu Serpent-Échelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.2 La marche aléatoire sur Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.3 Le système de Bonus-Malus en assurance automobile . . . . . . . . . . . . . . . . . 6
1 Introduction
Que signifie le terme processus ? Un processus stochastique est une famille (Xt )t2T de variables
aléatoires Xt . L’indice t peut représenter par exemple le temps ou une coordonnée le long d’un chemin.
L’ensemble des indices T du processus peut-être fini, infini-dénombrable (i.e., je peux compter chaque
élément) comme N ou Z ou non dénombrable comme R+ ou R. Lorsque T est fini ou dénombrable, le
processus est dit à temps discret, alors que si T est un intervalle de R le processus est dit à temps
continu.
Au croisement de la ième ligne et j ème colonne de la matrice P se trouve la probabilité Pi,j de passer de
l’état i à l’état j en un coup.
Une matrice qui vérifie les relations (1) est appelée matrice stochastique.
On peut aussi utiliser des graphes pour représenter les probabilités de transition.
En conclusion, une chaı̂ne de Markov est un processus dont le futur ne dépend de son passé qu’à travers
sa position à l’instant présent, on peut aussi l’énoncé ainsi “une chaı̂ne de Markov est un processus où la
loi conditionnelle de n’importe que Xn+1 sachant les états passés X0 , X1 , . . . , Xn 1 et le présent Xn est
indépendante du passé et ne dépend que de l’état présent”. Le processus est dit “sans-mémoire”.
Exemple Prévisions météorologiques (Ross, p.192)
On suppose que le climat du lendemain ne dépend que du climat d’aujourd’hui et pas des jours précédents.
On suppose que s’il pleut aujourd’hui il y a une probabilité p qu’il pleuve demain, par contre s’il ne pleut
pas aujourd’hui il y a une⇢probabilité q qu’il pleuve le lendemain.
0 il pleut ;
L’ensemble des états est
1 il ne pleut pas.
Vu les hypothèses le processus (Xn )n>0 , où Xn représente le temps le jour n, est une chaı̂ne de Markov
de matrice de transition
p 1 p
P = .
q 1 q
3
Proposition 5. Soit (Xn )n>0 une chaı̂ne de Markov sur un espace d’état S, de probabilités de transition
(Pi,j )i,j2S et de loi initiale pi = P(X0 = i). Alors pour tout n > 0 et i0 , i1 , . . . , in 2 S, on a
n
Y1
P(X0 = i0 , X1 = i1 , . . . , Xn = in ) = pi0 Pik ,ik+1 .
k=0
Démonstration.
P(X0 = i0 , X1 = i1 , . . . , Xn = in )
Bayes
= P(Xn = in |X0 = i0 , X1 = i1 , . . . , Xn 1 = in 1 )P(X0 = i 0 , X1 = i 1 , . . . , X n 1 = in 1)
Markov
= P(Xn = in |Xn 1 = in 1 )P(X0 = i 0 , X1 = i 1 , . . . , X n 1 = in 1)
= Pi n 1 ,in P(X0 = i0 , X1 = i1 , . . . , Xn 1 = in 1)
= Pi n 1 ,in Pi n 2 ,in 1 P(X0 = i0 , X1 = i1 , . . . , Xn 2 = in 2)
..
.
= Pi n 1 ,in Pin 2 ,in 1 . . . Pi1 ,i2 P(X0 = i0 , X1 = i1 )
= Pi n 1 ,in Pi n 2 ,in 1 . . . Pi0 ,i1 P(X0 = i0 ).
P(X0 = 1, X1 = 1, X2 = 1)
P(X1 = 1, X2 = 1|X0 = 1) = = 0.36.
P(X0 = 1)
4
On suppose que la partie est terminée à partir du moment où on est tombé sur la dernière case ou si
on l’a dépassée (contrairement au vrai jeu). Connaissant notre position actuelle, on peut déterminer la
probabilité de tomber sur les cases suivantes. On note Xn la position de notre pion après le nème lancer.
L’espace d’état est S = {1, 2, 3, 4, 5, 7, 8, 10, 11, 12, 13, 14, 15, 16}.
(Xn )n>0 est bien une chaı̂ne de Markov car la position Xn+1 à l’instant n ne dépend que de la position
du pion Xn à l’instant n et du résultat du n + 1ème lancer de dé (les lancers de dés étant indépendants
entre eux).
Calculons la matrice de transition :
0 1
0 1/6 1/6 1/6 1/6 0 1/6 0 0 0 0 1/6 0 0 0 0
B 0 0 1/6 1/6 1/6 0 1/6 1/6 0 0 0 1/6 0 0 0 0 C
B C
B 0 1/6 0 1/6 1/6 0 1/6 1/6 0 0 0 1/6 0 0 0 0 C
B C
B 0 1/6 0 0 1/6 0 1/6 1/6 0 1/6 0 1/6 0 0 0 0 C
B C
B 0 1/6 0 0 0 0 1/6 1/6 0 1/6 1/6 1/6 0 0 0 0 C
B C
B 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 C
B C
B 0 1/6 0 0 0 0 0 1/6 0 1/6 1/6 1/6 1/6 0 0 0 C
B C
B C
B 0 1/6 0 0 0 0 0 0 0 1/6 1/6 1/6 1/6 1/6 0 0 C
P =B C.
B 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 C
B C
B 0 0 0 0 0 0 0 0 0 0 1/6 1/6 1/6 1/6 1/6 1/6 C
B C
B 0 0 0 0 0 0 0 0 0 0 0 1/6 1/6 1/6 1/6 1/3 C
B C
B 0 0 0 0 0 0 0 0 0 0 0 0 1/6 1/6 1/6 1/2 C
B C
B 0 0 0 0 0 0 0 0 0 0 0 0 0 1/6 1/6 2/3 C
B C
B 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1/6 5/6 C
B C
@ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 A
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
(J’ai fait le choix de prendre une matrice 16 ⇥ 16, même si l’espace d’état est de taille 14, afin que la ligne
numéro i corresponde à la case numéro i du jeu. En fait, les colonnes 6 et 9 ne sont pas atteignables.)
5
1.2.2 La marche aléatoire sur Z
On considère une personne qui a un peu trop bu et qui souhaite rentrer chez elle à pied (elle a au moins la
présence d’esprit de ne pas prendre sa voiture !). On se place en dimension 1 pour simplifier le problème
(elle se déplace sur une ligne).
La personne a tellement bu qu’à l’instant n elle ne se souvient même plus où elle était auparavant. Sa
position à l’instant n + 1 ne dépend par conséquent que de sa position à l’instant n et de la décision
qu’elle va prendre : d’aller à droite ou à gauche. On peut par conséquent modéliser sa position à l’aide
d’une chaı̂ne de Markov. On suppose qu’elle décide d’aller à droite avec probabilité p et d’aller à gauche
avec probabilité 1 p.
La variable Xn représente donc la position de notre buveur à l’instant n. L’espace d’état est S = Z. Les
probabilités de transition sont :
Si p = 1/2 la marche aléatoire est dite symétrique et si p 6= 1/2 la marche est dite asymétrique (il
suffit que le contenu des poches de notre buveur soit plus lourd d’un coté que de l’autre pour l’influencer).
Le but de cette personne est de rentrer chez elle, on espère qu’elle y arrivera en temps fini.
Le calcul des primes dans les modèles européens ou asiatiques de l’assurance automobile est basé sur le
nombre d’accident de chaque conducteur. On va décrire un modèle (il en existe beaucoup, voir Ross p.194
pour un modèle très semblable).
Un nouveau conducteur doit payer une certaine prime d’assurance la première année. S’il n’a pas eu
d’accident pendant la première année, le conducteur bénéficie d’un bonus qui lui permet de payer une
prime d’assurance réduite pour la seconde année, si lors de la seconde année il n’a toujours pas d’accident,
sa prime est à nouveau baissée pour la troisième année et ainsi de suite jusqu’à un certain niveau. Par
contre, s’il a au moins un accident pendant une année, alors le conducteur obtient un malus qui augmente
sa prime d’assurance pour l’année suivante.
6
On définit di↵érents niveaux : le niveau le plus bas 0 correspond à la prime la plus basse et plus le niveau
augmente plus la prime augmente.
Si un client est au niveau i, le nombre d’accident qu’il aura pendant l’année suit une loi de Poisson de
paramètre i (rappel : la moyenne d’une loi de Poisson P( ) est ).
Un conducteur passe du niveau i au niveau i + j s’il a eu j accidents au cours de l’année. Par contre,
s’il n’a eu aucun accident au cours de l’année, le conducteur passe du niveau i au niveau i 1. Bien
évidemment, si le client était déjà au niveau 0 et qu’il n’a pas eu d’accident au cours de l’année, il reste
au niveau 0.
Pour i > 0, j > 0, la probabilité qu’un conducteur au niveau i ait j accidents est
j
i
P i (j) = e i
.
j!
On note Xn le niveau de la prime du conducteur l’année n. (Xn )n>0 est une chaı̂ne de Markov car Xn+1 ne
dépend que du niveau précédent Xn et du nombre d’accident que le conducteur aura au cours de l’année
(on suppose que les années sont indépendantes entre elles). Son espace d’état est
S = {0, 1, 2, . . .}.
De n’importe quel niveau on peut atteindre tous les niveaux strictement supérieurs, par contre si on est
un bon conducteur on ne peut atteindre que le niveau juste en dessous.
Le but de la compagnie d’assurance est d’évaluer la prime dans chaque niveau afin d’être solvable.
Les équations de Chapman-Kolmogorov vont nous fournir un moyen de passer de la loi à l’instant n à la
n la probabilité de l’état i à l’état j en n étapes :
loi du processus à l’instant n + m. Notons Pi,j
n
Pi,j = P(Xn+k = j|Xk = i) pour n > 0, i, j 2 S.
7
Proposition 6. On a pour tout n, m > 0 et pour tout i, j 2 S
X
n+m n m
Pi,j = Pi,k Pk,j .
k2S
Démonstration.
X
n+m
Pi,j = P(Xn+m = j|X0 = i) = P(Xn+m = j, Xn = k|X0 = i)
k2S
X
= P(Xn+m = j|Xn = k, X0 = i)P(Xn = k|X0 = i) (2)
k2S
Propriété de Markov X X
n m
= P(Xn+m = j|Xn = k)P(Xn = k|X0 = i) = Pi,k Pk,j .
k2S k2S
On reconnaı̂t la formule du produit matriciel. Par conséquent la matrice (Pijn )i,j2S est tout simplement le
produit n-fois de la matrice de transition P :
P n = P ⇥ P ⇥ . . . ⇥ P = (Pijn )i,j2S .
(n fois)
P n+m = P n P m .
2 0.61 0.39
P = .
0.52 0.48
8
Sachant qu’il pleut aujourd’hui, on a une probabilité de 61% qu’il pleuve dans 2 jours.
Maintenant, on souhaite connaı̂tre la probabilité qu’il pleuve dans 4 jours sachant qu’il pleut aujourd’hui,
4 .
soit P0,0
4 0.5749 0.4251
P = .
0.5668 0.4332
Sachant qu’il pleut aujourd’hui, on a une probabilité de 57, 49% qu’il pleuve dans 4 jours.
Maintenant, on suppose que le premier jour il pleut avec probabilité p0 = 0.1 et qu’il ne pleut pas avec
probabilité p1 = 0.9. On aimerait connaı̂tre la probabilité qu’il pleuve dans 4 jours.
X
4 4 4
P(X4 = 0) = P0,i P(X0 = i) = P0,0 P(X0 = 0) + P1,0 P(X0 = 1)
i2S
= 0.5749 ⇥ 0.1 + 0.5668 ⇥ 0.9 = 0.5676
9
3 Irréductibilité et classification des états
On souhaite étudier les chemins possible de la chaı̂ne de Markov. Est-ce que tous les chemins sont possible
entre les di↵érents états, ou est-ce que certains sont impossibles ? Est-ce que certains chemins peuvent
être emprunté un nombre infini de fois ou est-ce que certains états ne sont visités qu’un nombre fini de
fois ? Voilà les questions que l’on va se poser dans cette partie. Pour cela, on va classifier les états d’une
chaı̂ne de Markov en classes et ces classes seront entièrement déterminées par la matrice transition de la
chaı̂ne.
3.1 irréductibilité
On notera i ; j, si i mène à j (ou j est accessible à partir de i), c’est à dire qu’il existe un chemin de
probabilité strictement positive permettant de passer de i à j : il existe n > 0 tel que Pijn > 0.
On remarque que s’il n’existe pas n > 0 tel que Pi,j
n > 0, alors
1
!
[
P(atteindre j|partant de i) = P {Xn = j}|X0 = i
n=0
1
X 1
X
6 P(Xn = j|X0 = i) = n
Pi,j = 0.
n=0 n=0
Definition 8. Une chaı̂ne de Markov est dite irréductible si elle ne possède qu’une seule classe, c’est
à dire si tous les états communiquent entre eux.
Exemple 9. Considérons une chaı̂ne de Markov d’espace d’état S = {0, 1, 2} de matrice de transition
2 3
3/4 1/4 0
P = 4 1/2 0 1/2 5 .
1/3 1/3 1/3
10
Exemple 10. Considérons une chaı̂ne de Markov d’espace d’état S = {0, 1, 2, 3} de matrice de transition
2 3
0 1 0 0
6 3/4 1/4 0 0 7
P =6 4 1/8 0 7/8 0 5 .
7
0 0 1/9 8/9
On souhaite définir les communications entre les états. On a 0 $ 1, 0 6; 2 et 2 6; 3, les états 2 et 3 sont
inaccessibles des états 1 et 0, l’état 3 est inaccessible de 2. La chaı̂ne n’est pas irréductible, on a trois
classes :
{0, 1}, {2}, {3}.
Exemple Serpent-Échelle
Dans le cadre du jeu Serpent-Échelle, soit i 2 {1, . . . 15}, E[T16 |X0 = i] correspond à la durée moyenne
de la partie sachant que je pars de la case i.
Definition 12. Si fi = 1, alors l’état i est dit récurrent : partant de l’état i je suis certain de retourner
en i.
Si fi < 1, alors l’état i est dit transitoire (ou transient).
On dit que i est absorbant, si Pii = 1 (une fois arrivé en i on n’en bouge pas).
Si i est un état récurrent, partant de i je suis sûr de retourner en i et ainsi de suite. Par conséquent ma
chaı̂ne passera par l’état i infiniment souvent.
Par contre, si i est un état transitoire, on a une probabilité strictement positive de ne pas retourner en i
(égale à 1 fi ). Partant de i, le nombre de fois Ni que le processus passera en i suit une loi géométrique
de paramètre (1 fi ) : la probabilité de passer k fois en i est égale à fik 1 (1 fi ). Le nombre moyen de
passage en i est donc fini égal à 1/(1 fi ).
11
Démonstration. On a
1
X
Ni = 1Xn =i .
n=0
Exemple Serpent-Échelle
Dans le cas du jeu Serpent-Échelle, tous les états sont transitoires sauf la dernière case qui est absorbante.
En e↵et, pour i < 16, il existe un chemin de probabilité strictement positive qui part de la case i et arrive
à la case finale sans passer par l’échelle, donc qui ne permet pas de retourner en i. Par exemple, si i = 2
P(T2 = 1|X0 = 2) > P(avoir 6 au premier lancer, 6 au second lancer et 2 au dernier lancer) = 1/63 > 0.
12
P
- i est récurrent si et seulement si P1 n
n=1 Pi,i = 1,
- i est transitoire si et seulement si 1 n
n=1 Pi,i < 1.
n ! 0 quand n ! 1.
Par conséquent, si l’état i est transitoire, on a Pi,i
P
Démonstration. Posons In = 1{Xn=i } . Alors n>0 In représente le nombre de passage en i de la chaı̂ne
(Xn )n>0 . On a
1
X X1 1
X
n
E[ In |X0 = i] = P[Xn = i|X0 = i] = Pi,i .
n=0 n=0 n=1
D’où le résultat.
Un état transitoire n’est visité qu’un nombre fini de fois, par conséquent si l’espace d’état S est fini, les
états ne peuvent pas être tous transitoire (il suffit de prendre n assez grand). On a le résultat suivant
Theorem 15. On considère une chaı̂ne de Markov sur un espace d’état fini, alors il existe au moins un
état récurrent.
Si de plus la chaı̂ne est irréductible (une seule classe), alors tous les états sont récurrents.
est irréductible en dimension finie, donc tous les états sont récurrents.
Exemple 17. On considère une chaı̂ne de Markov à espace d’état S = {0, 1, 2, 3, 4} et de matrice de
transition 2 3
1/2 1/2 0 0 0
6 1/2 1/2 0 0 0 7
6 7
P =6 06 0 1/2 1/2 0 7 7.
4 0 0 1/2 1/2 0 5
1/4 1/4 0 0 1/2
On remarque que la chaı̂ne possède trois classes {0, 1}, {2, 3}, {4}. Les deux premières sont récurrentes
et la dernière est transitoire. En e↵et pour tout n > 0, Pi,i
n = 1/2 pour i 6= 4 et P n = (1/2)n , il suffit
4,4
ensuite d’utiliser la Proposition 13.
13
Démonstration. (Ross p.209)
Il suffit d’étudier un seul état vu que la chaı̂ne est irréductible. Considérons i = 0. Soit n > 0. Si n = 2k +1
est impair P00 n = 0 (il est impossible de revenir en 0 en un nombre impair de coups). Si n = 2k est pair,
2k (4p(1 p))k
P00 ⇠ p
⇡k
ce qui est le terme général d’une série convergente si p 6= 1/2 (car 4p(1 p) < 1) et divergente si p = 1/2
(car 4p(1 p) = 1).P n
En e↵et, la série n>1 anb converge si et seulement si a < 1 ou a = 1 et b > 1.
avec 0 < p, q, r < 1 et p + q + r = 1. On remarque que la chaı̂ne posséde deux points absorbants 2 et 0.
Partant de l’état 1, le processus peut y rester un certain temps, mais un jour il sautera soit à l’état 0 soit
à l’état 2 dont il ne pourra plus en sortir. Il sera absorbé.
On peut se demander si le processus a plus de chance d’être absorbé en 0 ou en 2 et combien de temps
en moyenne il faudra attendre avant que le processus soit absorbé ?
Pour cela on va utiliser une méthode qui s’appelle analyse des premiers (on regarde les premières transitions
de la chaı̂ne).
On définit T = min{n > 0 tel que Xn = 0 ou Xn = 2} le temps d’absorption du processus et on note
On suppose pour le moment que l’état initial du processus est X0 = 1. Alors à l’instant 1 on a
– soit X1 = 0 (avec proba p) et alors T = 1, XT = 0 ;
– soit X1 = 2 (avec proba r) et alors T = 1, XT = 2 ;
– soit X1 = 1 (avec proba q) et alors T > 1, et on débute alors une nouvelle transition partant à nouveau
de l’état 1.
Par conséquent, P(T = 1|X0 = 1) = p + r.
Par ailleurs, vu qu’on considère une chaı̂ne de Markov homogène, on remarque que
14
d’où u vérifie la relation
2
X
u = P(XT = 0|X0 = 1) = P(XT = 0, X1 = k|X0 = 1)
k=0
2
X
= P(XT = 0|X1 = k)P(X1 = k|X0 = 1) (Bayes + propriété de Markov)
k=0
= 1.p + u.q + 0.r
p p
On en déduit que u = 1 q = p+r . Par conséquent
r
P(XT = 2|X0 = 1) = 1 P(XT = 0|X0 = 1) = .
p+r
Cherchons maintenant le temps moyen d’absorption. Partant de l’état 1, il faut au moins une transition
pour être absorbé. Comme on l’a vu plus haut, soit on est absorbé dès le premier pas, soit on repart à
l’état initial et il faudra en moyenne v = E[T |X0 = 1] transitions supplémentaires pour être absorbé (ceci
est lié à l’absence de mémoire d’une chaı̂ne de Markov), d’où
v = E[T |X0 = 1]
= 1.P(T = 1|X0 = 1) + (1 + E[T |X0 = 1])P(X1 = 1|X0 = 1)
= (p + r) + (1 + v)q = 1 + vq
Remarque 18. Dans ce cas particulier, on pouvait calculer le temps moyen d’absorption d’une autre
manière. En e↵et, l’événement {T = n}, signifie je n’ai pas été absorbé pendant n 1 étapes et donc
je suis resté en 1 et j’ai ensuite fait la transition vers 0 ou 2. La probabilité de cet événement est :
P(T = n|X0 = 1) = q n 1 (1 q). T suit la loi géométrique (loi du premier succès) de paramètre 1 q = p+r,
son espérance est donc 1/(p + r).
L’intérêts de l’analyse des premiers pas est que l’on peut la généraliser à des exemples plus compliqués.
Exemple 19. On considère deux jeux. Le premier consiste à lancer une pièce équilibrée jusqu’à obtenir
2 faces de suite suivi d’un pile : F F P , le second consiste à obtenir face, pile, face : F P F . On aimerait
comparer les temps moyen d’une partie pour chacun des jeux.
Le premier jeu : on considère 4 états : S1 = {0, F, F F, F F P }.
On considère une chaı̂ne de Markov (Xn )n>0 définie sur S1 telle que l’on retourne au point de départ dès
qu’on sort des configurations {F, F F, F F P }. Dès qu’on a atteint la configuration F F P le jeu s’arrête, ce
point est absorbant. La matrice de transition de cette chaı̂ne est par conséquent
2 3
1/2 1/2 0 0
6 1/2 0 1/2 0 7
P1 = 64 0
7.
0 1/2 1/2 5
0 0 0 1
15
point est absorbant. La matrice de transition de cette chaı̂ne est par conséquent
2 3
1/2 1/2 0 0
6 0 1/2 1/2 0 7
P2 = 64 1/2 0
7.
0 1/2 5
0 0 0 1
Calculons les temps moyens d’une partie pour chacun des jeux.
Notons v0 le temps moyen pour le premier jeu partant de l’état 0, vF quand on part de l’état F et vF F
quand on part de l’état F F . Bien évidemment si on part de F F P le jeu est terminé, on a vF F P = 0. On
utilise l’analyse des premiers pas :
8
< v0 = 12 (1 + v0 ) + 12 (1 + vF ) = 1 + 12 v0 + 12 vF
v = 1 + 12 v0 + 12 vF F
: F
vF F = 1 + 12 vF F + 12 vF F P
D’où
v0 = 8 vF = 6 vF F = 2.
Pour le second jeu, notons w0 le temps moyen pour le premier jeu partant de l’état 0, wF quand on part
de l’état F et wF P quand on part de l’état F P . Bien évidemment si on part de F P F , on a wF P F = 0.
On utilise l’analyse des premiers pas :
8
< w0 = 1 + 12 w0 + 12 wF
w = 1 + 12 wF + 12 wF P
: F
wF P = 1 + 12 w0 + 12 wF P F
D’où
w0 = 10 wF = 8 wF P = 6.
Plus de lancers sont nécessaires en moyenne pour gagner dans le second jeu, alors que la probabilité d’avoir
FFP ou FPF en trois coups consécutifs est la même égale à 1/8.
16
4 Probabilité limite, loi invariante
On considère une chaı̂ne de Markov (Xn )n>0 à espace d’état S, de matrice de transition P . Connaissant
le loi initiale, la loi à chaque instant n est donnée par la formule (voir la Conséquence 7 page 8)
X
n
P(Xn = j) = Pi,j P(X0 = i).
i2S
On a l’impression que les puissances de la matrice de transition convergent vers une matrice dont toutes
les lignes sont identiques.
Remarque : ceci n’est pas vrai avec toutes les matrices de transition.
Dans cette section on va étudier la loi de Xn lorsque n grandit. Pour cela on aura besoin de notions
supplémentaires (encore !).
4.1 Périodicité
Definition 20. Considérons un état i 2 S et notons R(i) = {n > 0 : Piin > 0}. On définit la période d
d’un état i 2 S comme le plus grand commun diviseur de R(i) : d = pgcdR(i).
L’état i est dit apériodique si d = 1.
On remarque que la périodicité est une propriété de classe : tous les états d’une même classe ont la même
période.
Exemple Marche aléatoire
Dans le cas de la marche aléatoire la période est 2. Il faudra forcément un chemin de longueur un multiple
de 2 pour revenir au point initial (il faut aller autant de fois à gauche qu’à droite).
Par contre, si on considère un individu qui a vraiment trop bu et qui a des moments d’absence. Il a
alors une probabilité p d’aller à droite, q d’aller à gauche et r de rester sur place, avec 0 < p, q, r < 1 et
p + q + r = 1. La chaı̂ne est toujours irréductible, mais l’individu pouvant rester sur place, la période est
1.
Exemple Bonus-Malus
Partant du niveau 0 je peux rester à ce niveau, cet état est apériodique. La chaı̂ne modélisant le système
de Bonus-Malus étant irréductible (une seule classe). Tous les états sont donc apériodiques.
17
Propriété 22. – La récurrence positive (ou nulle) est une propriété de classe.
– Dans le cas d’un espace d’état S fini, tous les états récurrents sont forcément récurrents positifs.
– Un état i récurrent est récurrent nul si Piin ! 0 quand n ! 1, sinon il est récurrent positif.
Theorem 23. Une chaı̂ne de Markov irréductible à espace d’état fini est nécessairement récurrente
positive (i.e., tous les états sont récurrents positifs).
Démonstration. (Voir Promenade aléatoire de Michel Benaı̈m et Nicole El Karoui, Ed. École Polytech-
nique) Non fait en cours. P
Soit i 2 Z. On veut calculer E[Ti |X0 = i]. On note 'i (t) = E[etTi |X0 = i] = n>1 ent P(Ti = n|X0 = i) la
fonction génératrice des moments de Ti sachant que X0 = i. On sait retrouver l’espérance à l’aide 'i (t),
on va donc calculer cette fonction. On remarque que la marche aléatoire est invariante par translation,
donc 'i (t) ne dépend pas de i (quelque soit la valeur de i, le problème est le même et ne dépend pas de
la valeur de i). Notons alors cette fonction '(t).
Prenons i = 0. On sait que T0 > 2 car il est impossible de revenir au point de départ en une seule étape,
on va
– soit d’abord à droite (avec probabilité 1/2) et alors X1 = 1 et T0 = 1 + T1,0 où T1,0 est le temps pour
aller de 1 à 0,
– soit d’abord à gauche (avec probabilité 1/2) et alors X1 = 1 et T0 = 1 + T 1,0 où T 1,0 est le temps
pour aller de 1 à 0.
Par conséquent
18
(vérification : la variable T0 étant positive, '(t) est une fonction croissante.)
2t
Regardons la dérivée de ' en 0 : '0 (t) = pe , d’où pour tout i 2 Z, E[Ti |X0 = i] = '0 (0) = 1. Tous
1 e2t
les points sont bien récurrents nuls.
Remarque 25. – C’est l’irréductibilité de la chaı̂ne qui assure l’unicité de la loi invariante. Si on n’a pas
l’irréductibilité et que chaque classe est ergodique, il y a alors existence d’une infinité de lois invariantes.
– La convergence en loi est assurée par l’apériodicité de la chaı̂ne.
– Si la chaı̂ne est irréductible et ergodique, la suite (P n )n>0 converge quand n tend vers l’infini vers une
matrice dont toutes les lignes sont identiques, chaque ligne correspondant à la loi invariante ⇡. Ceci
permet en général de calculer ⇡ numériquement par ordinateur lorsque la dimension de la matrice n’est
pas trop grande, comme on l’a fait au début de cette section pour les prévisions météorologiques.
– La loi invariante ⇡ peut être considérée comme un vecteur ligne ⇡ = (⇡0 , ⇡1 , . . .) et donc ⇡ est solution
des équations X
⇡.P = ⇡ et ⇡i = 1.
i2S
Proposition 26. Sous les hypothèses du théorème, si la loi initiale de X0 est ⇡, alors pour tout n > 0,
Xn suit la loi ⇡.
D’où l’appellation de loi stationnaire.
Démonstration. En e↵et, pour n = 0 la loi de X0 est bien ⇡ et si on suppose que Xn suit la loi ⇡, on a
X X
P(Xn+1 = j) = Pi,j P(Xn = i) = Pi,j ⇡i = ⇡j .
i2S i2S
19
Proposition 27. Soit (Xn )n>0 une chaı̂ne de Markov à espace d’état S. On suppose la chaı̂ne irréductible,
récurrente (pas forcément positive) et apériodique, alors pour tout état i 2 S on a
1
lim Piin = ,
n!+1 µi
où µi est l’espérance E[Ti |X0 = i] du temps de retour en i partant de l’état i.
On retrouve le dernier résultat de la propriété 22.
Conséquence 28. Si la chaı̂ne est irréductible et ergodique et si on note ⇡ sa loi stationnaire, on a alors
pour tout i 2 S
1
⇡i = .
µi
Trouver ⇡ revient à résoudre un système linéaire, c’est donc un moyen assez simple de calculer le temps
moyen de retour dans un état partant de cet état.
20
3 2 3
D’où ⇡ = ( 10 , 5 , 10 ). À long terme la loi de Xn est proche de ⇡, donc le coût moyen à long terme est
3 2 3
C = 2. + 1. + 1. = 1, 3$.
10 5 10
Exemple Bonus-Malus
Revenons sur l’exemple des Bonus-Malus. Considérons un cas plus simple où l’espace d’état est fini
S = {0, 1, 2, 3, 4, 5, 6} (correspond au système brésilien, voir Bonus-Malus systems : The european and
asian approach to merit-rating de Jean Lemaire, dans North American Actuarial Journal (1998)). Le
principe est le même mais on ne peut pas dépasser le niveau 6. Par exemple, si on était dans la classe 2
et qu’on a eu plus de 4 accidents au cours de l’année, alors notre nouvelle prime sera celle du niveau 6.
On choisit le même paramètre pour chacun des niveaux : la probabilité d’avoir k accidents est donc
k
pk = e
k!
et la matrice de transition est
2 P 3
p0 p 1 p 2 p3 p4 p5 p
Pk>6 k
6 p0 0 p 1 p2 p3 p4 p 7
6 Pk>5 k 7
6 0 p0 0 p1 p2 p3 p 7
6 Pk>4 k 7
P =6
6 0 0 p0 0 p1 p2 p 7.
7
6 Pk>3 k 7
6 0 0 0 p0 0 p1 p 7
4 Pk>2 k 5
0 0 0 0 p0 0 p
Pk>1 k
0 0 0 0 0 p0 k>1 pk
P1
On remarque que, comme k=0 pk = 1, on a
X n
X1
pk = 1 pk .
k>n k=0
La chaı̂ne est irréductible, apériodique (l’état 0 est apériodique car P0,0 = p0 > 0), donc ergodique. Il
existe une unique probabilité stationnaire ⇡. Pour = 0.1, on obtient
6 8
p0 = 0.9048374, p1 = 0.0904837, p2 = 0.0045242, p3 = 0.0001508, p4 = 3.8.10 , p5 = 7.54.10
et donc
⇡ = (0.88948, 0.09355, 0.01444, 0.00215, 0.00032, 0.00005, 0.00001).
Par conséquent, en régime “stationnaire” (en “temps long”), 89% des assurés sont dans l’état 0 de plus
bas niveau et partant de l’état 0 il faut en moyenne attendre 1/0.88948 années pour revenir à l’état 0,
soit 1 an 1 mois et 15 jours.
21
La valeur de ⇡ permet à l’assureur d’ajuster la valeur de la prime dans chaque niveau afin d’être solvable
et compétitif. La valeur de (qui correspond au nombre moyen d’accident par assuré) est estimée à l’aide
de méthodes statistiques en fonction des données que l’assureur possède sur ses assurés.
Supposons que = 0.1, la compagnie d’assurance décide d’augmenter le montant de la prime de 20% à
chaque fois qu’on passe au niveau supérieur, c’est à dire
– le montant de la prime dans l’état 0 est a0 = a,
– le montant de la prime dans l’état 1 est a1 = a0 + a0 ⇤ 20% = 1.2a,
– le montant de la prime dans l’état 2 est a2 = a1 + a1 ⇤ 20% = (1.2)2 a,
.. ..
. .
– le montant de la prime dans l’état 6 est a6 = a5 + a5 ⇤ 20% = (1.2)6 a.
La prime moyenne payée par assuré est donc de
prime moyenne = a0 ⇡0 + a1 ⇡1 + . . . + a6 ⇡6
= a(⇡0 + 1.2⇡1 + . . . + (1.2)6 ⇡6 )
= a ⇥ 1.02704
Afin d’être solvable et compétitive, la compagnie d’assurance souhaite que la prime moyenne payée par
assuré soit de 100$, il faut donc que a ⇥ 1.02704 = 100, soit a = 97.36$. On obtient ainsi le montant de
la prime dans chaque niveau
Niveau 0 1 2 3 4 5 6
Montant de la prime 97.36$ 116.83$ 140.2$ 168.25$ 201.9$ 242.27$ 290.73$
Ce théorème est très utilisé en simulation pour simuler E[f (X1 )] qui n’est pas toujours facile à calcu-
ler. Pour cela, on simule n variables indépendantes de même loi et d’après la loi des grands nombres
1 Pn
n k=1 f (Xk ) est proche de la valeur cherchée. Lorsqu’on travaille avec des variables qui ne sont pas
indépendantes la loi des grands nombres ne s’applique plus.
22
Theorem 30. Soit (Xn )n>0 une chaı̂ne de Markov à espace d’état S. On suppose la chaı̂ne irréductible
récurrente positive et on note ⇡ sa loi invariante. Alors pour toute fonction f bornée, alors quelque soit
la loi initiale, avec probabilité 1,
n 1
1X X
f (Xk ) ! f (i)⇡i .
n n!+1
k=0 i2S
Un second théorème ergodique peut s’apparenter au théorème central limite. On peut écrire le théorème
central limite de la manière suivante : si (Xn )n>0 est une suite de variables indépendantes, de même loi
et d’espérance m et de variance 2 finie, alors
n
!
p 1X Loi
n Xk m ! N (0, 2 ).
n n!+1
k=1
Theorem 31. Soit (Xn )n>0 une chaı̂ne de Markov irréductible à espace d’état S fini. On considère une
fonction f et on note X
m= f (i)⇡i .
i2S
Alors, sous certaines hypohèses, il existe dépendant de f tel que
n 1
!
p 1X Loi 2
n f (Xk ) m ! N (0, ).
n n!+1
k=0
Notons Xn la richesse du joueur à l’instant n. (Xn )n>0 est une chaı̂ne de Markov à valeur dans {0, 1, . . . , N }.
À chaque instant le joueur gagne ou perd juste 1$, par conséquent les probabilités de transitions sont
pour i 2 {1, 2, . . . , N 1}
P0,0 = PN,N = 1
Pi,i+1 = 1 Pi,i 1 =p
23
et les autres probabilités de transitions sont nulles.
Cette chaı̂ne a deux états absorbants et on peut décomposer l’espace d’état en trois classes : deux
récurrente {0}, {N } et une transitoire {1, 2, . . . , N 1}.
Vu que les états transitoires ne sont visités qu’un nombre fini de fois, on est sur que le temps de jeux est
fini (on arrivera forcément dans un des états absorbants). On note T la durée du jeu :
T = min{n > 0 : Xn = 0 ou Xn = N }.
À l’instant T le joueur est soit ruiné soit riche, d’où XT = 0 ou N . On note Pi = P(XT = N |X0 = i) la
probabilité de sortir du jeu riche sachant que le capital initial du joueur était i.
Alors en utilisant l’analyse des premiers pas,
La probabilité P(XT = N |X1 = i + 1) représente la probabilité d’être riche sachant qu’on avait un capital
de i + 1, par conséquent Pi+1 . Le suite (Pi ), vérifie donc
Pi = pPi+1 + qPi 1.
⇣ ⌘i
q
Comme p + q = 1, si on note ui = Pi+1 Pi , on a pui = qui 1 . D’où ui = p u0 .
Comme P0 = 0, on a donc
q
P2 P1 = P1
p
✓ ◆2 Type your text
q q
P3 P2 = (P2 P1 ) = P1
p p
.. ..
. .
✓ ◆i 1
q
Pi Pi 1 = P1
p
.. ..
. .
✓ ◆N 1
q
PN PN 1 = P1
p
En sommant les i premières équations, on obtient
i 1 ✓ ◆k
X q
Pi P1 = P1 .
p
k=1
⇣ ⌘i
q
1 p
q q
On distingue deux cas, si p = 1, alors Pi = iP1 et si p 6= 1, Pi = q P1 .
1 p
n
X an+1
1
(En e↵et, de manière générale, si a 6= 1 on a ak = .)
1 a
k=0
q
1 pq
Vu que PN = 1, on en déduit que P1 = 1/N si p = 1 et P1 = ⇣ ⌘N sinon.
q
1 p
24
q
Par ailleurs p = 1 si et seulement si p = q = 1/2. Par conséquent, on a
8 ⇣ ⌘i
>
> 1 q
>
> p
< Pi = ⇣ ⌘N si p 6= 1/2;
q
> 1 p
>
>
>
: i
Pi = si p = 1/2.
N
On a q/p < 1 si et seulement si p > 1/2. Si on considère que la richesse de la banque augmente N ! +1,
on a 8 ⇣ ⌘i
< 1 q
si p > 1/2;
p
Pi !
:
0 si p 6 1/2.
Quand N ! +1 le joueur est par conséquent sur d’être ruiné si le jeu lui est défavorable (p < 1/2), ce
qui n’est pas étonnant, mais c’est aussi le cas même si le jeu est équitable. Par contre, si le jeu lui est
favorable p > 1/2, le joueur a une probabilité strictement positive (mais strictement inférieur à 1) que sa
richesse croisse indéfiniment.
Proposition 32. Ruine du joueur
On considère une marche aléatoire entre deux barrières absorbantes 0 et N , d’espace d’état S = {0, 1, . . . , N }.
On suppose que les probabilités de transitions sont données par
Pi,i+1 = p = 1 Pi,i 1 pour i = 1, . . . N 1 et P0,0 = PN,N = 1.
Alors la probabilité d’absorption en N en partant de l’état i est
8 ⇣ ⌘i
>
> 1 q
>
< p
Pi = ⇣ ⌘N si p 6= 1/2,
q
>
> 1 p
>
: i
N si p = 1/2.
Exemple 33. On considère Max et Patty qui jouent à pile ou face. Patty a 5$ en poche et Max a 10$ en
poche. Chacun parie 1$ à chaque fois. Les deux amis jouent jusqu’à la ruine d’un des joueurs. On cherche
la probabilité de gagner pour Patty.
Il suffit d’imaginer un boulier avec 5 boules du coté gauche et 10 boules du coté droit. A chaque fois que
Patty gagne on déplace une boule de droite à gauche et à chaque fois que Max gagne on déplace une boule
de gauche à droite. Le jeu se termine quand il n’y a plus de boule d’un coté.
25
On note Xn le nombre de boules du coté de Patty (la fortune de Patty). Il y a par conséquent 15 Xn
boules du coté de Max. Xn est à valeur dans {0, 1, . . . , 15}. On a Xn+1 = Xn + 1 si Patty a gagné au jeu
de pile ou face et sinon on a Xn+1 = Xn 1. On a bien une chaı̂ne de Markov.
D’après les résultats sur la ruine du joueur, la pièce étant supposée équilibrée (p = q = 1/2), la probabilité
que Patty gagne est P5 = P(XT = 15|X0 = 5) :
5 1
P5 = = .
15 3
Par conséquent, Max gagne avec une probabilité 2/3.
Exercice 34. Supposons qu’à chaque partie d’un jeu, Alexandre gagne 1$ avec probabilité p, ou perd
1$ avec probabilité q = 1 p. Alexandre continue de jouer jusqu’à temps qu’il gagne N $ ou perde M $.
Quelle est la probabilité qu’Alexandre quitte le jeu en tant que gagnant ?
Exercice 35. Pour le problème de la ruine du joueur, notons Mi le nombre moyen de parties avant que le
joueur soit ruiné ou gagne une fortune de N , sachant qu’il part d’un capital i (i 2 {0, 1, ..., N }). Donnez
un ensemble d’équations linéaires afin de trouver Mi (i 2 {0, 1, ..., N }).
Mi = 1 + pMi+1 + qMi 1.
26
Université du Québec à Montréal MAT 3071 - Hiver 2012
Département de Mathématiques Groupe : 011
1
1 Introduction
On considère une compagnie d’assurance. Elle souhaite évaluer le montant des primes que doivent verser
ses assurés afin qu’elle soit solvable, tout en restant concurrentielle par rapport aux autres compagnies
d’assurance. Chaque client verse une certaine prime chaque année. En retour, si le client a un accident la
compagnie doit lui verser des indemnités. Pour évaluer le montant de la prime la compagnie d’assurance
devra par conséquent évaluer le nombre d’indemnités qu’elle devra verser chaque année et leur montant.
On va se placer sous les hypothèses suivantes : les clients se comportent tous de la même manière et de
façon indépendante.
Pour répondre au problème de la compagnie d’assurance, il va falloir modéliser les sinistres (les instants où
il y a des sinistres et leur montant) et ensuite évaluer la probabilité de ruine de la compagnie d’assurance
en fonction de la prime fixée.
min(X, Y ) ⇠ E( + µ).
De plus
P(min(X, Y ) = X) = P(X 6 Y ) = .
+µ
Preuve. On pose Z = min(X, Y ). Z est une variable positive. Calculons sa fonction de survie : pour t > 0
on a
Indépendance
P(Z > t) = P(X > t, Y > t) = P(X > t)P(Y > t) = e ( +µ)t .
Par ailleurs, comme les variables X et Y sont indépendantes, la loi du couple (X, Y ) est continue de
densité fX,Y (x, y) = e x µe µy 1x>0 1y>0 , d’où
Z +1 ✓Z +1 ◆ Z +1
P(Z = X) = P(X 6 Y ) = e x
µe µy
dy dx = e ( +µ)x dx = .
0 x 0 +µ
⇤
Exercice 2. Une usine fabrique des lampes dont la durée de vie T en heures vérifie : P (T > t) = e t
pour t > 0, avec > 0. T suit donc la loi exponentielle de paramètre . La durée de vie moyenne d’une
lampe est 1/ .
On considère un échantillon de n lampes dont les durées de vie T1 , . . . , Tn sont supposées indépendantes,
de même loi que T . On note U = min(T1 , . . . , Tn ) le premier instant où au moins une des lampes cesse de
fonctionner et V = max(T1 , . . . , Tn ) le premier instant où toutes les lampes ont cessées de fonctionner.
Quelles sont les lois de U et de V ?
Corrigé : On va calculer les fonctions de répartition de U et V pour trouver leur loi. Les deux variables
sont à valeurs positives. On a pour t > 0
n t
FU (t) = 1 P(U > t) = 1 P(T1 > t, . . . , Tn > t) = 1 e par indépendance.
Proposition 7. La somme de n variables indépendantes de loi Poisson suit encore une loi de Poisson :
soient X1 , . . . , Xn des variables indépendantes de loi respective P( i ), alors
n
X n
X
Xi ⇠ P( i)
i=1 i=1
Pn
Preuve. On calcule la fonction génératrice de Z = i=1 Xi et on utilise le fait que la fonction génératrice
caractérise la loi : par indépendance des Xi on a
t t t t
Pn
1 (e 1) 2 (e 1) n (e 1)
'Z (t) = 'X1 (t) ⇥ 'X2 (t) ⇥ . . . ⇥ 'Xn (t) = e .e ...e = e(e 1) i=1 i
.
⇤
Exercice 3. On considère une compagnie d’assurance habitation. On note X les sinistres causés par une
personne de manière volontaire (vols, feux volontaires, ...) et Y les sinistres accidentels. On suppose que
X et Y sont indépendantes et suivent des loi de Poisson de paramètre respectif et µ. Montrer que la loi
conditionnelle de X sachant le nombre total de sinistres au cours ⇣ de l’année
⌘ est une loi binomiale : la loi
conditionnelle de X sachant X + Y = n est la loi binomiale B n, +µ .
Corrigé : On sait que X + Y suit la loi de Poisson de paramètre + µ. Par ailleurs, si {X + Y = n} alors
forcément X 6 n. On a donc pour k > n P(X = k|X + Y = n) = 0 et pour k 6 n
P(X = k, X + Y = n) P(X = k, Y = n k)
P(X = k|X + Y = n) = =
P(X + Y = n) P(X + Y = n)
P(X = k)P(Y = n k)
= par indépendance de X et Y
P(X + Y = n)
n! ke µn k e µ
= .
k!(n k)! ( + µ)n e ( +µ)
✓ ◆✓ ◆k ✓ ◆n k ✓ ◆✓ ◆k ✓ ◆n k
n µ n
= = 1 .
k +µ +µ k +µ +µ
4
Exemple 4. Un relecteur travaille sur deux livres. Le nombre de coquilles dans le premier livre suit une
loi de Poisson de moyenne 2 et le nombre de coquilles dans le second livre suit une loi de Poisson de
paramètre 5. Le relecteur choisit aléatoirement de façon équitable le livre sur lequel il va travailler. On
note X le nombre de coquilles que le relecteur va relever. On note Y le choix du livre : Y = 1 s’il relit le
livre 1 et Y = 2 s’il relit le livre 2.
Alors le nombre moyen de coquilles vaut
E[X] = E[X|Y = 1]P(Y = 1) + E[X|Y = 2]P(Y = 2) = 2 ⇥ 1/2 + 5 ⇥ 1/2 = 7/2.
Exemple Somme d’un nombre aléatoire de variables aléatoires
On pose N le nombre d’accidents de voitures pendant une année. Pour le ième accident, on note Zi le
montant des indemnités que la compagnie d’assurance verse au conducteur. On suppose que les Zi sont
indépendants et de même loi et indépendants de N .
Le montant total que la compagnie devra débourser au cours d’une année est
N
X
X= Zi .
i=1
On souhaite calculer sa valeur moyenne. Comme X s’écrit à l’aide de N , il est naturel de conditionner
par rapport à cette valeur. On a " N #
X
E[X] = E E[ Zi |N ]
i=1
Par ailleurs, on a
N
X n
X n
X
E[ Zi |N = n] = E[ Zi |N = n] = E[Zi |N = n]
i=1 i=1 i=1
n
X
= E[Zi ] par indépendance entre les Zi et N
i=1
= nE[Z] car les Zi sont de même loi.
Ceci est utile pour calculer la variance ou la fonction génératrice d’une variable aléatoire. Notamment
pour la variance V ar(X) = E[X 2 ] E[X]2 , on obtient la formule suivante
Proposition 8. (Formule de décomposition de la variance)
Preuve. On a
⇥ ⇤
E[V ar(X|Y )] = E E[X 2 |Y ] E[X|Y ]2
⇥ ⇤ ⇥ ⇤ ⇥ ⇤
= E E[X 2 |Y ] E E[X|Y ]2 = E[X 2 ] E E[X|Y ]2
et ⇥ ⇤ ⇥ ⇤
V ar(E[X|Y ]) = E E[X|Y ]2 E [E[X|Y ]]2 = E E[X|Y ]2 E[X]2 .
En sommant les deux expressions, on obtient le résultat. ⇤
Exemple Somme d’un nombre aléatoire de variables aléatoires (appelé modèle agrégé)
On reprend l’exemple précédent et on veut calculer la variance des remboursements au cours d’une année.
On va utiliser la formule de décomposition de la variance.
On a E[X|N ] = N E[Z], par conséquent
Notamment, si on suppose que le nombre de sinistres suit une loi de Poisson P( ), on a E[N ] = V ar(N ) =
et donc
V ar(X) = (E[Z]2 + V ar(Z)) = E[Z 2 ].
On suppose qu’à l’instant initial, t = 0 on a un seul ancêtre. On suppose que les générations ne se che-
vauchent pas et que chaque individu à la génération n donne naissance à des enfants de façon indépendante
et selon la même
P loi p = (p0 , p1 , . . .) pour tout le monde, loi que l’on connaı̂t, avec pi < 1 pour tout i > 0.
On note µ = i>0 ipi le nombre moyen d’enfant par individu et 2 la variance de la loi p.
Le nombre d’individu Xn+1 à la génération n + 1 est égal à la somme des enfants de chacun des individus
de la génération n, soit
XXn
Xn+1 = Zk ,
k=1
où Zk est le nombre d’enfant du ième individu de la génération n. Les variables Zk sont indépendantes de
Xn .
Ce type de processus est aussi appelé processus de branchement ou de ramification.
La suite (Xn )n>0 est une chaı̂ne de Markov à espace d’état S = N et l’état 0 est absorbant.
On a donc (
2 µ n 1 1 µn si µ 6= 1
V ar(Xn ) = 1 µ
n 2 si µ = 1
Dans les graphes ci-dessous on a tracé plusieurs trajectoires de Xn en fonction de n pour di↵érentes valeur
de µ (µ étant le nombre moyen d’enfant par individu) :
P(N (24) > 2|N (12) = 1) = P(N (24) N (12) > 1|N (12) = 1)
= P(N (24) N (12) > 1) car les accroissements sont indépendants
= P(N (12) > 1) car les accroissements sont stationnaires
= 1 P(N (12) = 0) ' 11, 3%.
Remarque 11. Soit (N (t))t>0 un processus de Poisson d’intensite . Le nombre de saut sur un petit
intervalle de temps ne dépasse généralement pas 1. Plus précisément, soit h > 0, pour h suffisamment
petit on a h < 1 et donc
( h)2
P(N (h) = 0) = e h
P(N (h) = 1) = he h
P(N (h) > 2) 6
2
et quand h temps vers 0, on a
P(N (h) = 1) P(N (h) > 2)
! et ! 0.
h h
Cherchons la loi de Tn et de Sn .
Theorem 1. La suite des instants inter-arrivées (Tn )n>1 est une suite de variables indépendantes iden-
tiquement distribuées de loi exponentielle E( ).
Par conséquent, la durée moyenne d’un intervalle de temps entre deux sauts est 1/ .
Preuve. Étudions le premier instant de saut T1 . Si à l’instant t on a N (t) = 0 ceci signifie que l’on n’a
pas encore sauté et donc T1 > t. Par conséquent
t
P(T1 > t) = P(N (t) = 0) = e .
Le nombre de saut sur l’intervalle ]s, s + t] suit une loi de Poisson P( t) et est indépendant de ce qui s’est
passé avant, par conséquent
t
P(T2 > t|T1 = s) = P(pas de saut sur l’intervalle ]s, s + t]) = e .
Si maintenant on regarde la probabilité que le temps d’attente entre le 10ème immigrant et le 11ème
immigrant soit supérieur à 2 jours :
2 2
P(T11 > 2) = e =e ' 0.133.
1
P(T11 < T12 ) = ,
1+ 2
où T11 est le premier instant de saut de N 1 et T12 le premier instant de saut de N 2 .
La probabilité que les deux processus sautent en même temps est nulle car leurs temps de saut sont
indépendants et suivent des lois gammas (loi continue !).
N 1 est un processus de Poisson, par conséquent N 1 (t + s) N 1 (s) suit la loi P( 1 t) et est indépendant
de N 1 (s). De même N 2 (t + s) N 2 (s) suit la loi P( 2 t) et est indépendant de N 2 (s). Les processus N 1
et N 2 étant indépendants, obtient que (voir la proposition 7) N (t + s) N (s) suit une loi de Poisson
P( 1 t + 2 t) et est indépendant de N (s) = N 1 (s) + N 2 (s).
Par ailleurs, le premier instant de saut de N a lieu dès que le premier processus entre N 1 et N 2 saute, par
conséquent N saute pour la première fois en T1 = min(T11 , T12 ). Les instants T11 et T12 étant indépendants,
on utilise alors les résultats sur le minimum de variables exponentielles indépendantes (voir la proposition
3 de ce chapitre) pour conclure. ⇤
Exemple 9. Considérons une compagnie d’assurance. Les sinistres pour un assuré arrivent selon un
processus de Poisson de paramètre . La compagnie a n clients. On suppose que les assurés ont des
comportements indépendants. Alors le nombre de sinistres que doit gérer la compagnie d’assurance est
un processus de Poisson d’intensité n .
Supposons par exemple que le nombre moyen de sinistre par individu sur une année est de 0.01. On peut
modéliser les instants d’arrivée des sinistres par un processus de Poisson d’intensité = 0.01/365 par
jour. On considère que la compagnie d’assurance a 5000 clients. Alors le premier sinistre de l’année pour la
compagnie arrive à l’instant T1 qui suit une loi exponentielle de paramètre 5000 = 50/365. En moyenne
le premier sinistre que devra prendre en charge la compagnie arrive au bout de 365/50 ' 7, 3 jours.
Exemple 10. On considère une compagnie d’assurance qui a une branche assurance automobile et une
branche assurance habitation. On peut modéliser les instants d’arrivée des sinistres à l’aide de processus de
Poisson indépendants pour chacune des branches, d’intensité a pour la branche automobile et d’intensité
h pour la branche habitation. Au final, pour la compagnie les instants d’arrivée d’un sinistre (quel qu’il
soit) sont les temps d’arrivée d’un processus de Poisson d’intensité a + h .
P(N 1 (t) = n, N 2 (t) = k) = P(N (t) = n + k dont n sauts sont de type I et k de type II)
✓ ◆ n+k
n+k
= pn (1 p)k e
n (n + k)!
(p )n p ((1 p) )k (1 p)
= e ⇥ e .
(n)! k!
Par conséquent N 1 (t) et N 2 (t) sont indépendants et suivent respectivement les lois de Poisson P(p ) et
P((1 p) ).
Étudions les accroissements de N 1 (le raisonnement est identique pour N 2 ). Soient t, s > 0, N 1 (t +
s) N 1 (s) correspond au nombre de sauts du type I du processus N . Comme N a des accroissements
indépendants, les sauts de type I de N sur (s, t + s] sont indépendants de tous les sauts intervenus
avant l’instant s, et donc indépendant de ceux de type I avant l’instant s. Donc N 1 a des accroissements
indépendants. On montre que les accroissements sont stationnaires de la même façon que précédemment
en calculant P(N 1 (t + s) N 1 (s) = n, N 2 (t + s) N 2 (s) = k) pour tout s, t > 0 et k, n 2 N. ⇤
Exemple 11. On considère une compagnie d’assurance qui s’occupe d’assurance habitation et assurance
automobile. On suppose que sa proportion de contrat automobile est égal à 3/4. On suppose que les
sinistres arrivent selon un processus de Poisson d’intensité 10 par mois. Le probabilité de ne pas avoir de
sinistre habitation pendant 3 mois peut être calculé de la manière suivante.
Le nombre de sinistre habitation est un processus de Poisson de paramètre 1/4 ⇥ 10 = 2.5 par mois. Par
conséquent la probabilité de ne pas avoir de sinistre habitation pendant trois mois est égale à
On veut trouver la meilleure valeur de y afin d’optimiser ce gain. Calculons donc la dérivée du gain :
1 500c
G0 (y) = .
2 (500 y)2
Par conséquent, si = 0.05 par minute (soit 3 o↵res par heure) et c = 0.1 $ par minute, on trouve
y ' 455 $.
Si jamais le coût du site internet est trop élevé et que les o↵res n’arrivent pas assez rapidement (par
exemple c = 3 $ et = 0.01) , il n’y a pas de solution optimale comprise entre 0 et 500. Il est alors
optimal d’accepter la première o↵re venue.
Definition 6. Considérons Y1 , . . . , Yn des variables aléatoires. On définit la statistique d’ordre Y(1) , . . . , Y(n)
comme étant les variables réordonnées par ordre croissant : Y(k) est le k ème plus petite valeur parmi
Y1 , . . . , Y n .
On a Y(1) 6 Y(2) 6 . . . 6 Y(n) .
Theorem 2. Sachant que N (t) = k, les instants de saut S1 , S2 , . . . , Sk ont la même loi que la statistique
d’ordre d’un k-échantillon de loi uniforme sur [0, t] : (U(1) , . . . , U(k) ).
pdf("[Link]")
# Longueur de l’intervalle de temps
T=30
# Intensite du parametre de Poisson
lambda=0.3
4
3
2
1
0
0 5 10 15 20 25 30
Temps
où (N (t))t>0 de paramètre et (Yi )i>1 est une suite de variables indépendantes, de même loi que Y et
indépendantes de (N (t))t>0 .
Exemple 15. On suppose que des familles immigrent au Québec selon un processus de Poisson de taux
2 par semaine. Si le nombre de personne dans chaque famille est indépendant et suit la loi
Par conséquent, le nombre moyen de personnes immigrant au Québec sur une période de 50 semaines est
où E[Y ] = 1.1/6 + 2.1/3 + 3.1/3 + 4.1/6 = 5/2 et la variance du nombre moyen de personnes immigrant
au Québec sur une période de 5 semaines est
La compagnie est ruinée dès que sa réserve Rt descend sous 0. La probabilité de ruine de la compagnie
est par conséquent
pc = P(min Rt < 0|R0 = c)
t>0
Si p < µ, on remarque que E[Rt ] ! 1. Par contre, si p = µ la réserve moyenne reste constante, mais
la variance E[V ar(Rt )] ! +1. On peut en fait montrer que dans ces deux cas que la compagnie a une
probabilité 1 d’être ruinée.
Si p > µ, on a E[Rt ] ! +1 et E[V ar(Rt )] ! +1, on ne peut rien en conclure.
Voici quelques simulations de la probabilité de ruine. On a pris un capital initial égale à c = 10, une
prime p = 1 par unité de temps et on a tracé en fonction du temps la probabilité de ruine avant l’instant
t (calculée par simulations) dans les trois di↵érents cas :
Dans le dernier cas (p > µ), on peut calculer explicitement par des techniques utilisant la propriété de
Markov la probabilité de ruine de la compagnie d’assurance qui est dans ce cas strictement inférieur à 1
et égale à
µ p pµ µ c
pc = e .
p