Tarification Avancée en Assurance Non Vie
Tarification Avancée en Assurance Non Vie
Xavier Milhaud
[Link]@[Link]
[Link]
1 / 157
Plan du cours
2 / 157
1 Introduction et rappels des concepts essentiels
3 / 157
Contrat d’assurance - Tarification
4 / 157
Ainsi le risque économique initialement supporté par l’assuré est
transféré vers l’assureur.
En effet,
5 / 157
Ces propriétés doivent permettre à l’assureur de prédire avec une
précision relative les pertes encourues pour une période donnée.
p .s .
S̄I −→ E[Si ] = µ.
n→∞
Ou encore : P lim S̄I = µ = 1.
I→∞
6 / 157
Prime technique - prime commerciale
7 / 157
→ la prime d’inventaire composée de la prime technique + frais :
d’acquisition,
d’administration et gestion du contrat,
→ la prime commerciale (prime finale) intègre à la prime
d’inventaire la rémunération d’intermédiaires (courtiers, ...).
La stratégie de la compagnie peut également jouer sur la hauteur
de ces chargements.
Objectif de l’assureur :
principe de l’espérance
principe de la variance
principe de l’écart-type
mesure de distortion : mesure de Wang, ...
...
9 / 157
Quelques principes de base en tarification
10 / 157
Le principe de la tarification est d’approcher X par un proxy
(variables tarifaires).
Ce proxy correspond aux info. indiv. → variables explicatives :
EP [S | X1 , . . . , XJ ] = EP [N | X1 , . . . , XJ ] . EP [Y | X1 , . . . , XJ ].
11 / 157
En économétrie, on cherche à estimer EP [Z | X1 , . . . , XJ ] par une
fonction des facteurs explicatifs notée Φ(X1 , . . . , XJ ).
Z | X1 , . . . , XJ ∼ N(β0 + β1 X1 + . . . + βJ XJ , σ2 ).
Z |X ∼ N(XT β, σ2 ).
12 / 157
Arthur CHARPENTIER - Big Data (a Personal Perspective)
Insured Insurer
Loss E[S] S ≠ E[S]
Average Loss E[S] 0
Variance 0 Var[S]
13 / 157
Arthur CHARPENTIER - Big Data (a Personal Perspective)
Insured Insurer
Loss E[S| ] S ≠ E[S| ]
Average Loss E[S] 0
Ë È Ë È
Variance Var E[S| ] Var S ≠ E[S| ]
Ë È Ë È
Var[S] = E Var[S| ] + Var E[S| ] .
¸ ˚˙ ˝ ¸ ˚˙ ˝
æinsurer æinsured
14 / 157
Arthur CHARPENTIER - Big Data (a Personal Perspective)
Segmentation avec information incomplète
(source : A. Charpentier)
Insurance : Personalization and Customization
Imperfect classification, personalized premium
Insured Insurer
Loss E[S|X] S ≠ E[S|X]
Average Loss E[S] 0
Ë È Ë È
Variance Var E[S|X] E Var[S|X]
Ë È Ë È
Var[S] = E Var[S|X] + Var E[S|X]
Ë È Ë Ë - ÈÈ Ë È
-
= E Var[S| ] + E Var E[S| ]-X + Var E[S|X] .
¸ ˚˙ ˝ ¸ ˚˙ ˝ ¸ ˚˙ ˝
pooling solidarity æinsured
¸ ˚˙ ˝
æinsurer
15 / 157
Dangers d’une mauvaise tarification
16 / 157
Des difficultés liées à la réglementation
17 / 157
Etapes statistiques dans la tarification
E[N | X] = f1 (Xβ)
18 / 157
La potentielle propagation des erreurs
19 / 157
Gestion / utilisation des données
20 / 157
Gestion de l’hétérogénéité inobservable : mélanges finis
21 / 157
Principe de l’algorithme EM
23 / 157
2 Applications classiques des GLM en assurance
Assurance non Vie
Assurance Vie
24 / 157
Quelques applications en assurance IARD
L’usage des GLM est ancré depuis longtemps dans les moeurs.
On peut citer parmi les domaines concernés :
assurance santé : remboursements soins, frais
d’hospitalisation ;
assurance auto / moto : dommages matériels, vol, ... ;
assurance Multi-Risques Habitation (MRH) : incendie, vol,
dégâts des eaux, ...
assurance Responsabilité Civile (RC) : dommages à autrui.
25 / 157
Les applications en VIE
26 / 157
Exemple en risque décès (DC) : Lee Carter
[Lee and Carter, 1992]
27 / 157
Exemple 2 : modèle de Brass
[Brass, 1964], [Brass and Macrae, 1984]
qexp (x , t ) qref (x , t )
! !
ln = a + b × ln
1 − qexp (x , t ) 1 − qref (x , t )
où
x est l’âge de la personne, t est le facteur temporel,
qref est une table de mortalité de référence,
qexp est la table de mortalité d’expérience.
28 / 157
3 Usage pratique des GLM : les écueils récurrents
Les GLM : brefs rappels
Quelques notions opérationnelles importantes sur les GLM
Surdispersion et masse en 0
Segmentation et modélisation : limites à garder en tête
Tenir compte de l’exposition : l’offset
Réponse catégorielle : sur-représentation d’une modalité
29 / 157
Intérêt des GLM
30 / 157
Attention à la notion de corrélation entre variables
E [(X − µX )(X 2 − µX 2 )] µX 3 − µX µX 2
ρX , Y = = = 0.
σX σX 2 σX σX 2
31 / 157
Composants d’un GLM (i e individu)
[McCullagh and Nelder, 1989]
g (E[Yi ]) = ηi .
ηi = βj Xij Yi ∼ N(ηi , σ2 ).
PJ
Ex. du modèle linéaire : g = Id j =1
32 / 157
3 Usage pratique des GLM : les écueils récurrents
Les GLM : brefs rappels
Quelques notions opérationnelles importantes sur les GLM
Surdispersion et masse en 0
Segmentation et modélisation : limites à garder en tête
Tenir compte de l’exposition : l’offset
Réponse catégorielle : sur-représentation d’une modalité
33 / 157
Choix de la loi de l’erreur et fonctions de lien en actuariat
µ exp (X β)
B(µ) logit : η = ln( 1−µ ) µ= 1+exp (X β)
Taux
G(α, β) inverse : η = 1
µ µ = (X β)−1 Sévérité
34 / 157
La gaussienne
L’utilisation d’une loi Normale est encore très répandue... Mais cela
implique des erreurs fondamentales de raisonnement, notamment
la densité de la loi est symétrique,
sa queue de distribution est fine,
support non adapté à des charges sinistres ⇒ P(Y < 0).
35 / 157
Valeur des coefficients calibrés : impact sur la réponse
36 / 157
Comparateur en ligne et odd-ratio (OR)
E[Y | Xj = xj + 1]
= h (βj ),
E[Y | Xj = xj ]
37 / 157
Validation d’un modèle GLM
38 / 157
Effets de facteurs de risque
39 / 157
Un peu plus loin : transformations au sein du prédicteur
40 / 157
2. Les modèles GLM ,
Résidus ?
Validation
L’exemple d’un
ci-dessous – Résidus
modèle GLMmontre que le modèle Gamma est bien
Les graphiques
mieux adaptéci-dessous mettent par
que le modèle exemple dans
lognormal en évidence que le modèle
cet exemple...
gamma (à gauche) est mieux adapté que le modèle LN (à droite) :
Dans le cas
Tarification, d’une
méthodes loi continue (coût moyen), on peut tester ces 38
avancées
41 / 157
Tweedie or not Tweedie ?
[Boucher and Danail, 2011]
42 / 157
L’ordre p ∈ R+ (paramètre d’indice), choisi (en fonction de
l’application) avant d’estimer µ et φ, définit le type de distribution :
→ p < 0 : réalisations dans R; p = 0 : loi gaussienne,
→ 0 < p < 1 : pas de distribution (pas de modèle Tweedie),
→ p = 1 avec φ = 1 : loi de Poisson,
→ 1 < p < 2 : loi composée Poisson-Gamma (réalisations ≥ 0),
→ 2 < p < 3 ou p > 3 : positive stable distributions (x > 0),
→ p = 2 : loi Gamma, p = 3 : loi inverse gaussienne.
43 / 157
3 Usage pratique des GLM : les écueils récurrents
Les GLM : brefs rappels
Quelques notions opérationnelles importantes sur les GLM
Surdispersion et masse en 0
Segmentation et modélisation : limites à garder en tête
Tenir compte de l’exposition : l’offset
Réponse catégorielle : sur-représentation d’une modalité
44 / 157
Pratique courante
En effet,
la survenance des sinistres est considérée sans mémoire„
la Poisson ne dépend que d’un paramètre donc est simple
cela simplifie le calcul global de sinistralité à l’échelle du
portefeuille : loi Poisson composée stable par addition.
45 / 157
Cas classique de surdispersion : la Binomiale Négative
λn δα λα−1 e −δλ
fN ,Λ (n, λ) = fN | Λ=λ (n) fΛ (λ) = e −λ (λ, α, δ > 0, n ∈ N).
n! Γ(α)
46 / 157
δ 1
Posons ensuite p= δ+1 , et q =1−p = δ+1 . Alors
Γ(α + n) α n
P(N = n) = p q .
n! Γ(α)
Remarques :
La queue de distribution est plus épaisse que celle d’une loi
de Poisson.
Sa variance est plus grande qu’une loi de Poisson : loi utilisée
en cas de surdispersion des observations.
47 / 157
Les modèles de comptage Zero-Inflated (ZI)
[Frees, 2009], [Vasechko et al., 2009]
π0 + (1 − π0 ) ek si k = 0,
−λ
Ex : N ∼ ZIP(λ) : P(N = k ) = λ
(1 − π0 ) e −λ
si k > 0.
k!
Régression (N continue) (cf formation comportements chris à la
fin). π0 peut resulter d’une binomiale par ex.
48 / 157
Les modèles de type “hurdle-at-zero”
[Frees, 2009], [Vasechko et al., 2009]
49 / 157
3 Usage pratique des GLM : les écueils récurrents
Les GLM : brefs rappels
Quelques notions opérationnelles importantes sur les GLM
Surdispersion et masse en 0
Segmentation et modélisation : limites à garder en tête
Tenir compte de l’exposition : l’offset
Réponse catégorielle : sur-représentation d’une modalité
50 / 157
Création de poches d’assurés
H0 : β̂j = 0 VS H1 : β̂j , 0.
β̂MLE
j ∼ N(βj , 1/I(βj )).
52 / 157
⇒ La variance de l’estimateur peut devenir grande si l’information
de Fisher est faible (quantité d’info contenue dans les données,
petite dans le cas de trop peu d’individus).
53 / 157
Dimension du modèle à “minimiser”
54 / 157
Pénalités ex-post
55 / 157
Distribution de sinistralité par poche
56 / 157
Discontinuité dans la distribution des coûts
57 / 157
3 Usage pratique des GLM : les écueils récurrents
Les GLM : brefs rappels
Quelques notions opérationnelles importantes sur les GLM
Surdispersion et masse en 0
Segmentation et modélisation : limites à garder en tête
Tenir compte de l’exposition : l’offset
Réponse catégorielle : sur-représentation d’une modalité
58 / 157
Qu’est-ce que l’offset ?
Exemples d’offset :
assurance auto indiv. : nb d’années d’assurance du véhicule ;
assurance collective auto : taille de la flotte assurée ;
assurance collective incapacité-invalidité : effectif de salariés,
masse salariale ;
réassurance : taille du portefeuille, ...
59 / 157
Comment intégrer un offset dans un modèle GLM ?
60 / 157
Exemple d’offset dans le modèle log-Poisson
!
E[Y | X = x]
Soit le modèle suivant à calibrer : ln = xT β.
exposition
61 / 157
Comment intégrer l’offset dans le modèle binomial ?
Cf TP
62 / 157
Contraindre des coefficients dans une régression
Si l’on veut intégrer dans le modèle des facteurs de risque dont les
coefficients ont déjà une valeur (estimée par ailleurs auparavant),
on peut donc utiliser la même idée que l’offset...
63 / 157
3 Usage pratique des GLM : les écueils récurrents
Les GLM : brefs rappels
Quelques notions opérationnelles importantes sur les GLM
Surdispersion et masse en 0
Segmentation et modélisation : limites à garder en tête
Tenir compte de l’exposition : l’offset
Réponse catégorielle : sur-représentation d’une modalité
64 / 157
Etude d’un taux de réponse faible
65 / 157
Seuil d’affectation et courbe ROC
66 / 157
Formalisation du contexte
Rappelons que
XTi = (1, Xi1 , ..., XiJ ) et βT = (β0 , β1 , ..., βJ ) ;
i ∈ 1, ..., I : Yi ∈ {0, 1} ⇒ Yi ∼ B(pi ) ;
pi = P(Yi = 1).
1
1yi =1 est de l’ordre de quelques % au +.
P
En pratique, p̄ = I i
67 / 157
Un aparté sur la fonction de lien
68 / 157
Otherwise, it is the case of overlap.
Les deux problèmes théoriques associés
For a simple example , . Complete separation means that
such that [Albert and
and Anderson, 1984]
. Quasi-complete separation means
that such that and . Otherwise it is the case
1 of overlap.
La séparabilité : en fait, l’existence d’un estimateur du
maximum de vraisemblance est conditionné par le problème
The following graph shows the case when there are only two variables in the sample.
de séparation. Il n’@ de MLE en cas de séparation complète.
Figure 2 Possible configuration of sample points in the case of two variables, and , and two
groups, , shown by circles, and , shown by crosses. Regions and define corresponding
allocation rule. (a) Complete separation. (b) Quasi-complete separation. (c) Overlap.
With this definition, we will list the results from Albert and Anderson concerning the
situation of separation in logistic regression:
69 / 157
2 La dimensionnalité (“curse of dimensionality”).
On dispose souvent de bc de covariables : la dim. de l’espace
% vite et les données peuvent rapidement devenir “sparse”.
“Small N large P”
70 / 157
Solutions “théoriques” existantes
71 / 157
Un mot sur la vraisemblance pénalisée
[Firth, 1993]
72 / 157
Idée de la régression logistique conditionnelle exacte
[Mehta and Patel, 1995]
I
X
Tj = yi xij ,
i =1
Tj − = (Tk )k ∈[1,J ], k ,j
73 / 157
On maximise ensuite la vraisemblance conditionnelle
exp(βj tj )
P(Tj = tj | βj , Tj − = tj − ) = P P ∗
Ωj exp(βj i yi xij )
74 / 157
Variance de l’estimateur MLE
Rappel.
L’erreur d’estimation de β est composée de 2 termes : le biais au
carré, plus la variance de l’estimateur. Cette erreur est différente
de l’erreur de modèle.
Estimation classique.
On estime le vecteur β de paramètres par maximum de
vraisemblance, où la vraisemblance vaut
76 / 157
On peut faire quelques remarques :
77 / 157
Biais du MLE dans le cas “unbalanced dataset”
[McCullagh and Nelder, 1989]
78 / 157
De manière plus précise, on a
wi est le poids accordé à l’observation i ;
p̂i est l’estimation fournie par la modélisation ;
ξi = 0.5 × Qii × [(1 + wi ) p̂i − wi ] ;
W est la matrice telle que W = diag (p̂i (1 − p̂i ) wi ) ;
Q est la matrice donnée par
X XT
;
XT W X
Qii sont les éléments diagonaux de la matrice Q ;
79 / 157
Exemple de biais du MLE dans un modèle simplifié
[King and Zeng, 2001]
exp(β0 + β1 X1 )
Considérons la modélisation suivante : pi = .
1 + exp(β0 + β1 X1 )
p̄ − 0.5
E[β̂0 − β0 ] = .
n p̄ (1 − p̄ )
Clairement, le biais sera donc négatif car p̄ est petit dans notre cas
⇒ on aura tendance à systématiquement sous-estimer β0 !
80 / 157
Biais dans l’estimation de la probabilité de “succès”
pi = P(Yi = 1 | X) = p̂i + Ci
81 / 157
Modification du jeu de données
82 / 157
Rééchantillonage de type response-based sampling
83 / 157
Formalisation du contexte
fY (y | x) = fY (y | x, p0 ).
84 / 157
Un aparté sur d’autres techniques de rééchantillonnage
(autres que response-based sampling)
L sr (p ; (y , x)) = f (y , x) = fY (y | x, p ) fX (x).
L es (p ; (y , x)) = f (y , x) = fY (y | x, p ) g (x).
85 / 157
Response-based sampling et modèle logit
[Xie and Manski, 1989]
Iy fY (y | x, p )fX (x) Iy
L rb (p ; (y , x)) = f (x | y ) =R
I f (y
X Y
| x, p )fX (x) dx I
86 / 157
Ici l’optimisation est modifiée, contrairement à précédemment où la
vraisemblance à optimiser était directement une fonction de p à
travers le noyau fY (y | x, p ).
f (x , y ) fY (y | x, p )fX (x)
=R .
f (y ) f (y | x, p )fX (x) dx
X Y
87 / 157
Méthode 1 : the weighting method
[Manski and Lerman, 1977]
I
X
log Lw (p ; (y , x)) = w (yi ) ln(f (yi | xi , p ))
i =1
avec
fY (y )
w (y ) = .
(Iy /I)
88 / 157
On conserve au final l’estimateur
89 / 157
En pratique...
On a
fY (y )
w (y ) = .
(Iy /I)
Au numérateur, il s’agit de la proportion de 1 (respectivement 0)
dans la population d’origine.
Au dénominateur, il s’agit de la proportion de 1 (respectivement 0)
dans la population response-based.
Donc
τ
pour yi = 1 : les poids sont w (1) = τc < 1
1−τc >
1−τ
pour yi = 0 : les poids sont w (0) = 1
On surpondère donc les observations égales à 0 : ceci est logique
puisque l’échantillon response-based contient bien moins de 0 que
celui d’origine...
90 / 157
Ecart de tarif
10000 × 2000
1−τ τc
!
β̃0 = β̂0 − ln ,
τ 1 − τc
93 / 157
Franchise : pertes internes collectées avec seuillage
94 / 157
Distribution de la sévérité
fθ (x ) f (x )
f̃θ|H (x ) = 1x >H = R ∞ θ 1x >H .
P(X > H ) fθ (u) du
H
95 / 157
Application au cas où Xik,j ∼ X ∼ LN(µ, σ)
ln H −(µ+σ2 )
1 − Φ( σ ) µ+σ2 /2
m1 (µ, σ) = ln H −µ
e
1 − Φ( σ )
ln H −(µ+2σ2 )
1 − Φ( σ ) 2(µ+σ2 )
m2 (µ, σ) = ln H −µ
e
1 − Φ( σ )
96 / 157
Distribution de la fréquence
λn
P (N = n) = e −λ
n!
Simple (EMV = moy. empirique). Attention : équidispersion !
Calibration de la fréquence après celle de la sévérité pour
prendre en compte la présence du seuil de collecte :
λ̂H λ̂H
λ̂ = =
P(X > H ) 1 − Fθ̂ (H )
97 / 157
Recours et réassurance
Il y a 2 solutions :
soit les recours se traitent en amont de la modélisation
soit on modélise la probabilité de recours, puis combien cela
rembourse (approche PD-LGD en crédit)
98 / 157
Prise en compte du provisionnement
99 / 157
Déviation par rapport au tarif existant
100 / 157
Résumé des étapes de création d’un tarif
Dans l’ordre,
1 importation des données et premiers traitements (données
aberrantes, valeurs manquantes, transformation de types, . . . )
2 extraction des bases par garantie assurée
3 traitement des données (nettes de franchises, recours, forfait
type IDA, mise en as-if pour l’inflation, dvp des sinistres pour
prise en compte de provision ds tarif, réass. à répercuter ?)
4 statistiques descriptives (exposition, fréquence et cout moyen
par variable explicative, tests de corrélation, . . . ) et premiers
choix de travail sur les modalités
5 extraction des seuils et isolement des extrêmes
6 détermination de l’individu de référence
7 création d’échantillons d’apprentissage et de validation
101 / 157
8 modélisation (hypothèse, adéquation aux lois choisies, . . . )
9 optimisation du modèle et travail manuel sur les variables et
les modalités
10 validation du modèle (résidus, comparaison à l’empirique sur
l’échantillon de validation)
11 détermination des primes
12 viabilité des primes segmentées définies.
102 / 157
5 Mise en place d’un zonier
Zonier : introduction
Généralités sur les zoniers
Données à disposition
Pré-modélisation : une étape commune
Zonier administratif
Etapes de l’agrégation territoriale
Agrégation territoriale : choix du seuil d’exposition minimale
Zones de risque spatial : classification
Zonier par lissage spatial
Introduction
Le modèle de Boskov et Verrall
Approche bayésienne : mise à jour des paramètres du modèle
Zonier prédictif
103 / 157
Création d’un zonier
[Taylor, 2001]
[Taylor, 1999]
[MATHIS, 2009]
104 / 157
Définition d’un zonier
105 / 157
Objectif principal d’un zonier
⇒ Vente par les agents rendue plus facile... Moins de plaintes des
assurés.
106 / 157
9.5. Cartographie du zonier des territoires administratifs
A partir de ce qui vient d’être défini ci-avant, un zonier de 10 zones a été réalisé et est
présenté ci-dessous (Figure 9-7). Le risque augmente selon le numéro de zone. Ainsi, la zone verte
Trois exemples de zonier différents
foncée correspond au territoire où le risque vol est le moins élevé et à l’inverse, la zone 10, rouge
foncée, correspond au territoire où le risque vol est le plus élevé. Comme cité précédemment,
chacune des 10 zones rassemble le même niveau d’exposition.
Le zonier administratif :
107 / 157
10.4. Cartographie du zonier lissage spatial
Le zonier prédictif :
Exemples :
garantie vol,
garantie CAT NAT (zonier inondation, sécheresse),
zonier santé (prix de la santé assez différent en fonction des
régions),
...
110 / 157
5 Mise en place d’un zonier
Zonier : introduction
Généralités sur les zoniers
Données à disposition
Pré-modélisation : une étape commune
Zonier administratif
Etapes de l’agrégation territoriale
Agrégation territoriale : choix du seuil d’exposition minimale
Zones de risque spatial : classification
Zonier par lissage spatial
Introduction
Le modèle de Boskov et Verrall
Approche bayésienne : mise à jour des paramètres du modèle
Zonier prédictif
111 / 157
Système d’Information Géograph. (SIG)
113 / 157
Stratégie en amont de la construction
114 / 157
En spécifiant un modèle GLM log-Poisson avec un offset pour tenir
compte de l’exposition, on a
115 / 157
Pour l’échantillonnage, on peut ou non procéder par
échantillonnage stratifié (sur l’exposition par exemple : 2/3 de
l’exposition dans l’échantillon d’apprentissage et 1/3 dans celui de
validation).
116 / 157
Point de vocabulaire : on distingue dans les méthodes de zonage
deux types de données :
les données laticielles : données observées sur une partition
du territoire (ex : exposition par commune) ;
117 / 157
Problématique classique
118 / 157
procéder par lissage spatial (on mutualise les risques
proches, ex : Boskov-Verrall (1994), Taylor (2001)). Cela induit
notamment :
+ une extraction des petites fluctuations aléatoires du risque
pour en révéler la structure spatiale sous-jacente.
- une difficulté de calibration pour les paramètres de lissage,
difficulté d’arbitrer dans le niveau de précision du zonage.
119 / 157
5 Mise en place d’un zonier
Zonier : introduction
Généralités sur les zoniers
Données à disposition
Pré-modélisation : une étape commune
Zonier administratif
Etapes de l’agrégation territoriale
Agrégation territoriale : choix du seuil d’exposition minimale
Zones de risque spatial : classification
Zonier par lissage spatial
Introduction
Le modèle de Boskov et Verrall
Approche bayésienne : mise à jour des paramètres du modèle
Zonier prédictif
120 / 157
Contexte
Rappelons que
Ni = offseti × e β0 × e β1 X1 × ... × e βp Xp + i
i i
121 / 157
Facteur de risque spatial : étapes
e β2 X2 e βp Xp
i i
Ni β0 β1 X1i
Ri = = e ×e × ×...× .
offseti × e β̂2 X2 × ... × e β̂p Xp e β̂2 X2 e β̂p Xp
i i i i
122 / 157
On appelle Ri le risque spatial résiduel.
123 / 157
On peut maintenant définir l’estimateur du risque spatial
résiduel au niveau de la commune k par
PI k
ei r̂i
r̂kc = Pi =k1 ,
I
i =1 ei
124 / 157
5 Enfin, on procède à l’agrégation territoriale au besoin.
→ Si le niveau choisi est trop fin (pas d’exposition), on agrège
alors au niveau d’au-dessus (ici le département par exemple).
125 / 157
Choix du seuil d’exposition minimale
126 / 157
On stocke donc dans un tableau pour chaque commune tous les
niveaux de risque spatiaux possibles suivant le niveau d’agrégation
considéré (commune, canton, département, région, ...).
127 / 157
3 pour trouver le seuil d’exposition minimale e, on optimise la
fonction
n
X
min e (r̂kT − r̂kA )2
e
k =1
128 / 157
Classification par zone risquée
129 / 157
classification se fait par quantile d’exposition : on veut créer Z
classes avec même niveau d’exposition.
expo totale
a= .
Z
En pratique, on veut satisfaire le critère “avoir au moins a en
termes d’exposition”.
130 / 157
5 Mise en place d’un zonier
Zonier : introduction
Généralités sur les zoniers
Données à disposition
Pré-modélisation : une étape commune
Zonier administratif
Etapes de l’agrégation territoriale
Agrégation territoriale : choix du seuil d’exposition minimale
Zones de risque spatial : classification
Zonier par lissage spatial
Introduction
Le modèle de Boskov et Verrall
Approche bayésienne : mise à jour des paramètres du modèle
Zonier prédictif
131 / 157
Différence principale de cette technique
132 / 157
Modèle de Boskov-Verrall, [Boskov and Verrall, 1994]
133 / 157
On stipule un modèle GLM log-Poisson pour expliquer le nombre
de sinistres, avec un offset :
Etapes de modélisation :
1 On estime un GLM log-Poisson sans µi , le facteur de risque
spatial. On obtient ainsi η̂i .
134 / 157
µi pour l’effet du risque spatial,
νi pour les résidus du modèle.
On doit maintenant spécifier des distributions de probabilités
a priori pour ces 2 quantités afin de mettre en oeuvre la
théorie bayésienne.
3 Supposons que :
l’effet spatial µi est lissé, en introduisant une dépendance
spatiale entre les régions voisines. Notons δi l’ensemble des
régions dans le voisinage de la région i.
Une loi possible peut être
135 / 157
Pour trouver la loi du vecteur, on tient compte de cette
dépendance. Donc
136 / 157
les résidus νi sont indépendants, centrés, et de type
gaussien, i.e.
On obtient donc
Y
f (νi ; λ) ∼ λ−r /2 e − 2λ νi2
1 Pr
f (ν; λ) = i =1 .
i
137 / 157
4 On sait que Ni | ηi , µi ∼ P(ei × e ηi +µi ), donc N ∼ L(Θ) avec
Θ = (U , V , τ, Λ).
N | (U , V , τ, Λ).
139 / 157
Résumé du raisonnement
141 / 157
Donnons nous un vecteur pour nos variables aléatoires :
142 / 157
Algorithme de Gibbs en pratique
(k +1) (k ) (k )
3 µ1 ∼ f (µ1 | λ(k +1) , τ(k +1) , µ−1 , ν(k ) , n), où µ−1 =
(k ) (k )
(µ2 , ..., µr )
...
(k +1) (k +1)
µr ∼ f (µr | λ(k +1) , τ(k +1) , µ−r , ν(k ) , n)
143 / 157
(k +1) (k )
4 ν1 ∼ f (ν1 | λ(k +1) , τ(k +1) , µ(k +1) , ν−1 , n)
...
(k +1) (k +1)
νr ∼ f (νr | λ(k +1) , τ(k +1) , µ(k +1) , ν−r , n)
144 / 157
Cette chaine de Markov converge normalement vers une
distribution stationnaire f (τ, λ, µ, ν | n) après quelques centaines /
milliers d’itérations.
K
1 X
X̂ = X (k ) .
K −T
T +1
145 / 157
On remarque cependant que la simulation des densités
conditionnelles univariées nécessite de les connaitre !
Par exemple,
(k +1) (k +1)
µi ∼ f (µi | τ(k +1) , λ(k +1) , µ−i , ν(k ) , n)
Avec les choix faits ici pour les lois a priori (log-Poisson, loi peu
informative, etc...), certaines de ces densités sont fournies dans
[J. Besag and Mollie, 1991].
146 / 157
5 Mise en place d’un zonier
Zonier : introduction
Généralités sur les zoniers
Données à disposition
Pré-modélisation : une étape commune
Zonier administratif
Etapes de l’agrégation territoriale
Agrégation territoriale : choix du seuil d’exposition minimale
Zones de risque spatial : classification
Zonier par lissage spatial
Introduction
Le modèle de Boskov et Verrall
Approche bayésienne : mise à jour des paramètres du modèle
Zonier prédictif
147 / 157
Construction d’un zonier prédictif
149 / 157
CONCLUSION
150 / 157
Conclusion
Principalement :
la segmentation et ce qu’elle induit (attention à ne pas trop
segmenter !) ;
151 / 157
la calibration des modèles (convergence du MLE, bornitude
de la vraisemblance, initialisation de l’algorithme de
Newton-Raphson, etc...) ;
152 / 157
Bibliographie
153 / 157
Brass, W. and Macrae, S. (1984).
Childhood mortality estimated from reports on previous births given by mothers at the
time of a maternity : I. Preceding-births technique.
In Asian and Pacific Census Forum, volume 11.
Brouhns, N., Denuit, M., Masuy, B., and Verrall, R. (2002).
Ratemaking by geographical area in the Boskov and Verrall model : a case study
using Belgian car insurance data.
Firth, D. (1993).
Bias reduction of maximum likelihood estimates.
Biometrika, 80(1) :27–38.
Frees, E. W. (2009).
Regression Modeling with Actuarial and Financial Applications.
International Series on Actuarial Science. Cambridge University Press, New York.
Greene, W. H. (2008).
Econometric Analysis (6th Edition).
Prentice Hall, New Jersey.
J. Besag, J. Y. and Mollie, A. (1991).
Bayesian image restoration, with two applications in spatial statistics.
Ann. Inst. Stat. Math., 43(1) :1–59.
154 / 157
King, G. and Zeng, L. (2001).
Logistic Regression in Rare Events Data.
Polit. Anal., 9(2) :137–163.
Lee, R. D. and Carter, L. R. (1992).
Modeling and forecasting U.S. mortality.
J. Am. Stat. Assoc., 87(419) :659–671.
Leroy, G. and Planchet, F. (2016).
Un regard actuariel sur les evolutions de l’assurance automobile.
Risques, 105.
Mahy, S. and Denuit, M. (2002).
Decoupage geographique par zones de Voronoi en assurance automobile.
Manski, C. F. and Lerman, S. R. (1977).
Estimation of Choice Probabilities from Choice-based Samples.
Econometrica, 45(8) :1977–1988.
MATHIS, J. (2009).
Elaboration d’un zonier en assurance de vehicules par des methodes de lissage
spatial basees sur des simulations MCMC.
PhD thesis.
McCullagh, P. and Nelder, J. A. (1989).
Generalized linear models, 2nd ed.
Monographs on Statistics and Applied Probability. Chapman and Hall, London.
155 / 157
Mehta, C. R. and Patel, N. R. (1995).
Exact logistic regression : Theory and examples.
Stat. Med., 14(19) :2143–2160.
Paglia, A. and Phelippe-Guinvarc’h, M. V. (2011).
Tarification des risques en assurance non-vie, une approche par modèle
d’apprentissage statistique.
Bull. français d’Actuariat, 11(22) :49–81.
Pouna Siewe, V. (2010).
Modeles additifs generalises : Interets de ces modeles en assurance automobile.
PhD thesis, ISFA.
Taylor, G. (2001).
Geographical premium rating by Whittaker spatial smoothing.
ASTIN Bull., 31(1) :147–160.
Taylor, G. C. (1999).
Use of spline functions for premium rating by geographical area.
ASTIN Bull., 19(1) :91–122.
Vasechko, O., Grun-Rehomme, M., and Benlagha, B. (2009).
Moelisation de la frequence des sinistres en assurance automobile.
Bull. français d’Actuariat, 9(18).
156 / 157
Xie, Y. and Manski, F. (1989).
The logit model and response-based samples.
Sociol. Methods Res., 17(3) :283–302.
157 / 157