Licence AIA- Intelligence artificielle en actuariat 2024-2025
TD 2 : Clustering (K-means et Classification
hiérarchique)
On considère les Données : X = {1, 2, 9, 12, 20}
Exercice 1 : K-Means
(a) Appliquez l’algorithme des K-means avec les valeurs de k et les points de départ
suivants :
i. k = 2, µ1 = 1, µ2 = 20
ii. k = 3, µ1 = 1, µ2 = 12, µ3 = 20
iii. k = 4, µ1 = 1, µ2 = 9, µ3 = 12, µ4 = 20
(b) On aimerait maintenant comparer la qualité de ces regroupements. Pour cela, on
recommence par regarder l’inertie intra-cluster.
i. Calculer cette valeur pour les 3 regroupements précédents.
ii. En utilisant ce critère, quel serait le meilleur regroupement possible ? Est-ce
que cela vous paraı̂t réaliste ?
(c) S’inspirant du critère BIC, quelqu’un propose de rajouter le terme suivant au critère
précédent :
+2kN log N où N est le nombre de données
i. Expliquer l’utilité de ce terme.
ii. Calculer la valeur du nouveau critère pour vos 3 regroupements. Qu’en concluez-
vous ?
Exercice 2 : Classification Hiérarchique
1. Classification Hiérarchique Ascendante
(a) Appliquer l’algorithme de classification hiérarchique ascendante en utilisant le saut
minimal et tracer le dendrogramme correspondant.
(b) Idem avec le saut maximal.
2. Classification Hiérarchique Descendante
Soit un algorithme de classification hiérarchique descendante qui recherche à chaque
itération la meilleure façon de couper un ensemble de points en deux parties.
(a) Détailler la première itération de cet algorithme (en utilisant un saut minimal).
(b) Expliquer l’utilité de cet algorithme.