0% ont trouvé ce document utile (0 vote)
39 vues48 pages

Analyses Factorielles en Statistique

Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
39 vues48 pages

Analyses Factorielles en Statistique

Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

CHAPITRE 2: LES ANALYSES FACTORIELLES

ECOLE PRIVÉE SUPERIEURE DES SCIENCES DE L’EAU ET DE l’ENVIRONNEMENT


(Ep-2SE)

Chargé du cours:
AWEL IBRAHIM Harouna
Ingénieur Statisticien Économiste

16 novembre 2021
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Sommaire

1 INTRODUCTION

2 A NALYSE EN C OMPOSANTES P RINCIPALES (ACP)


Nuage des Individus
Cercle de corrélation

3 A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC)


Données, Notations, Hypothèse d’indépendance
Ressemblance entre les profils

4 A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)


Données et Notations
Objectifs de l’ACM
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Sommaire

1 INTRODUCTION

2 A NALYSE EN C OMPOSANTES P RINCIPALES (ACP)


Nuage des Individus
Cercle de corrélation

3 A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC)


Données, Notations, Hypothèse d’indépendance
Ressemblance entre les profils

4 A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)


Données et Notations
Objectifs de l’ACM
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Sommaire

1 INTRODUCTION

2 A NALYSE EN C OMPOSANTES P RINCIPALES (ACP)


Nuage des Individus
Cercle de corrélation

3 A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC)


Données, Notations, Hypothèse d’indépendance
Ressemblance entre les profils

4 A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)


Données et Notations
Objectifs de l’ACM
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Sommaire

1 INTRODUCTION

2 A NALYSE EN C OMPOSANTES P RINCIPALES (ACP)


Nuage des Individus
Cercle de corrélation

3 A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC)


Données, Notations, Hypothèse d’indépendance
Ressemblance entre les profils

4 A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)


Données et Notations
Objectifs de l’ACM
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Sommaire

1 INTRODUCTION

2 A NALYSE EN C OMPOSANTES P RINCIPALES (ACP)


Nuage des Individus
Cercle de corrélation

3 A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC)


Données, Notations, Hypothèse d’indépendance
Ressemblance entre les profils

4 A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)


Données et Notations
Objectifs de l’ACM
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Introduction

Limites de la statistique descriptive


4 Les méthodes d’analyse de la statistique descriptive permettent d’étudier les variables
statistiques prises une à une (statistique descriptive univariée) ou deux à deux (statistique
descriptive bivariée)
4 La principale limite de ces méthodes d’analyse est quelles sont inefficaces lorsque le nombre
de variables est très élevé
4 Par exemple, lorsqu’on dispose de 50 variables quantitatives, il serait trop fastidieux de faire le
croisement deux à deux entre ces variables et c’est moins efficace en terme d’interprétation car
l’objectif c’est c’est de pouvoir résumer au mieux l’information contenue par plusieurs variables.

Solutions
Les analyses factorielles
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Introduction

Les analyses factorielles


4 Ce sont les méthodes d’analyse qui sont proposées afin de remédier aux limites de la
statistique descriptive vue au chapitre 1.
4 Ce sont des méthodes d’analyse multidimensionnelles qui procèdent par représentation
graphique des données.

Principe des méthodes factorielles


4 Le principe de ces méthodes est unique.
4 Deux nuages de points, représentant respectivement les lignes et les colonnes du tableau
étudié, sont construits et représentés sur des graphiques.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Sommaire

1 INTRODUCTION

2 A NALYSE EN C OMPOSANTES P RINCIPALES (ACP)


Nuage des Individus
Cercle de corrélation

3 A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC)


Données, Notations, Hypothèse d’indépendance
Ressemblance entre les profils

4 A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)


Données et Notations
Objectifs de l’ACM
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse en Composantes Principales (ACP)

Conditions d’utilisation de l’ACP


4 L’ACP est une méthode d’analyse factorielle qui est utilisée lorsqu’on dispose d’un tableau de
plusieurs individus décrits par plusieurs variables quantitatives (plus de deux variables
quantitatives).
4 Les lignes du tableau représentent les individus et les colonnes représentent les variables, le
tableau peut se présenter ainsi :
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse en Composantes Principales (ACP)

Tableau des données en ACP

Tableau – Tableau des données en ACP

variables
1··· k ··· K
1
.. ..
. .
individus i ··· xik ···
..
.
..
I .
I est le nombre total des individus et K est le nombre total de variables quantitatives ; xik est la
valeur prise par l’individu i de la variable k
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse en Composantes Principales (ACP)

Ressemblance entre les individus


4 A propos des individus, on essaie d’évaluer leur ressemblance : deux individus se ressemblent
d’autant plus qu’ils possèdent des valeurs proches pour l’ensemble des variables ; on utilise la
distance Euclidienne pour mesurer la ressemblance entre deux individus. La distance entre
deux individus i et l notée d (i, l) est obtenue par l’expression suivante :

Distance entre deux individus


K
X
d (i, l) = (xik − xlk )2
k =1
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse en Composantes Principales (ACP)

Corrélation entre les variables


4 A propos des variables, on essaie d’évaluer leur liaison. Pour calculer cette liaison, on utilise le
coefficient de corrélation linéaire noté ρ. L’expression du coefficient de corrélation linéaire entre
deux variables h et k est donnée par :

Coefficient de corrélation linéaire entre les variables


I
Cov (h, k ) 1X
ρ (h, k ) = ; Cov (h, k) = (xih − x h ) (xik − x k )
sh sk I i=1
I ! !
1 X xih − x h xik − x k
ρ (h, k) =
I i=1 sh sk
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse en Composantes Principales (ACP)

Ressemblance entre les individus et corrélation entre les variables


4 Un bilan de la ressemblance entre les individus Cela consiste à répondre aux questions de
type : quels sont les individus qui se ressemblent ? quels sont ceux qui diffèrent ? de façon
générale, on souhaite décrire la variabilité des individus. Cela conduit à chercher des groupes
homogènes d’individus dans une multitude de typologie d’individus ; autrement dit, on cherche
les principales dimensions de variabilité des individus.
4 Un bilan de la liaison entre les variables Concernant les variables, les questions peuvent
être de type : quelles sont les variables qui sont corrélées positivement entre elles ? quelles
sont celles qui s’opposent (corrélées négativement) ? Existe t-il des groupes de variables
corrélées entre elles ?
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse en Composantes Principales (ACP)

Corrélation entre les variables


4 Un autre aspect de l’étude des liaisons entre variables consiste à résumer l’ensemble des
variables par un petit nombre de variables synthétiques appelées ici composantes principales.
Ce point de vue est très lié au précédent : une composante principale peut être considérée
comme le représentant (la synthèse) d’un groupe de variables liées entre elles.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse en Composantes Principales (ACP)

Transformation des données


4 En ACP, le tableau des données est toujours centré (en pratique, le centrage est inclus dans les
programmes d’ACP). A chaque valeur numérique, on soustrait la moyenne de la variable en
question. Le tableau obtenu est alors de terme général :

xik − x k

4 Cette transformation n’a aucune incidence sur les définitions de la ressemblance entre
individus et de la liaison entre variables, les résultats issus du centrage des variables sont très
sensibles au choix des unités de mesure, raison pour laquelle on préfère réduire les variables
en divisant chaque observation centrée par l’écart-type de la variable.
4 On dit qu’une ACP est normée lorsque le terme général du tableau est :

xik − x k
sk
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse en Composantes Principales (ACP)

Nuage des individus


4 S’intéresser aux individus revient à envisager le tableau en tant que juxtaposition de lignes. À
chaque individu est associée une suite de K nombres. Selon ce point de vue, un individu peut
être représenté comme un point de l’espace vectoriel à K dimensions, noté RK , dont chaque
dimension représente une variable.
4 L’ensemble des individus constitue le nuage NI dont le centre de gravité G est confondu avec
l’origine O des axes du fait du centrage.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse en Composantes Principales (ACP)

Nuage des individus


4 On dispose de 132 pays sur lesquels ont été observées 17 variables quantitatives et on
souhaite faire une analyse des données afin de résumer au mieux l’information contenue dans
ces données. Pour ce faire on fera recours aux analyses factorielles notamment l’Analyse en
composantes principales. La figure ci-dessous donne l’histogramme des valeurs propres qui
donne pour chaque facteur le pourcentage d’inertie ou d’information qu’il contient.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse en Composantes Principales (ACP)

Figure – Histogramme des valeurs propres

Source : Données fictives


INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse en Composantes Principales (ACP)


Nuage des individus

Figure – Nuage des individus


INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse en Composantes Principales (ACP)


Cercle de corrélation

Figure – Cercle de corrélation

Source : Données fictives


INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Sommaire

1 INTRODUCTION

2 A NALYSE EN C OMPOSANTES P RINCIPALES (ACP)


Nuage des Individus
Cercle de corrélation

3 A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC)


Données, Notations, Hypothèse d’indépendance
Ressemblance entre les profils

4 A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)


Données et Notations
Objectifs de l’ACM
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Données, Notations, Hypothèse d’indépendance

Situation d’utilisation de l’AFC


4 À l’origine, l’Analyse Factorielle des Correspondances (AFC) a été conçue pour étudier des
tableaux appelés couramment tableaux de contingence (ou tableaux croisés). Il s’agit de
tableaux d’effectifs obtenus en croisant les modalités de deux variables qualitatives définies sur
une même population de n individus. Le tableau se présente comme suit :
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Données, Notations, Hypothèse d’indépendance

Tableau des données en AFC

Tableau – Tableau des données en AFC

1 ··· j ··· J Total


1 n11 ··· n1j ··· n1J n1.
.. .. .. .. .. .. ..
. . . . . . .
i ni1 ··· nij ··· niJ ni.
.. .. .. .. .. .. ..
. . . . . . .
I nI1 ··· nIj ··· nIJ nI.
Total n.1 ··· n.j ··· n.J n..
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Données, Notations, Hypothèse d’indépendance

Û En lignes, on a les I modalités de la variable X , et en colonnes, on a les J modalités de la


variable Y ; X et Y sont toutes des variables qualitatives.
Û nij Le nombre des individus ayant la modalité i de la variable X et la modalité j de la variable Y
J
X
Û n1. = n1j Le nombre des individus ayant la modalité 1 de la variable X indépendamment des
j=1
modalités de la variable Y
J
X
Û ni. = nij Le nombre des individus ayant la modalité i de la variable X indépendamment des
j=1
modalités de la variable Y
I
X
Û n.1 = ni1 Le nombre des individus ayant la modalité 1 de la variable Y indépendamment des
i=1
modalités de la variable X .
I
X
Û n.j = nij Le nombre des individus ayant la modalité j de la variable Y indépendamment des
i=1
modalités de la variable X .
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Données, Notations, Hypothèse d’indépendance

Tableau des données en AFC


En AFC, le tableau utilisé est celui des fréquences relatives.

Tableau – Tableau des données en AFC

1 ··· j ··· J Total


1 f11 ··· f1j ··· f1J f1.
.. .. .. .. .. .. ..
. . . . . . .
i fi1 ··· fij ··· fiJ fi.
.. .. .. .. .. .. ..
. . . . . . .
I fI1 ··· fIj ··· fIJ fI.
Total f.1 ··· f.j ··· f.J 1
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Données, Notations, Hypothèse d’indépendance

Notations

nij
fij = pourcentage des individus ayant la modalité i de X et la modalité j de Y .
n
J
ni. X
fi. = = fij Fréquence marginales colonne
n j=1
I
n.j X
f.j = = fij Fréquences marginales ligne
n i=1
I
X I X
X J
fi. = fij = 1 Somme des fréquences marginales colonne
i=1 i=1 j=1
J
X J X
X I
f.j = fij = 1 Somme des fréquences marginales ligne
j=1 j=1 i=1
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Données, Notations, Hypothèse d’indépendance

Indépendance entre les deux variables qualitatives


Un tableau de contingence exprime la liaison entre deux variables qualitatives. Classiquement, pour
une mesure de probabilité, on dit qu’il y a indépendance entre les deux variables lorsque, pour tout
i et pour tout j , on a l’égalité :
fij = fi. × f.j
Démonstration :

ni. × n.j nij ni. n.j


nij = =⇒ = ×
n n n n
=⇒ fij = fi. × f.j
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Données, Notations, Hypothèse d’indépendance

Indépendance entre les deux variables qualitatives


4 Il y a liaison entre les deux variables dès que certaines cases du tableau fij diffèrent du produit
fi. × f.j . Si fij est supérieur à ce produit, les modalités i et j s’associent plus qu’elles ne le font
dans l’hypothèse d’indépendance : on dit que i et j s’attirent.
4 Au contraire, si fij est inférieur au produit des marges, i et j s’associent moins que dans
l’hypothèse d’indépendance : on dit qu’il y a répulsion entre ces deux modalités.
4 L’indépendance s’exprime aussi en considérant le tableau comme un ensemble de lignes. En
effet, l’égalité ci-dessus est équivalente à l’égalité :
fij
= f.j
fi.
4 La quantité f.j représente le pourcentage de la population totale qui possède la modalité j tandis
fij
que représente ce même pourcentage dans la sous-population possédant la modalité i.
fi.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Données, Notations, Hypothèse d’indépendance

Objectif de l’AFC
3 On cherche à obtenir une typologie des lignes, une typologie des colonnes et à relier ces deux
typologies entre elles ;
3 La ressemblance, entre deux lignes d’une part et entre deux colonnes d’autre part, s’exprime
de manière totalement symétrique ;
3 Deux lignes sont considérées comme proches si elles s’associent de la même façon à
l’ensemble des colonnes, c’est-à-dire si elles s’associent trop (ou trop peu) aux mêmes
colonnes ; les termes trop et trop peu sont pris en référence à la situation d’indépendance ;
3 Symétriquement, deux colonnes sont proches si elles s’associent de la même façon à
l’ensemble des lignes.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Ressemblance entre les profils

Ressemblance entre les profils


En AFC, la ressemblance entre deux lignes ou entre deux colonnes est définie par une distance
entre leurs profils connue sous le nom de distance du X2 . Elle est définie de façon symétrique pour
les lignes et pour les colonnes. Soit :
J !2
X 1 fij flj
dX2 (profil-ligne i, profil-ligne l) = −
f fi. fl.
j=1 .j

I !2
X 1 fij fik
dX2 (profil-colonne j, profil-colonne k ) = −
f f.j f.k
i=1 i.

Plus la distance est petite, plus les deux modalités s’associent plus ; et plus la distance est élevée,
plus il y a répulsion entre les deux modalités.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Exemple d’Application 1

Lien entre Milieu de résidence et l’accès à l’eau potable


On souhaite étudier le lien entre le milieu de résidence et l’accès à l’eau potable ; les données sont
renseignées dans le tableau ci-dessous.

Tableau – Tableau des données 1

faible accès accès moyen accès eleve


rural 35 13 2
semi urbain 31 43 56
urbain 8 46 126
Comme il s’agit de deux variables qualitatives, une Analyse factorielle des Correspondances (AFC)
sera utilisée pour faire l’analyse.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Exemple d’Application 1

Figure – Représentation graphique des résultats de l’AFC

Source : Données fictives


INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Exemple d’Application 2

Lien entre le niveau d’étude et la catégorie socio-professionnelle


On souhaite étudier le lien entre le niveau d’instruction ou niveau d’étude et la catégorie
socio-professionnelle ; il s’agit de deux variables qualitatives, donc une AFC sera utilisée.

Tableau – Tableau des données 2

Manœuvre Ouvrier Cadre moyen Cadre supérieur


Aucun 46 13 7 2
Brevet 25 36 10 3
Bac 12 39 17 7
Licence 8 16 38 15
Master 5 13 49 70
Doctorat 2 24 56 95
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse Factorielle des Correspondances (AFC)


Exemple d’Application 2

Figure – Représentation graphique des résultats de l’AFC


INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Sommaire

1 INTRODUCTION

2 A NALYSE EN C OMPOSANTES P RINCIPALES (ACP)


Nuage des Individus
Cercle de corrélation

3 A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC)


Données, Notations, Hypothèse d’indépendance
Ressemblance entre les profils

4 A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)


Données et Notations
Objectifs de l’ACM
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse des Correspondances Multiples (ACM)


Données et notations

Données et notations
3 L’Analyse des Correspondances Multiples (ACM) permet d’étudier une population de I individus
décrits par J variables qualitatives.
3 Une variable qualitative (ou nominale) est une application de l’ensemble I des individus dans un
ensemble fini sur lequel on ne considère aucune structure : par exemple un ensemble de trois
couleurs (bleu, vert, rouge). Les éléments de cet ensemble sont appelés modalités de la
variable et l’on dit par exemple qu’un individu bleu possède la modalité bleu.
3 L’application la plus courante de l’ACM est le traitement de l’ensemble des réponses à une
enquête. Chaque question constitue une variable dont les modalités sont les réponses
proposées (parmi lesquelles chaque enquêté doit faire un choix unique).
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse des Correspondances Multiples (ACM)


Données et notations

Codage condensé
Le tableau des données en ACM se présente comme suit :

Tableau – Tableau des données en ACM

variables qualitatives
1··· j ··· J
1
.. ..
. .
individus i ··· xij ···
..
.
..
I .
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse des Correspondances Multiples (ACM)


Données et notations

Codage condensé
3 Ces données se présentent comme en ACP avec les individus en ligne et les variables en
colonne ;
3 Naturellement, même lorsque ce sont des nombres, les valeurs xij sont des codifications qui ne
possèdent pas de propriétés numériques ;
3 Si la variable j est la couleur des individus, cette couleur peut être codifiée ainsi : bleu =! 1, vert
1+2+3 6
= 2, rouge = 3. Il est clair que la moyenne entre bleu, vert et rouge = = 2 n’a pas
3 3
grand sens (on ne peut pas dire que bleu+vert+rouge donne la couleur verte).
3 Il n’est donc pas possible de traiter directement ce tableau par ACP (ou AFC) : les tableaux
Individus×Variables qualitatives possèdent des spécificités et leur analyse factorielle
nécessite une méthode spécifique.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse des Correspondances Multiples (ACM)


Données et notations

Tableau disjonctif complet

Tableau – Tableau disjonctif complet

variable 1 ··· variable j ··· variable J


1 1 k Kj K
1

individus i 0100 ··· xik ··· 0010

I

1 Si l’individu possède la modalité k de la variable j


xik = 
0 Sinon

INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse des Correspondances Multiples (ACM)


Objectifs de l’ACM

Objectifs de l’ACM
3 La problématique de l’ACM est apparentée à celle de l’ACP (étude d’un tableau
Individus×Variables) mais peut être considérée aussi comme une généralisation de celle de
l’AFC (étude de la liaison entre plusieurs variables qualitatives).
3 Ces deux aspects sont toujours plus ou moins explicitement présents dans les objectifs de
l’ACM, présentés ici à partir des trois familles d’objets qui interviennent en ACM : les individus,
les variables et les modalités des variables.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse des Correspondances Multiples (ACM)


Objectifs de l’ACM

Etude des individus


3 De façon analogue à l’ACP, l’un des objectifs de l’ACM est de réaliser une typologie des
individus. Cette typologie doit s’appuyer sur une notion de ressemblance telle que deux
individus sont d’autant plus proches qu’ils possèdent un grand nombre de modalités en
commun.
3 En outre, dans la plupart des applications de l’ACM, les individus sont très nombreux et ne sont
connus que par leurs caractéristiques présentes dans le tableau de données.
3 Par exemple, dans une enquête d’opinion, on ne dispose pour chaque individu d’aucune autre
connaissance que ses réponses au questionnaire.
3 Ainsi, dans les enquêtes d’opinion, on s’intéresse, par exemple, aux femmes, aux jeunes, aux
retraités, etc. Une analyse des individus au travers de ces classes doit être telle que deux
classes se ressemblent d’autant plus que leurs profils de répartition sur l’ensemble des
modalités sont proches.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse des Correspondances Multiples (ACM)


Objectifs de l’ACM

Etude des variables


3 Procédant encore de façon analogue à l’ACP, on peut adopter deux points de vue dans l’étude
des variables.
3 Le premier est celui du bilan des liaisons entre les variables. L’étude de la liaison entre deux
variables qualitatives nécessite de considérer le tableau de contingence croisant leurs
modalités. Un bilan un tant soit peu détaillé de ces liaisons implique donc de se situer au niveau
des modalités plus qu’à celui des variables.
3 Le second consiste à résumer l’ensemble des variables (qualitatives) par un petit nombre de
variables numériques. Par exemple, on peut chercher à résumer un ensemble de variables
socio-professionnelles par un indicateur de statut social. L’intérêt de ces variables
synthétiques provient de ce qu’elles sont liées à l’ensemble des variables étudiées. Ainsi, une
variable ne pourra être considérée comme un indicateur de statut social que si elle est liée à la
fois à la catégorie socio-professionnelle, au type de diplôme, etc.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse des Correspondances Multiples (ACM)


Objectifs de l’ACM

Etude des modalités des variables


3 Etudier l’ensemble des modalités revient à dresser un bilan de leurs ressemblances ;
3 la ressemblance entre deux modalités doit reposer sur leur association mutuelle : deux
modalités se ressemblent d’autant plus qu’elles sont présentes ou absentes simultanément
chez un grand nombre d’individus. Les autres modalités n’interviennent pas.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse des Correspondances Multiples (ACM)


Exemple d’Application

Num menage IBE m Niv instruction cm CSP cm Milieu Sexe cm Possession terre
menage 1 bien-etre faible Secondaire 1er cycle Travailleur pour compte propre Urbain Homme Possede une terre
.. .. .. .. .. .. ..
. . . . . . .
menage100 bien-etre faible Secondaire 2e cycle Manoeuvre Rural Homme Possede une terre
.. .. .. .. .. .. ..
. . . . . . .
menage4485 bien-etre faible Primaire Manoeuvre Rural Femme Ne possede pas de terre
menage7830 bien-etre faible Secondaire 1er cycle Manoeuvre Urbain Homme Possede une terre
.. .. .. .. .. .. ..
. . . . . . .
menage 10303 bien-etre faible Secondaire 1er cycle Manoeuvre Urbain Homme Ne possede pas de terre

3 En lignes nous avons les individus (ménages) et en colonnes nous avons des variables
qualitatives (plus de deux variables qualitatives)
3 Une Analyse des Correspondances Multiples (ACM) sera utilisée pour l’analyse.
INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse des Correspondances Multiples (ACM)


Exemple d’Application

Figure – Nuage des modalités des variables qualitatives


INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse des Correspondances Multiples (ACM)


Exemple d’Application

Figure – Nuage de 25 individus (ménages) pris au hasard

Source : Données fictives


INTRODUCTION A NALYSE EN C OMPOSANTES P RINCIPALES (ACP) A NALYSE FACTORIELLE DES C ORRESPONDANCES (AFC) A NALYSE DES C ORRESPONDANCES M ULTIPLES (ACM)

Analyse des Correspondances Multiples (ACM)


Exemple d’Application

Figure – Nuage des modalités et des individus sélectionnés

Vous aimerez peut-être aussi