INF L14
Initiation aux statistiques
5 Tendance centrale
Introduction
Reprsentations
graphiques
renseignent sur la forme
des distributions
ex. tuyaux dorgue
longueur de prnoms des tudiants
Introduction
Mais on a parfois besoin dindices numriques
rsumer de faon trs synthtique
comparer, classer
ex. comparer la longueur des prnoms
garons/filles
volution au fil des annes
Difficile faire avec des graphiques
Introduction
Divers indices possibles
Le plus simple :
caractriser le centre des
distributions
tendance centrale
O situeriez-vous le "centre" ? A la valeur 6, qui
est la plus frquente ? ou bien plus droite, par
exemple de faon partager les observations en
paquets gaux ? Si oui, o, exactement ? 7, 8, 9 ?
Mode
Mode
Valeur qui apparat le plus
frquemment.
Exemples:
taille de chaussures la plus
vendue
ge normal pour passer le
bac
le mode est 6
Tableur
Fonction
=MODE(donnes)
Donnes
7
8
8
0
3
6
Mode
Formule
8 =MODE(A2:A7)
Tableur
Attention, ne marche pas toujours
ici toutes les frquences sont identiques
pas de mode ou alors modes ex aequo
1
2
3
4
5
6
7
8
9
A
B
Donnes
0
4
6
7
1
8
Mode
Formule
#N/A =MODE(A2:A7)
Plusieurs modes ?
Pic principal et pic(s)
secondaire(s)
Distributions bimodales,
ou multimodales
Distance entre construit et barrage (pages
Web) (exemples)
Plusieurs modes ?
-1: construit (un) barrage
+3: barrage (a t) construit
+1: barrage construit
Donnes groupes
Lorsque les donnes ont de nombreuses valeurs
on calcule le mode aprs avoir group les donnes
par intervalles
Exemple, dures des pauses
dans un discours (ms)
Moyenne
La moyenne est la mesure de tendance centrale
la plus connue
Utilise frquemment dans la vie courante
Exemple :
La note finale d'une unit d'enseignement est la moyenne
des notes des diffrents partiels
Calcul de la moyenne
Somme des valeurs divise par le
nombre dindividus
X 1 X 2 ... X n
m
N
Reprsentation synthtique
S = somme
Moyenne : Tableur
Fonction
=MOYENNE(donnes)
1
2
3
4
5
6
7
8
9
A
Donnes
B
4
1
2
0
7
7
Moyenne
Formule
3,50 =MOYENNE(A2:A7)
Analogie physique
La moyenne est le point
auquel il faudrait placer
un support pour que la
"planche" reste en
quilibre.
Inconvnient de la moyenne
Sensibilit aux valeurs extrmes
erreurs
cas particuliers
Calcul
Donnes
danseuse 1
danseuse 2
danseuse 3
danseuse 4
danseuse 5
danseuse 6
danseuse 7
danseuse 8
sumotori
Moyenne
Formule
70,78 =MOYENNE(A2:A10)
51
52
45
50
51
51
53
49
235
les danseuses
ont de quoi se
faire du sushi
Exemple (cours 1)
On compare deux classes de 10 lves
A
11
11
12
11
12
11
13
11
10
20
Moy
12,2
B
13
13
14
13
12
14
13
15
12
0
Moy
11,9
Oops !
A
11
11
12
11
12
11
13
11
10
20
Moy
11,3
B
13
13
14
13
12
14
13
15
12
0
Moy
13,2
Mdiane
La mdiane est la valeur pour laquelle il y a
autant d'observations gauche qu' droite.
Pour la calculer,
on classe les observations par ordre croissant
on cherche quelle est la valeur qui divise les
observations en deux groupes gaux.
Exemple
Calculer
On pourrait faire le calcul la main
1) tri
2) choix de la valeur du milieu
1
2
3
4
5
6
7
8
9
10
A
Donnes
B
45 danseuse 3
49 danseuse 8
50 danseuse 4
51 danseuse 1
51 danseuse 5
51 danseuse 6
52 danseuse 2
53 danseuse 7
235 sumotori
Mdiane : Tableur
Fonction
=MEDIANE(donnes)
A
Donnes
1
2
51 danseuse 1
3
52 danseuse 2
4
45 danseuse 3
5
50 danseuse 4
6
51 danseuse 5
7
51 danseuse 6
8
53 danseuse 7
9
49 danseuse 8
10
235 sumotori
11 Moyenne
Formule
12
51 =MEDIANE(A2:A10)
Nombre pair
Cas particulier
On prend la moyenne des deux valeurs du milieu (le tableur se dbrouille)...
Exemple
A
11
11
12
11
12
11
13
11
10
20
Moy
12,2
Med
11,0
B
13
13
14
13
12
14
13
15
12
0
Moy
11,9
Med
13,0
Relation entre les trois indices
La relation dpend de la forme la distribution
Distribution symtrique (ou peu prs)
mode ~ mdiane ~ moyenne
So ?
Distribution asymtrique
Etale droite
mode < mdiane < moyenne
Iiiik !!!
[Link]
Distribution asymtrique
Etale gauche
mode > mdiane > moyenne
Yuuuk !!!
[Link]
Quel indice choisir ?
Mode
peu stable, parfois inexistant
Moyenne
la force de lhabitude
viter
ok dans les distributions symtriques
Mdiane
Meilleur indice dans les distributions asymtriques
Trs souvent le cas en linguistique !
Termes retenir
Tendance centrale
Mode
Distribution bimodale, multimodale
Moyenne
Mdiane
Distribution symtrique, asymtrique
Pweeh... all this computer hacking
is making me thirsty !