0% ont trouvé ce document utile (0 vote)
3 vues94 pages

Introduction à la Statistique et Méthodes

Le document traite des concepts fondamentaux de la statistique, y compris la statistique descriptive et inférentielle, ainsi que les étapes d'une étude statistique. Il aborde la collecte, l'analyse et l'interprétation des données, ainsi que les différents types de variables et leurs représentations graphiques. Enfin, il présente des méthodes de calcul et de présentation des résultats, notamment à travers des tableaux de distribution et des histogrammes.

Transféré par

wiameelhabti
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
3 vues94 pages

Introduction à la Statistique et Méthodes

Le document traite des concepts fondamentaux de la statistique, y compris la statistique descriptive et inférentielle, ainsi que les étapes d'une étude statistique. Il aborde la collecte, l'analyse et l'interprétation des données, ainsi que les différents types de variables et leurs représentations graphiques. Enfin, il présente des méthodes de calcul et de présentation des résultats, notamment à travers des tableaux de distribution et des histogrammes.

Transféré par

wiameelhabti
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Statistique

Table de Matières
• Statistique descriptive
• Échantillonnage
• Estimation
• intervalle de confiance
• Test d’hypothèse
• Régression linéaire
• Simulation sous logiciels R, SPSS et SAS

2
Statistique
Descriptive
POURQUOI ÉTUDIER LA
STATISTIQUE ?

✓Présenter des données.

✓Décrire des données

✓Tirer des conclusions sur des populations à


partir de calculs conduits sur des échantillons.

✓Faire de “bonnes” prévisions.


4
LES ÉTAPES D'UNE ÉTUDE STATISTIQUE

❖ Collecte des données : Des observations sont effectuées au


sein d'une population, relativement à un caractère ou une
variable, les résultats constituent une série statistique.
❖ Analyse des données : Il s'agit de la détermination de
paramètres statistiques qui permettent de caractériser la série
statistique.
❖ Interprétation des résultats : A l'aide de propriétés
mathématiques et en élaborant des tests pour une exploitation
des résultats.
5
Collecte des données Recensement

Sondage

Analyse des Statistique Descriptive


données

Inférence Statistique
Interprétation des
résultats

Prise de décisions
DEUX DOMAINES

Statistique descriptive: Organisation, présentation et


analyse des données en mettant les points importants en
évidence.

Statistique inférentielle: Raisonner par inférence,


prendre des décisions sur une population à partir d’un
échantillon.

7
ETUDE D'UN SEUL CARACTÈRE

8
DÉFINITIONS

Population
Ensemble de référence

Individu
Elément de la population x

Echantillon
Sous-ensemble
de la population.
9
POPULATION STATISTIQUE, UNITÉ
STATISTIQUE
✓ La population: ensemble constitué de:
▪Personnes, d’individus
▪Entités collectives
▪Objets matériels ou immatériels
▪Actions de situations

✓ l’unité statistique ou individu est l’unité sur laquelle porte


l’observation (élément de la population)

10
LES VARIABLES

C'est la propriété ou l'aspect singulier que l'on se propose


d'observer chez chaque individus de la population ou de
l'échantillon.

11
NATURE DES VARIABLES

Observables Mesurables
VARIABLES

Qualitatives Quantitatives

Nominales Ordinales Discrètes Continues

-N. d’enfants
- Sexe -Situation socioprof -N. de bactéries -Taille
-Couleur -Niveau d’étude -N. d’assurés -Poids
-Ville d’origine -Appréciation -N. de salariés -Taux de glucose
-Type de Culture -…etc. -N. de patients -Durée de vie
-…etc. -…etc. -.
12
Echelles de mesure
variable

qualitative quantitative

Echelle Echelle Echelle Echelle


nominale ordinale d’intervalle de rapport

13
REPRÉSENTATION DES DONNÉES

Plusieurs niveaux de description statistique :


– Présentation brute des données,

– Présentations par tableaux numériques,

– Représentations graphiques

– Résumés numériques fournis par un petit nombre de


paramètres caractéristiques.

14
DONNÉES BRUTES

✓ Définitions

On appelle données brutes ou tableau élémentaire le


tableau relevant pour chaque unité statistique la
modalité de la variable étudiée.

15
DONNÉES BRUTES
• Données brutes
– tableau regroupant les valeurs des différentes variables
pour chaque individu

variables

No Sexe Année Année de Boursier


Naissance première inscription
1 M 1996 2014 Oui
individus

2 M 1995 2013 Non


3 F 1996 2014 Non
4 F 1994 2013 Non
UN TABLEAU DE DONNÉES BRUTES
NUMERO SALAIRE SEXE AGE ANC NIVEAU
1 129472 F 42 3 B
2 212696 M 54 10 B
3 210888 M 47 10 A
4 213692 M 47 1 B
5 202408 M 44 5 B
6 196132 M 42 10 A
7 97580 M 30 5 A
8 97580 F 52 6 A
9 172496 M 48 8 A
10 95900 F 58 4 A
11 212696 M 46 4 C
12 234060 M 36 8 C
13 225176 M 49 10 B
14 197532 F 55 10 B
15 179536 M 41 1 A
16 213716 F 52 5 B
17 186296 M 57 8 A
18 235872 F 61 10 B
19 212696 M 50 5 A
20 214508 M 47 10 B
21 196132 M 54 5 B
22 219924 M 47 7 A
23 250120 M 50 10 B
24 110100 F 38 3 A
25 97580 M 31 5 A
26 227536 M 47 10 A
17
LE TRI À PLAT

Le tri à plat est la transformation qui permet de passer


du tableau des données brutes au tableau de la
distribution statistique présentant les modalités et les
effectifs, les modalités étant classées par ordre
croissant. (si la variable est ordinale ou si elle est
quantitative)

18
TRI À PLAT

On compte le nombre d’individus par modalité ou


valeur
– Ce nombre est l’effectif ou la fréquence absolue de
chaque modalité
– L’opération s’appelle tri à plat
TABLEAUX DE DISTRIBUTION

Le tableau de distribution de fréquences est un mode


synthétique de présentation des données. Sa constitution est
immédiate dans le cas d’un caractère discret mais nécessite en
revanche une transformation des données dans le cas d’un
caractère continu.

20
EFFECTIF D’UNE MODALITÉ

On appelle effectif de la modalité xi, le nombre n i de fois que


cette modalité est observée

n = N i

N est l’effectif total

21
FRÉQUENCE D’UNE MODALITÉ

On appelle fréquence de la modalité xi, le nombre f i tel que

fi = n i

 f =1
i
i

( 0  f  1) i

22
EXEMPLE TABLEAU DE
DISTRIBUTION

Niveau Effectifs Fréquences


A 13 0,5
B 11 0,42
C 2 0,08
Total 26 1
Exemple l’effectif de la modalité A est 13 et la fréquence de
cette modalité est 0,5

23
EFFECTIF CUMULÉ CROISSANT;
DÉCROISSANT
Définition
Quand les valeurs d’un caractère quantitatif sont rangées dans l’ordre
croissant,
-L’effectif cumulé croissant d’une valeur est la somme des effectifs des valeurs
inférieures ou égales à cette valeur,
- L’effectif cumulé décroissant d’une valeur est la somme des effectifs des
valeurs supérieures ou égales à cette valeur,

24
LA FRÉQUENCE CUMULÉE CROISSANTE,
DÉCROISSANTE
Quand les valeurs d’un caractère quantitatif sont rangées dans l’ordre
croissant,
-La fréquence cumulée croissante d’une valeur est la somme des fréquences
des valeurs inférieures ou égales à cette valeur.
-La fréquence cumulée décroissante d’une valeur est la somme des
fréquences des valeurs supérieures ou égales à cette valeur.

25
REPRÉSENTATIONS GRAPHIQUES
Les représentations graphiques ont l’avantage de renseigner
immédiatement sur l’allure générale de la distribution. Elles
facilitent l’interprétation des données recueillies.

26
REPRÉSENTATION GRAPHIQUES
Caractères qualitatifs
•Tuyaux d’orgue
•Diagrammes circulaires
•Cartogrammes

27
REPRÉSENTATION GRAPHIQUES
Caractères quantitatifs
❖Variable discrète
•Diagramme en bâton
•Polygone des fréquences
•Courbe cumulative
❖Variable continue
•Histogramme
•Polygone des fréquences
•Courbe cumulative
28
DIAGRAMME CIRCULAIRE

Niveau d'étude
8%

A
50% B
42% C

fréquences
niveau effectifs fréquences en %
A 13 0,5 50%
B 11 0,42 42%
C 2 0,08 8%
total 26 1 100%
29
DIAGRAMME EN TUYAUX D’ORGUE
60%
50%
40% A
30%
B
20%
C
10%
0%
A B C

fréquences
niveau effectifs fréquences en %
A 13 0,5 50%
B 11 0,42 42%
C 2 0,08 8%
total 26 1 100%
30
CARACTÈRE QUANTITATIF

• Mesurable, on peut faire des calculs

• Il est soit discret, soit continu

31
VARIABLES DISCRÈTES
diagramme différentiel

Diagramme en bâtons

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

32
VARIABLES DISCRÈTES
diagramme intégral

33
DISTRIBUTION DES DONNÉES POUR UN
CARACTÈRE QUANTITATIF CONTINU

• Lorsque la taille de l’échantillon ou l’unité d’arrondi


sont relativement grandes et les données recueillies
sont nombreuses étalées sur un large intervalle de
valeurs on procède alors à un regroupement des
données à l’intérieur de « classes » .

34
RÈGLES RÉGISSANT LE REGROUPEMENT
DES DONNÉES EN CLASSE (SUITE):

• Choisir les extrémités du classement (la borne


inférieure de la première classe et la borne
supérieure de la dernière classe) de manière à
ne pas créer de distorsion importante avec
l’ensemble des données.
• Choisir des bornes qui, autant que possible,
permettront des calculs simples.

35
HISTOGRAMME
CLASSES DE MÊME AMPLITUDE

• Repère orthogonal et modalités du caractère placées


sur l’axe des abscisses

• Chaque classe est représentée par un rectangle dont


l’aire est proportionnelle à l’effectif de la classe
concernée .
• Toutes les bases ont la même dimension donc les
« hauteurs » des rectangles sont proportionnelles aux
effectifs.
36
REPRÉSENTATION GRAPHIQUE

Histogramme pour la distribution des valeurs totales


26

20

15
Effectif

12

10 9
6 6

2
1 1 1
0

60 100 140 180 220 260 300 340 380 420 460
Valeurs (en milliers $)

37
REPRÉSENTATION GRAPHIQUE

Polygone de fréquences

20
Effectif

10

40 80 120 160 200 240 280 320 360 400 440 480
Valeurs totales (en milliers $)

38
HISTOGRAMME
CLASSES D’AMPLITUDES DIFFÉRENTES
• Les bases des rectangles n’ont pas toutes la même longueur.
• Les aires des rectangles sont proportionnelles aux effectifs des classes.
• L’histogramme se construit dans un repère orthogonal en portant sur
l’axe des abscisses les bornes des classes et en ordonnée des nombres
« hauteurs » des rectangles proportionnels aux densités d’effectifs
(effectif/amplitude).
le coefficient de proportionnalité choisi est souvent min(Li) qui est alors
l’unité d’amplitude de classe.

39
HISTOGRAMME

Ancienneté du personnel cadre d’une entreprise 40


VARIABLE CONTINUE
DIAGRAMME INTÉGRAL

41
CARACTÉRISTIQUES
D’UNE SÉRIE STATISTIQUE

42
LES PARAMÈTRES DE POSITION

Mode, Moyenne, Médiane

43
CLASSE MODALE, MODE

• Mode : modalité d’effectif maximal, donc représentée par


une barre de hauteur maximale.

• Classe modale : est une classe de densité maximale

44
CLASSE MODALE, MODE

Une classe modale est donc une classe pour laquelle le quotient
(effectif/amplitude) est maximal alors que pour des classes
d’amplitudes égales ou pour les variables discrètes, les
classes modales ou les modes correspondent aux effectifs
maxima.
Remarque : le quotient effectif/amplitude s’appelle la densité
d’effectif de la classe.
• Il peut exister plusieurs modes ou plusieurs classes modales.

45
CALCUL DU MODE
CAS D’UNE VARIABLE CONTINUE

 i 
= +  
ai  +  
Mo L
 i  s 

46
CLASSE MODALE, MODE

• L: borne inférieure de la classe modale

• ai : amplitude de la classe modale


∆i : différence entre le nombre d’observations (ou la fréquence)
de la classe modale et de la classe pré-modale (si les amplitudes
sont différentes on prend la densité de fréquence)

• ∆s : différence entre le nombre d’observations (ou la fréquence)


de la classe modale et de la classe post-modale (si les
amplitudes sont différentes on prend la densité de fréquence)

47
CONSTRUCTION DU MODE

48
EXEMPLE 1
Déterminer la classe modale et Calculer le mode de
la distribution suivante

Distribution de l’âge des clients rentrant dans un magasin


49
Réponse 1
Effectif
35 ai
30

25

20

15 ∆i ∆s
10

0
[10,15] [15,20] [20,25] [25,30] [30,35]
Effectif
L
M0

M0=L+ai(∆i/(∆i+ ∆s))=25+5(15/15+23)=26,97

50
EXEMPLE 2
Déterminer la classe modale de la distribution suivante
et calculer le mode

densité
Classes Effectifs fréquence Amplitude d'effectif
[10;15[ 10 0,125 5 2
[15;25[ 18 0,225 10 1,8
[25;30[ 15 0,1875 5 3
[30;50[ 30 0,375 20 1,5
[50;55[ 7 0,0875 5 1,4
Total 80 1

51
Réponse 2
Effectif
35
30
25
20 ai ∆s
15 ∆i
10
5
0
[10,15] [15,25]
L [25,30] [30,50] [50,55]
Effectif

M0

M0=L+ai(∆i/(∆i+ ∆s))=25+5(3/(3+15)=25,83333

52
LA MOYENNE D’UNE SÉRIE
STATISTIQUE
• La moyenne d'une série statistique est une mesure
de tendance centrale de la variable étudiée.
• Il existe plusieurs types de moyenne:
– La moyenne arithmétique
– La moyenne arithmétique pondérée
– La moyenne géométrique
– La moyenne quadratique
– La moyenne harmonique

53
LA MOYENNE ARITHMÉTIQUE

La moyenne arithmétique est la plus ancienne méthode employée


pour caractériser un ensemble de données et indiquer une tendance
centrale.
La moyenne arithmétique est la somme des observations divisée
par le nombre n d'observations :

54
LA MOYENNE ARITHMÉTIQUE

Moyenne arithmétique classique :

Dans une classe, la répartition des notes à un contrôle sont : 4, 5, 4,


8, 10, 7, 9, 6, 5, 2.

La somme de ces notes : 4+5+4+8+10+7+9+6+5+2 = 60

Sur 10 observations, la moyenne est donc 60 / 10 = 6.

55
LA MOYENNE ARITHMÉTIQUE
La moyenne arithmétique pondérée:
Soit x1, x2, … xi;….xk une série statistique où chacune
des valeurs élémentaire xi est répétée ni fois (sa fréquence
étant fi).

1 k
X = m =  i =1ni xi =  i =1 f i xi
k

N
Si les données sont organisées en classes de centre c i et de
fréquences fi, on aura :
1 k
X = m =  i =1ni ci =  i =1 f i ci
k

N 56
LA MOYENNE ARITHMÉTIQUE
Matière Coefficient note notes coefficientées
Français 4 12 4x 12= 48
maths 4 8 4x 8 = 32
Langue vivante 1 5 1 x5 = 5
EPS 1 14 1 x14 = 14
Enseignement 10 9,5 10 x9,5 = 95
professionnel
Total des coefficients : 4 +4 + 1
+ 1 + 10 = 20
Total des notes coefficientées : 194
Moyenne pondérée : 194/20 = 9,7 soit la note est de
9,7 / 20
57
LA MÉDIANE

La médiane est la valeur du caractère étudié


qui partage en deux parties égales de l’effectif total

50 % de l’effectif total 50 % de l’effectif total

Effectif correspondant à
la médiane de la série

58
MÉDIANE
Définition : Soit S une série statistique quantitative
discrète à une variable, de taille n, n  *, définie
par S = {si}1  i  n, ordonnée dans l’ordre croissant.
On appelle médiane de S tout réel m tel que au
moins 50 % des valeurs de la série sont
supérieures ou égales à m et au moins 50 % des
valeurs de la série sont inférieures ou égales à m.

59
MÉDIANE
• Quand la série est discrète,
on range les valeurs de la série par ordre croissant, chacune d'entre
elles étant répétée autant de fois que son effectif.
Si l'effectif total n est un nombre impair, la médiane est le terme de
rang (n+1)/2
Si l'effectif total n est un nombre pair, la médiane est le centre de
l'intervalle formé par les termes de rang n/2 et (n/2)+1 .
• Quand la série est regroupée par classes,
on détermine la médiane par interpolation linéaire à partir de la
courbe des effectifs ou des fréquences cumulées.
60
DANS LE CAS D’UN CARACTÈRE CONTINU
Exemple 3

Durée Nombre
en h d'élèves ECC ECD Fréquences FCC FCD
[0,4[ 40 40 620 0,065 0,065 1
[4;8[ 80 120 580 0,129 0,194 0,935
[8;12[ 160 280 500 0,258 0,452 0,806
[12;20[ 200 480 340 0,323 0,774 0,548
[20;28[ 140 620 140 0,226 1,000 0,226
620 1

61
POUR DÉTERMINER GRAPHIQUEMENT
LA MÉDIANE :

On trace la courbe des ECC(effectifs cumulés croissants),

ou la courbe des ECD (effectifs cumulés décroissants),.


On trace la droite horizontale passant par
le point d’ordonnée N/2 (la moitié de l’effectif total)
L’abscisse du point d’intersection de droite

horizontale et du polygone des ECC(ECD)

donne la valeur de la médiane.

62
DÉTERMINATION DE LA MÉDIANE
Exemple 4
Effectifs ( n i )
x Simples Cumulées Cumulées
i
Croissantes décroissantes
] 1000 - 1500 ] 6 6 65
] 1500 - 2000 ] 12 18 59
] 2000 - 2500 ] 25 43 47
] 2 500 - 3000] 17 60 22
] 3000 - 3500 ] 5 65 5
65

63
DÉTERMINATION GRAPHIQUE DE LA
MÉDIANE EXEMPLE

64
DÉTERMINATION GRAPHIQUE DE LA
MÉDIANE 2E MÉTHODE

65
LES QUARTILES

66
LE PREMIER QUARTILES

• Le premier quartile, noté Q1, est une valeur de la


série; telle que 25 % au moins des valeurs de la
série sont inférieures ou égales à Q1; et telle que
75% au moins des valeurs de la série sont
supérieures ou égales à Q1.

67
LE TROISIÈME QUARTILE

• Le troisième quartile, noté Q3, est : une valeur de la


série; telle que 75% au moins des valeurs de la série
sont inférieures ou égales à Q3; et telle que 25% au
moins des valeurs de la série sont supérieures ou
égales à Q3

68
QUARTILE CAS DISCRET
N= Q1 Q2 Q3
N = 4n entre la valeur de rang entre la valeur de entre la valeur de
n et celle de rang n+1 rang 2n et celle de rang 3n et celle de
rang 2n+1 rang 3n+1
N = 4n + 1 entre la valeur de rang la valeur de rang entre la valeur de
n et celle de rang n+1 2n+1 rang 3n+1et celle
de rang 3n+2
N = 4n + 2 la valeur de rang n+1 entre la valeur de la valeur de rang
rang 2n+1 et celle 3n+2
de rang 2n+2
N = 4n + 3 la valeur de rang n+1 la valeur de rang la valeur de rang
2n+2 3n+3

69
LES QUARTILES
(cas de regroupement en classes)

 N − Ecum 
Q = L+ 4 a
prcdt

1
 Eff 
 classeQ1

 3 N − Ecum 
Q = L+  4 prcdt
a
3
 Eff 
 classe . Q3

LE DEUXIÈME QUARTILE

• Le deuxième quartile par définition est la médiane.


• Cas de données groupées en classes:

 N − Effcum prcdt 
Md = L +  2  a
 Eff 
 classe − médiane

71
CARACTÉRISTIQUES DE FORME
• Mesure de l’asymétrie
Les courbes suivantes donnent une idée sur la forme d’une
distribution de données:

72
MESURE DE L’ASYMÉTRIE

Certains coefficients (indices) permettent de situer la distribution


dans un des trois cas précédents:
1. Coefficient de Yule:
(Q 3 − M) − (M − Q 1 )
S=
(Q 3 − M) + (M − Q 1 )
 S = 0 symétrie


 S 0 Courbe étalée à droite
 Courbe étalée à gauche

 S  0
73
MESURE DE L’ASYMÉTRIE

2. Coefficient de Pearson:

( X − M0 )
S=
σ
 S = 0 symétrie


 S 0 Courbe étalée à droite


 S 0 Courbe étalée à gauche

74
PARAMÈTRES DE DISPERSION

75
L’ESPÉRANCE

Dans le cas discret

Dans le cas continu

76
LA COVARIANCE
Définition

Si X et Y sont indépendantes alors

77
LE COEFICIENT DE CORRELATION

Cov( X , Y )
Cor ( X , Y ) =
 ( x) ( y )

Si X et Y sont indépendantes alors

Cor ( X , Y ) = 0

78
LA VARIANCE

La Variance : d’une distribution est la


moyenne des carrés des écarts, par rapport à la
moyenne, de toutes les valeurs de celle-ci.

s =  (x − x )
1
2 2

n i

79
PARAMÈTRES DE DISPERSION
• Ecart-type

− x)
N

 n (x
2
i

s = i=1 i

N
1
n x − x
k

s=
2 2
i i

N i=1

80
INTERPRÉTATION DE L’ÉCART-TYPE

◼ En général, on retrouve :
◼ une grande proportion des données dans
l ’intervalle [  - s ,  + s ] (souvent entre 50 et
70%),
◼ souvent plus de 95% des données dans
l ’intervalle [  - 2s ,  + 2s ],
◼ toutes les données (ou presque 100%) dans
l ’intervalle [  - 3s ,  + 3s ].

81
EXEMPLE 5

• On a demandé à un groupe de 220 élèves de 10 à


17 ans combien d'heures ils ont regardé la
télévision chaque semaine pendant les vacances.
Leurs réponses ont été consignées dans le tableau
ci-dessous. À l'aide de cette information, calculez
la moyenne et l'écart-type des heures pendant
lesquelles les 220 élèves ont regardé la télévision.
82
EXEMPLE (SUITE)

Nombre d'heures pendant lesquelles les 220 élèves ont


regardé la télévision
Heures Nombre d'élèves
10–14 2
15–19 12
20–24 23
25–29 60
30–34 77
35–39 38
40–44 8
83
TABLEAU
Nombre d'heures passées devant la télévision
Heures Point Fréquence Ni x ci (x - m) (x -m )2 ni(x - m)2
milieu (ci) (ni)
10 à 14 12 2 24 -17,82 317,6 635,2
15 à 19 17 12 204 -12,82 164,4 1 972,8
20 à 24 22 23 506 -7,82 61,2 1 407,6
25 à 29 27 60 1 620 -2,82 8,0 480,0
30 à 34 32 77 2 464 2,18 4,8 369,6
35 à 39 37 38 1 406 7,18 51,6 1 960,8
40 à 44 42 8 336 12,18 148,4 1 187,2
220 6 560 8 013,2
84
Calcul de l’écart type

85
INTERVALLE
• Toutes les données (ou presque 100%) dans
l ’intervalle [  - 3 ,  + 3 ]

• 29,82 - (3 x 6,03) < x < 29,82 + (3 x 6,03)


29,82 - 18,09 < x < 29,82 + 18,09
11,73 < x < 47,89
• Cela signifie une certitude d'environ 99 % qu'un
élève passera entre 12 heures à 48 heures devant la
télévision.
86
REMARQUE

•Plus l’écart – type σ est grand, plus les valeurs du


caractère sont dispersées autour de la moyenne

•Plus il est petit, plus les valeurs du caractère


sont groupées autour de la moyenne

87
LE COEFFICIENT DE VARIATION

c’est le rapport entre l’écart type et la moyenne, il


permet de comparer le taux de dispersion entre
distributions, car il est sans unité.

x
C.V = 100
x
Plus le coefficient de variation est petit, plus la série est
homogène. D’une manière générale, la population étudiée
est considérée homogène lorsque le CV < 15%.
88
DISPERSION AUTOUR DE LA MÉDIANE

Pour mesurer la dispersion autour de la médiane

On calcule:
• l’intervalle interquartile : [Q1;Q3 ]
• l’écart interquartile la différence Q3 – Q1.

contient environ 50 % des valeurs de la série.

89
DIAGRAMME À MOUSTACHE

Elle est due à JW. Tukey et est appelée « box plot »


en anglais.

90
REMARQUES

Une boîte avec des "pattes" courtes indique que la série


est assez concentrée autour de sa médiane.
Au contraire des "pattes" longues indique que la série
est assez dispersée.

Le graphique est parfois fait en dessinant des pattes


correspondant au 1er et au 99ème centile, ou même
aux valeurs extrêmes

91
VALEURS ABERRANTES

92
DIAGRAMME À MOUSTACHE
(suite)

Il est utilisé principalement pour comparer un


même caractère dans deux populations de tailles
différentes

93
DIAGRAMME À MOUSTACHE
(suite)
Les valeurs généralement représentées sont :
•le minimum (m),
•le premier décile (D1),
•le premier quartile (Q1),
•la médiane (Med=Q2),
•le troisième quartile (Q3),
•le neuvième décile (D9),
•le maximum (M).

94

Vous aimerez peut-être aussi