LED Chapitre III : Statistiques descriptives Classe : 2nd 15
I. Vocabulaire
1) Définition :
Une enquête statistique porte sur un ensemble de personnes ou d’objets :
– Cet ensemble est appelé population.
– Le nombre de personnes (ou d’objets) de cet ensemble est appelé effectif total.
– Chacun des éléments de l’ensemble est un individu.
– On étudie une (ou plusieurs) particularité de la population. Cette particularité est
appelée caractère, ou variable ; dont on étudie les valeurs ou modalités.
2) Exemple 1. On étudie la couleur des yeux à Djibouti :
Population : la population Djiboutienne.
Individus : les Djiboutiens.
Caractère : la couleur des yeux.
Modalités : bleu, noir, vert, marron...
Il s’agit d’une série statistique qualitative.
3) Exemple 2. On étudie les notes d’un Devoir Surveillé en classe de seconde :
Population : la classe de seconde.
Individus : les élèves de la classe.
Caractère : la note obtenue au Devoir Surveillé.
Valeurs : 0 ; 0,5 ; 1 ; 1,5 ... 19,5 ; 20.
Il s’agit d’une série statistique quantitative.
II. Effectifs et fréquences
1. Effectifs et fréquences
a) Définition
L’effectif ni d’une valeur du caractère est le nombre d’individus de la population
correspondant à cette valeur.
– La fréquence ƒi d’une valeur du caractère est le quotient de l’effectif de cette valeur
par l’effectif total. On a donc :
effectif de la valeur (ni)
fréquence ( ƒi ) =effectif total (N ) .
On rappelle que N= n1 + n2 + n3………+ n p
b) Propriété
La fréquence est un nombre compris entre 0 et 1. 0≤ ƒi ≤1
c) Démonstration
N est l’effectif total, N= n 1 +n 2+n 3………+n p, Donc pour tout i compris entre 1 et p on a 0 ≤ ni ≤ N
0 ni N ni
ƒi
d’où N ≤ N ≤ N , on a 0 ≤ N ≤ 1. Donc 0 ≤ ≤ 1.
On conclut que la fréquence est un nombre compris entre 0 et 1.
1
2. Effectifs et fréquences cumulé(e)s croissant(e)s et/ou décroissant(e)s.
a) Définition
L’effectif cumulé croissant en xi (respectivement fréquence cumulée
croissante) est égal à la somme des effectifs (respectivement fréquences) des
valeurs inférieures ou égales à xi.
b) Exemple
Un centre animalier a répertorie le nombre de chatons nés sur 50 portées :
Nombre de chatons 3 4 5 6 7 8 9
Fréquence
0.04 0.14 0.22 0.16 0.24 0.1 0.06
4
1. Quelle est la population, le caractère étudié, ses valeurs possibles et type du caractère.
2. Calculer les fréquences cumulées croissantes de la série.
Solution
1. La population est constituée _ _ _ _ _ _ _ _ _ _ _ _ _ _
Le caractère étudié est _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
Les valeurs possibles _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
Le caractère est _ _ _ _ _ _ _ _ _ _ _ _ _ ( _ _ _ _ _ _ _ _ _ car les résultats sont des nombres
et discret car il y a 7 résultats possibles).
2.
Nombre de chatons
3 4 5 6 7 8 9
Fréquence
0.04 0.14 0.22 0.16 0.24 0.14 0.06
Fréquence cumulées
croissantes 0.04 0.18
3. Nuage de points
Un nuage de points est un ensemble des points du plan ayant comme abscisse une valeur du
caractère et comme ordonnée l’effectif ou la fréquence lui correspondant.
Exemple : le tableau ci-dessous donne la taille en cm des enfants âges de 2 à 4 ans de trois
crèches.
2
III. Mesure de tendance centrale
1) La moyenne
a) Définition
La moyenne d’une liste de valeur xi et d’effectif total N est donnée par la formule.
p
∑ xi
x 1+x 2+x 3+. .. .. . .. .. . .+xn = i =1
x= N = N
moyenne d’une série quantitative est la somme des produits des caractères xi par l’effectif ni,
La
p
∑ xi∗ni
x 1 *n1 +x2*n2+x3 . .. .. . .. .. xp*np
= i =1
divisé par l’effectif total N : x = = N N
On peut aussi calculer une moyenne à partir de la distribution de fréquences :
p
x = f1*x1 + f2*x2 + · · · + fp*xp = i=1
∑ x 1∗f 1
b) Propriété (Linéarité de la moyenne)
o Si on ajoute (ou soustrait) un même nombre k à toutes les valeurs d’une série, alors
la moyenne de cette série se trouve augmentée (resp. diminuée) de k.
o Si on multiplie (ou divise) par un même nombre non nul k toutes les valeurs d’une
série, alors la moyenne de cette série se trouve multipliée (resp. divisée) par k.
c) Propriété 2 (Moyenne par sous-groupes)
Soit une série statistique, d’effectif total N, de moyenne x.
Si on divise cette série en deux sous-groupes disjoints d’effectifs respectifs p et q (avec
p + q = N) de moyennes respectives x1 et x2, alors on a :
P∗x +Q∗ y
x = P∗Q
3
2) La médiane
Définition
On considère une série statistique dont les valeurs du caractère étudié ont été rangés dans
l’ordre croissant : x1 ≤ x2 ≤ x3 ≤ · · · ≤ xn.
On appelle médiane la valeur centrale de cette série, c’est-à-dire celle qui la sépare en deux
parties de même effectif. On la note : Me.
Remarque:
a) Si l’effectif total est impair, la médiane correspond à la valeur centrale.
Si l’effectif total est pair, la médiane correspond à la demi - somme des deux valeurs
centrales.
b) Au moins 50 % des valeurs de la série sont inférieures (ou égales) à la médiane et au moins
50 % des valeurs de la série lui sont supérieures (ou égales).
c) La médiane est beaucoup moins sensible aux valeurs extrêmes que la moyenne.
Exemple :
On étudie l’âge des professeurs de deux collèges
Collège A : 30 ;28 ;47 ;30 ;44 ;60 ;50 ;26 ;29 ;37 ;30 ;29 ;58 ;59 ;28 ;
Collège B : 35 ;37 ;50 ;24 ;42 ;24 ;36 ;52 ;43 ;27 ;55 ;49 ;41 ;24 ;39 ;46.
1) Calculer la moyenne d’âge des professeurs du collège A. puis du collège B.
2) Déterminer la valeur médiane de l’âge les professeurs du collège A, puis du collège B.
3) Les quartiles
Définition
On considère une série statistique dont les valeurs du caractère étudié ont été rangés dans
l’ordre croissant : x1 ≤ x2 ≤ x3 ≤ · · · ≤ xn.
1. Le premier quartile est la plus petite valeur Q1 de la liste telle qu’au moins 25 % des
valeurs de la liste sont inférieures ou égales à Q1.
2. Le troisième quartile est la plus petite valeur Q3 de la liste telle qu’au moins 75 % des
valeurs de la liste sont inférieures ou égales à Q3.
3) Calculer les quartiles Q1 et Q3 de la série du collège A. puis du collège B.
4) Mesure de dispersion
L’étendue d’une série statistique est la différence entre la plus grande valeur et la plus petite
valeur. e= xmax - xmin
On appelle écart interquartile la quantité : (Q3 − Q1).
4) Calculer l’écart interquartile du collège A. puis collège B.
4
5) Diagramme en boite
Exemple : Pour une série statistique donnée, on a les caractéristiques suivantes :
Xmin Q1 Me Q3 Xmax
5 6 7.5 12 15
Le diagramme en boite coorspondant est:
Xmin Q Xmax
1 Me Q3
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 x