Cours de Probabilité et Statistique
Cours de Probabilité et Statistique
JOUDAR Nour-Eddine
[Link]@[Link]
2022/2023
1
Sommaire
1 Introduction
2 Statistique descriptive
3 Probabilité
3.1 Probabilité conditionnelle
3.2 Variables aléatoires multidimensionnels
3.3 Lois usuelles
• Définition
Ajustement
La statistique
Estimation
• C'est l'art de recueillir, présenter, analyser et utiliser des observations
(des données) afin d'aider à la prise de décisions et à la résolution de
problèmes.
• Le premier phénomène qui ressort des observations: la variabilité des
données.
3
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Introduction
Exemple
4
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Introduction
Statistique
Introduction
5
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Introduction
• Comment faire une étude statistique?
Recensement
Collecte des données
Introduction
Sondage
Statistique
Descriptive
Statistique Descriptive
Analyse des données
Probabilité
Estimation Conclusions
6
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Partie 1
Statistique descriptive
Ajustement
Caractère : On appelle caractère (ou variable statistique, dénotée V.S) toute
application X : Ω → C.
Estimation
L’ensemble C est dit : ensemble des valeurs du caractère X (c’est ce qui est
mesuré ou observé sur les individus)
Exemples: Taille, température, nationalité, couleur des yeux
8
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: Vocabulaire
Types des variables
Variable statistique
Introduction
Qualitative Quantitative
Statistique
Descriptive Ses valeurs sont des nombres
Ses valeurs peuvent être des
états, des opinions, des réels et correspondent à des
Probabilité propriétés,... des modalités qui quantités.
correspondent à des "qualités". Taille, âge,...
Ajustement
Couleur, lettre alphabétique,...
Discrète Continue
Estimation
Statistique x1 n 1 f 1 N1 F1
Descriptive
Estimation xp n p f p Np Fp
S1p n 1
11
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: variables
Étude d’une série statistique à variable continue
• Les valeurs sont mises en classes.
• Leurs valeurs extrêmes sont appelées bornes des classes.
Introduction
• Les classes sont mutuellement exclusives.
Statistique • L'amplitude de la classe ou intervalle ou module de classe :
Descriptive = borne supérieure - la borne inférieure.
• Le point central ou encore point médian est situé à mi chemin entre les
bornes.
Probabilité
Ajustement
• L'intervalle de classe est généralement constant, toutefois, on utilise parfois une
amplitude variable notamment pour les classes des valeurs extrêmes.
Estimation • En cas de classes d'amplitudes différentes, la densité de fréquence ni/ Di
permet de comparer les effectifs ou les fréquences d'une classe à l'autre.
• la densité de fréquence est utilisée pour tracer l’histogramme.
12
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: variables
Étude d’une série statistique a variable continue
Classe Ci ni fi Ni Fi
[140-160[ 150,0 10 0,05 10 0,05
Introduction
[160-165[ 162,5 20 0,10 30 0,15 Pour les calculs, le
[165-170[ 167,5 30 0,15 60 0,30 centre de classe Ci est
Statistique utilisé en remplacement
[170-175[ 172,5 45 0,23 105 0,53
Descriptive de xi
[175-180[ 177,5 40 0,20 145 0,73
[180-185[ 182,5 35 0,18 180 0,90
Probabilité
[185-190[ 187,5 15 0,08 195 0,98
[190-200[ 195,0 5 0,03 200 1,00
Ajustement
Remarque
• Pour les calculs des paramètres statistiques usuels des données quantitatives et uniquement de
Estimation ce type de données.
• On complète la distribution par :
• Une colonne ni * xi pour calculer le total,
• Une colonne ni * xi2 pour calculer le total des carrés.
13
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions non cumulées
• Données qualitatives :
Statistique • Diagramme sectoriel
Descriptive
Angle au centre proportionnel à ni (ou fi).
• Données quantitatives discrètes
Probabilité • Diagramme en bâtons
On trace parallèlement à l'axe des ordonnées, en regard
Ajustement des xi qui sont portés en abscisse, un segment de longueur
proportionnel à ni
• Polygone des fréquences
Estimation Ligne brisée joignant les bâtons.
Fréquences absolues / fréquences relatives.
14
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions non cumulées
15
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions non cumulées
Statistique
25
nombre nombre de
Descriptive d'enfants familles (ni) 20
(xi)
0 10 15
Probabilité
1 20
2 15 10
Ajustement 3 5
4 3 5
>4 0
0
Estimation
0 1 2 3 4 >4
16
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions non cumulées
Introduction
Distributions groupées
• Données quantitatives continues
Statistique
• Histogramme :
Descriptive
Composé de rectangles ayant comme base l'intervalle de
classe et comme hauteur la densité de fréquence (ni/Di).
Probabilité
La surface est proportionnelle à ni.
Ajustement
Estimation
17
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions non cumulées
Introduction
Histogramme
90
Statistique Densité
Descriptive 80
Classe ni (*10)
70
[140-160[ 10 5
60
Probabilité [160-165[ 20 40
50
[165-170[ 30 60
Ajustement
40
[170-175[ 45 90
30
[175-180[ 40 80
20
Estimation
[180-185[ 35 70
10
[185-190[ 15 30 0
[190-200[ 5 5 140 160 170 180 190 200
18
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions cumulées
Distributions cumulées
Introduction • Uniquement pour des données
quantitatives
• Polygone des fréquences :
Statistique
• Distributions non groupées =
Descriptive escalier.
• Distributions groupées = ligne
Probabilité
brisée.
• Histogrammes.
Ajustement
Estimation
19
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions cumulées
Asymétrie
Introduction L'asymétrie évalue dans quelle mesure vos données ne
sont pas symétriques. Qu'elle soit de 0, positive ou
Statistique négative, la valeur d'asymétrie fournit des informations
Descriptive sur la forme des données.
Probabilité
Ajustement
Estimation
20
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions cumulées
Introduction
Statistique
Descriptive
Probabilité
Ajustement
Estimation
21
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions cumulées
Aplatissement
Introduction L'aplatissement indique dans quelle mesure les queues
d'une loi diffèrent de la loi normale. Utilisez
Statistique l'aplatissement pour mieux comprendre dès le départ les
Descriptive caractéristiques générales de la distribution de vos
données.
Probabilité
Ajustement
Estimation
Introduction Application 2
Nombre Effectif de
d’enfants femmes
Statistique enquête réalisée auprès de 20 femmes
Descriptive casablancaises nées en 1970 sur le
nombre d’enfants qu’elles ont eus 0 1
Probabilité 1 3
2 5
Ajustement 1. Peut on représenter cette distribution en
3 5
classes? Si oui construire la table statistique
correspondante puis dresser un graphe 4 4
Estimation compatible? 5 2
23
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Introduction
Paramètres statistiques
Statistique
Descriptive Une série de données peut être résumée par quelques valeurs numériques
appelées caractéristiques des séries statistiques, classées en quatre grandes
catégories :
Probabilité
• Caractéristiques de tendance centrale (position).
2424
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: la moyenne
La moyenne se calcul en divisant la somme des valeurs par le nombre d'observations.
Introduction Propriétés
Moyen arithmétique:
Statistique
Descriptive La moyenne arithmétique permet de résumer par un seul nombre la série
statistique.
Probabilité • Elle prend en compte toutes les valeurs de la série et elle est facile à calculer.
• Elle est sensible aux valeurs extrêmes, il est parfois nécessaire de supprimer
Ajustement des valeurs extrêmes ou « aberrantes ».
• Mauvais résumé si la distribution est très dissymétrique.
Estimation • La quantité est l’écart de la valeur à la moyenne
arithmétique. La moyenne arithmétique des écarts est nulle.
Dans le cas continu, il suffit de remplacer les x par les centres des classes.
2525
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: le mode
Introduction Propriétés
Estimation
Introduction
Statistique
Descriptive
Probabilité
Ajustement
2727
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: les quantiles
Statistique Quartiles
Descriptive • Q1: 25% des valeurs sont inférieures au premier quartiles
• Q2: ou Médiane : 50% des valeurs sont inférieures au deuxième
Probabilité quartiles.
Ajustement
• Q3: 75% des valeurs sont inférieures au troisième quartiles.
2828
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: les quantiles
Introduction
Statistique
Descriptive
Probabilité
Ajustement
Estimation
2929
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: la médiane
811=2*405+1 Me=1
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,
3030
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: la Médiane
Introduction
Statistique
Descriptive
Probabilité
Ajustement
Estimation
Thalès
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,
3232
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: la Médiane
Estimation
Ces paramètres rendent compte de l'étalement des données. Cela permet de montrer si
Introduction
les données sont éloignées ou proches de la moyenne.
Variance
Introduction
Variance: noté , il s'agit de la moyenne des carrés des écarts ou variance empirique.
Il rend compte de l'éloignement de chaque valeur par rapport à la moyenne.
Statistique
Descriptive
Ajustement
Changement d’origine et d’échelle
Estimation
Écart type: il s'agit de la racine carré de la variance.
Écart type
Introduction
L’écart-type s caractérise la dispersion d’une série de valeurs. Plus s est petit, plus les
Statistique données sont regroupées autour de la moyenne arithmétique et plus la population est
Descriptive homogène.
L’écart-type permet de trouver le pourcentage de la population appartenant à un
intervalle centré sur l’espérance mathématique.
Probabilité
La variance tient compte de toutes les données, c’est la meilleure caractéristique de
dispersion (nombreuses applications en statistique).
Ajustement
Estimation
Coefficient de variation
Introduction
Coefficient de variation: Il s’exprime, sous la forme d’un pourcentage, par
l’expression suivante :
Statistique
Descriptive
Propriétés
• Le coefficient de variation ne dépend pas des unités choisies.
Probabilité • Il permet d’apprécier la représentativité de la moyenne arithmétique x par rapport à
l’ensemble des données.
• Il permet d’apprécier l’homogénéité de la distribution, une valeur du coefficient de
Ajustement variation inférieure à 15 % traduit une bonne homogénéité de la distribution.
• Il permet de comparer deux distributions, même si les données ne sont pas exprimées
avec la même unité ou si les moyennes arithmétiques des deux séries sont très
Estimation différentes.
Exemple: Une distribution a une moyenne de 10 et un écart-type de 1 (Cv= 10 %), elle
sera beaucoup plus dispersée qu'une distribution de moyenne 1000 et d'écart-type 10
(Cv de 1 %).
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,
3737
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de forme: symétrie
Symétrie-asymétrie
Introduction
Une distribution est symétrique si les valeurs de la variable statistique sont également
distribuées de part et d’autre d’une valeur centrale. Pour une distribution symétrique :
Statistique
Descriptive mode = médiane = moyenne arithmétique
Ajustement
Symétrie-asymétrie
Introduction
Ces deux coefficients sont principalement utilisés pour vérifier qu’une distribution
est proche d’une distribution normale (loi de Laplace-Gauss) ; en effet, pour une telle
Statistique
loi, le coefficient d’aplatissement est égal à 3 et le coefficient d’asymétrie à 0. Selon
Descriptive
la valeur de ces coefficients, on peut donner quelques caractéristiques sur la forme de
la distribution :
Probabilité • Si > 0, la distribution est étalée vers la droite.
• Si < 0, la distribution est étalée vers la gauche.
Ajustement • Si = 0, on ne peut pas conclure que la distribution est symétrique mais la
réciproque est vraie.
• Si > 3, la distribution est moins aplatie qu’une distribution gaussienne.
Estimation
• Si < 3, la distribution est plus aplatie qu’une distribution gaussienne.
Symétrie-asymétrie
Introduction
Statistique
Descriptive
Probabilité
Ajustement
Estimation
Concentration
Introduction
La courbe de concentration est réalisée à partir des calculs des fréquences cumulées croissantes
et des masses cumulées croissantes.
Statistique Les fréquences cumulées croissantes sont placées en abscisses et les masses cumulées
Descriptive croissantes sont placées en ordonnées.
La distribution théorique d'égale répartition correspond à la bissectrice du repère.
L'aire comprise entre la distribution théorique et la courbe de concentration s'appelle la surface
Probabilité de concentration.
Ajustement
Estimation
Concentration
Introduction Courbe de Lorentz
Statistique
Descriptive
Probabilité
Ajustement
Estimation
Concentration
Introduction
Il s’exprime par
Statistique
Descriptive
Ou
Probabilité
Ajustement
Symétrie-asymétrie
Introduction
Statistique
Descriptive
Probabilité
Ajustement
Estimation
Statistique
Descriptive
Probabilité
Exemple: Une distribution a une moyenne de 10 et un écart-type de 1 (Cv= 10 %), elle
Ajustement sera beaucoup plus dispersée qu'une distribution de moyenne 1000 et d'écart-type 10
(Cv de 1 %).
Estimation
Statistique
Descriptive
Probabilité
Ajustement
Estimation
Statistique
Descriptive
Probabilité
Ajustement
Estimation
Estimation
Introduction
Objectifs
Ajustement
Estimation
Probabilité
Nuage des points
Ajustement
Estimation
Introduction
Les variables x et y peuvent être analysées séparément. On peut calculer
tous les paramètres dont les moyennes et les variances :
Statistique
Descriptive Nuage des points
Probabilité
Ajustement
Estimation
Ces paramètres sont appelés paramètres marginaux : variances marginales,
moyennes
marginales, écarts-types marginaux, quantiles marginaux, etc.. . .
Probabilité
• La covariance peut prendre des valeurs positives, négatives ou nulles.
Ajustement • Quand Xi = Yi, pour tout i = 1, . . . , n, la covariance est égale a la variance.
• On peut également l’écrire sous cette forme:
Covariance
Estimation
Introduction Le coefficient de corrélation est la covariance divisée par les deux écart-
types marginaux :
Statistique Le coefficient de détermination est le carré du coefficient de corrélation :
Descriptive
Covariance de coorelation et de détermination
Probabilité
Ajustement
Estimation
Statistique
Descriptive
• Si le coefficient de corrélation est positif, les points sont alignés le long
Probabilité d’une droite croissante.
• Si le coefficient de corrélation est négatif, les points sont alignés le long d’une
Ajustement droite décroissante.
• Si le coefficient de corrélation est nul ou proche de zéro, il n’y a pas de
• dépendance linéaire. On peut cependant avoir une dépendance non-linéaire avec un
Estimation coefficient de corrélation nul
Statistique
Descriptive
Probabilité
Ajustement
Estimation
Statistique
Descriptive
La solution de ce problème est donnée par:
Ajustement
Probabilité
Estimation
Probabilité
Estimation
Ajustement
Probabilité
Estimation
Statistique
Descriptive 𝑥∗
Ajustement
Cas de deux variables.
Probabilité
Estimation
Statistique
Descriptive 𝑥∗
Ajustement
Probabilité
Estimation
Statistique
Descriptive
Ajustement
Probabilité
Estimation
Statistique
Descriptive
Ajustement
Probabilité
Estimation