0% ont trouvé ce document utile (0 vote)
115 vues67 pages

Cours de Probabilité et Statistique

Le document présente un cours sur la probabilité et la statistique. Il introduit les concepts clés de la statistique descriptive comme les variables, les populations et les échantillons. Différentes mesures statistiques sont également décrites.

Transféré par

Mohamed Taha MESBANE
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
115 vues67 pages

Cours de Probabilité et Statistique

Le document présente un cours sur la probabilité et la statistique. Il introduit les concepts clés de la statistique descriptive comme les variables, les populations et les échantillons. Différentes mesures statistiques sont également décrites.

Transféré par

Mohamed Taha MESBANE
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Probabilité et Statistique

JOUDAR Nour-Eddine
[Link]@[Link]
2022/2023

1
Sommaire

1 Introduction
2 Statistique descriptive
3 Probabilité
3.1 Probabilité conditionnelle
3.2 Variables aléatoires multidimensionnels
3.3 Lois usuelles

4 Ajustement statistique - principe des moindres carrés

5 Estimation et tests statistiques


6 Processus stochastique
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022 2
Introduction
• Question: Pourquoi un cours de statistiques ?

Intérêt des statistiques


Introduction
Réponse: La résolution d’un grand nombre de problèmes
Statistique au différentes disciplines fait appel à une compréhension
Descriptive de la variabilité ainsi qu’à une connaissance des outils
descriptifs et analytiques reliés à la variabilité.
Probabilité

• Définition
Ajustement
La statistique

Estimation
• C'est l'art de recueillir, présenter, analyser et utiliser des observations
(des données) afin d'aider à la prise de décisions et à la résolution de
problèmes.
• Le premier phénomène qui ressort des observations: la variabilité des
données.
3
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Introduction
Exemple

• On s'intéresse à un nouvel alliage aluminium et lithium; on


Introduction
analyse sa résistance à la compression.
Statistique
• 80 tests sont effectués (les unités sont en psi)
Descriptive

Probabilité 105 221 183 186 121 181 180 143


97 154 153 174 120 168 167 141
Ajustement 245 228 174 199 181 158 176 110
Lire et interpréter
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123 ces données???
134 178 76 167 184 135 229 146
Estimation 218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149

4
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Introduction
Statistique

Introduction

Statistique Statistique descriptive Statistique inférentielle


Descriptive
s'occupe de la description des s'occupe de tirer des
Probabilité données: tableau, graphique, conclusions générales à
pourcentage, ... partir d'expériences et de
faire des prévisions.
Ajustement
25
Résistance à la compression de l'alliage (en psi)
20
la résistance moyenne à la rupture de
15
cet alliage se situe entre 155,3 et
Estimation 10
170,1 psi ; cette affirmation possède
5
un niveau de confiance de 95%.
0
70 à 90 90 à 110 110 à 130 à 150 à 170 à 190 à 210 à 230 à
130 150 170 190 210 230 250

5
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Introduction
• Comment faire une étude statistique?

Recensement
Collecte des données
Introduction
Sondage
Statistique
Descriptive
Statistique Descriptive
Analyse des données
Probabilité

Ajustement Inférence Statistique

Estimation Conclusions

Prise des décisions

6
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Partie 1
Statistique descriptive

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022 7


Statistiques Descriptive: Vocabulaire
Définitions
Population : On appelle population l’ensemble sur lequel porte notre étude
statistique. Cet ensemble est noté Ω.
Introduction
Exemples: l’ensemble des étudiants d’une classe, l’ensemble des véhicules
susceptibles de circuler dans une ville,…
Statistique
Descriptive
Individu : On appelle individu tout élément de la population Ω, il est noté ω
(ω dans Ω)
Probabilité Exemples: un étudiant, une voiture ,…

Ajustement
Caractère : On appelle caractère (ou variable statistique, dénotée V.S) toute
application X : Ω → C.
Estimation
L’ensemble C est dit : ensemble des valeurs du caractère X (c’est ce qui est
mesuré ou observé sur les individus)
Exemples: Taille, température, nationalité, couleur des yeux
8
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: Vocabulaire
Types des variables
Variable statistique

Introduction

Qualitative Quantitative
Statistique
Descriptive Ses valeurs sont des nombres
Ses valeurs peuvent être des
états, des opinions, des réels et correspondent à des
Probabilité propriétés,... des modalités qui quantités.
correspondent à des "qualités". Taille, âge,...
Ajustement
Couleur, lettre alphabétique,...
Discrète Continue
Estimation

Ses valeurs a priori sont des Les valeurs se situent


nombres isolés les uns des donc dans des intervalles
autres de la droite réelle.
9
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: variables
Étude d’une série statistique à variable discrète

xi ni fi Chaque ligne correspond à


Introduction
une valeur observée différente.
Il y a p valeurs différentes
Statistique
x1 n1 f1
observées.
Descriptive
x2 n2 f2 ni correspond au nombre
Probabilité d’observations (effectif) ayant
comme valeur xi
… … …
Ajustement
xp np fp fi correspond à la fréquence
(pourcentage) d’observations
Estimation
S1p n 1 ayant comme valeur xi :
ni
fi 
x1 est la plus petite valeur, xp la plus grande
n
des valeurs observées.
10
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: variables
Étude d’une série statistique à variable discrète

Ni est l’effectif cumulé c’est dire le


Introduction xi ni fi Ni Fi nombre d’observations ayant des
valeurs inférieures ou égales à xi :

Statistique x1 n 1 f 1 N1 F1
Descriptive

Probabilité x2 n 2 f 2 N2 F2 Fi est la fréquence cumulée c’est à


dire la fréquence des
Ajustement observations ayant des valeurs
… … … …. … inférieures ou égales à xi :

Estimation xp n p f p Np Fp
S1p n 1
11
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: variables
Étude d’une série statistique à variable continue
• Les valeurs sont mises en classes.
• Leurs valeurs extrêmes sont appelées bornes des classes.
Introduction
• Les classes sont mutuellement exclusives.
Statistique • L'amplitude de la classe ou intervalle ou module de classe :
Descriptive = borne supérieure - la borne inférieure.
• Le point central ou encore point médian est situé à mi chemin entre les
bornes.
Probabilité

Ajustement
• L'intervalle de classe est généralement constant, toutefois, on utilise parfois une
amplitude variable notamment pour les classes des valeurs extrêmes.
Estimation • En cas de classes d'amplitudes différentes, la densité de fréquence ni/ Di
permet de comparer les effectifs ou les fréquences d'une classe à l'autre.
• la densité de fréquence est utilisée pour tracer l’histogramme.

12
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: variables
Étude d’une série statistique a variable continue
Classe Ci ni fi Ni Fi
[140-160[ 150,0 10 0,05 10 0,05
Introduction
[160-165[ 162,5 20 0,10 30 0,15 Pour les calculs, le
[165-170[ 167,5 30 0,15 60 0,30 centre de classe Ci est
Statistique utilisé en remplacement
[170-175[ 172,5 45 0,23 105 0,53
Descriptive de xi
[175-180[ 177,5 40 0,20 145 0,73
[180-185[ 182,5 35 0,18 180 0,90
Probabilité
[185-190[ 187,5 15 0,08 195 0,98
[190-200[ 195,0 5 0,03 200 1,00
Ajustement
Remarque
• Pour les calculs des paramètres statistiques usuels des données quantitatives et uniquement de
Estimation ce type de données.
• On complète la distribution par :
• Une colonne ni * xi pour calculer le total,
• Une colonne ni * xi2 pour calculer le total des carrés.
13
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions non cumulées

Distributions non groupées


Introduction

• Données qualitatives :
Statistique • Diagramme sectoriel
Descriptive
 Angle au centre proportionnel à ni (ou fi).
• Données quantitatives discrètes
Probabilité • Diagramme en bâtons
 On trace parallèlement à l'axe des ordonnées, en regard
Ajustement des xi qui sont portés en abscisse, un segment de longueur
proportionnel à ni
• Polygone des fréquences
Estimation  Ligne brisée joignant les bâtons.
 Fréquences absolues / fréquences relatives.

14
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions non cumulées

Données qualitatives: Diagramme sectoriel


Introduction

Répartition des groupes sanguins


Statistique
Descriptive Groupes
sanguins ni fi 16 A
Probabilité A 35 35% 35 B
B 9 9%
O
Ajustement O 40 40% 40 9 AB
AB 16 16%
Estimation
100 100%

15
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions non cumulées

Introduction Données quantitatives discrètes

Statistique
25

nombre nombre de
Descriptive d'enfants familles (ni) 20

(xi)
0 10 15

Probabilité
1 20
2 15 10

Ajustement 3 5
4 3 5

>4 0
0

Estimation
0 1 2 3 4 >4

Polygone des fréquences

16
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions non cumulées

Introduction
Distributions groupées
• Données quantitatives continues
Statistique
• Histogramme :
Descriptive
 Composé de rectangles ayant comme base l'intervalle de
classe et comme hauteur la densité de fréquence (ni/Di).
Probabilité
 La surface est proportionnelle à ni.
Ajustement

Estimation

17
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions non cumulées

Introduction
Histogramme

90
Statistique Densité
Descriptive 80
Classe ni (*10)
70
[140-160[ 10 5
60
Probabilité [160-165[ 20 40
50
[165-170[ 30 60
Ajustement
40
[170-175[ 45 90
30
[175-180[ 40 80
20
Estimation
[180-185[ 35 70
10
[185-190[ 15 30 0
[190-200[ 5 5 140 160 170 180 190 200

18
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions cumulées

Distributions cumulées
Introduction • Uniquement pour des données
quantitatives
• Polygone des fréquences :
Statistique
• Distributions non groupées =
Descriptive escalier.
• Distributions groupées = ligne
Probabilité
brisée.
• Histogrammes.
Ajustement

Estimation

19
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions cumulées

Asymétrie
Introduction L'asymétrie évalue dans quelle mesure vos données ne
sont pas symétriques. Qu'elle soit de 0, positive ou
Statistique négative, la valeur d'asymétrie fournit des informations
Descriptive sur la forme des données.

Probabilité

Ajustement

Estimation

20
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions cumulées

Introduction

Statistique
Descriptive

Probabilité

Ajustement

Estimation

Distributions positives ou asymétriques à Distributions négatives ou asymétriques à


droite gauche

21
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: représentation graphique
Distributions cumulées

Aplatissement
Introduction L'aplatissement indique dans quelle mesure les queues
d'une loi diffèrent de la loi normale. Utilisez
Statistique l'aplatissement pour mieux comprendre dès le départ les
Descriptive caractéristiques générales de la distribution de vos
données.
Probabilité

Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


22
2021/2022
Statistiques Descriptive: variables
Étude d’une série statistique à variable discrète

Introduction Application 2
Nombre Effectif de
d’enfants femmes
Statistique enquête réalisée auprès de 20 femmes
Descriptive casablancaises nées en 1970 sur le
nombre d’enfants qu’elles ont eus 0 1
Probabilité 1 3
2 5
Ajustement 1. Peut on représenter cette distribution en
3 5
classes? Si oui construire la table statistique
correspondante puis dresser un graphe 4 4
Estimation compatible? 5 2

23
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques

Introduction

Paramètres statistiques
Statistique
Descriptive Une série de données peut être résumée par quelques valeurs numériques
appelées caractéristiques des séries statistiques, classées en quatre grandes
catégories :
Probabilité
• Caractéristiques de tendance centrale (position).

Ajustement • Caractéristiques de dispersion.


• Caractéristiques de forme.
• Caractéristiques de concentration.
Estimation

2424
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: la moyenne
La moyenne se calcul en divisant la somme des valeurs par le nombre d'observations.
Introduction Propriétés

Moyen arithmétique:
Statistique
Descriptive La moyenne arithmétique permet de résumer par un seul nombre la série
statistique.
Probabilité • Elle prend en compte toutes les valeurs de la série et elle est facile à calculer.
• Elle est sensible aux valeurs extrêmes, il est parfois nécessaire de supprimer
Ajustement des valeurs extrêmes ou « aberrantes ».
• Mauvais résumé si la distribution est très dissymétrique.
Estimation • La quantité est l’écart de la valeur à la moyenne
arithmétique. La moyenne arithmétique des écarts est nulle.

Dans le cas continu, il suffit de remplacer les x par les centres des classes.
2525
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: le mode

Introduction Propriétés

Mode: Le mode est la valeur de la variable statistique la plus fréquente que


Statistique
l’on observe dans une série d’observations.
Descriptive
• Le mode n’existe pas toujours et quand il existe, il n’est pas toujours unique.
Probabilité • Si après regroupement des données en classes, on trouve deux ou plusieurs
modes différents, on doit considérer que l’on est en présence de deux ou
plusieurs populations distinctes ayant chacune leurs caractéristiques propres ;
Ajustement
dans ce cas, la moyenne arithmétique n’est pas une caractéristique de
tendance centrale.

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022 2626


Statistiques Descriptive: paramètres statistiques
Les paramètres de position: le mode

Introduction

Statistique
Descriptive

Probabilité

Ajustement

Estimation • Dans le cas continu, on dit une classe modale, la


classe dont la fréquence est maximale.

2727
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: les quantiles

Les quantiles divise la distribution en plusieurs secteurs d'intérêt.


Introduction

Statistique Quartiles
Descriptive • Q1: 25% des valeurs sont inférieures au premier quartiles
• Q2: ou Médiane : 50% des valeurs sont inférieures au deuxième
Probabilité quartiles.

Ajustement
• Q3: 75% des valeurs sont inférieures au troisième quartiles.

Il est possible aussi de couper la distribution en:


Estimation
• Déciles.
• Centiles.
• Percentiles particuliers.

2828
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: les quantiles

Introduction

Statistique
Descriptive

Probabilité

Ajustement

Estimation

2929
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: la médiane

Médiane: cas discret


Introduction
Pour déterminer la médiane, on utilise les effectifs cumulés croissants puis on
Statistique distingue les cas suivants:
Descriptive • Lorsque l’effectif total est un nombre impair (de type N = 2n+1), la
médiane est la valeur prise par le n+1 i ème effectif.
Probabilité • Lorsque l’effectif total est un nombre pair (de type N = 2n), la médiane
est la valeur prise par la moyenne entre le n i ème effectif et le n+1 i ième
Ajustement
effectif.
Exemple
Estimation

811=2*405+1 Me=1
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,
3030
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: la Médiane

Introduction Médiane: cas continu Exemple


Notes Effectif
Statistique • La classe médiane est la classe
Descriptive première classe pour laquelle la
fréquence cumulée dépasse 0,5.
[0,5[ 10
Probabilité • Pour trouver la médiane, on applique
la règle de Thalès a la classe [5,8[ 8
Ajustement
médiane. (Voir exemple) [8,12[ 12
[12,15[ 11
Estimation La médiane se trouve donc dans la [15,20[ 9
classe médiane [8;12[ 50

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


3131
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: la Médiane

Introduction

Statistique
Descriptive

Probabilité

Ajustement

Estimation

Thalès
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,
3232
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de position: la Médiane

Introduction Médiane: propriétés

Statistique Le calcul de la médiane est rapide.


Descriptive • La médiane n’est pas influencée par les valeurs extrêmes ou aberrantes.
• La médiane est influencée par le nombre des données mais non par leurs valeurs,
elle ne peut donc pas être utilisée en théorie de l’estimation.
Probabilité
• La médiane est le point d’intersection des courbes cumulatives croissante et
décroissante.
Ajustement • La médiane ne se prête pas aux combinaisons algébriques ; la médiane d’une série
globale ne peut pas être déduite des médianes des séries composantes.

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


3333
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de dispersion

Ces paramètres rendent compte de l'étalement des données. Cela permet de montrer si
Introduction
les données sont éloignées ou proches de la moyenne.

Étendue, intervalle interquartile, écart à la moyenne, L'écart absolu moyen


Statistique
Descriptive
• Étendue: :Il s'agit de différence entre les valeurs extrêmes de la distribution.
• IQR: Il s'agit de la différence entre les valeurs du troisième et premier
Probabilité
quartil.
Ajustement IQR=Q3-Q1
• Écart à la moyenne: Il s'agit des écarts de chaque valeur par rapport à la
moyenne.
Estimation
• L'écart absolu moyen (EAM): Il s'agit de la moyenne arithmétique des
valeurs absolues des écarts de chaque valeur par rapport à la moyenne.

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


3434
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de dispersion: variance

Variance
Introduction
Variance: noté , il s'agit de la moyenne des carrés des écarts ou variance empirique.
Il rend compte de l'éloignement de chaque valeur par rapport à la moyenne.
Statistique
Descriptive

Qui peut être simplifiée par:


Probabilité

Ajustement
Changement d’origine et d’échelle

Estimation
Écart type: il s'agit de la racine carré de la variance.

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


3535
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de dispersion: variance

Écart type
Introduction

L’écart-type s caractérise la dispersion d’une série de valeurs. Plus s est petit, plus les
Statistique données sont regroupées autour de la moyenne arithmétique et plus la population est
Descriptive homogène.
L’écart-type permet de trouver le pourcentage de la population appartenant à un
intervalle centré sur l’espérance mathématique.
Probabilité
La variance tient compte de toutes les données, c’est la meilleure caractéristique de
dispersion (nombreuses applications en statistique).
Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


3636
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de dispersion: variance

Coefficient de variation
Introduction
Coefficient de variation: Il s’exprime, sous la forme d’un pourcentage, par
l’expression suivante :
Statistique
Descriptive
Propriétés
• Le coefficient de variation ne dépend pas des unités choisies.
Probabilité • Il permet d’apprécier la représentativité de la moyenne arithmétique x par rapport à
l’ensemble des données.
• Il permet d’apprécier l’homogénéité de la distribution, une valeur du coefficient de
Ajustement variation inférieure à 15 % traduit une bonne homogénéité de la distribution.
• Il permet de comparer deux distributions, même si les données ne sont pas exprimées
avec la même unité ou si les moyennes arithmétiques des deux séries sont très
Estimation différentes.
Exemple: Une distribution a une moyenne de 10 et un écart-type de 1 (Cv= 10 %), elle
sera beaucoup plus dispersée qu'une distribution de moyenne 1000 et d'écart-type 10
(Cv de 1 %).
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,
3737
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de forme: symétrie

Symétrie-asymétrie
Introduction
Une distribution est symétrique si les valeurs de la variable statistique sont également
distribuées de part et d’autre d’une valeur centrale. Pour une distribution symétrique :
Statistique
Descriptive mode = médiane = moyenne arithmétique

Coefficient d’asymétrie ou de dissymétrie ou skewnessue


Probabilité

Ajustement

Coefficient d’aplatissement ou kurtosis


Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


3838
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de forme: symétrie

Symétrie-asymétrie
Introduction
Ces deux coefficients sont principalement utilisés pour vérifier qu’une distribution
est proche d’une distribution normale (loi de Laplace-Gauss) ; en effet, pour une telle
Statistique
loi, le coefficient d’aplatissement est égal à 3 et le coefficient d’asymétrie à 0. Selon
Descriptive
la valeur de ces coefficients, on peut donner quelques caractéristiques sur la forme de
la distribution :
Probabilité • Si > 0, la distribution est étalée vers la droite.
• Si < 0, la distribution est étalée vers la gauche.
Ajustement • Si = 0, on ne peut pas conclure que la distribution est symétrique mais la
réciproque est vraie.
• Si > 3, la distribution est moins aplatie qu’une distribution gaussienne.
Estimation
• Si < 3, la distribution est plus aplatie qu’une distribution gaussienne.

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


3939
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de forme: symétrie

Symétrie-asymétrie
Introduction

Statistique
Descriptive

Probabilité

Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


4040
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de concentration

Concentration
Introduction
La courbe de concentration est réalisée à partir des calculs des fréquences cumulées croissantes
et des masses cumulées croissantes.
Statistique Les fréquences cumulées croissantes sont placées en abscisses et les masses cumulées
Descriptive croissantes sont placées en ordonnées.
La distribution théorique d'égale répartition correspond à la bissectrice du repère.
L'aire comprise entre la distribution théorique et la courbe de concentration s'appelle la surface
Probabilité de concentration.

Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


4141
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de concentration

Concentration
Introduction Courbe de Lorentz

Statistique
Descriptive

Probabilité

Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


4242
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de concentration

Concentration
Introduction
Il s’exprime par

Statistique
Descriptive
Ou

Probabilité

Ajustement

Si G est proche de 0: la courbe de Lorentz est proche de la diagonale, la concentration


est faible. La concentration nulle correspond à une distribution égalitaire.
Estimation
Si G est proche de 1: la concentration est forte.

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


4343
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Les paramètres de forme: symétrie

Symétrie-asymétrie
Introduction

Statistique
Descriptive

Probabilité

Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


4444
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: paramètres statistiques
Combinaison position/dispersion

Coefficient de variation: Il combine les paramètres de moyenne et d'écart type.


Introduction
Il permet de comparer 2 variables de nature différentes.

Statistique
Descriptive

Probabilité
Exemple: Une distribution a une moyenne de 10 et un écart-type de 1 (Cv= 10 %), elle
Ajustement sera beaucoup plus dispersée qu'une distribution de moyenne 1000 et d'écart-type 10
(Cv de 1 %).

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


4545
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive
D’une donnée brute vers une donnée continue
Conversion d’une série discrete
Introduction

Statistique
Descriptive

Probabilité

Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


46
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: Application
Étude d’une série statistique à variable discrète

Introduction Nombre Nombre de


Application
d’infractions conducteurs
Statistique La brigade de police a effectuée un
Descriptive contrôle sur une artère de la capitale,
et a relevé les infractions commises 0 44
par les conducteurs contrôlés. 1 140
Probabilité
2 92
Ajustement
3 156
1. Déterminer la population, l’individu le
caractère et l’ensemble des modalités. 4 256
Estimation 2. Compléter cette étude statistique. 5 80
6 32

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


47
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: Application
Exercice 1.
Chez un fabriquant de tubes de plastiques, on a prélevé un échantillon de 100
tubes dont on a mesuré le diamètre en décimètre
Introduction

Statistique
Descriptive

Probabilité

Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


48
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: Application
Exercice 1.

Introduction 1. Identifier la population, les individus, le caractère et son type.


2. En utilisant la méthode de Yule puis de Sturge, établir le tableau statistique (Faites
Statistique débuter la première classe par la valeur 1.94).
Descriptive 3. Tracer l’histogramme de cette variable statistique.
4. Déterminer par le calcul la valeur du diamètre au-dessous de laquelle se trouvent 50%
Probabilité des tubes de plastique. Que représente cette valeur.
5. Déterminer par le calcul le pourcentage de tubes ayant un diamètre inférieur à 2.58.
Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


49
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Partie 2
Statistique bivariée

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022 50


Statistiques Descriptive: cas de deux variables

Introduction
Objectifs

Statistique La brigade On s’intéresse a deux variables x et y. Ces deux variables sont


Descriptive mesurées sur les n unités d’observation. Pour chaque unité, on obtient donc deux
mesures. La série statistique est alors une suite de n couples des valeurs prises par
les deux variables sur chaque individu.
Probabilité

Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


51
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Représentation graphique
Nuage des points
Nuage des points
Introduction Chaque couple est composé de deux
valeurs numériques. Un couple de
Statistique nombres (entiers ou réels) peut toujours
Descriptive être représenté comme un point dans un
plan

Probabilité
Nuage des points
Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


52
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Analyse des variables.

Introduction
Les variables x et y peuvent être analysées séparément. On peut calculer
tous les paramètres dont les moyennes et les variances :

Statistique
Descriptive Nuage des points

Probabilité

Ajustement

Estimation
Ces paramètres sont appelés paramètres marginaux : variances marginales,
moyennes
marginales, écarts-types marginaux, quantiles marginaux, etc.. . .

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


53
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Covariance

Introduction La covariance est définie par:


Covariance
Statistique
Descriptive

Probabilité
• La covariance peut prendre des valeurs positives, négatives ou nulles.
Ajustement • Quand Xi = Yi, pour tout i = 1, . . . , n, la covariance est égale a la variance.
• On peut également l’écrire sous cette forme:
Covariance
Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


54
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Corrélation

Introduction Le coefficient de corrélation est la covariance divisée par les deux écart-
types marginaux :
Statistique Le coefficient de détermination est le carré du coefficient de corrélation :
Descriptive
Covariance de coorelation et de détermination

Probabilité

Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


55
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Corrélation
• Le coefficient de corrélation mesure la dépendance linéaire entre deux variables:
Corrélation
Introduction

Statistique
Descriptive
• Si le coefficient de corrélation est positif, les points sont alignés le long
Probabilité d’une droite croissante.
• Si le coefficient de corrélation est négatif, les points sont alignés le long d’une
Ajustement droite décroissante.
• Si le coefficient de corrélation est nul ou proche de zéro, il n’y a pas de
• dépendance linéaire. On peut cependant avoir une dépendance non-linéaire avec un
Estimation coefficient de corrélation nul

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


56
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Covariance
Exemple
Introduction

Statistique
Descriptive

Probabilité

Ajustement

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


57
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Régression entre deux variables

Lorsque deux variables quantitatives sont correctement corrélées ( voisin de


Introduction
1) et que l’on peut considérer, a priori, que l’une (nous supposerons qu’il s’agit
de X) est cause de l’autre (il s’agira donc de Y ), il est alors assez naturel de
chercher une fonction de X approchant Y , “le mieux possible” en un certain
Statistique
Descriptive sens. La méthode statistique permettant de trouver une telle fonction s’appelle la
régression de Y sur X
Ajustement
La technique de régression s’appuie sur un choix adéquat d’une fonction qui
Probabilité représente de meilleure façon l’approximation de Y en fonction de X.

Si la fonction est linéaire, on dit que la régression est linéaire.


Estimation Dans le cas général, on parle de l’ajustement via les moindres carrées

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


58
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Régression linéaire
Il consiste à minimiser la quantité suivante :
Introduction

Statistique
Descriptive
La solution de ce problème est donnée par:
Ajustement

Probabilité

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


59
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Méthode des moindres carrées

Introduction Extremum des fonctions a plusieurs variables.

Les extrémums sont définis en résolvant l’équation vectorielle :


Statistique
Descriptive 𝑥∗ 𝜈𝑓 𝑥−∗ = 0

Ce qui est équivalent a résoudre le système suivant:


Ajustement

Probabilité

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


60
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Méthode des moindres carrées

Introduction Extremum des fonctions a plusieurs variables.

En trouvant les différentes positions , les minimas et maximas sont


Statistique définis par le signe du discriminent de la matrice hessienne au point .À

Descriptive la position , la𝑥matrice hessien est définie par l’expression suivante:

Ajustement

Probabilité

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


61
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Méthode des moindres carrées
Extremum des fonctions a plusieurs variables.
Introduction

Statistique
Descriptive 𝑥∗

Ajustement
Cas de deux variables.
Probabilité

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


62
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Méthode des moindres carrées

Principe des moindres carrées .


Introduction Le principe des moindres carrés permet de trouver les valeurs optimales des
paramètres d’un modèle en minimisant les écarts quadratiques entre les observations
(ou expérimentations) et le modèles théoriques (empiriques) proposés.
Statistique
Descriptive
Ce chapitre traite spécialement le cas de la modélisation de deux variables :
Ajustement Variables endogène et exogène.
Probabilité Variable exogène : dite variable indépendante, c’est la variable qui décrit le modèle,
notée dans ce chapitre « x » ;
- Variable endogène : c’est la variable dépendante, représentant la variable ou le
Estimation phénomène à modéliser en fonction de la variable exogène, notée dans ce chapitre
« y ».

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


63
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Méthode des moindres carrées
Étapes d’application des moindres carrées.
Introduction

Statistique
Descriptive 𝑥∗

Ajustement

Probabilité

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


64
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Statistiques Descriptive: cas de deux variables
Méthode des moindres carrées

Application au modèle parabolique.(Voir TD)


Introduction
Ajuster le modele non linéaire suivant:

Statistique
Descriptive

Ajustement

Probabilité

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


65
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022
Partie 2
Probabilité

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022 66


Statistiques Descriptive: cas de deux variables
Méthode des moindres carrées

Application au modèle parabolique.(Voir TD)


Introduction
Ajuster le modele non linéaire suivant:

Statistique
Descriptive

Ajustement

Probabilité

Estimation

JOUDAR NOUR-EDDINE, cours de statistiques et probabilité,


67
2021/2022
JOUDAR NOUR-EDDINE, cours de statistiques et probabilité, 2021/2022

Vous aimerez peut-être aussi