ETUDE DE 2
VARIABLES
QUANTITATIVES
ETUDE DE 2 VARIABLES QUANTITATIVES
(1) MESURE DE LA LIAISON ENTRE 2
VARIABLES QUANTITATIVES
95
90
Poids
Nom Taille xi (cm) Poids yi (kg)
Pierre 175 73 85
Arantxa 168 56 80
….. ….. ….. 75
Martin 185 87 70
65
60
55
Taille
50
150 160 170 180 190 200
La connaissance de la taille x apporte une certaine information sur le poids y
Il existe une relation de dépendance entre x et y
ETUDE DE 2 VARIABLES QUANTITATIVES
(2) MESURE DE LA LIAISON ENTRE 2
VARIABLES QUANTITATIVES
La connaissance de x n’apporte La connaissance de x permet de
aucune certaine information sur y connaître exactement la valeur de y
x et y sont indépendantes Il existe une relation fonctionnelle
entre x et y
ETUDE DE 2 VARIABLES QUANTITATIVES
(3) MESURE DE LA LIAISON ENTRE 2
VARIABLES QUANTITATIVES
1 n
Covariance : Cov x,y = x i -x y i -y
n i=1
Propriétés :
Cov x,y 0 x et y varient dans le même sens
Cov x,y 0 x et y varient en sens contraire
Cov x,y Cov y,x
Cov x,x V(x)
Cov a x + b y , z a Cov x,z b Cov y,z
ETUDE DE 2 VARIABLES QUANTITATIVES
(4) MESURE DE LA LIAISON ENTRE 2
VARIABLES QUANTITATIVES
cov(x,y)
Corrélation linéaire: ρ =
σ(x) σ(y)
Propriétés :
1 ρ 1
ρ = 1 si a > 0
y=ax+b
ρ = -1 si a < 0
ρ 1 Il existe une relation fonctionnelle entre x et y
ρ0 x et y sont indépendantes
0 ρ 1 Il existe une dépendance linéaire d’autant plus forte que |r| est grand
! Ne pas confondre causalité et corrélation
ETUDE DE 2 VARIABLES QUANTITATIVES
(1) AJUSTEMENT LINEAIRE
95
90
y = Poids
85
80
75
70
65
60
55
x = Taille
50
150 160 170 180 190 200
Est-il possible de trouver une fonction numérique f telle que y = f (x) ?
Si une telle fonction existe, on dit que f est un modèle du phénomène étudié.
x est la variable explicative.
y est la variable expliquée.
ETUDE DE 2 VARIABLES QUANTITATIVES
(2) AJUSTEMENT LINEAIRE
95
90
y = Poids
85
80
75
70
65
60
55
x = Taille
50
150 160 170 180 190 200
On désire trouver la droite qui passe « au mieux » à l’intérieur du nuage de points
ETUDE DE 2 VARIABLES QUANTITATIVES
(3) AJUSTEMENT LINEAIRE
« au mieux »
n n
Minimiser S = e 2
i
Minimiser S' =
i=1
e'i2
i=1
95 95
90
y = Poids 90
y = Poids
85 85
80 80
e'i
75
ei 75
70 70
65 65
60 60
55 55
x = Taille x = Taille
50 50
150 160 170 180 190 200 150 160 170 180 190 200
Droite de régression de y en x Droite de régression de x en y
ETUDE DE 2 VARIABLES QUANTITATIVES
(4) AJUSTEMENT LINEAIRE
REGRESSION LINEAIRE DE Y EN X
95
90
y = Poids
85
y80i f(x) = y = ax+b
Droite de régression
75
linéaire de y en x
y = f(x) = ax + b axi+b70 ei = |yi-axi-b|
65
60
55
x = Taille
50
150 160
xi
170 180 190 200
n n
yi -ax i -b
2 2
La droite de régression linéaire de y en x, notée D y/x , minimise S = e =
i
i=1 i=1
n
x -x y -y
i i
Cov x,y
a= i=1
= b = y - ax
n
V(x)
x i -x
2
i=1
Dy/x passe par le point moyen x , y
ETUDE DE 2 VARIABLES QUANTITATIVES
(5) AJUSTEMENT LINEAIRE
REGRESSION LINEAIRE DE Y EN X
95
90
y = Poids
85
y80i f(x) = y = ax+b
Droite de régression
75
linéaire de y en x
y = f(x) = ax + b axi+b70 ei = |yi-axi-b|
65
60
55
x = Taille
50
150 160
xi
170 180 190 200
y = a x + b définit un modèle affine
ŷi = a x i + b = valeur de yi prévue par le modèle
ri = yi - yˆ i = résidu de la ième observation
ei = ri = yi - a x i - b = erreur due au modèle
ETUDE DE 2 VARIABLES QUANTITATIVES
(6) AJUSTEMENT LINEAIRE
REGRESSION LINEAIRE DE X EN Y
95 ei’ = |xi-a’yi-b’|
90
y = Poids
85
y80i f(y) = x = a’y+b’
Droite de régression
75
linéaire de x en y
70
x = f(y) = a’y + b’
65
60
55
x = Taille
50
150 160
x170i a’yi+b’
180 190 200
n n
x i -a'yi -b'
2
La droite de régression linéaire de x en y, notée D x/y , minimise S' = 2
e' =
i
i=1 i=1
n
x -x y -y
i i
Cov x,y
a' = i=1
n
= b' = x - a' y
V(y)
y -y
2
i=1
i Dx/y passe par le point moyen x , y
ETUDE DE 2 VARIABLES QUANTITATIVES
LIENS ENTRE CORRELATION
ET DROITES DE REGRESSION
Cov x,y
Dy/x : y = ax + b a= b = y - ax
σ(x) σ(y)
V(x) r² = a a’ ρ=a = a'
σ(y) σ(x)
Cov x,y
Dx/y : x = a’y + b’ a' = b' = x - a' y
1 b' V(y)
y= x
a' a'
x, y x, y
x, y
r² = a a’ = 0 0< r² = a a’ < 1 r² = a a’ = 1
Le degré de dépendance linéaire
Indépendance linéaire Liaison fonctionnelle linéaire
se mesure à la proximité des
droites de régression
ETUDE DE 2 VARIABLES QUANTITATIVES
QUALITE D’UN AJUSTEMENT
y -y yˆ -y y -yˆ
2 2 2
On montre que i i i i
SCM SCR
SCT = SCM + SCR 1
SCT SCT
Somme des carrés
Somme des carrés Somme des
des écarts à la = des écarts du modèle
+ carrés des résidus
moyenne
L’ajustement est d’autant meilleur que SCR est proche de 0, c.à.d. que SCR/SCT est
proche de 0 ou SCM/SCT est proche de 1.
SCM
R = Coefficient de détermination = r² = (coef. de corrélation)²
SCT
= proportion de la variation totale due à l'ajustement
0 R 1