Statistiques Bivariées et Corrélations
Statistiques Bivariées et Corrélations
[(Xi
·
tableau
·
individus X Caractères
s x Y
1 xn y.
… … …
i Xi Y;
n Xn Yn
on a
plusieurs type de variable :
IV IV
ル
IV
^
苙
elaboration de tableaux et graphiques
X
Si on veut étudier deux ensembles
>
- réduction des données /Statistiques
tableau /TCI
de
contingence
→
ai
rijk-effectig associé au couple (xj ; 41)
réécriture :
[(Xji yf ; njk) , j
= 1
, ...
J h
,
=
,
,..., bY
distributions
·
marginales
étude d'une série observée /abstraction de l'autrel étude univariée.
b Ex ;;
Série
marginale en X : i
=
1 2
, , ..., n] au [/xj nj) ; j ,
=
1
, ..., 53
avec
nj =j les
effectifs marginau
Fréquence marginale en X :
fj .
= auj ...
ce
qui permet le calcul des statistiques suivantes :
J
告崎 5 . 5 et
*
Ʃ=
気= 吉 品
( ti -* R = 予 nj- (
xj
-
xR
·
série
marginale en
y
: [yi ; i
=
1
,
2
, ..., n) ou (142 ,
n .
2)ik =
1
,..., k]
avec n
=jk les effectifs marginaux
>
-
fréquence marginale en
y
:
F .
ch
vi = .
∞y =路 y
.
= 吉 “
表 Y%
L
∞
sy 告 “
( yo -
5
R:
吉
選 " h
[ y %- y ?
distributions
·
conditionnelles
b
distribution conditionnelle de
y en X : il
faut supposer que l'on connaisse la valeur de x : x =
xj
:
[(42 njk)
, ,
k =
1
,..., k]
=>
étude d'un échantillon de tailler nj.
fréquence Fhjhjfixé ;
·
conditionnelle
/profil-lignes) :
F42 =
avec cela or
peut calculer les variances, conditionnelles :
moyennes ,
-
π 1 xj
哥爱
-
=
^
jb 性
rgE yf lxjk
℃
1
y ) = -5
× 前 (
distribution conditionnelle de x en
y
: il
faut supposer que l'on connaissance la valus de
yiy
=
42 :
[(Xj njk) j
, ,
=
, ..., 5)
=> taille
étude sur un échantillar de n . L
.
* lµ
% =^ }0 xj
§ § 14 =
njh xj
[ -5 lyh 12
·
les moments :
généralisation à 2 dimensions de la notion de moment.
moments centrés :
Mrs(yi Crise
D cas
particuliers :
mco
= -=
☆=
最签 { yi ⑤} sy
=
mOz
-
ตา
น:
/ -1 yi
Sxy est
appelé covariance.
A mío
cas particuliers : =y
m'on =
T
Liss etmrs 吉
“ loi )' lrii 1 s
·
=
… n) o
-
posons
Xo ns
:
vi
=
, vi e . "
,
=3
= @'
g
A particulier
Sur
Sy
cas :
Covariance
zk -
llyi
A la covariance sera
positive s'il existe une relation croissante entre 2 variables.
décroissante
négative
·
Propriétés :
et L 1
Ui
#ixo Vi
e
= =^ …
.
cou loivl に
ody
a
1 cou lxigl 1 ≤
5
xbg 超吉Ib lti - 5
) - Cyi 5 }-
E
Sxyyyimmo me
1
กิ
·
coefficient corrélation
de /Bravais -
Pearson
= S * ,
r où 0
"
pente
·
r= 1
quand tous les points observés se trouvent sur une même droite de
r =
-1 quand tous les points observés se trouvent sur une mime droite de pente négative .
Propriétés :
Ne être utilisé
·
Signer (M) =
Signe /Cou IX , 41
·
-
1xr 1 car(cov/x , y1/ * sxsy
·
rxy quand et l,
= Vig
on a =
ru Vi xo
A uniquement avec dx et
dy strictement positifs .
:g /
·
vecteur =
moyenne
définit le centre des données
gravité
=
de
Is
·
matrice variance-covariance : Q=
matrice
symétrique
·
Soit X la matrice de observations :
antées
c = * )( 感
ー
→ v = ミピ 告(
Régression
·
linéaire simple
X .
les résidess : li
·
=
y;
-
Y; =
y;
-
a -
bxi
explicative yi .
But : minimiser :
Qlaibl =
ie lyi
:
'=
,
-
a
- bxik
lii) b =
Exy
gx
lw , tsl =
o
i )
nsyi -
a
- bxil
=
o, s
g i- na -b
ixi -∞ 0
ngi= na to x. ③
y
=
atby
c le centre
qui implique que de
gravité est sur la droite de régression.
☆
吉点 xigi - := xi
吾☆ (
、
bl * } ☆
尽然 1
y *
= b *
… *
Resltat : (i) a=
y
-
bx
1b
Ii
=
régression
·
Variance résiduelle et de :
o
la variable à 2 A régression /Va
on décompose l a variance de expliques/y) en
parties :
partie expliqués par la droite de .
de reg
② (variance résiduelle
partie non expliquée
formulr Sy :
=
z(yii-y =
démonstration -
on va décomposer la variance en une variance résiduelle et une variance de
régression.
5
y
=
告品 Iyi - 吉超 ' yi y -
ら: +
y
.- 5 で
Iyo 学 + 吉 1 i yigillgi -y
“
吉 に悟 ( )
5
- ! -
>
-
ensuite on montre que le double produit est nul .
异
Ʃ
器
gi- :} 1 ji
g
- 1= 弄念 lyi -g b
-
(
xi - xlHltblai -
x |
(
「 YigIlxi -i ) /i - *
) b しxi - *J
[ x =と b[ ☆}
=
aる
Sxy -bs
:
]
ω
?
sxy
響
coefficient de de
ro =
pente O
Se Sy/1-r()
peut =
r
·
re
y . :
interprétation : '
qui sera étendu dans le a s de régression multiple à mesure le % de variance de la variable (y/ expliqué
démonstration : Se =
sy(1-r2
ε
=
告
「
8 - -
s;R = 告 Syi -
g
- bixi
-
5 」R
吉品 1 、 5
超品 (* - *
路 i - g) i * i - * )
=
y -
←
-
i
§
y
5 α
線 Sxy
= 響
←
5
} 1
響
= 5
=
y
つ
y
Sy11 -
i'
一
一
一
·
moyenne conditionnelles :
/x; =3
ex : quel salaire
moyen
pour un travailleur
^
ayant un
diplome
de bachelier.
.
a r va
effectuer décomposition de l a variance marginale
-
une
* }
= 愛 { yig ) =
告
告
導
の tye
β - yk
露袋篇成 5
ysj 51
-
n
告超超 es gp
=
Pour rapper Rj :
.j et
n
Rapport 1x
=
·
interprétation :
pourcentage de la variance expliqués par la connaissance de la variable x.
A
Remarques :
·
expression à
comparer avec R
2
·
. x
est indépendant des origines et des unités
o2'y *
·
. x
tj =>
㎡
si j 1λ
j
=
g r
y . x
=0
Si S'ylxj =
0
Vj )1
=
g . x
=
l'indice
·
de l'observation
Y:
Rs
·
Corrilation de (Ms)
Spearman corr/R/X) RIy
=
: ,
Pearson
de la Corritation de
par définition ,
My -gi
画 X et modalités : An
2 variables
qualitatives/nominales) Y : X
prend J , ..., Aj et Y prend K modalités : Bs
..., BK
et y sont observés
·
} tableau de contingence IN
en
"
nj
→
nj .
=
mj&et n . h = mjk
tableau
·
des
fréquences relatives F
.
roljan 51
r(k k)
.
= 1
,...,
.
Fj=
·
Remarques :
fif estimation de
Tjh YC
=
une
,
est estimation
fj P(XEAj)
·
de =
.
une
j .
est estimation
FL de
Th P(YEBR)
=
une
.
tableaux fréquences
·
des conditionnelles
opvas
presentant e modalite
De poum en individue aant e
maand
851 == の “ る β= gixel
h
^ … :
>
-
estimation de probabilité conditionnelle :
P(XAjlYEBL)
Si 2 variables aléatoires et sont indépendantes FjE51 54 et V E(1 ...., k}
·
X alors
y , ...,
E) PLH E AJIYE BE 1
=
BLXEA5 I
l'échantillon
·
fj (1, 5} VhE(1 , k]
}
al firIj . fl
.
=
,
. .
., ...,
lot
fhlj = -th = =3. # Vj ,
Fh
Pfjlz
=hfj .
Fj ,
ffj etfran
·
rjf-rh
·
interprétations : ·
Si
ejh(o) niffizfrIj f. .
alors on dit que les modalités
Aj et BL "s'attirent"
. . que
·
mesures d'association du chi-carré :
D
l @
interprétation : la valur est grande ⑦ .
on s'écarte de l'indépendance donc association.