Relations entre les variables
1. Corrélation 2. Régression linéaire (simple) 3. Régression multiple 4. Modération / interaction 5. Régression logistique
Non discuté, ne fait pas partie
de l'examen
L’idée Relation linéaire entre deux Relation linéaire et causale entre Relation linéaire et causale Relation Y~X modéré par M Y~X
variables deux variables entre deux variables.
Suppositions Les deux variables sont 1 prédicteur >1 prédicteur ≥1 prédicteurs, 1 modérateur, VD= binaire : groupe de
numériques et normalement VD : numérique VD : numérique 1 terme d'interaction, référence / cible.
distribuées : Pearson corr. prédicteurs continus au centre 2 astuces (probabilité de y,
Si l'une variable ou l'autre est VD : numérique fonction logistique/fonction
ordinal/skewed, Spearman sigmoïde ; log pour linéariser.
corr.
Visualisation
L’equation - yi = β0 + β1xi + εi yi = β0 + β1X1i + β2X2i + yi = β0 + β1X1i + β2X2i + P(Y)
β3X3i + εi β3(X1*X2)i + εi Utilisation de la fonction
sigmoïde pour obtenir une
centrage des prédicteurs
probabilité comprise entre 0 et
numérique
1
Linéariser avec le log
Log(Odds) = β0 + β1xi + εi
Syntaxe R - lm(y ~ 1 + x) lm(y ~ 1 + x1 + x2 + x3) lm(y ~ 1 + x1 * x2) or glm(y ~ group,
lm(y ~ 1 + x1 + x2 + x1:x2) family=”binomial”)
Vérification de Les deux variables sont (i) Erreur normalement distribuée (i) Erreur normalement (i) Erreur normalement (i) Colinéarité
conditioins numériques et normalement (ii) Homoscédasticité de l'erreur distribuée distribuée
distribuées : Pearson corr. (iii) Cas influents / valeurs (ii) Homoscédasticité de (ii) Homoscédasticité de
Si l'une variable ou l'autre est extrème l'erreur l'erreur
ordinal/skewed, Spearman (iv) Linéarité (tracé descriptif) (iii) Cas influents / valeurs (iii) Cas influents / valeurs
corr. extrème extrème
(iv) Linéarité (tracé descriptif) (iv) Linéarité (tracé descriptif)
(v) Colinéarité
Interpretation: si la p-value est significative : … Le même, mais pour chaque Le modérateur augmente ou Si un effet est significatif et que
Regression Les personnes ayant des valeurs prédicteur. diminue la relation entre X et Y. log(Odds) > 0, cela indique une
coefficient plus élevées en X ont tendance à relation positive avec le groupe
(significatif) déclarer des valeurs cible.
élevées/inférieures en Y (B = 3.4, Si un effet est significatif et que
p = 0.021) log(Odds) < 0, cela indique une
relation négative avec le
groupe cible.
Limites Aucune direction causale Ne peut être utilisé que lorsque Ne peut être utilisé que lorsque Ne peut être utilisé que lorsque
les associations sont linéaires. les associations sont linéaires. les associations sont linéaires.
Causalité seulement supposée Causalité seulement supposée Causalité seulement supposée
mais non testée. mais non testée. mais non testée.
Noter. N'oubliez pas que l'idée de ce tableau est d'y mettre toutes les choses qui vous semblent importantes afin que vous puissiez l'utiliser pendant
l'examen.
J'ai inclus ces choses, qui comptent pour moi pour me souvenir de tous les points - mais peut-être avez-vous besoin de plus ou moins de points. Ainsi,
n'hésitez pas à changer et à ajouter des choses jusqu'à ce que vous vous sentiez prêt pour l'examen.