0% ont trouvé ce document utile (0 vote)
18 vues4 pages

TD Ecometrics

Le document présente un cours d'initiation à l'économétrie, incluant des exercices pratiques sur la régression linéaire, l'estimation de modèles, et l'analyse de données. Il aborde des thèmes tels que la consommation de véhicules, l'autocorrélation des erreurs, l'hétéroscédasticité, et l'impact de la fertilité sur le travail. Les exercices incluent des calculs de coefficients, des tests de significativité, et des estimations à partir de données réelles.

Transféré par

etsikiniaina
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
18 vues4 pages

TD Ecometrics

Le document présente un cours d'initiation à l'économétrie, incluant des exercices pratiques sur la régression linéaire, l'estimation de modèles, et l'analyse de données. Il aborde des thèmes tels que la consommation de véhicules, l'autocorrélation des erreurs, l'hétéroscédasticité, et l'impact de la fertilité sur le travail. Les exercices incluent des calculs de coefficients, des tests de significativité, et des estimations à partir de données réelles.

Transféré par

etsikiniaina
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Cours d’initiation à l’économétrie

TP & TD

Fréjus-Ferry HOUNDOGA
March 2, 2021

Exercice 1 Sur n = 100 observations et pour trois séries (y, x1 , x2 ), nous avons les résultats
numériques suivants :
2
V (y) = 1000, ry/x1
= 0.75; rx21 /x2 = 0.45; ry/x
2
2
= 0.85; ȳ = 12

1. La régression de y sur x1 donne : ŷ = 10x1 −6. Le coefficient de x1 est-il significativement


différent de 0 ?

2. La régression de y sur x2 donne : ŷ = 4x2 + 8. Le coefficient de x2 est-il significativement


différent de 0?

3. Calculer les coefficients du modèle : y = a0 +a1 x1 +a2 x2 +ε, et le coefficient de corrélation


multiple.

4. Les coefficients a1 et a2 sont-ils significativement différents de 0 ? La régression est-elle


globalement significative ?

Exercice 2 On procède à l’estimation d’un modèle linéaire avec une constante. Les informa-
tions disponibles sont :
   
250 0 0 500
X 0 X =  0 200 100 , X 0 y = 140 , y 0 y = 200
0 100 100 100

1. Calculer :

(a) la taille de l’échantillon


P P 2
(b) x1i , x1i
P P 2
(c) x2i , x2i
P
(d) x1i x2i

2. Calculez la droite de régression des yi en x1i et x2i (avec constante).

3. Calculez la matrice variance-covariance des variables explicatives.

4. Calculez la matrice des corrélations des variables explicatives.

Exercice 3 Un économiste spécialisé en économie du travail s’intéresse à la relation liant la


rémunération et la durée des études (théorie du capital humain). Pour ce faire, il dispose d’un
échantillon de 40 hommes et 25 femmes ayant le même âge, dont il relève la rémunération
annuelle (yi ), exprimée en milliers d’euros, et le nombre d’années d’études (xi ).

1
Les estimations économétriques conduisent aux résultats suivants :
Pour les hommes :

yi = 18.60 + 1.8 xi + ei , i = 1, . . . , n1 = 40 (1)


(9.3) (5.2)

(.): ratio de Student


R2 = 0.42
Pour les hommes :

yi = 14.50 + 0.7 xi + ei , i = 1, . . . , n2 = 25 (2)


(12.8) (2.5)

(.): ratio de Student


R2 = 0.22

1. L’influence de la durée des études sur la rémunération vous semble-t-elle significative ?

2. Existe-t-il une différence significative de l’impact de la durée des études sur la rémunération
des hommes et des femmes ?
On aimerait étudier l’influence du genre sur la rémunération.

3. Quel type de variable peut-on introduire pour étudier cet effet ?

4. On a procédé à trois estimations :

ˆ sur l’échantillon global et nous obtenons : SCR ;


ˆ sur l’échantillon des 40 hommes : SCRh ;
ˆ sur l’échantillon des 25 femmes : SCRf .
Comment construire le test d’homogénéité ?

Pratique 1 Le but de ce TP est d’expliquer la consommation des véhicules (en L/100 km) à
partir de 3 variables exogènes : la cylindrée notée X1 (taille du moteur, en cm3 ), la puis-
sance notée X2 (en kw) et le poids noté X3 (en kg). Pour cela, vous disposez du fichier
”tp car [Link]” contenant des données sur n = 30 véhicules.

1. Écrivez le modèle linéaire adjacent, rappelez ces hypothèses et justifier le signe attendu de
chaque variable exogène sur la dépendante.

2. Estimer le modèle spécifié. Le modèle est-il globalement significatif ? Qu’en est-il des
coefficients associés aux variables explicatives ?

3. A-t-on des raisons de suspecter la présence de multicolinéarité ?

Pratique 2 On considère les données du fichier tp [Link]. Le but de cette pratique est
de déceler une éventuelle autocorrélation d’ordre 1 des erreurs. Pour ce faire :

1. Estimez les coeffcients du modèle par moindres carrés ordinaires.

2. Calculez la statistique de Durbin-Watson, effectuez le test et commentez le résultat.


On désire maintenant corriger les effets liés à l’autocorrélation des erreurs.

3. Estimez le ρ à partir de la statistique de Durbin-Watson et avec cet estimateur, trans-


formez les données pour obtenir un modèle qui satisfasse aux hypothèses des moindres
carrés ordinaires.

2
4. Estimez le modèle en spécifiant au logiciel qu’il y a de l’autocorrélation d’ordre 1.
Commentez les résultats obtenus.

Pratique 3 Le fichier tp hetero contient des informations sur des communes en 2005. On
dispose de deux (02) variables : le nombre d’habitants dans la communes (en 2005) et le revenu
total imposable de tous les habitants de la commune en million de FCFA.

1. Représenter le nuage de points associés à ces deux variables. Commenter. Y a-t-il une
raison de soupçon de l’hétéroscédasticité ?

2. Estimer un modèle de régression linéaire du revenu en fonction de la population, puis


interpréter.

3. Représenter les résidus de l’estimation en fonction en fonction des communes classés par
ordre croissant de population. Que pensez-vous de vos soupçons sur l’hétéroscédasticité ?

4. Faire les différents tests d’hétéroscédasticité vus au cours.

5. Estimer l’équation du revenu par la population en supposant que les résidus sont hétéroscédastiques.

Pratique 4 Cet exercice vise à évaluer l’effet de la fécondité sur la main d’œuvre aux Etats-
Unis. La base de données utilisée est celle des femmes mariées recensées en 1980 aux Etats-
Unis. Les données sont contenues dans le fichier [Link]. Une description de la base de
données est contenue dans Fertility Description.

1. Régresser en utilisant les MCO, weeksm1 sur morekids, black et agem1. Peut-on avancer
qu’en moyenne, les femmes avec plus de deux enfants travaillent moins que celles avec
deux enfants seulement ? De combien est estimée cette différence ?

2. Expliquez pourquoi la méthode des MCO est inappropriée à l’estimation de l’effet causal
de la fertilité sur l’offre de travail. Proposez un test statistique.

3. Les femmes dont les deux premiers enfants ont le même sexe ont-elles plus de chances
d’en avoir un troisième ? L’effet est-il conséquent ? Est-il statistiquement significatif ?
(samesex)

4. Expliquer pourquoi samesex est un instrument faible.

Pratique 5 Cet exercise vise à examiner l’effet de l’interdiction de fumer au travail sur la
consommation de tabac aux Etats-Unis. La base de données est smoking dont la description est
donnée par le fichier smoking description.

1. Estimer la probabilité de fumer pour

(a) tous les salariés,


(b) les salariés soumis à une interdiction de fumer sur le lieu de travail,
(c) les salariés qui peuvent fumer sur le lieu de travail.

2. Quelle est la différence entre les probabilités de fumer chez les salariés qui ne peuvent pas
fumer au travail et ceux qui peuvent ? Utiliser les modèles probit et logit pour déterminer
si cette différence est statistiquement significative ?

3
3. Estimez des modèles logit et probit en considérant smoker comme variable dépendante et
les régresseurs suivants : smkban, female, age, age2 , hsdrop, hsgrad, colsome, colgrad.
Comparer l’effet estimé, à partir de cette régression, de l’interdiction de fumer sur le
lieu de travail avec votre réponse à la question (2). Suggérez une raison, basée sur cette
régression, expliquant la variation de l’effet entre (2) et (3) de cette interdiction.

4. Testez l’hypothèse que la probabilité d’être fumeur ne dépend pas dans la régression (3)
du niveau d’études. La probabilité d’être fumeur croı̂t-elle ou décroı̂t-elle avec le niveau
d’étude ?

5. En vous basant sur la régression (3), vérifiez qu’il existe une relation non-linéaire entre
age et la probabilité d’être fumeur. Représenter graphiquement la relation entre la proba-
bilité d’être fumeur et age, supposé compris entre 18 et 65 ans, pour une personne de sexe
masculin, titulaire d’un diplôme universitaire et pouvant fumer sur son lieu de travail.

6. Reprenez la question (3) sans le carré de l’âge. Quel est le meilleur modèle ?

7. Evaluer la qualité du modèle choisi.

8. Quelle conclusion pouvez-vous tirer ? Utiliser le modèle logit et calculer les odds ratios.

Pratique 6 1. Décrire la base de données [Link]

2. Le revenu détermine t-il le choix du mode de pêche ?

3. Cette conclusion reste t-elle si l’on change de catégorie de base ?

4. Cette relation est-elle robuste ? (Ajouter de nouvelles variables)

5. Tester l’effet individuel des variables incluses dans la régression (LR & wald).

6. Tester l’hypothèse IANP ?

7. Pouvons-nous nous permettre de combiner des alternatives ?

8. Reprendre l’exercice en se mettant dans le cas d’une variable ordonnée

9. Effectuer le test de régression parallèle. Quelle conclusion ?

Vous aimerez peut-être aussi