Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp.
Panel Extensions
Introduction à STATA
Nathalie Colombier & Julien Licheron
Activité organisée par PROJECT
Jeudi 3 Juillet 2008
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Pourquoi STATA ?
Logiciel intuitif : interface et fenêtres
Relativement exible : dispose souvent de nombreuses options,
et permet aussi de programmer
Grosse communauté d'utilisateurs : nombreux modules
supplémentaires, aide et documentation sur Internet, travail
des " Stata boys "
Particulièrement adapté aux variables qualitatives
Utilisé dans des disciplines autres que l'économie (nance,
épidémiologie, biologie, . . . )
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Plan de la Présentation
1 Introduction
2 Fichiers de Stata
3 Traiter les Variables
4 Statistiques Descriptives
5 Variables Qualitatives
6 Séries Temporelles
7 Données de Panel
8 Quelques Extensions
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA
Stata se présente sous la forme de 4 fenêtres :
Review : ache l'historique des commandes tapées par l'utilisateur
et permet d'en rappeler une facilement.
Results : utilisée pour acher tous les résultats des commandes
tapées par l'utilisateur.
Variables : détaille toutes les variables présentes dans la base de
Stata ne peut ouvrir
données actuellement ouverte dans Stata (
qu'une seule base de données en même temps ).
Command : permet à l'utilisateur d'entrer les commandes.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA
⇒ Une barre de menus qui permet d'exécuter les commandes les plus
courantes sous Stata sans avoir à se servir de la fenêtre Command.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA
Deux icônes permettant d'acher la base de données ( Data Editor
ou Data Browser ) également accessibles par le biais du menu
(Data/Data Editor ou Data/Data Browser ) et directement à partir
de la fenêtre de commandes (edit ou browse ).
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA : Fichiers et répertoires
Stata utilise plusieurs types de chiers, nommés d'après leurs extensions :
1 Fichier .do : Fichiers de commandes, lisibles dans n'importe quel
éditeur de texte et bien entendu par le Do-le Editor inclu dans
Stata. Ils permettent à l'utilisateur de lancer plusieurs commandes
Stata en une seule opération et de garder une trace des commandes
exécutées
2 Fichier .smcl : Fichiers d'aide (.hlp, ) ou de log (extension libre, en
général .log). Ces chiers s'achent dans le Viewer Stata ou dans
n'importe quel éditeur de texte. La syntaxe smcl permet à Stata
d'acher le gras, les italiques, etc.
3 Fichier .dta : Fichiers de données au format Stata.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA : Do-le editor
Il est possible de lancer l'intégralité du do-le ou d'en exécuter seulement
une partie.
⇒ Pour cela, il sut de sélectionner la partie souhaitée du .do avant de
cliquer sur Do ou Run.
La seule diérence entre Run et Do est que la seconde commande ache
les résultats dans la fenêtre Results, alors que la première est silencieuse.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA : Do-le editor
L'ouverture du Do-File Editor peut se faire en appuyant sur l'icône
correspondante dans la barre de menu, en sélectionnant dans le menu
Windows/Do-le Editor/New le, ou en entrant doedit dans la fenêtre
Command.
Lorsqu'on utilise Stata, il est préférable d'utiliser un chier Do-le.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA : Do-le editor
Un page blanche apparaît, et c'est sur cette page blanche que l'on inscrit
toutes les commandes que l'on veut faire exécuter sur nos données. Pour
exécuter tout ou une partie des commandes, il sut d'appuyer sur l'icône se
trouvant sur la barre d'outil du chier Do-le.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA : Do-le editor
Commandes utiles à insérer en préambule du do-le :
1 Gestion de la mémoire : Lorsque Stata doit ouvrir une base de données,
celle-ci est intégralement chargée en mémoire.
⇒ Pour un état des lieux de la mémoire, memory.
Stata dispose par défaut de 10 mégas de mémoire ⇒ toute base de plus
de 10 mégas ne s'ouvrira pas sauf si on modie la quantité de mémoire
disponible pour Stata.
Pour vérier la taille de la base à charger, on utilise la commande
describe using [Link].
Si celle-ci nécessite 100 mégas, set memory 100m ⇔ set mem 100m.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA : Do-le editor
2 Log : Pour conserver une trace complète de tout ce qui s'ache dans la
fenêtre Results au cours d'une session (commandes/résultats...), il est
possible (et préférable!) de créer un chier log.
Stata permet de créer des log au format texte (option text), ou au format
smcl (option smcl). Ce dernier format permet un achage du log dans le
Viewer Stata très propre, mais complique la lecture du log avec d'autres
logiciels.
Pour commencer un nouveau chier de log :
log using monchier
ou bien
log using D:\Home\ncolombi\MES
DOCUMENTS\document\économétrie\[Link],text.
Pour le fermer log : log close.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA
Pour mettre le log à la suite du log issu de la précédente session Stata :
append.
Pour débuter à partir d'un chier vierge : replace.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA : Do-le editor
3 Gestion de l'achage :
Pour supprimer l'achage des résultats d'une commande,
quietly commande.
Pour détailler au maximum les opérations réalisées par Stata :
set trace on.
Pour que Stata ne stoppe pas au cours de l'exécution d'un
do-le lorsque l'achage des résultats atteint le bas de la
fenêtre Results, set more o.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Présentation STATA : Do-le editor
EN RÉSUMÉ
On débute le programme avec la commande clear an de vider la
mémoire de Stata.
On spécie la taille de la mémoire à allouer set memory 100m ⇔ set
mem 100m.
on indique quelle base utiliser use
D:\document\économétrie\EPCV\[Link] .
il est conseillé d'ouvrir un chier log : log using [Link],
replace (par défaut à la racine) ou bien spécier l'emplacement du log :
log using D:\Home\ncolombi\MES
DOCUMENTS\document\économétrie\[Link]
commencer le programme par set more o
il est possible d'inclure des commentaires dans le programme en les
encadrant par des *
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Description des données
Les variables sous Stata peuvent être numériques ou alphanumériques.
Les variables numériques peuvent être de diérents types, selon la
précision (et la place en mémoire) nécessaire.
Les variables alphanumériques (en rouge dans browser) sont des chaînes
de caractères quelconques (string, str), d'une longueur maximale de 244
caractères. Pour transformer une chaîne en variable numérique, destring
variable, options. Parmi les options, gen(var) ou replace.
Stata stocke par défaut une variable sous forme de chaîne lorsque la
variable contient au moins un caractère non-numérique (souvent variables
manquantes)
⇒ Il est impossible d'utiliser cette variable dans une régression. Pour
contraindre Stata à ignorer les caractères non numériques, l'option force.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Généralités
Lors de l'écriture de programmes :
Pour chaque nouvelle commande il faut passer à la ligne, il est
inutile de nir par , ou ;. Par contre, à chaque commande
sont associées des options et la structure est :
nom_de_commande variables_concernées, options
Stata ne tient pas compte des espaces multiples
Minuscules/majuscules : les commandes sont à taper en
minuscules, attention aux noms de variables comportant des
majuscules.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Opérateurs et fonctions mathématiques
Quelques remarques :
En ce qui concerne le signe =, il existe une particularité. Lorsque le
signe = est une conjecture (à tester) ou une condition et non une
dénition, on doit le remplacer par ==.
Les valeurs manquantes (symbolisées par un point . sous Stata)
sont les plus grandes valeurs. Ainsi, l'expression salaire> 1500 est
vraie si le salaire est supérieur strictement à 1500 ou manquant.
Pour ne conserver que les valeurs supérieures à 1500 et non
manquantes, il faut préciser : salaire>1500 & salaire<.
Les opérateurs suivent l'ordre de priorité habituel. L'opérateur Et
est prioritaire sur l'opérateur Ou.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Opérateurs et fonctions mathématiques
Addition + Soustraction −
Multiplication ∗ Division /
Egalité = Inégalité ∼= ou ! =
Exposant b partie entière int ()
Racine sqrt () Exponentielle exp ()
Logarithme log () Valeur absolue abs ()
Sup. (resp. Inf.) > (resp. <) Sup. (resp. Inf ) ou égal >= (resp. <=)
Ou | Et &
Minimum min() Maximum max()
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Trois expressions : by, if et in
Ces trois expressions peuvent s'utiliser avec la majorité des commandes
Stata. On peut les combiner les unes avec les autres.
1 by permet d'appliquer une commande à chaque valeur d'une
variable. La syntaxe de cette expression est by variable :
commande variable.
En amont, il faut que la base de données soit classée par cette
variable. On peut utiliser sort avant by, ou pour classer et eectuer
le by en même temps, bysort.
Exemple : bysort sexe : summarize salaire permet d'obtenir le
salaire moyen des femmes et des hommes.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Trois expressions : by, if et in
2 if permet de n'appliquer la commande qu'aux observations
remplissant une condition particulière.
Syntaxe : commande variable if condition.
Exemple : summarize salaire if age==18 | age>20 &
age<=50 donne les statistiques descriptives de la variable salaire
pour les observations dont la variable age est égale à 18 ou comprise
entre 20 (exclu) et 50 (inclus).
L'opérateur & est prioritaire, les parenthèses sont inutiles ici.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Trois expressions : by, if et in
3 in permet de n'appliquer la commande qu'aux observations se
situant dans un intervalle donné.
Syntaxe : commande variable in condition.
Exemple : summarize salaire in 10/20 donne les statistiques
descriptives de la variable salaire pour les observations de la 10ème
à la 20ème ligne de la base de données.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Décrire et manipuler des données
describe : ache la liste de toutes les variables, le type et les
éventuels labels (peu utilisé) ⇔ des.
ds : liste les variables
codebook variable : détaille la variable ie. modalités possibles,
fréquences, nombre de données manquantes, ...
rename ancien_nom nouv_nom : Renomme la variable
ancien_nom en nouv_nom.
replace x = 12 : Remplace le contenu de la variable x par 12 ( x
devient une constante).
replace x = y if y > 10 & y ∼= . : Remplace la valeur de x par
celle de y , si y est supérieur à 10 et contient une valeur.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Décrire et manipuler des données
drop x : Supprime la variable x.
drop _all : Supprime toutes les variables
keep x : Conserve la variable x, supprime toutes les autres.
label var variable label : Attribue à une variable x un label (une
étiquette).
Exemple : label var lnsal "logarithme du salaire brut".
global liste var1 var2 var3 ... varn : permet de générer une
liste de variables appellée 'liste'.
regress salaire $liste ⇔ regress salaire var1 var2 var3 ... varn
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Décrire et manipuler des données
Dans le cadre notamment de l'économétrie des variables qualitatives, le
codage est déterminant et il est souvent nécessaire de générer ou
modier des variables.
Créer des variables : deux commandes existent :
generate permet de créer des variables qui nécessitent des calculs
simples
egenerate (extended generate) s'impose lorsque les calculs se
complexient un peu ou que l'utilisation de fonctions statistiques
spéciques est nécessaire.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Décrire et manipuler des données
Exemples d'utilisation de generate :
gen x = 12 : crée une constante nommée x, qui vaut 12.
gen x = log(a*b)-sqrt(abs(b)): La nouvelle variable
x = log(a × b) − |b |
p
.
gen x = (sexe==Homme): x est égal à 1 si la variable sexe
contient la chaîne de caractère Homme, 0 sinon.
gen x = y[_n-1] : x est égale à la valeur de l'observation
précédente de y.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Décrire et manipuler des données
Exemples d'utilisation de egenerate :
egen x = sd[y] : x, constante, est égal à l'écart-type de y.
egen x = pctile(y), p(50) : x est égal à la médiane de y.
Replace : permet de recoder, de remplacer certaines valeurs d'une
variable par d'autres valeurs :
replace satis=1 if satis==2|satis==3 : remplace satis par la
valeur 1 si satis est égale à 2 ou 3.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Fusionner des bases de données
Stata ne peut ouvrir qu'une seule base de données en même temps. Pour
travailler simultanément sur deux bases de données : soit ouvrir base 1,
l'enregistrer puis ouvrir base 2 ; soit ouvrir deux sessions Stata en
parallèle.
⇒ Pour fusionner deux bases de données, deux cas sont à distinguer
selon que l'on souhaite ajouter des observations ou bien des variables :
1 Ajouter de nouvelles observations :
append using nom_de_la_base2
Il faut bien entendu que les variables aient rigoureusement le même
nom dans les deux bases de données.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Fusionner des bases de données
2 Ajouter de nouvelles variables : il est impératif que les données soient
ordonnées de la même facon dans les deux bases (sort
nom_de_variable(s) ). Base 1 ouverte.
merge nom_de_variable(s) using nom_de_base2,
options
Une nouvelle variable _merge est créée et indique le résultat
de la fusion. Les options les plus usitées : unique (conserve
observations non fusionnées base 1 et 2), uniqmaster
(conserve observations non fusionnées base 1) et uniqusing
(conserve observations non fusionnées base 2).
joinby nom_de_variable(s) using nom_de_base2,
options : la diérence avec merge est que joinby ne conserve
que les observations pour lesquelles il y a eu fusion.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Statistiques Descriptives
summarize variable (sum) permet d'obtenir les statistiques
descriptives usuelles. L'option detail permet d'en avoir plus.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Statistiques Descriptives
tabulate variable (tab) calcule les fréquences des valeurs prises par
une variable, et permet de créer des tableaux croisés pour deux
variables.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Statistiques Descriptives
tabulate variable, row col cel (tab) permet de créer des tableaux
croisés pour deux variables avec toutes les fréquences
conditionnelles associées.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Statistiques Descriptives
count if condition renvoies le nombre d'observations qui
remplissent la condition imposée. Peut être associée à by.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Statistiques Descriptives : corrélation et covariance
pwcorr variable1 variable2 donne la matrice de corrélations entre
les variables. L'option sig permet d'obtenir le résultat du test de
nullité du coecient de corrélation.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Statistiques Descriptives : corrélation et covariance
corr variable1 variable2, cov permet d'obtenir la matrice des
variance-covariances.
pwcorr variable1 variable2 variable3 permet d'obtenir les
coecients de corrélation partielle entre les variables prises deux à
deux.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Tests sur la moyenne, la variance et la distribution des
variables
ttest permet de comparer les moyennes de deux variables.
Attention : ce test repose sur l'hypothèse implicite d'égalité des
variances des deux variables. L'option unequal permet de relâcher
celle-ci.
Exemples :
ttest age, by(homme), pour tester la signicativité de la diérence
d'âge entre hommes et femmes.
ttest age=40 : pour savoir si l'âge moyen est égal à 40 ans.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Tests sur la moyenne, la variance et la distribution des
variables
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Variables qualitatives : modèle binaire
On peut utiliser le modèle logit ou probit.
Les commandes sont du type :
logit variable_expliquée variable_explicatives.
probit variable_expliquée variable_explicatives.
Par exemple :
probit horlib homme age cspinter cspintel cycle1 cycle23
useintbu joigndepb
logit horlib homme age cspinter cspintel cycle1 cycle23
useintbu joigndepb
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Variables qualitatives : modèle binaire
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Variables qualitatives : modèle binaire post estimation
1 Pour obtenir les eets marginaux :
après l'estimation d'un modèle Logit ou Probit
⇒ on utilise la commande mfx compute.
dans le cadre du modèle Probit, la commande dprobit calcule
directement les eets marginaux, sans passer par les
coecients.
2 predict p permet d'obtenir la probabilité prédite notée p.
3 lstat permet d'obtenir le taux de bonnes et mauvaises prédictions.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Variables qualitatives : eets marginaux
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Variables qualitatives : probabilités prédites
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Variables qualitatives : modèle multinomiaux
Modèles ordonnés : la syntaxe est similaire à celle utilisée pour les
modèles binaires avec les commandes oprobit pour le probit
ordonné et ologit pour le logit ordonné.
Modèles multinomiaux :
Stata gère assez mal les modèles de type Probit multivariés
comportant plus de 4 alternatives.
Les modèles de type Logit multinomiaux par contre s'estiment
sans problème avec la commande mlogit .
mlogit statut homme diplome age, baseoutcome(1)
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Quelques tests . . .
Hausman :
mlogit statut homme diplome age, baseoutcome(1)
est store modele1
mlogit statut homme diplome age if statut !=0,
baseoutcome(1)
est store modele2
hausman modele1 modele2, alleqs constant
Heckman :
heckman : régression avec probit de sélection
heckman wage educ age, select(married children educ
age),options
heckprob : probit avec probit de sélection
heckman job educ age, select(married children educ
age),options
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Utilisation des séries temporelles
Pour spécier la nature temporelle des données, il faut utiliser
la commande : tsset variable_temporelle [, options]
Par exemple tsset month, monthly
tsll : remplace les "trous" par des valeurs manquantes
tsreport : reporte des stats sur la structure des séries
temporelles (trous, observations multiples, . . . )
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Principaux opérateurs de séries temporelles
L. : xt − 1 )
opérateur retard (
L2. : deuxième retard (xt −2 )
F. : opérateur lead (xt +1 )
F2. : deuxième lead (xt +2 )
D. : opérateur diérence (xt − xt −1 )
D2. : opérateur diérence (xt − xt −1 )−(xt −1 − xt −2 )
S. : opérateur diérence saisonnière (xt − xt −1 )
S2. : opérateur diérence saisonnière (xt − xt −2 )
Sn. : opérateur diérence saisonnière (xt − xt −n )
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
,→ Ces opérateurs peuvent être utilisé directement dans les
commandes, par exemple :
sum [Link]
regress y x1 L.x1 L4.x2
,→ Ces opérateurs peuvent être combinés, par exemple :
L(1/4).gdp : équivalent à [Link] [Link] [Link] [Link]
F(2/3).inf : équivalent à [Link] [Link]
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Quelques modèles disponibles
Modèles de régression simples (MCO, MCG)
Exemple : regress y x1 x2, noconstant
Modèles AR(p), MA(q) ou ARMA(p,q)
Exemple : arima y x1 x2, ar(2) ma(1/4)
Modèle ARIMA(p,d,q)
Exemple : arima y x1 x2, arima(2,2,1/4)
Modèles ARCH, GARCH et dérivés
Modèles VAR, SVAR et VECM
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Modèles à variables instrumentales (TSLS) - STATA 9
Exemple : ivreg y x1 (x2 = inst1 inst2), robust
Modèles GMM - STATA 9
Exemple : ivreg2 y x1 (x2 = inst1 inst2), gmm robust
,→ Dans STATA 10, une seule commande : ivregress
ivregress 2sls y x1 (x2 = inst1 inst2), vce(robust)
ivregress gmm y x1 (x2 = inst1 inst2), vce(robust)
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Quelques tests pour séries temporelles
Tests de racine unitaire ou de stationnarité
Test de Dickey-Fuller et tests ADF :
dfuller variable, lags(n) noconstant trend
Test de Phillips-Perron :
pperron variable, lags(n) noconstant trend
Test KPSS : kpss variable, lags(n) notrend
Tests d'autocorrélation des erreurs (après une régression)
Test de Durbin-Watson : estat dwatson
Test de Breusch-Godfrey : estat bgodfrey, lags(n)
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Utilisation des données de panel
Pour dénir la nature de panel des données, il faut utiliser la
commande :
tsset var_individu var_temporelle [, options]
Par exemple : tsset id quarter, quarterly
xtsum : permet d'obtenir des stats descriptives intra- et
inter-individuelles (Version panel de sum)
xttab : calcule les fréquences intra- et inter-individuelles
(Version panel de tab)
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Quelques modèles pour données de panel
Modèle à eets xes
Exemple : xtreg y x1 x2, fe
Modèle à eets aléatoires
Exemple : xtreg y x1 x2, re
Modèle avec variables instrumentales
Exemple : xtivreg y x1 (x2 = inst1 inst2), fe
Modèle GMM en panel
Exemple : xtivreg2 y x1 (x2 = inst1 inst2), fe gmm
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Modèles de panel dynamique estimés par GMM : commande
xtabond2
dierence-GMM
Estimateur de Arellano & Bond (1991) -
Exemple : xtabond2 y L.y x1 x2, robust small noleveleq
gmmstyle(L.y x1) ivstyle(x2)
system-GMM
Estimateur de Blundell & Bond (1998) -
Exemple : xtabond2 y L.y x1 x2, robust small
gmmstyle(L.y x1, lags(2 .) collapse)
ivstyle(x2, lags(1 .) collapse)
,→ Plus d'infos sur cette commande :
Roodman D. (2006): "How to do xtabond2: An introduction to
dierence and system GMM in Stata", Center for Global
Development, Working Paper 103, Washington.
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Variables qualitatives en panel
Probit à eets aléatoires
Exemple : xtprobit y x1 x2, re
Logit à eets xes
Exemple : xtlogit y x1 x2, fe
Probit ordonné à eets aléatoires
Exemple : reoprobit y x1 x2
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Quelques tests pour données de panel
Tests de racine unitaire ou de stationnarité
Test de Levin, Lin & Chu (LLC) :
levinlin variable, lags(n) noconstant trend
Test de Im, Pesaran & Shin (IPS) :
ipshin variable, lags(n) trend nodemean
Test d'Hadri : hadrilm variable, lags(n) notrend
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Meta-analyse avec STATA
Pas de commande unique pour la meta-analyse, mais une suite
complète de modules développés par les utilisateurs
meta et metan : stats et forest plot
metareg : régression
metafunnel et metabias : funnel plot et tests d'asymétrie
metatrim : "trim and ll" method
metainf : tests de sensibilité
...
,→ Plus d'infos sur ces commandes :
[Link]
[Link]
systreviews/pdfs/[Link]
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Exportation des tableaux de résultats
Exportation en chier ASCII (.out) ou Word (.doc) :
commande outreg
regress y x1 x2
outreg using [Link], title("Table 1") ctitle("A")
regress y x1 x2 x3
outreg using [Link], append ctitle("B")
type [Link]
AT X(.tex) : commande
Exportation au format L E est2tex
,→ Plus d'infos dans le guide de F. Bresson :
[Link]
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Ajout de nouvelles commandes
Pour installer de nouveaux modules à Stata (chiers .ado et .hlp) :
ssc install nom_du_module , all
Par exemple :
ssc install xtabond2, all
ssc install levinlin, all
Pour voir les nouveaux modules disponibles pour Stata (environ 50
modules depuis janvier 2008 !):
[Link]
Nathalie Colombier & Julien Licheron Introduction à STATA
Intro Fichiers Traiter les Variables Stats Des. Vbles Quali. Séries Temp. Panel Extensions
Trouver de l'aide. . .
Aide interne à Stata : help command
Manuels ociels Stata : complètent l'aide en ligne et donnent
des exemples
Site(s) Web de Stata et du Stata Journal :
[Link]
[Link]
[Link]
. . . et également la Statalist !
[Link]
Nathalie Colombier & Julien Licheron Introduction à STATA