Saad-Ellah Berhili
Plan de la présentation
I. Lecture et organisation de données
II. Analyse de données
III. Graphiques
IV. Organisation du travail
V. Les commandes indispensables
2
I. Lecture et organisation de
données
4
Choisir le répertoire de travail
Changer le répertoire : cd
lister les fichiers de données stata présents
dans le répertoire: dir *.dta
Copier ou supprimer un fichier : copy, erase
5
Syntaxe stata
[by varlist:] command [varlist] [=exp] [if exp]
[in range] [weight] [using filename] [, options]
Abréviations des commandes : d (describe),
di (display), gen (generate)
Aide : help
Rechercher des fonctions : findit
Augmenter la mémoire : set memory 500m
Vider la mémoire : clear
Arrêter l’exécution : q ou Ctrl-c
6
Utilisation de données
Ouvrir des fichiers stata : use, sysuse, webuse
Importation de fichiers non stata : insheet (1
observation par ligne), infix (format fixe), infile
(plus d’1 observation par ligne), infile using
dictionary (exemple fichier inspection)
Sauvegarder les données : save (avec l’option
replace)
Fusionner deux ou plusieurs fichiers de
données : append (par variable), merge (par
observation).
Changer la structure des données : reshape 7
Description des données
Description des données : describe
Lister les observations : list
Optimiser le format des données : compress
Données sommaires : summarize
Données manquantes : missing
Lister les données avec l’éditeur : browse au
lieu de edit
Tableau de fréquences : tabulate
Tableaux croisés : table
Par sous-groupe de données : by, bysort
8
Manipulation des données
Créer de nouvelles variables : generate, egen
Variables indicatrices: gen y = x!=0
Remplacer des valeurs : replace
Trier les données : sort
Garder ou supprimer des données : keep, drop
Renommer : rename
Ordonner les variables : order
9
Opérateurs dans stata
Arithmetic Logical Relational
+ addition & and > greater than
- subtraction | or < less than
* multiplication ! not >= > or equal
/ division ~ not <= < or equal
^ power == equal
- negation != not equal
+ string concatenation ~= not equal
10
II. Analyse de données
Régression linéaire
sysuse auto
reg price mpg
Source SS df MS Number of obs = 74
F( 1, 72) = 20.26
Model 139449474 1 139449474 Prob > F = 0.0000
Residual 495615923 72 6883554.48 R-squared = 0.2196
Adj R-squared = 0.2087
Total 635065396 73 8699525.97 Root MSE = 2623.7
price Coef. Std. Err. t P>t [95% [Link]]
mpg -238.8943 53.07669 -4.50 0.000 -344.7008 -133.0879
_cons 11253.06 1170.813 9.61 0.000 8919.088 13587.03
12
III. Graphiques
Création de graphiques
Utiliser le menu de préférence
Nuage de points : scatter price mpg (fichier auto)
Histogramme : hist price
Courbe : line (séries temporelles)
Droite de régression : reg price mpg
predict py
line py mpg
Deux graphiques superposés :
twoway (sc price mpg) || (line py mpg)
Exporter le graphique : graph export [Link] 14
15,000
10,000
5,000
0
10 20 30 40
Mileage (mpg)
Price Fitted values
IV. Organisation du travail
16
Garder une trace de votre
travail
1) Fichier log :
log using test
Commandes stata
log close
view [Link]
2) Fichier do :
do [Link] 17
V. Les indispensables
Les 40 indispensables
Pour l’aide : help, search, hsearch
Mise à jour : update, net, ado
Interface du système d’opération : cd, dir, copy, erase
Utilisation et sauvegarde des données : use, save, append,
merge, compress
Création et importation de données : input, edit, infile, infix,
insheet
Description et reporting des données : describe, codebook, list,
browse, count, inspect, table, tabulate
Manipulation de données : generate, replace, egen, drop, sort,
encode, decode, order, by, reshape
Organisation du travail : log
Utilisation comme calculatrice : display
19
Merci !!!
20