0% ont trouvé ce document utile (0 vote)
21 vues20 pages

Introduction à Stata et analyse de données

Ce document présente les principales commandes et fonctionnalités du logiciel Stata pour l'analyse de données. Il décrit les étapes de lecture, organisation, description, manipulation et analyse de données, ainsi que la création de graphiques et l'organisation du travail dans Stata.

Transféré par

ayoubhaouas
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PPT, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
21 vues20 pages

Introduction à Stata et analyse de données

Ce document présente les principales commandes et fonctionnalités du logiciel Stata pour l'analyse de données. Il décrit les étapes de lecture, organisation, description, manipulation et analyse de données, ainsi que la création de graphiques et l'organisation du travail dans Stata.

Transféré par

ayoubhaouas
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PPT, PDF, TXT ou lisez en ligne sur Scribd

Saad-Ellah Berhili

Plan de la présentation

I. Lecture et organisation de données


II. Analyse de données
III. Graphiques
IV. Organisation du travail
V. Les commandes indispensables

2
I. Lecture et organisation de
données
4
Choisir le répertoire de travail
 Changer le répertoire : cd
 lister les fichiers de données stata présents
dans le répertoire: dir *.dta
 Copier ou supprimer un fichier : copy, erase

5
Syntaxe stata
 [by varlist:] command [varlist] [=exp] [if exp]
[in range] [weight] [using filename] [, options]

 Abréviations des commandes : d (describe),


di (display), gen (generate)
 Aide : help
 Rechercher des fonctions : findit
 Augmenter la mémoire : set memory 500m
 Vider la mémoire : clear
 Arrêter l’exécution : q ou Ctrl-c
6
Utilisation de données
 Ouvrir des fichiers stata : use, sysuse, webuse
 Importation de fichiers non stata : insheet (1
observation par ligne), infix (format fixe), infile
(plus d’1 observation par ligne), infile using
dictionary (exemple fichier inspection)
 Sauvegarder les données : save (avec l’option
replace)
 Fusionner deux ou plusieurs fichiers de
données : append (par variable), merge (par
observation).
 Changer la structure des données : reshape 7
Description des données
 Description des données : describe
 Lister les observations : list
 Optimiser le format des données : compress
 Données sommaires : summarize
 Données manquantes : missing
 Lister les données avec l’éditeur : browse au
lieu de edit
 Tableau de fréquences : tabulate
 Tableaux croisés : table
 Par sous-groupe de données : by, bysort
8
Manipulation des données
 Créer de nouvelles variables : generate, egen
 Variables indicatrices: gen y = x!=0
 Remplacer des valeurs : replace
 Trier les données : sort
 Garder ou supprimer des données : keep, drop
 Renommer : rename
 Ordonner les variables : order

9
Opérateurs dans stata

Arithmetic Logical Relational

+ addition & and > greater than


- subtraction | or < less than
* multiplication ! not >= > or equal
/ division ~ not <= < or equal
^ power == equal
- negation != not equal
+ string concatenation ~= not equal

10
II. Analyse de données
Régression linéaire
 sysuse auto
 reg price mpg
Source SS df MS Number of obs = 74
F( 1, 72) = 20.26
Model 139449474 1 139449474 Prob > F = 0.0000
Residual 495615923 72 6883554.48 R-squared = 0.2196
Adj R-squared = 0.2087
Total 635065396 73 8699525.97 Root MSE = 2623.7

price Coef. Std. Err. t P>t [95% [Link]]

mpg -238.8943 53.07669 -4.50 0.000 -344.7008 -133.0879


_cons 11253.06 1170.813 9.61 0.000 8919.088 13587.03

12
III. Graphiques
Création de graphiques
 Utiliser le menu de préférence
 Nuage de points : scatter price mpg (fichier auto)
 Histogramme : hist price
 Courbe : line (séries temporelles)
 Droite de régression : reg price mpg
predict py
line py mpg
 Deux graphiques superposés :
twoway (sc price mpg) || (line py mpg)
 Exporter le graphique : graph export [Link] 14
15,000
10,000
5,000
0

10 20 30 40
Mileage (mpg)

Price Fitted values


IV. Organisation du travail

16
Garder une trace de votre
travail
 1) Fichier log :
log using test

Commandes stata

log close
view [Link]

 2) Fichier do :
do [Link] 17
V. Les indispensables
Les 40 indispensables
 Pour l’aide : help, search, hsearch
 Mise à jour : update, net, ado
 Interface du système d’opération : cd, dir, copy, erase
 Utilisation et sauvegarde des données : use, save, append,
merge, compress
 Création et importation de données : input, edit, infile, infix,
insheet
 Description et reporting des données : describe, codebook, list,
browse, count, inspect, table, tabulate
 Manipulation de données : generate, replace, egen, drop, sort,
encode, decode, order, by, reshape
 Organisation du travail : log
 Utilisation comme calculatrice : display
19
Merci !!!
20

Vous aimerez peut-être aussi