Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Initiation à R
Chargé de cours : Idir Ouassou
Université Cadi Ayyad,
Ecole Nationale des Sciences Appliquées
Marrakech
[Link]@[Link]
26-11-2024
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Plan du chapitre
1 Généralités sur le logiciel R
Généralités
Obtenir R
Coment obtenir de l’aide pour utiliser R ?
Le console R
Commennt utiliser R ?
Base et packages additionnels
Quelques commandes basiques pour R
2 Les objets R
3 Manipulation d’Objets R
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Généralités
Généralités sur le logiciel R
le logiciel R à la fois logiciel de statistique et langage de
programmation.
Logiciel libre, gratuit et multiplateforme, développé par des
bénévoles.
Utilisable en ligne de commande, ou via une interface
graphique : R Commander.
Logiciel le plus utilisé dans la recherche en sciences
humaines et bio-médicales, ......
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Généralités
Références
P.-A. Cornillon et co-auteurs : Statistique avec R. Presses
universitaires de Rennes, 2012.
M. Maumy-Bertrand et F. Bertrand : Initiation à la
statistique avec R. Dunod, 2010
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Obtenir R
Obtenir R
On peut trouver le logiciel R sur son site officiel :
le CRAN (Comprehensive R Archive Network)
http ://[Link]/
R est disponible sur Windows
R est disponible sur toutes les distributions Linux.
Pour Mac OS X, en fonction de la version de votre OS
(10.4, 10.6, 10.9, ...),
R peut nécessiter l’installation de certains logiciels tiers
pour fonctionner correctement. Consulter la FAQ
spécifique sur CRAN.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Coment obtenir de l’aide pour utiliser R ?
Coment obtenir de l’aide pour utiliser R ?
Une communauté d’utilisateurs très active, à retrouver sur :
http : //[Link] /logiciel − R/[Link]
De la documentation en Français et en Anglais sur le
CRAN :
http : //cran.r − [Link]/other − [Link]
R est open source : le code des fonctions peut être
consulté (simplement en tapant leur nom dans la console
R !), et l’aide de chaque fonction fournit l’adresse mail de
son auteur.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Le console R
Le console R
R se présente basiquement comme une console.
Le signe > (prompt) en début de ligne indique R est prêt à
recevoir une commande.
Tester les commandes suivantes (touche Entrée pour les
exécuter) :
> 3+8
> 7^4
> 5*9
> 17-12
> 45/5
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Le console R
Le console R
Si vous interrompez la saisie d’une commande en
appuyant trop tôt sur la touche Entrée,
R offre la possibilité de compléter la saisie de la
commande sur la ligne suivante , la ligne commence alors
par le symbole + :
> 9-
+1
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Commennt utiliser R ?
Commennt utiliser R ?
Il y a plusieurs approches possibles pour utiliser le logiciel :
Utiliser le langage R en saisissant des lignes de
commandes directement dans la console R (déconseillé).
Utiliser uniquement l’interface graphique R Commander, et
réaliser toutes les analyses « à la souris » ( déconseillé).
Utiliser un EDI (environnement de développement intégré)
tel que R Studio, intégrant à la fois
un éditeur de script,
une console R
plusieurs raccourcis utiles.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Base et packages additionnels
Base et packages additionnels
R est livré avec une certaine collection de fonctions de
base, permettant de réaliser les tâches les plus courantes
représentations graphiques usuelles,
estimations
tests classiques, etc..
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Base et packages additionnels
Base et packages additionnels
Pour mettre en œuvre des méthodes "rares" ou
spécifiques à une discipline, il existe plusieurs centaines
de packages additionnels, dont on peut obtenir la liste
grâce à la commande :
[Link]()
Il n’est nécessaire de les installer qu’une seule fois, mais
ils doivent ensuite être chargés à chaque démarrage du
logiciel grâce à la commande library.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Quelques commandes basiques pour R
Quelques commandes basiques pour R
Trouver une commande répondant à un besoin précis
(accès Internet requis) :
RSiteSearch(" ")
Exemple
RSiteSearch("mantel mean").
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Quelques commandes basiques pour R
Quelques commandes basiques pour R
Obtenir de l’aide sur une commande :
help()
Exemple
help(mean))
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Quelques commandes basiques pour R
Quelques commandes basiques pour R
Installer un package additionnel :
[Link](" ")
Exemple
Pour l’installer l’interface graphique,
[Link]("Rcmdr", dep=TRUE)
Charger un package additionnel :
library()
Exemple
Pour charger l’interface graphique :
library(Rcmdr)
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Plan du chapitre
1 Généralités sur le logiciel R
2 Les objets R
Objets basiques
Vecteur
Facteur
Matrice
Liste
Data frame
3 Manipulation d’Objets R
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Les objets R
Définition (Objet)
Un objet R est une " boîte étiquetée " dans laquelle vous
pouvez placer l’information qui vous intéresse.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Les objets R
Les variables, les données, les fonctions, les résultats
d’analyses sont stockés dans des objets.
Il existe plusieurs types d’objets : vecteurs, facteurs, etc.
Lorsque l’on importe un fichier dans R, on obtient dans R
un objet nommé data frame.
Les principaux objets seront présentés dans la suite .
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Les objets R
Les objets sont caractérisés par
z leur nom,
z leur contenu
z des attributs qui vont spécifier le type de données
représenté par l’objet.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Les objets R
z Le nom d’un objet
doit commencer par une lettre
peut comporter des lettres, des chiffres, des points et des
espaces soulignés.
z R distingue les majuscules des minuscules pour les noms
des objets,
Exemple
C’est-à-dire que z et Z nommeront des objets distincts.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Les objets R
z Les objets ont tous au moins deux attributs : le mode et la
longueur.
z Le mode est le type des éléments d’un objet. Il en existe
quatre principaux :
numérique,
caractère,
complexe,
logique (FALSE ou TRUE).
z Pour connaître le mode d’un objet on utilise la commande
mode( ).
z Pour connaître la longueur d’un objet on utilise la
commande length( ).
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Les objets R
z Plus formellement, il s’agit d’un espace de stockage dans
la mémoire de R, auquel on va donner un nom, et que l’on
va remplir avec un certain type d’information ou de
données.
z On peut ensuite y accéder à tout moment et réutiliser
cette information ou ces données dans le cadre de calculs,
de tests, etc.
z Ces objets peuvent être de différents types : c’est une
notion importante car chaque fonction de R ne peut
travailler qu’avec un type précis d’objet.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Les objets R
z On crée des objets en utilisant l’opérateur = ou − > ou
< −.
z Le mode et le type de l’objet ainsi créé sont généralement
déterminés de façon implicite.
z Il est possible de créer un objet en précisant son mode, sa
longueur, son type, etc.
z On peut aussi créer des objets à partir d’autres objets.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Les objets R
Le tableau 1 suivant indique les modes possibles pour les
objets :
z vecteur,
z facteur,
z array,
z matrice,
z [Link],
z ts
z liste.
1. tableau tiré du document R pour les débutants d’Emmanuel Paradis
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Les objets R
Objet Modes
vecteur num, car, comp, log
facteur num, car
array num, car, comp, log
matrice num, car, comp, log
[Link] num, car, comp, log
ts num, car, comp, log
liste num, car, comp, log, fonction, expression
num = numérique, car = caractère, comp = complexe, log =
logique, ts = les données de type séries temporelles.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Valeurs manquantes
Les valeurs manquantes sont représentées par NA (Not
Avalaible) quel que soit l’objet ou le mode.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Objets basiques
Objets basiques
z L’objet le plus basique est une constante, qui peut être
numérique,
complexe,
caractère,
logique.
z On affecte directement une valeur à un objet.
z L’objet n’a pas besoin d’être déclaré.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Objets basiques
Objets basiques
Exemple
Par exemple, on saisit sur la console : n = 8.
z On tape ensuite n pour afficher sa valeur.
z On obtient le résultat suivant :
[1] 8
Remarque
Le symbole [1] indique que l’affichage commence au premier
élément de n.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Objets basiques
Objets basiques
On aurait également pu affecter une valeur à l’objet n en
utilisant le signe < − ou − > :
Exemple
>n <- 8
>n
[1] 8
>8 -> n
>n
[1] 8
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Objets basiques
Objets basiques
Dans la suite du document, on utilisera le symbole " = ".
Exemple
>x=1
>x
[1] 1
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Objets basiques
Objets basiques
Si on affecte une valeur à un objet existant, sa valeur
précédente est effacée :
Exemple
>x = 10
>x
[1] 10
>y = 10 + 2
>y
[1] 12
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Objets basiques
Objets basiques
On utilise " ; " pour séparer des commandes distinctes sur la
même ligne :
Exemple
>w = 12 ; name = " Marwa "; dicton = "Aide-toi,
le bon Dieu t’aidera";
>w ; name ; dicton
[1] 12
[1] "Marwa"
[1] "Aide-toi, le bon Dieu t’aidera"
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Vecteur
Vecteur
Définition
Un vecteur est une suite indexée de valeurs toutes du même
type
Soit une suite de
nombres,
caractères,
complexes, etc.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Vecteur
Comment saisir un vecteur
z On peut saisir un vecteur avec
la commande c( ).
La fonction vector ().
z La fonction vector () a deux arguments :
le mode des éléments qui compose le vecteur
la longueur du vecteur.
z < − est l’opérateur d’affectation : il sert à ranger une
certaine information dans un certain objet.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Vecteur
Vecteur
Exemple
> x <- c(2,5.9,6.2,8.3)# définir un vecteur x
> x # afficher x
[1] 2.0 5.9 6.2 8.3
> x[1] # accéder au premier élément de x
[1] 2
> x[3] # accéder au troisième élément de x
[1] 6.2
> x[c(1,2)]#acceder aux éléments n° 1 et 2 de x
[1] 2.0 5.9
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Vecteur
Vecteur
Exemple
>a = vector("numeric", 5) ou a = numeric(5)
>b = vector("character",5) ou b = character(5)
>c = vector("logical", 5) ou c = logical(5)
>d = vector("complex", 5) ou d = complex(5)
Si on tape sur la console a ; b ; c ; d, le résultat suivant
s’affiche :
[1] 0 0 0 0 0
[1]"" "" "" "" ""
[1] FALSE FALSE FALSE FALSE FALSE
[1] 0+0i 0+0i 0+0i 0+0i 0+0i
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Vecteur
Vecteur
On peut également construire un vecteur à l’aide de la fonction
c()
Exemple
>vect = c(5, 7.2, 3.6, 4.9);
>vect
[1] 5.0 7.2 3.6 4.9
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Facteur
Facteur
Définition
Un facteur est un vecteur qui contient uniquement des données
qualitatives.
La fonction factor() crée des variables qualitatives nominales.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Facteur
Facteur
Exemple
factor(x, levels=sort(unique(x), [Link]=TRUE),
labels = levels, exclude = NA,
ordered = [Link](x))
z levels : spécifieles valeurs que peuvent prendre les
éléments du facteur.
z labels : définit les noms des niveaux
z exclude : définit les valeurs de x à ne pas inclure dans les
niveaux.
z ordered : argument logique spécifiant si les niveaux du
facteur sont ordonnés.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Facteur
Facteur
Exemple
> fac <- c("a", "a", "b", "a", "b")
> fac # à ce stade, fac n’est pas un facteur
[1] "a" "a" "b" "a" "b"
> fac <- factor(fac)# on le convertit en facteur
> fac # la gestion est alors diff\’erente!
[1] a a b a b
Levels: a b
> levels(fac) # lister les niveaux du facteur
[1] "a" "b"
> nlevels(fac) # nombre de niveaux du facteur
[1] 2
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Facteur
Facteur
Exemple
>factor(1:3)
[1] 1 2 3
Levels: 1 2 3
>factor(1:3, levels = 1:5)
[1] 1 2 3
Levels: 1 2 3 4 5
> factor(1:3,levels=1:5,
labels=c("A","B","C","D","E"))
[1] A B C
Levels: A B C D E
>factor(c(5,7,8,9), levels=5 :8)
[1] 5 7 8 <NA>
Levels : 5 6 7 8
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Facteur
Facteur
z 9 ne fait pas partie des levels (ensemble de définition).
z Le chiffre 9 est donc codé comme valeur manquante.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Facteur
Facteur
Exemple
10 personnes ont répondu à une enquête de satisfaction
auto-administrée.
Le degré de satisfaction est recueilli à partir d’une variable
comportant les 4 modalités suivantes :
1 très satisfait
2 satisfait
3 insatisfait
4 pas du tout satisfait
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Facteur
Facteur
Exemple (suite)
Voici les réponses des répondants : 1 1 2 3 1 0 4 2 3 4.
Définissez un facteur dans R pour coder ces réponses.
factor(c(1,1,2,3,1,0,4,2,3,4),levels=1:4)
[1] 1 1 2 3 1 <NA>4 2 3 4
Levels: 1 2 3 4
z La réponse 0 ne fait pas partie du domaine de définition.
z Elle est codée comme valeur manquante < NA >.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Matrice
Matrice
Définition
Une matrice est un tableau constitué de valeurs toutes du
même type : des nombres, des caractères, etc.
Chaque valeur est indexée par son numéro de ligne et de
colonne.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Matrice
Matrice
Exemple
> M <- matrix(c(1,2,3,4), ncol=2)
> M # afficher la matrice
[,1] [,2]
[1,] 1 3
[2,] 2 4
> M[1,2] # la valeur en ligne 1 et colonne 2
[1] 3
> M[ ,1] # le contenu de toute la colonne 1
[1] 1 2
> M[2, ] # le contenu de toute la ligne 2
[1] 2 4
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Matrice
Matrice
Remarque
z Une matrice est un vecteur qui possède un argument
supplémentaire qui définit les dimensions de la matrice.
z Tous les éléments d’une matrice doivent être de même
mode.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Matrice
Comment saisir une matrice
matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)
z data : les données
z nrow : permet de donner le nombre de lignes
z ncol : permet de donner le nombre de colonnes
z byrow : indique si les valeurs données par data doivent
remplir successivement les colonnes (FALSE, par défaut)
ou les lignes (si TRUE).
z dimnames : permet de donner des noms aux lignes et
colonnes.
z colnames() : permet de donner des noms aux colonnes
z rownames() : permet de donner des noms aux lignes
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Matrice
Matrice
Exemple
matrix(0, 5, 7)
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] 0 0 0 0 0 0 0
[2,] 0 0 0 0 0 0 0
[3,] 0 0 0 0 0 0 0
[4,] 0 0 0 0 0 0 0
[5,] 0 0 0 0 0 0 0
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Matrice
Matrice
Exemple
>x = 1:20
> x
[1] 1 2 3 4 5 6 7 8 9 10 11 12
[13] 13 14 15 16 17 18 19 20
>mat1 = matrix(x, 4, 5)
> mat1
[,1] [,2] [,3] [,4] [,5]
[1,] 1 5 9 13 17
[2,] 2 6 10 14 18
[3,] 3 7 11 15 19
[4,] 4 8 12 16 20
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Matrice
Matrice
Exemple
>mat2 = matrix(x, 4, 5, byrow = TRUE)
> mat2
[,1] [,2] [,3] [,4] [,5]
[1,] 1 2 3 4 5
[2,] 6 7 8 9 10
[3,] 11 12 13 14 15
[4,] 16 17 18 19 20
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Matrice
Matrice - fonction paste()
z La fonction paste() est utile dans une situation où on
souhaite nommer les lignes et / ou les colonnes d’une
matrice.
z La fonction paste() permet aussi de concaténer des objets.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Matrice
Matrice
Exemple
> nom_var = paste("V", 1:5, sep = "")
> nom_var
[1] "V1" "V2" "V3" "V4" "V5"
Exemple
> nom_ind = paste("I", 1:4, sep = "")
> nom_ind
[1] "I1" "I2" "I3" "I4"
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Matrice
Matrice
Exemple
> colnames(mat2) = nom_var
> rownames(mat2) = nom_ind
ou bien
> dimnames(mat2)=list(nom_ind, nom_var)
> mat2
V1 V2 V3 V4 V5
I1 1 2 3 4 5
I2 6 7 8 9 10
I3 11 12 13 14 15
I4 16 17 18 19 20
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Liste
Liste
Définition
Une liste est un objet indexé très général permettant de stocker
des informations de type potentiellement différent.
Remarque
z le premier élément peut être un nombre,
z le deuxième un caractère,
z le troisième une matrice, etc.
Les éléments qui compose une liste
z ne sont pas nécessairement du même mode
z ne sont pas nécessairement de la même longueur.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Liste
Liste
z Pour créer une liste, on utilise la commande list()
z Pour accéder au k ème élément d’une liste nommé L, on
utilise une notation en double crochet : L[[k ]].
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Liste
Liste
Exemple
> a = c(1, 2, 3, 4, 5)
> b = c("a", "b", "c")
> liste1 = list(a, b)
> liste1
[[1]]
[1] 1 2 3 4 5
[[2]]
[1] "a" "b" "c"
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Liste
On peut nommer les éléments d’une liste de la manière suivante
Exemple
> names(liste1) = c("L1", "L2") ;
> liste1
$L1
[1] 1 2 3 4 5
$L2
[1] "a" "b" "c"
> liste2 = list(L1 = a, L2 = b)
> liste2
$L1
[1] 1 2 3 4 5
$L2
[1] "a" "b" "c"
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Data frame
Data frame
z Un tableau de données est créé de façon implicite par la
fonction [Link].
z Il s’agit d’un tableau de données à n lignes (1 ligne = 1
individu) et p colonnes (1 colonne = 1 variable).
z Il peut y avoir des variables de différents types (des
facteurs, des variables numériques, etc.).
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Data frame
Data frame
Définition
Un data frame est le format par défaut donné par R aux jeux
de données que l’on importe depuis un tableur.
z On peut créer un tableau de données avec la fonction
[Link].
z Tous les éléments de la [Link] doivent être de la
même longueur.
z Dans le cas contraire, l’élément le plus court est recyclé un
nombre entier de fois.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Data frame
Data frame
z Comme dans le cas des matrices, chaque valeur est
repérée par son numéro de ligne et de colonne.
z Si le data frame s’appelle df, la commande df[2,3] permet
d’accéder à la valeur du 2ème individu et de la 3ème variable.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Data frame
Créer un Objet à partir d’un autre
Pour créer un Objet à partir d’un autre, on utilise les fonctions
suivantes :
[Link],
[Link],
[Link],
[Link], etc.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Data frame
Vecteur 2 Facteur
Pour créer un facteur à partir d’un vecteur, on utilise la fonction
suivante : [Link], on procède de la manière suivante :
Exemple
> x <- c(1,2,1,2,2)
>x
[1] 1 2 1 2 2
> x <- [Link](x)
>x
[1] 1 2 1 2 2
Levels: 1 2
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Data frame
Vecteur 2 [Link]
Pour créer une [Link] à partir d’un vecteur numérique et
d’un vecteur caractère, on procède de la manière suivante :
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Data frame
Data frame
Exemple
> X= c(1, 2, 3) ; X ; mode(X);
[1] 1 2 3
[1] "numeric"
> Y= c("a", "b", "c") ; Y ; mode(Y)
[1] "a" "b" "c"
[1] "character"
> df = [Link](X,Y)
> df
X Y
1 1 a
2 2 b
3 3 c
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Data frame
Data frame
Pour créer avec une seule instruction une [Link] avec une
variable numérique et une variable caractère :
Exemple
> df2 = [Link](A = 1:6, B = letters[1:6]);
> df2
A B
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
6 6 f
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Data frame
Data frame
Si on juxtapose un vecteur de longueur 6 et un vecteur de
longueur 3, le deuxième vecteur est dupliqué :
Exemple
> A = c(1, 2, 3, 4, 5, 6)
> B = c("a", "b", "c")
> df = [Link](a, b)
>df
A B
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
6 6 f
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Data frame
Data frame
Il faut donc que la longueur de l’un des vecteurs soit un multiple
de la longueur de l’autre vecteur :
Exemple
>A = c(1, 2, 3, 4, 5)
>B = c("a", "b", "c")
>df = [Link](A, B)
Error in [Link](a, b) :
arguments imply differing number of rows: 5, 3
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Plan du chapitre
1 Généralités sur le logiciel R
2 Les objets R
3 Manipulation d’Objets R
Conversion de modes
Manipulation d’un vecteur
Manipulation d’un data frame
Importer des fichies de données
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Conversion de modes
Conversion de modes
le type d’un objet est une caractéristique "flottante",
modifiable.
Il existe des fonctions pour convertir un objet vers un
nouveau type (sans en modifier le contenu), afin qu’il soit
traité différemment.
Dans de nombreuses situations pratiques, il est utile de
convertir le mode d’un objet en un autre.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Conversion de modes
Conversion de modes
Une telle conversion sera possible grâce à une fonction de la
forme :
[Link]
[Link],
[Link],
[Link]
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Exemples
Conversion de modes
Convertir des objets de mode logical en mode numeric
Exemple
> logique = c(FALSE, FALSE, TRUE, TRUE,
FALSE, TRUE)
conversion_numerique = [Link](logique)
conversion_numerique
[1] 0 0 1 1 0 1
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Exemples
Conversion de mode
Convertir des objets de mode character en mode numeric
Exemple
>caractere =c("1", "2","3", "A", "/", "T","%")
conversion_numerique = [Link](caractere)
>Warning message:
NAs introduced by coercion
conversion_numerique
[1] 1 2 3 NA NA NA NA
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Exemples
Conversion de mode
Convertir des objets de mode numeric en mode logical
Exemple
>numerique = 0:5
>conversion_logique1 = [Link](numerique)
>conversion_logique1
[1] FALSE TRUE TRUE TRUE TRUE TRUE
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Exemples
Conversion de mode
Convertir des objets de mode character en mode logical
Exemple
> caractere = c("FALSE","TRUE","F","T","false",
+ "t","A","(")
> conversion_logique2 = [Link](caractere)
> conversion_logique2
[1] FALSE TRUE FALSE TRUE FALSE NA NA NA
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Exemples
Conversion de mode
Convertir des objets de mode numeric en mode character
Exemple
numerique = 1:8
conversion_caractere1 = [Link](numerique)
conversion_caractere1
[1] "1" "2" "3" "4" "5" "6" "7" "8"
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Exemples
Conversion de mode
Convertir des objets de mode logical en mode character
Exemple
logique = c(TRUE, FALSE)
conversion_caractere2 = [Link](logique)
conversion_caractere2
[1] "TRUE" "FALSE"
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un vecteur
Manipulation d’un vecteur
Quelques commandes élémentaires à utiliser sur des vecteurs
numériques :
Exemple
> x<- c(10,12,8,10) # ex.: des notes sur 20
>x
[1] 10 12 8 10
> mean(x) # calculer la moyenne de x
[1] 10
> length(x) # nb de valeurs dans x
[1] 4
> max(x) # maximum de x
[1] 12
> x/2 # les memes notes sur 10
[1] 5 6 4 5
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un vecteur
Manipulation d’un vecteur
Exemple (suite)
> x<- c(12,14,9,10.5) # ex.: des notes sur 20
> y <-c(8.5,14)# on saisit deux nouvelles notes
> z <- c(x,y)# z = regoupe celle de x et y
> z # afficher z
[1] 12.0 14.0 9.0 10.5 8.5 14.0
> c(y,x) # attention à l’ordre :
+ c(x,y) est diferent de c(y,x)!
[1] 8.5 14.0 12.0 14.0 9.0 10.5
> z[2:4] # 1:3 est un raccourci pour c(2,3,4)
[1] 14.0 9.0 10.5
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un vecteur
Manipulation d’un vecteur
Exemple (suite)
> z[-2] # afficher tous les elements de z
+ sauf le numero 2
[1] 12.0 9.0 10.5 8.5 14.0
> sort(z) # tri croissant de z
[1] 8.5 9.0 10.5 12.0 14.0 14.0
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un vecteur
Manipulation d’un vecteur
On peut attribuer des noms à chaque valeur de z :
Exemple (suite)
> names(z) <- c("Ali","Med.","Ismail","Hajar",
+ "Youssef","Marwa")
> z
Ali Med. Ismail Hajar Youssef Marwa
12.0 14.0 9.0 10.5 8.5 14.0
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un vecteur
Manipulation d’un vecteur
On peut alors accéder aux valeurs par leur nom plutôt que leur
index :
Exemple (suite)
> z["Ismail"]
Ismail
11
> z["Ismail"] <- 11 # changer la note d’Ismail
> z # afficher la s\’erie de notes corrig\’ee
Ali Med. Ismail Hajar Youssef Marwa
12.0 14.0 11.0 10.5 8.5 14.0
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un data frame
Manipulation d’un data frame
Chaque feuille de données importée dans R se verra
attribuer la class [Link].
Il est donc essentiel de savoir manipuler de tels [Link]
puisqu’ils seront à la base de toute pratique de R.
Nous allons voir les principales fonctions à connaître pour
cette classe d’objets, et surtout, la façon d’importer un data
frame dans R !
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un data frame
Répertoire courant
Définition
Le répertoire courant d’une session R est le répertoire où le
logiciel ira chercher les feuilles de données, sauvegarder les
résultats, figures, etc.
Il est donc essentiel qu’il soit correctement défini, à chaque fois
que l’on ouvre le logiciel.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un data frame
Répertoire courant
X Sous Windows : aller dans Fichier > Changer le répertoire
courant.
X Sous Linux : il suffit tout simplement d’ouvrir une console
directement dans le répertoire où l’on souhaite travailler.
X Sous Mac OS : icône Divers > Changer de répertoire de
travail.
X Tous OS : utiliser la commande setwd() dans la console
R.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un data frame
Mise en forme des données
Important :
Utiliser R implique de respecter les conventions usuelles de
mise en forme des feuilles de données, faute de quoi il sera
impossible de les charger !
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un data frame
Mise en forme des données
1 Pour éviter les soucis, texte brut uniquement (.txt, .csv) :
jamais de .xls ou .ods, encore moins de .xsl.
2 Aucune mise en forme autorisée ;
fusion de cellules interdite ;
les informations ne sont indiquées que par du texte,
jamais par de la mise en forme ou des couleurs.
3 Une ligne correspond à un individu
4 Une colonne correspond à une variable
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un data frame
Mise en forme des données
1 Doublons interdits dans les noms des individus.
2 Noms de variables courts et sans espaces (utiliser des
underscores à la place)
3 Jamais de ligne ou de colonne vide ou aérer ou séparer.
4 Certains caractères spéciaux sont interdits : #, guillemets,
apostrophes,
5 Autres caractères spéciaux (accents, espaces, lettres
grecques) fortement déconseillés pour éviter les
problèmes d’encodage.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un data frame
Mise en forme des données
1 Les données manquantes s’indiquent de préférence par
une case vide, ou sinon par un codage unique qui sera
spécifié au logiciel est : NA (Not Available).
2 Pas de case vide si les données sont connues.
3 Séparateur décimal : point ou virgule, unique pour tout le
jeu de données.
4 Utiliser la fonction "Commentaire" de votre tableur pour
toute information qui n’a rien à voir avec le traitement
statistique.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Manipulation d’un data frame
Mise en forme des données
Conclusion :
Penser à vérifier minutieusement les données avant toute
analyse.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Importer des fichies de données
Importer une feuille de donnée
La commande générale à utiliser est [Link], ou plus
spécifiquement [Link] ou read.csv2 pour les fichiers CSV.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Marche à suivre
Importer une feuille de donnée
1 Lancer l’application ( Excell sous Microsof où OpenOffice
sous Mac)
2 Saisir les données (si vous n’avez pas les données)
3 Enregistrer les données sous le nom TPR en format CSV
dans le dossier Documents :
Fichier ? Enregistrer sous.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Marche à suivre
Importer une feuille de donnée
1 Lancer le logiciel R.
2 Choisir comme directoire de travail le dossier dans lequel
le fichier [Link] a été enregistré : Documents (Changer
le repertoire courant si vous voulez)
3 Vérifier que le fichier que l’on souhaite importer se trouve
bien dans le réepertoire de travail :
> dir()
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Marche à suivre
Importer une feuille de donnée
1 Importer les données du fichier [Link] en inscrivant
dans la console de R la commande :
> data <- [Link](file="[Link]")
2 Vérifier que l’importation s’est déroulée correctement :
> data
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Marche à suivre
Importer une feuille de donnée
Exemple
Après avoir défini correctement le répertoire courant, exécuter
la commande :
> dat <- [Link]("data_TPR.csv", header=TRUE, row.n
sep=";", dec=",", [Link]="")
Le jeu de données correspondant au fichier
"data_TPR.csv"
sera désormais stocké dans l’objet R dat.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Marche à suivre
Importer une feuille de donnée
Pour des détails à propos de chaque argument de la
commande, consulter l’aide de la fonction [Link].
Remarque
la commande [Link] convient par défaut aux fichiers en
norme anglaise (séparateur de colonnes = virgule, séparateur
décimal = point), tandis que la commande read.csv2 convient
par défaut aux fichiers en norme française (séparateur de
colonnes = point-virgule, séparateur décimal = virgule).
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Marche à suivre
Importer une feuille de donnée
Si le fichier est en norme française, la simple commande :
> dat <- read.csv2("data_TPR.csv", [Link]="")
suffit à le charger correctement.
Généralités sur le logiciel R Les objets R Manipulation d’Objets R
Marche à suivre
Importer une feuille de donnée
SI le fichier est en norme anglaise, la simple commande :
> dat <- read.csv2("data_TPR.csv2", [Link]="")
suffit à le charger correctement.