0% ont trouvé ce document utile (0 vote)

18 vues19 pages

Introduction aux forêts aléatoires en R

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

18 vues19 pages

Introduction aux forêts aléatoires en R

Transféré par

kamilia

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre 11

Forêts aléatoires

Les commandes utilisées dans ce chapitre font appel aux packages suivants
> #library(randomForest)
> library(ranger)
> library(kernlab)
> library(OOBCurve)
> library(tidymodels)
> library(vip)
> library(rpart)

Les forêts aléatoires sont des algorithmes réputés pour leur capacité à proposer
des prévisions efficaces sur de nombreux jeux de données. Fernández-Delgado
et al. (2014) ont montré à travers une étude comparative de 179 algorithmes sur
121 jeux de données que les forêts aléatoires arrivent régulièrement parmi les
meilleurs algorithmes prédictifs. Cette famille de méthodes possède de plus un
nombre de paramètres restreint qui contribue à faciliter le travail de calibration.
La construction de forêts aléatoires sera illustrée à travers le jeu de données
spam présenté dans la section 1.2.4
> data(spam)
> dim(spam)
## [1] 4601 58
> summary(spam$type)
## nonspam spam
## 2788 1813

Le problème est de prédire la variable binaire type par les 57 autres variables
du jeu de données.
168 Machine learning avec R

11.1 Bagging
Le terme bagging (Breiman (1996)) vient de la contraction de Bootstrap AGGrega-
tING et désigne un ensemble de méthodes permettant d’obtenir des algorithmes
de prévision en agrégeant d’autres algorithmes entraînés sur des échantillons
bootstrap. Considérons un algorithme de prévision

1 ÿ
B
fn (x) = Tb (x)
B
b=1

qui s’écrit comme la moyenne d’autres algorithmes T1 (x), . . . , TB (x). Il est bien
entendu possible d’utiliser plusieurs types algorithmes Tb : une régression linéaire
pour T1 , un arbre pour T2 , une SVM pour T3 , etc. . . Un tel procédé laisse
beaucoup liberté à l’utilisateur pour entraîner les différents algorithmes et rend
l’analyse de l’estimateur final très complexe. C’est pourquoi nous proposons de
construire les Tb de la même façon et sans ajouter de source d’aléa (pour l’instant).
Chaque Tb peut par exemple désigner la règle du 1 plus proche voisin, un arbre
CART utilisant une unique procédure pour choisir la profondeur. . . Sous ce
schéma, les variables aléatoires Tb sont identiquement distribuées. Nous proposons
d’évaluer l’intérêt de ce procédé d’agrégation en comparant les performances de
fn (l’algorithme final) à celles des Tb (les algorithmes que l’on agrège). Rappelons
qu’un algorithme peut être vu comme l’estimateur d’une fonction inconnue, par
exemple la fonction de régression E[Y |X = x] en régression ou les probabilités a
posteriori P(Y = k|X = x), k = 1, . . . , K en classification. La performance d’un
estimateur s’analyse souvent à travers l’étude du compromis biais/variance, nous
proposons donc d’étudier ces quantités pour fn et les Tb . Les Tb , b = 1, . . . , B
étant de même loi, elles possèdent le même biais, la même variance et on montre
que (voir exercice 11.1).

1 ≠ fl(x)
E[fn (x)] = E[T1 (x)] et V[fn (x)] = fl(x)V[T1 (x)] + V[T1 (x)],
B
(11.1)
où fl(x) = corr(T1 (x), T2 (x)) est le coefficient de corrélation entre les prévisions
de 2 algorithmes au même point x. Plusieurs messages importants se déduisent de
ces résultats. Du point de vue du biais, la procédure d’agrégation n’est d’aucun
intérêt puisque l’espérance de l’algorithme agrégé est la même que celle des
algorithmes qu’on agrège. L’éventuel gain se mesure donc à travers la variance.
Lorsque B est grand on a V[fn (x)] ¥ fl(x)V[T1 (x)], cela signifie que la variance
des Tb (x) est diminué d’un facteur proportionnel à fl(x) qui varie entre 0 et 1
(voir exercice 11.1).
Considérons deux scénarios extrêmes :

1. Les Tb sont tous entraînés sur l’échantillon initial. Si il n’y a pas d’aléa
supplémentaire dans la construction des Tb , ils vont tous renvoyer les mêmes
prévisions, fn est alors équivalent à T1 et l’agrégation n’est d’aucune utilité.
Chapitre 11. Forêts aléatoires 169

2. Les Tb sont entraînés sur des sous-échantillons disjoints de l’échantillon

initial. En plus d’être identiquement distribuées, les Tb sont alors indé-
pendants et on déduit que ﬂ(x) = 0. Cependant utiliser des échantillons
disjoints contraint le nombre d’itérations B ainsi que la taille des sous-
échantillons. Chaque Tb est ainsi entraîné sur peu de données et risque de
posséder un biais et une variance élevés. Le biais de fn est donc également
important et rien ne garantit que sa variance, donnée par V[T1 (x)]/B, soit
meilleure que celle de T1 entraînée sur toutes les données.

Le bagging offre un compromis entre ces deux situations en proposant d’entraîner

chaque algorithme sur des échantillons bootstrap, c’est-à-dire des échantillons de
taille n obtenus à partir de tirages avec remise dans l’échantillon initial. L’idée
est de diminuer la corrélation entre les prévisions des Tb en ajoutant de l’aléa
issu des tirages bootstrap. La méthode est présentée dans l’algorithme 11.1.

Algorithme 11.1 Bagging.

Entrées :
— B un entier positif ;
— T un algorithme de prévision.
Pour b entre 1 et B :
1. Faire un tirage aléatoire avec remise de taille n dans {1, . . . , n}. On note ◊b
l’ensemble des indices sélectionnés et Dn,b
ı
= {(xi , yi ), i œ ◊b } l’échantillon
bootstrap associé.
2. Entraîner l’algorithme T sur Dn,b
ı
=∆ T (., ◊b , Dn ).
q
Retourner : fn (x) = B1 b=1 T (x, ◊b , Dn ).
B

Nous avons écrit la sortie comme une moyenne des prévisions de chaque algo-
rithme. Il convient de l’adapter au type de prévision souhaité : valeur numérique
en régression, groupe ou probabilité en classification. Nous distinguerons ces trois
cas dans la section suivante pour l’algorithme des forêts aléatoires. L’écriture
T (., ◊b , Dn ) permet de distinguer les deux sources d’aléas de l’algorithme : l’aléa
traditionnel des données avec Dn et l’aléa des tirages bootstrap avec ◊b . Ce
dernier aléa implique qu’on peut obtenir des prévisions différentes en lançant
deux fois cet algorithme sur les mêmes données. La loi des grands nombre permet
de nuancer ce constat, en effet

1 ÿ
B
lim T (x, ◊b , Dn ) = E◊ [T (x, ◊, Dn )] = f¯n (x, Dn )
Bæ+Œ B
b=1

où E◊ désigne l’espérance calculée par rapport à la loi de ◊ uniquement, c’est-

à-dire conditionnellement à Dn . Ce résultat permet de conclure que, lorsque
B est grand, les prévisions de deux algorithmes bagging construits sur des
échantillons bootstrap différents convergent vers une même prévision f¯n (x, Dn )
qui ne dépend plus des tirages bootstrap. Il est ainsi recommandé de choisir B le
170 Machine learning avec R

plus grand possible afin de contrôler l’aléa bootstrap. L’utilisateur doit également
choisir l’algorithme à entraîner sur les échantillons bootstrap. Nous avons vu
que les prévisions sont d’autant plus performantes que la corrélation ﬂ(x) =
corr(T (x, ◊1 , Dn ), T (x, ◊2 , Dn )) est petite. La seule différence entre T (x, ◊1 , Dn )
et T (x, ◊2 , Dn ) est le tirage bootstrap. Ces deux prévisions sont issues du même
algorithme entraîné sur des échantillons obtenus en dupliquant et supprimant
quelques observations dans l’échantillon initial. Utiliser des algorithmes robustes
vis-à-vis de légères perturbations de l’échantillon sera donc d’une utilité limitée
puisque les prévisions de tels algorithmes sont peu affectées par les tirages
bootstrap. Les régressions linéaires et logistiques sont par exemple connues pour
posséder une telle robustesse et il n’est pas courant de les bagger (voir exercice
11.2). Un des reproches souvent fait aux arbres est justement une instabilité
par rapport à de légères perturbations de l’échantillon. En effet les arbres sont
construits en répétant des coupures binaires de Rp . Perturber les données peut
engendrer des changements de coupure en haut de l’arbre qui vont donc modifier
les coupures suivantes et par conséquent toute la structure de l’arbre. Cette
instabilité devient un avantage pour le bagging, les arbres sont en effet souvent
utilisés pour cette procédure. Les forêts aléatoires présentées dans la section
suivante s’inscrivent dans ce cadre.

11.2 Forêts aléatoires

Comme le nom l’indique, les forêts aléatoires agrègent des prédicteurs par
arbres construits sur des échantillons bootstrap. Il existe différents processus
d’agrégation, nous nous focalisons sur les forêts aléatoires proposées par Breiman
(2001) qui sont de loin les plus utilisées. On pourra trouver des variantes de cet
algorithme dans Poggi et Genuer (2019).
On rappelle qu’un arbre CART (voir chapitre ??) s’obtient en découpant de
façon récursive des nœuds selon des règles Xj Æ s où la variable de coupure Xj
et le seuil s sont sélectionnés en maximisant le gain d’impureté entre le nœud
père et ses deux nœuds fils sur toutes les variables et toutes les valeurs de seuil.
Breiman (2001) propose d’ajouter une variante dans le procédé de construction
des arbres d’une forêt. La variable de coupure ne sera pas choisie parmi toutes
les variables Xj , j = 1, . . . , d mais parmi un sous-ensemble de variables tirées
au sort. Ce procédé peut paraître étrange à première vue, il est en réalité très
astucieux. Il a en effet pour objectif d’augmenter les différences entre les arbres
de la forêt et donc de diminuer la corrélation ﬂ(x) entre deux prévisions d’arbres.
La construction de la forêt est décrite dans l’algorithme 11.2.
Afin de ne pas surcharger les notations, nous avons conservé l’écriture T (x, ◊b , Dn )
mais le paramètre ◊b contient ici tous les paramètres permettant de caractériser
le be arbre de la forêt : l’échantillon bootstrap, les coupures sélectionnées. . .
Précisons également que les mtry variables candidates pour découper un nœud
ne sont pas sélectionnées une seule fois : on tire mtry variables au hasard avant
de découper chaque nœud.
Chapitre 11. Forêts aléatoires 171

Algorithme 11.2 Forêt aléatoire.

Entrées :
— B un entier positif ;
— mtry un entier entre 1 et d ;
— [Link] un entier plus petit que n.
Pour b entre 1 et B :
1. Faire un tirage aléatoire avec remise de taille n dans {1, . . . , n}. On note Ib
l’ensemble des indices sélectionnés et Dn,b
ı
= {(xi , yi ), i œ Ib } l’échantillon
bootstrap associé.
2. Construire un arbre CART à partir de Dn,b
ı
en découpant chaque nœud de
la façon suivante :
(a) Choisir mtry variables au hasard parmi les d variables explicatives ;
(b) Sélectionner la meilleure coupure Xj Æ s en ne considérant que les
mtry variables sélectionnées ;
(c) Ne pas découper un nœud s’il contient moins de [Link]
observations.
3. On note T (., ◊b , Dn ) l’arbre obtenu.
qB
Retourner : fn (x) = B1 b=1 T (x, ◊b , Dn ).

La sortie fn (x) dépend de la nature de la prévision. En régression (Y continue),

chaque arbre renvoie une valeur numérique et la prévision finale est la moyenne
de ces prévisions :
1 ÿ
B
mn (x) = T (x, ◊b , Dn ).
B
b=1

En classification (Y à valeurs dans {1, . . . , K}) on peut s’intéresser à deux types

de prévision. Si on veut prédire le groupe d’une nouvelle observation alors chaque
arbre renvoie un groupe et la forêt fera voter les arbres à la majorité pour
prédire :
ÿB
gn (x) œ argmax 1T (x,◊b ,Dn )=k , k = 1, . . . , K.
kœ{1,...,K} b=1

Lorsqu’on souhaite prédire les probabilités P(Y = k|X = x), chaque arbre
estime ces probabilités par la proportion d’observations du groupe k dans le
nœud terminal qui contient x et la forêt fait la moyenne de ces probabilités
estimées :
1 ÿ
B
Sn,k (x) = T (x, ◊b , Dn ), k = 1, . . . , K.
B
b=1

Les packages randomForest et ranger peuvent être utilisés pour ajuster des
forêts aléatoires. randomForest est le plus ancien et certainement encore le plus
172 Machine learning avec R

utilisé. Le package ranger, codé en C++, se révèle plus efficace au niveau des
temps de calcul. Les syntaxes sont proches, nous proposons d’illustrer la méthode
avec ranger.
> [Link](12345)
> foret <- ranger(type~.,data=spam)
> foret
## Ranger result
##
## Call:
## ranger(type ~ ., data = spam)
##
## Type: Classification
## Number of trees: 500
## Sample size: 4601
## Number of independent variables: 57
## Mtry: 7
## Target node size: 1
## Variable importance mode: none
## Splitrule: gini
## OOB prediction error: 4.59 %

On retrouve dans l’objet foret plusieurs informations sur l’algorithme. Le type

de forêt Classification car la variable à expliquer (type) est qualitative. Si
elle avait été de classe numeric, on aurait eu une forêt de régression. On peut
ensuite lire le nombre d’arbres de la forêt (B) ainsi que la taille de l’échantillon
(4601) et le nombre de variables explicatives (57). Viennent après les nombres
de variables choisies au hasard pour découper les nœuds (Mtry qui vaut 7)
et le nombre d’observations minimal dans les nœuds terminaux (Target node
size). On remarque qu’il vaut 1, cela signifie que les arbres de la forêt sont
de profondeur maximale. On lit enfin dans Splitrule le critère d’impureté
utilisé pour découper les nœuds, l’impureté de gini est utilisée par défaut en
classification. Une estimation de l’erreur de classification est enfin précisée dans
OOB prediction error. Cette dernière estimation est calculée par une méthode
spécifique aux algorithmes bagging appelée Out Of Bag. Elle sera présentée dans
la section 11.4.1.
Une fois la forêt calculée, on obtient les prévisions pour de nouveaux individus
(2 nouveaux individus dans [Link]) avec
> predict(foret,data=[Link])$predictions
## [1] nonspam spam
## Levels: nonspam spam

Le groupe est prédit par défaut. Si on souhaite estimer les probabilités d’appar-
tenance aux groupes, il faut utiliser l’option probability=TRUE dans ranger :
> [Link](123)
> [Link] <- ranger(type~.,data=spam,probability=TRUE)
> predict([Link],data=[Link])$predictions
Chapitre 11. Forêts aléatoires 173

## nonspam spam
## [1,] 0.91243622 0.08756378
## [2,] 0.03554603 0.96445397

11.3 Choix des paramètres

L’algorithme 11.2 dépend de paramètres que l’utilisateur doit choisir. Le premier
est le nombre d’arbres B. Nous avons vu que ce paramètre devait être le plus
grand possible. En pratique il faut donc s’assurer que la forêt possède a atteint
son régime de convergence. Une manière de procéder est de regarder l’évolution
des erreurs OOB en fonction du nombre d’arbres. On peut par exemple obtenir
l’erreur de classification et l’AUC avec
> [Link](12345)
> foret <- ranger(type~.,data=spam,[Link]=TRUE)
> [Link] <- mlr::makeClassifTask(data=spam,target="type")
> erreurs <- OOBCurve(foret,measures = list(mmce, auc),
+ task=[Link],data=spam)
> erreurs1 <- erreurs %>% as_tibble() %>% mutate(ntrees=1:500) %>%
+ filter(ntrees>=5) %>%
+ pivot_longer(-ntrees,names_to="Erreur",values_to="valeur")
> ggplot(erreurs1)+aes(x=ntrees,y=valeur)+geom_line()+
+ facet_wrap(~Erreur,scales="free")

auc mmce

0.14

0.12
0.95

0.10
valeur

0.08
0.90

0.06

0.85 0.04
0 100 200 300 400 500 0 100 200 300 400 500
ntrees
Figure 11.1 – AUC (gauche) et erreurs de classification (droite) en fonction du
nombre d’arbres.

On observe sur la figure 11.1 que les erreurs sont stables, nous pouvons donc
considérer que 500 arbres sont suffisants. Les autres paramètres méritent plus
174 Machine learning avec R

d’attention. Nous avons représenté sur la figure 11.2 des erreurs de classification
estimées par validation hold out pour des forêts aléatoires utilisant différentes
valeurs de mtry et [Link]. Ces erreurs ont été calculées sur les données
spam en séparant les données en un échantillon d’apprentissage de taille 3000 et
un échantillon test de taille 1601. Ce processus a été répété sur 150 coupures
différentes pour stabiliser les erreurs.

0.09
[Link]
1
0.08
5
Erreur

15
0.07
50

100

0.06 500

0.05

1 3 10 30
mtry
Figure 11.2 – Erreurs de classification en fonction de mtry et de la profondeur
des arbres.

On observe que ces 2 paramètres ont une influence sur la performance de la

forêt. Il est tout d’abord évident que, sur cet exemple, l’erreur décroît avec la
profondeur des arbres : plus les arbres sont profonds ([Link] petit),
plus les erreurs sont petites. On peut expliquer cela en revenant au compromis
biais/variance étudié dans (11.1). Les agrégations bagging permettent de réduire
la variance des arbres que l’on agrège, en aucun cas le biais. Il est donc nécessaire
d’utiliser le bagging avec des algorithmes qui possèdent une grande variance et
peu de biais, en l’occurrence des arbres profonds. Non seulement il n’est pas
nécessaire d’élaguer les arbres de la forêt, mais il est recommandé de ne pas le
faire : la forêt sera plus efficace en agrégeant des arbres peu performants qui
sur-ajustent qu’en agrégeant des arbres “optimaux”. C’est pourquoi des petites
valeurs de [Link] sont proposées par défaut dans ranger : 1 pour la
classification et 5 pour la régression.
L’influence de mtry peut également se mesurer à partir de (11.1). Ce paramètre
possède une influence sur le biais et la variance des arbres de la forêt mais aussi la
corrélation ﬂ(x) entre deux arbres. La figure 11.3 compare les erreurs d’ajustement
et de prévision de la forêt en fonction de mtry. On visualise des courbes typiques
du phénomène de sur-ajustement qui peut s’expliquer en analysant l’influence
Chapitre 11. Forêts aléatoires 175

de ce paramètre sur le biais et la variance de la forêt :

— mtry petit signifie que peu de variables sont candidates pour découper
les nœuds. La variable de coupure est même choisie au hasard lorsque
mtry=1. Il est donc plus difficile pour chaque arbre de la forêt de bien
ajuster les données, notamment celles qui ne sont pas dans l’échantillon
bootstrap. C’est pourquoi l’erreur d’ajustement (voir figure 11.3), et donc
le biais, sont élevés lorsque mtry est petit. Au niveau de la variance, on
peut faire le constat que V[T (x, ◊, Dn )] sera toujours élevée car les arbres
sont profonds, quel que soit mtry. Néanmoins, utiliser des petites valeurs
pour mtry permet de diminuer la corrélation entre deux arbres de la forêt
et par conséquent la variance de la forêt ;
— mtry grand signifie à l’inverse qu’un grand nombre de variables sont
candidates pour découper les nœuds. Cela permet aux arbres de mieux
ajuster les données et donc de diminuer le biais. On a en revanche une
corrélation entre deux arbres d’une même forêt plus élevée, ce qui augmente
la variance de la forêt.

0.08

0.06
Erreur

0.04 ajustement

prevision

0.02

0.00

1 3 10 30
mtry
Figure 11.3 – Erreur de prévision (calculées sur les données test) et d’ajustement
(calculées sur les données d’apprentissage) en fonction de mtry.

Le sur-ajustement risque Ô donc d’apparaître lorsque mtry est (trop) grand. Les
valeurs par défaut sont d pour la classification et d/3 pour la régression mais
il est recommandé de tester plusieurs valeurs pour calibrer ce paramètre. Cela se
fait généralement à partir des méthodes classiques d’estimation de risques de
prévision par ré-échantillonnage qui ont été présentées dans le chapitre ??. À
titre d’illustration, nous proposons de choisir les paramètres nodesize et mtry
dans la grille suivante :
176 Machine learning avec R

> rf_grid <- [Link](mtry=c(seq(1,55,by=5),57),

+ min_n=c(1,5,15,50,100,500))

On estime l’accuracy et l’AUC par validation croisée répétée 5 fois en utilisant

la fonction tune_grid de tidymodels (voir section 3.2.2) :
> blocs <- vfold_cv(spam, v = 10,repeats = 5)
> tune_spec <- rand_forest(mtry = tune(),min_n= tune()) %>%
+ set_engine("ranger") %>%
+ set_mode("classification")
> rf_wf <- workflow() %>% add_model(tune_spec) %>% add_formula(type ~ .)
> rf_res <- rf_wf %>% tune_grid(resamples = blocs,grid = rf_grid)

Le paramètre min_n de rand_forest correspond à [Link]. On étudie

les meilleures valeurs de paramètres pour les deux critères considérés :
> rf_res %>% show_best("roc_auc")
## # A tibble: 5 x 8
## mtry min_n .metric .estimator mean n std_err .config
## <dbl> <dbl> <chr> <chr> <dbl> <int> <dbl> <chr>
## 1 4 1 roc_auc binary 0.988 50 6.14e-4 Prepro~
## 2 5 1 roc_auc binary 0.988 50 6.23e-4 Prepro~
## 3 6 1 roc_auc binary 0.988 50 6.17e-4 Prepro~
## 4 5 5 roc_auc binary 0.988 50 6.21e-4 Prepro~
## 5 7 1 roc_auc binary 0.988 50 6.45e-4 Prepro~
> rf_res %>% show_best("accuracy")
## # A tibble: 5 x 8
## mtry min_n .metric .estimator mean n std_err .config
## <dbl> <dbl> <chr> <chr> <dbl> <int> <dbl> <chr>
## 1 4 1 accuracy binary 0.954 50 0.00159 Prepro~
## 2 6 1 accuracy binary 0.954 50 0.00141 Prepro~
## 3 7 1 accuracy binary 0.954 50 0.00149 Prepro~
## 4 5 1 accuracy binary 0.954 50 0.00153 Prepro~
## 5 8 1 accuracy binary 0.953 50 0.00146 Prepro~

On retrouve bien des petites valeurs pour min_n : il faut des arbres profonds
pour que la forêt soit performante. Les valeurs optimales de mtry se situent
autours de la valeur par défaut (7 ici). On peut donc conserver cette valeur pour
ré-ajuster la forêt sur toutes les données :
> foret_finale <- rf_wf %>%
+ finalize_workflow(list(mtry=7,min_n=1)) %>%
+ fit(data=spam)

Le choix des paramètres de la forêt n’est donc pas un problème très difficile :
il faut prendre B grand, [Link] petit et tester quelques valeurs pour
mtry. Malgré cette simplicité, les forêts aléatoires font régulièrement partie des
meilleurs algorithmes de prévision dans les compétitions de type kaggle. On
propose une comparaison entre les performances prédictives des forêts aléatoires
et celles des arbres dans l’exercice 11.3 sur les données spam. Il y est conclut
Chapitre 11. Forêts aléatoires 177

sans surprise que les forêts sont supérieures pour ce jeu de données.

11.4 Erreur Out Of Bag et importance des va-

riables
11.4.1 Erreur Out Of Bag
Comme pour tous les algorithmes de prévision, il est important d’évaluer la
performance d’une forêt aléatoire. Cela peut se faire en utilisant des méthodes
comme la validation croisée utilisée dans la section précédente. Le fait d’utiliser
des échantillons bootstrap pour ajuster les arbres de la forêt permet de définir
une nouvelle méthode : l’estimation Out Of Bag (OOB). Cette technique s’appuie
sur les individus qui ne sont pas sélectionnés dans les différents échantillons
bootstrap. Plus précisément, on définit pour chaque individu i = 1, . . . , n,

OOB(i) = {b Æ B : i œ
/ Ib }

l’ensemble des tirages bootstrap qui ne contiennent pas i et

1 ÿ
fn,OOB(i) (xi ) = T (xi , ◊b , Dn )
|OOB(i)|
bœOOB(i)

la prévision de la forêt en ne considérant que les arbres pour lesquels i n’est pas
dans le tirage bootstrap. Même si cette prévision, n’est pas calculée à partir de
tous les arbres de la forêt, elle présente l’avantage de n’utiliser que des arbres qui
n’ont pas été entraîné avec i. L’erreur de la forêt est alors estimée en confrontant
ces prévisions aux valeurs observées. Le type d’erreur dépend une fois de plus de
la prévision. La fonction ranger renvoie

— le risque quadratique en régression

1ÿ
n
(yi ≠ mn,OOB(i) (xi ))2 .
n i=1

— l’erreur de classification lorsqu’on cherche à prédire la classe

1ÿ
n
1g (x )”=y .
n i=1 n,OOB(i) i i

— le score de Brier lorsque la forêt estime les probabilités P(Y = k|X =

x), k = 1, . . . , K :

1 ÿÿ
n K
(Sn,k,OOB(i) (xi ) ≠ 1yi =k )2 .
2n i=1
k=1
178 Machine learning avec R

Nous avons remplacé la notation fn par mn , gn et Sn,k pour spécifier le type

de prévision : numérique pour mn , classe pour gn et probabilité pour Sn,k . Le
score de Brier est facile à interpréter : il varie entre 0 (prévisions parfaites) et 1
(mauvaises prévisions).
L’estimation OOB peut être vue comme une approche compétitive aux méthodes
de ré-échantillonnage (validation hold out, validation croisée. . . ) présentées dans
le chapitre ??. Elle présente l’avantage de ne pas avoir à séparer les données
en blocs sur lesquelles on entraîne plusieurs fois l’algorithme et se révèle par
conséquent moins coûteuse en temps de calcul. Elle est calculée par défaut dans
ranger, l’erreur de classification OOB de la forêt obtenue dans la section 11.2
est par exemple égale à
> foret$[Link]
## [1] 0.0458596

11.4.2 Importance des variables

On reproche souvent aux forêts aléatoires d’avoir un côté “boîte noire”. Il est en
effet difficile d’expliquer comment est calculée la prévision d’une forêt puisqu’elle
s’obtient à partir d’un grand nombre d’arbres qui sont de plus très profonds.
Comme pour la plupart des algorithmes de machine learning, il est possible de
définir des scores d’importance pour les forêts aléatoires. Ces derniers apportent
une aide à l’utilisateur pour interpréter l’algorithme en notant les variables en
fonction de leur importance dans la construction de la forêt. Deux types de score
d’importance sont généralement renvoyés par les logiciels. Le premier définit
l’importance de la variable Xj par l’importance moyenne de cette variable pour
chaque arbre :
1 ÿ
B
Ijimp = Ij (Tb )
B
b=1

où Ij (Tb ) est l’importance de Xj pour le be arbre de la forêt défini par (8.3)

(voir section 8.4.1). Cette mesure étant calculée à partir des gains d’impureté
des coupures de l’arbre, on appelle ce score score d’impureté.
Le second score d’importance, appelé score par permutation, fait intervenir
l’erreur OOB présentée dans la section précédente. Afin de simplifier les notations,
on se place en régression où l’erreur OOB du be arbre de la forêt est définie par
1 ÿ
Err(OOBb ) = (yi ≠ T (xi , ◊b , Dn ))2 ,
|OOBb |
iœOOBb

avec
OOBb = {i Æ n : i œ
/ Ib }.
Err(OOBb ) est l’erreur quadratique de l’arbre b calculée sur les individus qui
n’ont pas servi à la construction de cet arbre. Afin d’évaluer l’importance de la
variable Xj , j = 1, . . . , d, on effectue une permutation aléatoire de la j e colonne
des observations de l’échantillon OOBb comme représentée sur la figure 11.4.
Chapitre 11. Forêts aléatoires 179

2 3 2 3
x11 . . . x1j . . . x1d x11 . . . x3j ... x1d
6x21 . . . x2j . . . x2d 7 6x21 . . . x5j ... x2d 7
6 7 6 7
6x51 . . . x3j . . . x3d 7 =) 6x51 . . . x1j ... x3d 7
6 7 6 7
4x41 . . . x4j . . . x4d 5 4x41 . . . x2j ... x4d 5
x51 . . . x5j . . . x5d x51 . . . x4j ... x5d
Figure 11.4 – Exemple de permutation de la j e colonne pour un échantillon
OOB de taille 5.

On note x̃ji les individus de l’échantillon OOBb permuté (x̃j1 correspond par
exemple au premier individu de l’échantillon de droite sur la figure 11.4) et on
recalcule l’erreur OOB avec ce nouvel échantillon :
1 ÿ
Err(OOBjb ) = (yi ≠ T (x̃ji , ◊b , Dn ))2 .
|OOBb |
iœOOBb

Si Xj a peu d’importance sur le calcul des prévisions du be arbre alors prévisions

T (xi , ◊b , Dn ) et T (x̃ji , ◊b , Dn ) doivent être proches. La différence entre Err(OOBb )
et Err(OOBjb ) est par conséquent faible. Si à l’inverse cette variable est très
importante pour prédire, alors la permutation aléatoire va dégrader l’erreur et
Err(OOBjb ) sera plus élevé que Err(OOBb ). Le score par permutation mesure
l’importance de Xj par l’écart moyen entre ces deux erreurs sur tous les arbres
de la forêt :
1 ÿ
B
Ijperm = (Err(OOBjb ) ≠ Err(OOBb )).
B
b=1

: : :{.remark} Pour définir l’importance par permutation en classification, il

suffit de remplacer les erreurs quadratiques par les erreurs dans classification ou
les score de Brier dans Err(OOBb ) et Err(OOBjb ). : : :
L’option importance de ranger permet de calculer ces deux scores :
> [Link](1234)
> [Link] <- ranger(type~.,data=spam,importance="impurity")
> [Link] <- ranger(type~.,data=spam,importance="permutation")

Il est d’usage de visualiser ces scores à l’aide de diagrammes en barres. On peut

les obtenir avec la fonction vip du package vip (figure 11.5)
> vip([Link])
> vip([Link])

Les variables ne sont pas classées dans le même ordre en fonction du score utilisé.
On observe néanmoins des tendances similaires puisque 7 variables se retrouvent
dans le top 10 des deux scores.
En plus d’aider à l’interprétation, ces scores peuvent être utilisés pour sélectionner
des variables. Des procédures de type backward sont par exemple proposées par
Gregorutti et al. (2017). L’approche consiste à ordonner les variables en fonction
180 Machine learning avec R

charExclamation capitalLong

charDollar hp

remove charExclamation

free remove

capitalAve capitalAve

your capitalTotal

capitalLong charDollar

hp free

capitalTotal your

money george

0 50 100 150 200 250 0.00 0.01 0.02 0.03 0.04

Importance Importance
Figure 11.5 – Scores d’importance d’impureté (gauche) et par permutation
(droite).

de leur score d’importance et à les retirer une à une jusqu’à ce que le retrait
n’apporte plus de gain à l’algorithme en terme d’erreur de prévision.

La question du choix du score d’importance se pose naturellement. Il n’existe

pas de résultat universel montrant la supériorité d’un score mais le score par
permutation est généralement privilégié. De plus, même si ces scores existent
depuis une vingtaine d’années, leurs propriétés théoriques ne sont encore pas
très bien connues et font encore l’objet de nombreux travaux. Gregorutti et al.
(2017) et Bénard et al. (2021) montrent par exemple que la présence de fortes
corrélations entre les variables explicatives peut dégrader la performance de ces
scores. La valeur du score a dans ce cas tendance à se répandre sur les variables
corrélées. Ce constat n’est pas forcément surprenant puisqu’il est bien connu que
la corrélation nuit également à l’interprétation des modèles statistiques classiques
comme la régression linéaire ou logistique.

11.5 Exercices
Exercice 11.1 (Biais et variance des algorithmes bagging).
Montrer les égalités (11.1). On prendra également soin de discuter du signe de
ﬂ(x).
Pour simplifier les notations on considère T1 , . . . , TB B variables aléatoires de
même loi et de variance ‡ 2 . Il est facile de voir que E[T̄ ] = E[T1 ]. Pour la
Chapitre 11. Forêts aléatoires 181

variance on a
C B D S T
1 1 Uÿ
ÿ V ÿ
V[T̄ ] = 2 V Ti = 2 V[Ti ] + Cov(Ti , Tj )V
B B
i=1 i=1 i”=j
1 # $ 1≠fl 2
= 2 B‡ 2 + B(B ≠ 1)fl‡ 2 = fl‡ 2 + ‡ .
B B
Considérons fl Æ 0. On déduit de l’équation précédente que B Æ 1 ≠ 1/fl. Par
exemple si fl = ≠1, B doit être inférieur ou égal à 2. Il n’est en effet pas possible
de considérer 3 variables aléatoires de même loi dont les corrélations 2 à 2 sont
égales à -1. De même si fl = ≠1/2, B Æ 3. . .

Exercice 11.2 (Corrélation bootstrap logistique vs arbre).

On considère le problème de classification binaire à deux dimensions présentés
dans la section 1.2.2. On pourra obtenir un échantillon de taille 200 avec :
> don <- gen_class_bin2D(n=n,graine=i,bayes=0.25)$donnees

On souhaite comparer les corrélations ﬂ(T (x, ◊1 , Dn ), T (x, ◊2 , Dn )) pour des

prévisions par

— modèle logistique avec les paramètres par défaut de la fonction glm

— arbre de classification avec comme paramètre minsplit=3 et cp=0.00001
pour les arbres.

1. Proposer un algorithme de Monte Carlo permettant d’estimer cette corré-

lation.
On peut estimer cette corrélation en simulant B (grand) échantillons. Puis pour
chaque échantillon en effectue deux tirages bootstrap sur lesquels on entraîne la
régression logistique. On calcule ensuite l’estimation de P(Y = 1|X = x) pour
les deux algorithmes ajustés. On estime enfin la corrélation par la corrélation
empirique sur les B répétitions.
2. Mettre en œuvre cette procédure et comparer les corrélations entre les
préditeurs logistique et par arbre. On pourra effectuer la comparaison pour
la valeur de x suivante :
> xnew <- tibble(X1=0.65,X2=0.3)
On créé une fonction qui calcule les prévisions des algorithmes sur de nouveaux
individus.
> [Link] <- function(B=100,n=200,Xnew){
+ [Link] <- matrix(0,nrow=B,ncol=2)
+ [Link] <- [Link]
+ prev <- matrix(0,nrow=B,ncol=6) %>% as_tibble()
+ names(prev) <- c("X1","X2","logit1","logit2","arbre1","arbre2")
+ res <- tibble()
+ for (i in 1:B){
182 Machine learning avec R

+ don <- gen_class_bin2D(n=n,graine=i,bayes=0.25)$donnees

+ theta1 <- sample(n,n,replace=TRUE)
+ theta2 <- sample(n,n,replace=TRUE)
+ D1 <- don[theta1,]
+ D2 <- don[theta2,]
+ logit1 <- glm(Y~.,data=D1,family=binomial)
+ logit2 <- glm(Y~.,data=D2,family=binomial)
+ prev[,3] <- predict(logit1,newdata=Xnew,type="response")
+ prev[,4] <- predict(logit2,newdata=Xnew,type="response")
+ arbre1 <- rpart(Y~.,data=D1,minsplit=3,cp=0.00001)
+ arbre2 <- rpart(Y~.,data=D2,minsplit=3,cp=0.00001)
+ prev[,5] <- predict(arbre1,newdata=Xnew,type="prob")[,2]
+ prev[,6] <- predict(arbre2,newdata=Xnew,type="prob")[,2]
+ prev[,1:2] <- Xnew
+ res <- res %>% bind_rows(prev)
+ }
+ return(res)
+ }
On déduit les corrélations avec
> aa <- [Link](100,200,xnew)
> aa %>% group_by(X1,X2) %>%
+ summarize(logit=cor(logit1,logit2),arbre=cor(arbre1,arbre2))
## # A tibble: 1 x 4
## # Groups: X1 [1]
## X1 X2 logit arbre
## <dbl> <dbl> <dbl> <dbl>
## 1 0.65 0.3 0.617 0.365
3. Faire le même travail pour 100 individus x générés aléatoirement sur le
carré [0, 1]. Comparer les corrélations obtenus à l’aide d’un boxplot.
On génère les individus et calcule toutes les corrélations avec
> Xnew <- tibble(X1=runif(100),X2=runif(100))
> bb <- [Link](100,200,Xnew)
> bb1 <- bb %>% group_by(X1,X2) %>%
+ summarize(logit=cor(logit1,logit2),arbre=cor(arbre1,arbre2))
On peut maintenant les comparer
> bb1 %>% pivot_longer(c(logit,arbre),names_to="Algo",
+ values_to="cor") %>%
+ ggplot()+aes(x=Algo,y=cor)+geom_boxplot()
On retrouve bien que les corrélations sont plus faibles pour les arbres.

Exercice 11.3 (Arbre vs forêt aléatoire).

Proposer et mettre en œuvre une procédure permettant de comparer les perfor-
mances (courbes ROC, AUC et accuracy) d’un arbre CART utilisant la procédure
d’élagage proposée dans la section 8.3.1 avec une forêt aléatoire.
On peut envisager différentes stratégies pour répondre à cette question. Il convient de
bien préciser ce que l’on souhaite faire. Il ne s’agit pas de sélectionner les paramètres
d’un algorithme. On souhaite comparer deux algorithmes de prévision :
Chapitre 11. Forêts aléatoires 183

0.6

0.4
cor

0.2

0.0

arbre logit
Algo
Figure 11.6 – Corrélations bootstrap pour algorithmes logistique et arbres.

— un arbre CART qui utilise la procédure d’élagage proposée dans la section

8.3.1 : création de la suite optimale de sous arbre puis sélection d’un arbre
dans cette suite en estimant l’erreur de classification par validation croisée ;
— une forêt aléatoire qui prend les valeurs par défaut pour nodesize et qui
sélection mtry en minimisant l’erreur OOB (c’est un choix).

Il faut estimer les risques demandés en se donnant une stratégie de ré-échantillonnage.

On choisit une validation croisée 10 blocs :
> [Link](123)
> blocs <- vfold_cv(spam, v = 10)

On crée une fonction spécifique à chaque algorithme qui calculera les prévisions de
nouveaux individus :
> [Link] <- function(df,newX){
+ arbre <- rpart(type~.,data=df,cp=1e-8,minsplit=15)
+ cp_opt <- arbre$cptable %>% [Link]() %>%
+ filter(xerror==min(xerror)) %>%
+ dplyr::select(CP) %>% slice(1) %>% [Link]()
+ [Link] <- prune(arbre,cp=cp_opt)
+ predict(arbre,newdata=newX,type="prob")[,2]
+ }

> [Link] <- function(df,[Link]=c(seq(1,55,by=5),57),newX){

+ err <- rep(0,length([Link]))
+ for (m in 1:length([Link])){
+ err[m] <- ranger(type~.,data=df)$[Link]
184 Machine learning avec R

+ }
+ foret <- ranger(type~.,data=df,probability=TRUE,
+ mtry=[Link][[Link](err)])
+ predict(foret,data=newX,type="response")$predictions[,2]
+ }

On effectue la validation croisée :

> [Link](321)
> score <- as_tibble(matrix(0,nrow=nrow(spam),ncol=2))
> names(score) <- c("arbre","foret")
> for (k in 1:10){
+ [Link] <- blocs$splits[[k]]$in_id
+ dapp <- spam[[Link],]
+ dtest <- spam[-[Link],]
+ score[-[Link],1] <- [Link](df=dapp,newX = dtest)
+ score[-[Link],2] <- [Link](df=dapp,newX = dtest)
+ }
> score1 <- score %>% mutate(obs=spam$type) %>%
+ pivot_longer(-obs,names_to = "Methode",values_to = "Prob") %>%
+ mutate(class=recode_factor([Link](Prob>0.5),
+ 0 ="nonspam", 1 ="spam"))

On déduit la courbe ROC (figure 11.7), l’AUC

> score1 %>% group_by(Methode) %>%
+ roc_curve(obs,Prob,event_level="second") %>% autoplot()

1.00

0.75

Methode
sensitivity

0.50 arbre
foret

0.25

0.00
0.00 0.25 0.50 0.75 1.00
1 − specificity
Figure 11.7 – Courbes ROC.
Chapitre 11. Forêts aléatoires 185

> score1 %>% group_by(Methode) %>% roc_auc(obs,Prob,event_level="second")

## # A tibble: 2 x 4
## Methode .metric .estimator .estimate
## <chr> <chr> <chr> <dbl>
## 1 arbre roc_auc binary 0.958
## 2 foret roc_auc binary 0.979

et l’accuracy
> score1 %>% group_by(Methode) %>% accuracy(obs,class)
## # A tibble: 2 x 4
## Methode .metric .estimator .estimate
## <chr> <chr> <chr> <dbl>
## 1 arbre accuracy binary 0.919
## 2 foret accuracy binary 0.939

Vous aimerez peut-être aussi

Méthodes ensemblistes : Voting et Forêts aléatoires
Pas encore d'évaluation
Méthodes ensemblistes : Voting et Forêts aléatoires
2 pages
Introduction à l'apprentissage supervisé
Pas encore d'évaluation
Introduction à l'apprentissage supervisé
52 pages
Relations entre IA, ML et Deep Learning
Pas encore d'évaluation
Relations entre IA, ML et Deep Learning
4 pages
Examen Algorithmes Data Mining II
Pas encore d'évaluation
Examen Algorithmes Data Mining II
3 pages
Introduction aux Machines à Vecteurs de Support
Pas encore d'évaluation
Introduction aux Machines à Vecteurs de Support
47 pages
TD 21 : Estimations en Probabilités
Pas encore d'évaluation
TD 21 : Estimations en Probabilités
2 pages
Apprentissage ensembliste : Concepts clés
Pas encore d'évaluation
Apprentissage ensembliste : Concepts clés
6 pages
Régression linéaire sur la consommation de poulet
Pas encore d'évaluation
Régression linéaire sur la consommation de poulet
9 pages
Introduction à la Régression Supervisée
Pas encore d'évaluation
Introduction à la Régression Supervisée
45 pages
Cours complet sur les modèles ML
Pas encore d'évaluation
Cours complet sur les modèles ML
4 pages
Introduction à la Régression Linéaire
Pas encore d'évaluation
Introduction à la Régression Linéaire
11 pages
TP ACP : Calculs et Applications
Pas encore d'évaluation
TP ACP : Calculs et Applications
6 pages
Régression linéaire : tabagisme et cancer
Pas encore d'évaluation
Régression linéaire : tabagisme et cancer
3 pages
Introduction à l'apprentissage automatique
Pas encore d'évaluation
Introduction à l'apprentissage automatique
28 pages
Apprentissage supervisé avec Python et Scikit-learn
Pas encore d'évaluation
Apprentissage supervisé avec Python et Scikit-learn
4 pages
Modèles de régression linéaire 2024/2025
Pas encore d'évaluation
Modèles de régression linéaire 2024/2025
4 pages
Correction TP1 Deep Learning 2023
Pas encore d'évaluation
Correction TP1 Deep Learning 2023
12 pages
Régression Linéaire avec Scikit-learn
Pas encore d'évaluation
Régression Linéaire avec Scikit-learn
2 pages
Régression Logistique en Machine Learning
Pas encore d'évaluation
Régression Logistique en Machine Learning
37 pages
Méthodes d'Ensemble en Machine Learning
Pas encore d'évaluation
Méthodes d'Ensemble en Machine Learning
20 pages
MAE vs RMSE : Quelle métrique choisir ?
Pas encore d'évaluation
MAE vs RMSE : Quelle métrique choisir ?
3 pages
Liaison entre Caractères Qualitatifs et Quantitatifs
Pas encore d'évaluation
Liaison entre Caractères Qualitatifs et Quantitatifs
12 pages
Arbres de décision et gain d'information
Pas encore d'évaluation
Arbres de décision et gain d'information
29 pages
Modélisation des Séries Temporelles
Pas encore d'évaluation
Modélisation des Séries Temporelles
9 pages
Introduction à la Régression Linéaire
Pas encore d'évaluation
Introduction à la Régression Linéaire
19 pages
Examen Final en Machine Learning
Pas encore d'évaluation
Examen Final en Machine Learning
4 pages
Régression multiple et analyse de variance
100% (1)
Régression multiple et analyse de variance
3 pages
Arbres de décision en apprentissage automatique
Pas encore d'évaluation
Arbres de décision en apprentissage automatique
25 pages
Cours sur la Régression Logistique
Pas encore d'évaluation
Cours sur la Régression Logistique
14 pages
SVM : Théorie et Applications Pratiques
Pas encore d'évaluation
SVM : Théorie et Applications Pratiques
18 pages
Introduction à l'apprentissage machine
Pas encore d'évaluation
Introduction à l'apprentissage machine
2 pages
Introduction à l'Apprentissage Automatique
Pas encore d'évaluation
Introduction à l'Apprentissage Automatique
39 pages
Optimisation de la Régression Linéaire avec Python
Pas encore d'évaluation
Optimisation de la Régression Linéaire avec Python
36 pages
Comprendre l'algorithme KNN en ML
Pas encore d'évaluation
Comprendre l'algorithme KNN en ML
5 pages
Dendrogrammes en Clustering Hiérarchique
100% (1)
Dendrogrammes en Clustering Hiérarchique
3 pages
Prédiction de l'accident de Challenger
Pas encore d'évaluation
Prédiction de l'accident de Challenger
2 pages
Andrew NG Machine Learning
Pas encore d'évaluation
Andrew NG Machine Learning
118 pages
Arbres de Décision : Concepts et Algorithmes
Pas encore d'évaluation
Arbres de Décision : Concepts et Algorithmes
39 pages
Analyses Factorielles en Statistique
Pas encore d'évaluation
Analyses Factorielles en Statistique
48 pages
Méthode K-ppv en apprentissage supervisé
Pas encore d'évaluation
Méthode K-ppv en apprentissage supervisé
26 pages
Prédiction des prix du Bitcoin par ML
Pas encore d'évaluation
Prédiction des prix du Bitcoin par ML
27 pages
Algorithme ID3 en Data Mining
Pas encore d'évaluation
Algorithme ID3 en Data Mining
36 pages
Exercices sur la régression logistique
Pas encore d'évaluation
Exercices sur la régression logistique
1 page
Évaluation des Modèles en Machine Learning
Pas encore d'évaluation
Évaluation des Modèles en Machine Learning
36 pages
Régression Linéaire et Courbes d'Apprentissage
Pas encore d'évaluation
Régression Linéaire et Courbes d'Apprentissage
8 pages
Comprendre la Descente du Gradient
100% (1)
Comprendre la Descente du Gradient
9 pages
Régression linéaire et polynomiale en Python
Pas encore d'évaluation
Régression linéaire et polynomiale en Python
71 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
180 pages
Module de Recherche Opérationnelle
Pas encore d'évaluation
Module de Recherche Opérationnelle
2 pages
Classification et Régression en Machine Learning
Pas encore d'évaluation
Classification et Régression en Machine Learning
48 pages
Classification avec K-Nearest Neighbors
Pas encore d'évaluation
Classification avec K-Nearest Neighbors
26 pages
Classification ascendante hiérarchique en Python
Pas encore d'évaluation
Classification ascendante hiérarchique en Python
15 pages
Introduction à la régression logistique
Pas encore d'évaluation
Introduction à la régression logistique
3 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
29 pages
Tuning des Hyperparamètres en ML
100% (1)
Tuning des Hyperparamètres en ML
47 pages
Systèmes Multiagents : Questions et Exercices
Pas encore d'évaluation
Systèmes Multiagents : Questions et Exercices
2 pages
Arbre de Décision : Calculs et Méthodes
Pas encore d'évaluation
Arbre de Décision : Calculs et Méthodes
8 pages
Introduction aux arbres de décision
Pas encore d'évaluation
Introduction aux arbres de décision
6 pages
Introduction à l'algorithme Random Forest
100% (1)
Introduction à l'algorithme Random Forest
32 pages
Méthodes d'Ensemble : Bagging et Boosting
Pas encore d'évaluation
Méthodes d'Ensemble : Bagging et Boosting
4 pages
Apprentissage Automatique et Classification
Pas encore d'évaluation
Apprentissage Automatique et Classification
7 pages
Classification Automatique des Données
Pas encore d'évaluation
Classification Automatique des Données
6 pages
Apprentissage Automatique COVID-19
100% (1)
Apprentissage Automatique COVID-19
8 pages
UML : Modélisation et Concepts Clés
Pas encore d'évaluation
UML : Modélisation et Concepts Clés
16 pages
Introduction à la Compilation Informatique
Pas encore d'évaluation
Introduction à la Compilation Informatique
20 pages
Survol historique de l'IA par Gaussier
Pas encore d'évaluation
Survol historique de l'IA par Gaussier
48 pages
Correction TD Génie Énergétique 2019/2020
100% (1)
Correction TD Génie Énergétique 2019/2020
65 pages
Exemples d'algorithmes en algorithmique
Pas encore d'évaluation
Exemples d'algorithmes en algorithmique
3 pages
Interpolation et Différences Finies
Pas encore d'évaluation
Interpolation et Différences Finies
29 pages
Détection d'Anomalies avec Isolation Forest
Pas encore d'évaluation
Détection d'Anomalies avec Isolation Forest
9 pages
Système d'Information Décisionnel 2023
Pas encore d'évaluation
Système d'Information Décisionnel 2023
26 pages
Statistiques et Probabilités - TD 2024-2025
Pas encore d'évaluation
Statistiques et Probabilités - TD 2024-2025
22 pages
Clustering K-means et DBSCAN en Python
Pas encore d'évaluation
Clustering K-means et DBSCAN en Python
4 pages
Exercices sur les Processus Stochastiques
Pas encore d'évaluation
Exercices sur les Processus Stochastiques
6 pages
Examen sur les Matrices Symétriques
Pas encore d'évaluation
Examen sur les Matrices Symétriques
2 pages
Comparaison des algorithmes de chemin
Pas encore d'évaluation
Comparaison des algorithmes de chemin
9 pages
TP MATLAB : Analyse Numérique et Intégration
Pas encore d'évaluation
TP MATLAB : Analyse Numérique et Intégration
14 pages
Chiffrement symétrique vs asymétrique
50% (2)
Chiffrement symétrique vs asymétrique
4 pages
Introduction à l'économétrie financière
Pas encore d'évaluation
Introduction à l'économétrie financière
88 pages
Codes BCH et Reed-Solomon expliqués
Pas encore d'évaluation
Codes BCH et Reed-Solomon expliqués
68 pages
Introduction à l'Algèbre Linéaire
Pas encore d'évaluation
Introduction à l'Algèbre Linéaire
18 pages
Decomposition LU et Résolution de Systèmes
Pas encore d'évaluation
Decomposition LU et Résolution de Systèmes
7 pages
Exercices de Probabilités et Lois Statistiques
Pas encore d'évaluation
Exercices de Probabilités et Lois Statistiques
2 pages
Excellence en Mathématiques Terminale C
Pas encore d'évaluation
Excellence en Mathématiques Terminale C
1 page
Exercices de Probabilités et Statistiques IV
Pas encore d'évaluation
Exercices de Probabilités et Statistiques IV
2 pages
Emplois du Temps 2025-2026
Pas encore d'évaluation
Emplois du Temps 2025-2026
5 pages
Traitement du Signal et Filtres Numériques
Pas encore d'évaluation
Traitement du Signal et Filtres Numériques
1 page
Correction Bac NSI 2024 - Jour 2
100% (1)
Correction Bac NSI 2024 - Jour 2
7 pages
Probabilités et Coccinelles en BTS
Pas encore d'évaluation
Probabilités et Coccinelles en BTS
8 pages
Introduction à la programmation linéaire
Pas encore d'évaluation
Introduction à la programmation linéaire
71 pages
Détection 3D d'objets par IA LiDAR
Pas encore d'évaluation
Détection 3D d'objets par IA LiDAR
69 pages
Corrigé de Microéconomie S1
Pas encore d'évaluation
Corrigé de Microéconomie S1
4 pages
Exercice corrigé sur le traitement d'images
100% (2)
Exercice corrigé sur le traitement d'images
3 pages
Cours sur l'apprentissage automatique
Pas encore d'évaluation
Cours sur l'apprentissage automatique
49 pages
Examen Commande Systèmes Linéaires 2024
Pas encore d'évaluation
Examen Commande Systèmes Linéaires 2024
14 pages