0% ont trouvé ce document utile (0 vote)

24 vues9 pages

Day 20

Le document traite des réseaux de neurones multicouches (MLP) en deep learning, abordant des concepts clés tels que la propagation avant, les fonctions d'activation, et la rétropropagation. Il présente également des applications pratiques comme la classification bancaire et la prévision de prix, tout en soulignant les avantages et limites des MLP par rapport à d'autres modèles comme XGBoost. Enfin, il met en avant l'importance des MLP comme base pour d'autres architectures de deep learning telles que les CNN et RNN.

Transféré par

Safaa Kahil

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

24 vues9 pages

Day 20

Transféré par

Safaa Kahil

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

JOUR 20 / 30 | DEEP LEARNING — MULTILAYER PERCEPTRON

Réseaux de Neurones — MLP

Du neurone biologique à la rétropropagation — apprendre toute fonction
Input → Couches cachées → Activation → Output — Rosenblatt (1958) à aujourd’hui
ReLU ReLU
ReLU

Sigmoid
x3
rétropropagation ∇L
ŷ
x2
Output

x1
Input

Couche 1 Couche 2 Couche 3

Safaa Kahil Data Scientist | #30DaysDataScience

Au Programme

Théorie Pratique
✓ Le neurone artificiel et la propagation avant → Classification tabulaire (banque, assurance)
✓ Fonctions d’activation : ReLU, Sigmoid, Tanh, Softmax → Régression : prévision de prix
✓ Rétropropagation et descente de gradient → Détection de fraude (MLP vs XGBoost)
✓ Batch Normalization et Dropout → Embedding catégories : Entity Embedding
✓ Optimiseurs : SGD, Adam, RMSprop → MLP vs XGBoost vs RF sur données tabulaires
✓ Regularisation : L1/L2, Early Stopping

“Le MLP est l’unité de base du deep learning. Bien que XGBoost domine les données tabulaires, le MLP avec Entity Em-
bedding et Batch Normalization devient compétitif — et reste la porte d’entrée vers les CNNs, RNNs et Transformers.”

2/9
Le Neurone Artificiel et la Propagation Avant

b
Un neurone : somme pondérée + activation
p
X x1
z = w⊤ x + b = wj xj + b w1
j=1
w2 a
a = σ(z) x2 σ output
w : poids synaptiques. b : biais. σ : activation.
.. w3
.
x3
z = w⊤ x + b
Propagation avant (Forward Pass) pour une couche l :
a = σ(z)
Z[l] = W[l] A[l−1] + b[l] xp

A[l] = σ [l] (Z[l] ) ReLU vs Sigmoid

W[l] : matrice de poids (nl × nl−1 ). 1

ReLU
A[0] = X : entrée. ŷ = A[L] : sortie. 0.5
Sigmoid

−2 2

Théorème d’approximation universelle

Un MLP avec une couche cachée de taille suffisante peut approcher

n’importe quelle fonction continue sur un compact (Cybenko, 1989).
⇒ Le MLP est un approximateur universel. 3/9
Fonctions d’Activation : Choisir la Bonne

Comparaison des activations

Activation Formule Usage
3
1 ReLU
Sigmoid Sortie binaire
1+e −z
e −e −z
z Sigmoid
Tanh Couches cachées RNN
e z +e −z 2 Tanh
ReLU max(0, z) Couches cachées MLP Leaky ReLU
Leaky ReLU max(αz, z) Si neurones morts
1

ELU α(e z − 1) si z < 0 Variance stable

e zk
Softmax P zj Sortie multi-classe
j e
−2 −1 1 2
GELU zΦ(z) Transformers
−1

Règle : ReLU pour les couches cachées (rapide, pas de saturation). Sigmoid
pour la sortie binaire. Softmax pour la classification multi-classe. Linéaire
pour la régression.

Problème ReLU : neurones morts si z < 0 pour tous les exemples ⇒

gradient nul ⇒ poids figés. Solution : Leaky ReLU (α = 0.01) ou ELU.

4/9
Rétropropagation et Optimiseurs

Convergence des optimiseurs

Rétropropagation (Backpropagation)

Calculer ∂L
par la règle de dérivation en chaîne : Adam
∂W[l]
RMSprop
∂L ∂L ∂A[l] ∂Z[l] SGD
= · · 0.4
∂W[l] ∂A[l] ∂Z[l] ∂W[l]

Perte (loss)
SGD+momentum
Mise à jour SGD :
W ← W − η · ∇W L

0.2

Optimiseurs modernes

Adam (Kingma & Ba, 2015) : mt = β1 mt−1 + (1 − β1 )∇ vt =

β2 vt−1 + (1 − β2 )∇2 W ← W − η √v̂m̂t+ε 0 20 40 60 80 100
t
Adam = momentum + learning rate adaptatif par paramètre. Défaut : Époque
Adam
η = 0.001, β1 = 0.9, β2 = 0.999. converge plus vite. SGD+momentum peut mieux généraliser.

5/9
Regularisation : Batch Norm, Dropout, L1/L2

Impact Dropout + Batch Norm

Batch Normalization (Ioffe & Szegedy, 2015)
1
Normaliser les activations à l’intérieur du réseau :
zi − µB
ẑi = q
2 +ε
σB 0.9

Accuracy
z̃i = γ ẑi + β
γ, β : paramètres apprenables. Accélère l’entraînement, réduit la sensibilité
à l’initialisation. 0.8

Train (sans régul.)

Test (sans régul.)
Dropout (Srivastava et al., 2014) 0.7
Train (BN + Dropout)
0 20 Test40(BN +60Dropout)
80 100
Pendant l’entraînement, désactiver aléatoirement une fraction p de
neurones. Époque
mi · ai
ãi = , mi ∼ Bernoulli(1 − p)
1−p
Force chaque neurone à apprendre des représentations indépendantes.
Défaut : p = 0.2 à 0.5. Désactivé en inférence.

6/9
Applications Réelles

Classification Bancaire et Assurance Prévision de Prix (Régression)

Contexte : scoring client, churn, probabilité de défaut. Dataset : Ames Housing (81 features, dont 43 catégorielles).
Architecture : Input → BN → Dense(256) → Dropout(0.3) → Architecture : Entity Embedding pour catégories + MLP + sortie
Dense(128) → Sigmoid. linéaire.
Avantage : Entity Embedding pour les variables catégorielles. MAPE : 7.2% (comparable à XGBoost sur ce dataset).
BNP Paribas, AXA, Allianz. MLP compétitif face à XGBoost si embed- Zillow, Meilleurs Agents. Entity Embedding transforme les catégories
ding bien tunas. en représentations denses.

Systèmes de Recommandation Porte d’entrée vers le Deep Learning

Architecture : Neural Collaborative Filtering (NCF). CNN : MLP appliqué localement sur des images (convolution).
Idée : embeddings users + items → MLP → score de pertinence. RNN/LSTM : MLP partagé à travers le temps.
Exemple : Netflix Prize, Amazon recommendations. Transformer : MLP dans le feedforward block de chaque couche
Netflix, Spotify, YouTube. NCF + MLP a remplacé la factorisation d’attention.
matricielle classique. Comprendre le MLP, c’est comprendre le socle de tous les architectures
deep learning.

7/9
Avantages, Limites & Comparaison

+ Avantages – Limites

✓ Approximateur universel : apprend toute fonction × Données tabulaires : souvent inferieur à

continue XGBoost/RF
✓ Entity Embedding : représentations riches des × Tuning long : architecture, lr, dropout, batch size
catégories × n élevé nécessaire : risque d’overfit sur petits
✓ Scalable : mini-batch + GPU + TensorFlow/PyTorch datasets
✓ Transfert learning : fine-tuner des modèles × Boite noire : moins interprétable que les arbres
pré-entraînés
✓ Porte d’entrée vers CNN, RNN, Transformer

8/9
Récapitulatif Visuel

Données Architecture Adam + EarlyStopping

StandardScaler Dense + BN + Dropout ReduceLROnPlateau

Prédiction Diagnostic overfit Courbes loss

AUC / MAE Ajuster Dropout train vs val

1. StandardScaler 2. BN + Dropout 3. Adam + Early 4. Courbes loss

obligatoire ReLU cachées Stopping AUC / MAE

Mémoriser : Forward Pass → Loss → Backprop → Adam. ReLU pour les couches cachées. Batch Norm avant Dropout. EarlyStopping
toujours. StandardScaler avant l’entraînement.

9/9

Vous aimerez peut-être aussi

Cours Reseaux Neurones ENSPD
Pas encore d'évaluation
Cours Reseaux Neurones ENSPD
22 pages
Presentation MLP
Pas encore d'évaluation
Presentation MLP
18 pages
MLP et CNN avec Keras et TensorFlow
Pas encore d'évaluation
MLP et CNN avec Keras et TensorFlow
29 pages
Introduction au Deep Learning
Pas encore d'évaluation
Introduction au Deep Learning
36 pages
AI 02 MachineLearning DeepLearning
Pas encore d'évaluation
AI 02 MachineLearning DeepLearning
12 pages
Réseaux de Neurones Artificiels et MLP
Pas encore d'évaluation
Réseaux de Neurones Artificiels et MLP
27 pages
Introduction aux Réseaux de Neurones
Pas encore d'évaluation
Introduction aux Réseaux de Neurones
22 pages
Introduction au Machine Learning et Deep Learning
Pas encore d'évaluation
Introduction au Machine Learning et Deep Learning
12 pages
Introduction aux Réseaux de Neurones
Pas encore d'évaluation
Introduction aux Réseaux de Neurones
9 pages
Tutoriel sur la rétropropagation en deep learning
Pas encore d'évaluation
Tutoriel sur la rétropropagation en deep learning
90 pages
Introduction au Deep Learning MLP
Pas encore d'évaluation
Introduction au Deep Learning MLP
43 pages
Perceptron multicouche et rétropropagation
Pas encore d'évaluation
Perceptron multicouche et rétropropagation
57 pages
Les Réseaux de Neurones Artificiels
Pas encore d'évaluation
Les Réseaux de Neurones Artificiels
14 pages
Introduction aux Réseaux de Neurones ANNs
Pas encore d'évaluation
Introduction aux Réseaux de Neurones ANNs
67 pages
Résumé DL
Pas encore d'évaluation
Résumé DL
53 pages
Modélisation Et Reconnaissance Des Formes Regression Avec Les MLP (Perceptron Multi-Couches)
Pas encore d'évaluation
Modélisation Et Reconnaissance Des Formes Regression Avec Les MLP (Perceptron Multi-Couches)
25 pages
Régression avec Perceptrons Multicouches
Pas encore d'évaluation
Régression avec Perceptrons Multicouches
25 pages
Introduction à l'apprentissage profond
Pas encore d'évaluation
Introduction à l'apprentissage profond
49 pages
IA Et Big Data Part1
Pas encore d'évaluation
IA Et Big Data Part1
24 pages
Introduction aux réseaux de neurones
Pas encore d'évaluation
Introduction aux réseaux de neurones
26 pages
Introduction aux réseaux de neurones
Pas encore d'évaluation
Introduction aux réseaux de neurones
72 pages
Reseaux de Neurones
Pas encore d'évaluation
Reseaux de Neurones
31 pages
Introduction aux Réseaux de Neurones
Pas encore d'évaluation
Introduction aux Réseaux de Neurones
79 pages
Introduction aux Réseaux de Neurones
Pas encore d'évaluation
Introduction aux Réseaux de Neurones
7 pages
Introduction aux réseaux de neurones
Pas encore d'évaluation
Introduction aux réseaux de neurones
31 pages
Comprendre les Perceptrons et CNNs
Pas encore d'évaluation
Comprendre les Perceptrons et CNNs
10 pages
Introduction au Deep Learning et Réseaux Neuronaux
Pas encore d'évaluation
Introduction au Deep Learning et Réseaux Neuronaux
38 pages
CM 1
Pas encore d'évaluation
CM 1
33 pages
Comparaison TensorFlow et DeepLearning4J
Pas encore d'évaluation
Comparaison TensorFlow et DeepLearning4J
208 pages
Introduction au Deep Learning et IA
Pas encore d'évaluation
Introduction au Deep Learning et IA
49 pages
Perceptron Multicouches MLP en Deep Learning
Pas encore d'évaluation
Perceptron Multicouches MLP en Deep Learning
31 pages
Exercices Pratiques sur les MLP en Deep Learning
Pas encore d'évaluation
Exercices Pratiques sur les MLP en Deep Learning
3 pages
Deep Learning - Cours ENSAM 2025 - 2026
Pas encore d'évaluation
Deep Learning - Cours ENSAM 2025 - 2026
29 pages
2025 Cours IA
Pas encore d'évaluation
2025 Cours IA
59 pages
Introduction aux réseaux de neurones
Pas encore d'évaluation
Introduction aux réseaux de neurones
63 pages
Perceptron Multicouche et Rétropropagation
Pas encore d'évaluation
Perceptron Multicouche et Rétropropagation
17 pages
DeepLearning Master Part2
Pas encore d'évaluation
DeepLearning Master Part2
180 pages
Introduction aux réseaux de neurones et DNN
Pas encore d'évaluation
Introduction aux réseaux de neurones et DNN
56 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
30 pages
Reseauxdeneurones
Pas encore d'évaluation
Reseauxdeneurones
20 pages
Réseaux de Neurones Artificiels et Deep Learning
Pas encore d'évaluation
Réseaux de Neurones Artificiels et Deep Learning
76 pages
Réseaux de neurones multicouches
100% (1)
Réseaux de neurones multicouches
26 pages
Cours ML Part1
Pas encore d'évaluation
Cours ML Part1
86 pages
Deep Learning
Pas encore d'évaluation
Deep Learning
137 pages
Chapitre I - Introduction Deep Learning
Pas encore d'évaluation
Chapitre I - Introduction Deep Learning
52 pages
IA - Course - Part 2
Pas encore d'évaluation
IA - Course - Part 2
52 pages
Introduction aux réseaux de neurones
Pas encore d'évaluation
Introduction aux réseaux de neurones
25 pages
Deep Learning
Pas encore d'évaluation
Deep Learning
8 pages
Cours sur les réseaux de neurones
Pas encore d'évaluation
Cours sur les réseaux de neurones
26 pages
Introduction au Machine Learning 2023
Pas encore d'évaluation
Introduction au Machine Learning 2023
27 pages
Introduction aux réseaux de neurones
Pas encore d'évaluation
Introduction aux réseaux de neurones
26 pages
Fondamentaux du Deep Learning
Pas encore d'évaluation
Fondamentaux du Deep Learning
163 pages
Introduction à l'Intelligence Computationnelle
Pas encore d'évaluation
Introduction à l'Intelligence Computationnelle
146 pages
Introduction aux Réseaux de Neurones
Pas encore d'évaluation
Introduction aux Réseaux de Neurones
96 pages
Comprendre le Deep Learning et ses Neurones
Pas encore d'évaluation
Comprendre le Deep Learning et ses Neurones
46 pages
Day 8
Pas encore d'évaluation
Day 8
14 pages
Introduction aux Réseaux Neuronaux Récurrents
Pas encore d'évaluation
Introduction aux Réseaux Neuronaux Récurrents
25 pages
Analyse des Files d'Attente en Santé et Services
Pas encore d'évaluation
Analyse des Files d'Attente en Santé et Services
2 pages
Examen de Chaînes de Markov 2016
100% (1)
Examen de Chaînes de Markov 2016
4 pages
Examen sur les chaînes de Markov - MIMSE 2012-2013
Pas encore d'évaluation
Examen sur les chaînes de Markov - MIMSE 2012-2013
7 pages
Matrices symétriques et positives
Pas encore d'évaluation
Matrices symétriques et positives
12 pages
Rappels essentiels d'algèbre linéaire
Pas encore d'évaluation
Rappels essentiels d'algèbre linéaire
8 pages