0% ont trouvé ce document utile (0 vote)
3 vues12 pages

Introduction Au Machine Learning: Table Des Matières

Ce document introduit le Machine Learning, en expliquant ses concepts fondamentaux et ses différentes catégories d'algorithmes, notamment l'apprentissage supervisé, non supervisé et par renforcement. Il fournit également des exemples d'applications et des considérations pratiques pour les étudiants et professionnels ayant des bases en mathématiques et en programmation. Le contenu inclut des sections sur la régression linéaire, la classification, l'évaluation des modèles et des algorithmes avancés comme les forêts aléatoires et les réseaux de neurones.

Transféré par

optimisteoo77
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
3 vues12 pages

Introduction Au Machine Learning: Table Des Matières

Ce document introduit le Machine Learning, en expliquant ses concepts fondamentaux et ses différentes catégories d'algorithmes, notamment l'apprentissage supervisé, non supervisé et par renforcement. Il fournit également des exemples d'applications et des considérations pratiques pour les étudiants et professionnels ayant des bases en mathématiques et en programmation. Le contenu inclut des sections sur la régression linéaire, la classification, l'évaluation des modèles et des algorithmes avancés comme les forêts aléatoires et les réseaux de neurones.

Transféré par

optimisteoo77
Copyright
© All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Introduction au Machine Learning

Votre Nom
Université ou Organisation
27 janvier 2026

Résumé
Ce document présente une introduction au Machine Learning (Apprentissage Automa-
tique). Nous y abordons les concepts fondamentaux, les différentes catégories d’algorithmes
(supervisé, non supervisé, par renforcement), ainsi que des exemples d’applications et des
considérations pratiques. Ce cours est destiné aux étudiants et professionnels ayant des bases
en mathématiques et en programmation.

Table des matières


1 Introduction 3
1.1 Définition et historique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Pourquoi le Machine Learning ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Les grandes catégories d’apprentissage 3


2.1 Apprentissage supervisé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Apprentissage non supervisé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3 Apprentissage par renforcement . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

3 Régression Linéaire 4
3.1 Modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.2 Fonction coût et optimisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

4 Classification : Régression Logistique 5


4.1 Modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4.2 Fonction coût . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4.3 Extension multi-classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

5 Évaluation des modèles 6


5.1 Métriques pour la classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
5.2 Métriques pour la régression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
5.3 Validation croisée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

6 Algorithmes d’apprentissage non supervisé 7


6.1 K-means . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
6.2 Analyse en Composantes Principales (PCA) . . . . . . . . . . . . . . . . . . . . . 7

7 Forêts aléatoires (Random Forests) 8


7.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
7.2 Avantages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
7.3 Hyperparamètres principaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1
8 SVM (Support Vector Machines) 9
8.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
8.2 Fonction de décision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
8.3 Kernels courants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

9 Réseaux de neurones et Deep Learning 10


9.1 Le neurone artificiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
9.2 Architecture d’un réseau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
9.3 Entraînement par rétropropagation . . . . . . . . . . . . . . . . . . . . . . . . . . 10
9.4 Exemple d’architecture CNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

10 Exemple pratique : Projet ML complet 11


10.1 Workflow typique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
10.2 Bonnes pratiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

11 Conclusion et perspectives 12

2
1 Introduction
1.1 Définition et historique
Le Machine Learning (ML) est un sous-domaine de l’intelligence artificielle (IA) qui concerne
la conception de systèmes capables d’apprendre à partir de données, sans être explicitement
programmés pour chaque tâche. L’idée remonte aux travaux d’Arthur Samuel (1959) et connaît
depuis les années 2000 un essor considérable grâce à la disponibilité des données (Big Data) et
à la puissance de calcul.

1.2 Pourquoi le Machine Learning ?


— Traitement de problèmes complexes où les règles explicites sont difficiles à formuler (re-
connaissance d’images, traitement du langage naturel).
— Adaptation à des environnements changeants.
— Découverte de patterns cachés dans de grands volumes de données.

2 Les grandes catégories d’apprentissage


2.1 Apprentissage supervisé
L’algorithme apprend à partir d’exemples étiquetés (Xi , yi ). Le but est de trouver une fonc-
tion f telle que f (Xi ) ≈ yi .
— Classification : yi est une classe discrète (ex : spam/non-spam).
— Régression : yi est une valeur continue (ex : prix d’une maison).

2.2 Apprentissage non supervisé


L’algorithme explore des données sans étiquettes pour en découvrir la structure.
— Clustering : Regroupement des données en clusters (ex : segmentation client).
— Réduction de dimension : Visualisation et compression (PCA, t-SNE).

2.3 Apprentissage par renforcement


Un agent apprend à prendre des décisions en interagissant avec un environnement pour
maximiser une récompense cumulée (ex : jeux vidéo, robotique).

3
3 Régression Linéaire
3.1 Modèle
Pour un problème de régression linéaire simple :

y = θ 0 + θ1 x + ϵ

où θ0 est l’ordonnée à l’origine, θ1 le coefficient de pente et ϵ le bruit.


Sous forme matricielle, avec m exemples et n features :

y = Xθ + ϵ

3.2 Fonction coût et optimisation


La fonction coût des moindres carrés (MSE) est :
m
1 X
J(θ) = (hθ (x(i) ) − y (i) )2
2m i=1

avec hθ (x) = θ ⊤ x.
On minimise J(θ) via la descente de gradient :


θj := θj − α J(θ)
∂θj

où α est le taux d’apprentissage.

4
4 Classification : Régression Logistique
4.1 Modèle
Pour la classification binaire (y ∈ {0, 1}), on utilise la fonction sigmoïde :
1
hθ (x) = σ(θ ⊤ x) = ⊤
1 + e−θ x

qui représente la probabilité que y = 1.

4.2 Fonction coût


La fonction de coût logistique (log loss) est :
m h
1 X i
J(θ) = − y (i) log(hθ (x(i) )) + (1 − y (i) ) log(1 − hθ (x(i) ))
m i=1

4.3 Extension multi-classe


On utilise généralement la stratégie one-vs-rest (OvR) ou softmax pour les problèmes à k
classes.

5
5 Évaluation des modèles
5.1 Métriques pour la classification
— Précision : T P +TTN
P +T N
+F P +F N
— Précision : T PT+F
P
P
— Rappel (Recall) : T PT+F P
N
— F1-score : moyenne harmonique de précision et rappel
— Matrice de confusion : tableau croisé des prédictions vs. vraies classes.

5.2 Métriques pour la régression


1
(yi − ŷi )2
P
— Erreur quadratique moyenne (MSE) : m

— Racine de l’erreur quadratique moyenne (RMSE) : M SE
1 P
— Erreur absolue moyenne (MAE) : m |yi − ŷi |
— R2 : proportion de variance expliquée.

5.3 Validation croisée


La k-fold cross-validation permet une estimation robuste de la performance en découpant le
jeu d’entraînement en k partitions.

6
6 Algorithmes d’apprentissage non supervisé
6.1 K-means
Algorithme de clustering itératif qui partitionne les données en k clusters.

Algorithm 1 K-means
1: Choisir aléatoirement k centroïdes initiaux
2: repeat
3: Affecter chaque point au centroïde le plus proche
4: Recalculer les centroïdes comme moyenne des points de chaque cluster
5: until convergence (stabilisation des centroïdes)

6.2 Analyse en Composantes Principales (PCA)


Réduction de dimension linéaire qui projette les données sur les axes de plus grande variance.
Soit X la matrice centrée. On calcule les vecteurs propres de X⊤ X (covariance). Les compo-
santes principales sont les vecteurs propres associés aux plus grandes valeurs propres.

7
7 Forêts aléatoires (Random Forests)
7.1 Principe
Les forêts aléatoires combinent plusieurs arbres de décision entraînés sur des sous-ensembles
de données (bagging) et de features, puis agrègent leurs prédictions (moyenne pour la régression,
vote pour la classification). Ceci réduit le sur-apprentissage.

7.2 Avantages
— Excellente performance sur de nombreux problèmes.
— Peu sensible au réglage des hyperparamètres.
— Fournit une mesure d’importance des variables.
— Gère bien les données manquantes.

7.3 Hyperparamètres principaux


— n_estimators : Nombre d’arbres.
— max_depth : Profondeur maximale des arbres.
— min_samples_split : Nombre minimal d’échantillons pour diviser un nœud.

8
8 SVM (Support Vector Machines)
8.1 Principe
Les SVM recherchent l’hyperplan qui sépare les classes avec la marge maximale. Pour les
problèmes non linéairement séparables, on utilise le kernel trick pour projeter les données dans
un espace de plus grande dimension.

8.2 Fonction de décision


Pour un hyperplan défini par w et b, la fonction de décision est :

f (x) = w⊤ ϕ(x) + b

où ϕ est la fonction de mapping vers l’espace de features.

8.3 Kernels courants


— Linéaire : K(xi , xj ) = xi⊤ xj
— Polynomial : K(xi , xj ) = (γxi⊤ xj + r)d
— RBF (Gaussien) : K(xi , xj ) = exp(−γ∥xi − xj ∥2 )

9
9 Réseaux de neurones et Deep Learning
9.1 Le neurone artificiel
Un neurone calcule : n
X
z= wi xi + b, a = σ(z)
i=1

où σ est une fonction d’activation (sigmoïde, ReLU, tanh).

9.2 Architecture d’un réseau


Un réseau multicouche (feedforward) empile des couches denses (fully connected), des couches
de convolution (CNN), des couches récurrentes (RNN/LSTM), etc.

9.3 Entraînement par rétropropagation


L’algorithme de rétropropagation calcule efficacement le gradient de la fonction de coût par
rapport à tous les poids en utilisant la règle de chaîne.

9.4 Exemple d’architecture CNN

1 from tensorflow . keras import layers , models


2
3 model = models . Sequential ([
4 layers . Conv2D (32 , (3 ,3) , activation = ’ relu ’ , input_shape =(28 ,28 ,1) ) ,
5 layers . MaxPooling2D ((2 ,2) ) ,
6 layers . Flatten () ,
7 layers . Dense (64 , activation = ’ relu ’) ,
8 layers . Dense (10 , activation = ’ softmax ’)
9 ])
10 model . compile ( optimizer = ’ adam ’ ,
11 loss = ’ s p a r s e _ c a t e g o r i c a l _ c r o s s e n t r o p y ’ ,
12 metrics =[ ’ accuracy ’ ])
Listing 1 – Exemple simplifié avec Keras/TensorFlow

10
10 Exemple pratique : Projet ML complet
10.1 Workflow typique
1. Compréhension du problème et définition des objectifs.
2. Collecte et exploration des données (EDA).
3. Nettoyage et prétraitement : gestion des valeurs manquantes, encodage des variables
catégorielles, normalisation.
4. Sélection et entraînement des modèles : choix d’algorithmes, validation croisée.
5. Ajustement des hyperparamètres : grid search, random search.
6. Évaluation finale sur un jeu de test jamais vu.
7. Déploiement et monitoring en production.

10.2 Bonnes pratiques


— Toujours séparer les données en entraînement/validation/test.
— Utiliser des pipelines pour éviter les fuites d’information.
— Documenter les expériences (outils comme MLflow, Weights & Biases).
— Penser à l’interprétabilité et à l’équité des modèles.

11
11 Conclusion et perspectives
Le Machine Learning est devenu un outil indispensable dans de nombreux secteurs. Les
défis actuels incluent l’interprétabilité des modèles complexes (XAI), la réduction des biais,
l’apprentissage avec peu de données (few-shot learning), et l’équilibre entre performance et
consommation énergétique. Le domaine continue d’évoluer rapidement, avec des avancées dans
l’apprentissage auto-supervisé, les modèles de langage géants (LLMs) et l’apprentissage par
renforcement.

Références
— Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning.
Springer.
— Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.
— Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and Tensor-
Flow. O’Reilly.
— Documentation de scikit-learn et TensorFlow.

12

Vous aimerez peut-être aussi