Introduction
Le machine learning est une branche de l’intelligence artificielle qui permet d’apprendre à partir de
donnée, sans être explicitement programmé pour chaque tache. Au lieu de suivre des instructions fixes,
les systèmes de machine learning identifie des modèles, font des prédictions et s’améliore
automatiquement avec l’expérience.
Cette discipline repose sur l’idée que les données contiennent des structures exploitables. En
analysant de grands volumes d’informations, un algorithme peut apprendre à reconnaitre des
tendances et à prendre des décisions. Par exemple, il peut être utilisé pour recommander des films,
détecter des fraudes bancaires ou encore reconnaitre des images et des voix.
2- Principe fondamental
Contrairement à la programmation classique :
Programmation classique :
Données+ règles Résultat
Machine learning :
Données + résultat Modèle (qui apprend les règles)
(Le Ml n’apprend pas « comme un humain ». il optimise une fonction mathématique ‘’ souvent une
erreur ‘’).
3 – Types principaux de Machine Learning
a- Apprentissage supervisé
. Données étiquetées
Exemple : reconnaitre si un email est spam
Tache :
. Classification (Chat / chien)
. Régression (Prédire un prix)
b- Apprentissage non supervisé
. Données sans étiquette
. Objectif : trouver des structures cachées
Exemple : Regrouper des clients selon leur comportement
c- Apprentissage par renforcement
. Apprentissage par essais/ erreurs
.Basé sur récompense/ punition
Exemple :
. Jeux (échecs, Go)
. Robot autonomes
4- Algorithmes courants en Machine Learning
Il existe plusieurs algorithmes.
Chaque algorithme est adapté à un type de problème et de données. Le choix du modèle est donc une
étape critique en Machine Learning
Régression linéaire
k-plus proche voisin (KNN)
Arbre de décision
Foret aléatoires
Machines à vecteurs de support (SVM)
1- Régression linéaire
Trouver une relation entre des variables pour prédire une valeur.
Type : Régression
Sortie : nombre (ex: prix)
Quand l’utiliser
Relation simple entre les variables
Données peu complexes
Limite (conséquence)
Mauvais si la relation est non linéaire
2- K plus proche voisins (KNN)
Regarder les ‘’voisins’’ les plus proches pour décider.
Type classification ou régression
Exemple :
Tu veux classer un email
Tu regardes les emails similaires
La majorité décide.
Quand l’utiliser ?
Donner simple (peu de donner)
Limites
Lent si beaucoup de données
Sensible au bruit (données incorrectes, mal étiquetées).
3- Arbre de décision
Prendre des décisions en posant des questions successives.
Type : Classification ou régression
Exemple
‘’Revenu > 3000 ?’’
‘’Age> à 30 ?’’
Décision finale
Structure de l’arbre quand l’utilisé ?
Besoin d’explication claire, données structurées
Limite
Peut sur apprendre facilement
4- Foret aléatoire (Random Forest)
Utiliser plusieurs arbres de décision et combiner leurs résultats.
Plus précis qu’un seul arbre
Réduit le surapprentissage (correspond à un modèle qui apprend les détails des données au lieu de le
tendance générale, ce qui le rend inefficace sur de nouvelles données)
Quand l’utiliser ?
Donner complexes
Besoins de bonnes performances
Limite
Moins interprétable
4-SVM (Machines à vecteur de support)
Tracer une frontière qui sépare les données
Exemples
Séparer chats vs chiens
Le modèle cherche la meilleure séparation possible.
Quand l’utiliser ?
Données bien séparables
Problèmes de classification
Limites
Difficile à comprendre
Pas idéal pour très grandes données
Résumé stratégique
Algorithme Utilisation principale
Régression linéaire Prédire une valeur
KNN Classification simple
Arbre de décision Décision explicable
Random Forest Performance élevée
SVM Séparation précise
5- Processus d’un projet ML (1-2 slides)
Collecte des données
Nettoyage
Sélection des caractéristiques
Chois du modèle
Entrainement
Evaluation (accury, précision, etc)
Déploiement
6- Domaines d’application
Le Machine Learning est utilisé dans :
Santé (diagnostic médical)
Finance (détection des fraudes)
E-commence (recommandation)
Transport (voiture autonome)
Réseaux sociaux (Filtrage de contenu)
7- Avantages et limites
a- Avantages
Autonomisation intelligente
Capacité à traiter de grandes données
Amélioration contenue avec plus de données
b- Les limites
Dépendance aux données (qualité critique)
- Un modèle de ML est aussi bon que ses données
- Données mauvaises = modèle mauvais
- Données biaisées = décisions biaisées
Biais algorithmiques
Le modèle peut apprendre des injustices cachées :
- Discrimination (genre, origine, etc.)
- Mauvaises généralisations
Exemple : un système de reconnaissance faciale moins précis pour certaines populations.
Cout de calcul élevé
Le Machine Learning demande :
Beaucoup de données
Beaucoup de puissance de calcul
Du temps
Manque d’interprétation (boite noire)
Un modèle est dit boite noire quand :
Il donne une prédiction, mais on ne comprend pas comment il a pris cette décision
Pourquoi ça arrive ?
a- Modèle trop complexe
Certains modèles utilisent :
Des milliers (ou millions) de paramètres
Des calculs non intuitifs
Exemple : réseau des neurones
b- Relation non visible
Le modèle capte des relations mathématiques cachées que l’humain ne peut pas facilement interpréter.
Exemple : imaginons un modèle médical :
- Entrée : données d’un patient
- Sortie : « risque élevé de maladie »
Problème : le programme ne dit pas : C’est à cause de X et Y
Il dit juste : résultat : ‘’risque élevé ‘’
C’est un sérieux problème car il crée un manque de confiance
Peut-on réduire l’effet ‘’ boite noire’’ ?
Oui partiellement en utilisant un arbre de décision et la régression linéaire
En conclusion : la boite noire désigne le fait que certains modèles donnent des résultats sans fournir
d’explication claire. Cela pose des problèmes de confiance, surtout dans les domaines sensibles
comme la santé ou la finance.
8- Ouverture de Discussion
Peut-on faire confiance aux décisions automatiques ?
Le Machine Learning est-il dangereux ?
Les données biaisées rendent-elles les modèles injustes ?
Remplace-t-il réellement l’intelligence humaine ?
Conclusion
Le Machine Learning est le cœur de l’intelligence artificielle moderne.
Il permet aux machines d’apprendre à partir des données, mais reste limité par la qualité de ces
données et les choix humains derrière les modèles.