Algorithmes d'optimisation en machine learning

Le document présente plusieurs algorithmes d'optimisation et de classification en machine learning, notamment la descente de gradient pour minimiser une fonction coût, l'Analyse en Composantes Principales (ACP) pour la réduction de dimension, le classifieur Naïve Bayes pour la classification basée sur le théorème de Bayes, et la régression ridge pour réduire l'overfitting. Chaque algorithme est défini, son but est expliqué, ainsi que les types de problèmes qu'il résout et son principe de fonctionnement. Les détails incluent des formules mathématiques et des exemples d'application pour chaque méthode.

Transféré par

fernandbenjamink

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

13 vues4 pages

Algorithmes d'optimisation en machine learning

Transféré par

fernandbenjamink

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Algorithme de descente de gradient

Définition
La descente de gradient est une méthode itérative d'optimisation qui cherche à minimiser
une fonction différentiable (fonction coût) J (θ) en se déplaçant dans la direction opposée au
gradient ∇ θ J (θ).
But de l'algorithme
Trouver les paramètres θ qui minimisent une fonction coût J (θ). C’est le cas par exemple
pour ajuster un modèle aux données).
Types de problèmes résolus par la descente de gradient
- Régression linéaire (minimiser MSE).
- Réseaux de neurones (minimiser Loss).
- Optimisation convexe ou non-convexe en machine learning.
Exemples : ajuster une droite aux points, entraînement d'un perceptron, estimation de
paramètres.
Principe de fonctionnement
On considère une fonction coût J ( θ ) . À l'itération t :

θ(t+ 1)=θt −α ∇θ J ( θt ) ,

où α >0 est le taux d'apprentissage (Learning rate).

Pour la régression linéaire simple (modèle hθ ( x )=θ 0+θ 1 (x)) avec m exemples ( x(i) , y(i)) la
fonction coût (MSE) :
m
1
∑
2
j ( θ 0 , θ1 )= (h θ ( x ( i) )− y ( i) )
2 m i=1

Les gradients :
m
∂J 1
= ∑ ¿ ¿,
∂ θ j m i=1

Avec x 0(i) =1, x 1(i)=x (i) .

Variantes : batch GD (tous les exemples), mini-batch GD, stochastic GD (SGD).

Algorithme ACP via décomposition SVD (PCA via SVD)

Définition
L'Analyse en Composantes Principales (ACP ou PCA) est une méthode de réduction de
dimension qui cherche des directions orthogonales (composantes principales) maximisant la
variance des données. La SVD (Singular Value Decomposition) est une façon numérique
stable de calculer la PCA.

But de l'algorithme
L’objectif est de réduire la dimensionnalité tout en conservant le maximum de variance, de
faciliter visualisation, la compression, le débruitage et le prétraitement pour l’apprentissage.

Types de problèmes
- Compression d'images, représentation de données, visualisation (projeter en 2D/3D).
- Prétraitement avant classification.
Exemples : réduction d'un jeu de données 100-d à 2-d pour visualiser clusters.

Principe de fonctionnement
Soit X ∈ R m ×n (m échantillons, n variables).
1
1. Centrer les données : ~
X= X−1 μ où μ=
T
∑X;
m i i

2. Calculer SVD : ~ T
X=U Σ V .
o Colonnes de V sont vecteurs propres de la matrice de covariance (directions
principales).
o Σ contient les valeurs singulières σ 1 ≥ σ 2 ≥ ….
~
3. Projeter sur les k premières composantes : Z= X V k (où V k est en n × k ).

4. Reconstruction approchée : ^ T T
X =Z V k +1 μ .
2
1 ~T ~ Σ T
Lien avec covariance : X X =V V .
m m

Algorithme Classifieur Naïve Bayes (Gaussien)

Définition
Le classifieur naïve Bayes applique le théorème de Bayes en supposant l'indépendance
conditionnelle des caractéristiques xjx_jxj donné la classe yyy. Pour les variables continues,
on utilise souvent la loi normale (Gaussienne) par caractéristique — d'où Gaussian Naive
Bayes.

But de l'algorithme
Classer un échantillon xxx en la classe ccc qui maximise la probabilité a posteriori P(c∨x).

Types de problèmes
Cet algorithme permet de résoudre des problèmes de classification binaire ou multi-classes.
Exemples : filtrage spam, classification de texte (avec variantes multinomiales), classification
de fleurs IRIS, etc.

Principe de fonctionnement
Par Bayes :
P ( x|c ) P (c )
P ( c|x )= .
P(x)

On choisit c^ =arg maxc P ( x|c ) P (c) .

n
Naïve : P ( x|c )=∏ P (x j∨c).
j=1

Gaussian NB : on suppose x j∨ y=c ℵ (μ cj , σ 2cj ). Alors :

2
n
1 −( x j−μ cj )
P ( x|c )=∏ exp ⁡( ).
j=1 √2 π σ 2
cj
2
2 σ cj

On calcule log-probabilités pour stabilité :

[ ]
2
−1 ( x j−μcj )
lop P ( x|c ) +log P ( c )=∑ log ( 2 π σ cj )−
2
2
+ logP ( c ) .
j 2 2 σ cj

Régression ridge en optimisation (Ridge Regression ou Régression

à régularisation L2)
Définition
La régression ridge minimise la somme des carrés des erreurs plus un terme de pénalité
proportionnel au carré des coefficients (L2) :
1 2 λ
¿| Xβ− y|∨¿ 2+ ¿|β|∨¿ 2 ¿ ¿ .
2
J ( β )=
2m 2
où λ ≥ 0 contrôle la force de la régularisation.

But de l'algorithme
Réduire l'overfitting lorsque les variables sont multicolinaires ou quand il y a beaucoup de
caractéristiques, en contraignant la magnitude des coefficients.

Types de problèmes
Cet algorithme peut être utilisé pour :
- Régression linéaire avec colinéarité.
- Problèmes où on veut éviter coefficients très grands.
Exemples : prédiction de prix avec de nombreuses paramètres corrélées, modèle
linéaire en présence de bruit élevé.

Principe de fonctionnement
Solution analytique (closed-form) :
^β=(X T X + λmI )−1 X T y .

Remarque : Ces formules varient selon normalisation des termes. Ici, j'ai inclus facteur 1/m
dans coût.
On peut aussi minimiser itérativement via gradient :
1 T
∇βJ= X ( Xβ− y ) + λβ ,
m
Et la mise à jour (GD) est définie par :
t +1 t
β =β −α ¿.

Vous aimerez peut-être aussi

Regression en Machine Learning
Pas encore d'évaluation
Regression en Machine Learning
55 pages
Implémentation de SVM en Python
Pas encore d'évaluation
Implémentation de SVM en Python
4 pages
Naïve Bayes Classifier 1
Pas encore d'évaluation
Naïve Bayes Classifier 1
66 pages
Classifieurs Linéaires en Apprentissage Machine
Pas encore d'évaluation
Classifieurs Linéaires en Apprentissage Machine
42 pages
Algorithme de descente de gradient
Pas encore d'évaluation
Algorithme de descente de gradient
6 pages
Prediction Supervisee
Pas encore d'évaluation
Prediction Supervisee
40 pages
Gradient Stochastique en Apprentissage Machine
Pas encore d'évaluation
Gradient Stochastique en Apprentissage Machine
3 pages
Régression sur Composantes Principales
Pas encore d'évaluation
Régression sur Composantes Principales
51 pages
Harawkan 6
Pas encore d'évaluation
Harawkan 6
34 pages
Ai Cours
Pas encore d'évaluation
Ai Cours
5 pages
Introduction aux SVM et k-NN
Pas encore d'évaluation
Introduction aux SVM et k-NN
40 pages
TP Perceptron et Gradient Stochastique
Pas encore d'évaluation
TP Perceptron et Gradient Stochastique
5 pages
Deep Learning avec Keras et TensorFlow
Pas encore d'évaluation
Deep Learning avec Keras et TensorFlow
30 pages
Algorithms
Pas encore d'évaluation
Algorithms
149 pages
Introduction aux Support Vector Machines
Pas encore d'évaluation
Introduction aux Support Vector Machines
22 pages
Introduction à l'apprentissage supervisé
Pas encore d'évaluation
Introduction à l'apprentissage supervisé
4 pages
Réseaux de Neurones: Définitions Exemples Types D'apprentissage
Pas encore d'évaluation
Réseaux de Neurones: Définitions Exemples Types D'apprentissage
89 pages
SVM : Discrimination et Hyperplan Optimal
Pas encore d'évaluation
SVM : Discrimination et Hyperplan Optimal
16 pages
Algorithmes d'optimisation en ML
Pas encore d'évaluation
Algorithmes d'optimisation en ML
20 pages
Optimisation des SVM et Analyse des Noyaux
Pas encore d'évaluation
Optimisation des SVM et Analyse des Noyaux
14 pages
Algorithme des K Plus Proches Voisins
Pas encore d'évaluation
Algorithme des K Plus Proches Voisins
8 pages
Comprendre l'algorithme XGBoost
Pas encore d'évaluation
Comprendre l'algorithme XGBoost
21 pages
SVM : Méthodes et Optimisation
Pas encore d'évaluation
SVM : Méthodes et Optimisation
5 pages
Descente de Gradient Stochastique et SVD
Pas encore d'évaluation
Descente de Gradient Stochastique et SVD
11 pages
Aaaaaaaaaaaaaaaa
Pas encore d'évaluation
Aaaaaaaaaaaaaaaa
56 pages
Optimisation en apprentissage machine
Pas encore d'évaluation
Optimisation en apprentissage machine
25 pages
Cours ML Op Minds 25 26
Pas encore d'évaluation
Cours ML Op Minds 25 26
51 pages
Solutions SVD et Optimisation Mathématique
Pas encore d'évaluation
Solutions SVD et Optimisation Mathématique
13 pages
Chap02 GD
Pas encore d'évaluation
Chap02 GD
74 pages
Guide complet sur la régression polynomiale
Pas encore d'évaluation
Guide complet sur la régression polynomiale
11 pages
Classification avec SVM et Noyaux
Pas encore d'évaluation
Classification avec SVM et Noyaux
50 pages
Linear Regression From Scratch-1
Pas encore d'évaluation
Linear Regression From Scratch-1
14 pages
Classification supervisée avec SVM
Pas encore d'évaluation
Classification supervisée avec SVM
28 pages
Algorithmes de Classification en ML
Pas encore d'évaluation
Algorithmes de Classification en ML
29 pages
SVM - Seance - 8 (1) - Compressed
Pas encore d'évaluation
SVM - Seance - 8 (1) - Compressed
95 pages
Implémentation de la Descente de Gradient
Pas encore d'évaluation
Implémentation de la Descente de Gradient
5 pages
Optimiseurs en apprentissage automatique
Pas encore d'évaluation
Optimiseurs en apprentissage automatique
3 pages
Introduction aux Support Vector Machines
Pas encore d'évaluation
Introduction aux Support Vector Machines
22 pages
Introduction au Deep Learning MLP
Pas encore d'évaluation
Introduction au Deep Learning MLP
43 pages
Algorithmes de Régression en Machine Learning
Pas encore d'évaluation
Algorithmes de Régression en Machine Learning
6 pages
Régression Linéaire en Machine Learning
100% (1)
Régression Linéaire en Machine Learning
46 pages
Cours ML - Séance 3
Pas encore d'évaluation
Cours ML - Séance 3
37 pages
SVM : Classification et Marges Maximales
Pas encore d'évaluation
SVM : Classification et Marges Maximales
29 pages
Introduction aux SVM et leur fonctionnement
Pas encore d'évaluation
Introduction aux SVM et leur fonctionnement
13 pages
IA Cours1
Pas encore d'évaluation
IA Cours1
89 pages
Techniques de régression linéaire en IA
Pas encore d'évaluation
Techniques de régression linéaire en IA
36 pages
Cours IA Chapitres 1
Pas encore d'évaluation
Cours IA Chapitres 1
72 pages
Apprentissage supervisé : Perceptron et TP
Pas encore d'évaluation
Apprentissage supervisé : Perceptron et TP
3 pages
Optimisation SVM et Convexification
Pas encore d'évaluation
Optimisation SVM et Convexification
26 pages
Régression Linéaire Multiple et Estimation
Pas encore d'évaluation
Régression Linéaire Multiple et Estimation
13 pages
Optimisation Stochastique en Ingénierie
Pas encore d'évaluation
Optimisation Stochastique en Ingénierie
32 pages
(Ai) Ayehhhhhhh Ayeeeh Atvalide
Pas encore d'évaluation
(Ai) Ayehhhhhhh Ayeeeh Atvalide
8 pages
Optimisation Stochastique en Statistique
Pas encore d'évaluation
Optimisation Stochastique en Statistique
27 pages
Introduction à Scikit-Learn en ML
Pas encore d'évaluation
Introduction à Scikit-Learn en ML
35 pages
Introduction à l'apprentissage automatique
100% (1)
Introduction à l'apprentissage automatique
53 pages
Mobilisation pour le festival Mbog Liaa
Pas encore d'évaluation
Mobilisation pour le festival Mbog Liaa
2 pages
Installation rapide caméra IPCam 360°
Pas encore d'évaluation
Installation rapide caméra IPCam 360°
31 pages
Universalisation des Compétences au Cameroun
Pas encore d'évaluation
Universalisation des Compétences au Cameroun
18 pages
Amélioration QoS Télécom par IA
Pas encore d'évaluation
Amélioration QoS Télécom par IA
8 pages
Introduction aux exceptions en Python
Pas encore d'évaluation
Introduction aux exceptions en Python
4 pages
iPhone 12 Noir 128GB - Excellent État
Pas encore d'évaluation
iPhone 12 Noir 128GB - Excellent État
1 page
Sécurité Des Bases de Données-1 Sur 4
Pas encore d'évaluation
Sécurité Des Bases de Données-1 Sur 4
96 pages
Installation de l'interface EXT3 FERMATOR
Pas encore d'évaluation
Installation de l'interface EXT3 FERMATOR
7 pages
Informatique Décisionnelle : Concepts Clés
Pas encore d'évaluation
Informatique Décisionnelle : Concepts Clés
16 pages
Institut Supérieure de Technologies Appliquées Et de Management - 071912
Pas encore d'évaluation
Institut Supérieure de Technologies Appliquées Et de Management - 071912
7 pages
Exercice corrigé sur TCP/IP
Pas encore d'évaluation
Exercice corrigé sur TCP/IP
7 pages
CP-Event Pharma VF
Pas encore d'évaluation
CP-Event Pharma VF
3 pages
Fonctionnement de l'imprimante jet d'encre
Pas encore d'évaluation
Fonctionnement de l'imprimante jet d'encre
3 pages
Système Indim@j : Gestion des Dépenses
100% (1)
Système Indim@j : Gestion des Dépenses
21 pages
Épreuve de Mathématiques Générales
Pas encore d'évaluation
Épreuve de Mathématiques Générales
2 pages
Meilleur addon Douglas DC3 pour FSX
Pas encore d'évaluation
Meilleur addon Douglas DC3 pour FSX
3 pages
Modélisation des motorisations sous Scilab
Pas encore d'évaluation
Modélisation des motorisations sous Scilab
22 pages
Engagement de Confidentialité EDF C4020T
Pas encore d'évaluation
Engagement de Confidentialité EDF C4020T
5 pages
Offre d'emploi : Technicien Telecom Cameroun
Pas encore d'évaluation
Offre d'emploi : Technicien Telecom Cameroun
3 pages
Requêtes SQL pour données inférieures à 10
Pas encore d'évaluation
Requêtes SQL pour données inférieures à 10
13 pages
Innovations avec les puces Espressif
Pas encore d'évaluation
Innovations avec les puces Espressif
140 pages
Comprendre l'algorithme TikTok
100% (1)
Comprendre l'algorithme TikTok
16 pages
Structure de la Page d'Accueil du Portfolio
Pas encore d'évaluation
Structure de la Page d'Accueil du Portfolio
3 pages
Protocole d'utilisation du chariot de bionettoyage
100% (2)
Protocole d'utilisation du chariot de bionettoyage
4 pages
Commande Sort en Linux : Guide Complet
100% (2)
Commande Sort en Linux : Guide Complet
2 pages
Équipement optimal pour BAC PRO Travaux publics
Pas encore d'évaluation
Équipement optimal pour BAC PRO Travaux publics
1 page
Modélisation scientifique assistée par ordinateur
Pas encore d'évaluation
Modélisation scientifique assistée par ordinateur
23 pages
Amants 2021 : Film Complet en Streaming
Pas encore d'évaluation
Amants 2021 : Film Complet en Streaming
4 pages
Usages des réseaux sociaux à Dakar
Pas encore d'évaluation
Usages des réseaux sociaux à Dakar
169 pages
Configuration d'un bac à sable informatique
Pas encore d'évaluation
Configuration d'un bac à sable informatique
1 page
BTS en Commerce International
Pas encore d'évaluation
BTS en Commerce International
4 pages
Apprendre le Français : Cours Élémentaire
Pas encore d'évaluation
Apprendre le Français : Cours Élémentaire
14 pages
Avantages et inconvénients de RAID 6
Pas encore d'évaluation
Avantages et inconvénients de RAID 6
6 pages
FCD-CO108-Ordre Interne - Clôture de Périodex
Pas encore d'évaluation
FCD-CO108-Ordre Interne - Clôture de Périodex
12 pages