Chapitre 2 — Outils mathématiques pour
l’intelligence artificielle
1
Chapitre 1
Les outils mathématiques dans
l’intelligence artificielle
1.1 Introduction
L’intelligence artificielle moderne repose fortement sur une variété d’outils mathé-
matiques. Ces outils permettent de représenter les données, de concevoir les modèles,
d’optimiser leurs performances et d’interpréter leurs résultats.
1.2 Algèbre linéaire
L’algèbre linéaire fournit un cadre pour représenter les données sous forme de vecteurs
ou de matrices. Par exemple, un jeu de données contenant m échantillons et n caractéris-
tiques peut être représenté par une matrice X ∈ Rm×n .
1.2.1 Produit scalaire
Soient deux vecteurs x, y ∈ Rn , leur produit scalaire est défini par :
n
X
⟨x, y⟩ = xi yi .
i=1
Ce produit est utilisé notamment dans les algorithmes de classification tels que les SVM
ou les réseaux de neurones.
1.2.2 Décomposition en valeurs singulières (SVD)
La décomposition en valeurs singulières (SVD) d’une matrice est une méthode cen-
trale en algèbre linéaire. Elle est parfois qualifiée de « théorème fondamental de l’algèbre
linéaire » (Strang, 1993), car elle peut s’appliquer à toute matrice, qu’elle soit carrée ou
non, et elle existe toujours.
2
De plus, comme nous allons le voir dans ce qui suit, la SVD d’une matrice A, qui
représente une application linéaire Φ : V → W , permet de quantifier le changement de
géométrie entre les deux espaces vectoriels sous-jacents.
Pour un aperçu plus approfondi des fondements mathématiques de la SVD, on pourra
se référer aux travaux de Kalman (1996) et Roy et Banerjee (2014).
Théorème 1.1 (Décomposition en valeurs singulières (SVD)). Soit A ∈ Rm×n une ma-
trice rectangulaire de rang r ∈ [0, min(m, n)]. La décomposition en valeurs singulières de
A est une factorisation de la forme :
A = U ΣV ⊤
où :
— U ∈ Rm×m est une matrice orthogonale dont les colonnes sont les vecteurs ui ,
i = 1, . . . , m,
— V ∈ Rn×n est une matrice orthogonale dont les colonnes sont les vecteurs vj ,
j = 1, . . . , n,
— Σ est une matrice m × n diagonale, telle que Σii = σi ≥ 0 et Σij = 0 pour i ̸= j.