0% ont trouvé ce document utile (0 vote)

7 vues66 pages

Introduction à l'apprentissage automatique

Le document présente une introduction à l'apprentissage automatique, un domaine de l'intelligence artificielle axé sur le développement de méthodes permettant aux machines d'apprendre à partir de données. Il aborde divers concepts tels que la généralisation, les types d'apprentissage (supervisé et non supervisé), ainsi que des techniques spécifiques comme les arbres de décision et le clustering K-means. Enfin, il discute des méthodes d'évaluation des modèles et des approches d'ensemble comme le bagging et le boosting.

Transféré par

mma177038

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

7 vues66 pages

Introduction à l'apprentissage automatique

Transféré par

mma177038

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

20/03/2023

Introduction à
l’apprentissage
automatique

OULAD SAYAD YOUNES

[Link]@[Link]

Quotes

1
20/03/2023

Acquisitions

Challenges

2
20/03/2023

Comparison

3
20/03/2023

What is Machine Learning?

•Un des champs d’étude de l’intelligence artificielle

•La discipline scientifique concernée par le développement,
l’analyse et l’implémentation de méthodes
automatisables qui permettent à une machine (au sens
large) d’évoluer grâce à un processus d’apprentissage.
•Permet de remplir des tâches qu’il est difficile ou
impossible de remplir par des moyens algorithmiques plus
classiques

4
20/03/2023

Where does ML fit in?

En texte

5
20/03/2023

En texte

Sur des documents

6
20/03/2023

En image

7
20/03/2023

Interface cerveau-machine

8
20/03/2023

Systèmes de recommendation

Dans les jeux et la robotique

9
20/03/2023

L’apprentissage aujourd’hui : Big Data

Quand appliquer l’apprentissage ?

10
20/03/2023

• Un bon modèle de machine learning, c’est un modèle qui

généralise.

• Qu’est-ce que c’est, déjà, la généralisation ?

La généralisation, c’est la capacité d’un modèle à faire des
prédictions non seulement sur les données que vous avez utilisées
pour le construire, mais surtout sur de nouvelles données : c’est
bien pour ça que l’on parle d’apprentissage

• L’objectif du machine learning est de trouver un modèle qui

effectue une approximation de la réalité (le phénomène à
l’origine des données), à l’aide de laquelle on va pouvoir
effectuer des prédictions. 21

Exemple

Comment ça marche ?

• On donne à l’algorithme des données

d’entrainement
• l’algorithme d’apprentissage machine
apprend un modèle capable de
généraliser à de nouvelles données

source : Hugo Larochelle

11
20/03/2023

Notations

source : Hugo Larochelle

Notations

12
20/03/2023

Types d’apprentissage machine

Apprentissage supervisé

13
20/03/2023

Classification vs Regression

14
20/03/2023

Classification vs Regression

Exemple

Exemple d’apprentissage supervisé en musique : reconnaissance du genre

15
20/03/2023

Exemple

16
20/03/2023

Apprentissage non-supervisé

source : Hugo Larochelle

Exemple

17
20/03/2023

Exemple

Un premier exemple : La régression linéaire

18
20/03/2023

Un premier exemple : La régression linéaire

Linear regression vs Logistic Regression

Linear regression Logistic regression

19
20/03/2023

Linear regression vs Logistic Regression

Validation croisée / Cross-validation

20
20/03/2023

Cross-validation

Stratified Cross validation

21
20/03/2023

Confusion matrix

Exactitude / Accuracy

Confusion matrix

Précision / Precision

Out of all the positive predicted,

what percentage is truly positive

22
20/03/2023

Confusion matrix

Rappel (sensibilité) / Recall / TPR

Out of the total positive, what

percentage are predicted positive

Confusion matrix

Spécificité / Specificity

How well a test can identify true

negatives

23
20/03/2023

Confusion matrix

F-measure (F1-score) & G-mean (Geometric mean)

Confusion matrix

False Positive Rate (FPR)

Ratio of negative events wrongly categorized as positive and the total number of
actual negative events

24
20/03/2023

Confusion matrix

False negative rate (FNR) / Miss rate

The probability that a true positive will be missed by the test

Exemple

25
20/03/2023

Bias vs Variance

HighBias

Bias vs Variance

High Variance

26
20/03/2023

Bias vs Variance

Probabilistic classifiers

Classification models are predictive models that predict a class label based on an
input example. But some classification models do not directly predict a class for an
example of the given input but instead report a probability; this classification model
is called the Probabilistic classification model.
For example, it might predict that there’s a 75% chance the observation is positive.
The natural choice is to assign the observation as positive since the predicted
probability is greater than 50%. However, we don’t have to stick to 50%; we can
adjust our threshold and only classify observations as positive if our models predict
a greater than 90% probability.
Examples: Naive Bayes, Logistic Regression and Multilayer Perceptrons

27
20/03/2023

Probabilistic classifiers

By increasing the threshold, our model will only make positive predictions when it
is confident. Conversely, if we lower our threshold, our model will more liberally
assign positive labels. Model’s precision and recall are affected by adjusting the
threshold.

ROC curve (Receiver Operating Characteristic curve)

TPR tells us what proportion of the positive class got correctly classified.
FPR tells us what proportion of the negative class got incorrectly classified.

28
20/03/2023

ROC curve (Receiver Operating Characteristic curve)

The ROC curve shows the

trade-off between
sensitivity (or TPR) and
specificity (1 – FPR).
Classifiers that give curves
closer to the top-left corner
indicate a better
performance. As a baseline,
a random classifier is
expected to give points lying
along the diagonal (FPR =
TPR). The closer the curve
comes to the 45-degree
diagonal of the ROC space,
the less accurate the test.
57

ROC curve (Receiver Operating Characteristic curve)

29
20/03/2023

ROC curve (Receiver Operating Characteristic curve)

The Area Under the Curve (AUC) is the measure of the ability of a classifier to
distinguish between classes and is used as a summary of the ROC curve.
The higher the AUC, the better the performance of the model at distinguishing
between the positive and negative classes.

Supervised Learning: KNN

KNN

30
20/03/2023

Supervised Learning: KNN

kNN (k plus proches voisins)

Supervised Learning: KNN

kNN (k plus proches voisins)

31
20/03/2023

Supervised Learning: KNN

kNN (k plus proches voisins)

Supervised Learning: KNN

kNN (k plus proches voisins)

32
20/03/2023

Supervised Learning: KNN

kNN (k plus proches voisins)

Distance Euclidienne
65

Supervised Learning: Decision Trees (DT)

• Les arbres de décision sont une sorte
de modèles non paramétriques, qui
peuvent être utilisés à la fois pour la
classification et la régression.
• Les arbres de décision apprennent à
partir des données pour approximer une
courbe sinusoïdale avec un ensemble
de règles de décision si-alors-sinon
• Les DT sont construits à l'aide de
deux types d'éléments : les nœuds et
les branches.
• A chaque nœud, une des
caractéristiques de nos données est
évaluée afin de scinder les observations
• Le nœud feuille représente une
classification ou une décision
66

33
20/03/2023

Supervised Learning: Decision Trees (DT)

34
20/03/2023

Supervised Learning: Decision Trees (DT)

Supervised Learning: Support Vector Machine (SVM)

35
20/03/2023

Supervised Learning: Support Vector Machine (SVM)

36
20/03/2023

Supervised Learning: Support Vector Machine (SVM)

Kernel types:

Supervised Learning: Support Vector Machine (SVM)

Kernel types:

Polynomial kernel vs Linear kernel

37
20/03/2023

Supervised Learning: Support Vector Machine (SVM)

Regularisation C.

Unsupervised Learning: Clustering

• L'organisation des données non étiquetées en groupes de similarité

appelés clusters.
• Un cluster est une collection d'éléments de données qui sont
« similaires » entre eux et « différents » aux éléments de données
dans d'autres clusters.

38
20/03/2023

Clustering Approaches

Hierarchical Clustering

39
20/03/2023

Cluster Distance Measures

Cluster Distance

40
20/03/2023

Example

41
20/03/2023

Example

42
20/03/2023

Example

43
20/03/2023

Example

44
20/03/2023

Partitioning Clustering: K-means

Le clustering K-means vise à partitionner les données en k clusters de manière à

ce que les points de données dans le même cluster soient similaires et que les
points de données dans les différents clusters soient plus éloignés.

K-means

Similarity of two points is determined by the distance between them

45
20/03/2023

K-means

Le fonctionnement de l'algorithme K-Means est expliqué dans les étapes ci-

dessous :

• Étape 1 : Sélectionnez le nombre K pour décider du nombre de clusters.

• Étape 2 : Sélectionnez des points K aléatoires ou des centroïdes.
• Étape 3 : Attribuez chaque point de données à leur centroïde le plus
proche, qui formera les clusters K prédéfinis.
• Étape 4 : Calculez la variance et placez un nouveau centre de gravité de
chaque cluster.
• Étape 5 : répétez les troisièmes étapes, ce qui signifie réaffecter chaque
point de données au nouveau centroïde le plus proche de chaque cluster.
• Étape 6 : Si une réaffectation se produit, passez à l'étape 4, sinon
TERMINER.
• Étape 7 : Le modèle est prêt.

K-means

1 2

46
20/03/2023

K-means

3 4

K-means
La variance des clusters se calcule comme suit :

5 6

47
20/03/2023

K-means

7 8

K-means

9 10

48
20/03/2023

K-means: Parameter Optimization

Généralement, en mettant dans un graphique les différents nombres de clusters en fonction de la
variance, on retrouve un graphique similaire à celui-ci :

On remarque sur ce graphique, la forme

d’un bras où le point le plus haut
représente l’épaule et le point le plus bas
représente l’autre extrémité : la main. Le
nombre optimal de clusters est le point
représentant le coude. Ici le coude peut
être représenté par 3. C’est le nombre
optimal de clusters. Généralement, le
point du coude est celui du nombre de
clusters à partir duquel la variance ne se
réduit plus significativement.

K-means: Parameter Optimization

49
20/03/2023

K-means: Parameter Optimization

100

50
20/03/2023

K-means: Parameter Optimization

101

K-means: Parameter Optimization

102

51
20/03/2023

K-means: Parameter Optimization

103

K-means: Parameter Optimization

104

52
20/03/2023

K-means: Parameter Optimization

105

K-means: Parameter Optimization

106

53
20/03/2023

K-means: Parameter Optimization

107

K-means: Parameter Optimization

108

54
20/03/2023

K-means: Parameter Optimization

109

K-means: Parameter Optimization

110

55
20/03/2023

K-means: Parameter Optimization

111

Ensemble Learning

112

56
20/03/2023

Bagging

113

Bagging

114

57
20/03/2023

Bagging

115

Bagging

116

58
20/03/2023

Boosting

117

Boosting

118

59
20/03/2023

Boosting

119

Boosting

120

60
20/03/2023

Stacking

121

Stacking

122

61
20/03/2023

Stacking

123

Stacking

124

62
20/03/2023

Stacking

125

Stacking

126

63
20/03/2023

Blending

127

Blending

128

64
20/03/2023

Voting

129

PCA: Principal component analysis

130

65
20/03/2023

PCA: Principal component analysis

The goal of PCA is to explain most of the variability in a dataset with fewer variables than
the original dataset. 131

PCA: Principal component analysis

132

Vous aimerez peut-être aussi

Introduction à l'apprentissage automatique
Pas encore d'évaluation
Introduction à l'apprentissage automatique
74 pages
Introduction à l'apprentissage automatique
Pas encore d'évaluation
Introduction à l'apprentissage automatique
91 pages
Machine Learning-2
Pas encore d'évaluation
Machine Learning-2
68 pages
Choix ML
Pas encore d'évaluation
Choix ML
8 pages
Harawkan 6
Pas encore d'évaluation
Harawkan 6
34 pages
2024 - 2 - Rappel de ML
Pas encore d'évaluation
2024 - 2 - Rappel de ML
49 pages
Introduction au Machine Learning
100% (1)
Introduction au Machine Learning
12 pages
ML Metriques Algorithmes
Pas encore d'évaluation
ML Metriques Algorithmes
7 pages
Introduction à l'apprentissage supervisé
Pas encore d'évaluation
Introduction à l'apprentissage supervisé
44 pages
Cours sur l'apprentissage supervisé
Pas encore d'évaluation
Cours sur l'apprentissage supervisé
38 pages
02 Regression Et Classification
Pas encore d'évaluation
02 Regression Et Classification
3 pages
Introduction à l'Apprentissage Automatique
Pas encore d'évaluation
Introduction à l'Apprentissage Automatique
36 pages
Introduction Au Machine Learning: Table Des Matières
Pas encore d'évaluation
Introduction Au Machine Learning: Table Des Matières
12 pages
Concepts clés du Machine Learning
Pas encore d'évaluation
Concepts clés du Machine Learning
9 pages
Cours sur l'Apprentissage Automatique
100% (1)
Cours sur l'Apprentissage Automatique
131 pages
Classification Supervisée en IA
Pas encore d'évaluation
Classification Supervisée en IA
36 pages
Algorithme des K Plus Proches Voisins
Pas encore d'évaluation
Algorithme des K Plus Proches Voisins
8 pages
Introduction à l'apprentissage supervisé
Pas encore d'évaluation
Introduction à l'apprentissage supervisé
114 pages
Méthodes clés du Machine Learning
Pas encore d'évaluation
Méthodes clés du Machine Learning
14 pages
Classification
Pas encore d'évaluation
Classification
16 pages
Apprentissage Automatique et Clustering
Pas encore d'évaluation
Apprentissage Automatique et Clustering
63 pages
Arbres de Décision et Méthodes Ensemblistes
Pas encore d'évaluation
Arbres de Décision et Méthodes Ensemblistes
33 pages
Machine Learning pour la Gestion des Tickets
Pas encore d'évaluation
Machine Learning pour la Gestion des Tickets
5 pages
ML1 1 Introduction
Pas encore d'évaluation
ML1 1 Introduction
19 pages
Métriques d'évaluation en Machine Learning
Pas encore d'évaluation
Métriques d'évaluation en Machine Learning
25 pages
Fouille Des Big Data Et Visualisation - Week 5
Pas encore d'évaluation
Fouille Des Big Data Et Visualisation - Week 5
49 pages
Chap4 Part1
Pas encore d'évaluation
Chap4 Part1
15 pages
Les Fondamentales Du Machine Learning
Pas encore d'évaluation
Les Fondamentales Du Machine Learning
50 pages
Apprentissage et Classification en ML
Pas encore d'évaluation
Apprentissage et Classification en ML
47 pages
Document Authorisé Exam
Pas encore d'évaluation
Document Authorisé Exam
8 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
16 pages
Introduction à l'apprentissage automatique
100% (1)
Introduction à l'apprentissage automatique
53 pages
Introduction à l'apprentissage supervisé
Pas encore d'évaluation
Introduction à l'apprentissage supervisé
16 pages
Modèles de Machine Learning Essentiels
Pas encore d'évaluation
Modèles de Machine Learning Essentiels
9 pages
Algorithmes de Machine Learning en 2023
100% (1)
Algorithmes de Machine Learning en 2023
52 pages
Chapitre 2 - Apprentissage Automatique
Pas encore d'évaluation
Chapitre 2 - Apprentissage Automatique
33 pages
Algorithmes de Classification en Machine Learning
Pas encore d'évaluation
Algorithmes de Classification en Machine Learning
30 pages
Cours ML Part1
Pas encore d'évaluation
Cours ML Part1
86 pages
Introduction à l'apprentissage statistique
Pas encore d'évaluation
Introduction à l'apprentissage statistique
26 pages
Machine Learning
Pas encore d'évaluation
Machine Learning
7 pages
Prétraitement des données en régression logistique
Pas encore d'évaluation
Prétraitement des données en régression logistique
35 pages
Catégorisation de textes et apprentissage
Pas encore d'évaluation
Catégorisation de textes et apprentissage
41 pages
Historique de l'apprentissage automatique
Pas encore d'évaluation
Historique de l'apprentissage automatique
61 pages
Types d'apprentissage machine expliqués
Pas encore d'évaluation
Types d'apprentissage machine expliqués
25 pages
Algorithmes d'apprentissage automatique clés
Pas encore d'évaluation
Algorithmes d'apprentissage automatique clés
6 pages
Resume IA Et ML
Pas encore d'évaluation
Resume IA Et ML
12 pages
Introduction à l'analyse prédictive
Pas encore d'évaluation
Introduction à l'analyse prédictive
40 pages
Introduction à l'Apprentissage Machine
Pas encore d'évaluation
Introduction à l'Apprentissage Machine
46 pages
Algorithmes de Machine Learning PDF
Pas encore d'évaluation
Algorithmes de Machine Learning PDF
16 pages
Chapitre 2 - Apprentissage Automatique
Pas encore d'évaluation
Chapitre 2 - Apprentissage Automatique
33 pages
Introduction au Machine Learning
100% (1)
Introduction au Machine Learning
63 pages
Processus d'apprentissage automatique
Pas encore d'évaluation
Processus d'apprentissage automatique
10 pages
Introduction à l'apprentissage automatique
Pas encore d'évaluation
Introduction à l'apprentissage automatique
25 pages
Résumé ML
Pas encore d'évaluation
Résumé ML
14 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
84 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
6 pages
Apprentissage supervisé et non supervisé
Pas encore d'évaluation
Apprentissage supervisé et non supervisé
32 pages
Sécurité des systèmes d'information : TD 1
Pas encore d'évaluation
Sécurité des systèmes d'information : TD 1
3 pages
Introduction à la régression logistique
Pas encore d'évaluation
Introduction à la régression logistique
18 pages
Introduction au Machine Learning 2023
Pas encore d'évaluation
Introduction au Machine Learning 2023
22 pages
Exercice Python sur les Diviseurs et Nombres Parfaits
Pas encore d'évaluation
Exercice Python sur les Diviseurs et Nombres Parfaits
1 page
Correction TD3 Cryptographie et Sécurité
Pas encore d'évaluation
Correction TD3 Cryptographie et Sécurité
9 pages
Exigences et scénarios de sécurité IT
Pas encore d'évaluation
Exigences et scénarios de sécurité IT
3 pages
Exercices de Chiffrement et Déchiffrement
Pas encore d'évaluation
Exercices de Chiffrement et Déchiffrement
2 pages
Questions sur la Sécurité Informatique
Pas encore d'évaluation
Questions sur la Sécurité Informatique
6 pages
Examen de Machine Learning 2023
100% (1)
Examen de Machine Learning 2023
3 pages
Exercices sur KNN et SVM en ML
Pas encore d'évaluation
Exercices sur KNN et SVM en ML
2 pages
Modèles d'entrepôts logistiques durables
Pas encore d'évaluation
Modèles d'entrepôts logistiques durables
2 pages
Détection rapide de CRKP par ML et MALDI-TOF
Pas encore d'évaluation
Détection rapide de CRKP par ML et MALDI-TOF
10 pages
Introduction au machine learning en français
Pas encore d'évaluation
Introduction au machine learning en français
2 pages
IA et contrôle qualité des données
Pas encore d'évaluation
IA et contrôle qualité des données
34 pages
Introduction à l'économie numérique
Pas encore d'évaluation
Introduction à l'économie numérique
7 pages
IA et achats impulsifs : étude exploratoire
Pas encore d'évaluation
IA et achats impulsifs : étude exploratoire
15 pages
TP 1 - Exercice 1 - Correction
Pas encore d'évaluation
TP 1 - Exercice 1 - Correction
4 pages
IA et Machine Learning au Tronc Commun
Pas encore d'évaluation
IA et Machine Learning au Tronc Commun
10 pages
Algorithmes d'Apprentissage Automatique
Pas encore d'évaluation
Algorithmes d'Apprentissage Automatique
36 pages
Maintenance Intelligente : Guide Pratique
Pas encore d'évaluation
Maintenance Intelligente : Guide Pratique
10 pages
Introduction à la science des données
Pas encore d'évaluation
Introduction à la science des données
26 pages
Introduction au Deep Learning et ANN
Pas encore d'évaluation
Introduction au Deep Learning et ANN
21 pages
Génération automatique de cas de test AI
Pas encore d'évaluation
Génération automatique de cas de test AI
5 pages
L'IA générative : enjeux et applications
Pas encore d'évaluation
L'IA générative : enjeux et applications
8 pages
2IA - Abdellatif El Afia Copie
Pas encore d'évaluation
2IA - Abdellatif El Afia Copie
2 pages
Quiz sur l'intelligence artificielle
Pas encore d'évaluation
Quiz sur l'intelligence artificielle
6 pages
Analyse de la Scalabilité des Big Data
Pas encore d'évaluation
Analyse de la Scalabilité des Big Data
16 pages
Optimisation 5G/6G par IA en Temps Réel
Pas encore d'évaluation
Optimisation 5G/6G par IA en Temps Réel
10 pages
Introduction au Machine Learning et Deep Learning
Pas encore d'évaluation
Introduction au Machine Learning et Deep Learning
12 pages
Impact de l'IA sur l'éducation et l'apprentissage
Pas encore d'évaluation
Impact de l'IA sur l'éducation et l'apprentissage
18 pages
IA et e-commerce : enjeux futurs
Pas encore d'évaluation
IA et e-commerce : enjeux futurs
6 pages
Sécurité des Objets Connectés IoT avec IA
Pas encore d'évaluation
Sécurité des Objets Connectés IoT avec IA
23 pages
Apprentissage Automatique : Guide Complet
Pas encore d'évaluation
Apprentissage Automatique : Guide Complet
47 pages
Définition et enjeux des faux positifs
Pas encore d'évaluation
Définition et enjeux des faux positifs
7 pages
Survol historique de l'IA par Gaussier
Pas encore d'évaluation
Survol historique de l'IA par Gaussier
48 pages
Introduction à l'apprentissage automatique
Pas encore d'évaluation
Introduction à l'apprentissage automatique
28 pages
Réseaux intelligents en télécommunications
Pas encore d'évaluation
Réseaux intelligents en télécommunications
5 pages
Gestion d'accès avec Aruba ClearPass
Pas encore d'évaluation
Gestion d'accès avec Aruba ClearPass
26 pages