0% ont trouvé ce document utile (0 vote)

7 vues6 pages

Classification de maladies cardiaques avec Python

Ce document présente un TP sur l'apprentissage supervisé utilisant le dataset de maladies cardiaques. Les objectifs incluent la compréhension de la formalisation d'un problème de classification, l'implémentation d'un modèle de régression logistique, et l'analyse des erreurs d'entraînement et de test. Le TP se compose de plusieurs parties, allant de la préparation des données à la visualisation des résultats et à l'analyse réflexive sur le biais et la variance des modèles.

Transféré par

MOHAMMED CHBOUBA

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

7 vues6 pages

Classification de maladies cardiaques avec Python

Transféré par

MOHAMMED CHBOUBA

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP2 – Apprentissage Supervisé (Heart

Disease Dataset)
🎯 Objectifs pédagogiques
• Comprendre la formalisation d’un problème supervisé
• Implémenter un modèle simple de classification (régression logistique)
• Calculer le risque empirique et manipuler différentes fonctions de coût
• Visualiser les effets de la complexité du modèle sur la généralisation
• Illustrer le compromis biais/variance à travers des exemples concrets

📁 Dataset utilisé
Vous utiliserez le fichier [Link], contenant des données médicales de patients :
- Exemples de variables : âge, cholestérol, tension, fréquence cardiaque, etc.
- Objectif : prédire la présence d’une maladie cardiaque (1 = oui, 0 = non).
Ce dataset est adapté à une tâche de classification binaire supervisée.

🔧 Partie 1 – Chargement et préparation des données

• • Charger les données dans un DataFrame avec pandas.

👉 Indication : Utilisez pd.read_csv() pour charger les données.

Affichez les premières lignes avec .head().

• • Vérifier les valeurs manquantes et les gérer.

👉 Indication : Utilisez .isnull().sum() et remplacez ou supprimez si

nécessaire.

• • Isoler la variable cible `target` et les variables explicatives.

👉 Indication : `X = [Link]('target', axis=1)` et `y = df['target']`.

🧠 Partie 2 – Formalisation du problème

• • Identifier les entrées X et la sortie y.
• • Quel est le type du problème ?
• • Exprimer l’objectif du modèle comme une fonction f : X → Y.
⚙️ Partie 3 – Modèle et entraînement
• • Séparer les données en jeu d’entraînement et de test.

👉 Indication : Utilisez train_test_split() avec test_size=0.2.

• • Entraîner un modèle de régression logistique.

👉 Indication : Utilisez :

model = LogisticRegression(max_iter=1000)

[Link](X_train, y_train)

• • Prédire les classes sur le jeu de test.

👉 Indication : Utilisez y_pred =[Link]( X_test).

📉 Partie 4 – Risque empirique et fonctions de coût

• • Calculer l’erreur d’entraînement (risque empirique).

👉 Indication : Utilisez

empirical_risk_train = zero_one_loss(y_train, y_train_pred)

• • Calculer l’erreur sur le test.

👉 Indication : Même fonction, mais avec y_test et y_pred .

• • Calculer la log-loss (entropie croisée).

👉 Indication : Utilisez :

probas = model.predict_proba(X_test)

logloss = log_loss(y_test, probas)

• • Calculer l’erreur quadratique moyenne (MSE).

👉 Indication : Utilisez mse = mean_squared_error(y_test, y_pred).

📊 Partie 5 – Visualisation : sur-apprentissage

• • Créer un modèle simple avec une seule variable (ex : age).
👉 Indication : Entraînez la régression logistique sur une seule
colonne.
X_train_age = X_train[['age']]

X_test_age = X_test[['age']]

• • Créer un modèle plus complexe avec un polynôme de degré élevé.

👉 Indication : Utilisez PolynomialFeatures() de

[Link].

• • Comparer les erreurs d’apprentissage et de test pour les degrés de 1 à 9.

👉 Indication : Faites une boucle for sur les degrés et tracez les
erreurs avec matplotlib.

train_errors = []
test_errors = []
for degree in range(1, 10):
# 1. Créer un pipeline : transforme les données + applique un modèle
model = make_pipeline(
PolynomialFeatures(degree=degree),
LogisticRegression(max_iter=1000)
)

# 2. Entraînement sur X_train_age

[Link](X_train_age, y_train)

# 3. Prédictions
y_train_pred = [Link](X_train_age)
y_test_pred = [Link](X_test_age)

# 4. Calcul des erreurs 0/1

train_error = zero_one_loss(y_train, y_train_pred)
test_error = zero_one_loss(y_test, y_test_pred)

train_errors.append(train_error)
test_errors.append(test_error)

• • Tracer les courbes d’erreurs train/test en fonction du degré.

👉 Indication : Utilisez [Link]() pour tracer les deux courbes.

import [Link] as plt

[Link](range(1, 10), train_errors, label="Erreur train")
[Link](range(1, 10), test_errors, label="Erreur test")
[Link]("Degré du polynôme")
[Link]("Erreur 0/1")
[Link]()
[Link]("Biais/Variance – Régression logistique sur 'age'")
[Link](True)
[Link]()

📈 Partie 6 – Visualisation des fonctions de coût (bonus)

• • Tracer la log loss et la hinge loss.

👉 Indication : Créez une fonction x → L(y · f(x)) et affichez les

courbes sur [-3, 3].

import numpy as np

x = [Link](-3, 3, 100)
log_loss_curve = [Link](1 + [Link](-x))
hinge_loss_curve = [Link](0, 1 - x)

[Link](x, log_loss_curve, label="Log Loss")

[Link](x, hinge_loss_curve, label="Hinge Loss")
[Link]("Comparaison des fonctions de coût")
[Link]("y · f(x)")
[Link]()
[Link](True)
[Link]()

• • Comparer visuellement les punitions infligées aux erreurs.

👉 Indication : Observez comment chaque fonction traite les

mauvaises prédictions.

🧠 Partie 7 – Frontière de décision (bonus)

• • Générer des données synthétiques 2D (make_classification).

👉 Indication : Spécifiez n_features=2 et n_informative=2.

from [Link] import make_classification

X2D, y2D = make_classification(n_samples=500, n_features=2, n_informative=2,

n_redundant=0, random_state=42)
• • Entraîner un modèle de régression logistique.

👉 Indication : Même procédure que précédemment.

clf = LogisticRegression()
[Link](X2D, y2D)

• • Tracer la frontière de décision.

👉 Indication : Utilisez [Link]() et contourf() pour visualiser

le résultat.

xx, yy = [Link]([Link](X2D[:, 0].min(), X2D[:, 0].max(), 100),

[Link](X2D[:, 1].min(), X2D[:, 1].max(), 100))
Z = [Link](np.c_[[Link](), [Link]()])
Z = [Link]([Link])

[Link](xx, yy, Z, alpha=0.3)

[Link](X2D[:, 0], X2D[:, 1], c=y2D, edgecolors='k')
[Link]("Frontière de décision - Régression Logistique")
[Link]()

🧠 Partie 8 – Analyse réflexive

• • Identifier un cas de sous-apprentissage.

👉 Indication : Faible performance sur train ET test.

• • Identifier un cas de sur-apprentissage.

👉 Indication : Très bon sur train, mauvais sur test.

• • Quel modèle offre un bon compromis biais/variance ?

👉 Indication : Celui dont les erreurs train/test sont proches et

raisonnablement basses.

• • Pourquoi ne faut-il pas se contenter du risque empirique ?

👉 Indication : Car il ne reflète pas la capacité à généraliser sur de

nouvelles données.
📎 À remettre
• Un notebook `.ipynb` avec tout le code exécuté

• Les visualisations demandées

• Vos réponses aux questions réflexives

Vous aimerez peut-être aussi

Application de la régression logistique
Pas encore d'évaluation
Application de la régression logistique
5 pages
Guide complet sur la régression polynomiale
Pas encore d'évaluation
Guide complet sur la régression polynomiale
11 pages
Techniques de régression et classification ML
Pas encore d'évaluation
Techniques de régression et classification ML
15 pages
Apprentissage supervisé en régression IA
Pas encore d'évaluation
Apprentissage supervisé en régression IA
6 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
15 pages
ChapitreRegressionLogistique 20 AVRIL 2026
Pas encore d'évaluation
ChapitreRegressionLogistique 20 AVRIL 2026
45 pages
10 Algorithmes ML pour Débutants en Data Science
Pas encore d'évaluation
10 Algorithmes ML pour Débutants en Data Science
1 page
TP Éléments D'intelligence Artificielle Appliquée1
Pas encore d'évaluation
TP Éléments D'intelligence Artificielle Appliquée1
8 pages
Att 1 Regression and Classification Avec Scikit Learn
Pas encore d'évaluation
Att 1 Regression and Classification Avec Scikit Learn
25 pages
TP 2 - Regression Logistic
Pas encore d'évaluation
TP 2 - Regression Logistic
7 pages
Application de l'IA aux Robots et Softbots
Pas encore d'évaluation
Application de l'IA aux Robots et Softbots
11 pages
Régression Linéaire et Courbes d'Apprentissage
Pas encore d'évaluation
Régression Linéaire et Courbes d'Apprentissage
8 pages
Exercices Apprentissage Supervise Non Supervise
Pas encore d'évaluation
Exercices Apprentissage Supervise Non Supervise
14 pages
Régression Logistique : Prédiction de Réussite Étudiante
Pas encore d'évaluation
Régression Logistique : Prédiction de Réussite Étudiante
5 pages
TP Regression
Pas encore d'évaluation
TP Regression
5 pages
TP Régression Linéaire avec Python 2024
Pas encore d'évaluation
TP Régression Linéaire avec Python 2024
8 pages
Régression logistique pour admission universitaire
Pas encore d'évaluation
Régression logistique pour admission universitaire
16 pages
Resume ML Python
Pas encore d'évaluation
Resume ML Python
14 pages
Fastp 04
Pas encore d'évaluation
Fastp 04
4 pages
TP Python : Apprentissage supervisé ML
Pas encore d'évaluation
TP Python : Apprentissage supervisé ML
6 pages
Prédiction de maladies cardiaques par ML
Pas encore d'évaluation
Prédiction de maladies cardiaques par ML
8 pages
TP Regression
Pas encore d'évaluation
TP Regression
5 pages
TP4 Régression Corrigé
Pas encore d'évaluation
TP4 Régression Corrigé
15 pages
Example
Pas encore d'évaluation
Example
4 pages
Estimation des performances en classification
Pas encore d'évaluation
Estimation des performances en classification
7 pages
TP Reconnaissance Chiffres avec Scikit-learn
Pas encore d'évaluation
TP Reconnaissance Chiffres avec Scikit-learn
10 pages
Introduction à l'apprentissage automatique avec Scikit-Learn
Pas encore d'évaluation
Introduction à l'apprentissage automatique avec Scikit-Learn
44 pages
Modèle de régression logistique en Python
Pas encore d'évaluation
Modèle de régression logistique en Python
2 pages
Cours Python Pour Machine Learning M2 2026
Pas encore d'évaluation
Cours Python Pour Machine Learning M2 2026
17 pages
Machine Learning : Méthodes et Applications
Pas encore d'évaluation
Machine Learning : Méthodes et Applications
7 pages
TP2ML
Pas encore d'évaluation
TP2ML
5 pages
TP2ML
Pas encore d'évaluation
TP2ML
5 pages
Classification avec Forêts Aléatoires et Naïve Bayes
Pas encore d'évaluation
Classification avec Forêts Aléatoires et Naïve Bayes
5 pages
TP Machine Learning : KNN et Évaluation
Pas encore d'évaluation
TP Machine Learning : KNN et Évaluation
5 pages
Introduction au Machine Learning et Régression
Pas encore d'évaluation
Introduction au Machine Learning et Régression
49 pages
Régression polynomiale avec Python
Pas encore d'évaluation
Régression polynomiale avec Python
14 pages
TP1 ML MohamadNeqqaz
Pas encore d'évaluation
TP1 ML MohamadNeqqaz
21 pages
Régression et Classification avec Python
Pas encore d'évaluation
Régression et Classification avec Python
4 pages
Régression Logistique en Apprentissage Machine
Pas encore d'évaluation
Régression Logistique en Apprentissage Machine
2 pages
Analyse et prédiction du Titanic avec Python
Pas encore d'évaluation
Analyse et prédiction du Titanic avec Python
8 pages
Régression Logistique en Python
Pas encore d'évaluation
Régression Logistique en Python
4 pages
TP Machine Learning : Régression Linéaire
Pas encore d'évaluation
TP Machine Learning : Régression Linéaire
4 pages
Modèles IA : Régression Logistique et SVM
Pas encore d'évaluation
Modèles IA : Régression Logistique et SVM
4 pages
Résolution Logistique : Descente de Gradient
Pas encore d'évaluation
Résolution Logistique : Descente de Gradient
18 pages
Guide Complet sur l'Apprentissage Machine
Pas encore d'évaluation
Guide Complet sur l'Apprentissage Machine
26 pages
Régressions linéaires : Salaire et Profit
Pas encore d'évaluation
Régressions linéaires : Salaire et Profit
3 pages
Classification avec KNN et SVM en Python
100% (2)
Classification avec KNN et SVM en Python
16 pages
TP1: Classification Avancée Et Ensembles
Pas encore d'évaluation
TP1: Classification Avancée Et Ensembles
17 pages
TD Sur Modèle de Régression Logistique
Pas encore d'évaluation
TD Sur Modèle de Régression Logistique
12 pages
Régression Linéaire et Logistique en Deep Learning
Pas encore d'évaluation
Régression Linéaire et Logistique en Deep Learning
90 pages
TP 02
Pas encore d'évaluation
TP 02
2 pages
Régressions linéaires et logistiques expliquées
Pas encore d'évaluation
Régressions linéaires et logistiques expliquées
1 page
Liste des Présences : Hamza Ennaboulsi
Pas encore d'évaluation
Liste des Présences : Hamza Ennaboulsi
6 pages
Examen Algorithme II - Rattrapage 2019
Pas encore d'évaluation
Examen Algorithme II - Rattrapage 2019
2 pages
Corrigé Examen Algorithmique II
80% (5)
Corrigé Examen Algorithmique II
5 pages
Examen Algorithmique II - Université 2018
100% (1)
Examen Algorithmique II - Université 2018
2 pages
Exemples Mise en Oeuvre Chinois College
Pas encore d'évaluation
Exemples Mise en Oeuvre Chinois College
25 pages
Grace Upon Grace: Chants et Musique
Pas encore d'évaluation
Grace Upon Grace: Chants et Musique
8 pages
Guide Utilisateur de Xerox DocuShare
Pas encore d'évaluation
Guide Utilisateur de Xerox DocuShare
45 pages
Impact Environnemental du Déchiquetage de Pneus
Pas encore d'évaluation
Impact Environnemental du Déchiquetage de Pneus
88 pages
Couche limite et décollement en aéronautique
Pas encore d'évaluation
Couche limite et décollement en aéronautique
6 pages
Exercice sur le trapèze isocèle
Pas encore d'évaluation
Exercice sur le trapèze isocèle
1 page
Pompes à chaleur Oertli : efficacité et écologie
Pas encore d'évaluation
Pompes à chaleur Oertli : efficacité et écologie
24 pages
Éducation en santé sexuelle et reproductive
Pas encore d'évaluation
Éducation en santé sexuelle et reproductive
51 pages
Raboub
Pas encore d'évaluation
Raboub
13 pages
Exercices de physique sur le mouvement
Pas encore d'évaluation
Exercices de physique sur le mouvement
17 pages
L'Homme et l'Animal : Relations et Enjeux
Pas encore d'évaluation
L'Homme et l'Animal : Relations et Enjeux
18 pages
Types et avantages des suspensions automobiles
Pas encore d'évaluation
Types et avantages des suspensions automobiles
12 pages
LISTE Avril 2025 16 % - 12 Mois
Pas encore d'évaluation
LISTE Avril 2025 16 % - 12 Mois
23 pages
Licence en Construction Mécanique 2014-2015
Pas encore d'évaluation
Licence en Construction Mécanique 2014-2015
91 pages
Audit d'Inspection des Biologiques Équipe
Pas encore d'évaluation
Audit d'Inspection des Biologiques Équipe
24 pages
Homologation du réaménagement foncier à Sammana
Pas encore d'évaluation
Homologation du réaménagement foncier à Sammana
1 page
Régulateur PID pour Contrôle Niveau Eau
Pas encore d'évaluation
Régulateur PID pour Contrôle Niveau Eau
4 pages
Conjugaison des verbes en français
Pas encore d'évaluation
Conjugaison des verbes en français
8 pages
Gestion des emprunts en bibliothèque
Pas encore d'évaluation
Gestion des emprunts en bibliothèque
2 pages
Rapport de stage : Hôpital Souissi
Pas encore d'évaluation
Rapport de stage : Hôpital Souissi
11 pages
Facteurs de succès des clubs de football marocains
Pas encore d'évaluation
Facteurs de succès des clubs de football marocains
68 pages
Formation en ligne pour conseillers agricoles
Pas encore d'évaluation
Formation en ligne pour conseillers agricoles
4 pages
Statistiques du Tiefelin Ensorceleur 10
Pas encore d'évaluation
Statistiques du Tiefelin Ensorceleur 10
6 pages
Polycopie Allosterie
Pas encore d'évaluation
Polycopie Allosterie
22 pages
Semaine de la Jeunesse : Projet d'Intégration
Pas encore d'évaluation
Semaine de la Jeunesse : Projet d'Intégration
6 pages
Concours Commun Mines-Ponts (CCMP) 2025 MP-PC-PSI Informatique Commune CB
Pas encore d'évaluation
Concours Commun Mines-Ponts (CCMP) 2025 MP-PC-PSI Informatique Commune CB
4 pages
Application de télésurveillance avancée
Pas encore d'évaluation
Application de télésurveillance avancée
69 pages
Drissi Thèse V10
Pas encore d'évaluation
Drissi Thèse V10
129 pages
Micro-takaful : Assurance islamique accessible
100% (1)
Micro-takaful : Assurance islamique accessible
3 pages