0% ont trouvé ce document utile (0 vote)

11 vues6 pages

Python ML

Ce rapport présente une stratégie de trading LONG/SHORT pour Exxon Mobil utilisant un classifieur supervisé basé sur des données de clôture. L'approche inclut un pipeline méthodologique complet, des techniques de validation temporelle, et un backtest out-of-sample, soulignant l'importance de la stabilité du signal et des coûts de transaction. Les résultats montrent que malgré une légère amélioration des métriques de classification, la performance nette reste insuffisante, indiquant des axes d'amélioration possibles.

Transféré par

boitetom

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

11 vues6 pages

Python ML

Transféré par

boitetom

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Trading quotidien LONG/SHORT par Machine

Learning
Application à la série Close d’Exxon Mobil (XOM)

Ethan Ada Tom Cohen Valentin Beaufils

10 février 2026

Résumé
Ce rapport présente un pipeline complet et reproductible pour construire une stratégie de
trading quotidienne sur une action, en s’appuyant sur un classifieur supervisé. Conformément aux
consignes de l’examen, toutes les variables explicatives sont dérivées du Close (transformations
et indicateurs techniques), la cible est définie à partir de rendements futurs, la validation est
temporelle (TimeSeriesSplit), et la stratégie est backtestée out-of-sample avec frais de transaction.
L’objectif n’est pas de maximiser la performance brute mais de justifier les choix méthodologiques
(métriques, sélection de variables, tuning, robustesse) et d’analyser de manière critique les résultats.

1 Objectif et cadre du projet

L’objectif est de produire chaque jour une décision de trading sur Exxon Mobil :

positiont ∈ {−1, +1}, (1)

avec +1 une position LONG et −1 une position SHORT. La contrainte imposée est LONG/SHORT
uniquement : la stratégie est toujours investie (pas de cash). Le livrable principal est un rapport
sans code expliquant les étapes (nettoyage, labelling, features, métriques, modèle, validation, backtest
et analyse critique).

2 Données et préparation
2.1 Source et périmètre
Le jeu de données contient une série temporelle quotidienne avec au minimum : Date et Close.
La période out-of-sample considérée va de 2015-06-15 à 2023-01-04.

2.2 Nettoyage et alignements

La préparation suit une démarche standard sur séries temporelles :
— conversion de Date en format date, tri chronologique strict ;
— conversion de Close en numérique ;
— gestion des valeurs manquantes créées par les fenêtres glissantes (indicateurs) ;
— remplacement de ±∞ par NaN ;
— complétion par forward fill si nécessaire, puis drop final des lignes restantes non valides ;
— alignement exact entre les features X et la cible y afin d’éviter toute fuite temporelle.

2.3 Contrôles de cohérence (sanity checks)

Un bloc de vérification systématique a été ajouté pour sécuriser le pipeline (dimensions, NaN/inf,
split, équilibre de classes). Les contrôles observés sur la version finale sont résumés ci-dessous.

1
Table 1 – Résumé des contrôles de cohérence

Élément Valeur
Dimensions dataframe (9519, 50)
Dimensions X (9519, 45)
Dimensions y (9519, )
NaN / Inf dans X 0/0
Split temporel Train (7615, 45) ; Test (1904, 45)
Balance classes (Train) {1 : 0.502, 0 : 0.498}
Balance classes (Test) {0 : 0.515, 1 : 0.485}

3 Labelling : définition de la cible

3.1 Rendement futur
On définit le rendement futur à horizon H jours :
Closet+H
rt→t+H = − 1. (2)
Closet
Le problème de classification consiste à prédire, à la date t, un proxy directionnel de rt→t+H .

3.2 Encodage LONG/SHORT

La cible économique naturelle est yttrade ∈ {−1, +1}. Pour compatibilité avec XGBoost (classes
entières), on utilise : (
1 si LONG
yt = (3)
0 si SHORT.
En post-traitement, ŷ ∈ {0, 1} est reconverti en position p̂ ∈ {−1, +1} pour le backtest.

3.3 Seuils et règle sticky

Deux logiques de labelling ont été testées :
— seuil zéro : LONG si rt→t+H > 0 ;
— seuil médian : LONG si rt→t+H dépasse la médiane (classes plus équilibrées).
En trading, la stabilité du signal est critique car les changements de position génèrent du turnover
et donc des coûts. Nous avons donc ajouté une règle sticky basée sur la probabilité prédite P(LONG) :
— LONG si p(LONG) > u ;
— SHORT si p(LONG) < ℓ ;
— sinon, conservation de la position précédente.
Cette règle respecte la contrainte LONG/SHORT (jamais flat) tout en contrôlant le nombre de flips.

4 Feature engineering (inputs)

Conformément à la consigne, toutes les variables explicatives sont dérivées du Close. L’objectif
est de fournir au modèle plusieurs points de vue : tendance, momentum, volatilité et normalisation.
— Rendements : rendement simple et log-rendement.
— Tendance / momentum : SMA/EMA multi-fenêtres, momentum k-jours, ratios (ex. Close/SMA(20)-1).
— Volatilité et z-scores : volatilité rolling des rendements ; z-score rolling du prix.
— Indicateurs techniques (TA-Lib ou équivalents) : RSI(14), MACD(12,26,9), Bandes de
Bollinger (20, 2σ) et dérivés (

2
5 Split temporel, métriques et validation
5.1 Split train/test
Le split est strictement chronologique (aucun shuffle). Il simule un usage réel : entraînement
sur le passé, évaluation sur une période future non vue.

5.2 Validation croisée temporelle

Pour le tuning, nous utilisons TimeSeriesSplit (3 folds) afin de limiter la fuite d’information et
d’obtenir une estimation plus robuste que le seul test.

5.3 Choix des métriques

En classification directionnelle LONG/SHORT, l’accuracy seule est insuffisante (déséquilibre
possible, coûts asymétriques). Nous utilisons :
— F1 macro comme objectif de tuning : elle pénalise un modèle qui ne prédirait qu’une seule
classe et traite les classes de manière symétrique.
— Matrice de confusion et classification report pour diagnostiquer les erreurs.
— Backtest OOS comme critère final : equity, drawdown, Sharpe et turnover, car une légère
hausse de métriques ML ne garantit pas un edge exploitable une fois les coûts inclus.

6 Modèle, pipeline et optimisation

6.1 Choix du modèle
Nous retenons XGBClassifier (gradient boosting) car il capture des non-linéarités, fonctionne
bien sur données tabulaires d’indicateurs, et fournit des probabilités utiles pour la règle sticky.

6.2 Pipeline de modélisation

Le pipeline utilisé est :

StandardScaler → SelectKBest → XGBClassifier.

SelectKBest réduit la dimension, limite l’overfitting et accélère la recherche d’hyperparamètres.

6.3 GridSearch (baseline) et Optuna

Une première étape de GridSearchCV sert de référence méthodologique, puis Optuna est employé
pour explorer plus efficacement l’espace de paramètres.

Table 2 – Tuning : meilleurs scores observés (objectif = F1 macro en CV)

Méthode Meilleur score CV Commentaire

GridSearch 0.5328 Baseline (40 candidats, 3 folds)
Optuna (Run A) 0.5352 Recherche bayésienne/heuristique
Optuna (Run B) 0.5355 Nouvelle exploration (robustesse)

3
7 Résultats ML (classification)
Nous reportons les performances sur train et test, ainsi qu’un modèle dummy en benchmark.

Table 3 – Performance en test : modèle vs baseline

Modèle (Test) Accuracy F1 macro

XGB + GridSearch 0.4916 0.4916
XGB + Optuna (Run A) 0.5058 0.5058
Dummy (classe majoritaire) 0.4848 0.3265

Analyse. Les scores en test sont proches de 0.50, ce qui indique un signal faible, typique sur un
seul actif avec des features techniques classiques. L’écart Train > Test suggère un sur-apprentissage
partiel. Néanmoins, le modèle bat le dummy en F1 macro, car il apprend à prédire les deux classes.

8 Backtest out-of-sample
8.1 Règles de backtest
Le backtest respecte des conventions réalistes :
— la décision au jour t s’applique au rendement du jour suivant (shift t → t + 1) ;
— position toujours LONG/SHORT ;
— coût de transaction appliqué lors d’un flip (changement de signe).

8.2 Impact des seuils sticky (frais = 0.5%)

Table 4 – Backtest OOS avec règle sticky (Optuna Run A, frais par trade = 0.005)

Seuils (u/ℓ) Equity finale strat. Equity stock Sharpe strat. Flips
0.55 / 0.45 0.1825 1.2759 -0.6086 275
0.60 / 0.40 0.2927 1.2759 -0.3996 167
0.65 / 0.35 0.2251 1.2759 -0.5162 83

8.3 Diagnostic : isoler l’effet des frais

Pour distinguer un problème de signal d’un problème de coûts, on compare l’equity finale en
faisant varier les frais (exemple sur sticky 0.55/0.45) :

Table 5 – Sensibilité aux frais (sticky 0.55/0.45)

Frais par trade Equity finale Turnover Flips

0.000 0.7231 0.1445 275
0.001 0.5493 0.1445 275
0.005 0.1825 0.1445 275

Analyse. Même sans frais, l’equity est inférieure à 1 (0.72–0.77 dans nos diagnostics), ce qui
suggère que le signal est structurellement insuffisant sur la période. L’ajout de frais réalistes dégrade
fortement la performance nette, surtout lorsque les flips sont nombreux.

4
8.4 Figures

Figure 1 – Courbes d’equity OOS : stratégie vs buy&hold.

Figure 2 – Drawdowns OOS : stratégie vs buy&hold.

Figure 3 – Histogramme des rendements nets journaliers (OOS).

5
9 Discussion critique et pistes d’amélioration
Les résultats obtenus sont cohérents avec un contexte de signal faible sur une action isolée :
— Faible généralisation. Les métriques proches de 0.5 en test indiquent que les patterns appris
ne sont pas stables.
— Turnover. Le nombre de flips (83 à 275 selon les seuils) rend les coûts déterminants.
— Objectif ML vs objectif trading. Optimiser F1 macro améliore l’équilibre de prédiction,
mais ne garantit pas un PnL positif.
Axes d’amélioration (méthodologiques) :
— enrichir l’information (si autorisé) : volume, high/low, facteurs de marché ;
— labels plus robustes : triple-barrier, seuils dépendants de la volatilité, horizon multiple ;
— réduire la variance : bagging / ensembles, calibration des probabilités, régularisation accrue ;
— politique de trading : filtre de tendance (régime), neutralisation (si multi-actifs), gestion du
risque (stop/position sizing).

10 Conclusion
Nous avons construit un pipeline complet de ML appliqué à une stratégie LONG/SHORT sur
Exxon Mobil : labelling via rendements futurs, features techniques à partir du Close, split temporel,
validation TimeSeriesSplit, tuning (GridSearch puis Optuna), et backtest out-of-sample avec coûts
de transaction. Les résultats confirment qu’une légère amélioration des métriques de classification ne
suffit pas à générer une performance nette positive : la stabilité du signal et le turnover (donc les
coûts) sont déterminants. Le travail reste néanmoins conforme aux bonnes pratiques attendues pour
un framework ML de trading (pas de fuite, validation temporelle, benchmark, backtest et analyse
critique).

Vous aimerez peut-être aussi

Rapport D'expertise Validation de La Pérennité Des Stratégies de Trading Algorithmique
Pas encore d'évaluation
Rapport D'expertise Validation de La Pérennité Des Stratégies de Trading Algorithmique
4 pages
ML Exercice Trading Strategy
Pas encore d'évaluation
ML Exercice Trading Strategy
2 pages
Guide Stratégique - Optimisation Et Rentabilisation D'un Bot MQL5 Par Le Backtesting
Pas encore d'évaluation
Guide Stratégique - Optimisation Et Rentabilisation D'un Bot MQL5 Par Le Backtesting
3 pages
Trading Automatisé : DRL et Sentiments
Pas encore d'évaluation
Trading Automatisé : DRL et Sentiments
58 pages
Optimisation GA pour stratégies de trading
Pas encore d'évaluation
Optimisation GA pour stratégies de trading
8 pages
Djomako Tchuangou Armel Chrislain MSC 2025
Pas encore d'évaluation
Djomako Tchuangou Armel Chrislain MSC 2025
85 pages
Stratégie de Trading avec Filtre de Kalman
Pas encore d'évaluation
Stratégie de Trading avec Filtre de Kalman
11 pages
Apprentissage statistique en finance
Pas encore d'évaluation
Apprentissage statistique en finance
133 pages
Prédiction de Pannes pour Bras Robotique
Pas encore d'évaluation
Prédiction de Pannes pour Bras Robotique
24 pages
Algorithmes d'IA pour le Trading Financier
Pas encore d'évaluation
Algorithmes d'IA pour le Trading Financier
12 pages
TP2.1 Strat
Pas encore d'évaluation
TP2.1 Strat
2 pages
SYNTHETIX PRO Documentation
Pas encore d'évaluation
SYNTHETIX PRO Documentation
16 pages
Améliorations pour V100_Sniper_SMC_MTF_V2
Pas encore d'évaluation
Améliorations pour V100_Sniper_SMC_MTF_V2
23 pages
Partie 1: Séries Temporelles Financières (Ti-P1)
Pas encore d'évaluation
Partie 1: Séries Temporelles Financières (Ti-P1)
7 pages
Comment Exceller en Trading Algorithmique Et Quant
Pas encore d'évaluation
Comment Exceller en Trading Algorithmique Et Quant
7 pages
Stratégie de Trading avec Bollinger Bands
Pas encore d'évaluation
Stratégie de Trading avec Bollinger Bands
8 pages
Chapchapchap
Pas encore d'évaluation
Chapchapchap
17 pages
Stratégies Modernes Et Gestion Des Risques
Pas encore d'évaluation
Stratégies Modernes Et Gestion Des Risques
10 pages
(FR) ChatGPT Trading Strategy Made 19527 - Profit (FULL T...
Pas encore d'évaluation
(FR) ChatGPT Trading Strategy Made 19527 - Profit (FULL T...
4 pages
CHATFIN - Analyse Financière Multi-Modale
Pas encore d'évaluation
CHATFIN - Analyse Financière Multi-Modale
14 pages
Machine Learning en Finance : Stratégies Nouvelles
Pas encore d'évaluation
Machine Learning en Finance : Stratégies Nouvelles
55 pages
Analyse des Séries Temporelles Financières
Pas encore d'évaluation
Analyse des Séries Temporelles Financières
60 pages
Prédiction des Actions Amazon par IA
Pas encore d'évaluation
Prédiction des Actions Amazon par IA
44 pages
Prompt Pour Le GPT
Pas encore d'évaluation
Prompt Pour Le GPT
3 pages
Risque de modèle en liquidation d'actions
Pas encore d'évaluation
Risque de modèle en liquidation d'actions
92 pages
Apprentissage Automatique pour Trading
Pas encore d'évaluation
Apprentissage Automatique pour Trading
13 pages
Stratégie Scalping M5 en Forex
0% (1)
Stratégie Scalping M5 en Forex
10 pages
Stratégie Scalping RSI + VWMA pour MT5
Pas encore d'évaluation
Stratégie Scalping RSI + VWMA pour MT5
4 pages
BRANCART
Pas encore d'évaluation
BRANCART
77 pages
Indicateur de tendance Robotrade
Pas encore d'évaluation
Indicateur de tendance Robotrade
32 pages
Machine Learning en Tarification Non-Vie
Pas encore d'évaluation
Machine Learning en Tarification Non-Vie
91 pages
Détection de Fraude Financière ML
100% (2)
Détection de Fraude Financière ML
51 pages
Prévision des séries temporelles MASI LSTM
Pas encore d'évaluation
Prévision des séries temporelles MASI LSTM
24 pages
Amélioration de la modélisation SARIMA
Pas encore d'évaluation
Amélioration de la modélisation SARIMA
4 pages
Améliorations pour V100_Sniper_SMC_MTF_V2
Pas encore d'évaluation
Améliorations pour V100_Sniper_SMC_MTF_V2
4 pages
Estimation GARCH par Bootstrap en Mathématiques
Pas encore d'évaluation
Estimation GARCH par Bootstrap en Mathématiques
70 pages
Système de Prédiction de Trading Multi-Exchange
Pas encore d'évaluation
Système de Prédiction de Trading Multi-Exchange
8 pages
Outil IA pour Gestion de Portefeuille Wafa
Pas encore d'évaluation
Outil IA pour Gestion de Portefeuille Wafa
6 pages
Analyse de L'expert Senior Bot TITAN V16 The ST
Pas encore d'évaluation
Analyse de L'expert Senior Bot TITAN V16 The ST
2 pages
Estimation et choix de modèles ML efficaces
Pas encore d'évaluation
Estimation et choix de modèles ML efficaces
7 pages
Synthese Optimizers DL Bis!!4!23!12
Pas encore d'évaluation
Synthese Optimizers DL Bis!!4!23!12
9 pages
Introduction au Trading Quantitatif
Pas encore d'évaluation
Introduction au Trading Quantitatif
5 pages
Analyse et Prédiction des ETFs 2023
Pas encore d'évaluation
Analyse et Prédiction des ETFs 2023
2 pages
Stratégie de Trading Automatisé Crypto
Pas encore d'évaluation
Stratégie de Trading Automatisé Crypto
20 pages
La Descente de Gradient Stochastique: Comment Les Machines Apprennent Un Pas Approximatif À La Fois
Pas encore d'évaluation
La Descente de Gradient Stochastique: Comment Les Machines Apprennent Un Pas Approximatif À La Fois
30 pages
Plan Détaillé Pour Projet Scoring Crédit - DeepSeek
Pas encore d'évaluation
Plan Détaillé Pour Projet Scoring Crédit - DeepSeek
11 pages
Prédicteurs et Classifieurs en Deep Learning
Pas encore d'évaluation
Prédicteurs et Classifieurs en Deep Learning
15 pages
Stratégie rentable pour l'indice Step
Pas encore d'évaluation
Stratégie rentable pour l'indice Step
5 pages
Maintenance Prédictive des Équipements Électriques
Pas encore d'évaluation
Maintenance Prédictive des Équipements Électriques
7 pages
Strategie ELITE v4 Winrate 65
Pas encore d'évaluation
Strategie ELITE v4 Winrate 65
2 pages
Pitch Rempli
Pas encore d'évaluation
Pitch Rempli
3 pages
Prédiction des Émissions de CO2 au Canada
Pas encore d'évaluation
Prédiction des Émissions de CO2 au Canada
26 pages
Interprétation des graphes SVM en ML
Pas encore d'évaluation
Interprétation des graphes SVM en ML
34 pages
Interprétabilité des modèles de ML en banque
Pas encore d'évaluation
Interprétabilité des modèles de ML en banque
11 pages
Problèmes numériques en finance et trading
Pas encore d'évaluation
Problèmes numériques en finance et trading
148 pages
Avis sur Progroupe Chaud et Froid
Pas encore d'évaluation
Avis sur Progroupe Chaud et Froid
21 pages
Guide du Dictamen d'Auditeur Indépendant
Pas encore d'évaluation
Guide du Dictamen d'Auditeur Indépendant
7 pages
Cadre de Dépenses à Moyen Terme en Tunisie
Pas encore d'évaluation
Cadre de Dépenses à Moyen Terme en Tunisie
73 pages
Culture Générale ONCF 2025
100% (1)
Culture Générale ONCF 2025
3 pages
Justificatifs bancaires et opérations courantes
Pas encore d'évaluation
Justificatifs bancaires et opérations courantes
11 pages
Demande de TOU 2024 Vaud
Pas encore d'évaluation
Demande de TOU 2024 Vaud
2 pages
Fonctionnement du système bancaire
100% (3)
Fonctionnement du système bancaire
6 pages
Fusion et Comptabilité de Groupe
Pas encore d'évaluation
Fusion et Comptabilité de Groupe
3 pages
Catalogue des produits Longrich 2023
Pas encore d'évaluation
Catalogue des produits Longrich 2023
2 pages
Relevé de compte Société Générale
Pas encore d'évaluation
Relevé de compte Société Générale
1 page
Liste Des Sous-Traitant en RDC 2023
Pas encore d'évaluation
Liste Des Sous-Traitant en RDC 2023
100 pages
Économie Monétaire et Financière au Maroc
Pas encore d'évaluation
Économie Monétaire et Financière au Maroc
17 pages
Empreintes en PAT : Guide complet
Pas encore d'évaluation
Empreintes en PAT : Guide complet
13 pages
Enjeux de la gestion financière intercommunale
Pas encore d'évaluation
Enjeux de la gestion financière intercommunale
39 pages
Analyse du Cycle de Vie de l'Hévéa en Côte d'Ivoire
Pas encore d'évaluation
Analyse du Cycle de Vie de l'Hévéa en Côte d'Ivoire
38 pages
Comptabilité Approfondie STG 2023-2024
Pas encore d'évaluation
Comptabilité Approfondie STG 2023-2024
5 pages
Marchés Financiers : Portefeuilles et CAPM
Pas encore d'évaluation
Marchés Financiers : Portefeuilles et CAPM
4 pages
Tables des anillos Seeger normalisés
Pas encore d'évaluation
Tables des anillos Seeger normalisés
4 pages
Mastercard: Guide de L'Utilisateur Et Conditions Générales de Vente
Pas encore d'évaluation
Mastercard: Guide de L'Utilisateur Et Conditions Générales de Vente
36 pages
Analyse SWOT de l'entreprise Nike
Pas encore d'évaluation
Analyse SWOT de l'entreprise Nike
3 pages
Document Enregistrement Universel 2020
Pas encore d'évaluation
Document Enregistrement Universel 2020
540 pages
Relevé de Compte CFA UEMOA 03.11.24-14.02.25
Pas encore d'évaluation
Relevé de Compte CFA UEMOA 03.11.24-14.02.25
3 pages
Licence Pro en Commerce International
Pas encore d'évaluation
Licence Pro en Commerce International
2 pages
Prime de Progrès Auchan 2025
Pas encore d'évaluation
Prime de Progrès Auchan 2025
2 pages
Assemblée Générale 2025 : Dividende approuvé
Pas encore d'évaluation
Assemblée Générale 2025 : Dividende approuvé
2 pages
Histoire de Harland Sanders, fondateur de KFC
Pas encore d'évaluation
Histoire de Harland Sanders, fondateur de KFC
2 pages
Attestation de Résidence Fiscale 5000
Pas encore d'évaluation
Attestation de Résidence Fiscale 5000
6 pages
Mobilisation des recettes fiscales en RDC
Pas encore d'évaluation
Mobilisation des recettes fiscales en RDC
8 pages
Stage en Microfinance à FUCEC-Togo
Pas encore d'évaluation
Stage en Microfinance à FUCEC-Togo
4 pages