Chapt1 Analyse Graphique
Représentations graphique :
Le chronogramme :
Le chronogramme est un graphique linéaire représentant une série temporelle sous forme de
points (t,yt), où l'axe horizontal indique le temps et l'axe vertical les valeurs observées. Les
points sont reliés entre eux pour visualiser la chronologie.
Il permet de :
Détecter les composantes principales d’une série (tendance, saisonnalité, etc.),
Identifier des corrélations temporelles.
Exemples analyses
Population des USA (1800–1980)
➤ Tendance claire à la hausse.
➤ Pas de saisonnalité ni de périodicité.
Nombre de passagers aériens (1949–1960)
➤ Tendance croissante (quasi-exponentielle).
➤ Présence d’une saisonnalité annuelle marquée (période 12).
Accidents mortels en France (1995–2004)
➤ Saisonnalité visible.
➤ Tendance à la baisse du niveau moyen après 2000, due à des mesures de sécurité
routière.
Le Corrélogramme
Le corrélogramme (ou autocorrélogramme) est un outil graphique qui montre les
corrélations entre une série temporelle et ses valeurs passées (retards ou lags). Il sert
à détecter :
des structures temporelles,
des périodicités,
des modèles de dépendance dans les données
Fonctionnement et Interprétation
Axe horizontal : Retards (lags).
Axe vertical : Coefficients de corrélation (de -1 à +1).
Barres : Corrélations à chaque retard.
Lignes pointillées : Intervalles de confiance (significativité statistique).
Points clés d’interprétation
🔹 Corrélation proche de +1 : Forte corrélation positive.
🔹 Corrélation proche de -1 : Forte corrélation négative.
🔹 Corrélation proche de 0 : Faible ou aucune dépendance.
Périodicités et Structures Temporelles :
Pics réguliers : présence d’une périodicité.
Corrélation persistante : présence possible d’une tendance.
Alternance pics/creux : existence de cycles.
Le Lag-Plot (Diagramme Retardé)
Le lag-plot est un graphique utilisé en analyse des séries temporelles pour
représenter la relation entre les valeurs d’une série et leurs valeurs précédentes
(retardées).
Le lag-plot aide à :
Détecter une dépendance temporelle,
Identifier une saisonnalité ou un cycle,
Repérer des anomalies ou points aberrants.
Méthode pour construire un lag plot
Données : Considérez une série temporelle x={x1,x2,..xn}.
Retard (Lag) : Pour un lag k, tracez les points ( x(t) , x(t-k) ) où t>k.
Axes : - L'axe x représente x(t-k) (la valeur retardée).
-L'axe y représente x(t) (la valeur actuelle).
Exemple ‘Nombre de passagers aériens’
[Link](AirPassengers, layout=c(4,3), lags=12)
➤ Affiche les relations pour 12 retards sur la série des passagers aériens.
Interprétation
Alignement linéaire : Corrélation forte entre valeurs actuelles et retardées.
Dispersion aléatoire : Pas de relation, indépendance temporelle.
Formes particulières (non linéaires) : Présence de cycles ou relations complexes.
Graphique de Décomposition d’une Série Temporelle
La décomposition d’une série temporelle permet de visualiser ses composantes
fondamentales :
Tendance
Saisonnalité
Résidus (ou bruit)
Elle aide à mieux comprendre la structure interne des données.
Exemple: [Link]
Co
mp
osa
nte
s
du
Graphique
1. Tendance :
o Montre la direction générale (hausse ou baisse) des données dans le temps.
2. Saisonnalité :
o Met en évidence les motifs périodiques ou répétitifs (par exemple, chaque
année ou chaque mois).
3. Résidus :
o Correspondent aux variations inexpliquées par la tendance et la saisonnalité.
o Peuvent révéler des événements anormaux ou des fluctuations aléatoires.
Intérêt de la Représentation Graphique :
La représentation graphique permet de visualiser facilement les caractéristiques d'une série
temporelle, notamment :
1. Tendance
o Évolution à long terme de la série.
o Fonction monotone (croissante ou décroissante).
2. Phénomène périodique
o Lié à des rythmes réguliers (saisons, fêtes, vacances...).
o Représenté par une fonction périodique.
3. Cycle (non abordé dans ce cours)
o Comportement régulier, mais avec une périodicité variable et imprévisible.
4. Fluctuations irrégulières
o Variations brèves et aléatoires, souvent faibles.
o Non systématiquement explicables.
5. Variations accidentelles
o Valeurs anormales isolées (pics ou creux soudains).
o Souvent dues à des événements exceptionnels.
Chapt2 Analyse Statistique
La stationnarité :
Une série temporelle est stationnaire quand ses valeurs restent stables dans le temps (pas de
tendance forte ou de variation irrégulière).
Elle rend les séries plus faciles à analyser.
Elle permet d'utiliser des modèles statistiques classiques comme ARIMA.
Elle améliore les prévisions futures.
Elle aide à mieux comprendre les liens entre les données passées et présentes.
On distingue deux types de stationnalité :
Stationnarité forte :
Une série est fortement stationnaire si sa distribution ne change pas dans le temps.
Cela veut dire que peu importe le moment où on regarde, les caractéristiques de la série
restent exactement les mêmes (même forme de distribution).
Stationnarité faible :
Une série est faiblement stationnaire si :
Sa moyenne ne change pas dans le temps.
Sa covariance (ou corrélation entre deux points dans le temps) dépend seulement du
décalage, pas du moment exact.
Exemple:
Le bruit blanc gaussien est une série temporelle stationnaire. Tandis que, la marche aléatoire est
une série temporelle non stationnaire.
Comment vérifier si une série est stationnaire ?
Il existe 3 méthodes principales :
Méthode graphique
On trace la série dans le temps.
Si on voit :
o Une tendance (croissante/décroissante) ➜ pas stationnaire.
o Une saisonnalité (valeurs qui se répètent régulièrement) ➜ pas stationnaire.
Corrélogramme (ACF - autocorrélation)
Si les barres du graphe ACF diminuent lentement ➜ non stationnaire.
Si elles chutent rapidement ➜ stationnaire.
Test statistique (ADF - Dickey-Fuller augmenté)
Hypothèse nulle : la série est non stationnaire.
Si p-value < 0.05 ➜ on rejette l’hypothèse nulle, donc la série est stationnaire.
Si p-value > 0.05 ➜ on garde l’hypothèse nulle, donc non stationnaire.
L'indicateur :
Indices descriptifs :
1️Indice de tendance (Moyenne)
Il indique le centre de la série.
C’est la moyenne de toutes les valeurs :
2️Indice de dispersion (Variance)
Il mesure à quel point les valeurs sont éloignées de la moyenne.
Plus la variance est grande, plus les valeurs sont éparpillées.
Indices de dépendance :
1️Auto-covariance :
But : Mesurer la dépendance entre les valeurs d’une série à différents temps.
Définitions : l’auto-covariance d’ordre k mesure le lien entre les valeurs à t et t + k :
Autocovariogramme : Graphe représentant σ(k) pour plusieurs valeurs de k.
Propriétés :
σ(0)≥0
∣σ(k)∣≤σ(0)
σ(−k)=σ(k)
2 Auto-corrélation:
But : Mesurer la force et le sens de la dépendance linéaire entre y(t) et y(t+k) .
Définition :
Interprétation :
ρ(k)≈0 : pas de dépendance linéaire.
ρ(k)≈1 : forte dépendance positive.
ρ(k)≈−1 : forte dépendance négative.
∣ρ(k)∣ mesure l’intensité de la relation.
Le signe indique le sens (positif ou négatif).
Mise En Œuvre D’Auto-corrélation :
Fonctions utiles :
1 Fonction acf (Autocorrélation): Calcule l'autocorrélation d'une série temporelle pour
identifier les tendances et saisonnalités. Le graphique montre la corrélation entre les observations à
différents décalages
Paramètres :
y : la série temporelle.
[Link] : nombre de décalages à calculer.
type : type de calcul (autocovariance ou autocorrélation).
plot : pour afficher ou non le graphique.
2 Fonction pacf (Autocorrélation partielle): Calcule la corrélation partielle entre les
observations, en éliminant l'effet des décalages plus courts. Utile pour choisir le nombre de retards
dans les modèles AR (autoregressive) et MA (moving average)
Différence avec acf :
acf calcule la corrélation totale.
pacf élimine les effets indirects des décalages plus courts.
3 Fonction lag plot (Diagramme de retard ) : Visualise la dépendance d'une série par
rapport à ses valeurs passées. Aide à détecter les corrélations entre les observations et leurs versions
décalées.
Paramètres :
y : série temporelle.
lag : nombre de décalages.
[Link] : spécifie l'ensemble des décalages.
layout : permet d'organiser plusieurs graphiques dans une même fenêtre.
Interprétation graphique :
1 ACF (Autocorrélation) :
Tendance : Une forte autocorrélation indique une tendance (linéaire).
Saisonnalité : Une autocorrélation qui se répète (périodique) peut révéler une saisonnalité.
Résidus : Si les résidus sont autocorrélés, des informations importantes restent à modéliser. Le
meilleur modèle est celui avec des résidus faiblement corrélés.
2 Lag Plot (Diagramme de retard ) :
Tendance : Une forme linéaire des points indique une tendance (montante = positive, descendante =
négative).
Autocorrélation : Points regroupés autour de la diagonale = forte corrélation.
Stationnarité : Nuage de points sans forme claire = données stationnaires.
Aléatoire : Points dispersés sans motif = données aléatoires.
Modèle : Une forme reconnaissable dans le nuage aide à choisir un modèle (ex : ARIMA).
Chapt3 Ajustement Des Séries
Temporelles
Tendance :
1 Ajustement linéaire :
On cherche à modéliser la tendance d’une série temporelle à l’aide d’une fonction mathématique
simple, en général une droite.
avec fθ(t)=αt+b , où θ=(α,b) sont les paramètres inconnus (pente et ordonnée à
l’origine).
Étapes de l’ajustement
1. Choisir une forme de fonction (ex: linéaire).
2. Estimer les paramètres α et b à partir des données observées.
3. Méthode utilisée : les moindres carrés, qui consiste à minimiser la somme des carrés des
écarts entre les valeurs observées et les valeurs ajustées :
2 La méthode des moindres carrés :
Estimer les paramètres α et b d’un modèle linéaire yi=αti+b+εi , de manière à minimiser l’erreur
globale entre les valeurs observées yi et les valeurs prédites par le modèle.
Principe
On minimise la somme des carrés des écarts entre les observations et le modèle :
Cela donne un système d'équations à résoudre pour obtenir les valeurs optimales de α et b .
Formules des estimateurs
On obtient :
Propriétés
1. La droite des moindres carrés a pour équation :
2. Elle passe toujours par le point moyen (tˉ,yˉ) .
3. La qualité de l’ajustement est mesurée par le coefficient de corrélation linéaire r (plus r est
proche de 1 ou -1, meilleur est l’ajustement).
4. La variance totale se décompose en :
o SCT : somme des carrés totale
o SCR : somme des carrés résiduelle (erreur)
o SCE : somme des carrés expliquée par le modèle
SCT=SCE+SCR
Chapt4 Stationnarité D’une Série
Temporelle
Une série temporelle est stationnaire si ses caractéristiques statistiques (comme l’espérance, la
variance et la covariance) ne varient pas dans le temps. Cette propriété est cruciale pour la
modélisation et la prévision.
Stationnarité forte (ou stricte)
Une série (yt) est fortement stationnaire si la loi de probabilité de tout vecteur yt1,…,ytn) reste
inchangée par un décalage temporel k.
Toutes les propriétés statistiques sont constantes dans le temps.
✔️Toute série fortement stationnaire est faiblement stationnaire.
❌ L’inverse n’est pas toujours vrai.
Stationnarité faible
Une série (yt) est faiblement stationnaire si :
Sa moyenne est constante : E[yt]=μ
Sa covariance ne dépend que de la distance temporelle :
Cov(y(t+k))=γ(k)
Plus simple à vérifier en pratique. Suffisante pour de nombreux modèles (ex. ARMA).
Exemple:
[Link] i.i.d. (indépendantes et identiquement distribuées) → strictement stationnaires
[Link] gaussien à moyenne constante et covariance dépendant uniquement de la distance →
faiblement stationnaire (et aussi strictement stationnaire si gaussien)
[Link] blanc :
Faible : E[εt]=0, variance constante, pas de corrélation
Fort : idem, mais avec variables i.i.d
Le bruit blanc gaussien est faiblement stationnaire
[Link] aléatoire : non stationnaire
Types de non-stationnarité :
Caractéristiques d’une série non stationnaire :
Tendance : Évolution croissante ou décroissante des données.
Saisonnalité : Fluctuations régulières (mensuelles, trimestrielles…).
Variance non constante : Amplitude des variations qui change dans le temps.
1. Non-stationnarité déterministe (Trend Stationarity - TS)
Forme :
où f(t) est une tendance déterministe et Zt est stationnaire.
Solution : On peut rendre la série stationnaire en supprimant la tendance f(t).
Interprétation : Les chocs (bruits) n’ont pas d’effet durable sur la tendance de long terme.
Exemple : Série avec une pente linéaire + bruit blanc
2. Non-stationnarité stochastique (Difference Stationarity - DS)
Forme :
La série devient stationnaire après différenciation :
est stationnaire.
Interprétation : Les chocs aléatoires ont un effet permanent sur la série.
Exemple : Marche aléatoire (random walk).