Le coefficient de corrélation donne une idée de la corrélation
existant entre deux ensembles de données
et
, de même nombre
de mesures :
Il est alors possible de tracer les variations de ce coefficient
en fonction du décalage que l'on introduit dans l'une des séries
temporelles par rapport à l'autre. La fonction introduite ici est
appelée la fonction d'intercorrélation :
Un coefficient de corrélation positif élevé obtenu pour un
décalage positif signifie que est en avance par rapport à
, et
réciproquement un coefficient de corrélation positif obtenu pour
un décalage négatif signifie que
est en avance par rapport à
. Un coefficient de corrélation négatif implique une anticorrélation
entre les deux séries temporelles.
Il est relativement malaisé d'interpréter une telle représentation.
En effet, beaucoup de phénomènes différents peuvent provoquer
des coefficients de corrélation positifs ou négatifs. Une même
périodicité
présente dans les deux séries temporelles peut impliquer un
coefficient de corrélation positif pour des valeurs de
multiples
de cette périodicité et un coefficient négatif pour des valeurs
de
multiple de la demi-période. Mais ce n'est pas si simple, car
un signal réel n'est pas constituté d'une seule et unique
périodicité et en général, cette périodicité n'est même
pas constante en amplitude et/ou en temps. Les effets décrits ci-dessous
peuvent par conséquent être très atténués. En particulier,
une variation lente dans une ou les séries temporelles entra^ne
l'atténuation d'un certain nombre de coefficients
et en revanche implique l'amplification de certains autres. Il est possible
de supprimer cette variation à long terme, mais il faudrait pouvoir
l'enlever sans perturber les données, ce qui n'est pas facile. Moins
les données sont manipulées et plus elles contiennent de l'information
``réelle'' et utile. Toute manipulation entra^ne une modification
plus ou moins importante selon le soin que l'on a apporté dans la
manipulation et selon la nature de cette dernière. Une
interprétation, tout au moins une interprétation soignée,
nécessite du temps, de l'expérience et des constants aller-retour
entre les séries temporelles, les transformées de Fourier donnant
les périodicités présentes, et le tracé des coefficients de
corrélation en fonction du décalage. Il est de plus nécessaire de
procéder à des tests ou simulations afin de confirmer ou d'infirmer
les intuitions.
Il est en général inutile de calculer l'intercorrélation
pour des longueurs supérieures au quart des séries temporelles.
Le nombre de points restant pour le calcul devient en effet trop petit.
De plus, il a été montré (Chatfield 1975)
que pour une série temporelle constituée de N nombres aléatoires
distribué selon une loi uniforme,
suit une loi de distribution a peu près normale de moyenne
et de variance
. Par conséquent, 95 %des coefficients de
corrélation pour un tel diagramme se situent entre
.
Pour
grand, l'intervalle de confiance est
.
Dans un diagramme de corrélation dessiné pour de séries temporelles
non aléatoires, les valeurs des coefficients se trouvant en dehors
de ces limites sont significatives à 5 %. Il faut cependant être
attentif, car ainsi que cela a été vu plus haut, des variations
à long terme sur les données peuvent diminuer largement certains
coefficients de corrélation (voir Chatfield 1975, pour des exemples).
vig@