Coefficient de corrélation et diagramme de corrélation

Auto-corrélation -covariance 3.1.4 Bruit dans les mesures 3.1.3 Statistique utile

Coefficient de corrélation et diagramme de corrélation

Le coefficient de corrélation donne une idée de la corrélation existant entre deux ensembles de données et , de même nombre de mesures :
Il est alors possible de tracer les variations de ce coefficient en fonction du décalage que l'on introduit dans l'une des séries temporelles par rapport à l'autre. La fonction introduite ici est appelée la fonction d'intercorrélation :
Un coefficient de corrélation positif élevé obtenu pour un décalage positif signifie que est en avance par rapport à , et réciproquement un coefficient de corrélation positif obtenu pour un décalage négatif signifie que est en avance par rapport à . Un coefficient de corrélation négatif implique une anticorrélation entre les deux séries temporelles. Il est relativement malaisé d'interpréter une telle représentation. En effet, beaucoup de phénomènes différents peuvent provoquer des coefficients de corrélation positifs ou négatifs. Une même périodicité présente dans les deux séries temporelles peut impliquer un coefficient de corrélation positif pour des valeurs de multiples de cette périodicité et un coefficient négatif pour des valeurs de multiple de la demi-période. Mais ce n'est pas si simple, car un signal réel n'est pas constituté d'une seule et unique périodicité et en général, cette périodicité n'est même pas constante en amplitude et/ou en temps. Les effets décrits ci-dessous peuvent par conséquent être très atténués. En particulier, une variation lente dans une ou les séries temporelles entra^ne l'atténuation d'un certain nombre de coefficients et en revanche implique l'amplification de certains autres. Il est possible de supprimer cette variation à long terme, mais il faudrait pouvoir l'enlever sans perturber les données, ce qui n'est pas facile. Moins les données sont manipulées et plus elles contiennent de l'information ``réelle'' et utile. Toute manipulation entra^ne une modification plus ou moins importante selon le soin que l'on a apporté dans la manipulation et selon la nature de cette dernière. Une interprétation, tout au moins une interprétation soignée, nécessite du temps, de l'expérience et des constants aller-retour entre les séries temporelles, les transformées de Fourier donnant les périodicités présentes, et le tracé des coefficients de corrélation en fonction du décalage. Il est de plus nécessaire de procéder à des tests ou simulations afin de confirmer ou d'infirmer les intuitions.
Il est en général inutile de calculer l'intercorrélation pour des longueurs supérieures au quart des séries temporelles. Le nombre de points restant pour le calcul devient en effet trop petit. De plus, il a été montré (Chatfield 1975) que pour une série temporelle constituée de N nombres aléatoires distribué selon une loi uniforme, suit une loi de distribution a peu près normale de moyenne et de variance . Par conséquent, 95 %des coefficients de corrélation pour un tel diagramme se situent entre . Pour grand, l'intervalle de confiance est . Dans un diagramme de corrélation dessiné pour de séries temporelles non aléatoires, les valeurs des coefficients se trouvant en dehors de ces limites sont significatives à 5 %. Il faut cependant être attentif, car ainsi que cela a été vu plus haut, des variations à long terme sur les données peuvent diminuer largement certains coefficients de corrélation (voir Chatfield 1975, pour des exemples).

Auto-corrélation -covariance 3.1.4 Bruit dans les mesures 3.1.3 Statistique utile

vig@
Wed Oct 30 19:17:13 MET 1996