détection des dépendances à long-terme et estimation des … · 2016-03-04 · la nature arfima...

13
Détection des dépendances à long-terme et estimation des exposants fractals au moyen des modélisations ARFIMA Didier Delignières Kjerstin Torre Loïc Lemoine Mars 2005 Les analyses classiquement utilisées en analyse fractale reposent sur l’appréciation visuelle de la forme de spectres de puissance ou de graphiques de diffusion en coordonnées log-log. Cette appréciation reste subjective et peut rester ambiguë. Les graphiques suivant présentent les résultats obtenus par l’analyse spectrale et la R/S analysis sur une série auto-régressive, une série de moyenne mobile, et un bruit gaussien fractionnaire On a proposé des surrogate tests, consistant à comparer l’exposant d’une série avec l’exposant obtenu avec une version randomisée de la série. Ces tests cependant testent l’hypothèse de la présence de corrélation dans la série vs aucune corrélation. Ils ne testent pas AR(1) fGn MA(1) -7 -6 -5 -4 -3 -2 -1 0 -3.5 -3 -2.5 -2 - 1.5 -1 -0.5 0 log frequency -7 -6 -5 -4 -3 -2 -1 0 -3.5 -2.5 -1.5 -0.5 0.5 log frequency log power -9 -8 -7 -6 -5 -4 -3 -2 -3.5 -2.5 -1.5 -0.5 0.5 log frequency log power -4 -3 -2 -1 0 1 2 3 4 -3 -2 -1 0 1 2 3 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 1 1.5 2 2.5 3 log(n) log(R/S) 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 1 1.5 2 2.5 3 log(n) log(R/S) 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 1 1.5 2 2.5 3 log(n) log(R/S)

Upload: others

Post on 19-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

Détection des dépendances à long-terme et estimation des exposants fractals au moyen des modélisations ARFIMA

Didier Delignières

Kjerstin Torre Loïc Lemoine

Mars 2005

Les analyses classiquement utilisées en analyse fractale reposent sur l’appréciation visuelle de la forme de spectres de puissance ou de graphiques de diffusion en coordonnées log-log. Cette appréciation reste subjective et peut rester ambiguë. Les graphiques suivant présentent les résultats obtenus par l’analyse spectrale et la R/S analysis sur une série auto-régressive, une série de moyenne mobile, et un bruit gaussien fractionnaire

On a proposé des surrogate tests, consistant à comparer l’exposant d’une série avec l’exposant obtenu avec une version randomisée de la série. Ces tests cependant testent l’hypothèse de la présence de corrélation dans la série vs aucune corrélation. Ils ne testent pas

AR(1) fGn MA(1)

-7

-6

-5

-4

-3

-2

-1

0

-3.5 -3 -2.5 -2 -1.5 -1 -0.5 0

log f requency

-7

-6

-5

-4

-3

-2

-1

0

-3.5 -2.5 -1.5 -0.5 0.5

log frequency

log

pow

er

-9

-8

-7

-6

-5

-4

-3

-2

-3.5 -2.5 -1.5 -0.5 0.5

log frequency

log

pow

er

-4

-3

-2

-1

0

1

2

3

4

-3

-2

-1

0

1

2

3

-0.5-0.4

-0.3-0.2

-0.10

0.10.20.3

0.40.5

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

1 1.5 2 2.5 3

log(n)

log(

R/S

)

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

1 1.5 2 2.5 3

log(n)

log(

R/S

)

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

1 1.5 2 2.5 3

log(n)

log(

R/S

)

Page 2: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

l’hypothèse de la présence de corrélation à long terme. Le problème n’est pas de tester la présence de corrélations (qui est probable), mais de vérifier si ces corrélations sont à court terme ou à long terme

Les modèles ARIMA

Les corrélations à court terme sont modélisés par les modèles ARMA Modèle auto-régressif (1, 0): yt = φ1(yt-1) + εt Modèle de moyenne mobile (0, 1): yt = -θ1(εt-1) + εt Modèle hybride (1, 1): yt = φ1(yt-1) -θ1(εt-1) + εt Ces modèles ne rendent compte que de corrélations à court terme (la donnée actuelle n’est influencée que par la donnée précédente). Ces modèles peuvent être complexifiés par un terme d’intégration, rendant compte d’une tendance linéaire dans la série. yt = µ + yt-1 On obtient des modèles ARIMA: Modèle auto-régressif (1, 1, 0): yt = µ + yt-1 + φ1(yt-1) + εt Modèle de moyenne mobile (0, 1, 1): yt = µ + yt-1 -θ1(εt-1) + εt Modèle hybride (1, 1, 1): yt = µ + yt-1 + φ1(yt-1) -θ1(εt-1) + εt

Les modèles ARFIMA

On peut également formaliser les modèles ARIMA à l’aide d’un « backshift operator », noté B et défini comme suit:

Byt = yt-1 Soit un processus (1, 0, 0) yt = µ + φyt-1 + εt yt - φyt-1 = µ + εt (1 - Bφ)yt = µ + εt

Page 3: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

Soit un processus (1, 1, 0) yt - yt-1 = µ + φ( yt - yt-1) + εt

(1 - φ)(yt - yt-1) = µ + εt

(1 - φ)(1 - B) = µ + εt Un modèle ARIMA (p, d, q) peut alors être formalisé selon l’équation:

φ(B)(1 - B)d = θ(B)εt avec φ(B) = 1 – Bφ1 – B2φ2 - ... - Bpφp et θ(B) = 1 - Bθ1 – B2θ2 - … - Bqθq Les modèles ARIMA sont notés (p, d, q), d étant un entier Granger (1980) montre que l’on peut rendre compte de corrélations à long terme en permettant à d de prendre des valeurs fractionnaires. Il propose une nouvelle catégorie de modèles, les ARFIMA (auto-regressive fractionally integrated moving average).

φ(B)(1 - B)d = θ(B)εt

ARFIMA et corrélations à long terme

Wagenmakers, Farrell et Ratcliff (in press) proposent d’utiliser ces modèles pour tester la présence de corrélations à long terme. Ils proposent de tester 8 modèles ARMA (p, q) et 8 modèles ARFIMA (p, d, q), p et q variant de 0 à 2. On suppose que si la série présente des corrélations à long terme, les modèles ARFIMA présenteront un meilleur ajustement aux données que les modèles ARMA. Les analyses ARMA/ARFIMA fournissent pour chaque modèle un score de vraisemblance L (exact likelihood). L doit être pondéré par le nombre k de paramètres libres dans le modèle (de 1 pour le modèle (0, 0) à 6 pour le modèle (2, d, 2). Deux critères d’ajustements sont classiquement utilisés: Le Akaike Information Criterion (AIC) AIC = -2lnL + 2k Le Bayes Information Criterion (BIC) BIC = -2lnL + klogN N représentant la longueur de la série Wagenmakers et al. proposent de calculer pour chacun des 18 modèles testés et pour chacun des critères (AIC et BIC) la différence au meilleur modèle (notées ∆AIC ou ∆BIC). La vraisemblance qu’un modèle soit le meilleur modèle est estimé selon l’équation suivante:

)21exp( AICL ∆−∝

Page 4: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

Ces vraisemblances sont converties en poids par normalisation:

m représentant le nombre de modèles testés Le poids exprime la vraisemblance relative de chacun des modèles (par rapport à l’ensemble des modèles testés). La somme des poids est égale à 1 Le traitement fourni également, pour chacun des coefficients du modèle, une statistique t testant la différence à zéro. On peut proposer deux procédures pour tester la présence de corrélations à long terme: 1. La somme des poids des modèles ARFIMA comparée à la somme des poids des modèles

ARMA 2. La nature ARFIMA du modèle présentant le poids le plus élevé

Objectifs de l’étude - Tester la capacité des modélisation AFIMA pour détecter la présence de corrélation à long terme dans des séries simulées - Comparer les performances des critères AIC et BIC - Effet de la longueur de séries analysées - Effet du bruitage des séries

Méthode Séries simulées de fGn (H variant de 0.1 à 0.9 par pas de 0.1, longueurs 2048, 1024, 512, 256 et 128 points) Séries simulées de fGn (H variant de 0.1 à 0.9 par pas de 0.1, longueur 1024 points, bruitées à 0, 33, 66 et 100% par un bruit blanc) Séries simulées de AR(1) (φ variant de 0.1 à 0.9 par pas de 0.2), et de MA(1) (θ variant de 0.1 à 0.9 par pas de 0.2)

∑=

∆−

∆−= m

jj

i

i

AIC

AICw

1)

21exp(

)21exp(

Page 5: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

1. Pourcentage de classifications incorrectes des séries de fGn. Effet de la longueur des séries, de l’exposant fractal, et du critère utilisé.

Seule la nature du meilleur modèle est prise en compte (d peut être non significatif) Aucune erreur de classification pour BIC Détection de corrélation à long terme pour H = 0.5! Quelques erreurs pour AIC, notamment pour H>0.5 2. Pourcentage de classifications incorrectes de séries fGn de 1024 données bruitées

Effet de la longueur des séries, de l’exposant fractal, et du critère utilisé Seule la nature du meilleur modèle est prise en compte (d peut être non significatif ) Aucune erreur de classification pour BIC Quelques erreurs pour AIC, notamment pour H>0.5 Aucun effet évident de l’importance du bruitage

0.10.2

0.30.4

0.50.6

0.70.8

0.9

0.000.330.661.000.000.330.661.00

0

0.5

1

1.5

2

2.5

3

3.5

perc

enta

ge o

f mis

clas

sific

atio

n

true Hurst exponent

0.10.2

0.30.4

0.50.6

0.70.80.9

2048

1024

5122561282048

1024

512256128

0

0.5

1

1.5

2

2.5

3

3.5

perc

enta

ge o

f mis

clas

sific

atio

n

true Hurst exponent

BICAIC

BICAIC

Page 6: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

3. Pourcentages de spécifications correctes (paramètre d significatif), selon le critère AIC (à gauche) et le critère BIC (à droite) Séries de fGn, de 2048 à 128 données

Les séries de bruit blanc (H=0.5) ne sont plus identifiées comme modèles à mémoire à long terme Le critère BIC commet moins d’erreurs que le AIC Le pourcentage d’erreur augmente lorsque la longueur des séries diminue. Notamment pour les fGn faiblement persistants 4. Pourcentages de spécifications correctes (paramètre d significatif), selon le critère AIC (à gauche) et le critère BIC (à droite) Séries de fGn bruitées

Les séries avec H=0.5 se sont plus spécifiées comme modèle de mémoire à long terme La présence de bruit affecte surtout les séries de fGn anti-persistant, pour H=0.1 et H=0.2 Le critère BIC commet moins d’erreurs que le critère AIC Le critère BIC n’est pas affecté par le bruit, pour les séries les plus longues (2048 et 1024 données)

0102030405060708090

100

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

Per

cent

age

of c

orre

ct s

peci

ficat

ion

0.00

0.33

0.661.00

0102030405060708090

100

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

Per

cent

age

of c

orre

ct s

peci

ficat

ion

0.00

0.33

0.661.00

0

1020

30

4050

60

70

8090

100

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

true Hurst exponent

Perc

enta

ge o

f cor

rect

spe

cific

atio

ns

20481024512256128

0

10

20

30

40

50

60

70

80

90

100

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

true Hurst exponent

Perc

enta

ge o

f cor

rect

spe

cific

atio

ns

20481024512256128

Page 7: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

5. Somme de poids des modèles ARFIMA, selon le critère AIC (en haut) et le critère BIC (en bas). Séries de fGn, de 2048 à 128 données.

Le poids de modèles ARFIMA pour H = 0.5 reste autour de 0.6 La vraisemblance ARFIMA est moins variable pour le critère BIC, notamment pour les séries longues (2048 et 1024) La spécification se détériore lorsque la longueur des séries diminue, notamment pour le fGn faiblement persistants (H = 0.6 et H = 0.7) La spécification est meilleure pour le critère BIC, notamment pour les séries longues

0

0.10.2

0.3

0.40.5

0.6

0.7

0.80.9

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

arfim

a m

odel

s w

eigh

ts s

um

20481024512256128

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

0 0.2 0.4 0.6 0.8 1

true Hurst exponentst

anda

rd d

evia

tion

20481024512256128

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

arfim

a m

odel

s w

eigh

ts s

um

20481024512256128

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

stan

dard

dev

iatio

n

20481024512256128

Page 8: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

6. Somme de poids des modèles ARFIMA, selon le critère AIC (en haut) et le critère BIC (en bas). Séries de fGn bruitées de 1024 données.

La spécification est meilleure pour le critère BIC, notamment pour les séries de fGn persistant La spécification des fGn antipersistants se détériore lorsque les séries sont bruitées La variabilité est plus faible avec le critère BIC, notamment pour les séries de fGn persistantes

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

arfim

a m

odel

s w

eigh

ts s

um

0.00

0.33

0.661.00

00.020.040.060.080.1

0.120.140.160.180.2

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

stan

dard

dev

iatio

n

0.00

0.33

0.661.00

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

arfim

a m

odel

s w

eigh

ts s

um

0.00

0.33

0.661.00

00.020.040.060.080.1

0.120.140.160.180.2

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

stan

dard

dev

iatio

n

0.00

0.33

0.66

1.00

Page 9: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

7. Pourcentage de spécifications incorrectes de séries MA(1) à gauche et AR(1) à droite. AIC en haut, et BIC en bas.

Le critère BIC produit moins d’erreurs que le critère AIC Les erreurs de spécification apparaissent surtout pour les séries à faibles corrélations Le critère AIC tend à sous-estimer H, notamment pour les fGn persistants

0

5

10

15

20

25

30

35

40

45

0.1 0.3 0.5 0.7 0.9

MA(1) coefficient

Per

cent

age

of m

issp

ecifi

catio

n

512

1024

2048

0

10

20

30

40

50

60

70

0.1 0.3 0.5 0.7 0.9

MA(1) coefficient

Perc

enta

ge o

f mis

spec

ifica

tion

512

1024

2048

0

5

10

15

20

25

30

0.1 0.3 0.5 0.7 0.9

AR(1) coeff icient

Per

cent

age

of m

issp

ecifi

catio

n

512

1024

2048

0

10

20

30

40

50

60

0.1 0.3 0.5 0.7 0.9

AR(1) coefficient

Perc

enta

ge o

f mis

spec

ifica

tion

512

1024

2048

Page 10: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

8. Estimation de l’exposant H par la méthode ARFIMA, Selon le critère AIC (en haut) et le critère BIC (en bas)

Le critère AIC tend à sous-estimer H, notamment pour les fGn persistants Le critère BIC produit des estimations satisfaisantes, sauf pour les séries les plus courtes (128 données) La dégradation de l’estimation avec la longueur des séries touche surtout les séries de fGn proches du bruit 1/f La variabilité de l’estimation est plus faible pour le BIC que pour le AIC La variabilité se détériore avec la diminution de la longueur des séries Le BIC présente une variabilité faible pour les séries les plus longues (2048 et 1024 données)

-0.2

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

mea

n es

timat

ed H

urst

exp

onen

t 20481024512256128

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0 0.2 0.4 0.6 0.8 1

true Hurst exponentst

anda

rd d

evia

tion

20481024512256128

-0.2

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

mea

n es

timat

ed H

urst

exp

onen

t 20481024512256128

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

stan

dard

dev

iatio

n

20481024512256128

Page 11: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

9. Estimation de l’exposant H par la méthode ARFIMA. Séries de 1024 données bruitées. En haut : critère AIC, en bas : critère BIC.

Le bruit entraîne un biais vers H = 0.5 pour les séries anti-persistantes Le bruit entraîne une sous-estimation de H, pour les séries persistantes La variabilité de l’estimation est plus faible pour le critère BIC, et augmente peu avec le bruit

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

mea

n es

timat

ed H

urst

exp

onen

t 0.00

0.33

0.66

1.00

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

stan

dard

dev

iatio

n

0.000.330.661.00

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

stan

dard

dev

iatio

n0.000.330.661.00

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

mea

n es

timat

ed H

urst

exp

onen

t 0.00

0.33

0.66

1.00

Page 12: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

10. Comparaison de la modélisation ARFIMA (critère BIC) et de la DFA pour l’estimation de l’exposant de Hurst

11. Comparaison de la modélisation ARFIMA (critère BIC) et de la R/S analysis pour l’estimation de l’exposant de Hurst

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

mea

n es

timat

ed H

urst

exp

onen

t 2048

1024

512

256

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

stan

dard

dev

iatio

n

2048

1024

512

256

-0.2

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

mea

n es

timat

ed H

urst

exp

onen

t 2048

1024

512

256

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

stan

dard

dev

iatio

n

20481024512256

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

mea

n es

timat

ed H

urst

exp

onen

t

2048

1024

512

256

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

stan

dard

dev

iatio

n

2048

1024

512

256

-0.2

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

mea

n es

timat

ed H

urst

exp

onen

t 2048

1024

512

256

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

stan

dard

dev

iatio

n

20481024512256

Page 13: Détection des dépendances à long-terme et estimation des … · 2016-03-04 · La nature ARFIMA du modèle présentant le poids le plus élevé Objectifs de l’étude - Tester

12. Comparaison de la modélisation ARFIMA (critère BIC) et de la lowPSDwe pour l’estimation de l’exposant de Hurst

-0.2

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

mea

n es

timat

ed H

urst

exp

onen

t

20481024512256

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

stan

dard

dev

iatio

n

2048 1024512 256

-0.2

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

mea

n es

timat

ed H

urst

exp

onen

t 2048

1024

512

256

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0 0.2 0.4 0.6 0.8 1

true Hurst exponent

stan

dard

dev

iatio

n

20481024512256