Le funzioni periodicheUna funzione si dice periodica se i suoi valori si ripetono esattamente a intervalli regolari.
€
f t( ) = f t + kr( ) ∀ t, k = 0,±1,±2,…
Il minimo tra gli “r” che soddisfa tale condizione è il periodo della funzione e questa è detta funzione periodica di periodo “r”
con periodo:
€
a e b sono dei coefficienti
Funzioni periodiche più comuni sono il seno e coseno trigonometrici.
€
r =2πw
asen wt( ), bcos wt( )
Ripasso Il seno di un angolo x (in gradi o radianti) è definito a partire dalla circonferenza goniometrica, ovvero dalla circonferenza di raggio unitario nel piano cartesiano. Presa la semiretta uscente dall'origine che forma un angolo x con l'asse delle ascisse, il seno dell'angolo è il valore della coordinata y del punto di intersezione tra la semiretta e la circonferenza (in figura, è la lunghezza del segmento DC).
Ripasso/2 Si definisce il coseno considerando una circonferenza di raggio unitario ed una semiretta uscente dall'origine che forma un angolo x con l'asse delle ascisse.
Il coseno dell'angolo x è definito come il valore della coordinata x del punto di intersezione tra la semiretta e la circonferenza (lunghezza del segmento OC).
Per angoli tra 0 e π / 2, il coseno di un angolo è il seno dell'angolo complementare, cioè
Comportamento delle funzioniLa prima questione da affrontare è come si comporta la funzione sen(ax), dove a è un numero reale positivo fissato a piacere.
Considerare “ax” come argomento del seno corrisponde a cambiare la scala delle ascisse cioè il grafico di sen(ax) è quello di sen(x) ``dilatato'' o “contratto” secondo che “a” sia minore o maggiore di uno in valore assoluto
-1.5
- 1
-0.5
0
0.5
1
1.5
0 2 4 6 8 10 12 14
Sen(x)Sen(4x)Sen(2x/π)
sen(x) nell’intervallo (0,4π) ha due picchi e due valli .sen(4x) ha 8 picchi e 8 vallisen(2x/π) sale e scende una sola volta
Seno e coseno/2Poiché funzioni seno e coseno hanno periodo “r” saranno anche periodiche con periodo “2r”, “3r”, …
Quando si parla di periodo si sottintende che si considera il periodo minimo, definito come il più piccolo p tale che f(x+r) = f(x) per ogni x
Piú in generale sen(kx) e cos(kx) , con k intero, hanno come periodo minimo r=2k/π.
cos(x) nell’intervallo (0,4π) ha tre picchi e due valli.cos(4x) ha 9 picchi e 8 vallicos(2x/π) sale una volta e scende due volte
-1.5
- 1
-0.5
0
0.5
1
1.5
0 2 4 6 8 10 12 14
Cos(x)Cos(4x)Cos(2x/π)
Scomposizione in serie di Fourier
L’ampiezza è lo scarto massimo di oscillazione rispetto all’asse.
La fase è l’ascissa del primo punto di massimo.
Il periodo (o potenza) esprime la durata dell’oscillazione (curva tra due picchi)
La frequenza (reciproco del periodo) si interpreta come numero di oscillazioni per unità di tempo. ALTA FREQUENZA = MOLTE OSCILLAZIONI
L’idea è che una funzione PERIODICA nel tempo possa esprimersi come somma di termini trigonometrici (armoniche).
Scomposizione in serie di Fourier/2
Il punto ruotando si trova in posizione 1 e completa il giro in posizione 2. Da qui prosegue e si porta in posizione 3 per completare il cerchio più interno e tornare in posizione 2. Riparte infine per raggiungere la posizione 4 e completare per l’ultimo cerchio.
La serie storica è disaggregata in tutte le frequenze che in essa sono presenti.
Si parte con la minore: se n=100 la frequenza più piccola è 1/100=0.01 dell’unità di tempo della serie storica (anno, mese, settimana, etc.)
Immaginate che la serie storica sia rilevata ogni secondo.
La lancetta fucsia ruota ogni centesimo di secondo.
Scomposizione in serie di Fourier/3
Che succede intanto alla serie storica?
I passaggi nei cerchi possono essere seguiti linearmente:
picchi o valli nella serie storica sono posizioni elevate o basse nei vari cerchi.
La separatezza delle componenti è solo una nostra interpretazione che prelude alla loro stima.
In realtà si vede solo l’intreccio delle componenti.
Scomposizione in serie di Fourier/4
Ogni armonica è un’onda sinusoidale che completa il suo ciclo in “c/i” periodi.
Le alte frequenze esprimono variazioni di breve periodo (stagionalità, settimane, giorni).
Le basse frequenze componenti cicliche con cadenze sempre minori (man mano che si riduce la frequenza.
Questo approccio venne avviato nei primi anni del secolo scorso, ma ebbe sviluppo limitato a causa delle difficoltà di calcolo.
Stagionalità/ciclicità con le armonicheLe componenti periodiche possono essere espresse da combinazioni lineari di “armoniche”. Ad esempio
Il coefficiente di stagionalità è la somma delle armoniche.
“i” è l’indice della armonica
Questa è una tecnica di stagionalità variabile dato che il coefficiente varia per l’anno e per il periodo.
St = aii =1
m∑ sen fit + ϕ i( )
St = coefficiente di stagionalitàs = stagionalità (mesi ⇒ s = 12)
fi =2πi
s frequenza della armonica
ϕ i = fase della armonicas
i = numero di periodi in cui si completa la stagionalitàm = numero massimo di armoniche in St
m è da scegliere
Stagionalità con le armoniche/2
La durata più breve in cui si può parlare di “ciclo” è 2 (da un dato a quello successivo). Il massimo numero di armoniche stagionali è dato da
Infatti, in caso di “s” pari, la m-esima armonica completerebbe il suo ciclo in un numero di periodi uguale a:
sm=ss2
= 2
D’altra parte non è necessario usare tutte le armoniche dato che le primedue o tre sono già in grado di esprimere complesse strutture ondulatorie.
Le ultime armoniche hanno oscillazioni smorzate e quindi poco utili.
m =
s2
se s è paris−1
2; se s è dispari
"
# $
% $
EsempioEsempio di armonica a1 = 0; φ1 = 0; a2 = −0.7; ϕ2 = 0.6944π (125°)
Stagionalità 1ª arm+2ª arm
1ª armonica
2ª armonica
Gli angoli sono misurati in radianti
Stagionalità con le armoniche/3Le armoniche consentono ulteriori verifiche della presenza e tipologia dellla
stagionalità
Coefficiente di stagionalità
St = aii=1
m
∑ sen fit +ϕi( ) = Aii=1
m
∑ cos 2πs
⎛
⎝⎜
⎞
⎠⎟i
⎡
⎣⎢
⎤
⎦⎥+ sen
2πs
⎛
⎝⎜
⎞
⎠⎟i
⎡
⎣⎢
⎤
⎦⎥= ci
i=1
m
∑
Periodogramma
EsempioLa presenza di un picco in ogni periodo è segno di stagionalità
Questa impostazione rende più esplicite le componenti periodiche quali la ciclicità e la stagionalità.
Altro esempioUn solo picco indica una presenza discutibile di stagionalità
One of the spectral requirements is that seasonal peaks, inthe spectrum of the original series, should be removed in the spectrum of the seasonally adjusted series.
Frequenze ciclicheLa frequenza cui è associata la massima potenza è la fonte di stagionalità dominante.
Le prime due frequenze sono molto prossime a 4 e confermano il tipo di stagionalità presente nella serie storica.
Sales of the SPSS Manual
Units
6000
8000
10000
12000
14000
16000
1976
1977
1978
1979
1980
1981
1982
0.1 0.2 0.3 0.4 0.5
0e+00
2e+07
4e+07
6e+07
8e+07
Frequency
Periodogram
Potenziali stagionalità: 4.29 3.75 2.73 15 2.14 3
π x
Esempio
Si vedono picchi in corrispondenza in prossimità delle stagionalità
Le frequenza stagionali corrispondo a12/2=6, 12/4=3, 12/3=4, 12/6=2.
0 1 2 3 4 5 6
0.5
1.0
2.0
spectrum
Cig ordinaria operai (Italia)
0.0 0.1 0.2 0.3 0.4 0.5
020
4060
80
Frequency
Periodogram
Potenziali stagionalità: 3.21 6.43 12.86 4.29 2.14 2.57
Serie detrendizzata
Metodologia BV4Studiamo una versione semplificata del metodo sviluppato dall’ufficio centrale di statistica tedesco
Si tratta di uno schema ADDITIVO
E’ caratteristica l’ibridazione dei polinomi e delle armoniche di solito usate in contesti diversi (ad esempio in fisica).
Trend-Ciclo = Un polinomio in t (di solito la cubica)
Stagionalità = Somma di armoniche normalizzate
yt = Tt + Ct + St + ut
Metodologia BV.4Il trend è una polinomiale in “t”, il modello con trend e stagionalità è:
€
yt = β0 + β itk
i=1
k
∑ + aisen fit +ϕ i( ) + utj=1
m
∑
La formulazione non è lineare a causa della presenza dei parametri φ comeargomento del seno. Tuttavia, tenuto conto che:
La relazione può essere così linearizzata:
€
sen x + y( ) = sen x( )*cos y( ) + sen y( )*cos x( )
€
yt = β0 + β itk
i=1
k
∑ + a j γ j1sen f j t( ) *cos ϕ j( ) + γ j2 cos f j t( ) * sen ϕ j( )[ ] + utj=1
m
∑
= β0 + β itk
i=1
k
∑ + δ j1sen f j t( ) + δ j2 cos f j t( )[ ] + utj=1
m
∑
Ancora sulla BV.4Dato che la stagionalità deve compensarsi nell’arco dell’anno si pone il vincolo
Vendite mensile di auto nel Quebec-Canada
0
5
10
15
20
25
30
€
δ1isen fit( )i=1
m
∑ + δ2i cos fit( ) = 0⇒
γ 2m =
− δ1isen fit( ) + δ2i cos f it( )[ ]i=1
m−1
∑ −δ1msen fmt( )
cos fmt( )
Che può essere soddisfatto ignorando l’armonica m-esima o una delle sue componenti oppure togliendo l’intercetta dal trend-ciclo
fi = i π6
" # $
% & ' , i = 1,2,…, 6
EsempioScelta del trend e delle armoniche con la stepwise regression (si delega al computer la selezione del numero di armoniche da usare)
Ogni armonica è un’onda sinusoidale che completa il suo ciclo ogni periodo.
Le alte frequenze esprimono variazioni di breve periodo (stagionalità, settimane, giorni).
Le basse frequenze esprimono componenti cicliche con cadenze sempre minori.
OperativitàÈ difficile che uno stesso modello rimanga valido per tutto l’arco temporale. Una validità per un periodo più ristretto sembra una strategia più realistica.
La serie storica è quindi divisa in più sotto-periodi di numerosità simile h, ma comunque decisamente superiore al numero di parametri da stimare
h > (k+1+s)
Se h=19 ed n= 34 allora le finestre di stima sarebbero i periodi indicati in colonna.
Per ciascun sotto-periodo si devono stimare i parametridella cubica e delle armoniche. Per comodità i termini da usare si scelgono con la stepwise regression.
Invece di una media mobile abbiamo un modello mobile che potrebbe essere diverso da periodo a periodo.
Inizio Fine1 192 203 214 225 236 247 258 269 2710 2811 2912 3013 3114 3215 3316 34
Operatività/2I sottoperiodi si sovrappongono, almeno in parte.
Ne consegue che per uno stesso periodo disponiamo di più stimeInizio Fine Periodi di riferimento delle stime
1 19 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 192 20 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 203 21 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 214 22 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 225 23 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 236 24 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 247 25 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 258 26 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 269 27 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
10 28 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 2811 29 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 2912 30 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 3013 31 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 3114 32 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 3215 33 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 3316 34 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
Ad esempio per il periodo 10 otteniamo il dato interpolato in 10 diverse situazioni (fino ad un massimo di 16).
La sintesi dei valori stimati può farsi con la media, la mediana o altro.
Applicazione alle vendite auto
●
●
●
● ●●
●
●●
● ●●
❍
❍
❍
❍
❍
❍
❍
❍ ❍
❍
❍
❍
■ ■
■
■
■
■
■
■
■
■■
■▲ ▲
▲
▲ ▲
▲
▲
▲▲
▲
▲
▲▼ ▼
▼
▼▼
▼
▼
▼▼
▼▼
▼❙❙
❙
❙ ❙
❙
❙ ❙
❙
❙❙
❙
✚ ✚
✚
✚
✚✚
✚ ✚
✚
✚
✚
✚
✳✳
✳
✳
✳
✳
✳✳ ✳
✳✳
✳✠
✠
✠
✠
✠
✠
✠
✠
✠
✠
✠
✠
Gennaio
Febbraio
Marzo
Aprile
Maggio
Giugno
Luglio
Agosto
settembre
Ottobre
Novem
bre
Dicem
bre
0
5
10
15
20
25
30
● 1960
❍ 1961
■ 1962
▲ 1963
▼ 1964
❙ 1965
✚ 1966
✳ 1967
✠ 1968
La stagionalità è presente ed in forma costante. C’è anche il trend.
Applicazione alle vendite auto/2Trend cubico. Finestra=31. Metodo: weighted stepwise regression
Cambio Euro/Dollaro Can.
http://uif.bancaditalia.it/UICFEWebroot/cambiSSMForm.jsp?lingua=it
Exchange rate Euro/Can.$
Mo
nth
ly a
ve
rag
e
2002 2003 2004 2005 2006 2007 2008
3.0
3.1
3.2
3.3
Livellamento esponenziale (No trend - No seasonality)
I metodi di livellamento esponenziale ES (exponential smoothing) sono nati negli anni ‘50 e diventati subito popolari perché danno stime affidabili con pochi dati.
La previsione per il prossimo periodo si basa sulla previsione per il periodo corrente più un aggiustamento proporzionale all'errore già fatto
dove "α" è il fattore di correzione (si ipotizza che 0 < α <1 )
All'avvicinarsi di "α" ad "1" aumenta l'incidenza del fattore di correzione. Se α tende a zero l’errore di previsione perde gradualmente la sua importanza.
Se α=1 il metodo ES coincide con il metodo naive per k=1
ˆ y t+1 = ˆ y t +α yt − ˆ y t( )
Livellamento esponenziale/2
Il valore prossimo previsto è una media ponderata tra il valore già previsto ed il valore certo del periodo precedente. Infatti:
Se "α" tende a zero si riduce l’incidenza del valore passato ed aumenta quella della previsione precedente (processo AUTOADATTIVO).
L’ipotesi di serie storica a media costante comporta che tutti i valori diano lo stesso contributo alla formazione della previsione corrente.
Tale ipotesi è spesso indifendibile e converrà passare ad un modello in cui la media possa variare nel tempo.
ˆ y t+1= ˆ y t +αyt −αˆ y t = αyt + 1−α( )ˆ y t
Livellamento esponenziale/3
il principio è quello della media ponderata: tutti i valori passati della serie contribuiscono al valore futuro, ma non con lo stesso peso.
Anzi, i pesi decrescono man mano che il periodo di riferimento si allontana nel passato.
C'è però un'altra interpretazione dell'ES che è molto illuminante
In generale
€
y^t+1= αyt + 1−α( )y
^t = αyt + 1−α( ) αyt−1+ 1−α( ) αyt−2+ 1−α( ) …[ ][ ][ ]
€
y^n+1= α 1−α( )i yn+1−i
i=1
n∑ + 1−α( )n y
^n
Per n grande tende a zero
Note sul fattore di correzione
Più alto è il fattore più rapida è la caduta del contributo dei valori passati e più alto è il peso dei valori più recenti
E' da osservare che la somma dei pesi nello schema di ES dipende da "α" e da "n", ma all'aumentare di "n" tende rapidamente ad uno
€
α 1−α( )i =i=1
n∑ α 1−α( )i =
i=1
n∑ α
1− 1−α( )n+1
1− 1−α( )
⎡
⎣ ⎢ ⎢
⎤
⎦ ⎥ ⎥
=1− 1−α( )n+1
La serie storica ha memoria dei valori passati, ma la loro influenza decresce man mano che si allontanano dal presente.
Peso dei valori passati
Ancora sul fattore di correzione Scelta ragionata del fattore di correzione
La scelta di " α" è un processo di prove ed errori: è noto che i valori vicini allo zero livellano la serie più dei valori prossimi ad uno.
Se la serie è molto oscillatoria si scelgono valori bassi che frenano le reazioni all'aggiornamento dovuto a forze di espansione o di contrazione.
Se invece ha una struttura ben marcata e con poche oscillazioni si opterà per un valore più alto).
In generale si dovrebbe avere:
Il fattore " α" influenza l'accuratezza della previsione e deve essere scelto in modo che l'errore di previsione sia il più piccolo possibile.
N.B.
0.01≤α ≤ 0.3
α→ 0 Tutti i valori (vicini e lontani) contano ugualmenteα→1 E' importante solo il valore più recente
⎧⎨⎪
⎩⎪
Scelta del fattore di correzione/2
Per ottenere un buon valore di prova di “α” si sfrutta l’analogia con le medie mobili
Si può scegliere “α” in modo da rendere l’ES simile ad una media mobile di “m” termini. Quindi
Un dato inserito in una media mobile di “m” termini ha “età media” cioè rimane nella serie, pari a
Nel livellamento esponenziale la presenza media è
1m⎛ ⎝
⎞ ⎠ t=
m−12t=0
m−1∑
α 1− α( )t[ ] = 1− ααt=0
∞∑
m−12 =
1− αα
⇒α =2
m+1Se m=10 allora sarà α=0.18
Implementazione dell’ES
Il meccanismo ricorsivo ˆ y t+1= αyt + 1−α( )ˆ y t
Può essere riscritto come
e può attivare la previsione in ogni momento della serie.
che viene usato per la previsione successiva
e così via fino all’n-esimo dato
(1) Significa che si prevede un periodo in avanti
ˆ y n 1( ) = αyn + 1− α( )ˆ y n−1 1( )
ˆ y 1 1( ) = αy1 + 1− α( )ˆ y 0 1( )
ˆ y 2 1( ) = αy2 + 1− α( )ˆ y 1 1( )
Previsione per il 2° periodo basata sul 1°
Previsione per il 3° periodo basata sul 2°
Stima del valore inizialePer avviare il processo di ES si deve fare una scelta per il valore di partenza:
ovvero la stima "naive"
ˆ y 0 1( )
Tra le varie scelte possibili di ricordiamo le due più semplici
1) Media dei primi m valori
2) si pone
Applicando sequenzialmente la formula di ES si vede che
L’impatto della prima previsione è trascurabile se n è grande.Se n=50 e α=0.2 per il secondo addendo si avrebbe
0.850 y0 1( )⎡⎣
⎤⎦= 0.000014 y0 1( )⎡
⎣⎤⎦
ˆ y 0 1( )
ˆ y n 1( ) = α 1−α( )n− i yii=1
n∑⎡
⎣ ⎢ ⎤
⎦ ⎥ + 1− α( )n ˆ y 0 1( )
Esempio
In questo caso il valore adatto per "α" è 0.8 in quanto segue meglio la serie.
Quindi la previsione più accurata per l'88 è 14.01
Ecco un esempio su dati annuali. Come valore iniziale si è usata la stima naive.
Quando la serie è analizzata la prima volta, l'ES è applicato a tutti i termini
Si intuisce che la scelta di "α" deve essere preceduta da diverse prove
Scelta automatica di αIl fattore "α" determina l’intensità con la quale i valori passati influenzano le
Previsioni future.
Valori piccoli di “α” daranno risposte lente ai cambiamenti di livello, ma saranno più stabili.
Valori elevati rendono le previsioni più sensibili ai cambiamenti quindi più vicine all’andamento reale, ma anche più legate a fatti episodici e irregolari.
Un modo per scegliere “α” meno soggettivamente è il seguente:
Per una scansione di valori di “α” 0.05 - 0.30, passo 0.05 si calcola
Il valore di “α” cui corrisponde il minimo di sarà quello prescelto per tutte le previsioni
MSE α( ) = yt − yt−1 1( )⎡⎣
⎤⎦
t=1
n
∑2
Ancora sulla scelta automatica di α
Se il criterio prescelto ha un andamento convesso, il punto di minimo indicherà il valore corretto di α.
In genere la sensibilità non è elevata per cui va bene anche una griglia poco fitta per la disamina dell’intervallo unitario.
Esempio
Il valore di “α” da applicare è α=0.05
Tuttavia lo smussamento appare eccessivo.
Un altro candidato è α=0.30, ma l’efficacia è dubbia
t Yt1 31.902 33.183 37.444 28.575 29.226 33.117 27.948 33.319 40.82
10 32.9011 34.4512 30.7813 29.5514 26.8215 32.1716 30.7217 29.6318 30.8919 29.3520 29.3921 33.6022 38.4723 39.5824 36.0825 34.9826 42.8127 36.2828 37.4429 22.7930 28.40
α SSE(α)0.05 607.680.10 621.670.15 629.710.20 633.340.25 633.690.30 631.960.35 629.370.40 626.960.45 625.520.50 625.590.55 626.32
20.00
25.00
30.00
35.00
40.00
45.00
0 10 20 30 40
20.00
25.00
30.00
35.00
40.00
45.00
0 10 20 30 40
Leaving-one-outIn fase di costruzione del meccanismo di ES si può ben sacrificare un dato
per mettere a punto il previsore.
L’idea è di effettuare l’ES non sugli “n” dati, ma su (n-1) e di eaminare una scansione di valori del coefficiente di smorzamento “α”.
Il valore di “α” che fornisce ma stima migliore del valore più recente Yn sarà quello da adottare nel previsore
α Ysn(α)0.05 22.970.10 27.060.15 29.000.20 28.120.25 24.950.30 20.410.35 15.410.40 10.620.45 6.480.50 3.270.55 1.120.60 0.090.65 0.200.70 1.44
20.00
25.00
30.00
35.00
40.00
45.00
0 10 20 30 40
Il valore di “α” da applicare è α=0.60
La prossimità tra serie originale e serie prevista dall’ES è troppo elevata:
ogni singolo episodio viene riportato nel previsore che non attua alcun livellamento
Previsioni con l'ESForecasting involves making projections about future performance on the basis of historical and current data.Lo scopo dell'ES è di eliminare le fluttuazioni casuali e conservare la struttura consolidata della serie storica
Il metodo ES è utile se si debbono aggiornare centinaia o migliaia diprevisioni -a breve termine- allorché si acquisisce un nuovo dato.
Infatti, per gestire l'ES occorre registrare il dato osservato in passato e la previsione fatta su di esso. Quindi due sole informazioni.
Quando il nuovo dato si rende disponibile si inserisce questo e la suaprevisione fatta nel periodo precedente e così via.
L' ES ha un orizzonte temporale limitato ad un periodo e non potrebbe essere usato per una sequenza di previsioni se non attraverso un meccanismo ricorsivo poco affidabile.
EsempioQuarterly Iowa nonfarm income
(1948 - 1979). Source: Abraham & Ledolter (1983).
0
1000
2000
3000
4000
5000
6000
7000
0 20 40 60 80 100 120 140
La presenza di un trend esponenziale inducead attivare la scala logaritmica e le differenze prime (cioè i tassi di crescita)
Nel grafico dei tassi di crescita c’è una progressiva, sebbene lenta crescita del livello medio. Quindi il modello a media costante sarebbe inappropriato. Usiamo y0=(media globale della serie) α=0.13
DLog*1000
-10
-5
0
5
10
15
20
0 20 40 60 80 100 120 140
Valore previsto nella scala e forma della serie originaria è yt+1=ytexp(0.01139949)=6033.387
-0.005
0
0.005
0.01
0.015
0.02
1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103109115121127
Logdif Livellata
Maggiore è il valore di α, maggiore è la variabilità dell’errore di previsione.
In base alla varianza dell’errore di previsione si possono calcolare degli intervalli di previsione, approssimati come la varianza da cui derivano.
L’errore di previsione dell’ ES è definito da
Varianza dell’errore di previsione
€
en+1=^yn+1− yn+1
con varianza
€
varen+1( ) = var ^yn+1⎛
⎝ ⎜
⎞
⎠ ⎟ +σ y
2
≅ varα 1−α( )i=1
∞∑
i−1yn+1−i
⎛
⎝ ⎜
⎞
⎠ ⎟ +σ y
2 = α2 1−α( )i=1
∞∑
2 i−1( )σ y
2+σ y2
≅ α2−ασ y
2+σ y2 =
2σ y2
2−α
Esempio
La “forchetta” (qui al 95%) deve essere considerata più in termini qualitativi che quantitativi
Year Forecast True value %Err. 2005 2140.007 2172 1.47 2006 2140.007 2398 10.76 2007 2140.007 2398 10.76
Unknown parameters are determined by minimizing the squared prediction error.
y1 =min y{ }
Livellamento esponenziale e Trend
L’ES è appropriato se la serie non ha un trend. Se invece il trend c'è ed in particolare se il trend è lineare l'ES produce valori poco utili
Supponiamo che la serie storica sia esprimibile con il modello
Oltre alla media costante b0 c’è un incremento regolare del livello medio della serie.
Se si applica l'ES si ottiene
yt = b0 + b1t
€
^yn+1= α 1−α( )
i=1
n∑
iyn+1−i = α 1−α( )
i=1
n∑
ib0+b1 n+1− i( ) +en+1−i[ ]
= b0α 1−α( )i=1
n∑
i+b1α 1−α( )
i=1
n∑
i−b1α i 1−α( )
i=1
n∑
i+α 1−α( )
i=1
n∑
ien+1−i
In definitiva si ha
Quindi il metodo ES semplice (SES: single exponential smoothing ) sottostima il trend se è crescente o lo sovrastima se è decrescente.
Al tendere di "n" all'infinito succede che
Media degli errori
Livellamento esponenziale e Trend/2
€
n→∞Lim α 1−α( )
i=1
n∑
i=1;
n→∞ Lim i 1−α( )
i=1
n∑
i=
1−αα2
n→∞Lim 1−α( )
i=1
n∑
iun+1−i = 0
€
y^n+1= b0+b1 n+1( )[ ]−
b11−α( )α
= Tn+1−b11−α( )
α
Metodo di HoltPer superare questo limite è stato proposto il metodo LES (linear exponential smoothing) noto anche come METODO DI HOLT.
Tale metodo prevede prima il livellamento della serie storica con un modello misto
L'espressione è simile a quella del metodo ES. Cambia solo per la presenza del termine di trend che si somma all'ultimo valore livellato della serie.
Il simbolo “L” per il valore livellato (non trend) in questo caso è più comodo.
Il significato del coefficiente di smussamento “α” rimane invariato, ma si stabilisce che il valore previsto ora si articola su due componenti distinte : il livello ed il trend
Relazione 1: Lt =α yt + 1−α( ) Lt−1 +Tt−1( )
Questa è la prima equazione del metodo di Holt
Metodo Holt/2
Compaiono due fattori di livellamento (α e β) da cui il nome di DES (Double Exponential smoothing) con cui è anche noto questo metodo
La seconda equazione del metodo prevede il livellamento del trend
Questa è una stima del trend
Il trend è espresso come media ponderata tra la stima più recente del trend stesso e l’incremento del valore livellato.
Questo è già stato ottenuto dalla1ª equazione
La scelta di “β” troppo vicina ad uno porta ad un trend applicato solo alle ultime osservazioni.
Se “β” tende a zero il trend si stima su tutte le osservazioni dando a tutte lo stesso peso.
Relazione 2: Tt = β Lt − Lt−1( )+ 1−β( )Tt−1; 0 < β <1
Metodo di Holt/3Il metodo LES opera separatamente sulle due componenti per poi combinarle
in fase di previsione
La previsione è la somma del valore livellato della serie e del trend
Per avviare il processo di previsione è necessario determinare i valori iniziali del trend e della serie livellata
Ad esempio si può scegliere
€
L1 =αy1+ 1−α( ) L0 + T0( )T1 = β L1− L0( ) + 1−β( )T0⎧ ⎨ ⎩
€
y^t+1= Lt +Tt
€
a) L1= y1, L0 = y1−T0, T1= T0b) L1= y2− y1; c) L1= yn − y1( )/(n−1)
State-Space model
Implementazione del metodo di Holt
Rimane da scegliere il valore iniziale del trend. Due possibili scelte sono
Il meccanismo del LES è ora definito:
1) si calcola
2) si calcola
Fissati
A fini previsivi si pone poi
(a scelta)
€
α, β, y0, T0
€
Lt =αyt + 1−α( ) Lt−1+ Tt−1( )
€
Tt = β Lt − Lt−1( ) + 1−β( )Tt−1
€
y^n+1= Ln +Tn
Esempio
La serie mostra un chiaro trend lineare per cui il LES può essere applicato con speranza di succeso
€
^y1= β0 intercetta retta stimata su 14 punti( )L1= min y{ }
Metodo Holt-WintersI metodi di livellamento esponenziale sono detti ADATTIVI in quanto operano la valutazione graduale dell'impatto dei dati passati sui valori futuri.
Nessuno dei due metodi (SES e DES) riesce a "seguire" serie con forti effetti stagionali. Il metodo di Winters cerca di colmare tale lacuna
in cui si ipotizza che l'interazione che lega trend e stagionalità sia moltiplicativa dove k esprime il numero di frazioni stagionali presenti nell'anno. E' ovvio che
Nel metodo di Winters il trend è lineare per questo il metodo è anche detto di Holt-Winters
yt+1 = Lt + Tt( )St−k+1
Tt = b0 + b1t
Sii=1
k
∑ = k
Il metodo Holt-Winters/2
Il metodo Holt-Winters si articola su tre equazioni (e quindi in tre passi)
Livellamento delle osservazioni
Livellamento della stagionalità
Livellamento del trend
Sono presenti ben tre fattori di livellamento (compresi tra 0 e 1) e questo dà al metodo grande flessibilità, ma anche più arbitrarietà nella scelta.
Lt = αytSt−k⎛
⎝ ⎜ ⎜
⎞
⎠ ⎟ ⎟ + 1−α( ) Lt−1+ Tt−1( )
€
Tt = β Lt − Lt−1( ) + 1−β( )Tt−1€
St = γytLt
⎛
⎝ ⎜
⎞
⎠ ⎟ + 1− γ( )St−k
Il metodo Holt-Winters/3Le previsioni a partire dal periodo t si effettuano con la formula
Per avviare i calcoli occorre fissare il livello del trend, la previsione zero ed i fattori di stagionalità. Esistono varie scelte.
Con l’esperienza ed un processo di prove-ed-errori si può definire un set ottimale.
Soluzioni semplici sono le seguenti
L1 = yk valore ultima stagione primo annoT0 = 0Sj = 1 per j = 1,2,…,k
L1 =yj
j=1
n∑
n media totale
T0 = 0
Sj =yj
yjj=1
k∑
per j =1,2,…,k
yt+m = Lt +mTt( )St−k+m m =1,2,!
EsempioImporti IVA versati trimestralmentein una provincia italiana Schema di calcolo
ˆ y n+1= Ln + Tn( )Sn−4+1 = L20+ T20( )S17= 444.18+ 2.95( )1.04= 465.02ˆ y n+2 = Ln + 2Tn( )Sn−4+2 = L20+ 2T20( )S18= 444.18+ 5.9( )0.92= 414.074
Esempio/continuaOrd Anno Trim IVA Lt St Tt Yt+1 1 0.75 2 0.92 3 1.07 4 251.15 1.26 0.00
1 1984 1 76 116.24 0.66 -1.35 105.532 2 93 102.61 0.91 -1.47 107.893 3 108 101.24 1.07 -1.47 126.134 4 128 101.10 1.27 -1.46 66.115 1985 1 196 275.83 0.71 0.30 250.606 2 175 201.16 0.87 -0.45 214.127 3 141 139.03 1.02 -1.06 174.658 4 236 181.59 1.30 -0.63 127.749 1986 1 256 344.50 0.74 1.01 301.87
10 2 190 230.27 0.83 -0.14 234.6011 3 227 223.42 1.02 -0.21 289.3412 4 227 179.93 1.27 -0.64 132.5613 1987 1 299 381.88 0.78 1.38 318.1014 2 403 475.32 0.85 2.30 485.4515 3 282 297.47 0.95 0.50 376.9716 4 288 234.68 1.23 -0.13 182.6317 1988 1 387 470.79 0.82 2.23 400.2018 2 484 562.16 0.86 3.12 539.7519 3 330 367.58 0.90 1.15 453.8920 4 497 400.24 1.24 1.46 328.47
ˆ y 21= L20+ T20( )S17= 400.24+1.46( )0.82= 329.39ˆ y 22= L20+ 2T20( )S18= 400.24+ 2.92( )0.86= 346.72
La combinazione dei fattori che era buona per i primi valori iniziali non è necessariamente buona per gli altri
Altro esempio (Trend=F,Seas=T) Altro esempio (Trend=T,Seas=T)
Holt-Winters additivoLa versione additiva prevede la separazione tra stagionalità e trend
Lo schema di calcolo è
Le previsioni saranno quindi
yt+1 = Lt + Tt + St−k+1
ˆ y t+m = Lt +mTt + St−k+m
Sii=1
k∑ = 0
€
Lt = α yt−St−k( ) + 1−α( ) Lt−1+Tt−1( )Tt = β Lt− Lt−1( ) + 1− β( )Tt−1St = γ yt− Lt( ) + 1− γ( )St−k
Vincolo di pareggiamento nell’anno
Esempio
Incassi trimestrali WallMart
Quarter Code Yt Lt St Tt Yt+1 Alfa= 0.101 -0.15 beta= 0.862 -0.06 Gamma= 0.293 -0.034 13640.00 0.24 10972.50 1992-1 1 9280 23079.27 -11867.3910527.86 33607.071992-2 2 10340 31280.42 -18008.77 9853.12 41133.511992-3 3 10630 38083.19 -23609.74 8968.52 47051.951992-4 4 13640 43710.51 -25860.60 7999.57 39842.691993-1 5 11650 48890.81 -33688.53 7181.98 38064.021993-2 6 13030 53569.39 -37385.10 6455.99 36415.641993-3 7 13680 57751.82 -41207.13 5796.66 37687.881993-4 8 17122 61491.89 -41778.59 5200.25 33003.611994-1 9 13920 64783.78 -48459.25 4646.83 32045.511994-2 10 16237 67849.76 -49620.88 4188.38 30831.011994-3 11 16827 70637.73 -52046.23 3782.26 32641.411994-4 12 20361 73191.96 -51283.62 3426.13 28158.841995-1 13 17690 75571.20 -56562.13 3122.53 29072.851995-2 14 19942 77780.65 -56688.16 2857.74 28592.161995-3 15 20418 79820.98 -58373.03 2620.69 31158.041995-4 16 24448 81770.66 -56477.20 2426.10 27634.631996-1 17 20440 83477.30 -62130.77 2217.45 29006.591996-2 18 22723 85066.39 -61551.66 2035.23 28728.591996-3 19 22913 86520.06 -62874.30 1866.58 31909.441996-4 20 27550 87950.70 -59851.41 1740.15 27560.081997-1 21 22772 89212.04 -65836.74 1601.30 29261.681997-2 22 25587 90445.87 -64395.86 1494.73 29066.311997-3 23 25644 91598.38 -65523.17 1395.49 33142.461997-4 24 30856 92765.22 -61621.12 1329.18 28257.651998-1 25 25409 93809.53 -68041.60 1246.57 30660.241998-2 26 28366 94826.68 -66171.60 1180.04 30483.551998-3 27 28777 95836.06 -66844.03 1130.55 35345.481998-4 28 35386 96970.66 -61589.76 1131.72 30060.78
9000
12000
15000
18000
21000
24000
27000
30000
33000
36000
0 5 10 15 20 25 30
Previsione per il 28°. Usata per fissare i parametri
Previsione prossima
Meida anno1
Tipologie di LES
Sono in uso regolare ben 15 diverse formulazioni della tecnica.
Si distinguono per i tipo di trend, se c’è; il tipo di stagionalità, se c’è e per lo schema di formazione del dato
La tabella di Gardner(1985)
Parametri Ets in package forecast
ets(y, model="ZZZ", damped=NULL, alpha=NULL, beta=NULL, gamma=NULL, phi=NULL, additive.only=FALSE, lambda=NULL, lower=c(rep(0.0001,3), 0.8), upper=c(rep(0.9999,3),0.98), opt.crit=c("lik","amse","mse","sigma","mae"), nmse=3, bounds=c("both","usual","admissible"), ic=c("aic","aicc","bic"), restrict=TRUE)
Note that the forecast equations for the seasonal methods are valid only for a forecast horizon () less than or equal to the length of the seasonal cycle (mp).
Esempio