prediccion de senales~ m eto dos de descomposici on

33
PREDICCI ´ ON DE SE ˜ NALES etodos de descomposici´ on Francisco J. Gonz´ alez Serrano Universidad Carlos III de Madrid

Upload: others

Post on 24-Jul-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PREDICCION DE SENALES~ M eto dos de descomposici on

PREDICCION DE SENALESMetodos de descomposicion

Francisco J. Gonzalez Serrano

Universidad Carlos III de Madrid

Page 2: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Metodos de descomposicion

En el modelado estructural de una serie temporal, los datos observados se interpretan como

una combinacion de componentes no observables como son las tendencias, los ciclos y las

componentes estacionales.

Este metodo tambien recibe el nombre de metodo de descomposicion, puesto que requiere

identificar tres componentes aisladas en el patron subyacente en los datos.

Xt = f (St, Tt, Ct, Ut)

• Xt: valor de la serie en el instante (actual) t

• St: componente estacional

• Tt: tendencia

• Ct: componente cıclica

• Ut es la componente aleatoria (o error) en el instante t.

• f (·): aditiva (simplemente se suman los cuatro elementos), multiplicativa, etc.

F. Gonzalez 1

Page 3: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Modelos con tendencia y estacionalidad

1800 1820 1840 1860 1880 1900 1920 1940 1960 19800

50

100

150

200

250

Mill

ones

1980 1982 1984 1986 1988 1990 19920

0.5

1

1.5

2

2.5

3

Mile

s

(a) (b)

Figura 1: (a) Poblacion de los Estados Unidos por decenios en el periodo 1790-1990. (b) Ventas mensuales de vino tinto (millones delitros) durante el periodo Enero 1973 - Octubre 1991.

Clara tendencia creciente.

En ambos casos, los modelos de media cero presentan graves deficiencias.

La grafica correspondiente a la poblacion, que aparentemente no contiene ninguna componente

periodica, parece ajustarse mejor a un modelo de la forma

Xt = Tt + Ut (1)

Una vez seleccionado el modelo, es necesario ajustarlo a los datos: mınimos cuadrados.

F. Gonzalez 2

Page 4: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Modelos con tendencia y estacionalidad

Datos de poblacion parecen ajustarse a tendencia cuadratica:

Tt = a0 + a1t + a2t2 . (2)

Ajustando este modelo al periodo 1790 ≤ t ≤ 1990, se obtienen las valores a0 = 2,1 × 1010,

a1 = −2,3 × 107 y a0 = 6,5 × 103.

1800 1820 1840 1860 1880 1900 1920 1940 1960 19800

50

100

150

200

250

Mill

ones

F. Gonzalez 3

Page 5: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Modelos con tendencia y estacionalidad

1880 1890 1900 1910 1920 1930 1940 1950 1960 19706

7

8

9

10

11

12

1880 1890 1900 1910 1920 1930 1940 1950 1960 1970−2.5

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

2.5

(a) (b)

Figura 2: (a) Nivel del lago Huron en el periodo 1875-1972 con modelo lineal para la tendencia. (b) Residuos producidos en el ajuste.

Analisis superficial: tendencia lineal decreciente.

Xt = a0 + a1t + Ut

Tras ajuste de mınimos cuadrados, en el residuo, mostrado en la Figura 2.b, ya no se aprecia

ninguna tendencia aparente.

Presencia de de segmentos relativamente grandes con valores que presentan el mismo signo:

correlacion temporal en el residuo, cualidad que impide calificarlo como ruido IID.

Las dependencias temporales pueden aprovecharse para ajustar un modelo mas fino a los datos.

F. Gonzalez 4

Page 6: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Regresion armonica

En muchas series presencia de un patron periodico.

1973 1974 1975 1976 1977 1978 19796.5

7

7.5

8

8.5

9

9.5

10

10.5

11

11.5

Mile

s

Figura 3: Muertes por accidentes de trafico en el periodo 1973-1978.

F. Gonzalez 5

Page 7: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Para describir esta serie, se sugiere utilizar el modelo

Xt = St + Ut (3)

• St: funcion periodica de periodo d.

St = a0 +

N∑

k=1

(ak cos(ωkt) + bksen(ωkt)) (4)

• ωk son multiplos enteros de2π

d• N − 1 es el numero de armonicos considerados.

F. Gonzalez 6

Page 8: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Regresion armonica

0 5 10 15 20 25 30 350

0.5

1

1.5

2

2.5

3

3.5

4x 10

4

Comp. anual

Comp. semestral

1973 1974 1975 1976 1977 1978 19796.5

7

7.5

8

8.5

9

9.5

10

10.5

11

11.5

(a) (b)

Figura 4: (a) Componentes de la serie de Fourier de la secuencia de accidentes de trafico. (b) Estima de la componente armonica.

Modelo: Xt = St + Ut (5)

con St = a0 +

N∑

k=1

(ak cos(ωkt) + bksen(ωkt)) (6)

Figura 6.a muestra las componentes del desarrollo en serie de Fourier.

• Observar frecuencia fundamental (periodo anual) y el armonico correspondientes al periodo

semestral.

Modelo con un armonico (N = 2) representa la tendencia estacional.

F. Gonzalez 7

Page 9: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Estimacion de tendencia y estacionalidad

Procedimiento general

• Inspeccion visual.

• Si hubiese discontinuidades aparentes, dividir la serie en segmentos que presenten

caracterısticas homogeneas.

• Si se detectan valores extranos (outliers), debe hacerse un analisis cuidadoso para justificar

su descarte.

Estimacion de tendencia sin estacionalidad

En ausencia de estacionalidad,

Xt = Tt + Ut, , t = 1, . . . , n (7)

donde E [Ut] = 0

• Si E [Ut] 6= 0, entonces Tt → Tt + E [Ut] y Ut → Ut − E [Ut], respectivamente.

F. Gonzalez 8

Page 10: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Metodo 1: Estimacion de la tendenciaAlisado con filtro FIR de promedio movil.

Tt =1

2q + 1

q∑

j=−q

Xt−j , q + 1 ≤ t ≤ n − q . (8)

1950 1955 1960 1965 1970 1975 19803

3.5

4

4.5

5

5.5

6

6.5

Mile

s

1950 1955 1960 1965 1970 1975 1980−1000

−800

−600

−400

−200

0

200

400

600

800

(a) (b)

Figura 5: (a) Promediado de 5 terminos sobre la serie de rayos. (b) Residuo.

F. Gonzalez 9

Page 11: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Metodo 1: Estimacion de la tendenciaAlisado exponencial.

Tt = aXt + (1 − a)Tt−1 (9)

• Para t ≥ 2,

Tt =

t−2∑

j=0

a(1 − a)jXt−j + (1 − a)t−1X1

Eliminacion componentes de alta frecuencia

1950 1955 1960 1965 1970 1975 19803

3.5

4

4.5

5

5.5

6

6.5

Mile

s

1950 1955 1960 1965 1970 1975 19803

3.5

4

4.5

5

5.5

6

6.5

Mile

s

(a) (b)

Figura 6: Serie de rayos (a) Alisada exponencial con factor α = 0,4. (b) Alisado mediante la eliminacion de las componentes defrecuencia (normalizada) mayor que fl = 0,4; fl = 1,0 hubiera dejado la serie sin alterar.

F. Gonzalez 10

Page 12: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Metodo 2: diferenciado

Notacion

• ∇: Operador diferencia de orden 1

∇Xt = Xt − Xt−1 = (1 − D)Xt (10)

• D: operador desplazamiento hacia atras (retardo),

DXt = Xt−1 .

• ∇j(Xt) = ∇(∇j−1(Xt)) con j ≥ 1 y ∇0(Xt) = Xt.

• Ejemplo

∇2Xt = ∇(∇(Xt)) = (1 − D)(1 − D)Xt = (1 − 2D + D2)Xt

= Xt − 2Xt−1 + Xt−2

• Si Xt = Tt + Ut con Tt =∑k

j=0 cjtj y siendo Ut un proceso estacionario de media 0,

∇kXt = k! ck + ∇kUt ,

que tiene media k! ck.

• Aplicacion reiterada puede conducirnos a un proceso estacionario de facil caracterizacion.

F. Gonzalez 11

Page 13: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Metodo 2: diferenciado

Serie: Poblacion de los Estados Unidos: Aplicacion del operador ∇2

1800 1820 1840 1860 1880 1900 1920 1940 1960 19800

50

100

150

200

250

Mill

ones

1800 1820 1840 1860 1880 1900 1920 1940 1960 1980 2000−10

−5

0

5

10

15

Mill

ones

1800 1820 1840 1860 1880 1900 1920 1940 1960 1980 2000−0.12

−0.1

−0.08

−0.06

−0.04

−0.02

0

0.02

0.04

0.06

0.08

(a) (b)

La amplitud de las variaciones de ∇2Xt aumenta con el valor de Xt (Figura a).

Este efecto puede eliminarse transformando los datos con un operador logarıtmico antes de

aplicar el operador ∇2 (Figura b).

F. Gonzalez 12

Page 14: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Estimacion conjunta

Modelo de descomposicion basico

Xt = Tt + St + Ut (11)

con E [Ut] = 0, St+d = St y∑d

j=1 Sj = 0.

1. Eliminar componente estacional y ruido.

Si el periodo es impar, d = 2q + 1,

Tt =1

2q + 1

q∑

j=−q

Xt−j , q + 1 ≤ t ≤ n − q .

Si fuese par,

Tt =

(

1

2Xt−q + Xt−q+1 + · · · + Xt+q−1 +

1

2Xt+q

)

/d

con q < t ≤ n − q.

F. Gonzalez 13

Page 15: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

2. Calcular la componente estacional.

Si wk, con k = 1, . . . , d es el promedio de las desviaciones{(

Xk+jd − Tk+jd

)

, con q < k + jd ≤ n − q}

.

entonces

Sk = wk −1

d

d∑

i=1

wi, con k = 1, . . . , d

verificandose que Sk = Sk−d para k > d.

3. Definir proceso sin componentes estacionales Dt = Xt − St.

Eliminando la tendencia del nuevo proceso Tt, se obtendra una serie ruidosa estacionaria

dada por:

Ut = Dt − Tt

F. Gonzalez 14

Page 16: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Estimacion componente estacional

Aplicacion del procedimiento de estimacion de la componente estacional sobre la serie de

muertos en accidentes.

1973 1974 1975 1976 1977 1978 1979−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

Mile

s

1973 1974 1975 1976 1977 1978 19798

8.5

9

9.5

10

10.5

Mile

s

1973 1974 1975 1976 1977 1978 1979−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

Mile

s

(a) (b) (c)

Figura 7: (a) Componente estacional de la serie de muertos en accidente. (b) Serie sin la componente estacional. (c) Serie ruidosa Ut

sin tendencia (Dt: polinomio de segundo orden) ni componente estacional.

F. Gonzalez 15

Page 17: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Metodo 2: diferenciado

Serie con componente estacional de periodo d

Definimos

∇dXt = Xt − Xt−d = (1 − Bd)Xt . (12)

Aplicandolo al modelo de descomposicion clasica,

∇dXt = Tt − Tt−d + Ut − Ut−d .

• Componente ruidosa: Ut − Ut−d

• Tendencia: Tt − Tt−d.

◦ Eliminable con metodos anteriores.

F. Gonzalez 16

Page 18: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Metodo 2: diferenciado

Aplicacion del operador ∇12 a la serie de muertes mensuales por accidente (∇12Xt,

t = 13, . . . , 72)

1974 1975 1976 1977 1978 1979

−1.2

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8m

iles

• Persiste tendencia ascendente en los datos.

F. Gonzalez 17

Page 19: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Metodo 2: diferenciado

Eliminacion de la tendencia mediante diferenciado (∇∇12Xt, t = 14, . . . , 72).

1974 1975 1976 1977 1978 1979

−800

−600

−400

−200

0

200

400

600

800

1000

1200

• Eliminacion tendencia mediante aplicacion del operador ∇.

F. Gonzalez 18

Page 20: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Analisis de residuos

Objetivo final: extraer de la serie toda la informacion sobre tendencias y componentes

estacionales para dejar un residuo con propiedades estadısticas estacionarias.

Alcanzado este objetivo, resta encontrar un modelo para la secuencia de ruido.

El caso mas favorable es obtener un residuo ruidoso formado por una secuencia de variables

aleatorias independientes e identicamente distribuidas (IID).

En otro caso habrıa que iniciar un procesado adicional para eliminar toda la informacion que

permanece aun en el residuo.

F. Gonzalez 19

Page 21: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Pruebas de comparacion

Funcion de autocorrelacion temporal (ACF)

• Para grandes espacios muestrales, las muestras de la funcion de autocorrelacion de una

secuencia IID Y1, . . . , Yn de varianza finita son aproximadamente IID, con distribucion

normal de media 0 y varianza 1/n

ρ(h) ∼ N(0, 1/n).

• Alrededor del 95 % de las muestras de ρ(h) deben quedar dento de los margenes ±1,96/√

n.

• Desde un punto de vista practico, si se calculan las muestras de la funcion de

autocorrelacion hasta el retardo 40 y se encuentran mas de 2 o 3 valores fuera de los

margenes, o bien uno que exceda significativamente esos lımites, se puede rechazar la

hipotesis IID.

F. Gonzalez 20

Page 22: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Pruebas de comparacion: ACF

Serie correspondiente al nivel del lago Huron.

• Ajuste lineal (decreciente) para la tendencia.

1880 1890 1900 1910 1920 1930 1940 1950 1960 19706

7

8

9

10

11

12

1880 1890 1900 1910 1920 1930 1940 1950 1960 1970−2.5

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

2.5

0 5 10 15 20 25 30 35 40

−0.2

0

0.2

0.4

0.6

0.8

1

muestra

AC

F

El modelo no proporciona resultados adecuados (tres de las cuatro primeras muestras de la

ACF de los residuos superan los margenes ±1,96/√

98).

F. Gonzalez 21

Page 23: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Test Portmanteau

Se define el estadıstico Q = n∑h

j=1 ρ2(j)

Si Y1, . . . , Yn es una secuencia IID de varianza finita, la distribucion Q ∼ χ2(h) (h = 20)

0 10 20 30 40 50 60 70 80 90 1000

0.01

0.02

0.03

0.04

0.05

0.06

0.07

• Un valor grande de Q indica que las muestras de la funcion de autocorrelacion son grandes

y que por tanto, es probable, que no se satisfaga el test de IID.

Se rechaza la hipotesis de IID al nivel α si Q > χ21−α(h), donde χ2

1−α(h) es el cuantil 1 − α de

la distribucion chi-cuadrado.

F. Gonzalez 22

Page 24: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Test Portmanteau

Existen variaciones del estadıstico Q. Por ejemplo, la propuesta por Ljung y Box.

QLB = n(n + 2)

h∑

j=1

ρ2(j)/(n − j) .

Propuesta por McLeod y Li: permite distinguir si los datos proceden de una secuencia de

variables aleatorias IID con distribucion normal.

• Sustituye la ACF por la autocorrelacion de los datos elevados al cuadrado, ρY 2(h)

Q = n(n + 2)

h∑

k=1

ρ2Y 2(k)/(n − k) .

• La hipotesis de datos IID con distribucion normal se rechaza para un nivel α si el valor

obtenido de Q es mayor que el cuantil (1 − α) de la distribucion χ2(h).

F. Gonzalez 23

Page 25: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Punto de cambio

Sea y1, . . . , yn una secuencia de datos,

• Si yi−1 < yi e yi > yi+1, o si yi−1 > yi e yi < yi+1, punto de cambio en el instante i.

C : numero de puntos de cambio

Para secuencias IID,

µC = E(C) =2

3(n − 2) σ2

C = V ar(C) = (16n − 29)/90.

Puede rechazarse la hipotesis IID si

|C − µC|/σC > Φ1−α/2

• Φ1−α/2: cuantil (1 − α/2) de una distribucion normal (si α = 0,05, Φ1−α/2 = 1,96).

Simplificacion.

• S: numero de puntos donde se verifica

yi > yi−1, i = 2, . . . , n.

• S ∼ N(µS, σ2S)

µS =1

2(n − 1) σ2

S = (n + 1)/12

F. Gonzalez 24

Page 26: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Prueba del Orden

Prueba util para detectar tendencias lineales en los datos.

Si {Y1, . . . , Yn}: secuencia IID y

P : numero de pares de puntos (i, j) en los que se verifica

yi < yj, con i < j e i = 1, . . . , n − 1

• El numero de pares (i, j) que verifican i < j es(

n

2

)

=1

2n(n − 1)

• El evento {Yi < Yj} tiene probabilidad1

2.

• Por tanto,

µP =1

4n(n − 1) σ2

P = n(n − 1)(2n + 5)/8

Para un numero de muestras suficientemente grande,

P ∼ N(µP , σ2P )

Por consiguiente, los tests para rechazar la hipotesis de secuencia IID son nuevamente

aplicables.

F. Gonzalez 25

Page 27: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Ejemplo

En este ejemplo se considera la serie temporal

Xt = cos(t) + Nt, t = 0,1, 0,2, . . . , 20

donde Nt es una proceso aleatorio normal, de media 0 y varianza 0.25.

Muestras de la serie

0 2 4 6 8 10 12 14 16 18 20−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

2.5

3

En el analisis se desconoce el modelo con el que se han generado.

• Primera hipotesis: secuencia IID.

F. Gonzalez 26

Page 28: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Ejemplo. Pruebas a realizar

1. Funcion de autocorrelacion muestral del residuo. Se muestran los margenes ±1,96/√

n.

0 5 10 15 20 25 30 35 40

−0.2

0

0.2

0.4

0.6

0.8

1

Muestras

AC

F

Mas del 20 % de las muestras superan el umbral ±1,96/√

n

Conclusion: rechazo test IID.

F. Gonzalez 27

Page 29: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

2. Analisis estadıstico.

Q = n

h∑

j=1

ρ2(j) . (13)

Para h = 20, Q superior al cuantil 0.95 (α = 0,05) de la distribucion chi-cuadrado

Q = 48,6 > χ21−α(20) = 31,4

3. Densidad de puntos de cambio.

C = 137

Distribucion asintotica (para n = 200): N(132, 35,3),

|C − µC|/σC = 0,84 < Φ1−α/2 = 1,96.

Conclusion: no existen suficientes evidencias para rechazar la hipotesis IID.

4. Recuento numero de puntos, S, en los que xi > xi−1, i = 2, . . . , 200.

S = 99

|S − µS|/σS = 0,12 < Φ1−α/2 = 1,96

Conclusion: no existen suficientes evidencias para rechazar la hipotesis IID.

5. Prueba del Orden.

F. Gonzalez 28

Page 30: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

P = 10,134

Distribucion asintotica: N(9950, 2,015 × 104).

|P − µP |/σP = 0,1296 < Φ1−α/2 = 1,96

Conclusion: no se puede rechazar la hipotesis IID.

Pruebas (1) y (2) ofrecen rotundos resultados: debe rechazarse la hipotesis IID.

F. Gonzalez 29

Page 31: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

Gaussianidad

Y1, . . . , Yn: muestras de N(µ, σ2)

Y(1), . . . , Y(n), muestras ordenadas.

Y(1) < Y(2) < · · · < Y(n)

Proceso normalizado N(0, 1)

X(1) < X(2) < · · · < X(n)

Transformacion lineal X(j) → Y(j)

E(Y(j)) = µ + σmj

con mj = E(X(j))

Por tanto, el grafo (q-q plot) de los puntos(

m1, Y(1)

)

, . . . ,(

mn, Y(n)

)

F. Gonzalez 30

Page 32: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

• Si gaussiano: lineal.

R2 =E

(

miY(i)

)2

E (mi)2 E

(

Y(i)

)2 → 1

• En otro caso: no lineal.

Si aproximamos mi por Φ−1((i − 0,5)/n)

• Coeficiente de correlacion

R2 =

(

∑ni=1

(

Y(i) − Y)

Φ−1

(

i − 0,5

n

))2

∑ni=1

(

Y(i) − Y)2 ∑n

i=1

(

Φ−1

(

i − 0,5

n

))2

• Para n = 200, Pr(R2 < 0,987) = 0,05

F. Gonzalez 31

Page 33: PREDICCION DE SENALES~ M eto dos de descomposici on

Prediccion de senales: Metodos de descomposicion

−2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5−2.5

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

Standard Normal Quantiles

Qua

ntile

s of

Inpu

t Sam

ple

QQ Plot of Sample Data versus Standard Normal

F. Gonzalez 32