introducción al análisis clásico de series de tiempo
TRANSCRIPT
Introducción al Análisis Clásico de Series de Tiempo
© Citar como: Arellano, M. (2001): "Introducción al Análisis Clásico de Series de Tiempo", [en línea] 5campus.com, Estadística <http://www.5campus.com/leccion/seriest> [y añadir fecha consulta]
1. Conceptos Basicos De Series De Tiempo
1.1 Introducción
1.2 Definición De Serie De Tiempo
1.3 Primer Paso Al Analizar Cualquier Serie De Tiempo
2. Modelos Clasicos De Series De Tiempo
2.1 Modelos De Descomposición
2.2 Estimación De La Tendencia
2.3 Estimación De La Estacionalidad
3. Predicciones
3.1 Ejemplo Ilustrativo
1. CONCEPTOS BASICOS DE SERIES DE TIEMPO1.1 INTRODUCCIÓN Toda institución, ya sea la familia, la empresa o el gobierno, tiene que hacer planes para el futuro si ha de sobrevivir y progresar. Hoy en día diversas instituciones requieren conocer el comportamiento futuro de ciertos fenómenos con el fin de planificar, prever o prevenir. La planificación racional exige prever los sucesos del futuro que probablemente vayan a ocurrir. La previsión, a su vez, se suele basar en lo que ha ocurrido en el pasado. Se tiene pues un nuevo tipo de inferencia estadística que se hace acerca del futuro de alguna variable o compuesto de variables basándose en sucesos pasados. La técnica más importante para hacer inferencias sobre el futuro con base en lo ocurrido en el pasado, es el análisis de series de tiempo. Son innumerables las aplicaciones que se pueden citar, en distintas áreas del conocimiento, tales como, en economía, física, geofísica, química, electricidad, en demografía, en marketing, en telecomunicaciones, en transporte, etc.
Series De Tiempo Ejemplos 1. Series económicas:
- Precios de un artículo- Tasas de desempleo- Tasa de inflación- Índice de precios, etc.
2. Series Físicas:
- Meteorología- Cantidad de agua caída- Temperatura máxima diaria- Velocidad del viento (energía eólica)- Energía solar, etc.
3. Geofísica:
- Series sismologías
4. Series demográficas:
- Tasas de crecimiento de la población- Tasa de natalidad, mortalidad- Resultados de censos poblacionales
5. Series de marketing:
- Series de demanda, gastos, ofertas
6. Series de telecomunicación:
- Análisis de señales
7. Series de transporte:
- Series de tráfico
Uno de los problemas que intenta resolver las series de tiempo es el de predicción. Esto es dado una serie {x(t1),...,x(tn)} nuestros objetivos de interés son describir el comportamiento de la serie, investigar el mecanismo generador de la serie temporal, buscar posibles patrones temporales que permitan sobrepasar la incertidumbre del futuro. En adelante se estudiará como construir un modelo para explicar la estructura y prever la evolución de una variable que observamos a lo largo del tiempo. La variables de interés puede ser macroeconómica (índice de precios al consumo, demanda de
electricidad, series de exportaciones o importaciones, etc.), microeconómica (ventas de una empresa, existencias en un almacén, gastos en publicidad de un sector), física (velocidad del viento en una central eólica, temperatura en un proceso, caudal de un río, concentración en la atmósfera de un agente contaminante), o social (número de nacimientos, matrimonios, defunciones, o votos a un partido político). 1.2 DEFINICIÓN DE SERIE DE TIEMPO En muchas áreas del conocimiento las observaciones de interés son obtenidas en instantes sucesivos del tiempo, por ejemplo, a cada hora, durante 24 horas, mensuales, trimestrales, semestrales o bien registradas por algún equipo en forma continua. Llamamos Serie de Tiempo a un conjunto de mediciones de cierto fenómeno o experimento registradas secuencialmente en el tiempo. Estas observaciones serán denotadas por {x(t1), x(t2), ..., x(tn)} = {x(t) : t Î T Í R} con x(ti) el valor de la variable x en el instante ti. Si T = Z se dece que la serie de tiempo es discreta y si T = R se dice que la serie de tiempo es continua. Cuando ti+1 - ti = k para todo i = 1,...,n-1, se dice que la serie es equiespaciada, en caso contrario será no equiespaciada. En adelante se trabajará con series de tiempo discreta, equiespaciadas en cuyo caso asumiremos y sin perdida de generalidad que: {x(t1), x(t2), ..., x(tn)}= {x(1), x(2), ..., x(n)}. 1.3 PRIMER PASO AL ANALIZAR CUALQUIER SERIE DE TIEMPO El primer paso en el análisis de series de tiempo, consiste en graficar la serie. Esto nos permite detectar las componentes esenciales de la serie. El gráfico de la serie permitirá: a) Detectar Outlier: se refiere a puntos de la serie que se escapan de lo normal. Un outliers es una observación de la serie que corresponde a un comportamiento anormal del fenómeno (sin incidencias futuras) o a un error de medición. Se debe determinar desde fuera si un punto dado es outlier o no. Si se concluye que lo es, se debe omitir o reemplazar por otro valor antes de analizar la serie. Por ejemplo, en un estudio de la producción diaria en una fabrica se presentó la siguiente situación ver figura 1.1:
Figura 1.1Los dos puntos enmarcados en un círculo parecen corresponder a un comportamiento anormal de la serie. Al investigar estos dos puntos se vio que correspondían a dos días
de paro, lo que naturalmente afectó la producción en esos días. El problema fue solucionado eliminando las observaciones e interpolando. b) Permite detectar tendencia: la tendencia representa el comportamiento predominante de la serie. Esta puede ser definida vagamente como el cambio de la media a lo largo de un periodo (ver figura 1.2).
Figura 1.2 c) Variación estacional: la variación estacional representa un movimiento periódico de la serie de tiempo. La duración de la unidad del periodo es generalmente menor que un año. Puede ser un trimestre, un mes o un día, etc (ver figura 1.3). Matemáticamente, podemos decir que la serie representa variación estacional si existe un número s tal que x(t) = x(t + k×s). Las principales fuerzas que causan una variación estacional son las condiciones del tiempo, como por ejemplo:
1) en invierno las ventas de helado2) en verano la venta de lana3) exportación de fruta en marzo.
Todos estos fenómenos presentan un comportamiento estacional (anual, semanal, etc.)
Figura 1.3 d) Variaciones irregulares (componente aleatoria): los movimientos irregulares (al azar) representan todos los tipos de movimientos de una serie de tiempo que no sea tendencia, variaciones estacionales y fluctuaciones cíclicas.
2. MODELOS CLASICOS DE SERIES DE TIEMPO2.1 MODELOS DE DESCOMPOSICIÓN Un modelo clásico para una serie de tiempo, supone que una serie x(1), ..., x(n) puede ser expresada como suma o producto de tres componentes: tendencia, estacionalidad y un término de error aleatorio. Existen tres modelos de series de tiempos, que generalmente se aceptan como buenas aproximaciones a las verdaderas relaciones, entre los componentes de los datos observados. Estos son: 1. Aditivo: X(t) = T(t) + E(t) + A(t) 2. Multiplicativo: X(t) = T(t) · E(t) · A(t) 3. Mixto: X(t) = T(t) · E(t) + A(t) Donde:
X(t) serie observada en instante t
T(t) componente de tendenciaE(t) componente estacionalA(t) componente aleatoria (accidental)
Una suposición usual es que A(t) sea una componente aleatoria o ruido blanco con media cero y varianza constante. Un modelo aditivo (1), es adecuado, por ejemplo, cuando E(t) no depende de otras componentes, como T(t), sí por el contrario la estacionalidad varía con la tendencia, el modelo más adecuado es un modelo multiplicativo (2). Es claro que el modelo 2 puede ser transformado en aditivo, tomando logaritmos. El problema que se presenta, es modelar adecuadamente las componentes de la serie. La figura 2.1 ilustra posibles patrones que podrían seguir series representadas por los modelos (1), (2) y (3).
Figura 2.1 2.2 ESTIMACIÓN DE LA TENDENCIA Supondremos aquí que la componente estacional E(t) no está presente y que el modelo aditivo es adecuado, esto es:
X(t) = T(t) + A(t), donde A(t) es ruido blanco.
Hay varios métodos para estimar T(t). Los más utilizados consisten en: 1) 1) Ajustar una función del tiempo, como un polinomio, una exponencial u otra
función suave de t.2) 2) Suavizar (o filtrar) los valores de la serie.3) 3) Utilizar diferencias. 2.2.1 AJUSTE DE UNA FUNCIÓN Los siguientes gráficos ilustran algunas de las formas de estas curvas. 1.T(t) = a + bt (Lineal)
2.T(t) = a ebt (Exponencial)
3. T(t) = a + b ebt
(Exponencial modificada)
4.T(t) = b0 + b1t ,...,+ bmt
m
(Polinomial)
5.T(t) = exp(a + b(rt))(Gompertz 0 < r < 1)
6. T(t) = 10,
)(
1
r
rba t
(Logística)
Nota:
i. i. la curva de tendencia debe cubrir un periodo relativamente largo para ser una buena representación de la tendencia a largo plazo.
ii. ii. La tendencia rectilínea y exponencial son aplicable a corto plazo, puesto que una curva S a largo plazo puede parecer una recta en un período restringido de tiempo (por ejemplo).
Figura 2.2 En la figura 2.2 ambas curvas (recta y Gompertz) ajustan bien pero las proyecciones divergen enormemente a largo plazo. Ejemplo 1: En la tabla 2.1 se presentan los datos trimestrales de unidades habitacionales iniciadas en los Estados Unidos desde el tercer trimestre de 1964 hasta el segundo trimestre de 1972 [1]. (Es necesario advertir que para el análisis de tendencia el periodo que se considera debería ser más largo. Sin embargo, ya que el propósito principal es el de ilustrar el método de descomposición y las técnicas para inferir partiendo de los elementos así descompuestos, la insuficiencia de los datos no tiene por qué interesar.) Tabla 2.1: Nuevas unidades habitacionales comenzadas en los Estados Unidos del tercer trimestre de 1964 al segundo trimestre de 1972 (en miles de unidades).
Año I II III IV Total Anual1964 398 352 1965 283 454 392 345 1,4741966 274 392 290 210 1,1661967 218 382 382 340 1,3221968 298 452 423 372 1,5451969 336 468 387 309 1,5001970 264 399 408 396 1,4671971 389 604 579 513 2,0851972 510 661
Fuente: U.S. Department of Comerse, Survey of Current Bussiness. Sea t cada uno de los 32 trimestres que van de 1964 a 1972, o sea que t = 1 para el tercer trimestre de 1964, t = 2 para el cuarto trimestre, y así sucesivamente. Así que el dominio de definición de t es el conjunto de los enteros de 1 a 32 inclusive. Sea T(t) las iniciaciones de viviendas trimestralmente. Los valores de t y T(t) se dan en la tabla 2.2. Para calcular los valores de a y de b en la recta de tendencia
T(t) = a + bt Se obtienen las siguientes cifras a partir de los datos de la tabla 2.1.Tabla 2.2: Cálculo de la tendencia de las viviendas comenzadas en los Estados Unidos del tercer trimestre de 1964 al segundo trimestre de 1972
Año trimestre t T(t) Tendencia1964: 3 1 398 291,73
4 2 352 298,071965: 1 3 283 304,41
2 4 454 310,753 5 392 317,094 6 345 323,43
1966: 1 7 274 329,772 8 392 336,113 9 290 342,454 10 210 348,79
1967: 1 11 218 355,13
2 12 382 361,473 13 382 367,814 14 340 374,15
1968: 1 15 298 380,492 16 452 386,833 17 423 393,174 18 372 399,51
1969: 1 19 336 405,852 20 468 412,193 21 387 418,534 22 309 424,87
1970: 1 23 264 431,212 24 399 437,553 25 408 443,894 26 396 450,23
1971: 1 27 389 456,572 28 604 462,913 29 579 469,254 30 513 475,59
1972: 1 31 510 481,932 32 661 488,27
Entonces, la recta de tendencia es
T(t) = 285,39 + 6,34× t La figura 2.3 muestra gráficamente la recta de tendencia ajustada a los datos trimestrales de la tabla 2.2. La recta de trazos después de 1972 representa proyecciones (ver sección 3 Predicciones).
Figura 2.3 2.2.2 SUAVIZAMIENTO. FILTROS LINEALES
Una forma de visualizar la tendencia, es mediante suavizamiento de la serie. La idea central es definir a partir de la serie observada un nueva serie que suaviza los efectos ajenos a la tendencia (estacionalidad, efectos aleatorios), de manera que podamos determinar la dirección de la tendencia (ver figura 2.4).
Figura 2.4
Lo que hacemos es usar una expresión lineal que transforma la serie X(t) en una serie suavizada Z(t): Z(t) = F(X(t)), t = 1,...,n
X(t) Z(t)
de tal modo que F(X(t)) = T(t). La función F se denomina Filtro Lineal. El filtro lineal más usado es el promedio móvil. 2.2.2.1 PROMEDIOS MÓVILES El objetivo es eliminar de la serie las componentes estacionales y accidentales. Para una serie mensual con estacionalidad anual (s = 12), la serie suavizada se obtiene,
67,12
)6()5()5()6()( 2
12
1
nkkZkZkZkZ
kZ
(1) Para una serie trimestral, con estacionalidad anual (s = 4), la serie suavizada está dada por
23,4
)2()1()()1()2()( 2
12
1
nkkZkZkZkZkZ
kZ(2)
A este procedimiento se les llama: filtro simétrico finito. Nota: se suaviza cuando existen muchos cambios bruscos, movimientos irregulares. Ejemplo 2: A partir de los datos del ejemplo1, se calcula un promedio móvil sumando los valores para un cierto número de periodos sucesivos y dividiendo luego la suma así obtenida por el número de períodos abarcados. En este caso se trata de una serie trimestral y para ello se ocupa la fórmula (2).
F
Tabla 2.3: Cálculo del Promedio Móvil centrado de cuatro trimestres de las iniciaciones de viviendas en los EEUU, tercer trimestre 1964 a segundo trimestre de 1972 (en miles de unidades)
Año por trimestre
Datos Originales Y
Total Móvil en cuatro trimestres
Promedio Móvil de cuatro trimestres
Promedio Móvil Centrado de cuatro trimestres
(1) (2) (3) (4) (5)
1964: 3 398 4 352
1965: 1 283 1.487 372 3712 454 1.481 370 3693 392 1.474 369 3674 345 1.465 366 359
1966: 1 274 1.403 351 3382 392 1.301 325 3083 290 1.166 292 2854 210 1.110 278 276
1967: 1 218 1.100 275 2872 382 1.192 298 3143 382 1.322 331 3414 340 1.402 351 359
1968: 1 298 1.472 368 3732 452 1.513 378 3823 423 1.545 386 3914 372 1.583 396 398
1969: 1 336 1.599 400 3952 468 1.563 391 3833 387 1.500 375 3664 309 1.428 357 348
1970: 1 264 1.359 340 3422 399 1.380 345 3563 408 1.467 367 3824 396 1.592 398 424
1971: 1 389 1.797 449 4712 604 1.968 492 5073 579 2.085 521 5364 513 2.206 552 559
1972: 1 510 2.263 566 2 661
En la tabla 2.3, por ejemplo, el promedio móvil de cuatro trimestres para el primer trimestre de 1965 se obtiene sumando los valores del tercer y cuarto trimestres de 1964 y el primero y segundo trimestres de 1965 y dividiendo luego la suma por 4. El promedio para el segundo trimestre de 1965 se obtiene sumando los valores del cuarto trimestre de 1964 con los del primero, segundo y tercer trimestres de 1965 y luego dividiendo la suma por 4. Así pues, para cada promedio sucesivo, se resta el trimestre que viene primero y se suma el último siguiente. La columna 4 de la tabla 2.3 muestra los promedios móviles de cuatro trimestres obtenidos, partiendo de los datos iniciaciones de viviendas para el 1964 a 1972. El promedio móvil no elimina las fluctuaciones muy acentuadas de la serie, pero reduce sustancialmente la amplitud de las variaciones de los datos originales.
Si en el cálculo de un promedio móvil entra un número impar de períodos, el proceso será más sencillo puesto que el número de períodos antes y después del período para el cual se calcula el promedio son iguales. Si el número de periodos es par, como en este ejemplo, no se puede utilizar el mismo número de períodos antes y después de un periodo especificado. Por tanto, el promedio móvil ha de quedar a mitad de camino entre los valores de dos períodos consecutivos y no se relaciona con ningún período. Este problema se puede resolver calculando un promedio móvil centrado en la serie, lo cual se logra obteniendo primero un promedio móvil centrado de dos trimestres de los promedios móviles ya obtenidos. El primer promedio móvil centrado es la media de los dos primeros promedios móviles de cuatro trimestres, el segundo promedio móvil centrado es la media de los promedios móviles de cuatro trimestres segundo y tercero, etc. De esta manera, habrá un número igual de períodos después y antes del periodo especificado para el cual se está calculando el promedio móvil centrado. Los promedios móviles centrados se ven en la columna 5 de la tabla 2.3.
)2(*4
392)454283352(*2398)3(
2)3( 4
3924542833524
454283352398
Z
Z
Según la fórmula 2, el cálculo sería el siguiente:
3714
454283352)3(
4
)5()4()3()2()1()3(
2392
2398
21
21
Z
ZZZZZZ
Este valor corresponde al Promedio Móvil Centrado que se muestra en la columna 5. La figura 2.5 muestra gráficamente el ajuste por a través del promedio móvil, según tabla 2.3, donde el segmento negro representa la serie original y el segmento azul la serie suavizada.
Figura 2.5 2.3 ESTIMACIÓN DE LA ESTACIONALIDAD La estimación de la estacionalidad no sólo se realiza con el fin de incorporarla al modelo para obtener predicciones, sino también con el fin de eliminarla de la serie para visualizar otras componentes como tendencia y componente irregular que se pueden confundir en las fluctuaciones estacionales. De acuerdo con los modelos de descomposición (sección 2.1), se asume el siguiente modelo para T(t),
a) )()()()( tAtEtTtX Aditivo
b)
accidentalEstacional
tT
tAtE
tT
tX
.
)(
)()(
)(
)(
Mixto Una vez removida la tendencia se obtiene los siguientes gráficos, donde en la figura 2.6 (a) aparece el modelo aditivo y en la (b) el modelo mixto.
(a) (b)
Figura 2.6 Pues si no hay tendencia, se espera
1)(,
0)(,
tTt
tEt
Como )24()12()( tEtEtE para serie mensual, entonces basta estimar E(1), E(2), E(3), ... , E(12). Para una serie trimestral, bastaría conocer: E(1), E(2), E(3) y E(4). Suponga que se ha estimado la tendencia por alguno de los métodos vistos en la sección
previa. Sea )(ˆ tT la estimación de la tendencia ya sea mediante una curva o filtros lineales. Entonces,
Si el modelo es aditivo nttTtXtR ,...,1),(ˆ)()( representa la serie con los efectos de tendencia removidos.
Análogamente, si el modelo es mixto )(ˆ)(
)(tT
tXtW
representa la serie, una vez removidos los efectos de tendencia.
Estas series generadas a partir de la original por eliminación de la tendencia se denominan “series de residuos” y deberán contener predominantemente fluctuaciones estacionales. Para estimar la estacionalidad se requiere haber decidido el modelo a utilizar (mixto o aditivo), lamentablemente esto no es siempre claro, ya sea porque no contamos con información a priori para suponerlo o porque el gráfico no ha dejado evidencia suficientemente clara como para decidirnos por alguno de ellos. En tal situación se propone calcular ambas series residuales y elegir aquella cuyos valores correspondientes a una estación dada oscilen menos en torno a su promedio. Para fijar ideas, supongamos una serie con datos trimestrales y que la información de las series residuales pueden ser resumidas como en las tablas 2.4 y 2.5. Tabla 2.4. Residuos modelo Mixto
Período 1 2 K Promedio STD C.V.Estación Fila Fila Fila
1 W(1) W(5) W(4k-3) )1(W S1)1(
1W
S
2 W(2) W(6) W(4k-2) )2(W S2)2(
2W
S
3 W(3) W(7) W(4k-1) )3(W S3)3(
2W
S
4 W(4) W(8) W(4k) )4(W S4)4(
4W
S
Tabla 2.5. Residuos modelo Aditivo
Período 1 2 K Promedio STD C.V.Estación Fila Fila Fila
1 R(1) R(5) R(4k-3) )1(R S1)1(
1R
S
2 R(2) R(6) R(4k-2) )2(R S2)2(
2R
S
3 R(3) R(7) R(4k-1) )3(R S3)3(
2R
S
4 R(4) R(8) R(4k) )4(R S4)4(
4R
S
Una forma de seleccionar el modelo, es por inspección de los coeficientes de variación (C.V.). Suponemos, que en aquellas filas donde la variación sea menor en torno a la media tendrá menor coeficiente de variación en términos absolutos. Luego, comparando dichos coeficientes parece razonable seleccionar el modelo cuyos coeficientes sean menores en términos absolutos. Esto puede complementarse con gráficos para cada fila en ambos modelos. Finalmente, una vez que se ha elegido el modelo a utilizar, se procede a estimar la estacionalidad. Si el modelo es Mixto, entonces,
)1()1()1(ˆ WWE
)1()2()2(ˆ WWE
)1()3()3(ˆ WWE
)1()4()4(ˆ WWE
donde:
4
1 4
)(
h
hWW
y si el modelo es Aditivo, entonces,
RRE )1()1(ˆ
RRE )2()2(ˆ
RRE )3()3(ˆ
RRE )4()4(ˆ
donde
4
1 4
)(
h
hRR
Probablemente, la primera idea para estimar la estacionalidad consistiría de los promedios por estación en las series residuales. La corrección que aparece arriba para cada caso, apunta a garantizar que,
AditivoModelonES
n
1
,0)(ˆ
MixtoModelonES
n
1
,1)(ˆ
como es de esperarse en el modelo teórico. Ejemplo 3. Continuando con el ejemplo 2, tenemos lo siguiente:
Se supuso que el Modelo es Mixto )(ˆ)(
)(tT
tXtW
y se obtuvo la serie suavizada Z(t):
Trimestre 1965 1966 1967 1968 1969 1970 19711 371 338 286,5 373,125 395,25 342,375 470,6252 369 308,375 314,25 382,25 382,875 355,875 506,6253 367 284,5 340,5 391 366 382,375 536,3754 359 276,25 359,25 397,75 348,375 423,625 558,625
Sea )(ˆ tT la estimación de la tendencia (2*594386,0*3984,1163,379)(ˆ tttT )
Trimestre 1965 1966 1967 1968 1969 1970 1971
1 368,83 337,50 325,19 331,90 357,63 402,39 466,162 359,21 332,64 325,09 336,55 367,04 416,55 485,083 350,78 328,97 326,48 342,39 377,63 431,90 505,184 343,55 326,48 328,44 349,42 389,42 448,44 526,47
Entonces, )(ˆ)(
)(tT
tXtW
, donde X(t) es la serie observada.Trimestre 1965 1966 1967 1968 1969 1970 1971 )(hW
1 0,77 0,81 0,67 0,9 0,94 0,66 0,83 0,802 1,26 1,18 1,18 1,34 1,28 0,96 1,25 1,213 1,12 0,88 1,17 1,24 1,02 0,94 1,15 1,074 1 0,64 1,04 1,06 0,79 0,88 0,97 0,91 W = 0,9975
)(hW = promedio de W(t) para el trimestre h, h = 1, 2, 3, 4.
)(ˆ)( accidental parte la removido ha Se
91,0)4(
07,1)3(
21,1)2(
8,0)1(
tT
tA
W
W
W
W
y 9975,0
4
)(4
1
h
hWW
Como se observa en la siguiente figura, en el modelo mixto estos valores varían entorno al uno.
0
0,5
1
1,5
2
0 5 10 15 20 25 30t
W(t)
Si el modelo es Mixto, entonces,
)1()1()1(ˆ WWE = 0,8 – (0,9975 - 1) = 0,8025)1()2()2(ˆ WWE = 1,21 – (0,9975 – 1) = 1,2125)1()3()3(ˆ WWE = 1,07 – (0,9975 – 1) = 1,0725)1()4()4(ˆ WWE = 0,91 – (0,9975 – 1) = 0,9125
La idea es que
4
1
14
)(ˆ
h
hE
En definitiva, la estimación de la estacionalidad es,
9125,0)4(ˆ
0725,1)3(ˆ
2125,1)2(ˆ
8025,0)1(ˆ
E
E
E
E
3. PREDICCIONES Predecir, es estimar el futuro utilizando información del presente y del pasado. El conocimiento del futuro nos capacita para planificar, prever o prevenir. La idea es estimar X(t) en un instante n + k posterior al último dato observado en t =n, k = 1,2,3,4,... (trimestre, mes, etc.). Una vez estimada la tendencia y la estacionalidad las fórmulas de predicción quedarán determinadas por:
)mod)((ˆ)(ˆ)(ˆ),(ˆ sknEknTknXknX Modelo Mixto)mod)((ˆ)(ˆ)(ˆ),(ˆ sknEknTknXknX Modelo Aditivo
3.1 EJEMPLO ILUSTRATIVO Con el objeto de ilustrar los métodos revisados en este capítulo considere los siguientes datos: Tabla 3.1. Serie OriginalSEM/AÑO 1 2 3 4 5 6
1 1,73757 2,42106 4,47481 4,78939 5,19210 5,107752 2,01815 2,80325 4,85566 5,14076 5,06387 5,24787 Con el fin de eliminar los efectos irregulares y estacionalidad se obtiene la serie suavizada Z(t) con un promedio móvil centrado de orden 2, como se muestra en la tabla 3.2. Tabla 3.2. Serie Suavizada (Z(t))SEM/AÑO 1 2 3 4 5 6
1 - 2,41589 4,15214 4,89381 5,14721 5,121812 2,04874 3,1256 4,74389 5,06576 5,1069 - Una vez suavizada la serie, se obtienen las series residuales con el objeto de eliminar la estacionalidad dentro del modelo y saber por medio de un análisis tabular de los residuos si el modelo es aditivo o mixto. PRIMER CASO: Modelo Mixto. X(t) = T(t) · E(t) + A(t) Con el objeto de eliminar la estacionalidad de la serie, se genera la serie de residuos:
)(
)()(
tZ
tXtW
La siguiente tabla contiene los residuos. Tabla 3.3. Serie de Residuos (W(t))
Sem/Año 1 2 3 4 5 6 )(hW SW CV
1 - 1,00214 1,07771 0,97866 1,00872 0,9953 1,01251 0,03813 0,027662 0,98507 0,89687 1,02356 1,0148 0,99157 - 0,98237 0,05037 0,05127 La estimación de la estacionalidad para este caso queda dada por:
99744,0W
)1()()(ˆ WhWhE
)1()1()1(ˆ WWE = 1,01251– (0,99744- 1) = 1,01251 + 0,00256 = 1,01507)1()2()2(ˆ WWE = 0,98237 + 0,00256 = 0,98493
SEGUNDO CASO: Modelo Aditivo. X(t) = T(t) + E(t) + A(t) Como en el caso anterior y con el objeto de eliminar la estacionalidad se construye la serie de residuos. R(t) = X(t) - Z(t) Los resultados se muestran en Tabla 3.4. Tabla 3.4. Serie de Residuos (R(t))Sem/Año 1 2 3 4 5 6 )(hR SR CV
1 - 0,00517 0,32267 -0,10442 0,04489 -0,02406 0,04885 0,16256 3,3278
2 -0,03059 0,32235 0,11177 0,075 -0,04303 - -0,04184 0,17034 -4,0712
La estimación de la estacionalidad para este caso queda dada por:
RRE )1()1(ˆ = 0,04885 - 0,0351 = 0,04534
RRE )2()2(ˆ= 0,004184 - 0,00351 = 0,04534
El cálculo de las series residuales se realizó con el objeto de identificar a través de los coeficientes de variación para cada fila de los modelos; aquel modelo que sus filas presenten una menor variabilidad relativa a su media, será escogido como el que interpreta a la serie a analizar. En este caso el modelo adoptado, es el modelo mixto. A través de este modelo se obtendrán las proyecciones deseadas para los próximos dos semestres. Para tal efecto resta entonces obtener una estimación de la tendencia. Con tal fin, se ajustará una curva a la serie suavizada.
Z(t) = a + bt Al ajustar la recta por mínimos cuadrados se obtiene:
3611,0ˆy836,1ˆ baYt = 0,442966 + 0,938027*t - 4,56E-02*t**2 Una vez obtenidas estas estimaciones se utiliza la ecuación
)mod)((ˆ)(ˆ)(ˆ sknEknTknX para proyectar.
Proyecciones
6,6)13(ˆ
01507,1)13*3611,0836,1()13(ˆ
X
X
8,6)14(ˆ
98493,0)14*3611,0836,1()14(ˆ
X
X
Resumen Se llama Serie de Tiempo, a un conjunto de mediciones de cierto fenómeno o experimento registradas secuencialmente en el tiempo, por ejemplo a cada hora, mensualmente, trimestralmente, semestralmente, etc.. En este apunte se trabajó con series de tiempo discreto, equiespaciadas en cuyo caso se asume que: : {x(t1), x(t2), ..., x(tn)}= {x(1), x(2), ..., x(n)}. Debido al carácter introductorio se restringió al caso de series de tiempo univariadas. Al analizar una serie de tiempo, lo primero que se debe hacer es graficar la serie. Esto nos permite detectar las componentes esenciales de la serie. El gráfico de la serie permitirá: detectar Outlier, detectar tendencias, variación estacional, variaciones irregulares (o componente aleatoria). Un modelo clásico para una serie de tiempo, puede ser expresada como suma o producto de tres componentes: tendencia, estacional y un término de error aleatorio. Existen tres modelos de series de tiempos. Estos son:
1. Aditivo: X(t) = T(t) + E(t) + A(t) 2. Multiplicativo: X(t) = T(t) · E(t) · A(t) 3. Mixto: X(t) = T(t) · E(t) + A(t)
Con el fin de obtener un modelo, es necesario estimar la tendencia y la estacionalidad. Para estimar la tendencia, se supone que la componente estacional no está presente. La estimación se logra al ajustar a una función de tiempo a un polinomio o suavizamiento de la serie a través de los promedios móviles. Para estimar la estacionalidad se requiere haber decidido el modelo a utilizar (mixto o aditivo). Una vez estimada la tendencia y la estacionalidad se esta en condiciones de predecir. Los métodos revisados en este apunte son de naturaleza descriptiva, por lo que el juicio y el conocimiento del fenómeno juegan un rol importante en la selección del modelo. Los métodos clásicos tienen la desventaja que se adaptan a través del tiempo, lo que implica que el proceso de estimación debe volver a iniciarse frente al conocimiento de un nuevo dato.
Bibliografía
[1] [1] Chao, Lincoln L. (1975) Estadística para ciencias sociales y administrativas. Bogota: McGraw-Hill.
[2] [2] Iglesias Z. Pilar. (1988). Elementos de series de tiempo.[3] [3] Makridakis, S; Wheelright, S.C.; McGee, V.E. (1983). Forecasting:
Methods and Applications. Wiley, New York. [4] [4] Peña, Daniel. (1989). Estadística, Modelos y Métodos 2. Modelos Lineales
y Series Temporales. Alianza Universidad, Madrid. Enlaces
Einsteinnet (2001). Análisis Clásico De Series Temporales. [en línea]. Disponible en: http://www.einsteinnet.com/econometria/seriestemp/acseriestemp.htm Conectado el 25 de junio de 2001.
INEI.(2001). Desestacionalización de series de tiempo económicas. [en línea]. Disponible en: www.inei.gob.pe/cpi/bancopub/libfree/LIB408/LIB408.htm Conectado el 26 de junio de 2001.
2222222222222222222222222
CURSO : INVESTIGACIÓN DE OPERACIONES
CAT.: MSc. EDGAR N. CARRERA
PRONÓSTICOS
Introducción
El pronóstico es un proceso de estimación de un acontecimiento o
fenómeno, regularmente económico en el cual se involucra el tiempo,
proyectando hacia el futuro datos del pasado, para realizar una
estimación cuantitativa del comportamiento del fenómeno estudiado
hacia el futuro.
La predicción, previsión o adivinación, es un proceso de estimación de
un suceso futuro basándose en consideraciones subjetivas diferentes
a los simples datos provenientes del pasado; estas consideraciones
subjetivas no necesariamente deben combinarse de una manera
predeterminada. Es decir, cuando se base en suposiciones subjetivas
y no existen datos del pasado, se requiere una predicción, y de lo
contrario, se necesita un pronóstico.
Los pronósticos son la base de la planificación corporativa a largo
plazo. El personal de producción y de operación utiliza pronósticos
para tomar decisiones periódicas con respecto a la selección de
procesos, a la planificación de la capacidad, a la planificación de la
producción, a la programación de actividades y al inventario.
Tipos de pronósticos
Los pronósticos se pueden clasificar en cuatro tipos básicos:
cualitativos, análisis de series de tiempo o cuantitativos, relaciones
causales y simulación.
Las técnicas cualitativas son de carácter subjetivo y se basan en
estimaciones y opiniones.
El análisis de series de tiempo se basa en la idea de que se
pueden usar los datos relacionados con la demanda del pasado para
realizar pronósticos.
Los pronósticos causales suponen que la demanda esta
relacionada con uno o más factores subyacentes del ambiente.
Los modelos de simulación permiten al pronosticador recorrer una
gama de suposiciones sobre la condición del pronóstico.
Modelos comunes para pronósticos cuantitativos
Promedio Móvil Simple Se promedia un periodo que contiene varios
puntos de datos, dividiendo la suma de los valores de los puntos
entre el número de puntos. Así, cada punto tiene la misma influencia.
Promedio Móvil Ponderado Ciertos puntos se ponderan más o menos
que otros, según se considere conveniente de acuerdo con la
experiencia.
Suavizamiento o suavización Exponencial Los puntos de datos más
recientes tienen mayor peso; este peso se reduce exponencialmente
cuanto más antiguos son los datos.
Análisis de Regresiones Ajusta una línea recta a datos pasados, por lo
general relacionando el valor del dato con el tiempo. El método de
ajuste más común es el de mínimos cuadrados, permite identificar la
tendencia de la serie de tiempo analizada.
Análisis de series de tiempo
Los modelos de pronóstico de series de tiempo tratan de pronosticar
el futuro con base a datos pasados.
Los promedios móviles y el suavizamiento exponencial son los
mejores y más fáciles de usar para pronósticos a corto plazo:
requieren pocos datos y los resultados son de nivel medio. Los
modelos a largo plazo son más complejos, requieren más datos de
entrada y ofrecen mayor precisión. Desde ya, los términos corto,
medio y largo son relativos, dependiendo del contexto en que se
apliquen.
En los pronósticos empresariales, el corto plazo por lo general se
refiere a menos de tres meses; el medio, de tres meses a dos años; y
el largo, a mas de dos años. En términos generales, los modelos a
corto plazo se ajustan para cambios a corto plazo (como la respuesta
de los consumidores ante un nuevo producto).
Los pronósticos a medio plazo son buenos para efectos estaciónales y
los modelos a largo plazo detectan las tendencias generales y son de
utilidad especial para identificar punto de cambios decisivos.
El modelo de pronósticos a escoger depende de lo siguiente:
1. Horizonte de tiempo para el pronóstico.
2. Disponibilidad de datos.
3. Precisión requerida.
4. Tamaño del presupuesto para pronósticos.
5. Disponibilidad de personal calificado.
También hay que tener en cuenta el grado de flexibilidad de la
empresa (si es mayor la capacidad para reaccionar con rapidez ante
los cambios, no tiene que ser tan preciso el pronóstico)
Promedio Simple
Es un promedio de los datos del pasado en el cual las demandas de
todos los períodos anteriores tienen el mismo peso relativo.
Se calcula de la siguiente manera:
PS = Suma de demandas de todos los períodos anteriores, entre o
dividido por
K = Número de periodos de demanda
PS = D1 + D2 +.....+Dk
K
Donde:
D1= demanda del período más reciente;
D2= demanda que ocurrió hace dos períodos;
Dk= demanda que ocurrió hace k períodos.
Promedio Móvil
Una media móvil simple combina los datos de demanda de la mayor
parte de los periodos recientes, siendo su promedio el pronóstico para
el siguiente periodo.
Una media móvil simple de n periodos se puede expresar mediante:
MMS = Suma de las demandas anteriores de los últimos n periodos
entre o dividido por
N = Número de periodos empleados en la media móvil
MMS = Dt = D1 + D2 +.....+ Dn
N
Donde:
t = 1 es el periodo más antiguo en el promedio de n periodos;
t = n es el periodo más reciente.
Suavizamiento o suavización Exponencial
Las principales razones de popularidad de las técnicas de suavización
son:
1. Los modelos exponenciales tienen una precisión sorprendente.
2. Es muy fácil formular un modelo exponencial.
3. El usuario puede comprender como funciona el modelo.
4. Se requiere muy pocos cálculos para usar el modelo.
5. Como se usan datos históricos limitados, son pocos los requisitos
de almacenamiento en computadores.
6. Es fácil calcular pruebas para de terminar la precisión del modelo
en la practica.
En el método solo se necesitan tres datos: el pronostico más
reciente, la demanda real que se presentó para ese periodo, y una
constante de suavización alfa, .
La ecuación para un pronóstico de suavizamiento exponencial simple
no es mas que:
Pronóstico de la demanda = Ft = F(t – 1) + α ( A(t-1) – F(t-1) )
Donde:
Ft = El pronóstico suavizado exponencialmente para el periodo t.
Ft-1 = El pronóstico suavizado exponencialmente para el periodo
anterior.
At-1 = La demanda real para el periodo anterior.
a = La tasa de respuesta deseada, o constante de suavizamiento.
Análisis de regresión lineal
Se define a la regresión como una relación funcional entre dos o más
variables correlacionadas y se usa para pronosticar una variable con
base en la otra.
En la regresión lineal la relación entre las variables forma una línea
recta.
La línea de regresión lineal es de forma
Y = a + bX, otras formas son Y = aX + b, Y = mX + b
donde Y es la variable dependiente que queremos resolver; a es la
intersección de Y; b es la pendiente y X es la variable independiente
(en el análisis de series de tiempo, X representa unidades de tiempo).
Los valores de a y b se obtienen de calcular:
a= n∑(XtDt) – (∑Xt) (∑Dt)
n(∑X2t) – (∑Xt)2
b = ∑Dt – b∑Xt
n
La regresión lineal es útil para pronósticos a largo plazo de sucesos
importantes.
La restricción principal para usar los pronósticos de regresión lineal es
que, supuestamente, los datos pasados y las proyecciones caen sobre
una línea recta