modelo arima - miportafoliojehinner.weebly.com€¦ · arima se restringe a series largas y de...
Post on 09-Oct-2020
5 Views
Preview:
TRANSCRIPT
Universidad Mariano Gálvez de Guatemala
Sede universitaria Chiquimula
Maestría Dirección y Gestión del Recurso Humano
Inga. Claudia Esmeralda Villela Cervante
“MODELO ARIMA”
Jehinner Wilfrido Gramajo Perdomo
3228 – 06 – 16605
Métodos Cuantitativos
Chiquimula, 30 de Julio del 2016
0
Índice
Introducción .................................................................................................................................... 1
I. MODELO ARIMA ..................................................................................................................... 2
A. DEFINICIONES BÁSICAS PARA APROXIMARSE A LOS MODELOS ARIMA ........... 2
1. Proceso estocástico........................................................................................................... 2
2. Serie temporal y proceso estocástico ........................................................................... 3
3. Estacionariedad de un proceso....................................................................................... 3
a. Proceso estocástico estacionario en sentido fuerte .............................................. 3
b. Proceso estocástico estacionario en sentido débil ................................................ 4
c. Definición informal de un proceso estacionario ..................................................... 5
4. Proceso estocástico “ruido – blanco” ........................................................................... 6
5. Modelos Autorregresivos AR(p) ...................................................................................... 6
6. Operador y polinomio de retardos.................................................................................. 8
7. Modelo de medias móviles MA(q) ................................................................................... 9
B. Fases en la elaboración de un modelo ARIMA ........................................................ 10
1. Identificación ..................................................................................................................... 11
2. Estimación ......................................................................................................................... 12
3. Diagnóstico ........................................................................................................................ 12
4. Aplicación práctica .......................................................................................................... 12
II. Conclusión ............................................................................................................................. 13
Bibliografía ..................................................................................................................................... 14
ANEXOS .......................................................................................................................................... 15
1
Introducción
El modelo ARIMA es un modelo estadístico que utiliza variaciones y regresiones
de datos estadísticos con el fin de encontrar patrones para una predicción hacia el
futuro, se trata de un modelo dinámico de series temporales, es decir, las
estimaciones futuras vienen explicadas por los datos del pasado y no por variables
independientes.
En los modelos ARIMA se consideran tres tipos de procesos posibles:
autorregresión (AR), diferenciación o integración (I) y medias móviles (MA), como
consecuencia de ello, tales modelos contemplan tres parámetros estructurales, p,d
y q, que se expresa de la siguiente manera ARIMA(p,d,q), donde p es el orden de
la autorregresión, d es el grado de diferenciación y q el orden de la media móvil
considerada.
2
I. MODELO ARIMA
Según (Hernández, 2005), para hacer un modelo ARIMA se aconseja acudir a
un conjunto de criterios que globalmente permiten juzgar la mayor o menor
idoneidad de una especificación, así que se debe analizar si el modelo estimado
cumple el requisito básico de estacionariedad o invertibilidad.
En 1970, Box y Jenkins desarrollaron un cuerpo metodológico destinado a
identificar, estimar y diagnosticar modelos dinámicos de series temporales en los que
la variable tiempo juega un papel fundamental, los modelos ARIMA, la metodología
ARIMA es sólo una pequeña parte de los que se conoce normalmente como
“Econometría de Series Temporales” pero, sin duda alguna, una de las más utilizadas
y germen de otros muchos desarrollos posteriores.
En ocasiones, los procedimientos que vamos a analizar se han contrapuesto a la
llamada “econometría estructural”, es decir, a la especificación de modelos
econométricos apoyada en las teorías subyacentes; sin embargo, hoy en día los
conceptos y procedimientos que examinaremos constituyen más una herramienta
para apoyar y complementar los conocimientos econométricos tradicionales que un
modo alternativo de “hacer econometría”, por otro lado, la utilización de modelos
ARIMA se restringe a series largas y de “alta frecuencia” (meses, semanas, días) y
su utilidad finalista los hace útiles para el pronóstico a corto plazo pero no para la
comprensión estructural del fenómeno o la simulación de escenarios.
A. DEFINICIONES BÁSICAS PARA APROXIMARSE A LOS MODELOS
ARIMA
1. Proceso estocástico
Un proceso estocástico es una sucesión de variables aleatorias Yt ordenadas,
pudiendo tomar t cualquier valor entre - y . Por ejemplo, la siguiente sucesión de
variables aleatorias puede ser considerada como proceso estocástico:
3
El subíndice t no tiene, en principio, ninguna interpretación a priori, aunque si
hablamos de proceso estocástico en el contexto del análisis de series temporales
este subíndice representará el paso del tiempo.
2. Serie temporal y proceso estocástico
Una vez introducido el concepto genérico de proceso estocástico puede decirse
que una serie temporal cualquiera es, en realidad, una muestra, una realización
concreta con unos valores concretos de un proceso estocástico teórico, real. El
análisis de series temporales tratará, a partir de los datos de una serie temporal, inferir
las características de la estructura probabilística subyacente, del verdadero proceso
estocástico. Si logramos entender qué características tiene este proceso (cuál es la
esperanza de sus variables, su varianza y las relaciones entre variables separadas
en el tiempo) y observamos además que estas características se mantienen en el
tiempo, podremos utilizar la metodología ARIMA para proyectar su valor en el futuro
inmediato.
3. Estacionariedad de un proceso
La utilización de modelos ARIMA como estrategia de predicción de series
temporales sólo tiene sentido si las características observadas en la serie (o más
correctamente, en el proceso estocástico subyacente) permanecen en el tiempo.
a. Proceso estocástico estacionario en sentido fuerte
Cada una de las variables Yt que configuran un proceso estocástico tendrán su
propia función de distribución con sus correspondientes momentos, así mismo, cada
conjunto de variables tendrán su correspondiente función de distribución conjunta y
sus funciones de distribución marginales. Habitualmente, conocer esas funciones de
distribución resulta complejo de forma que, para caracterizar un proceso estocástico,
y,y,........y,y,y,Y 432-3-4-5-
4
basta con especificar la media y la varianza para cada yt y la covarianza para variables
referidas a distintos valores de t:
)]-y)(-yE[(=)Y,YCov(=
]-yE[=)yVar(=
=]YE[
ssttstst
2
ttt
2t
tt
,
Decimos que un proceso estocástico es estacionario en sentido estricto o fuerte si
las funciones de distribución conjuntas (no sólo la esperanza, las varianzas o las
covarianzas, sino las funciones de distribución “completas”) son constantes, o dicho
con más propiedad, son “invariantes con respecto a un desplazamiento en el tiempo”
(variación de t). Es decir, considerando que t, t+1, t+2, ...., t+k reflejan períodos
sucesivos:
Para cualquier t, k y m; por ejemplo:
b. Proceso estocástico estacionario en sentido débil
La definición de estacionariedad en sentido estricto puede relajarse
sustancialmente utilizando la denominada estacionariedad en sentido amplio o
débil, decimos que un proceso estocástico es débilmente estacionario si:
- Las esperanzas matemáticas de las variables aleatorias no dependen del
tiempo, son constantes:
)Y,.....,Y,YF(=)Y,.....Y,YF( m+k+tm+1+tm+tk+t1+tt
5
- Las varianzas tampoco dependen del tiempo (y son finitas):
- Las covarianzas entre dos variables aleatorias del proceso correspondientes
a períodos distintos de tiempo (distintos valores de t) sólo dependen del lapso
de tiempo transcurrido entre ellas:
De esta última condición se desprende que, si un fenómeno es estacionario, sus
variables pueden estar relacionadas linealmente entre sí, pero de forma que la
relación entre dos variables sólo depende de la distancia temporal k transcurrida entre
ellas.
c. Definición informal de un proceso estacionario
De una manera informal, diremos que un proceso es estacionario cuando se
encuentra en equilibrio estadístico, en el sentido de que sus propiedades (su media,
su varianza, las covarianzas entre distintas variables del proceso) no varían a lo largo
del tiempo.
m ]YE[=]YE[ m+tt
m ]YVar[=]YVar[ m+tt
m )Y,YCov(=)Y,YCov( m+sm+tst
6
4. Proceso estocástico “ruido – blanco”
En este contexto, un ruido blanco es una sucesión de variables aleatorias
(proceso estocástico) con esperanza nula, varianza constante, y covarianzas nulas
para distintos valores de t. Este tipo de proceso, que sólo presenta varianza, que no
presenta relación entre variables de distintos períodos, no podrá ser reproducido con
un modelo ARIMA, es un proceso “vacío” de información de carácter auto proyectivo.
5. Modelos Autorregresivos AR(p)
Los modelos ARIMA tratarán de expresar la evolución de una variable Yt de un
proceso estocástico en función del pasado de esa variable o de impactos aleatorios
que esa variable sufrió en el pasado. Para ello, se utilizarán dos tipos de formas
funcionales lineales sencillas: los modelos AR (Modelos Autorregresivos), y los
modelos MA (de Medias Móviles).
Definimos un modelo AR (autorregresivo) como aquel en el que la variable
endógena de un período t es explicada por las observaciones de ella misma
correspondientes a períodos anteriores (parte sistemática) más un término de error
ruido blanco (innovación).
Los modelos autorregresivos se abrevian con la palabra AR tras la que se indica
el orden del modelo: AR (1), AR (2),....etc. El orden del modelo expresa el número
de observaciones retasadas de las series temporales analizadas que intervienen en
la ecuación. Así, por ejemplo, un modelo AR (1) tendría la siguiente expresión:
La expresión genérica de un modelo autorregresivo, no ya de un AR (1) sino de
un AR (p) sería la siguiente:
Esta forma funcional se acompaña de una serie de restricciones conectadas con
importantes hipótesis analíticas:
a+Y+=Y t1-t10t
7
- El proceso no debe ser anticipante (hipótesis de recursividad temporal); lo
que quiere decir que los valores de una variable en un momento t no
dependerán de los que esta misma tome en t+j.
- La correlación entre una variable y su pasado va reduciéndose a medida
que nos alejamos más en el tiempo (proceso ergódico)
- La magnitud de los coeficientes está limitada en valor absoluto: así, por
ejemplo, en el caso de un AR(1), el coeficiente autorregresivo de un
proceso estocástico estacionario ha de ser inferior a 1 en valor absoluto;
en el caso de un Ar(2), es la suma de los dos coeficientes la que no puede
exceder la unidad. Estas restricciones expresadas en los coeficientes
conectan con las propiedades de estacionariedad del proceso analizado o,
dicho de otro modo: sólo los modelos cuyos coeficientes respetan una serie
de condiciones (que dependen del orden “p” del modelo) representan
procesos estocásticos estacionarios y, por tanto, tienen utilidad analítica.
a+Y+......+Y+Y+=Y tp-tp2-t21-t10t
8
6. Operador y polinomio de retardos
El operador retardo Lp aplicado al valor Yt de una determinada serie devuelve el
valor de esa serie retardado “p” observaciones, es decir:
LpYt=Yt-p
Polinomio de retardos de orden “p” p(L) se compone de una sucesión de “p”
operadores de retardos con sus respectivos coeficientes:
El polinomio de retardos permite abreviar la expresión de u modelo AR(p)
escribiéndose:
La utilidad del polinomio de retardos no es, sin embargo, permitir una notación
abreviada: las características del polinomio de retardos o, más concretamente, el
valor de sus raíces (las soluciones del polinomio) permiten analizar la estacionariedad
del proceso estocástico que subyace al modelo ARIMA, es decir, los analistas pueden
evaluar características relevantes del proceso estocástico que se está modelizando
estudiando las propiedades matemáticas del polinomio de retardos, de ahí su
utilidad.
L-......-L-L-1=(L) p
p
2
21p
a+=Y(L) t0tp
9
7. Modelo de medias móviles MA(q)
Como difiere (Pulido, 2006) las medidas móviles consisten básicamente en
realizar una media aritmética de un número preestablecido de datos, donde se va
añadiendo sucesivamente un dato nuevo y eliminando el más antiguo de los incluidos,
la serie correspondiente a la media móvil alisa variaciones de la serie original.
Un modelo de los denominados de medias móviles es aquel que explica el valor
de una determinada variable en un período t en función de un término independiente
y una sucesión de términos de error, de innovaciones correspondientes a períodos
precedentes, convenientemente ponderados, estos modelos se denotan
normalmente con las siglas MA, seguidos, como en el caso de los modelos
autorregresivos, del orden entre paréntesis. Así, un modelo con q términos de error
MA (q) respondería a la siguiente expresión:
Que de nuevo puede abreviarse utilizando el polinomio de retardos (como en el
caso de los modelos AR):
Así como un modelo autorregresivo es intuitivamente sencillo de comprender, la
formulación de un modelo de medias móviles resulta sorprendente para el no iniciado.
¿Qué significa que una variable aleatoria se explique en función de los errores
cometidos en períodos precedentes?, ¿De dónde proceden esos errores?, ¿Cuál es
la justificación de un modelo de este tipo? en realidad, un modelo de medias móviles
puede obtenerse a partir de un modelo autorregresivo sin más que realizar sucesivas
sustituciones:
a+....+a+a+a+=Y q-tq2-t21-t1tt
+a(L)=Y tqt
10
B. Fases en la elaboración de un modelo ARIMA
Básicamente consiste en determinar el modelo subyacente en una determinada
serie temporal: Identificación. Una vez determinado el tipo de modelo, proceder a la
estimación de los parámetros del mismo: Estimación. Y por último, comprobar si el
modelo se ajusta correctamente a los datos empíricos: Diagnóstico, que en caso de
no cumplirse, se reiniciaría del nuevo el proceso. Una vez finalizado el proceso
podremos aplicar el modelo. Así:
Identificación Estimación Diagnóstico Aplicación del modelo
Fuente: Recuperado de http://www.es.slideshare.net
+a+....+a+a+a+a=Y
Y+a+a=Y
a+Y=Ya+Y=Y
j-t
j
3-t
3
2-t
2
1-ttt
2-t
2
1-ttt
1-t2-t1-tt1-tt
...........
........
11
1. Identificación
Para (Villareal, 2005), la identificación es la primera etapa donde se determinan
tanto el orden de integración de la serie de tiempo Xt, como el orden de los
polinomios AR y MA regulares y estacionales, para ello la principal herramienta es
el análisis de la función de auto covarianza.
Es la fase más importante, se trata de determinar los parámetros p, d y q que
conforma el proceso ARIMA (p,d,q) generador de la serie. Hay que decir que aunque
estos parámetros pueden adoptar cualquier valor, en la práctica la casi totalidad de
los casos serán 0 o 1, y raras veces 2, lo que hace que el proceso de identificación
sea menos complejo de lo que aparentemente resulta. Por ejemplo, el 51% de las
series estudiadas por Glas y otros (1975) no necesitaron diferenciación y tal solo el
6% necesitaron una diferenciación mayor del primer orden. Igualmente, y esto
mismos autores, detectaron que tan sólo el 2% de las series tienen un orden
autorregresivo superior a la unidad. Igualmente son raras medias móviles
superiores a 1.
Lo primero es el parámetro d, estos es el grado de diferenciación para que la
serie sea estacionaria, para ello, el procedimiento es muy sencillo, en primer lugar
se observa gráficamente si la series es estacionaria o no.
Estacionariedad significa, como se sabe, que la serie tiene la misma media y
varianza a lo largo de todo su recorrido, si la serie no es estacionaria se procede a
diferenciarla y se comprueba de nuevo gráficamente si es estacionaria, si lo es,
sabemos por tanto que el valor d vale 1, en caso contrario se deferencia de nuevo,
y así tantas veces hasta que se logre la estacionalidad, el valor d será el número de
veces que se ha diferenciado.
Conocido el valor d procedemos a conocer p y q. Para ambos parámetros
recurriremos a la función de autocorrelación ACF y a la función de autocorrelación
parcial PACF.
12
Los modelos AR(p) presenta un decaimiento exponencial en los valores de ACF
y picos en los primeros p valores del PACF, por otro lado, los modelos MA(q)
presentan q picos en los primeros q valores del ACF, y valores decrecientes
exponencialmente en PACF, para otros caso, ver el Apéndice al final de estas
páginas.
2. Estimación
Por otro lado (Mongay, 2005), nos dice que la estimación normalmente es para
estimar el modelo recién identificado, se utiliza el método de mínimos cuadrados o
el método de máxima verosimilitud.
Los modelos ARIMA no son modelos lineales en sus parámetros, lo que
imposibilita el recurso a los programas estándar de regresión lineal, en su lugar se
recurre a modelos iteractivos y a la máxima verosimilitud como procedimiento de
estimación de parámetros, en esta fase se determinan los valores de los parámetros
p, d y q, que obviamente han de ser estadísticamente significativos.
3. Diagnóstico
Consistente en determinar la adecuación del modelo con los datos empíricos, si
el modelo estimado es el adecuado, los residuales generados por el mismo serán
verdaderamente aleatorios y carecerán de cualquier pauta o estructura, para ello
recurrimos de nuevos al ACF y PACF donde cabe esperar valores de los residuos
completamente aleatorios, esto es ruido blanco, en caso de no ser así habría que
replantearse el modelo y establecer otros parámetros para el modelo.
4. Aplicación práctica
Vamos a aplicar el modelo ARIMA sobre unos supuestos datos en el contexto
del control de calidad de una empresa en la producción de unos determinados
componentes, los datos, una vez definidas las fechas son los siguientes (ver
ANEXOS).
13
II. Conclusión
El modelo ARIMA necesita identificar los coeficientes y número
de regresiones que se utilizarán, este modelo es muy sensible a la precisión con
que se determinen sus coeficientes, se suele expresar como ARIMA(p,d,q) donde
los parámetros p, d y q son números enteros no negativos que indican el orden de
las distintas componentes del modelo respectivamente.
Las componentes autorregresiva, integrada y de media móvil, cuando alguno de
los tres parámetros es cero, es común omitir las letras correspondientes del
acrónimo, AR para la componente autorregresiva, I para la integrada y MA para la
media móvil, por ejemplo, ARIMA(0,1,0) se puede expresar como I(1) y
ARIMA(0,0,1) como MA(1).
El modelo ARIMA puede generalizarse aún más para considerar el efecto de
la estacionalidad, ya que se restringe a series largas y de “alta frecuencia” (meses,
semanas, días) y su utilidad finalista los hace útiles para el pronóstico a corto plazo
pero no para la comprensión estructural del fenómeno o la simulación de escenarios.
14
Bibliografía
Hernández, Z. (2005). MODELOS ECONJOMETRICOS PARA EL ANALISIS
ECONOMICO. Madrid, España: ESIC.
Mongay. (2005). QUIMETRIA. Valencia, España: Juli Capilla, S.L.
Pulido. (2006). GUIA PARA USUARIOS DE PREDICCIONES ECONOMICAS.
Madrid, España: Ecobook.
Villareal. (2005). ELEMENTOS TEORICOS DEL AJUSTE ESTACIONAL DE
SERIES ECONOMICAS. Santiago de Chile: L.C/L.
15
ANEXOS
Fuente: Recuperado de http://www.minitab.com
Fuente: Recuperado de http://www.ciberspaceandtime.com
16
Fuente: Recuperado de http://www.ciberspaceandtime.com
Fuente: Recuperado de http://www.scielo.org.co
17
Fuente: Recuperado de http://www.scielo.br
Fecha
182
176
170
164
158
152
146
140
134
128
122
116
110
104
98
92
86
80
2280
2260
2240
2220
2200
2180
2160
2140
PUNTUACI
95% LCL for PUNTUACI
from ARIMA, MOD_42
95% UCL for PUNTUACI
from ARIMA, MOD_42
top related