pronóstico de la producción de leche, mediante modelos...
TRANSCRIPT
Pronóstico de la producción de leche, mediante modelos ARIMA.
Facultad de Matemática y Computación "Universidad de La Habana"
Pronóstico de la producción de leche, mediante
modelos ARIMA. Caso UBPC “Maniabo”.
Autor Lyhen Sánchez Suárez
Tutores
MSc. Gladis Cabanas Gómez DrC. Verena Tórres Cárdenas
Asesor
MSc. Yoandra Abad Lamoth
Tesis presentada en opción al título académico de Máster en
Bioestadística
Ciudad de La Habana 2013
Pronóstico de la producción de leche, mediante modelos ARIMA.
"Si buscas resultados distintos, no hagas siempre lo mismo."
Albert Einstein
Pronóstico de la producción de leche, mediante modelos ARIMA.
DEDICATORIA
A mi mamita, fiel amiga y consejera, gracias a su sacrificio estoy aquí en estos
momentos. Serás siempre mi inspiración para alcanzar mis metas, por enseñarme
que todo se aprende y que todo esfuerzo es al final recompensado. Tu esfuerzo,
se convirtió en tu triunfo y el mío, TE AMO.
A mis abuelos, que por su modo de conducir mi educación, supieron guiarme bajo
los principios éticos morales y fueron fuente constante de apoyo, amor
incondicional y motivación.
A mis padres, Julio y Reinaldo, que con su empeño diario me han enseñado que la
vida exige sacrificios y perseverancia para lograr los objetivos.
A toda mi familia que es el mejor regalo que me ha dado la vida.
A mis amigos Yoandra y Eliecer, que fueron incondicionales y estuvieron a mi lado
ayudándome y depositando toda su confianza en mí.
A mis tutores Gladis y Verena que estuvieron al tanto de mi trabajo todo el tiempo
e hicieron sus exigencias cada vez mayores, gracias por haberme transmitido
todos los conocimientos que hoy tengo y por hacer de mi la profesional que soy.
A mis compañeros de trabajo que depositaron confianza en mí y confiaron más
para hacer de mí una mejor persona y profesional.
A todos aquellos que de alguna forma contribuyeron en mi formación, que
soportaron mis buenos y malos humores, mis canturías y mis locuras, a todos
muchas gracias, por ser lo que soy hoy.
Gracias de todo corazón.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Resumen
El trabajo presenta una metodología para el estudio y predicción de la producción
de leche en las condiciones de UBPC ganaderas en Cuba incluyendo métodos
estadísticos de validación de los pronósticos y modelos encontrados. A partir de la
serie de litros de leche producidos, observada en el caso de estudio, se realiza un
análisis de la misma en los años del 1994 al 2010, encontrándose ausencia de
tendencia y una estacionalidad altamente significativa, se ajusta un modelo de tipo
ARIMA que resultó un ARIMA (1,0,3)x(0,1,0) y se halla un pronóstico a mediano
plazo (2011 - 2013) donde se obtuvieron errores aceptables, incluyendo un error
medio porcentual aproximadamente del 15% y valores extremadamente similares
a los reales en el 2011 (primer año pronosticado y tomado como año de
validación). Se obtienen resultados en el caso de la UBPC “Maniabo” de La Tunas
que incluyen un estudio descriptivo de los principales indicadores registrados en
estas unidades y que estaban más relacionados con la producción de leche, en
este caso se encontró que la misma está estrechamente relacionada con la
cantidad de vacas en ordeño y los litros por vaca, variables que explican un
97.40% de la variabilidad de la producción de leche, estas variables (vacas en
ordeño, litros de leche por vaca) son tan difíciles de predecir como la propia
producción de leche, por ello es necesario su estudio y control, para el logro de
una predicción confiable de producción de leche.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Abstract
This paper presents a methodology for studying and predicting the milk production
under the conditions of Cuban cattle Basic Units of Cooperative Production
(BUCP), including statistical methods of validating the prognosis and models found.
From the amount of milk liters produced in the case of study, an analysis is
conducted from 1994 to 2010, and there was not high significant tendency or
seasonal, adjusted to a model type ARIMA that resulted to be an ARIMA
(1,0,3)x(0,1,0) and a prognosis will be found at middle term (2011 - 2013), where
acceptable mistakes were obtained, including a mean percent error of about 15%
and values similar to those real in 2011 (first predicted year and considered as
validation year). Results are obtained in the case of the BUCP “Maniabo”, Las
Tunas that includes a more detailed study of the main indicators recorded in these
units and that are also related with milk production. In this case, it is closely related
with the amount of milking cows and liters per cow, variables that explain 97.40%
of the variability of milk production. These variables (milking cows, liters per cow)
are so difficult to predict as milk production itself. Therefore, its study and control
are needed to achieve a reliable milk production prediction.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Índice General
Introducción ………………………………………………………...………….…...1
1. Las Series Temporales…………………………………………..............…….6
1.1 Aspectos generales de las series temporales y su uso……………………..……….....6
1.2 Generalidades de los modelos clásicos de series temporales………………..…….....8
1.3 Componentes de las series…………….………………………………………….……….9
1.4 Enfoque a partir de procesos estocásticos. Proceso estacionario de
segundo orden……………………………………………………………………….…….22
1.5 Modelos Autorregresivos (AR) y de Medias Móviles (MA) …….……………………..25
1.6 Modelo Autorregresivo de Medias Móviles (ARMA)……………………………..…….27
1.7 Series no estacionarias en media. Diferencias estacionales y no
estacionales………….……………………………………………………………….…….28
1.8 Autorregresivo Integrado de Medias Móviles (ARIMA)………………………….…….30
1.9 Criterios de selección………………………………………………………………..…….33
2. Materiales y Métodos…………………………………………………………..33 2.1 Área de Estudio…………………………………………...………..……………..………33
2.2 Recolección de Datos…………………………………...………………………..………34
2.3 Métodos estadísticos……………………………………………………………….…….35
3. Resultados y Discusión…………………………………………………...…..36 3.1 Metodología de análisis en una UBPC……………………………...........…….……...42
3.2 Estudio de caso UBPC “Maniabo”………………………...…………………….……....44
Conclusiones………………………………………......…...………………….…..64
Recomendaciones.……………………………………………………...…….…..65
Bibliografía………………………………………………………………..…….…..66
Pronóstico de la producción de leche, mediante modelos ARIMA.
Introducción
La producción ganadera en los países tropicales se caracteriza por la baja
productividad que se alcanza en los indicadores productivos, y si se toma en
consideración la importancia que tiene para el hombre la producción de leche y
carne, se deben tener en cuenta todos los estudios que se desarrollen en las
explotaciones pecuarias actuales, que ayuden a la toma de decisiones correctas y
a conocer las estructuras que hacen posible este mecanismo [34, 35].
En los sistemas de producción de leche en Cuba, la alimentación se sustenta en la
utilización de los pastos y forrajes [32, 36]; estos no se escapan a la necesidad de
encontrar sistemas que sean eficientes aún en condiciones de bajos insumos [20].
Entre sus grandes retos se encuentran los desequilibrios financieros y los
esfuerzos por mantener un crecimiento sostenido en el orden social y productivo,
con el que se garantice el bienestar de la población y la equidad social [29]. Para
poder afrontar con eficiencia y previsión la planificación de los recursos es
necesario tener predicciones confiables de la futura situación de la producción del
sector.
La estadística ha desarrollado teorías y métodos que se han convertido en
herramientas imprescindibles para la estimación, comparación y la predicción.
Entre estos métodos estadísticos se encuentran la regresión, los métodos
multivariados y los aplicados a las series temporales entre otros.
Estos métodos pueden ser empleados para analizar fundamentalmente las
relaciones existentes entre variables, la incidencia de una variable particular sobre
un fenómeno analizado [44].
En el caso particular de las series temporales se aplican, fundamentalmente, los
métodos de pronósticos y, su mayor dificultad radica generalmente en la escasez
Pronóstico de la producción de leche, mediante modelos ARIMA.
de datos para analizar el problema y la falta de comunicación entre los estadísticos
y los usuarios que emplean los resultados de estos métodos [57].
El análisis estadístico de series temporales o cronológicas, como también se les
conoce, se usa hoy día con profusión en muchas otras áreas de la ciencia como
son: la física, ingeniería, la demografía, el marketing, las telecomunicaciones, la
meteorología, la química, las ciencias médicas y fundamentalmente en economía
[7, 34].
El uso de los métodos de estudio de las series cronológicas se ha venido
acrecentando debido a sus propios objetivos, dentro de los que se destacan la
predicción, el control y la simulación de los procesos. Cuando se toma en cuenta
la crisis económica que hoy atraviesa el mundo, es cada vez más necesaria la
planificación de los recursos para sobrevivir y progresar [8, 34].
El uso de las series temporales en diferentes áreas de la ciencia se evidencia
través de diferentes trabajos como son: “Evaluación epidemiológica de procesos
respiratorios bacterianos en gallinas ponedoras”, presentado por Colás Chávez y
colaboradores en el 2011, “Liga española contra la hipertensión arterial”,
desarrollado por Molinero M. Luis en el 2004 y otro desarrollado por Cañedo A., R.
and Arencibia J., R., “En busca de los secretos moleculares de la vida”, entre
otros [18, 26, 54].
El Ministerio de Agricultura, Ganadería y Pesca, en Argentina, es uno de los que
emplean los métodos estadísticos de las series temporales en la rama
agropecuaria, ellos emplean un Sistema Integrado de Información Agropecuaria,
en el que tienen la necesidad de realizar informes tanto agroclimáticos como
comerciales y para realizar los mismos lo hacen a través de la utilización de estos
métodos; hallando los pronósticos de condiciones agroclimáticas y de la situación
comercial de las empresas, teniendo en cuenta a su vez el análisis de mercado.
Pronóstico de la producción de leche, mediante modelos ARIMA.
En las investigaciones desarrolladas en la esfera agropecuaria, en Cuba,
históricamente se han analizado muchas variables, ya sea peso vivo al nacer,
producción de leche, de carne, número de hojas, el intervalo parto-parto, el
intervalo parto-gestación etc., sin embargo se han realizado pocos análisis que
muestren el comportamiento de estas variables de tal forma que sea posible
pronosticar su comportamiento en los años futuros. En este campo de estudio, los
pronósticos que se puedan realizar en base al análisis de este tipo de información
pueden emplearse para el desarrollo de nuevos planes y para el análisis correcto
de inversiones [42].
En el sector económico y financiero, los datos de las series temporales pueden ser
muy variados y usualmente son usados para evaluar el comportamiento de las
ventas de una empresa, o para evaluar el comportamiento de los índices de precio
de un país o de un tipo de producto, pero en general pueden utilizarse en
cualquier área.
Este aspecto, en Cuba, ha sido abordado en diferentes temáticas o aplicaciones,
pero en la esfera pecuaria los análisis temporales generalmente no han sido
profundos, un ejemplo, de una excepción de esta regularidad, se muestra en un
trabajo realizado por Viera en el 2006, en la Universidad Agraria de La Habana,
donde fue analizada una serie temporal del comportamiento productivo de las
granjas del Instituto de Ciencia Animal, para predecir el costo económico de
producciones futuras [67].
En los tiempos actuales, el hecho de no tener buenas predicciones de
producciones futuras, así como de ganancias productivas o económicas es una
cuestión a solucionar, de ahí que no contar con predicciones confiables de las
producciones en la esfera agropecuaria es nuestro problema de investigación.
La aplicación de los modelos de series temporales, a los resultados productivos,
en las empresas pecuarias permitirá pronosticar el comportamiento de las
producciones de las mismas y ayudar así al proceso de toma de decisiones;
logrando una planificación correcta de los sucesos futuros, debido a lo anterior es
Pronóstico de la producción de leche, mediante modelos ARIMA.
que se desarrolla este estudio, donde se define como hipótesis, que con la
aplicación de los métodos de series temporales se podrá pronosticar el
comportamiento futuro de la producción de leche en una UBPC.
De aquí que el objetivo general de este trabajo es proponer una metodología
para describir el comportamiento de la producción de leche y pronosticar dicha
producción mediante modelos ARIMA de series temporales en una UBPC y
ejemplificarla en la UBPC “Maniabo” de La Tunas.
Los objetivos específicos:
Proponer una metodología para el análisis estadístico y pronóstico de la
producción de leche a nivel de UBPC.
Caracterizar el comportamiento de la serie de producción de leche en la
UBPC “Maniabo” de Las Tunas para el período 1994-2010.
Identificar y seleccionar el modelo ARIMA adecuado para el pronóstico de la
producción de leche de la serie anterior.
Validar el modelo seleccionado y pronosticar la producción de leche para el
período 2011–2013.
La novedad y el aporte científico del presente trabajo radican en que se brindará
una metodología mediante el uso de modelos ARIMA, para analizar y pronosticar
la producción de leche en el campo agropecuario a nivel de unidad de base,
metodología que podrá ser aplicada con pocas variaciones para el análisis y
pronóstico de otras variables empleadas en la rama agropecuaria.
El documento quedará dividido en los siguientes capítulos: Introducción, donde se
realizará un bosquejo del tema agropecuario y el posible uso de los métodos
estadísticos de series temporales en el mismo y su importancia, quedando definido
Pronóstico de la producción de leche, mediante modelos ARIMA.
el objeto de investigación del trabajo. En el capítulo 1 se abordarán los aspectos
fundamentales de las series temporales y su uso, se trataran los modelos clásicos
(aditivo, multiplicativo, mixto) y los aspectos generales de los modelos AR, MA, el
ARMA y el ARIMA; se abordan los aspectos generales de las componentes que
forman parte de una serie temporal y el tratamiento de las mismas; se trataran
también los diferentes criterios de selección de un modelo específico de series
temporales. El capítulo 2 detalla las condiciones de trabajo donde se realizó el
estudio y los datos empleados para el mismo, así como los materiales utilizados
para el análisis de las series y la relación de los métodos estadísticos aplicados en
el análisis. En el capítulo 3 se recogen los resultados obtenidos y se realiza la
discusión de los mismos y a continuación se muestran las conclusiones, las
recomendaciones y la bibliografía consultada.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Capítulo 1
Las Series Temporales.
1.1 Aspectos generales de las series temporales y su uso.
“Se llama serie de tiempo, temporal o cronológica a un conjunto de mediciones de
cierto fenómeno, registradas secuencialmente en instantes de tiempo
equiespaciados”, es decir la secuencia de valores que toma una variable
cuantitativa en momentos equidistantes de tiempo, durante un período
observado:
donde el subíndice representa el tiempo.
El gráfico de una serie de tiempo, que consiste en una poligonal cuyos vértices
corresponden a los puntos ( ), puede ayudar a analizar su comportamiento [2,
8].
En este trabajo se emplearán las series temporales, aplicadas como tal a la rama
ganadera, en la cual se tratan disimiles variables, como son la producción de
leche, los litros de leche por vaca, los nacimientos, los partos, las gestaciones, los
intervalos parto-parto, las muertes, intervalos parto-gestación entre otras, que
como casi todos los problemas o fenómenos de la vida, pueden ser analizadas y
modeladas matemáticamente para ayudar a comprender su comportamiento y a
tomar decisiones según la predicción futura de las mismos.
Pronóstico de la producción de leche, mediante modelos ARIMA.
En Cuba como se mencionó en la introducción, las series temporales son también
utilizadas, fundamentalmente en meteorología y en las ciencias médicas y,
ejemplo de ello es un trabajo realizado por Gladis Cabanas en el año 2005 [17],
para analizar los cambios temporales de la lluvia en el occidente de Cuba y otro
realizado en el 2007, por Gisele Coutín [27], donde utilizan específicamente los
modelos ARIMA de series temporales, para la vigilancia de enfermedades
transmisibles; pero en la rama agropecuaria, las series temporales han sido poco
utilizadas, hay algunos trabajos como por ejemplo el desarrollado por Lázara
Raquel Montes de Oca en el 2010, para predecir las propiedades de la calidad de
la guayaba [56] , pero hasta el momento, no se ha tratado específicamente la
aplicación de modelos ARIMA de series temporales en esta rama para realizar
pronósticos en el campo pecuario, en el país.
Existen dos objetivos principales del trabajo con las series:
1. Identificar la naturaleza de algún fenómeno representado por una
secuencia de observaciones.
2. La predicción de valores futuros de dicha secuencia de observaciones.
Para aplicar los métodos de series temporales, es preciso, inicialmente, conocer o
comprobar si efectivamente se está en presencia de una serie temporal o
simplemente frente a una secuencia de datos aleatorios, tomando en
consideración que una secuencia de datos completamente aleatorios en el tiempo,
también es una serie, pero esta no puede ser pronosticada.
Dentro de los modelos de series, se encuentran los llamados Modelos
Autorregresivos (AR), los modelos de Medias Móviles (MA), los Modelos
Autorregresivos de Medias Móviles (ARMA), los Modelos Autorregresivos
Integrados de Medias Móviles (ARIMA), etc.
“Con la identificación y aislamiento, de los factores determinantes en el
comportamiento de una serie temporal y teniendo en cuenta los cambios
Pronóstico de la producción de leche, mediante modelos ARIMA.
originados a través del tiempo, es posible determinar los valores futuros de la
variable en estudio” [13, 24]; esta afirmación constituye la suposición básica que
sustenta el pronóstico, mediante las series temporales. Si estos factores no son
los mismos en todo el recorrido de la serie posiblemente habrá que hacer cortes
en la misma para posibilitar su análisis.
Los modelos de series de tiempo tienen un enfoque analítico y predictivo, con ellos
los pronósticos se elaborarán en base al comportamiento pasado de la variable de
interés [26].
1.2 Generalidades de los modelos clásicos de series temporales.
El modelo clásico de series temporales supone que una
serie , estudiada de forma adecuada permite conocer las
causas de los movimientos determinísticos experimentados en la variable. Estos
movimientos son denominados componentes de la serie y son tres: las variaciones
estacionales, la tendencia y la ciclicidad. En todos los modelos de series
temporales, ya sea el aditivo, el multiplicativo o mixto, pueden estar incluidas todas
o varias de estas componentes [11, 16, 17, 19, 21, 25, 33]. En estos modelos se
plantea también la existencia de otra componente, no determinista, que es la
componente aleatoria.
Existen discrepancias entre los autores en cuanto al modelo más utilizado, si es el
aditivo o el multiplicativo, pero si se plantea que en casi todas las series con
tendencias marcadas, a mayores valores hay oscilaciones más amplias [67] y el
modelo multiplicativo es utilizado en las series cuando la variación interna del
patrón estacional tenga mayor amplitud al desplazarse hacia valores mayores de
la tendencia, si por el contrario, la variación del patrón estacional permanece
constante, se utilizará un modelo aditivo [69].
Los métodos clásicos, de series temporales, son mejor trabajados cuando se trata
de series en las cuales está presente la variación lineal de tendencia [22, 36]. En
Pronóstico de la producción de leche, mediante modelos ARIMA.
un modelo clásico de series de tiempo, se supone que la serie puede ser
expresada como suma o producto de sus componentes [38, 54].
Los correspondientes modelos son:
1. Aditivo :
2. Multiplicativo :
3. Mixto :
Donde es la serie observada en cada instante de tiempo , la es la
componente de tendencia, la es la componente estacional, la es la
componente aleatoria (accidental) y la es la componente cíclica de la serie.
1.3 Componentes de las series.
La tendencia ( ), uno de los componentes que puede estar presente en una serie
temporal, constituye aquella parte de la serie cronológica, que se caracteriza por
un movimiento suave, monótono y lento, durante un período bastante extenso de
tiempo [1] y esta puede ser creciente, decreciente o constante y se describe por
una función dependiente del tiempo ( )[40, 45].(Figura No1.1)
Pronóstico de la producción de leche, mediante modelos ARIMA.
FiguraNo 1.1: Serie temporal con tendencia creciente.
Como se planteó anteriormente, la tendencia refleja un continuo crecimiento o
decrecimiento de la serie en un largo período de tiempo, tiempo necesario para
hacer posible la caracterización del comportamiento de la variable en cuestión,
que por lo general, se describe por medio de una recta o de un tramo monótono de
alguna curva que se ajuste al comportamiento de los datos [63].
La estacionalidad ( ), otro de los componentes de las series temporales, resulta de
las fluctuaciones periódicas que se presentan regularmente en la serie durante
sub-intervalos de un período dado, generalmente un año [6, 50]. (Figura No1.2)
Pronóstico de la producción de leche, mediante modelos ARIMA.
Figura No1.2: Estacionalidad marcada en una serie temporal.
Los ciclos ( ), que también constituyen una de las componentes de una serie
temporal, no son más que movimientos regulares en amplitud y período y se
diferencian del estacional en que, este último, es tan marcado que, por lo general,
es un movimiento cuyo período se conoce previo al estudio de la serie y es único;
y en el caso de los ciclos pueden ser varios movimientos periódicos con diferentes
períodos y generalmente no son tan fuertes como el estacional [12, 62].
Los movimientos aleatorios, residuales o irregulares ( ), como también se les
llama, es otro componente que refleja aquellos movimientos esporádicos que
ocurren en la serie y que no presentan regularidad alguna, ni en intensidad, ni
periodicidad [33, 60]. Estos movimientos son motivados por acontecimientos
fortuitos, son movimientos erráticos que no siguen un patrón específico, que
obedecen a causas diversas e impredecibles [6, 26].
La estimación de los componentes de una serie es un proceso relevante en el
análisis de la misma. Por ejemplo, el conocimiento de los movimientos
estacionales contribuye a explicar si los cambios que se están observando en una
variable, en determinado momento, obedecen efectivamente a aumentos o
disminuciones en su nivel medio o bien a fenómenos estacionales [10].
De forma general la tendencia y la estacionalidad en una serie pueden ser
identificados y/o estimados, mediante varios métodos como son el método
observacional, los métodos de suavizamiento, el método exponencial de Brown, el
exponencial lineal de Hotl, entre otros, que serán explicados a continuación.
Para analizar la presencia de tendencia en una serie temporal puede utilizarse el
método observacional, al ver el movimiento del gráfico horizontal de la serie, pero
cuando la estacionalidad o la componente aleatoria, o ambas, producen
oscilaciones muy marcadas se dificulta el análisis visual haciéndose necesario
Pronóstico de la producción de leche, mediante modelos ARIMA.
aplicar previamente algún tipo de suavizamiento, para poder determinar el
movimiento a largo plazo de la serie.
La idea central de los suavizamientos es generar, a partir de la serie observada
una nueva serie, que suaviza los efectos ajenos a la tendencia (estacionalidad,
efectos aleatorios), de manera que esta se puede visualizar y estimar [24].
La obtención de la serie demedias móviles, es otro método de suavizamiento y de
hecho es uno de los más utilizados [13, 57]; consiste en fijar un número ,
preferentemente impar y calcular los promedios de todos los grupos de términos
consecutivos, comenzando cada grupo en la observación siguiente a la que se
consideró inicio del k-uplo anterior. Se obtiene una nueva serie suavizada por
medias móviles de orden que tiene términos menos que la serie original.
De este modo se tienden a anular las variaciones aleatorias [16]
La fórmula está dada por:
El suavizamiento de media móvil es muy fácil de aplicar, permite visualizar la
tendencia de la serie. Pero tiene dos inconvenientes, uno que con la aplicación de
este método no es posible obtener estimaciones de la tendencia en los extremos
de la serie y otro, que no constituye en sí un medio para hacer predicciones [25].
Si la serie presenta un efecto estacional de período , es conveniente aplicar un
suavizamiento de media móvil de orden . En tal caso se elimina el efecto
estacional, junto con la variación aleatoria, observándose solamente la tendencia
[16].
Esto permite estimar la línea de tendencia con menos error a partir de las medias
móviles ya que se aseguró la eliminación del factor que generalmente representa
Pronóstico de la producción de leche, mediante modelos ARIMA.
la mayor fuente de variabilidad en la serie y que se considera ajeno a la tendencia
que es la estacionalidad.
El método de suavizamiento exponencial, se basa en que una observación
suavizada, en el tiempo , es un promedio ponderado entre el valor actual de la
serie original y el valor de la serie suavizada, en el tiempo inmediatamente
anterior.
Si representa la serie de tiempo original y la serie de tiempo suavizada,
entonces lo anterior se puede escribir como donde
es un número entre y [13].
Si es cercano a , la serie suavizada pondera más fuertemente el valor original,
luego ambas se parecen, y en consecuencia, el suavizamiento es poco; si se
acerca a 0.5, se ponderan moderadamente la serie original y la suavizada, por lo
que el suavizamiento es moderado y si es cercano a , es cercano a , y
la serie suavizada pondera más fuertemente el valor suavizado inmediatamente
anterior, por lo que el suavizado es importante [13].
Consecuencia de la fórmula anterior es que la serie suavizada se puede expresar
como:
Es decir, cada término suavizado es un promedio ponderado de todos los términos
históricos de la serie original.
Como está entre y , estos números se van reduciendo a medida que avanzan,
o sea, que a medida que se aleja hacia el pasado, los términos van influyendo
cada vez menos en el término presente. La rapidez con que disminuye la
influencia es mayor mientras esté más cercano a , o sea, mientras mayor sea
[65].
Pronóstico de la producción de leche, mediante modelos ARIMA.
Si la serie varía lentamente, por lo general se eligen valores de cercanos a
(valor típico ). En cambio, si varía bruscamente, se eligen valores de
cercanos a 1 (valor típico ) [6, 25].
Algunos métodos empleados con fines de pronósticos, pero que pueden ser
utilizados también para detectar si una serie presenta tendencia o no, es el
suavizamiento polinomial, el método exponencial de Brown, el exponencial lineal
de Hotl y el estacional de Winter[2].
Un polinomio es una expresión de tipo:
Que para valores de describe una curva de orden o grado . Los
coeficientes son los parámetros de ajuste estimados para cada serie.
El suavizamiento polinomial, como el mismo nombre indica, es el suavizamiento
de la serie, ajustando un polinomio y con su aplicación se obtiene una curva más
plana, con menos irregularidades que la serie original. Si hay varios órdenes de
suavizamientos polinomiales que indiquen movimientos tendenciales similares en
la mayor parte del gráfico de la serie incluyendo la porción final, indica la
existencia de tendencia y se puede tomar como su estimación la curva polinomial
mejor ajustada.
Si , coincide con la media de la serie [61].
Para la detección de tendencia en una serie temporal mediante el suavizamiento
polinomial, se realiza este con polinomios de grado bajo, que pueden considerarse
desde hasta .
Cuando se indica un tipo de polinomio para el suavizamiento de una serie,
definiendo la a emplear, se pueden obtener por cualquier método de ajuste los
valores de los parámetros del polinomio más cercano, dentro de la familia de
polinomio de grado , a la serie; mientras menor sea será mayor la fuerza de
Pronóstico de la producción de leche, mediante modelos ARIMA.
aislamiento producida sobre la serie, pero también más se dejará influir por los
valores aberrantes y por la estacionalidad, con el crecimiento de el polinomio
produce curvas cada vez más sinuosas que se alejan del concepto de tendencia
[2].
El método exponencial de Brown consiste en realizar dos suavizamientos
exponenciales, a partir de los cuales se obtendrá el valor estimado, o pronóstico
que se busca realizar, mediante un cálculo realizado con una expresión sencilla.
La primera se aplica a los valores observados en la serie de tiempo y la segunda a
la serie atenuada obtenida mediante la primera atenuación.
Debido a que los valores calculados al realizar las dos primeras atenuaciones no
son los datos estimados a obtener, o sea, que no constituirán las inferencias de los
valores que se espera que tome la serie de tiempo en el futuro cercano, se emplea
una notación distinta a la de la expresión final, con la cual se calculan los valores
que constituyen en realidad el pronóstico.
El método de suavizamiento exponencial lineal de Hotl utiliza dos constantes de
suavizamiento, la primera constante, , entre y , es utilizada para la media de
la serie y la segunda, , también entre y , para la tendencia. Ambas constantes
seleccionan el peso dado a los valores en la serie para la estimación de media y
tendencia en el suavizamiento, mientras más cercanos a , más repartido el peso
entre todos los valores de la serie y mientras más cerca de , más concentrado en
los últimos valores.
El método estacional de Winter se utiliza cuando además de presentarse una
tendencia lineal en la serie de tiempo, hay también un patrón de comportamiento
de tipo estacional o periódico en los datos o valores de la serie de tiempo. Esta
técnica es una extensión del método de Holt ya que incorpora una ecuación para
calcular una estimación de la estacionalidad.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Salvo en el caso de las medias móviles que no aportan una ecuación de la serie
suavizada en función del tiempo, los otros suavizamientos permiten no sólo
visualizar con mayor facilidad si existe una tendencia marcada en la serie, ya que
el gráfico tiene menos irregularidades, sino que también aportan una ecuación
mediante la cual se pueden estimar los valores de tendencia.
La estimación a partir de un suavizamiento adecuado puede mejorar el error con el
que se estima la tendencia, si esta se ajusta a partir de la serie suavizada y no a
partir de los datos originales, pero se corre el peligro de no haber tomado
adecuadamente, los parámetros del alisamiento y que esta estimación posterior de
una función más suave sea peor que la estimada a partir de los datos originales, el
caso del alisamiento por medias móviles es el ideal para este tipo de estimación
en dos pasos ya que su único parámetro corresponde al período estacional
que,casi siempre, es conocido con seguridad por el usuario.
Teniendo en cuenta el tipo de modelo representado en la serie, existen diferentes
métodos de estimación de tendencia, por ejemplo en una serie aditiva, los posibles
métodos a utilizar para estimar la tendencia son métodos de regresión[10]a partir
de algún suavizamiento; se emplean la regresión lineal, cuadrática y logística, pero
en el caso de la utilización de estos métodos existe una contradicción y es que,
uno de los supuestos de una serie temporal, plantea la presente autocorrelación
entre las observaciones y esto se contradice con el supuesto básico de la
regresión, que consiste en la independencia de las observaciones.
Para solucionar este inconveniente los paquetes estadísticos actuales, cuando
comprenden estudios de series, utilizan adaptaciones de los métodos de regresión
al caso de existencia de correlaciones entre observaciones, evitando así estas
deformaciones. Además de eliminar previamente la estacionalidad, mediante
suavizamientos adecuados generalmente con el uso de medias móviles, pues en
caso contrario puede deformar las estimaciones por ser un movimiento oscilatorio
alrededor de la línea de ajuste, que es generalmente muy fuerte.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Contar con una estimación de la tendencia de la serie permite efectuar
consideraciones acerca del crecimiento subyacente de la misma. En este aspecto,
debe hacerse la aclaración de que las herramientas de descomposición de series
de tiempo, disponibles hasta este momento en la mayor parte de los sistemas de
programas estadísticos comerciales, realizan una estimación de la tendencia y del
ciclo en forma conjunta(medias móviles con correspondiente al período
estacional), es decir, se obtiene una descomposición de las series en componente
estacional, componente irregular y componente tendencia-ciclo, donde se pierde la
característica periódica del ciclo en la estimación [11].
Otro de los métodos que pueden emplearse para ajustar la tendencia ( ) en una
serie es el método de las dos medias [26, 33].
El método de las dos medias consiste en separar las observaciones en dos grupos
(preferiblemente iguales) y calcular la media aritmética de cada uno de los grupos,
obteniéndose así dos puntos [65]. La línea de tendencia se halla entonces
haciendo pasar una recta por los dos puntos hallados.
La recta que pase por los dos puntos se determinará analíticamente mediante la
expresión general:
Donde y son las coordenadas de los dos puntos,
respectivamente. Gráficamente, la línea de tendencia puede hallarse simplemente
uniendo los dos puntos por una recta. Este método es muy utilizado si no se
requiere una buena estimación de la tendencia sino sólo su signo de crecimiento
Después de detectar si una serie presenta tendencia o no y estimar la misma, es
necesario estimar la componente estacional, para lo que es necesario tener datos
de varios períodos consecutivos [69].
Para verificar la existencia de estacionalidad ( ) se puede realizar la prueba
ANOVA tomando las poblaciones como los diferentes instantes del período
Pronóstico de la producción de leche, mediante modelos ARIMA.
estacional, por ejemplo, en una serie mensual con estacionalidad anual todos los
eneros formarían una población, se debe tener en cuenta que debido a la
autocorrelación de la serie, las muestras son relacionadas y los vectores de
observaciones correlacionados, por lo que no se debe utilizar el ANOVA clásico
sino uno no paramétrico que sea más robusto.
Se demuestra que cualquier proceso periódico se puede modelar, con la precisión
deseada, mediante series de términos de funciones sinusoidales (senos y
cosenos), lo que se conoce como Series de Fourier, y se denomina espectro a la
representación de las amplitudes, en el eje de las , que constituyen los diferentes
términos de la serie (numérica) para toda la gama de frecuencias (eje de las ).
El espectro es una buena herramienta para detectar estacionalidad en una serie y
determinar su período y este está relacionado con la función de autocorrelación.
Puesto que
, obtenida la frecuencia, o frecuencias (picos en el
espectro), a partir de ésta se calcula de forma sencilla el período de las
oscilaciones en la serie de datos.
Una estimación del espectro utilizando una ventana de frecuencias que incluya la
frecuencia para la cual se obtiene el valor estimado en lugar de suavizamientos
sucesivos, la constituyen los periodogramas, la diferencia entre ellos sólo depende
de cómo se tomó y utilizó la ventana de frecuencias.
El periodograma, es un método gráfico que se asemeja a un sintonizador de un
receptor de radio, así, la serie que se observa sería la señal emitida por una radio
y el periodograma no sería más que el dial que busca en que frecuencia se
“oye”mejor la señal emitida [65].
El periodograma representa la descomposición del gráfico de la serie, considerado
como una función continua en el tiempo, en una suma de funciones periódicas y
mide las aportaciones a la varianza total de la serie, de componentes periódicos
de una frecuencia determinada. Si el periodograma presenta un “pico” en una
Pronóstico de la producción de leche, mediante modelos ARIMA.
frecuencia, indica que dicha frecuencia tiene mayor “importancia” en la serie que el
resto. (Figura No1.3)
Figura No1.3: Periodograma aplicado a una serie temporal.
En el gráfico anterior se observa que en la frecuencia 0,0833 se encuentra el pico
más alto lo que significa que el período (1/frecuencia) de longitud 12 (posiblemente
correspondiente al estacional) es el que responde al movimiento periódico más
notable en la serie, no obstante se observan también dos picos relativamente altos
en frecuencias menores (períodos mayores), que pudieran corresponder a otros
movimientos periódicos importantes.
En el caso de las frecuencias muy pequeñas es necesario ser cuidadoso, pues los
períodos tan grandes que sobrepasen la cuarta parte del tiempo de observación
de la serie, resultan poco observables y los picos en estas frecuencias se deben
más a problemas en la estimación que a movimientos reales.
Como al descomponer una función continua, en una suma de armónicos, no en
todas las frecuencias resultan aportes importantes al comportamiento generaly lo
que aporta el periodograma, es una estimación que no se sabe si es
significativamente diferente de cero, por muy distinta que sea a las de las otras
frecuencias, es importante discernir cuáles son los períodos a los cuales
responden amplitudes o intensidades significativamente mayores o notables en
este conjunto.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Si la serie presenta estacionalidad,también se hace necesario conocer la
significación del movimiento períodico con período estacional en la misma, para
todo esto se emplean el periodograma y el periodograma integrado.
El periodograma integrado, que se muestra en la figura No1.4, se utiliza para ver la
significación de las ordenadas del periodograma; este no es más que una prueba
de hipótesis gráfica, para ver la significación de cada uno de los movimientos
periódicos en que se puede descomponer la serie.
Figura No
1.4: Periodograma integrado aplicado a una serie temporal.
Las frecuencias que presentan ordenadas mayores en el periodograma tienen
mayor posibilidad de resultar significativas en el periodograma integrado. Una
frecuencia es significativa, en esta prueba, si el aumento de la ordenada de la
frecuencia anterior a la estudiada (dentro de las frecuencias trabajadas en el
periodograma) es mayor que la diferencia de ordenadas entre la diagonal y uno de
los límites de la banda de confianza en esta misma frecuencia. De los tres picos
mayores del periodograma anterior (Figura No1.3) se observa que son
significativas las frecuencias 0.0833 y la 0.022, pero la menor de estas tres
frecuencias no resulta así a pesar de que ese pico era mayor que el segundo, esto
se debe a los problemas que se señalan en las estimaciones de las ordenadas del
periodograma de frecuencias muy pequeñas.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Los valores de la variable en una serie generalmente dependen, en cierta forma,
de la magnitud de los valores anteriores; esta dependencia se debe disipar o
amortiguar al aumentar el tiempo entre ellos, bajo esa línea de pensamiento
intuitiva, también se espera, al haber estacionalidad en una serie, que los valores
separados entre sí por lapsos de tiempo iguales al período estacional, deben estar
correlacionados de alguna forma sin importar el atenuamiento de las correlaciones
hasta este retardo, ya que tienden a repetir un comportamiento similar en instantes
iguales correspondientes a cada período estacional.
La función de autocorrelación no es más que la correlación entre
y y la función de autocorrelación parcial , la correlación parcial de y
dado .(se verá posteriormente que para definir estas
funciones se asume que esta correlación no depende de t)
En caso de que exista estacionalidad en la serie, los coeficientes de
autocorrelación para un retardo igual al período estacional o un múltiplo pequeño
de este deben resultar positivos y significativamente diferentes de [46].
La correlación parcial con el retardo estacional también tendrá este
comportamiento; que estos valores de correlación se comporten en esta forma no
asegura que realmente se deba a la estacionalidad, ya que pudiera deberse a una
relación aleatoria, pero es un indicador fuerte de que esto puede ser así.
A las estimaciones puntuales de la componente estacional en los diferentes
instantes del período estacional se le llaman índices o patrones estacionales
según se den los valores en lo que provoca esta componente aislada, en
referencia a la tendencia, en ese instante, o como el valor promedio o
característico de ese momento del período estacional.
En el modelo multiplicativo los índices de variación estacional recogen el
incremento o la disminución porcentual que el componente estacional produce en
cada instante del período, es decir que porciento del valor que tendría la serie de
Pronóstico de la producción de leche, mediante modelos ARIMA.
no estar presente la estacionalidad representa lo predicho por el modelo si se
toman los índices de todo el período estacional su promedio siempre debe ser
igual a .
En el modelo aditivo los índices estacionales indican el valor en que aumenta o
disminuye la serie del valor de la tendencia a causa del componente estacional.
Estos índices siempre deberán sumar .
La estimación de la estacionalidad no se realiza solamente con el fin de
incorporarla al modelo para obtener predicciones, sino también con el fin de
eliminarla de la serie para visualizar otras componentes como tendencia y la
componente irregular, ya que se pueden confundir en las fluctuaciones
estacionales.
Las series generadas a partir de la original, por eliminación de la tendencia se
denominan “series de residuos de las medias móviles” y deberán contener
predominantemente las fluctuaciones estacionales. Para estimar la estacionalidad
se parte de estos residuos, pero se requiere haber decidido el modelo a utilizar,
lamentablemente esto no es siempre claro, ya sea porque no contamos con
información a priori para suponerlo o porque el gráfico no ha dejado evidencia
suficientemente clara, como para decidirnos por alguno de ellos. En tal situación
se propone calcular las series ajustadas por ambos modelos y elegir aquella cuyos
residuos sean menores.
La identificación y el análisis de la estacionalidad puede realizarse también
mediante el empleo de diferentes métodos gráficos como son el gráfico de cajas y
bigotes múltiples, característicos de la estadística descriptiva.
El gráfico de cajas y bigotes (Box-Plot) descrito por Jonh Tukey en 1977, resume
la información de cinco medidas estadísticas: el valor mínimo, el primer cuartil, la
mediana, el tercer cuartil y el valor máximo. No es más que un rectángulo (la caja),
donde los lados más largos muestran el recorrido intercuartílico, dividida por un
Pronóstico de la producción de leche, mediante modelos ARIMA.
segmento horizontal que indica la posición de la mediana y por lo tanto muestra
también su relación con los cuartiles primero y tercero. Este rectángulo tiene
además dos segmentos de recta, uno superior y otro inferior, que muestran los
valores mínimo y máximo de la variable. Este gráfico es muy útil, proporciona
información con respecto a la simetría o asimetría de la distribución de la variable,
permite identificar la presencia de valores atípicos o aberrantes y muestra la
variabilidad del conjunto de datos [27].
Para estudiar la estacionalidad de una serie se haría un Box-Plot múltiple, con
tantas cajas con bigotes, como instantes tenga el período estacional, cada una
reflejará el comportamiento del instante correspondiente, por ejemplo en datos
mensuales con estacionalidad anual, el gráfico tendrá un Box-Plot para enero, otro
para los febreros y así sucesivamente.
1.4 Enfoque a partir de procesos estocásticos. Proceso
estacionario de segundo orden.
Un proceso estocástico está definido como una sucesión de variables aleatorias
{ } . El subíndice no tiene, en principio, ninguna interpretación a priori,
aunque en el contexto de series temporales, cuando se habla proceso estocástico,
este subíndice representara el paso del tiempo [56, 68].
Cada una de las variables , que configuran un proceso estocástico, tendrá su
propia función de distribución con sus correspondientes momentos. Así mismo,
cada par de esas variables tendrán su correspondiente función de distribución
conjunta y sus funciones de distribución marginales. Esto mismo ocurrirá, ya no
para cada par de variables, sino para conjuntos más amplios de las mismas. De
esta forma, para caracterizar un proceso estocástico se deben especificar las
funciones de distribución conjunta de cualquier conjunto de variables
[12]:
Pronóstico de la producción de leche, mediante modelos ARIMA.
Un objetivo del estudio de las series de tiempos es realizar inferencias sobre el
proceso estocástico desconocido a partir de la serie temporal observada; el
problema radica en que prácticamente se desconocen todas las características
probabilísticas de las variables del proceso estocástico y, por otra parte,
únicamente se dispone de una realización muestral del proceso, o sea, una única
observación de cada variable del proceso; es por esta razón que es necesario
imponer toda una serie de condiciones o requisitos que permitan realizar las
inferencias de interés como son las condiciones de estacionaridad.
Un proceso estocástico es estacionario si las funciones de distribución conjuntas
finitas son invariantes con respecto a un desplazamiento en el tiempo (variación de
). Es decir, para todo natural ( ; ) tiene la misma distribución
conjunta para todo dado un fijo.
Esta definición de estacionaridad se conoce como estacionaridad en sentido
estricto o fuerte y puede relajarse sustancialmente utilizando la denominada
estacionaridad en sentido amplio o débil o estacionaridad de segundo orden. Se
dice que un proceso estocástico es débilmente estacionario si las esperanzas
matemáticas de las variables aleatorias no dependen del tiempo, son constantes,
si las varianzas tampoco dependen del tiempo y son finitas y si las covarianzas
entre dos variables aleatorias del proceso correspondientes a períodos distintos de
tiempo (distintos valores de ) solamente dependen del lapso de tiempo
transcurrido entre ellas [25].
En un proceso estacionario débil queda claro que se pueden definir las funciones
de autocorrelación y autocorrelación parcial de la serie que se evalúan en la
diferencia entre los instantes de tiempo en que se miden las variables (
y =
⁄ ) y que ya presentamos
someramente en el epígrafe anterior,ya que como las covarianzas sólo dependen
de la distancia en el tiempo entre las dos variables y la varianza es constante, las
correlaciones cumplen esta misma relación. Estas funciones tienen la misma
Pronóstico de la producción de leche, mediante modelos ARIMA.
interpretación que la correlación lineal y la correlación parcial utilizada en la
regresión.
Los paquetes de programas estadísticos comerciales, como los utilizados en este
trabajo, las dan mediante gráficos donde, en una secuencia horizontal alrededor
de la línea del cero, aparece una barra para cada retardo desde el uno a cierta
cantidad, según el programa, y una banda de confianza que permite considerar
significativamente distinta de cero la correlación para el retardo cuya barra salga
fuera de la banda.
Bajo este enfoque una serie de tiempo no sería más que la realización práctica de
un tramo finito de un proceso estacionario de segundo orden donde en general se
asume que las variables fueron observadas a distancias regulares de tiempo.
Tiene la característica de que cada variable se puede observar una sola vez, a
esta secuencia de observaciones de un tramo finito de un proceso se le llama
también trayectoria.
Esta definición de serie es demasiado restrictiva, ya que en la práctica las medias
de los variables cambian en el tiempo, en casi todas las series reales observadas,
por la presencia de componentes como la estacionalidad, la tendencia etc., por
eso se ha suavizado esta definición en diferentes formas, considerando en casi
todos los casos que se puede definir la serie, como un proceso con una
componente no aleatoria, dada por las medias de las variables del proceso, y un
proceso estacionario de segundo orden.
En la actualidad ya se trabajan algunos modelos que suavizan incluso estas
últimas restricciones como son los modelos de varianza variable (lo que implica
ampliar la definición de serie temporal) pero no serán objetivo de estudio en este
trabajo por lo que en lo adelante se continuara utilizando la definición anterior que
permite cambios solamente en las medias.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Se verá un caso particular de serie que es muy utilizado en la definición de los
diferentes modelos de series cronológicas.
El proceso de ruido blanco es un proceso formado por una secuencia de variables
aleatorias independientes e idénticamente distribuidas, con media y varianza
finitas [69], generalmente se asumen con media cero y varianza constante. Dado
que el proceso de ruido blanco no posee estructura de dependencia, no resulta
muy útil como instrumento diagnóstico, pero se utiliza su estructura para los
requerimientos de errores de casi todos los modelos definidos sobre series ya que
forman la parte no predecible por relaciones con observaciones anteriores.
En el caso de la serie ser ruido blanco no puede ser pronosticada por ningún
modelo mejor que la propia media si por el contrario esta es predecible y se puede
construir un modelo para la misma, entonces no se considera un ruido blanco [17].
1.5 Modelos Autorregresivos (AR) y de Medias Móviles (MA).
Para las series temporales existen diferentes modelos que se han venido
desarrollando, entre estos tenemos los llamados Modelos Autorregresivos o de
autorregresión (AR) ylos modelos de Medias Móviles (MA). Es importante señalar
que estos modelos no tienen relación con el alisamiento de medias móviles a
pesar de la semejanza de nombre.
Se denomina modelo Autorregresivo (AR), a la dependencia existente de la serie
temporal con los retardos o valores pasados, de la misma. El número de retardos
de la serie temporal , que se introducen en el modelo, se denomina orden
autorregresivo del modelo y se denota mediante la letra , se denominan AR( )
La palabra autorregresivo viene de que se modela este comportamiento como una
regresión lineal múltiple (regresivo) con valores propios de la misma serie temporal
(auto) retardados un período de muestreo [46]; con la diferencia de
que existe correlación no eliminable entre las variables independientes y estas
Pronóstico de la producción de leche, mediante modelos ARIMA.
intercambian su papel de dependientes a independientes según el instante
estimado.
El modelo autorregresivo tiene la siguiente forma:
donde: es un ruido blanco
Como se esperaría dada la similitud con el modelo de regresión, al no estar en el
modelo las variables , , etc. las autocorrelaciones parciales son ceros
a partir de . Esta propiedad permite que se pueda utilizar la estimación de la
autocorrelación parcial para obtener un estimado de .
Este modelo es estacionario si las raíces del polinomio asociado
están fuera del círculo unidad.
Los modelos de medias móviles (MA), son también recomendables para series de
tiempo que no presentan patrones de tendencia, estacionalidad, o ciclicidad en los
datos [8], pues siempre responden a series estacionarias.
Los procesos MA se dice que no tienen memoria, puesto que rápidamente
(dependiendo del orden) convergen hacia la media y la varianza del proceso [22],
y tiene la siguiente forma:
donde es un ruido blanco.
La función de autocorrelación es la que se utiliza en este caso para determinar
cuál podría ser el orden del modelo de medias móviles que corresponde con el
último retardo con correlación significativa. Esto se debe a que es un ruido
blanco y por tanto y resultan incorrelacionados si , ahora bien como
está formada por una combinación de ruidos con subíndices de a
Pronóstico de la producción de leche, mediante modelos ARIMA.
, ninguno de estos ruidos coincide con los que forman y las variables
y , al estar formadas por dos combinaciones de ruidos sin ningún término
coincidente, resultan independientes.
Después de determinar el orden del modelo en cada caso se pasan a estimar los
coeficientes del mismo, en el caso del AR( ) mediante un método similar al de
regresión pero que tiene en cuenta la existencia de autocorrelaciones y que parte
precisamente de la estimación de esta función y en los modelos MA( ) por un
método numérico iterativo, estos métodos aparecen en los paquetes estadísticos
para su uso directo a partir de la declaración del órden y su estudio no va a ser
objetivo del presente trabajo.
Tanto en los modelos AR( ) como en los MA( ) generalmente se asume que el
ruido blanco es gaussiano con media cero.
1.6 Modelo Autorregresivo de Medias Móviles (ARMA).
Entre los modelos de series temporales se encuentran también los modelos ARMA
y los modelos ARIMA.
Como parte de los modelos de series temporales, los modelos ARMA
(Autorregresivo de Medias Móviles), no presentan tendencia ni estacionalidad y es
considerado un modelo lineal; esto significa que la variable que define la serie
temporal depende de una constante , linealmente de valores pasados de la
misma variable y linealmente de una ponderación de errores de ajuste realizados
en el pasado [9], es decir de una combinación de un autorregresivo con media
cero más un media móvil que puede incluir una constante (media). En este trabajo
se considerara .
Para comprobar si una serie se ajusta por un ARMA es necesario comprobar la
estacionaridad de la serie, o sea que esta tenga media y varianza constantes en el
tiempo.
Pronóstico de la producción de leche, mediante modelos ARIMA.
El esquema general del modelo es el siguiente:
El término que corresponde al ruido en el mismo momento en el que se estima
el nuevo valor de la variable [61] y representa el error del modelo a la hora de
ajustar la serie.
Al igual que en el autorregresivo la diferencia de este modelo con los modelos
clásicos de regresión está en que, en la serie, las observaciones están
correlacionadas en el tiempo y en la regresión se estima a partir de una muestra
independiente de puntos, además de que los no se observan.
El proceso de estimación de los parámetros comienza por la estimación de los
órdenes y para lo que se tiene que la función de autocorrelación de un
ARMA( ) tiene la misma característica de la de un MA( ) y su función de
autocorrelaciones parciales presenta la forma de la de un AR( )
1.7 Series no estacionarias en media. Diferencias estacionales y
no estacionales.
Cuando se habla de modelos estacionarios se refieren a aquellos que revierten a
una media, mientras que los no estacionarios, no tienen una media común para
todos los instantes, ya sea por un movimiento de tendencia, de estacionalidad u
otro. La tendencia se puede eliminar de la serie mediante la aplicación de
diferencias no estacionales, la diferencia no estacional es la serie de las
diferencias .
La serie de estas diferencias tiene un polinomio de tendencia un grado menor que
la anterior; luego si se quiere eliminar completamente esta componente, se harán
tantas diferencias como grado tenga el polinomio de tendencia original.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Para eliminar la estacionalidad se utilizan las diferencias estacionales. La
diferencia estacional es la serie de las diferencias , donde es el período
estacional; esta diferencia elimina o disminuye el movimiento estacional y la serie
obtenida es un año más corta que la serie original.
El problema que se presenta al analizar series temporales con un posible
componente estacional o de tendencia es que este sea tan fuerte que implique
una variación de la media (global) en el tiempo. En este caso se requerirán
diferencias estacionales ( ) o no estacionales ( ) para que la serie resultante sea
estacionaria. En un modelo de serie temporal el objetivo de la diferenciación es
hacer que la misma se estabilice y se convierta en estacionaria.
Si se tiene una tendencia polinomial el tipo de tendencia equivale al grado u orden
del polinomio a ser ajustado a la serie, se considera tendencia lineal en la serie si
el grado de polinomio es , si el grado del polinomio es la tendencia se considera
cuadrática y si es cúbica el grado polinomial es y el grado del polinomio de
tendencia se corresponde con el número de diferencias no estacionales que hay
que hacer para eliminar esta tendencia.
En caso de existir estacionalidad se harán diferencias estacionales mientras esta
persista, otra forma de eliminar la misma es mediante la aplicación de un modelo
ARMA estacional (ARMA( )) donde la serie se considera formada por los k-
uplos de cada repetición del período estacional o por combinación de ambos
métodos.
Debe considerarse que con la aplicación de estas diferencias se producen
perdidas de secuencias de valores de la serie y que mientras mayores sean la
cantidad de diferencias o los órdenes del ARMA estacional se pierden más valores
en la serie (uno por cada diferencia no estacional y por cada diferencia
estacional o por cada unidad de la suma de los dos órdenes del ARMA estacional)
para realizar el análisis posteriormente; a pesar de este inconveniente por el hecho
de incluir este tipo de diferencias en la estimación del modelo ARIMA, como un
Pronóstico de la producción de leche, mediante modelos ARIMA.
parámetro, lo hacen ser muy empleado, ya que modela series que no son
estacionarias en media.
1.8 Autorregresivo Integrado de Medias Móviles (ARIMA).
“A comienzo de los años 70, G.E.P. Box, profesor de Estadística de la Universidad
de Wisconsin, y G.M. Jenkins, profesor de Ingeniería de Sistemas de la
Universidad de Lancaster, introdujeron una pequeña revolución en el enfoque del
análisis de series temporales, en sus trabajos sobre el comportamiento de la
contaminación en la bahía de San Francisco, con el propósito de establecer
mejores mecanismos de pronóstico y control. El libro, “Time Series Analysis,
Forecasting and Control.”, escrito por Box- Jenkins en 1976 [15], en el que
describen la metodología, se convirtió rápidamente en un clásico, y sus
procedimientos se utilizan ampliamente desde entonces, en diferentes ramas de la
ciencia, conociéndose como modelos ARIMA y también como modelos Box-
Jenkins” [47].
En un modelo ARIMA se considera que el comportamiento de la variable, en
cualquier momento del tiempo, está influenciado por las observaciones de la
propia variable (recientes o remotas), incorporadas a un modelo mediante los
términos autorregresivos (AR) y los errores o influencia de los elementos
aleatorios (recientes o remotos) que se representan con los términos de medias
móviles (MA) [16].Pero también existen componentes de tendencia y
estacionalidad que se adicionan al modelo ARMA, por eso recibe el nombre de
integrado. En su concepción más amplia concibe la unión de un arma con un arma
adicionando además tendencia y estacionalidad.
La principal ventaja de esta metodología es que proporciona predicciones
generalmente buenas en el plazo inmediato a mediano. Esto se debe a que la
metodología Box-Jenkins permite elegir entre un amplio rango de distintos
modelos según represente mejor el comportamiento de los datos [48].
Pronóstico de la producción de leche, mediante modelos ARIMA.
Los Modelos Autorregresivos Integrados de Medias Móviles (ARIMA) presentan
inconvenientes metodológicos y de orden práctico, como son la gran cantidad de
datos necesarios por fase a analizar para establecer significación estadística, Box
y Jenkins (1970) establecen un mínimo de 100 datos, mientras Glass, Wilson y
Gottman (1975) lo hacen a partir de un mínimo de 50 observaciones [20, 67].En la
práctica se evidencia que para aplicar un modelo ARIMA se debe tener un mínimo
de 10 períodos estacionales
El procesamiento de estimación en el caso del ARIMA comienza por eliminar la
tendencia por diferencias no estacionales ( ) sucesivas, como ya se vio
tantas como el orden del polinomio de tendencia, y la estacionalidad mediante
diferencias estacionales donde es la longitud del período estacional, para
obtener un proceso con las características del ARMA, que se ajusta utilizando los
estimadores del mismo [60].
El método que será planteado a continuación es una forma de trabajo alternativo,
que no es lo clásico de un modelo ARIMA y solo tiene ventajas cuando la
tendencia no se ajusta bien por un polinomio de grado bajo (hasta ) y no es objeto
de estudio en el trabajo desarrollado.
Habitualmente, cuando una serie muestra tendencia, se subdivide dicha serie en
dos componentes: una primera, la estimación de dicha tendencia y la segunda, el
residuo o error que se comete cuando se utiliza dicha tendencia como valor
estimado de la serie original. Si además presenta una estacionalidad marcada se
trabajará la estimación de la tendencia con las medias móviles.
Una vez estimada la tendencia, aproximada con una regresión lineal, parabólica,
exponencial o la que sea más conveniente; se trabaja con la serie del residuo,
que entonces no mostrara tendencia y se puede decir que es estacionaria en
media. Es sobre este residuo sobre el que se lleva a cabo la metodología de
identificación ARIMA, sumando finalmente el valor de la tendencia estimada si se
quieren dar resultados de estimación de la serie original; es decir: . La
Pronóstico de la producción de leche, mediante modelos ARIMA.
identificación del proceso ARIMA se hará sobre esta serie del residuo
estimada previamente la tendencia del modo más adecuado.
Para obtener valores estimados de la serie original, se suma el componente
tendencial al valor estimado del residuo mediante el modelo ARIMA [1,
24].
En este trabajo el método ARIMA se trabaja por diferencias para la eliminación de
ambas componentes no estacionarias, es decir, sin previo ajuste de tendencia ni
modelos ARMA estacionales.
El incumplimiento de la condición de estacionariedad sólo afecta a la componente
AR del proceso ARIMA, ya que la componente MA siempre es estacionaria.
En un modelo ARIMA se necesita identificar los órdenes y estimar los coeficientes,
el resultado de regresiones que se utilizarán y es muy sensible a la precisión con
que se determinen sus órdenes, suele expresarse como ARIMA( )( )
donde los órdenes , y son números enteros no negativos que indican el orden
de las distintas componentes del modelo no estacional, orden de la componente
autorregresiva, grado del polinomio de tendencia y orden de media móvil
respectivamente y ( ) corresponden a los parámetros del modelo estacional,
orden de la componente autorregresiva estacional, número de diferencias
estacionales y orden de media móvil estacional respectivamente y es, como
siempre, la longitud del período estacional
Para elegir los parámetros , y se debe ser muy cuidadoso, pues, como ya se
señaló, cada aumento en una unidad en alguno de los tres parámetros reduce un
año de observaciones de las que se dispondrán para estimar luego los
coeficientes del modelo, es por esto que su suma debe ser pequeña.
Generalmente el aumento en estos parámetros se plantea por la presencia
mantenida de la estacionalidad luego de la primera diferencia estacional y, como
no se acostumbra a utilizar modelos donde esta suma sea mayor de , se pueden
Pronóstico de la producción de leche, mediante modelos ARIMA.
determinar por comparación de los modelos posibles. Si la serie es muy corta (no
más de 6 períodos estacionales) no se usan sumas mayores de
Cuando se han obtenido los 6 parámetros y en aras de lograr simplicidad para
reducir errores de estimación, el ajuste del modelo se compara con el de modelos
de órdenes menores a los obtenidos en el estudio inicial.
Si se denota ARIMA( ); cuando alguno de los tres parámetros
de un ARIMA( ) es , es común omitir las letras correspondientes del
acrónimo, AR para la componente autorregresiva, la letra I para la integrada y MA
para la media móvil; de hecho muchos autores lo hacen, por ejemplo en caso de
tener un modelo ARIMA( )( ), lo tratan como ARMA( ) y un
ARIMA( )( ) como MA( ).
1.9 Criterios de selección.
Dentro de los criterios de selección de modelo se encuentra un método para la
comparación de modelos basado en la teoría de la información, este método es
conocido como criterio de selección de Akaike, llamado también , por sus
siglas en inglés.
El método permite determinar cuál modelo es el más parecido al correcto y
cuantificar su parecido.
La base teórica del método , combina la teoría de máxima verosimilitud, la de
la información y el concepto de entropía de la información.
El modelo está definido por la ecuación:
(
)
Donde es el número de datos, es el número de parámetros de la ecuación de
ajuste a la regresión más uno, porque en la regresión se estima el número de
Pronóstico de la producción de leche, mediante modelos ARIMA.
parámetros más la suma de cuadrados, y es la suma de cuadrados de las
distancias verticales de los puntos a la curva [4].
Si se analiza la ecuación del modelo se puede apreciar que su valor estará
dado en unidades relacionadas mediante un logaritmo con el cuadrado de las
unidades en las cuales los datos fueron tomados, por lo que, el no puede ser
interpretado como un valor individual. El valor final puede resultar positivo o
negativo; por tanto el criterio cobra verdadera importancia cuando se comparan los
modelos, para esto se trabaja con las diferencias entre los [5].
Cuando se está en presencia de varios modelos lo que se hace es calcular los
individuales de cada uno y se tomara como modelo correcto el de menor valor.
Otros métodos utilizados como criterios de selección es la comparación de errores
y las medidas de precisión del pronóstico, utilizadas para determinar qué tan eficaz
es un pronóstico a través del cálculo de su precisión con respecto a los valores
reales, o sea, con estas se busca obtener una medida de qué tan lejos se
encuentran los valores pronosticados de los obtenidos en la realidad. Se
seleccionará el modelo que se estime más cercano a la realidad.
Con las medidas de precisión se halla el error de pronóstico, o lo que es lo mismo,
la diferencia entre el valor real y el pronosticado del período correspondiente.
Donde es el error del pronóstico del período , es el valor real para ese
período y el valor que se había pronosticado.
Entre estas medidas se encuentran:
Error Medio ( ): ∑
Error Medio Absoluto ( ): ∑ | |
Pronóstico de la producción de leche, mediante modelos ARIMA.
Error Medio Absoluto Porcentual ( ): ∑ |
|
Error Medio Porcentual ( ): ∑
Error Cuadrático Medio ( ): ∑
Raíz del Error Cuadrático Medio ( ): √
Vale aclarar que en estas fórmulas no corresponden al largo de la serie si no sólo
a la cantidad de valores pronosticados por pronóstico de valor inmediato (Valor del
tiempo según modelo teniendo los datos hasta ) dentro de la trayectoria
observada.
Capítulo 2
Materiales y Métodos
2.1 Área de Estudio.
El estudio fue realizado en la UBPC “Maniabo”, ubicada en los 20.6º de Latitud
Norte, 76.0 º de Longitud Oeste a 86 metros sobre el nivel del mar, en el Municipio
y Provincia de Las Tunas, esta entidad perteneció a la Empresa Cuenca Lechera
Pronóstico de la producción de leche, mediante modelos ARIMA.
hasta Julio del 2009 y actualmente pertenece a la empresa agropecuaria Las
Tunas.
Figura No 2.1: Ubicación de la provincia Las Tunas dentro del territorio nacional.
Su principal objeto social es la producción de leche y durante su desarrollo ha
obtenido resultados ascendentes, que la han colocado entre las primeras
productoras del país [28]. Cuenta además con una producción variada que incluye
huevos, carne, cultivos varios, tabaco, humus, pies de cría y materia orgánica, un
reflejo claro de la diversificación de sus producciones. Del total de producción de la
entidad, la producción de leche representa el 35% de su producción mercantil.
Desde 1993 cuenta con un módulo pecuario, un centro de lombricultura, un
autoconsumo y está compuesta por siete vaquerías, tres microvaquerías, un
centro de destete y dos centros de desarrollo y el último cambio tecnológico
desarrollado en la entidad fue antes de este año.
Su masa ganadera está compuesta por 3 898 cabezas de bovinos, 43 equinos, 1
025 ovino-caprinos, 257 porcinos, 1 450 aves y 156 conejos, cuenta además con
301 cooperativistas, de los cuales el 100% de la fuerza está vinculada a los
resultados finales de la producción. Las razas predominantes son el Mestizo
Siboney, Mestizo Holstein y el Cebú Lechero.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Para su desarrollo la entidad cuenta con un área total de 1 948 ha y de ellas 1 821
ha se emplean en la agricultura, a la ganadería vacuna están dedicadas 1 656, de
ellas con 399.9 ha de pastos naturales que representa un 24.1 % y 1 256.1 con
pastos artificiales que constituyen el 75.9 %; el área forrajera es de 81.8 ha, el CT-
115 y el King Grass ocupan 36.2 ha y 45.6 ha lo ocupa la caña forrajera.
El territorio donde se encuentra ubicada la UBPC es considerablemente llano, solo
con ondulaciones y cerros aislados, con una media anual de precipitaciones es de
900 mm como máximo y una temperatura anual oscilante entre los 28°C y 34°C y
su red fluvial es poco desarrollada, formada solo por ríos de poco caudal, tiene
además diferentes tipos de suelos, como son pardos grisáceos, vertisuelos y los
fersialíticos, los que presentan factores limitantes que disminuyen su fertilidad [37].
2.2 Recolección de Datos
Para el desarrollo del trabajo se realizó la investigación en la Empresa Pecuaria
Cuenca Lechera de Las Tunas, a la cual perteneció la UBPC “Maniabo” y los
datos se obtuvieron de los boletines técnicos de la UBPC, donde se reportaban un
total de 19 variables productivas relacionadas con los indicadores de producción
de leche, el rebaño, la reproducción y la situación de los pastos y forrajes. Se
obtuvieron las variables climáticas con el Instituto de Meteorología y el Instituto
Nacional de Recursos Hidráulicos (INRI) de Las Tunas.
Se creó una base de datos, organizada como una matriz y para cada uno de los
años y meses se evaluaron las variables:
1. Producción de leche en litros (l)
2. Vacas en ordeño (cabezas)
3. Nacimientos (cabezas )
4. Muertes (cabezas)
Pronóstico de la producción de leche, mediante modelos ARIMA.
5. Litros por vaca (l)
Una vez determinados estos aspectos se identifica la serie de producción de
leche, se realiza un análisis descriptivo de la misma y se aplican métodos, para su
estudio y predicción, que se explicaran en acápites posteriores del trabajo.
2.3 Métodos estadísticos.
En el desarrollo del trabajo y para lograr finalmente el pronóstico de la producción
de leche, se utilizaron varios métodos estadísticos descriptivos para analizar el
comportamiento de los datos, se calcularon los estadígrafos más importantes
(media, desviación estándar y coeficiente de variación) y se realizó un análisis de
regresión lineal múltiple con uso de componentes principales, para determinar
cuáles variables ejercían mayor influencia en la producción de leche.
Se emplearon los gráficos Box-Plot, para realizar su análisis descriptivo y para
comprobar si la serie presentaba tendencia o no, se empleó el método de
suavizamiento polinomial, para tres grados de polinomios diferentes (n=1, 3 y 5) y
también se usaron periodogramas para comprobar la existencia de estacionalidad
Posteriormente para realizar el pronóstico se aplicaron los modelos ARIMA, de
series temporales, también llamados modelos Box-Jenkins y se comprobó la
normalidad de los residuos del modelo ajustado mediante la prueba Normal
Probability Plot.
El modelo elegido mediante los modelos ARIMA, se valida contra los datos
históricos para ver si describe la serie con precisión.
Todos los resultados fueron procesados en los diferentes paquetes estadísticos,
Minitab 15, R versión 2.15.0, el STATGRAPHICS Centurión XV.II y el Microsoft
Excel 2007.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Capítulo 3
Resultados y Discusión
3.1 Metodología de análisis en una UBPC.
Para realizar el estudio y pronóstico de la producción de leche en una UBPC,
mediante los modelos ARIMA se propone una metodología de trabajo compuesta
por las etapas de la figura No3.1, que aparece a continuación.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Figura No3.1: Pasos de la metodología de los modelos ARIMA de series temporales.
Para llevar a cabo el desarrollo de esta metodología se debe comenzar por
analizar a partir de qué año las condiciones bajo las cuales se desarrolla la serie,
son las mismas para poder considerar estabilidad en la misma; luego de
seleccionar el tiempo del estudio se verá la existencia de información en los
indicadores que se entiendan como relacionados y la observación de presencia de
datos aberrantes que puedan considerarse errores en la información.
Se propone que para el trabajo, con esta metodología, el tiempo además de ser
estable y con información adecuada, no debe ser menor de 10 años.
A continuación se construye la base de datos mensuales colocando los mismos en
forma de matriz con los indicadores por columnas y los tiempos de observación
por filas.
Luego se realiza un estudio descriptivo la variable a pronosticar, que debe incluir
los principales estadígrafos a nivel mensual.
Analisis descriptivo general y temporal.
• Utizacion de los gráficos Box-Plot.
• Detección y estimación de tendencia y estacionalidad.
Identificación del modelo y
estimación de parámetros.
• Comparación de diferentes modelos.
Predicción de la produccion de
leche
• Validación del pronóstico realizado
Pronóstico de la producción de leche, mediante modelos ARIMA.
Posteriormente se debe realizar un estudio descriptivo temporal dentro del cual se
recomienda el uso de gráficos de los Box-Plot de los diferentes meses y otro de
los diferentes años de la producción de leche en el período como los utilizados en
el estudio de “Maniabo”, pues son muy ilustrativos del comportamiento estacional y
tendencial en el período.
Se recomienda además buscar las relaciones de la producción de leche con otras
variables ya que podrían aparecer relaciones fuertes con variables fácilmente
predecibles que permitirían modelos multivariados de pronósticos o al menos
ayudar a sugerir que medidas se pudieran tomar si los pronósticos encontrados no
son económicamente satisfactorios.
Posteriormente se continúa el estudio de la serie de producción de leche, para lo
que se sugiere comprobar el análisis inicial de la existencia de tendencia, a través
del uso de los suavizamientos polinomiales y de estacionalidad por diferentes
métodos, como son el observacional o el periodograma simple y el integrado.
En caso de comprobarse la existencia de estas componentes (tendencia y
estacionalidad) deben ser estimadas para el análisis del comportamiento de la
producción de leche de la unidad, para ello se propone utilizar los modelos
clásicos de serie incluidos en casi todos los paquetes de programas estadísticos
comerciales y en los software libres como R; en ellos se solicitarán los índices
estacionales del tipo que la observación del gráfico general de la serie sugiera
(aditivo o multiplicativo) y la tendencia podrá modelarse de acuerdo al polinomio
encontrado en el suavizamiento polinomial.
Para obtener el pronóstico en el tiempo deseado se seleccionara un modelo
ARIMA, obteniéndose primero el parámetro por el orden del polinomio de
tendencia, tomando si hay estacionalidad, si la serie tiene mucho más de 10
años se pudiera tomar una mayor en caso de que los residuos presentaran
estacionalidad.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Teniendo esto se analizan los órdenes y del modelo por los valores
significativos de las funciones de autocorrelación parcial y autocorrelación de la
serie diferenciada respectivamente, y se deben tomar como 0, ya que las
series nunca serán tan largas.
Una vez determinados los parámetros ( y ) se probaran otros modelos más
simples (reduciendo el valor de los parámetros obtenidos) y se seleccionara,
dentro de todos ellos, el que tenga menores valores en los errores clásicos, sobre
todo en el medio absoluto y el medio absoluto porcentual.
Se deben comprobar los supuestos del ruido blanco en los residuos del modelo
seleccionado aplicando la prueba de las rachas y una prueba de normalidad.
La validación del pronóstico obtenido, estará dada por la importancia del monto de
estos errores desde el punto de vista de un cambio de esta magnitud en la
producción de leche en comparación con los valores obtenidos en el proceso
descriptivo inicial, además serán mostrados (puede ser de forma gráfica) los
intervalos de confianza al 95% (habitual en la rama pecuaria y la económica) para
los pronósticos obtenidos.
3.2 Estudio del caso UBPC “Maniabo”
Se presenta un análisis descriptivo de la variable producción de leche para tener
una base valorativa de los resultados posteriores del pronóstico de la misma y el
estudio de las relaciones con otras variables para valorar otras posibilidades de
modelos de predicción.
Años
N
Producción de leche
Media D.E. CV
1994 12 91550 40330.8 44.05
1995 12 58600 27666.03 47.21
1996 12 77550 35731.46 46.08
1997 12 83425 35309.9 42.33
1998 12 93175 48147.48 51.67
Pronóstico de la producción de leche, mediante modelos ARIMA.
Tabla No 3.1: Estadígrafos de la variable producción de leche(l) en la UBPC
“Maniabo” en los años 1994-2010.
Para la variable producción de leche la media de producción por mes en el año se
mantiene bastante estable en el período estudiado (generalmente algo por debajo
de los 100000 litros) y aunque se reportan en forma consecutiva tres de los
valores más bajos de la serie en los tres últimos años y los mayores valores
agrupados en la mitad central de la misma no se consideran un fenómeno notable
en esta serie donde se espera una relación con los ciclos hiperanuales de la lluvia,
que en Cuba tienen una duración que oscila entre 11 y 23 años aproximadamente
y se dividen en un semiciclo lluvioso y otro poco lluvioso de años consecutivos con
la misma naturaleza hidrológica, entre otras variables. El rango de mayor
diferencia fue de 61433 litros y correspondió a los años 1995 y 2003. (Tabla
No3.1). Por otra parte el año de mayor variabilidad en este indicador fue el 2005
con un CV=59.5%, aunque este estadígrafo siempre fue superior a 27%.
1999 12 73116.67 33958.69 46.44
2000 12 83341.67 39709.2 47.65
2001 12 105758.3 35675.19 33.73
2002 12 97616.67 41981.92 43.01
2003 12 120033.3 45443.92 37.86
2004 12 113666.7 46568.08 40.97
2005 12 83391.67 49615.27 59.5
2006 12 84291.67 43356.82 51.44
2007 12 88350 24505.31 27.74
2008 12 78016.67 29518.43 37.84
2009 12 63333.33 26529.1 41.89
2010 12 67350 35176.04 52.23
Pronóstico de la producción de leche, mediante modelos ARIMA.
A continuación se estudian algunas posibles relaciones entre los litros de leche
producidos y otros indicadores asociados al comportamiento de la unidad
productiva.
En el caso de las vacas en ordeño (Anexo No1) en el año 1994 fue donde
existieron más animales de esta categoría, aunque no es el año de mayor
producción este coincide con una de las más altas producciones de leche en el
período, la coincidencia no tiene por qué ser total pues una vaca en ordeño no
siempre da la misma cantidad de leche, de todos modos puede observarse que los
años del 2001 al 2004, período de alta productividad de leche corresponden a
valores altos de esta variable. En las unidades de esta empresa siempre hubo mas
de 400 vacas en ordeño, como promedio anual.
En la figura No 3.2 se observa que las vacas en ordeño y la producción de leche
no muestran marcadas variaciones en los años estudiados. En el período
comprendido del 2006 al 2010 se observa una disminucion de las vacas en ordeño
y una producción de leche ligeramente baja pero relativamente estable, que osciló
entre los 808200 - 1011500 litros de leche.
Figura No 3.2: Relación entre vacas en ordeño y la producción leche.
0.00
200000.00
400000.00
600000.00
800000.00
1000000.00
1200000.00
1400000.00
1600000.00
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
Vacas en ordeño Producción de leche
Pronóstico de la producción de leche, mediante modelos ARIMA.
Para analizar la influencia de la variable muertes, nacimientos, vacas en ordeño y
litros por vaca, como variables independientes, en la producción de leche, se
realizó un análisis de regresión lineal múltiple; las variables altamente significativas
( ) para explicar la producción de leche fueron los litros de leche por vaca
y las vacas en ordeño (Tabla No 3.2).
Variables independientes
Coeficiente de Estimación
Error Estándar
Valor de P
Constante -83813.4 2394.74 0.00
Litros de leche por vacas
17.65 0.30 0.00
Muertes 22.16 15.70 0.16
Nacimientos 2.56 13.59 0.85
Vacas en ordeño
147.34 3.89 0.00
Tabla No 3.2: Resumen del Análisis de Regresión Lineal Múltiple.
Por la correlación existente entre estas dos variables, se obtuvo la ecuación de
regresión a partir de un análisis de componentes principales, quedando:
El coeficiente de determinación obtenido fue de 97.40%
Para obtener un buen modelo para el pronóstico de producción de leche, se
tuvieron que incluir las variables vacas en ordeño y litros por vaca, ya que se vio
que la relación con vacas en ordeño no era tan estrecha (Figura No3.2) y la
variable litros por vaca es aún más difícil de predecir que la misma producción de
leche, por lo que la ecuación obtenida no brinda un instrumento de pronóstico.
En Cuba, en las estaciones del año solo resultan contrastantes dos épocas o
períodos, el período lluvioso, que abarca desde segunda mitad del mes de mayo
hasta octubre y el período poco lluvioso desde noviembre hasta la primera mitad
de mayo. Estos factores climatológicos van a influir en la producción de leche,
pues ellos ejercen influencia sobre el comportamiento productivo de los animales.
Pronóstico de la producción de leche, mediante modelos ARIMA.
En los gráficos Box-Plot, contenidos en la figura No3.3, se muestra el
comportamiento mensual y anual de la serie de producción de leche.
Figura No3.3: Comportamiento de la producción de leche en la UBPC”Maniabo” en
el período 1994-2010 anual y mensual.
Durante la época lluviosa, donde los animales disponen de abundantes fuentes de
alimentación con un mayor rendimiento y calidad de los pastos, ocurren las
mayores manifestaciones de altas producciones de leche; no siendo así en la
época poco lluviosa, donde se cuenta con una menor disponibilidad de pastos y
esto repercute negativamente en la producción de leche, ya que los animales que
no reciben una suplementación adecuada [23, 32].
Se puede apreciar que los meses de mayor producción de leche son los del
período Julio-Octubre, con un rango de producción entre los 2113000 y 2135200
litros de leche, que como se aprecia coinciden con el período lluvioso en el país,
se puede observar también que los meses de menor producción fueron los meses
de Enero, Febrero, Marzo y Abril con un rango de producción entre los 745600 y
los960900 litros de leche, que coincide con el período poco lluvioso.(Gráfico 1 de
la figura No3.3)
Pronóstico de la producción de leche, mediante modelos ARIMA.
Desde el punto de vista climático, las precipitaciones son el elemento de mayor
variación espacio–temporal del clima de Cuba y por tanto, determina las
principales regularidades del clima local en las diferentes zonas del país. La
provincia de Las Tunas, no es una excepción de lo anterior y muestra una
marcada diferencia en la distribución de sus precipitaciones anuales [30, 63] lo que
provoca cambios en la calidad y cantidad de los pastos. Estas fluctuaciones
estacionales, que dependen de la duración del período poco lluviosa, se refleja
también en cambios drásticos en la producción de pastos, el peso vivo de los
animales y la producción de leche en los vacunos, aspecto que repercute en las
pérdidas de la masa por muertes.
La UBPC “Maniabo”, después de irse recuperando poco a poco de las bajas
producciones hasta lograr alcanzar el pico de producción de leche en el 2003, tuvo
una recaída en el año 2005 comenzando nuevamente un decrecimiento
productivo progresivo, debido a la ocurrencia de las bajas precipitaciones, los altos
valores de humedad del aire, (69% y 82% como promedio), unido a las altas
temperaturas con valores comprendidos entre 33.2 oC a 38.1oC.
El análisis de series de tiempo necesita de series consistentes y estables, lo que
incrementa la confiabilidad de los resultados. Adicionalmente, la aplicación de los
modelos de Box y Jenkins impone disponer de un gran número de observaciones
(generalmente más de 50) [55].
Para que una serie sea considerada consistente y estable, los factores externos,
que puedan afectar la misma, no deben tener diferente naturaleza en los distintos
instantes de tiempo. Los cambios en la serie temporal no siempre se deben a sus
propias leyes de comportamiento y para considerarlas estables y consistentes es
necesario que estas no cambien en el período formado por el estudiado junto con
el pronosticado.
En lafigura No 3.4 se muestra el comportamiento de serie de producción de leche,
de la UBPC “Maniabo”, correspondiente a los datos mensuales de los años del
Pronóstico de la producción de leche, mediante modelos ARIMA.
1994 al 2010, donde se evidencian los movimientos oscilatorios de la producción
previstos en los Box-Plot y desde el punto de vista observacional muestra la no
presencia de tendencia. Como sugerían los Box-Plot anuales (Gráfico 2 de la
figura No 3.3)
Pronóstico de la producción de leche, mediante modelos ARIMA.
Figura No 3.4: Comportamiento de la producción de leche en la UBPC”Maniabo” en
el período 1994-2010.
0.00
20000.00
40000.00
60000.00
80000.00
100000.00
120000.00
140000.00
160000.00
180000.00
200000.00
1 6 11 4 9 2 7 12 5 10 3 8 1 6 11 4 9 2 7 12 5 10 3 8 1 6 11 4 9 2 7 12 5 10 3 8 1 6 11 4 9
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Pro
du
cció
n d
e le
che
Pronóstico de la producción de leche, mediante modelos ARIMA.
Para comprobar la no presencia de tendencia en la serie se empleó el método de
suavizamiento polinomial, el cual se ajustaron curvas de diferentes grados
(polinomios) a los valores de la variable contenidos en la serie.
Para apreciar el efecto de suavizamiento se aplicaron polinomios de grado
diferentes , , y , en los tres casos los puntos en el gráfico
representan la serie original y los puntos producidos por el polinomio para cada
momento fueron enlazados con una línea continua. Con los suavizamientos con
y el polinomio produce curvas propias de el mismo que, además de no
comportarse de forma similar en ambos casos, desaparece con la aplicación del
polinomio de , que es el más estricto, pues mientras menor es el valor de ,
la fuerza de aislamiento producida por la serie será mayor, con esto se comprueba
que la serie no presenta tendencia. (Figura No 3.5, Figura No 3.6, Figura No 3.7)
Figura No 3.5: Suavizamiemto polinomial de la serie de producción de leche con
n=5.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Figura No 3.6: Suavizamiemto polinomial de la serie de producción de leche con
n=3.
Figura No 3.7: Suavizamiemto polinomial de la serie de producción de leche con
n=1.
Esta serie fue considerada consistente y estable, además de no presentar
tendencia ni valores aberrantes y estar compuesta por 504 observaciones, que
son consideradas suficientes para realizar el análisis de una serie temporal.
Es necesario entonces comprobar si en la serie hay presencia de estacionalidad,
la estacionalidad ( ) en una serie temporal, es aquella componente de
movimiento, donde la variable tiene movimientos periódicos fuertes y de períodos
generalmente conocidos.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Para detectar la presencia de estacionalidad en una serie, primeramente se
analiza visualmente el gráfico de la serie original [33] (Figura No 3.4) y de haber
dudas se utilizan los periodogramas.
En el trabajo se detectó la estacionalidad mediante el método observacional, por lo
que se tienen en cuenta los resultados mostrados en el primer gráfico de la figura
No3.3, donde se observa que los meses de mayores valores de producción son de
Julio a Octubre, que también se conoce que pertenecen al período lluvioso del
país y en el período poco lluviosa, o sea los meses de Enero a Abril la producción
de leche tiende a disminuir, evidenciando esto que la serie tiene un
comportamiento similar cada cierto período de tiempo.
Con el periodograma mostrado en la figura No 3.8 se confirmó el período
estacional que presento la serie (de izquierda a derecha aumenta la frecuencia y
disminuye el período), es de 12 meses (frecuencia 0.833), como el movimiento
periódico más importante en la serie analizada.
Figura No 3.8: Periodograma de la serie de producción de leche de 1994 al 2010.
Se observan, en la tabla No 3.3,tres valores de frecuencia que corresponden a las
mayores ordenadas, con las cuales se calcularon los períodos correspondientes.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Frecuencia Período
0.0049 204.0
0.024 40.8
0.0833 12 Tabla No 3.3: Frecuencias correspondientes a las mayores ordenadas del
periodograma de la serie de producción de leche.
Para valores de frecuencias de 0.0049, 0.024, 0.0833, los cálculos arrojan
resultados de períodos con mayor importancia en 204, 40.8 y 12 meses
respectivamente siendo este último el de mayor ordenada compatible con el
comportamiento del proceso de exploración inicial del gráfico de la serie el período
de 12 meses. En cuanto al período de 204 meses se puede desechar pues no hay
suficientes datos para que esta sea confiable, los períodos de 12 y 40,8 meses se
determinará su significación por el periodograma integrado.
Como la serie no presentó tendencia, se obtuvo el periodograma integrado sin
extracción de la media, en este se observa la recta diagonal central que siguen las
amplitudes relativas acumuladas de una secuencia aleatoria, a sus lados se
muestran los intervalos de confianza para la desviación de la curva muestral al
75% (interior) y 95%(exterior).
Para facilitar la lectura del gráfico de la figura No 3.9, las amplitudes relativas
acumuladas, en la serie probada, para cada frecuencia se han unido con una
línea, que es la curva irregular. Se observa, que el aumento de la función del
periodograma integrado por encima del de la diagonal es mayor que el radio de la
banda de confianza en los períodos significativos, se puede observar entonces
que el único ciclo significativo es el estacional (12 meses).
Pronóstico de la producción de leche, mediante modelos ARIMA.
Figura No 3.9: Periodograma integrado de la serie de producción de leche.
La descripción de las componentes del modelo clásico se reduce entonces a la de
la única componente determinista existente que es la estacionalidad, los índices
estacionales se reflejan en el siguiente gráfico (Figura No 3.10), respaldando el
resultado de los Box-Plot mensuales (Gráfico 1 de la figura No 3.3).
Figura No 3.10: Periodograma estacional de la serie de producción de leche.
Teniendo en cuenta que la serie presenta estacionalidad, se realiza el análisis
apoyado en los modelos ARIMA propuestos por Box-Jenkins en 1970 y previo a la
Pronóstico de la producción de leche, mediante modelos ARIMA.
utilización de su metodología se verificó que las series cumplen con los requisitos
recomendados por otros autores, como son la consistencia la estabilidad y la no
existencia de valores aberrantes [44, 54] y que la serie tuviera también un número
suficiente de observaciones.
Para determinar los órdenes y del modelo a utilizar se obtienen las funciones
de autocorrelación y autocorrelación parcial de la serie con una diferencia
estacional y sin diferencias no estacionales (se vio que la serie tiene
estacionalidad pero no tiene tendencia), Se tomó el criterio de no probar con más
de una diferencia estacional ya que la serie no es muy larga y en este tipo de
diferencias se pierde un año de observaciones con cada diferencia. (Figura No
3.11)
Figura No 3.11: Autocorrelación y Autocorrelación parcial de la serie temporal con 1
diferencia estacional.
Estos gráficos sugieren que los órdenes requeridos son ≤ 1 y ≤ 3
En el presente trabajo se probaron varios modelos para determinar cuál de ellos
se ajustaba mejor a la serie de producción de leche; todos los modelos probados
Pronóstico de la producción de leche, mediante modelos ARIMA.
incluyeron una diferencia estacional (que fue suficiente para eliminar la
estacionalidad) y ninguna no estacional.
Los modelos probados fueron:
A) ARIMA(1,0,0)(0,1,0)12 con constante
B) ARIMA(1,0,1)(0,1,0)12 con constante
C) ARIMA(1,0,3)(0,1,0)12 con constante
D) ARIMA(1,0,2)(0,1,0)12 con constante
E) ARIMA(0,0,1)(0,1,0)12 con constante
F) ARIMA(0,0,2)(0,1,0)12 con constante
G) ARIMA(0,0,3)(0,1,0)12 con constante
Para la selección del mejor modelo se realizó la comparación de estos utilizando la
tabla de errores que aparece a continuación.(Tabla No 3.4)
Modelo Raíz del Error Cuadrático
Medio
( )
Error Medio
Absoluto
( )
Error Medio Absoluto
porcentual
( )
Error Medio
( )
Error Medio porcentual
( )
A 17494,5 12218,5 18,4691 51,3397 -3,23136
B 17502,7 12129,7 18,3265 -6,22601 -3,36211
C 17546,3 12015,3 17,914 -5,11895 -3,39983
D 17526,9 12085,7 18,2672 48,7076 -3,22063
E 19462,7 13969,8 21,2032 78,9262 -4,7455
F 18495,8 13380,1 20,8417 73,123 -4,33691
G 17778,6 12235,3 18,3771 126,011 -3,59895 Tabla No 3.4: Comparación de modelos probados para la serie de producción de
leche.
Cada uno de los estadísticos empleados está basado en los errores de predicción,
que son las diferencias entre los valores de las observaciones en tiempo y la
predicción de ese valor hecha a tiempo .
Los estadísticos Raíz del Error Cuadrático Medio ( ), el Error Medio Absoluto
( ) y el Error Medio Absoluto Porcentual ( ), miden la magnitud de los
Pronóstico de la producción de leche, mediante modelos ARIMA.
errores, o sea, el mejor será el que muestre el valor más pequeño; y el Error
Medio ( ) y el Error Medio Porcentual ( ) miden el sesgo estadísticamente y
se considera que el mejor modelo dará un valor próximo a
Tomando en consideración estos criterios se concluye que el modelo mejor
ajustado es el modelo , por ser el que presenta menor valor en casi todos los
errores clásicos y en los que no responde al error mínimo está casi en el mismo
rango de este. (Tabla No.8)
Con este modelo se han predicho los valores para la serie de producción de leche
en los de los años 2011, 2012 y 2013, con un total de 504 datos (de los años
1994-2010), con la aplicación del modelo ARIMA ( ), que asume que la mejor
predicción para los datos futuros, que está dado por un modelo paramétrico que
relaciona los valores más recientes con los valores anteriores y el ruido anterior.
En la tabla No 3.5se muestran los parámetros del modelo seleccionado, se
observa que el P-valor del término AR(1), es estadísticamente significativo, con un
nivel de significación menor que 0.05 y los medias móviles aunque no llegan a ser
individualmente significativos ya se vio que marcan una diferencia en los residuos
del modelo, la desviación típica estimada de la entrada de ruido blanco es igual a
17554.2.
Parámetro Estimación Error Estándar t Valor-P
AR(1) 0.548488 0.155125 3.53579 0.000513
MA(1) -0.244145 0.159292 -1.53269 0.127044
MA(2) -0.0797912 0.128899 -0.619024 0.536654
MA(3) -0.140858 0.0918899 -1.5329 0.126991
Media -1291.3 3972.3 -0.325076 0.745487
Constante -583.036 Tabla No 3.5: Parámetros del modelos ARIMA(1,0,3)x(0,1,0)12 con constante.
En lafigura No 3.12se muestra la autocorrelación, la autocorrelación parcial de los
residuos de la serie de producción de leche, así como el periodograma y el
Pronóstico de la producción de leche, mediante modelos ARIMA.
periodograma integrado ajustado, también de los residuos de la misma serie, se
evidencian en la figura No 3.13.
Se evidencia poca correlación residual solo se observa alguna significación en
elretardo1 (aunque no es una correlación altamente significativa) (Figura No 3.12)
y los periodogramas desmienten la significación de una estacionalidad residual
(Figura No 3.13).
Figura No 3.12: Autocorelación y Autocorrelación parcial de los residuos del
modelo.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Figura No 3.13: Periodograma y periodograma integrado residual del modelo
ajustado de la serie de produccion de leche.
En la figura No.3.14se muestran los residuos aparentemente incorrelacionados,
como se observó también en el gráfico de correlaciones residuales de la figura
No3.12; y se observa que no hay ciclos significativos (Figura No3.13) y son, en
general, aceptablemente estacionarios (Figura No3.14)
La prueba de normalidad, (Normal Probability Plot), de los residuos del modelo
(Figura No3.15) ofrece frecuencias siguiendo una recta teórica para frecuencias
acumuladas de una secuencia aleatoria en el rango del residuo condistribución
normal de probabilidades, evidencia la falta de normalidad de los mismos
(corroborada por los test de normalidad Anexo No3 ) lo cual puede afectar el
cálculo de los límites de confianza del pronóstico, no así los errores que se
tomaron para la selección del modelo.
Estos resultados junto a las comparaciones con otros modelos de órdenes
cercanos, indican que este es el modelo de esta familia que resulta mejor ajustado
para la serie presentada o sea que no es posible, con los elementos que se
conocen de la serie, mejorar los resultados bajo el enfoque ARIMA.
Figura No 3.14: Gráfico de aleatorización de los residuos de la serie de producción
de leche, para el modelo ajustado.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Figura No3.15: Gráfico de normalidad de los residuos de la serie de producción de
leche, para el modelo ajustado.
Se procede entonces a pronosticar la producción de leche para los años 2011,
2012 y 2013, por el modelo elegido. (Figura No3.16)
Se pronostica la producción de leche con un nivel de confianza del 95%.
Figura No3.16: Pronóstico de producción de leche para el 2011-2013.
Como se evidencia en el gráfico (Figura No 3.16) los intervalos de confianza para
el pronóstico en estos años son más amplios que los del 2011 ya que el error de
estimación va creciendo según se utilicen más datos estimados en sus cálculos, si
se quiere ir rectificando los pronósticos sobre la marcha bastaría con actualizar la
Pronóstico de la producción de leche, mediante modelos ARIMA.
serie con los datos observados según se acabe cada año y volver a calcular los
pronósticos, aunque se debe señalar que en este caso de estudio el
incumplimiento d normalidad delos residuales hace poco confiable la estimación
de los límites de los intervalos de confianza. Si se va a pronosticar a más largo
plazo se debe además repetir el proceso de obtención del modelo ya que las
condiciones pueden ir cambiando en el tiempo y aunque esto no ocurra con una
mayor cantidad de datos se puede mejorar la estimación de los parámetros del
modelo.
En la tabla siguiente (Tabla No 3.6)se muestran los valores reales y pronosticados
de la producción de leche para el año 2011, con estos se evidencia que no existe
variación significativa entre el pronóstico y el comportamiento real.
Período Pronóstico L(miles)
Real L(miles) (Meses)
Enero 34346 36530
Febrero 23507 25500
Marzo 27631 29650
Abril 29759 30340
Mayo 48656 49870
Junio 78244 79170
Julio 100483 101190
Agosto 110550 111090
Septiembre 109331 106960
Octubre 106621 106960
Noviembre 78115 78390
Diciembre 53721 53940 Tabla No 3.6: Comportamiento real de la producción de leche en el 2011.
Se muestran entonces los valores pronosticados de producción de leche, en la
UBPC, para los años 2012 y 2013 en la tabla No3.7
Período Pronóstico 2012 (ML)
Pronóstico 2013 (ML)
(Meses)
Enero 32057 30766
Febrero 22216 20925
Pronóstico de la producción de leche, mediante modelos ARIMA.
Marzo 26340 25049
Abril 27469 26178
Mayo 47365 46074
Junio 76953 75662
Julio 99192 97901
Agosto 109258 107967
Septiembre 108040 106749
Octubre 105330 104038
Noviembre 76824 75533
Diciembre 52421 51130 Tabla No 3.7: Comportamiento de la producción de leche en el 2012 y 2013.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Conclusiones
Se estableció una metodología para pronosticar producciones de leche que
resultó muy adecuada en el caso de estudio desarrollado.
Con el análisis descriptivo se comprobó que las variables que permiten definir
y realizar el estudio de la serie de producción de leche, bajo las condiciones
de la UBPC "Maniabo", fueron los litros de leche por vaca y las vacas en
ordeño, ambas variables poco predecibles.
La serie de producción de leche evaluada no presenta tendencia, pero sí un
comportamiento similar cada cierto período de tiempo de 12 meses, o sea un
ciclo estacional de 12 meses.
Se utilizó un modelo ARIMA para la modelación de la serie, con el que se
lograron errores aceptables (por debajo del 18% de la media) y se obtuvieron
predicciones muy cercanas a los valores reales en el año 2011.
Pronóstico de la producción de leche, mediante modelos ARIMA.
Recomendaciones
Generalizar el uso de la metodología ARIMA, para la predicción de la
producción de leche, en las unidades de base.
Profundizar en este tema para lograr predicciones, con otros indicadores
productivos, en las cuales se utilicen otros modelos de series temporales.
Deben tomarse en consideración en estudios futuros otros factores que
pudieran influir en el rendimiento de la producción de leche
Pronóstico de la producción de leche, mediante modelos ARIMA.
Bibliografía
[1] Agresti A.: “Categorical and Data Analysis.” Editorial John Wiley & Sons.
New York. (1990)
[2] Aguirre A.: “Introducción al tratamiento de series temporales.
Aplicación a las Ciencias de la Salud.” Editorial. Díaz de Santos.
Departamento de Epidemiología y Bioestadística. Escuela Nacional de
Sanidad. I.S.B.N.:84-7978-153- X. Madrid. España. (1994)
[3] Akaike H.:“A New Look at the Statistical Model Identification.” Editorial
IEEE Transactions on Automatic Control. Vol. AC-19, Núm. 6. (1974)
[4] Akaike H.: “Markovian Representation of Stochastic Processes by
Canonical Variables.” SIAM Journal of Control. Vol. 13, Núm.1. (1975)
[5] Akaike H.: “Canonical Correlation Analysis of Time Series and the Use
of an Information Criterion.” Academic Press. (1976)
[6] Anderson D., Streeney, D.& Williams, T.: “Estadística para Finanzas,
Administración y Economía.” Editorial International Thomson. Disponible
en: http://www.monografias.com/Administracion_y_Finanzas/index [en
línea] 24/11/2012. (1999)
[7] Antúnez I.C.H.: “Análisis de Series de Tiempo.” Revista Contribuciones a
la Economía, con Número Internacional Normalizado de Publicaciones
Seriadas. ISSN 1696-8360. (2003)
[8] Arellano M.: “Estadística. Introducción al Análisis Clásico de Series de
Tiempo.” Disponible en: http://ciberconta.unizar.es/cv/mireyaarellano.htm
[en línea] 13/09/2012 (2001)
[9] Arroyo J., González G. R., Maté, C.: “Forecasting with interval and
histogram data: some financial applications, en Handbook of empirical
economics and finance.” Editorial. Chapman & Hall. (2010)
[10] Bauer D. y Wagner, M.: “Estimating Cointegrated Systems Using
Subspace Algorithms.” Journal of Econometrics. Vol. 111, (2002b)
Pronóstico de la producción de leche, mediante modelos ARIMA.
[11] Bello L.: “Estadística como apoyo a la investigación.”. Editorial L. Vieco
e Hijas. 1ra ed. Medellín. (2005)
[12] Bidegain M., Díaz A. and Barreiro M.: “Análisis Estadístico de Datos
Climáticos. Series temporales II.” Doc. Universidad de la República.
Montevideo, Uruguay (2009)
[13] Blumberg C.J.: “Commnets on “A simplified time-series analysis for
evaluating treatment interventions” Journal of Applied Behavior Analysis.
Vol.17.(1984)
[14] Box, G. E. P. y Jenkins, G. M.: “Time Series Analysis, Forecasting and
Control.” Editorial Holden-Day, San Francisco. (1970)
[15] Box, G. E. P. y Jenkins, G. M.: “Time Series Analysis, Forecasting and
Control.” Editorial Holden-Day, San Francisco, 2a ed. (1976)
[16] Box, G. E. P. y Jenkins, G. M.: “Time Series Analysis, Forecasting and
Control.” Prentice Hall, Englewood Cliffs, 3ra ed.(1994)
[17] Cabanas G. et al.: “Cambios temporales de la lluvia en el occidente de
la isla de Cuba.” Investigaciones Geográficas.Núm.38, Universidad de
Alicante, España. (2005)
[18] Cañedo A.R. and Arencibia J.R.: “Bioinformática: en busca de los
secretos moleculares de la vida.” Disponible en:
http://www.scielo.cl/scielo.php [en línea] 22/11/2012. (2005)
[19] Cansado E.: “Curso de Estadística General.” Ediciones Revolucionarias.
La Habana, Cuba.(1966)
[20] Castañeda, M.O.G, Ávila D.A., Vinay V.J.C.: “Comportamiento
productivo de ganado cruzado europeo por cebú en clima tropical.” In
Memorias XVI Reunión Internacional Sobre Producción de Carne y Leche
en Clima Cálido. Baja California, México. (2006)
[21] Chatfield C.: “The Analysis of Time Series: An Introduction.” Editorial
Chapman and Hall. London. (2003)
[22] Chatfield C.: “Time Series Forecasting.” Editorial Chapman and Hall.
I.S.B.N.:1-58488-063–5. United Kingdom.(2000)
Pronóstico de la producción de leche, mediante modelos ARIMA.
[23] CITMA.: “Informe de la Delegación Provincial.”(2003)
[24] Colás M. & Lamazares et al.: “Evaluación epidemiológica de procesos
respiratorios bacterianos en gallinas ponedoras.” Revista de Salud
Animal. Vol.33. (2011)
[25] Cooper D.M. y Wood E.F.: “Identifying Multivariate Time Series Models.”
Journal of Time Series Analysis. Vol. 3. (1982)
[26] Coutín M.G.: “Las series temporales.” Trabajo de Diploma (en opción del
título de Licenciado en Contabilidad y Finanzas). Facultad de Contabilidad y
Finanzas. Universidad de La Habana. Cuba. (2003)
[27] Coutín M.G.: “Métodos para la detección de la variación estacional en
Cuba aplicados a la vigilancia en salud.” Revista Cubana Salud Pública.
Unidad Nacional de Análisis y Tendencias en Salud Nacional, MINSAP.
Cuba. (2007)
[28] Decreto Ley 142.: “Sobre las UBPC.” Dirección Nacional de la ANAP.
Cuba. (1993)
[29] Delgado A.: “Estudio de la producción de carne a base de pasto
Pangola (Digitaria decumbens Sten) con suplementación durante la
estación seca.”Tesis de Dr. en Ciencias. Instituto de Ciencia Animal. La
Habana, Cuba. (1978)
[30] Febles G. & Ruiz T.E.: “The global climatic change and its impacts in
Cuba. Actions for the future.” Cuban Journal Agriculture. (2009)
[31] Fernández P.: “Cuatro experiencias exitosas en UBPC.” Biblioteca
ACTAF. La Habana, Cuba. (2007)
[32] Funes M., Lantiga M., Van Keulen H.: “Agro‐Ecological Indicators (AEIs)
for dairy and mixed farming systems classification: Identifying
alternatives for the Cuban livestock sector.” Journal of Sustainable
Agriculture. Vol.33. Núm. 4.(2009)
[33] Granger C.: “Análisis de Series Temporales, Cointegración y
Aplicaciones.” Disponible en:
http://www.revistaasturianadeeconomia.org/raepdf/30/GRANGER.pdf [en
Pronóstico de la producción de leche, mediante modelos ARIMA.
línea] 28/04/2009. (2004)
[34] Grubb H.: “A Multivariate Time Series Analysis of Some Flour Price
Data.” Applied Statistics. Vol. 41 (1992)
[35] Helsfenstein U.: “Box Jenkins modelling in medical research.” Statistics
Methods. Vol. 5. Núm.1. (1996)
[36] Herman J., Grohn Y., Erbih E.: “Influence of milk somatic cell and age on
cheese yield.” Journal Dairy Science. Vol. 74. (1996)
[37] Hernández M.: “Los suelos ganaderos en Cuba. Curso Fundamentos
de la producción de pastos.” Programa de maestría en Pastos y Forrajes.
Estación Experimental de Pastos y Forrajes "Indio Hatuey". Matanzas.
Cuba. (2002)
[38] Hurtado C. & Gonzalo R.: “Tópicos de Minería de Datos.” Universidad de
Chile. Facultad de Ciencias Físicas y Matemáticas. Departamento de
Ciencias de la Computación. Semestre primavera. Santiago de Chile, Chile.
(2008)
[39] Huyhn H. and Feldt L.S.: “Conditions under which mean square ratios in
repeated measures designs have exact F-distributions.” Journal of the
American Statistical Association. (1970)
[40] Juez, M.P.: “Herramientas estadísticas para la investigación en
Medicina y Economía de la Salud.” Centro de Estudios Ramón Areces.
Madrid, España. (2001)
[41] Leng R.A., Preston T.R.: “Diagnostico general y tendencia en relación a
la ganadería y el medio ambiente.” Memorias del curso. Taller
internacional. Ganadería, Desarrollo Sostenible y Medio Ambiente. Ciudad
de La Habana, Cuba. (2003)
[42] Loma J.L.: “Experimentación agrícola.” Unión Tipográfica. Editorial
Hispano-americana. México, D.F.(1955)
[43] Machado R., Menéndez J.: “Descripción de gramíneas y leguminosas.
En: Los Pastos en Cuba.” Tomo l. Producción. La Habana, Cuba. (1979)
Pronóstico de la producción de leche, mediante modelos ARIMA.
[44] Marchall & Mason.: “Estadística para Administración y Economía.”
Disponible en: http://www.monografias.com/trabajos901/nuevas-
tecnologias-edicion-montaje/nuevas-tecnologias-edicion-montaje.shtml 11ª
ed. Editorial Alfa Omega. México. [en línea] 20/01/2012 (2004)
[45] Martín G., Labeaga J.M., Mochón F.: “Introducción a la Econometría.”
Prentice Hall Iberia. Madrid (1997)
[46] Maté C., Ruiz-Falcó A.: “Design for maintainability. A methodology
using statistical methods in Maintenance Management and
Optimization.” Ed. European Commission. Luxemburg. (2003)
[47] Maté C.: “A multivariate analysis approach to forecasts combination.
Application to Foreign Exchange (FX) markets.” Revista Colombiana de
Estadística. Vol. 34, Núm. 2. (2011)
[48] Maté C.: “A multivariate analysis approach to forecasts combination.
Application to Foreign Exchange (FX) markets.” Revista Colombiana de
Estadística. Vol. 34, Núm. 2. (2011)
[49] Maté C.: “Curso general sobre STATGRAPHICS. Procedimientos.
Métodos Estadísticos. Aplicaciones. Ejercicios Resueltos.” Tomo II.
Editorial Universidad Pontificia Comillas. Madrid, España.(1995)
[50] McCandless G., Florencia, M.T.: “Modelos econométricos de predicción
macroeconómicos en la Argentina.” Banco Central de la República.
(1999)
[51] MINAG.: “Manual de Normas y Procedimientos del Departamento de
Registros Pecuario.” Centro Nacional de control Pecuario, Ministerio de la
Agricultura. La Habana, Cuba. (2000)
[52] Ministerio de Finanzas y Precios.: “Precios precio de acopio de ganado
bovino en pie.” Resolución No.153-2007. (2007)
[53] Ministerio de Justicia.: “Gaceta Oficial de la República de Cuba, 2004.”
La Habana, Cuba. (2004)
Pronóstico de la producción de leche, mediante modelos ARIMA.
[54] Molinero M.L.: “Liga Española para la lucha contra la Hipertensión
Arterial.” Revista de la Asociación de la Sociedad Española de
Hipertensión, por (Alce Ingeniería). Disponible en: http://www.seh-
lelha.org/stat1.htm [en línea] 7/02/2013 (2004)
[55] Montes de Oca R.L. et al.: “Evaluación del potencial de las series
temporales para predecir las propiedades de calidad de la guayaba
(Psidium guajava L), variedad enana roja EEA 1-23, durante su
conservación a temperatura ambiente.” Revista Ciencias Técnicas
Agropecuarias. Vol.19 .Num.2 (2010)
[56] Otero M.: “Econometría, Series Temporales y predicciones.” Editorial
HG. Madrid.(1993)
[57] Peña C.J., Guillamon F.A. & Nieto V.S.: “Test de independencia en series
temporales.” Universidad Politécnica de Cartagena y Escuela Técnica
Superior de Ingeniería Industrial. Departamento de Matemática Aplicada y
Estadística. Disponible en:
http://repositorio.bib.upct.es/dspace/handle/10317/3180 [en línea]
7/03/2013. (2005)
[58] Peña, D.: “Estadística, Modelos y Métodos 2. Modelos Lineales y
Series Temporales.” Alianza Universidad, Madrid. (1989)
[59] Preston T.R. y Leng R.A.:“Matching ruminant production systems with
available resouses in the tropics and subtropics.” Penambul Books,
Armidale and CTA. Wageningen, Australia.(1987)
[60] Revilla P. and Pilar R.: “Analysis quality control from ARIMA modeling.”
Argentina. (2000)
[61] Revilla P., Rey P. and Espasa A.: “Selective editing methods based in
Time Series modelling.” Topic (iii): New methodological and technological
developments in statistical data editing. Conference of European
statisticians. Statistical commission and Working. Paper No. 22. Rome, Italy.
(1999)
Pronóstico de la producción de leche, mediante modelos ARIMA.
[62] Schaefer M., Barker, B., Taylor G. y Wallis J.: “Regional precipitation-
frequency analysis and spatial mapping for 24-hour precipitation for
Oregon.” Oregon Climate Service. (2006)
[63] Schaefer M.: “Regional precipitation-frequency analysis and spatial
mapping for 24-hour and 2-hour durations in eastern Washington.”
Oregon Climate Service. (2007)
[64] SPSS.: Software estadístico SPSS para Windows. Versión 15.0.1.
Copyright IBM Corporation 2010 IBM Corporation. Route 100 Somers. NY
10589 (2006)
[65] Suárez O.M.: “Métodos de suavizamiento y pronóstico para series de
tiempo.” Disponible en: http://www.monografias.com/trabajos87/metodos-
suavizamiento-y-pronostico-series-tiempo/metodos-suavizamiento-y-
pronostico-series-tiempo.shtml [en línea] 12/02/2013 (2012)
[66] Terceiro J.: “Estimation of Dynamics Econometric Models with Errors
in Variables.” Springer-Verlag. Berlin. (1990)
[67] Tsay R.S.: “Identifying Multivariate Time Series Models.” Journal of
Time Series Analysis. Vol. 10. Núm. 4.(1989a.)
[68] Wei W.: “Time serie analysis. Univariante and Multivariante Methods.”
Addison-Wesley. New York. EE.UU. (1990)
[69] Wold, H.O.A.: “A Study in the Analysis of Stationary Time Series.”
Almqvistand Wiksell. Uppsala.(1964)
Pronóstico de la producción de leche, mediante modelos ARIMA.
ANEXOS
Anexo No1
Tabla de estadígrafos de la variable vacas en ordeño en la UBPC “Maniabo” en los años 1994-2010.
Años N
Vacas en ordeño
Media D.E. CV
1994 12 696 58.45 8.39
1995 12 599 52.59 8.79
1996 12 468 76.8 16.4
1997 12 570 80.52 14.14
1998 12 620 98.02 15.81
1999 12 594 57.55 9.68
2000 12 555 87.8 15.81
2001 12 670 112.2 16.74
2002 12 685 51.6 7.53
2003 12 640 99.86 15.61
2004 12 678 119.12 17.56
2005 12 552 70.96 12.87
2006 12 465 127.1 27.35
2007 12 498 61.92 12.44
2008 12 464 56.08 12.09
2009 12 418 80.75 19.31
2010 12 401 102.85 25.65
Pronóstico de la producción de leche, mediante modelos ARIMA.
Anexo No2
Tabla de estadígrafos de la variable litros por vaca en la UBPC “Maniabo” en los años 1994-2010.
Años N
Litros por vaca
Media D.E. CV
1994 12 4241.67 1642.87 38.73
1995 12 3133.33 1225.73 39.12
1996 12 5333.33 1847.52 34.64
1997 12 4658.33 1454.43 31.22
1998 12 4750 1840.7 38.75
1999 12 3925 1547.51 39.43
2000 12 4700 1684.69 35.84
2001 12 5025 1016.34 20.23
2002 12 4591.67 1740.15 37.9
2003 12 5970 1687.31 28.26
2004 12 5289.17 1589.15 30.05
2005 12 4708.33 2449.66 52.03
2006 12 5491.67 1817.32 33.09
2007 12 5625 963.07 17.12
2008 12 5358.33 1655 30.89
2009 12 4966.67 1306.86 26.31
2010 12 5158.33 1617.78 31.36