centro de investigación estadística y mercadeo

38
Centro de Investigación Estadística y Mercadeo www.leondariobello.com

Upload: estela-rosero

Post on 03-Feb-2015

14 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Centro de Investigación Estadística y Mercadeo

Centro de Investigación Estadística y Mercadeo

www.leondariobello.com

Page 2: Centro de Investigación Estadística y Mercadeo

Enfoque Clásico

CIEM

Page 3: Centro de Investigación Estadística y Mercadeo

DEFINICION. Una serie de tiempo es un conjunto de datos numéricos

que se obtienen en periodos regulares a través del tiempo. La unidad de tiempo puede ser: Hora, día, mes, trimestre, año o cualquier periodo que se pueda considerar de interés.

OBJETIVO.Identificar y aislar los factores de influencia con propósitos de hacer predicciones (pronósticos), y prevenir “brotes” o “epidemias”.

Material preparado por:

Profesor León Darío Bello PariasCIEM

Page 4: Centro de Investigación Estadística y Mercadeo

Con el análisis de series temporales se pretende extraer

el patrón de comportamiento sistemático contenido en

una sucesión de observaciones que se recoge de forma

regular y homogénea a lo largo del tiempo. Con este

patrón es posible: a) caracterizar el comportamiento del

fenómeno estudiado; b) predecir su evolución futura; y c)

extraer componentes no observables (señales) que

reflejan más fielmente la evolución subyacente de la

variable de interés. Preparado por: León Dario BelloCIEM

Page 5: Centro de Investigación Estadística y Mercadeo

El tratamiento numérico de las series Temporales es variado y la metodología a utilizar depende de los objetivos planteados. En general, se puede decir que de una secuencia cronológica nos puede interesar adquirir un conocimiento descriptivo o diagnóstico, en el sentido de poder detectar la dinámica generadora del fenómeno bajo estudio, y un conocimiento predictivo o pronóstico, pretendiendo deducir de los datos registrados hasta el momento, cómo será su comportamiento futuro.

Material preparado por:

Profesor León Darío Bello PariasCIEM

Page 6: Centro de Investigación Estadística y Mercadeo

Número de Casos Acumulados de Tosferina Periodo 13 (Antioquia 1994-2001)

0

100

200

300

400

500

600

1994 1995 1996 1997 1998 1999 2000 2001

Año

Cas

os

Tasas Acumulada por 100.000 habitantes de Tosferina Perioido 13 (Antioquia 1994-2001)

0.0

2.0

4.0

6.0

8.0

10.0

12.0

1994 1995 1996 1997 1998 1999 2000 2001

Años

Tasa

s * 1

00.0

00

http://www.col.ops-oms.org/iah/lisnalsds.htmCIEM

Page 7: Centro de Investigación Estadística y Mercadeo

Número de Casos Acumulados de Rubeola Periodo 13 (Antioquia 1994-2001)

0

1000

2000

3000

4000

5000

6000

1994 1995 1996 1997 1998 1999 2000 2001

Años

Cas

os

Tasas Acumuladas por 100.000 habitantes de Rubeola Periodo 13 (Antioquia 1994-2001)

0.0

20.0

40.0

60.0

80.0

100.0

120.0

1994 1995 1996 1997 1998 1999 2000 2001

Años

Tasa

s *

100.

000

CIEM

Page 8: Centro de Investigación Estadística y Mercadeo

Número de Casos Acumulados de HIV/Sida Periodo 13 (Antioquia 1992-2001)

0

100

200

300

400

500

600

700

800

1992 1993 1994 1995 1996 1997 1998 1999 2000 2001

Tasas Acumuladas por 100.000 habitantes de VIH/Sida Periodo 13 (Antioquia 1992-2001)

0.0

2.0

4.0

6.0

8.0

10.0

12.0

14.0

1992 1993 1994 1995 1996 1997 1998 1999 2000 2001

AñosTa

sas

* 10

0.00

0

FUENTE: SIS 12 , REGISTROS DE PROGRAMA, Y SIVIGILA * CERTIFICADOS DE DEFUNCIÓN DANE( SISTEMAS)http://www.dssa.gov.co/infecc/infecciosas.htm

CIEM

Page 9: Centro de Investigación Estadística y Mercadeo

Consideraciones Previas

Consistencia: Mecanismos de notificación, los cuales pueden cambiar la forma de captura de la información.

Comparabilidad: cambios que se originan a través del tiempo.

Preparado por: León Dario Bello

CIEM

Page 10: Centro de Investigación Estadística y Mercadeo

COMPONENTES DE UNA SERIE Tendencia: Movimientos percistentes

ascendentes o descendentes a través del tiempo. Variaciones estacionales. Fluctuaciones

periódicas en periodos de tiempo cuya frecuencia es menor a un año, aproximadamente en las mismas fechas y casi con la misma intensidad.

Movimientos o variaciones cíclicas.

Los movimientos se consideran cíclicos, solo si se producen en un intervalo de tiempo superior al año.

Movimientos irregulares o al azar. movimientos esporádicos o de corto plazo.Material preparado por:

Profesor León Darío Bello PariasCIEM

Page 11: Centro de Investigación Estadística y Mercadeo

COMPONENTES DE UNA SERIE

Material preparado por:

Profesor León Darío Bello PariasCIEM

Page 12: Centro de Investigación Estadística y Mercadeo

Preparado por: León Dario Bello

Page 13: Centro de Investigación Estadística y Mercadeo

USO DE PROMEDIOS MOVILES SERIE INFECCION RESPIRATORIA AGUDA EN SANTA FE DE BOGOTA (1982-1992)

0

20

40

60

80

100

120

140

MESES

Serie1

Serie2

Serie3

Preparado por: León Dario BelloCIEM

Page 14: Centro de Investigación Estadística y Mercadeo

Preparado por: León Dario Bello

Page 15: Centro de Investigación Estadística y Mercadeo

Ajuste De Un Modelo

1.T(t) = a + bt

(Lineal)

2.T(t) = a e bt

(Exponencial)

3.

(Exponencial

modificada)

i. La curva de tendencia debe cubrir un periodo relativamente largo para ser una buena representación de la tendencia a largo plazo.

ii. La tendencia rectilínea y exponencial son aplicable a corto plazo, puesto que una curva S a largo plazo puede parecer una recta en un período restringido de tiempo (por ejemplo).

LogisticaGompertz

Especialización EIA

Page 16: Centro de Investigación Estadística y Mercadeo

Técnicas de suavizado

Grupo de métodos cuyo objetivo es identificar las componentes subyacentes de la serie.

Suaviza el aspecto de la gráfica mediante la eliminación o alisado de las oscilaciones de la serie.

Especialización EIA

Page 17: Centro de Investigación Estadística y Mercadeo

Técnicas de suavizado

Promedios Móviles  El objetivo es eliminar de la serie las

componentes estacionales y accidentales.  

Xt es el valor de la predicción para el instante t Zt es el valor real de la serie el instante genérico t K es el número de valores considerados en el

cálculo de la media móvil

k

ZZZX tktkt

t11 ...

y ySiguiente observación Observación más remota

Mt t

1

Material preparado por:

Profesor León Darío Bello Parias

Page 18: Centro de Investigación Estadística y Mercadeo

Técnicas de suavizado

La previsiones obtenidas con este método, pueden ser útiles en situaciones en que la serie es muy vólatil y una media estable. Se recomienda un K alto si la serie es muy heterógenea. Usualmente se trabaja con valores entre 3 y 11.

Material preparado por:

Profesor León Darío Bello Parias

Page 19: Centro de Investigación Estadística y Mercadeo

Incidencia de malaria por 100 000 habitantes. Antioquia 1982-1993 Medias móviles

0

500

1000

1500

2000

2500

3000

1982 1984 1986 1988 1990 1992

Años

Prop

orci

ón Real

Pronóstico M=3

Pronóstico M=5

Preparado por: Maria Cristina Velásquez

Page 20: Centro de Investigación Estadística y Mercadeo

Técnicas de suavizadoExponencial simple: Esta técnica supera al método de promedios móviles en

el sentido que no elimina valores. Además, le da mayor ponderación a los últimos valores de la serie y menos peso a los primeros. Se recomienda cuando la serie no tiene tendencia ni estacionalidad, es decir, se estima el nivel de la serie. El pronóstico debe ser a muy corto plazo.

Material preparado por:

Profesor León Darío Bello Parias

n,,,tSyS

yS

ttt 32101 1

11

El problema radica en determinar el valor de

XXtt = X = Xt-1t-1 + a(Z + a(Zt-1t-1 – X – Xt-1t-1) )

Page 21: Centro de Investigación Estadística y Mercadeo

Predicción con suavizado exponencial (Método de Brown):

Permite la realización de previsiones a muy corto plazo, además puede emplearse también en el simple suavizado de series, al estilo de las medias móviles. Debe ser utilizado sólo y sólo para series con ruido.

Xt = Xt-1 + a(Zt-1 – Xt-1)

Xt es ekl valor de la serie suavizada para el período t Zt es el valor de la serie original en el período t a es la constante de suavizado, 0<=a<=1.

En series que presenten una tendencia aproximadamente lineal o bien sean estables en media, este método puede dar buenos resultados, si la serie presenta oscilaciones cíclicas, los resultados serán pobres.

Especialización EIA

Page 22: Centro de Investigación Estadística y Mercadeo

Estimación de la Estacionalidad

La estimación de la estacionalidad no sólo se realiza con el fin de incorporarla al modelo para obtener predicciones, sino también con el fin de eliminarla de la serie para visualizar otras componentes como tendencia y componente irregular que se pueden confundir en las fluctuaciones estacionales.

CIEM

Page 23: Centro de Investigación Estadística y Mercadeo

Técnicas de descomposición de series

El factor de tendencia recoge comportamiento general, a largo plazo de la serie. El factor estacional recoge comportamientos repetitivos de ciclo corto, este comportamiento cíclico está presente con frecuencia en series de tipo económico.

CIEM

Page 24: Centro de Investigación Estadística y Mercadeo

Técnicas de descomposición de series (Modelo Holt )

Este modelo pretende identificar la tendencia de la serie de un modo tal que permita que esa tendencia pueda variar a lo largo del tiempo, produciéndose un ajuste automático del modelo. Se utiliza para series con ruido y tendencia ( y ).

Xt+m = St + mbt

  Donde: Xt+m es la previsión obtenida para el instante t+m, desde

el instante t St es el nivel de suavizado en que se encuentra la serie en

el instante t bt es la tendencia que presentaba la serie en el instante t.

CIEM

Page 25: Centro de Investigación Estadística y Mercadeo

Técnicas de descomposición de series (Modelo Holt - Winters)

El metodo de Holt no admite la presencia de variaciones estacionales. Si le añadimos un tercer término para recoger este elemento, tenemos el modelo de Winters que, por tanto, considera la serie como formada por tres factores : nivel tendencia y ciclos (, y ).

  El primer parámetro está relacionado con

el factor aleatorio de la serie, el segundo con la tendencia y el tercero con la componente estacional. CIEM

Page 26: Centro de Investigación Estadística y Mercadeo

EL METODO DE HOLT-WINTER PARA EL AJUSTE DE LA TENDENCIA Y DEL PRONOSTICO

 METODO DE HOLT-WINTER, es una extensión del planteamiento de suavizado exponencial, la diferencia radica en que el procedimiento de suavizado exponencial proporciona una visión de los movimientos a largo plazo sin tener en cuenta la estacionalidad ni la tendencia, mientras que Holt Winter permite pronosticar teniendo en cuenta ambas componentes. El método se ha venido refinando cada vez más, en esta capacitación se presentan las formulas para tratar la tendencia.

NIVEL E i = U(E i -1+ Ti - 1) + (1-U) Y i

 

TENDENCIA T i = VT i -1 +(1-V)(E i - E I - 1)

^

PRONOSTICO Yn +J = En + j (Tn)

 E i = Nivel de la serie suavizada en el periodo i.

 E i - 1 = Nivel de la serie suavizada en el periodo i - 1.

 T i = Valor del componente de tendencia en el periodo i.

 T i - 1 = Valor del componente de tendencia en el periodo i - 1

Y i = Valor de la serie en el tiempo i.

 U = Constante de suavizado asignada de manera subjetiva (0<U<1). V = Constante de suavizado asignada de manera subjetiva (0<V<1). Para empezar a realizar los cálculos, hacemos E 2 = Y 2 y T 2 = Y 2 - Y 1 Preparado por: León Dario Bello

Page 27: Centro de Investigación Estadística y Mercadeo

• Es posible tener una apreciación más clara sobre el

comportamiento de la misma. 

• Facilita la identificación de patrones subyacentes

en ellas.

• Al aislar los factores exogenos ayuda a conocer

como se relaciona la serie de interés con otras series.

• Ayuda a disminuir las posibilidades de ser

engañados por correlaciones espureas, es decir,

correlaciones que muestran casualidad y no causalidad.

Preparado por: León Dario BelloCIEM

Page 28: Centro de Investigación Estadística y Mercadeo

1. Método del porcentaje medio. En este método expresamos los

datos de cada mes como porcentajes del promedio anual. Los

porcentajes para meses correspondientes en distintos años se

promedian entonces (usando una media o una mediana). Los doce

porcentajes resultantes dan el índice estacional.

2. Método del porcentaje de tendencia. En este método

expresamos los datos para cada mes como porcentajes de valores de

tendencia mensuales. Un promedio apropiado de los porcentajes

para meses correspondientes da entonces el índice requerido.

Preparado por: León Dario BelloCIEM

Page 29: Centro de Investigación Estadística y Mercadeo

3. Método del promedio móvil en porcentaje. En este método calculamos un promedio móvil de doce meses. Como los resultados obtenidos así caen entre meses sucesivos en lugar de en el centrodel mes ( que es donde caen los datos originales), calculamos un promedio móvil de dos meses de ese promedio móvil de doce meses.

El resultado se llama a veces un promedio móvil de doce meses centrado. Tras hacer eso, expresamos los datos originales de cada mes como un porcentaje del promedio móvil centrado de 12 meses que corresponde a los datos originales. Los porcentajes de los meses correspondientes se promedian a continuación, dando el índice buscado.

  Valor original x 100

Valor ajustado estacionalmente = ----------------------------------

índice estacional Preparado por: León Dario Bello

Page 30: Centro de Investigación Estadística y Mercadeo

Preparado por: León Dario Bello

Page 31: Centro de Investigación Estadística y Mercadeo

DESCOMPOSICION DE LA SERIE

Preparado por: León Dario Bello

Page 32: Centro de Investigación Estadística y Mercadeo

Se presentan varios criterios para identificar el modelo que más se

ajusta a los datos originales, los más utilizados son: El Error

Cuadrado Medio (MSE), la Desviación Media Absoluta (DMA) como

métodos numéricos y el análisis de residuales como método gráfico.

La fórmula para el DMA esta dada por.

DMA= Y i - Y ij / n

Preparado por: León Dario Bello

Page 33: Centro de Investigación Estadística y Mercadeo

PASOS EN EL ANALISIS CLASICO DE UNA SERIE DE TIEMPO.

 1. DETERMINAR SI LA SECUENCIA DE DATOS

FORMAN UNA SERIE NO ALEATORIA.2. ANALISIS EXPLORATORIO DE DATOS. 3.SUAVIZAR LA SERIE para identificar el

comportamiento subyacente de la misma.4. DESCOMPONER LA SERIE en sus respectivas

componentes.5.  AJUSTE DE MODELOS MATEMATICOS.6. ANALISIS DE RESIDUALES7. REALIZAR ESTIMACIONES Y PRONOSTICOS.8. VALIDAR EL MODELO Material preparado por:

Profesor León Darío Bello PariasCIEM

Page 34: Centro de Investigación Estadística y Mercadeo

Desarrollo de los Pasos

1. Realmente es una serie no aleatoria: Rachas

2. Análisis exploratorio de datos: -Gráfico de secuencias.   Gráfico de Caja y Sesgo. - Cálculo de estadísticas descriptivas.3. Identificación de las componentes de la serie:

YEAR, not periodic

1999

1998

1998

1997

1996

1996

1995

1994

1994

1993

1992

1992

1991

1990

1990

1989

1988

1988

me

ro

d

e C

aso

s

140

120

100

80

60

40

20

Serie IRA la cual contiene número de casos reportados en Santa Fé de Bogotá desde enero de 1988 hasta diciembre de 1999

Preparado por: León Dario Bello

Page 35: Centro de Investigación Estadística y Mercadeo

Desarrollo de los Pasos

4. Descomponer la serie.

Preparado por: León Dario Bello

Prueba de homogeneidad de varianzas

Número de Casos

1.009 11 132 .442

Estadísticode Levene gl1 gl2 Sig.

ANOVA

Número de Casos

11507.243 11 1046.113 5.408 .000

25532.083 132 193.425

37039.326 143

Inter-grupos

Intra-grupos

Total

Suma decuadrados gl

Mediacuadrática F Sig.

Prueba de homogeneidad de varianzas

Número de Casos

1.242 11 132 .266

Estadísticode Levene gl1 gl2 Sig.

ANOVA

Número de Casos

8462.910 11 769.355 3.554 .000

28576.417 132 216.488

37039.326 143

Inter-grupos

Intra-grupos

Total

Suma decuadrados gl

Mediacuadrática F Sig.

Diferencia de Medias por año. Diferencia de Medias por mes.Hay Tendencia Hay Estacionalidad

MONTH, period 12

121110987654321

Me

dia

de

me

ro d

e C

aso

s

100

90

80

70

60

50

YEAR, not periodic

199919981997199619951994199319921991199019891988

Me

dia

de

me

ro d

e C

aso

s

100

90

80

70

60

CIEM

Page 36: Centro de Investigación Estadística y Mercadeo

Desarrollo de los Pasos

Modelo de Winter, se realizó el análisis de residuos.Prueba de rachas

-.3225664

72

72

144

62

-1.840

.066

Valor de pruebaa

Casos < Valor de prueba

Casos >= Valor deprueba

Casos en total

Número de rachas

Z

Sig. asintót. (bilateral)

Error forCASOS fromEXSMOOTH,MOD_6 WI A.20 G .00 D

.00

Medianaa.

Prueba de Kolmogorov-Smirnov para una muestra

144

-.1041087

11.7830248

.035

.035

-.033

.425

.994

N

Media

Desviación típica

Parámetros normales a,b

Absoluta

Positiva

Negativa

Diferencias másextremas

Z de Kolmogorov-Smirnov

Sig. asintót. (bilateral)

Error forCASOS fromEXSMOOTH,MOD_6 WI A.20 G .00 D

.00

La distribución de contraste es la Normal.a.

Se han calculado a partir de los datos.b.

YEAR, not periodic

140

120

100

80

60

40

20

Número de Casos

Fit for CASOS from E

XSMOOTH, MOD_6 WI A

Preparado por: León Dario BelloCIEM

Page 37: Centro de Investigación Estadística y Mercadeo

Gráfico de Pronosticos

YEAR, not periodic

2000

2000

1999

1998

1998

1997

1996

1996

1995

1994

1994

1993

1992

1992

1991

1990

1990

1989

1988

1988

140

120

100

80

60

40

20

Número de Casos

Fit for CASOS from A

RIMA, MOD_16 NOCON

El conocimiento del área específica será de gran ayuda para seleccionar modelo adecuado. el participante puede comparando los errores absolutos de otros modelos y realizando las pruebas de residuales, encontrar otros modelos validos.

Preparado por: León Dario Bello

Page 38: Centro de Investigación Estadística y Mercadeo

Fecha

JUN 1999

JUL 1998

AUG 1997

SEP 1996

OCT 1995

NOV 1994

DEC 1993

JAN 1993

FEB 1992

MAR 1991

APR 1990

MAY 1989

JUN 1988

JUL 1987

AUG 1986

SEP 1985

OCT 1984

NOV 1983

DEC 1982

JAN 1982

120

100

80

60

40

20

0

HOMBRE

LINT(HOMBRE)

Fecha

140

120

100

80

60

40

20

0

HOMBRE

MUJER

TOTAL

MORTALIDAD POR ACCIDENTE EN BOGOTÁ ENERO 1995 – OCTUBRE

1999

Estimar valores perdidos.Identificar componentes de la serieNo existencia de tendencia ni estacionalidad, ajustar suavización simpleExiste tendencia sin estacionalidad, ajustar HoltExiste tendencia y estacionalidad, ajustar WinterAjustar modelos mínimo cuadráticos y comparar SCEValidar supuestos de los residualesCalcular los pronósticos.

Preparado por: León Dario BelloCIEM