ricardo fraiman universidad de san andrés, argentina ana justel universidad autónoma de madrid
DESCRIPTION
Servei d'Estadística 27 de marzo de 2009. Las temperaturas registradas en la Antártida como series de datos funcionales, necesitamos un concepto de tendencia. Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid Pamela Llop - PowerPoint PPT PresentationTRANSCRIPT
Las temperaturas registradas en la Las temperaturas registradas en la Antártida como series de datos Antártida como series de datos funcionales, necesitamos un concepto funcionales, necesitamos un concepto de tendencia de tendencia
Ricardo FraimanRicardo FraimanUniversidad de San Andrés, ArgentinaUniversidad de San Andrés, Argentina
Ana JustelAna JustelUniversidad Autónoma de MadridUniversidad Autónoma de Madrid
Pamela LlopPamela LlopInstituto de Matemática Aplicada delInstituto de Matemática Aplicada delLitoral (IMAL) - CONICET, ArgentinaLitoral (IMAL) - CONICET, Argentina
Servei d'EstadísticaServei d'Estadística27 de marzo de 200927 de marzo de 2009
Cambio climático globalCambio climático global
Cuando se habla del cambio climático en la Antártida, Cuando se habla del cambio climático en la Antártida, la información existente es muy escasa, y la que se la información existente es muy escasa, y la que se
aprovecha mucha menosaprovecha mucha menos
Los (pocos) estudios que se han hecho dicen que...
• Hay una cierta evidencia de calentamiento “global” en la Antártida
• Un enfriamiento en la Antártida Continental• Y un calentamiento muy por encima del global del
planeta en la Península Antártica
Lo dicen…
• IPCC (2001) • Comiso (2000): J. of Climate • Doran et al. (2002): Nature• Vaughan el al. (2003): Climatic Change• Turner et al. (2005): Int. J. Climatology• …• Steig (Enero, 2009): Nature
Sólo cuatro en la Región
de la Península Antártica
Sólo cuatro en la Región
de la Península Antártica
PROBLEMAS DETECTADOS EN LOS ESTUDIOS PREVIOS:
Se usa una proporción muy baja de los datos existentes, sólo de estaciones con registros de 50 años y de TODO EL AÑO (menos de 20)
Conclusiones basadas en el ajuste por mínimos cuadrados de tendencias lineales deterministas
• No parece muy realista asumir que la evolución de la temperatura es determinista (el futuro está escrito)
• La estimación de la tendencia da más peso siempre a los datos centrales
Las medias anuales o mensuales pueden estar muy sesgadas por la abundancia de rachas de “missing data”
Sorprende la poca presencia de estadísticos entre los grupos que han realizado los estudios más relevantes sobre la tendencia de parámetros meteorológicos en la Antártida
NUESTRO OBJETIVO:
Proponer nuevas herramientas Proponer nuevas herramientas estadísticas para tratar con datos “malos”estadísticas para tratar con datos “malos”
•Datos anuales en los que sólo se observa una estación
•Una cantidad alta de atípicos en datos que se
observan con mucha frecuencia (observaciones no
equiespaciadas)
•Rachas largas de datos faltantes
EL CASO DE LOS DATOS CLIMATOLÓGICOS DE LA EL CASO DE LOS DATOS CLIMATOLÓGICOS DE LA BASE BASE ANTÁRTICA ESPAÑOLA JUAN CARLOS IANTÁRTICA ESPAÑOLA JUAN CARLOS I::
BAE-JCIBAE-JCISpanish Antarctic Base Spanish Antarctic Base
Juan Carlos IJuan Carlos I
• Funcionando desde enero de 1988, en la costa SO de la Peninsula Hurd, Isla Livingston (South Shetland Islands)
• Se registran TEMPERATURAS AREAS instantáneamente cada 10 minutos
• Tomamos la media de datos horarios (media de entre 1 y 5 datos, según el número de missing)
Shouth Shouth Sheatland Sheatland
Is.Is.
Temperaturas registradas en la Base Antártica Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI)Española Juan Carlos I (BAE-JCI)
10 años10 años10 años10 años
NUEVO ENFOQUE DEL PROBLEMA:
• Suponemos que existe una curva/función de temperatura para cada verano que se observa únicamente en periodos discretos de tiempo debido a las limitaciones que imponen los aparatos de medida
• Tenemos una serie temporal anual donde para cada año el dato que se observa es una curva
verano
X1
X2
X3
X4
XT
t
VENTAJAS:
• No necesitamos observar la serie completa durante todo el año
• Se utiliza el micro-dato
• No se pierde la información de la estacionalidad diaria
• No necesitamos datos equiespaciados
ANÁLISIS DE SERIES TEMPORALES PARA ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALESDATOS FUNCIONALES
El objetivo es estudiar si una serie temporal de datos funcionales tiene o no tendencia
verano
X1
X2
X3
X4
XT
t
Temperaturas registradas en la Base Antártica Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI)Española Juan Carlos I (BAE-JCI)
No se ve nada
ANÁLISIS DE SERIES TEMPORALES PARA ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALESDATOS FUNCIONALES
El objetivo es estudiar si una serie temporal de datos funcionales tiene o no tendencia
verano
X1
X2
X3
X4
XT
t
Bosq (1991) introduce el FAR(1)Ferraty y Vieu (2006) comentan los resultados de varios autoresTratan el problema de predecir en procesos estacionarios
PRINCIPAL DIFICULTAD: No tenemos una definición asociada PRINCIPAL DIFICULTAD: No tenemos una definición asociada al concepto de tendencia para el caso de datos funcionalesal concepto de tendencia para el caso de datos funcionales
Buscamos una “DEFINICIÓN” asociada al concepto DE Buscamos una “DEFINICIÓN” asociada al concepto DE TENDENCIA para el caso de datos funcionalesTENDENCIA para el caso de datos funcionales
Ideas basadas en RANGOSIdeas basadas en RANGOS
• Dos métodos descriptivos de evaluación de tendenciasDos métodos descriptivos de evaluación de tendencias
• Proponemos test sobre “curvas máximas”Proponemos test sobre “curvas máximas”
• Reducimos la dimensión infinita del problemaReducimos la dimensión infinita del problema
ANÁLISIS DE SERIES TEMPORALES PARA ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALESDATOS FUNCIONALES
IDEA 1: Rangos de las curvasRangos de las curvas
Diremos que la serie tiene tendencia si la Diremos que la serie tiene tendencia si la serie de los “rangos” de las “series serie de los “rangos” de las “series ordenadas” tiene tendenciaordenadas” tiene tendencia
IDEA 2: Rangos de las curvas ordenadasRangos de las curvas ordenadas
Diremos que la serie tiene tendencia si la Diremos que la serie tiene tendencia si la “serie de rangos” de las curvas tiene “serie de rangos” de las curvas tiene tendenciatendencia
Métodos descriptivos de evaluación de tendenciasMétodos descriptivos de evaluación de tendencias
Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia
1.1. Para cada curva XPara cada curva Xtt calculamos los rangos en un número calculamos los rangos en un número
finito de instantes finito de instantes RRtt (1)(1), …, R, …, Rtt(S)(S)
s
X1
X2
X3
t 1 1 1
2
2 2 2
3
33
2
1 1
1
33332
1
2
IDEA 1: Rangos de las curvas Rangos de las curvas
Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia
IDEA 1: Rangos de las curvas Rangos de las curvas
Cada conjunto de barras corresponde a una curva, cuenta el Cada conjunto de barras corresponde a una curva, cuenta el número de veces a lo largo del tiempo en que el rango es 1,2, …,17número de veces a lo largo del tiempo en que el rango es 1,2, …,17
1.1. Para cada curva XPara cada curva Xtt calculamos los rangos en un número calculamos los rangos en un número
finito de instantes finito de instantes RRtt (1)(1), …, R, …, Rtt(S)(S)
s
X1
X2
X3
t 1 1 1
2
2 2 2
3
33
2
1 1
1
33332
1
2
2.2. Integramos a lo largo de todo el periodo de observación Integramos a lo largo de todo el periodo de observación de la curvade la curva
R3 = 17/7
R2 = 14/7
R1 = 11/7
Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia
IDEA 1: Rangos de las curvas Rangos de las curvas
Comentarios:
• Aunque le llamamos “serie de rangos”, no son rangos ya que al tratarse de un promedio de rangos no toman valores enteros
• Reducimos la dimensión infinita asociando a cada curva un valor real positivo
• No es importante el orden temporal en s=1,…,S, así que se puede generalizar a cualquier tipo de curva
• En cada instante que calculamos los rangos tenemos que haber observado todas las series
• Para aprovechar mejor los datos lo mejor es suavizar la curva antes de discretizar
Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia
IDEA 1: Rangos de las curvas Rangos de las curvas
INTERPOLACIÓN “SHAPE PRESERVING” de MATLABINTERPOLACIÓN “SHAPE PRESERVING” de MATLAB
• Utiliza información local únicamente de la propia curvaUtiliza información local únicamente de la propia curva
• Es no paramétricaEs no paramétrica
• Es un método sencilloEs un método sencillo
• Y siempre mejorable con una modelización previa…Y siempre mejorable con una modelización previa…
• Da una solución bastante razonable!!!Da una solución bastante razonable!!!
DATOS CON INTERPOLACIÓN “shape preserving”DATOS CON INTERPOLACIÓN “shape preserving”
DATOS CON INTERPOLACIÓN “shape preserving”DATOS CON INTERPOLACIÓN “shape preserving”
DATOS CON INTERPOLACIÓN “shape preserving”DATOS CON INTERPOLACIÓN “shape preserving”
SeasonSeason Percentage of Percentage of observed dataobserved data
First observed First observed datadata
Last observed Last observed datadata
1987/1988 6.53 1864 2160
1988/1989 65.42 645 2158
1989/1990 71.11 230 2086
1990/1991 61.90 433 2158
1991/1992 71.39 539 2160
1992/1993 5.13 1243 2131
1993/1994 65.79 529 2040
1994/1995 59.03 143 2160
1995/1996 69.91 87 1720
1996/1997 31.30 1478 2160
1997/1998 84.40 185 2102
1998/1999 95.23 71 2160
1999/2000 90.42 168 2160
2000/2001 93.33 67 2160
2001/2002 97.17 1 2160
2002/2003 99.35 1 2160
2003/2004 90.23 1 1976
2004/2005 92.08 14 2160
2005/2006 100 1 2160
2006/2007 100 1 2160
Eliminadas Eliminadas (insuficientes datos)
1076 datos 1076 datos empleados empleados cada añocada año
Diremos que la serie tiene tendencia si la serie de Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia“rangos” de las curvas tiene tendencia
IDEA 1: Rangos de las curvas Rangos de las curvas
1.1. Para cada curva XPara cada curva Xtt calculamos los rangos en un número calculamos los rangos en un número
finito de instantes finito de instantes RRtt (1)(1), …, R, …, Rtt(S)(S)
2.2. Integramos a lo largo de todo el periodo de observación Integramos a lo largo de todo el periodo de observación de la curvade la curva
IDEA 1: Rangos de las curvasRangos de las curvas
Diremos que la serie tiene tendencia si la Diremos que la serie tiene tendencia si la serie de los “rangos” de las “series serie de los “rangos” de las “series ordenadas” tiene tendenciaordenadas” tiene tendencia
IDEA 2: Rangos de las curvas ordenadasRangos de las curvas ordenadas
Diremos que la serie tiene tendencia si la Diremos que la serie tiene tendencia si la “serie de rangos” de las curvas tiene “serie de rangos” de las curvas tiene tendenciatendencia
Métodos descriptivos de evaluación de tendenciasMétodos descriptivos de evaluación de tendencias
1.1. Se calculan las curvas “ordenadas” xSe calculan las curvas “ordenadas” x(1)(1), …, x, …, x(T) (T) (mínima, (mínima, segunda,…, máxima)segunda,…, máxima)
Diremos que la serie tiene tendencia si la serie de los Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia“rangos” de las series “ordenadas” tiene tendencia
IDEA 2: IDEA 2: Rangos de curvas ordenadasRangos de curvas ordenadas
s
X1
X2
X3
s
X(1)
X(2)X(3)
1 1 13
2 2
2
3 1 32
1 11
3333
2
2
2
R’3 = 18/7
R’2 = 12/7
R’1 = 12/7
2.2. Para cada xPara cada x(t)(t) calculamos los “rangos” en un número calculamos los “rangos” en un número finito de instantes, R’finito de instantes, R’tt
(1)(1),…,R’,…,R’tt(S)(S), siendo R’, siendo R’tt
(j) (j) el orden de el orden de la curva asociada en el instante jla curva asociada en el instante j
3.3. Integramos a lo largo de todo el periodo de observación Integramos a lo largo de todo el periodo de observación de la curvade la curva
Diremos que la serie tiene tendencia si la serie de los Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia“rangos” de las series “ordenadas” tiene tendencia
IDEA 2: IDEA 2: Rangos de curvas ordenadasRangos de curvas ordenadas
Comentarios:
• Aunque le llamamos serie de “rangos”, no son rangos ya que al tratarse de un promedio de rangos no toman valores enteros, tampoco son las series “ordenadas”
• Reducimos la dimensión infinita del problema
• No es importante el orden temporal en s=1,…,S, así que se puede generalizar a cualquier tipo de curva
• En cada instante que calculamos los rangos tenemos que haber observado todas las series
• Para aprovechar mejor los datos lo mejor es suavizar la curva antes de discretizar
• Sirve de base para los test de “curvas máximas”…
Diremos que la serie tiene tendencia si la serie de los Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia“rangos” de las series “ordenadas” tiene tendencia
IDEA 2: IDEA 2: Rangos de curvas ordenadasRangos de curvas ordenadas
Test para curvas máximasTest para curvas máximas
Consideramos la cantidad de Consideramos la cantidad de veces que una curva coincide veces que una curva coincide con la curva máxima con la curva máxima
1.1. Proponemos un test sobre la probabilidad de que una Proponemos un test sobre la probabilidad de que una curva coincida con la curva máximacurva coincida con la curva máxima
Si no hay calentamiento (HSi no hay calentamiento (H00), las curvas son independientes ), las curvas son independientes y la probabilidad es la misma para las T curvasy la probabilidad es la misma para las T curvas
3333
2
2
2
Bajo la hipótesis nula Bajo la hipótesis nula
eses
Test para curvas máximasTest para curvas máximas
2.2. Proponemos un test sobre la Proponemos un test sobre la probabilidad de que una curva probabilidad de que una curva coincida con la curva máxima coincida con la curva máxima de las observadas hasta el de las observadas hasta el momentomomento
Rechazamos para todos los veranos excepto en 2003/04
que fue un verano “sorprendentemente” frío
para las personas que estuvimos allí
Rechazamos para todos los veranos excepto en 2003/04
que fue un verano “sorprendentemente” frío
para las personas que estuvimos allí
Test para curvas máximasTest para curvas máximas
Test para curvas máximas – Bases ArgentinasTest para curvas máximas – Bases Argentinas
CONCLUSIONES:
• Con este trabajo no pretendemos dar respuesta a la pregunta de si hay o no calentamiento en la Antártida
• Proponemos herramientas estadísticas que permitan incorporar en los estudios la mayor parte de los datos que se están registrando con gran coste económico y humano
• Hemos visto que un enfoque basado en el Análisis de Datos Funcionales es útil para tratar series temporales que se observan sólo en una parte del año
• Las mismas técnicas se pueden utilizar en otros problemas similares. Por ejemplo, evolución del ozono troposférico
Muchas graciasMuchas gracias