análisis estadístico de datos climáticosmeteo.fisica.edu.uy/.../teorico_aedc/explore3.pdf ·...

23
Análisis Estadístico de Datos Climáticos Técnicas exploratorias para datos apareados: - scatterplots - coefs. de correlación de Pearson y Spearman - función de autocorrelación; persistencia teporal

Upload: others

Post on 30-Apr-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Análisis Estadístico de Datos Climáticos

Técnicas exploratorias para datos apareados:- scatterplots- coefs. de correlación de Pearson y Spearman- función de autocorrelación; persistencia teporal

Page 2: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Técnicas eploratorias para datos multi-dimensionales

● Datos multidimensionales:

✔ una estación con medidas de varias variables diferentes (temp, precip, humedad, etc...)

✔ una variable medida en varias estaciones. ✔ salida de un modelo con la variable en una grilla (lat x

lon). La cantidad de variables físicas de un modelo no es menor a 20.

Entonces tenemos un numero no menor de 20 x 100 x 50 x 10 = 1x106 variables.

● Matriz de correlación● Mapas de correlación● Mapas de teleconectividad

Page 3: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Matriz de correlaciónConsideremos datos de precip, humedad relativa, temperatura

mínima, temperatura máxima y temperatura media diarias para la estación de Las Brujas en julio de 1975.

%Cargar datos de la estación Las Brujas (INIA)pre=nc_varget('Precip_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','pcpn');rh=nc_varget('RelatHum_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','rh');tmi=nc_varget('TempMin_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','tempmin');tma=nc_varget('TempMax_LasBrujas_INIA_1Jan197531Dec1995.cdf','tempmax');tme=nc_varget('TempMedia_LasBrujas_INIA_1Jan1975-31Dec1995.cdf','tempavg');

%Datos para Julio 1975 (es aproximado pues considero meses de 30 dias)pre=pre(6*30+1:7*30);rh=rh(6*30+1:7*30);tmi=tmi(6*30+1:7*30);tma=tma(6*30+1:7*30);tme=tme(6*30+1:7*30);

%Matriz de datos y traspongodatos=[pre; rh; tma; tme; tmi]; % variable x tiempo= 5 x 30datos=datos'; % tiempo x variable = 30 x 5

Page 4: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

PRE RH TMAX TMED TMIN

7.2000 97.0000 16.2000 13.9000 13.0000 13.5000 98.0000 14.2000 13.8000 13.4000 24.5000 100.000 14.0000 13.3000 11.8000 1.5000 93.0000 15.0000 11.7000 9.8000 0 91.0000 17.4000 11.9000 9.4000 23.4000 71.000 11.8000 10.3000 8.2000 0 67.0000 12.0000 9.5000 5.6000 0 60.0000 17.8000 12.0000 4.0000 0 69.0000 19.6000 12.9000 7.0000 0 78.0000 21.6000 15.4000 10.2000 1.0000 94.0000 17.0000 14.7000 13.1000 0 89.0000 13.4000 12.7000 10.3000 0 75.0000 13.4000 9.8000 6.2000 0 88.0000 15.4000 10.1000 3.8000 6.5000 93.0000 14.6000 12.4000 9.1000 3.8000 51.0000 8.8000 7.6000 2.6000 0 67.0000 7.3000 4.8000 2.0000 1.0000 78.0000 6.9000 4.9000 3.5000 0 78.0000 10.0000 4.3000 0.1000 0 80.0000 12.0000 4.3000 -0.4000 0 74.0000 13.7000 6.4000 0.2000 0 91.0000 13.8000 6.8000 0.1000 0 95.0000 12.2000 7.2000 4.3000 0 95.0000 13.8000 10.3000 6.7000 0 92.0000 10.2000 8.3000 5.9000 2.0000 78.0000 8.4000 6.2000 4.8000 0 72.0000 9.2000 5.2000 0.6000 0 82.0000 9.6000 4.7000 -2.1000 0 84.0000 14.9000 10.3000 7.0000 0 96.0000 12.9000 7.7000 2.4000

Matriz de datosdiarios en Las Brujasjulio de 1975

tiempo(30 dias)

Page 5: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Supongamos que quiero hallar la correlacion entre las diferentes variables

Tengo que correlacionar cada variable con las otras. Para eso hago:

R=corrcoef(datos); %coef. de correlacion de Pearson

y obtengo la matriz de correlacion R

PRE RH TMAX TMED TMIN

PRE 1.0000 0.1848 0.0028 0.3334 0.4598RH 0.1848 1.0000 0.2440 0.3341 0.4605TMAX 0.0028 0.2440 1.0000 0.8114 0.5496TMED 0.3334 0.3341 0.8114 1.0000 0.9008TMIN 0.4598 0.4605 0.5496 0.9008 1.0000

Page 6: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Propiedades de R

PRE RH TMAX TMED TMIN

PRE 1.0000 0.1848 0.0028 0.3334 0.4598RH 0.1848 1.0000 0.2440 0.3341 0.4605TMAX 0.0028 0.2440 1.0000 0.8114 0.5496TMED 0.3334 0.3341 0.8114 1.0000 0.9008TMIN 0.4598 0.4605 0.5496 0.9008 1.0000

● Simétrica con respecto a la diagonal. En general se toma el triangulo inferior para mostrar los resultados.

● La diagonal son siempre 1 pues es la correlación de una variable consigo misma

● Para K variables se tienen K(K-1)/2 coeficientes diferentes

● Notar que TMIN es la variable mas correlacionado con las demás.

Correlación entreRH y TMED.

Page 7: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

En general la matriz de correlación se puede escribir como

r ij=r ji

Page 8: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Mapas de correlación

Las matrices de correlación son útiles para mostrar la relacion entre diferentes

variables en una estación.

Muchas veces se quiere relacionar la variabilidad en una estación (o región) con

el resto del globo. En este caso es útil presentar las correlaciones

gráficamente/espacialmente.

Page 9: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Correlación de TS (56W,35S) con TS global en c/punto. Período: meses Ene1949-Ago2007

La correlación es máxima (=1) sobre (56W,34S) y decrece a medida que nos alejamos. La escala espacial de caida de correlación nos da la escalade autocorrelacion espacial.

Page 10: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

%Código Matlabtemp=nc_varget('sfctemp.cdf','temp'); %size(temp) =704x73x144X=nc_varget('sfctemp.cdf','X');Y=nc_varget('sfctemp.cdf','Y');

[clim,anom]=climatology(X,Y,temp,0);

%Calculo correlación d (X,Y)=(52,122)=(35S,56W) con el restofor i=1:144 for j=1:73 cc(j,i)=corrcoef(anom(:,51,122),anom(:,j,i)); endend

%Graficocont_netcdf(X,Y,cc',0,(-1:0.2:1))

colormap(rednblue3) %seteo paleta de coloresset(gca,'xtick',(0:50:350),'xticklabel',[' 0 '; ... '50E';'100E';'150E';'160W';'110W';' 60W';' 10W']) %cambio nombres eje x

Page 11: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Correlación de Precip (56W,35S) con Precip global en c/punto. Período: meses Ene1979-

Dic2006

Menor autocorrelación espacial. Mas ruidosa.

Page 12: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Correlación de TS (56W,35S) con TS global en c/punto. Mayos de 1949-2007

Este mapa sugiere la presencia de un fenómeno ondulatorio que modula las correlaciones en el hemisferio sur. Regiones lejanas estanrelacionadas = teleconexiones.

Page 13: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

%En Matlab

for i=1:144 for j=1:73 cc5(j,i)=corrcoef(anom(5:12:end,51,122),anom(5:12:end,j,i)); endend

cont_netcdf(X,Y,cc5',0,(-1:0.2:1))

colormap(rednblue3)set(gca,'xtick',(0:50:350),'xticklabel',[' 0 '; ... '50E';'100E';'150E';'160W';'110W';' 60W';' 10W'])

Page 14: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Correlación de PS (56W,35S) con PS global en c/punto. Mayos de 1949-2007

Un mapa de correlación de presion a nivel del mar tambien sugiere elfenómeno ondulatorio, aunque está concentrado en el Pacifico sur.

Page 15: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Correlacion de la TSM en la zona ecuatorial con el resto de los oceanos

La TSM en el Pacificoecuatorial tiende acovariar en ladireccion longitudinal pero estarestringido en la direccionlatitudinal.

➢ la zona ecuatorialtiene una dinamica propia.

Page 16: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

La zona ecuatorial tiene correlacionespacial anisotropica.

Que tiene de especial el ecuador?

La fuerza de Coriolis es

despreciable.

Page 17: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Para monitorear los procesos oceanicos

ecuatoriales (El Niño) basta con una red de

boyas entre 8°S y 8°N

Page 18: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Generalizaciones del mapa de correlacion

La idea básica de mapear correlaciones puede extenderse:

● usar variables diferentes: por ejemplo, correlacionar las anomalías de precipitación en Uruguay con las temperaturas de superficie globales.

● construir una matriz de correlación con retraso temporal.

Page 19: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Los mapas de correlacion muestran solo una fila de la matriz de correlacion

Vimos que estos mapas pueden mostrar patrones de teleconexion. Una forma de resumir la informacion sobre teleconexiones de la matriz de correlacion es hacer una

mapa de teleconectividad T, el cual se define como,

para cada fila i se determina

dim(R)= Nlon x Nlat

Page 20: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Por ejemplo para la PS en (56W,35S) durante los mayos de 1949-2007, el T

(56W,35S)~|-0.5|=0.5

(ubicado alrededor de (100W,70S)).

Page 21: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Mapa de teleconectividad para para la altura de geopotencial en 500mb en el

invierno del H.N.

Pacific NorthAmerican pattern

North AtlanticOscillation

La altura de geopotenciales “casi” la altura a la cual la presion atmosferica tiene un determinado valor.

Page 22: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

Patrón de teleconexión forzado por El Niño

Page 23: Análisis Estadístico de Datos Climáticosmeteo.fisica.edu.uy/.../teorico_AEDC/Explore3.pdf · Técnicas eploratorias para datos multi-dimensionales Datos multidimensionales: una

● Los mapas de teleconectividad son de otra época.

● Fueron usados en meteorología hasta los años ochenta para encontrar patrones de circulación que covaríen.

● Hoy día fueron sustituidos por metodologías estadísticas mas potentes como análisis de componentes principales y análisis de máxima covarianza que veremos mas adelante.