contribuciones a la estadística espacial no paramétrica
TRANSCRIPT
Contribuciones a la Estadıstica Espacial No Parametrica
Sergio Castillo Paez (UVIGO, ESPE)
II CONFERENCIA DE MATEMATICOS ECUATORIANOS
Parıs, Abril 2016
Contribuciones a la Estadıstica Espacial No Parametrica 1 / 21
Indice
1 IntroduccionModelo geoestadısticoObjetivos principalesEnfoque parametrico y no parametrico
2 Estimacion no parametrica de la tendenciaEstimador lineal local multivarianteSeleccion de la ventana
3 Estimacion no parametrica de la dependenciaEstimacion NP del variograma
4 Inferencias sobre el proceso espacial
5 Nuevas contribucionesSeleccion de ventana para estimacion lineal localMetodo Bootstrap No ParametricoMapas de riesgo geoestadıstico no parametricoEstimacion NP en procesos espaciales heterocedasticos
Contribuciones a la Estadıstica Espacial No Parametrica 2 / 21
Un ejemplo introductorio
concentración de zinc (ppm)
330000
331000
332000
333000
179000 179500 180000 180500 181000
●● ●
●
●●
●●
●●
●●
●●●
●
●
●
●
● ●●●
●●●●
●●
●
●●●
●●●
●●●
●
●
●●
●
●
●
●
●
●
●●
●●
●●●
●●
●
●
●
●
●
●
●●
●
●
●
●●●
● ●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●●●
●
●●
●
●●●
●●
●
●
●
●●
●
●
●
●●
●●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
● ●
●
●●
●●●
●
●●
●●●
●
●
●
●
●
●
[113,197.4](197.4,344.9](344.9,602.5](602.5,1053](1053,1839]
Figura 1. Concentracion de zinc medida sobre la superficie de las riberas del rıo Meuse
(Pebesma, 2004)Contribuciones a la Estadıstica Espacial No Parametrica 3 / 21
Modelo geoestadıstico
Proceso espacial:{Y (x), x ∈ D ⊂ Rd
}, con dominio D continuo.
Modelo:Y (x) = µ(x) + ε(x), (1)
µ(·) funcion tendencia (determinıstica).
ε(·) proceso de error estacionario de segundo orden, de media cero ycovariograma:
C (u) = Cov(ε (x) , ε (x + u))
Usualmente, la dependencia se modela a traves del variograma:
γ(u) =1
2Var(ε (x)− ε (x + u)) (2)
Contribuciones a la Estadıstica Espacial No Parametrica 4 / 21
Objetivos principales
A partir de n valores observados Y = (Y (x1), . . . ,Y (xn))t , puedeinteresar:
Estimar la tendencia del proceso: µ(·)
Obtener la dependencia estimada: γ(·)
Realizar inferencias sobre el proceso espacial:
Predicciones en regiones no observadas: Y (x0).
Intervalos de confianza para µ(·) y γ(·).
Mapas de riesgos: P(Y (x0) ≥ c).
Contribuciones a la Estadıstica Espacial No Parametrica 5 / 21
Enfoque parametrico y no parametrico
Enfoque parametrico tradicional:
4.5
5.0
5.5
6.0
6.5
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
178500 179000 179500 180000 180500 181000 181500
3300
0033
1000
3320
0033
3000
(a) Predicción paramétrica de la tendencia
x
y
++ + +++
+++ +++
++++
++
++ +++
++++
+++
+++ ++++
+++
+++
+
+++++
++
++++++ +
++
+++
++
++
++
+++
+ ++++
++
+ +
+
+
+
++
++
++ ++
+
++
+++
+
+ + +
+
++ +
++
+++
++++
++
+
++
+++
++
++
+
+
+
+
+
+
+
+++
+++
+ ++
++++
+ ++
+++ +
+
(b) Estimación paramétrica del Variograma
distance
sem
ivar
ianc
e
0.05
0.10
0.15
0.20
0.25
500 1000 1500
●
●
●
●
●
●
●
●
●
●
●
● ●
● ●
Figura 2. (a) Prediccion parametrica de la tendencia de Log(Zinc) tomando como
variable explicativa la raız cuadrada de la distancia al rıo, y (b) Estimacion parametrica
del variograma de los residuos a partir de un modelo Exponencial
Contribuciones a la Estadıstica Espacial No Parametrica 6 / 21
Enfoque parametrico y no parametrico
Enfoque no parametrico:
No estan expuestos a problemas de mala especificacion .
Obtienen estimaciones mas flexibles.
De utilidad en inferencia parametrica y facilitan la seleccion de unmodelo.
Requieren la seleccion de un parametro de suavizado (ventana).
Se propone utilizar el estimador lineal local por sus propiedades teoricas(reduccion efecto frontera) y son mas faciles de implementar (paquetenpsp de R).
Contribuciones a la Estadıstica Espacial No Parametrica 7 / 21
Estimacion NP de la tendenciaEstimador lineal local multivariante:
Se obtiene por suavizado lineal de los datos (xi ,Y (xi )), tal que:
µH(x) = et1(Xt
xWxXx
)−1Xt
xWxY = stxY, (3)
e1 = (1, 0, .., 0)t .
Xx matriz cuya i-esima fila es (1, (xi − x)t).
Wx = diag {KH(x1 − x), . . . ,KH(xn − x)} ,
KH(u) = |H|−1K (H−1u), donde K es una funcion tipo nucleod-dimensional.
H es una matriz definida positiva de orden d , y representa el parametrode suavizado o ventana.
Matriz de suavizado S: matriz n × n con stxi en la fila i tal que:
Y = SY.
Contribuciones a la Estadıstica Espacial No Parametrica 8 / 21
Criterios para seleccion de la ventana
Validacion cruzada tradicional (VC), suponiendo independencia:
CV (H) =1
n
n∑i=1
(Y (xi )− m−i (xi ))2
siendo m−i (xi ) la estimacion obtenida eliminando el dato i .
VC generalizada con correccion de sesgo para dependencia(Francisco-Fernandez y Opsomer, 2005):
CGCV (H) =1
n
n∑i=1
(Y (xi )− m(xi )
1− 1n tr (SR)
)2
siendo R la matriz de correlaciones (estimada).
Contribuciones a la Estadıstica Espacial No Parametrica 9 / 21
Influencia de la ventana en la estimacion NP
4
5
6
7
8
179.0 179.5 180.0 180.5 181.0
330
331
332
333
(a) Estimación de la Tendencia bajo independencia
(120x120)Easting (km)
Nor
thin
g (k
m)
4.5
5.0
5.5
6.0
6.5
7.0
179.0 179.5 180.0 180.5 181.0
330
331
332
333
(b) Estimación de la tendencia bajo dependencia
(120x120)Easting (km)
Nor
thin
g (k
m)
Figura 3. (a) Estimacion NP de la tendencia de Log(Zinc) con ventana
H = diag(0,5329, 0,5683) bajo independencia y (b) Estimacion NP de la tendencia de
Log(Zinc) con ventana H = diag(1,0945, 1,5631) bajo dependencia de los datos.
La matriz ventana H controla el grado de suavizado de la estimacionlineal local.
Contribuciones a la Estadıstica Espacial No Parametrica 10 / 21
Estimacion NP del variograma
Se realiza a partir de los residuos: r(xi ) = Y (xi )− µ(xi ).
Si la media se supone constante: r(xi ) = Y (xi )
Puede verse como un caso particular de regresion:
γ(u) =1
2E(ε(x)− ε (x + u))2
La estimacion se puede obtener por suavizado lineal utilizando (3)sobre los datos (||u||, 1
2 (r(x)− r (x + u))2), usando una ventanaseleccionada por VC.
Estos estimadores no son condicionalmente definido-negativos (no esfactible realizar predicciones kriging), por lo que se debe ajustar unmodelo de variograma valido.
Modelo ”no parametricos”de Shapiro - Botha (paquete npsp).
Contribuciones a la Estadıstica Espacial No Parametrica 11 / 21
Correccion del sesgo de variograma
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●●
● ● ● ● ● ● ● ● ●
0.0 0.5 1.0 1.5
0.0
0.1
0.2
0.3
0.4
0.5
0.6
Nonparametric bias−corrected semivariogram and fitted models
distancias
sem
ivar
ianzas
corregidosesgado
Figura 4. Variograma sesgado y corregido de los residuos estimados luego de eliminar la
tendencia del Log(Zinc).
La correccion del sesgo se realiza mediante un proceso iterativobasado en la relacion: Σr = Σ + SΣSt −ΣSt − SΣ, siendo Σr lamatriz de covarianza de los residuos.
Contribuciones a la Estadıstica Espacial No Parametrica 12 / 21
Inferencias sobre el proceso espacial
5.0
5.5
6.0
6.5
7.0
7.5●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
178500 179000 179500 180000 180500 181000 181500
3300
0033
1000
3320
0033
3000
Predicción paramétrica por kriging universal
x
y
++ + ++ +
+++ +++
+++
++
++
+ +++
++++
+++
+++ ++++
+++
+++
+
+++++
++
++++++ +
++
+++
++
++
++
+++
+ ++++
++
+ +
+
+
+
++
++
++ ++
+
++
+++
+
+ + +
+
++
+
++
+++
++++
++
+
++
+++
++
++
+
+
+
+
+
+
+
+++
+++
+ ++
++++
+ ++
+++ +
+
Figura 5. Prediccion de Log(Zinc) mediante kriging no parametrico.
Se pueden construir predicciones, intervalos de confianza, mapas deriesgo, etc.
Aplicaciones en minerıa, monitoreo ambiental, procesamiento deimagenes satelitales, meteorologıa, etc.
Contribuciones a la Estadıstica Espacial No Parametrica 13 / 21
Nuevos criterios para la seleccion de ventana
Propuestas para seleccionar H del estimador lineal local de latendencia de un proceso espacial (Fernandez-Casal, Castillo-Paez yGarcıa-Soidan, 2016):
CCV (H) =1
n
n∑i=1
(Y (xi )− m−i (xi ))2 +2
ntr (S−N1Σ)
o mas generalmente:
CMCV (H) =1
n
n∑i=1
(Y (xi )− m−N(i)(xi)
)2+
2
ntr (S−NΣ)
para algun vecindario N y siendo Σ la matriz de covarianzas de Y.
Contribuciones a la Estadıstica Espacial No Parametrica 14 / 21
Metodo Bootstrap No Parametrico (NPB)
Realizar inferencias sobre la variabilidad del estimador lineal local delvariograma de un proceso espacial con y sin tendencia.
Proponer un metodo bootstrap, basado en la descomposicion deCholesky de la matriz de covarianzas Σ = LLt .
1 A partir de una ventana H, obtener el estimador lineal local de latendencia, tal que: Y = SY.
2 Calcular los residuos r = Y − SY y estimar el variograma sesgado γ(u)
3 Obtener Σr y Lr ajustando un Modelo Shapiro - Botha a γ(u).
4 Corregir el sesgo de Σr para ası obtener Σ y L.
5 Generar e∗ por remuestreo independiente de e = L−1r r.
6 Construir la muestras bootstrap Y∗ = SY + r∗, donde r∗ = Le∗.
Contribuciones a la Estadıstica Espacial No Parametrica 15 / 21
Metodo Bootstrap No Parametrico (NPB)
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●●
● ● ● ● ● ● ● ● ●
0.0 0.5 1.0 1.5
0.0
0.1
0.2
0.3
0.4
0.5
0.6
Variogramas
distancias
sem
ivar
ianz
as
● NP est. variog. correct. variog. IC (95%) - NPB
Figura 6. Intervalo de confianza al 95 % para el estimador lineal local del variograma de
los residuos de datos ”meuse”, utilizando el NPB.
Estudios numericos muestran que el NPB conduce a mejoresresultados que otros metodos bootstrap como el MBB o SPB(Castillo-Paez, S., Fernandez-Casal, R., y Garcıa-Soidan, P., 2016).
Contribuciones a la Estadıstica Espacial No Parametrica 16 / 21
Mapas de riesgo geoestadıstico no parametrico
A partir del NPB es factible contruir mapas de riesgo basados en laprediccion kriging.
Se estima a partir de la probabilidad de que la variable Y exceda unvalor crıtico c en un ubicacion especıfica x0:
rc (x0) = P (Y (x0) ≥ c) .
El proceso propuesto por Fernandez-Casal, R., Castillo-Paez, S., yFrancisco-Fernandez, M. (2016), implica:
1 Aplicar el metodo NPB para construir B replicas bootstrapY ∗(xi ), i = 1, . . . , n del proceso espacial original.
2 Obtener la prediccion kriging Y ∗(x0) en cada localizacion nomuestreada x0 a partir de cada muestra bootstrap.
3 El mapa para rc (x0) se construye mediante las frecuencias observadasen las que Y ∗(x0) ≥ c .
Contribuciones a la Estadıstica Espacial No Parametrica 17 / 21
Mapas de riesgo geoestadıstico no parametrico
0.0
0.2
0.4
0.6
0.8
1.0
179.0 179.5 180.0 180.5 181.0
330
331
332
333
Threshold = 6
x1
x2
Figura 7. Mapa de probabilidad estimada de observar una concentracion de log(zinc)
mayor o igual a un valor crıtico de c = 6,0 ppm.
Contribuciones a la Estadıstica Espacial No Parametrica 18 / 21
Estimacion NP en procesos espaciales heterocedasticos
Se considera el modelo:
Y (x) = µ(x) + σ(x)ε(x),
µ(·) funcion tendencia, σ(·) funcion varianza (determinısticas).
ε(·) proceso de error estacionario de segundo orden, de media cero,varianza unitaria y correlograma:
ρ(u) = Cov(ε (x) , ε (x + u))
En este caso: γ(u) = 1− ρ(u).
Objetivo: Estimar no parametricamente las caracterısticas del proceso,i.e., µ(x), σ(x) y γ(u).
Se proponen nuevos estimadores para σ(x) y una modificacion delproceso iterativo para la correccion del sesgo del variograma bajoheterocedasticidad.
Contribuciones a la Estadıstica Espacial No Parametrica 19 / 21
MUCHAS GRACIAS
Contribuciones a la Estadıstica Espacial No Parametrica 20 / 21
Referencias
Fernandez-Casal R, Francisco-Fernandez M (2014) Nonparametric bias-correctedvariogram estimation under non-constant trend. Stoch Environ Res Risk Assess 28.
Francisco-Fernandez M, Opsomer JD (2005) Smoothing paremeter selectionmethods for nonparametric regression with spatially correlated errors. Canadian JStat 33:279-295.
Garcıa-Soidan, P., Gonzalez-Manteiga, W., Febrero-Bande, M. (2003) Local linearregression estimation of the variogram. Stat Prob Lett 64.
Pebesma, E.J. (2004) Multivariable geostatistics in S: the gstat package.Computers & Geoscience 30: 683-691.
Nuevas contribuciones pendientes de publicacion.
Fernandez-Casal, R., Castillo-Paez, S. y Garcıa-Soida, P. (2016) Bandwidthselection for local linear trend estimation, presentado en el Congreso InternacionalMETMA 2104, Turın, Italia.
Castillo-Paez, S., Fernandez-Casal, R., y Garcıa-Soidan, P. (2016) Bootstrapmethods for inference on the variogram, presentado en el Congreso SEIO 2015,Pamplona, Espana.
Fernandez-Casal, R., Castillo-Paez, S., y Francisco-Fernandez, M. (2016)Nonparametric geostatistical risk mapping, presentado en el CongresoInternacional METMA 2104, Turın, Italia.
Contribuciones a la Estadıstica Espacial No Parametrica 21 / 21