estimación lineal mínimo cuadrática en modelos arh(1

49
Felícita Doris Miranda Huaynalaya a

Upload: others

Post on 04-Oct-2021

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

MASTER EN ESTADÍSTICA APLICADAFACULTAD DE CIENCIAS

Estimación Lineal Mínimo Cuadrática

en Modelos ARH(1) Afectados por Ruido

Felícita Doris Miranda Huaynalaya

TRABAJO DE FIN DE MASTER

DirectoraDra. Da María Dolores Ruiz Medina

Granada, diciembre 2011

1

Page 2: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Deseo mostrar mi más sincero agradecimiento, este trabajo no se hubierallevado a cabo sin la ayuda y el apoyo de la Dra. Da María Dolores RuizMedina, por su constante y valiosa dedicación a lo largo de estos meses y porsu excelente labor como directora de esta memoria.

Tambien deseo agradecer todas las muestras de ayuda y estímulo recibidaspor familiares, amigos(as) y todos ellos que han tomado parte de alguna uotra forma, en la realización de la misma.

2

Page 3: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Índice general

1. Filtrado Espacio-Temporal de la Secuencia de Datos Funcio-nales Espaciales Fractales 91.1. Modelo estadístico funcional . . . . . . . . . . . . . . . . . . . 91.2. Estructura de dependencia funcional y sus aproximación em-

pírica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.3. Estimador funcional lineal por mínimos cuadrados . . . . . . . 111.4. Estimación empírica B-Spline y sus aproximaciones . . . . . . 12

1.4.1. Aproximación de Funcionales Lineal con Penalización . 131.4.2. Aproximación de Funcionales Lineal basado en Obser-

vaciones Discreta . . . . . . . . . . . . . . . . . . . . . 141.5. Estructuras de datos funcionales con dependencia espacial . . 15

1.5.1. Datos Funcional Geostadística . . . . . . . . . . . . . . 161.5.2. Datos Funcional asociado con procesos puntos . . . . . 161.5.3. Datos Areal Funcional . . . . . . . . . . . . . . . . . . 17

1.6. Métodos Cokriging para datos funcional espacial . . . . . . . . 181.6.1. Modelo lineal espacial para datos funcionales . . . . . . 18

2. Estimación de Máximo Verisimilitud Funcional del ModeloARH(p) 202.1. Formulación del modelo . . . . . . . . . . . . . . . . . . . . . 20

2.1.1. El caso ARH(p) . . . . . . . . . . . . . . . . . . . . . . 212.2. Diagonalización y Filtro de Kalma en el caso ARH(1) . . . . . 21

2.2.1. Filtro y suavizado Kalman . . . . . . . . . . . . . . . . 222.2.2. Filtro Kalman forward . . . . . . . . . . . . . . . . . . 23

2.3. Diagonalización y Filtro de Kalma en el caso ARH(p) . . . . . 242.3.1. Filtro y suavizado Kalman . . . . . . . . . . . . . . . . 252.3.2. Filtro Kalman forward . . . . . . . . . . . . . . . . . . 262.3.3. Suavizado Kalman backward . . . . . . . . . . . . . . . 27

2.4. Algoritmo EM . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.4.1. Estimaciones iniciales . . . . . . . . . . . . . . . . . . . 272.4.2. Pasos E y M . . . . . . . . . . . . . . . . . . . . . . . . 28

3

Page 4: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

2.4.3. El caso ARH(p) . . . . . . . . . . . . . . . . . . . . . . 302.5. Generación del proceso . . . . . . . . . . . . . . . . . . . . . . 32

3. Estimación Lineal Mínimo Cuadrática en Modelos ARH(1)mediante Proyección 333.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.2. Resolución de la Ecuación Estimación Funcional mediante Pro-

yección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343.3. Predicción optima mediante el ltro de Kalman . . . . . . . . 363.4. Conclusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

4

Page 5: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Introducción

Muchos procesos físicos, biológicos, medio ambiente, geofísico, incluyen lavariabilidad en el espacio y el tiempo. Como resultado de las dicultades cau-sadas por grandes conjuntos de datos y el modelado de las interacciones deespacio, tiempo y espacio temporal, los métodos tradicional espacio-tiemposon limitados. Al mismo tiempo, el creciente número de situaciones donde lainformación de la muestra funcional está disponible ha permitido que las he-rramientas estadísticas funcionales que deben aplicarse en el análisis de estascaracterísticas. De hecho, la estadística funcional proporciona un marco másinformativo y ricos contexto en el que la complejidad de tales característicaspuede ser debidamente analizada.

En el contexto de la estimación de parámetros mínimo contraste, nosreferimos a Anh, Leonenko y Sakhno (2004) sobre la estimación de pará-metros de campos aleatorios fraccional a partir de información de la mues-tra funcional. El libro de Christakos (2000) proporciona una visión generalde las diferentes metodologías aplicado en el análisis estadístico de camposaleatorios espacio-temporal, incluyendo los modelos diferenciales fraccional yanálisis de heterogeneidad. Por otro lado, las diferentes familias covarianzaespacio-temporales recientemente se han introducido y analizado como unaherramienta para el modelado estadístico de datos espacio-temporales (verBerg et al. 2008; Gneiting 2002; Kelbert et al. 2005; Ma 2005; Porcu y Mateu2007; Stein 2005; entre otros). En el caso en el que pesados-cola y núcleosfractales son considerados para un modelo (véase, por ejemplo, Antoniadisy Sapatinas 2003, Berg et al. 2008 y Kelbert et al. 2005), el problema deestimación funcional asociados es un problema mal planteado. Una opciónes aplicar los métodos de proyección numéricos localizando un espacio di-mensional nito en el que la inversión estable es posible, en términos de unabase ortonormal adecuada. Otra forma es considerar un espacio funcional,con una geometría adecuada, compensando singularidad del espectro, dondela inversión de la ecuación Wiener-Hopf asociados es limitada.

Estadísticas Funcional (véase, por ejemplo, Christakos 2005; Ferraty Vieuy 2006, Ramsay y Silverman 2005) proporciona un contexto usual para el aná-lisis de sistemas complejos. Entre la amplia gama de campos aplicados dondese requiere el análisis estadístico de información de la muestra funcional, sehará referencia a las aplicaciones epidemiológicas (véase Christakos y Hris-topulos 1998). El enfoque funcional permite resolver clasicación complejosy los problemas de discriminación, que son fundamentales en la detecciónde factores de riesgo tales como la alteración de genes celulares (el riesgo de

5

Page 6: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

cáncer humano) (véase Hall et al 2001; Müller de 2005; Müller y Stadmüllerde 2005, que aplicó modelos lineal funcional generalizado). Adicionalmente,la dinámica colectiva evoluciona espacialmente y temporalmente de actuarde manera crítica a coordinar el desarrollo multicelular (por ejemplo, morfo-genéticas movimientos de las células y la transcripción de genes que requierede buena coordinación espacial y temporal). Las conexiones entre datos ge-nómica de alto rendimiento, que se obtiene a nivel molecular y nivel celular,y mayor nivel organizacional y funcional se establecen a partir de lecturasrelevante biológicamente involucrado de las escalas temporales y espaciales(ver Germain et al. 1999; Haoudi Bensmail y 2006; Monk 2003, entre otros).La alta dimensionalidad de los datos generados por estos estudios requie-re el desarrollo de nuevas herramientas en Estadísticas Funcional para unprocesamiento eciente y el análisis de estos conjuntos de datos. Transfor-maciones ortogonales y biortogonal son usualmente aplicado para reducirla dimensionalidad. Por ejemplo, las transformaciones espectrales discretasy continuas (por ejemplo, el análisis de componentes principales funcional,descomposición en valores singular, la transformada de Fourier) se conside-ran para el modelado y procesamiento de conjunto de datos de expresióngenoma (véase, por ejemplo, Alter 2000, 2003; Klevezc y Murray 2001; Yaoet al. 2003, 2005). El problema de predicción en secuencias biológicas, y, enparticular, en datos de expresión génica (ver Bar-Joseph 2004; Bar- Josephet al 2003;. Raychadhuri et al. 2000, entre otros) también se formula en uncontexto funcional cuando los segmentos no observados debe ser estimado.Los modelos Autorregresivos Hilbert son considerado a representar secuen-cias de datos funcionales. Estas secuencias pueden estar constituidos, porejemplo, segmentos de secuencias biológicas, por las imágenes en el análisisespacio-temporal de la deformación de dos dimensiones y el movimiento delas células de las series temporales de imágenes de vídeo digital, etc.

Sin embargo, en muchas aplicaciones, las investigaciones también se en-frentan al problema de la estimación de parámetros de sistemas observadaparcialmente. En este sentido, frente a este problema, bajo el supuesto deGauss, de la familia de modelos ARH(p). Consideramos que el caso de queun ruido de observación funcional aumenta la variabilidad funcional de los da-tos de producción de una pérdida de información. Las bases ortonormales, aligual que las consideradas en el análisis de componentes principales funcional(base autofunción empírica asociada con el operador de covarianza espacial),no proporciona una proyección adecuada (no diagonaliza la ecuación de es-tado funcional ARH) con el n de calcular los estimadores de parámetro deproyección ML en el contexto ARH.

6

Page 7: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

El Análisis estadístico de datos espacio-temporales requiere de las pro-yeccciones de funciones ortogonales u ortonornales que permitan reducir laelevada dimensión de los problemas que se plantean en este análisis (verRuiz-Medina y Angulo[82], Wikle y Cressie [110], Wikle [106] y [107]). Tra-bajaremos en un contexto de espacio de estados. Más concretamente, noscentraremos en el análisis de secuencias de datos funcionales espaciales desdela perspectiva proporcionada por los modelos de series autorregresivas hil-bertianas. Estudiaremos el caso de modelos autorregresivos hilbertianos deorden uno, ARH(1). En este trabajo, se desarrollará la implementación delestimador lineal mínimo cuadrático de la ecuación de estados funcional enel modelo ARH(1) afectado por ruido, en sentido fuerte, mediante proyec-ción en la base de autofunciones empíricas del operador de autocovarianzadel proceso ARH(1). La aproximación a la predicción del espacio-tiempo quelogra la reducción de la dimensión y utiliza un modelo estadístico que estemporalmente dinámica y espacialmente descriptivo (ver Wikle y Cressie1999). Es decir, que explota el ujo unidireccional del tiempo, en un marcoautorregresivo, y es espacialmente "descriptivo"de que el proceso autorre-gresivo espacialmente colorido. Con la inclusión de una ecuación de medida,esta formulación conduce naturalmente al desarrollo de un ltro de Kalmanespacio-temporal que logra la reducción de dimensión en el análisis de gran-des conjuntos de datos espacio-temporales.

En la capítulo 1, se estudia el problema funcional de ltrado asociadosa los procesos espacio-temporal denido por una ecuación de evolución seu-dodiferencial perturbado por un ruido de observación fractal, las condicionespara un cálculo estable de la solución al problema ltrado funcional asociadoque son establecidas en función de los espectros de operador de covarianzadel proceso de interés y de la observación de ruido Hilbert. La aplicación deperturbación teórica de operadores lineales limitado, se establece de las con-diciones en el espacio de parámetros, caracterizando el modelo de observaciónfuncional, para conseguir una inversión estable de la ecuación Wiener-Hopfasociados. También se menciona y desarrolla brevemente algunas técnicasusada en la estimación del modelo de regresión funcional espacial.

En el capítulo 2, En la implementación del método de estimación de pro-yección ML (máxima verosimilitud) de los parámetros funcional que denenla ecuación ARH(p), se considera la diagonalización de las bases Riesz dualdel operador de autocorrelación. Las estimaciones de proyección máxima ve-rosimilitud del operador autocorrelación, y los operadores covarianza de lasinnovaciones funcionales y los ruidos de observación que se obtienen mediantela combinación de ltrado de Kalman y suavizado con el algoritmo EM. La

7

Page 8: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

implementación del algoritmo ltros de Kalman se realiza en términos de lasseries denido por los Coecientes POP del proceso de interés, así como entérminos de la transformación POP de los momentos de segundo orden con-dicional involucrados. El paso expectativa y paso maximización son entoncescalculado a partir del ltrado de Kalman forward seguido por una recursiónsuavizado Kalman backward en términos de coecientes Fourier asociados auna descomposición.

En el capítulo 3, se estudia la implementación del estimador lineal mí-nimo cuadrático de la ecuación de estados funcional en el modelo ARH(1)afectado por ruido Hilbert, en sentido fuerte, mediante proyección en la ba-se de autofunciones empíricas del operador de autocovarianza del procesoARH(1), teniendo en cuenta la secuencia de datos funcionales espaciales delproceso de interés con respecto a la observación del tiempo, sin considerar lalocalización.

8

Page 9: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Capítulo 1

Filtrado Espacio-Temporal de laSecuencia de Datos FuncionalesEspaciales Fractales

El modelo de observación se dene en términos de una secuencia de rea-lizaciones espaciales del proceso de interés, la solución a una ecuación seudodiferencial espacio-temporal, afectados por fuertes ruido blanco aditivo deHilbert. Se estudiará las condiciones en el espacio de parámetros, consideran-do la pesada cola y el comportamiento fractal de la familia núcleo covarianzaconsiderado, para obtener una regularización del problema ltrado funcionalasociados. Por lo tanto, la robustez del estimador funcional se obtiene frentea la variabilidad local funcional de los datos. En la práctica, estas condi-ciones se reeren a los relacionados espectros empíricos con los estimadoresoperadores covarianza.

1.1. Modelo estadístico funcional

El problema ltrado asociado con el modelo de observación funcional(ver Salmerón y Ruiz-Medina 2009, para el caso de procesos Hilbertianoautorregresivo).

Zt = Yt +Nt, t ∈ [0, T ], (1.1)

donde Y es la solución a la ecuación evolución

∂Y

∂t(t, x) = LxY (t, x), (t, x) ∈ R+ ×D ⊂ R+ × Rn, (1.2)

con condiciones inicial aleatorias valuado Hilbert

Y (0, ·) ≡ Y0(·) ∈ HY0 , (1.3)

9

Page 10: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

la condición inicial aleatoria denido por una variable aleatoria con valores enel espacio de Hilbert HY0 de funciones espacial denido en dominio D ⊂ Rn.

El modelo (1.1) es entonces interpretado como un modelo estadístico fun-cional con Nt, t ∈ R+, denido como un fuerte ruido blanco Hilbertiano, esdecir, como una secuencia de variables aleatorias independientes valuado HN

que satisfaceE∥Nt∥2HN <∞, t ∈ R+

Los modelos del fuerte ruido blanco Hilbertiano están denido en térmi-nos de ruido de colores espaciotemporal fractal con el núcleo de covarianzaabsolutamente integrable.

1.2. Estructura de dependencia funcional y sus

aproximación empírica

La estructura de segundo orden de las variables aleatorias Hilbert valuadodel modelo de observación funcional

Zt = Yt +Nt, t ∈ [0, T ],

con Nt, t ∈ R+, un fuerte ruido blanco Hilbertiano. El modelo de observaciónfuncional está dado en términos de los siguientes operadores.

Los operadores covarianza de los procesos de Y,N y Z están denido co-mo

RYtYs = E [Yt ⊗ Ys] , t, s ∈ R+,RNµNs = E [Nµ ⊗Ns] , µ, s ∈ R+,RZµZs = E [Zµ ⊗ Zs] = E [Yµ ⊗ Ys] + E [Nµ ⊗Ns] , µ, s ∈ R+,

especícamente,

RYtYs(ϕ) = E[Yt⟨Ys, ϕ⟩HY =Hs(D)

], ∀ϕ ∈ D(RYtYs),

RNµNs(ϕ) = E[Nµ⟨Ns, ϕ⟩HN=Hβ(D)

], ∀ϕ ∈ D(RNµNs),

RZµZs(ϕ) = E[Zµ⟨Zs, ϕ⟩HZ=Hd(D)

], ∀ϕ ∈ D(RZµZs),

(1.4)

denotado por D(A) el dominio del operador A. Si los procesos Y y N sonestacionario en el tiempo, para t = s y u = s, entonces los operadores decovarianza espacial de los procesos Y,N y Z, son invariante en el tiempo.

10

Page 11: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

El operador de covarianza transversal entre el proceso de interés y elproceso observado está dado por

RYtZs = E [Yt ⊗ Zs] , t, s ∈ R+,

Es decir,

RYtZs(ϕ) = E[Yt⟨Zs, ϕ⟩HZ=Hd(D)

], ∀ϕ ∈ D(RYtZs),

Para la estimación funcional del proceso de interés Y desde el modelo deobservación 1.1, bajo la estacionalidad en el tiempo, se tiene los siguientesestimadores funcional de los operadores de covarianza transversal y espacialde Z, basado en el método de momentos, desde la observación del tiempot = 1, . . . , T ,

RTZsZs

=1

T

(T∑

u=1

Zµ ⊗ Zµ

)−

(1

T

T∑u=1

)⊗

(1

T

T∑u=1

)

RTZsZs+k

= RTYsYs+k

=1

T − k

[T−k∑u=1

Zµ ⊗ Zµ+k

]−

[1

T − k

T−k∑u=1

]⊗

[1

T − k

T−k∑u=1

Zµ+k

],

(1.5)

para k = 1, . . . , p.

En práctica, la información muestral funcional es discreta. Los métodossuavizado se pueden aplicar con el n de aproximarse a la naturaleza continuade los datos. Es decir, en la práctica, el modelo de observación es denidocomo

Zt(x) = Yt(x) +Nt(x), x ∈ DOBSZ ⊂ D, t = 1, . . . , T, (1.6)

donde DOBSZ es un conjunto discreto contenido en D. La densidad de locacio-

nes espacial deniendo el conjunto DOBSZ debe garantizar un buen desempeño

de las técnicas de suavizado con el n de aplicar la metodología de las es-tadísticas funcionales (ver, por ejemplo, Besse et al. 2000, en relación a laimplementación de los métodos de estimación funcional en términos de datosfuncional suavizado).

1.3. Estimador funcional lineal por mínimos cua-

drados

Del modelo de observación funcional 1.1, de la ecuación Wiener-Hopf,se dene el estimador lineal por mínimos cuadrados de Y en tiempo t ∈

11

Page 12: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

[0, T ], para el problema ltrado, y en el tiempo futuro para el problema depredicción, se deriva de la siguiente manera

E[(Yt(·)− LtZ.(·))Zs(·)] = 0, s ∈ [0, T ], (1.7)

donde Lt denota el operador lineal que dene la transformación optima, en elsentido de media cuadrática de los datos funcionales espacial a aproximarsea la realización espacial de Y en cada tiempo t de interés, es decir,

Yt = LtZ.

En el caso donde Lt es un operador integral, tenemos

Yt(x) = LtZ.(x) =

∫[0,T ]×D

l(t, s;x, y)Zs(y) dsdy, (1.8)

donde l denota el nucleo espacio temporal deniendo el operador Lt en elcaso integral. Desde la ecuación 1.7, el operador Lt debe satisfacer

RYtZs = LtRZ.Zs , s ∈ [0, T ] (1.9)

La inversión estable de la ecuación 1.9 conduce a la solución funcional

Lt = RYtZ. [RZ.Z⋆ ] , (1.10)

donde ⋆ representa el argumento de segundo tiempo del nucleo l deniendoel operador Lt en el caso integral (ver ecuación 1.8).

En el caso de Gauss, los exponentes s y β son estimados de los espec-tros empíricos relacionados con la representación umbral Wavelet de los es-timadores de operador covarianza de la ecuación 1.5 (ver Bosq 2000, dondeproporcionan los resultados de la convergencia de los espectro empírico alteórico).

1.4. Estimación empírica B-Spline y sus apro-

ximaciones

(Ver Guillas, S y Lai, M.J., 2009) Sea Y una variable aleatoria con valoresreales. Sea D un dominio poligonal en R2. El modelo de regresión es:

Y = f(X) + ϵ = ⟨g,X⟩+ ϵ =

∫D

g(s)X(s)ds+ ϵ, (1.11)

12

Page 13: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

donde g(s) está en un espacio funcional H (generalmente = L2(D)), ϵ es unavariable aleatoria real que satisface Eϵ = 0 y EX(s)ϵ = 0, ∀s ∈ D.

A continuación, los métodos de aproximación para determinar una es-timación de g donde es denido en una 2D dominio espacial D de las ob-servaciones en X obtenidos sobre un conjunto de puntos de diseño en D eY .

1.4.1. Aproximación de Funcionales Lineal con Penali-zación

Suponemos que X e Y sigue el modelo de regresión (1.11). La soluciónα ∈ H que se resuelve con el siguiente problema de minimización:

α = argmınβ∈H

E[(Y − ⟨β,X⟩)2] + ρ∥β∥2r, (1.12)

donde ρ > 0 es un parámetro y ∥β∥2r denota la semi-norma de β:

∥β∥2r = ξr(β, β),

donde

ξr(α, β) =

∫D

r∑k=0

∑i+j=k

Di1D

i2αD

i1D

i2β,

D1 y D2 posición de la derivada parcial con respecto a la primera y segundavariables. A menos que la pena es igual a cero, α no es necesariamente iguala g. Desde Sr

d() puede ser denso en el espacio de Hilbert H como || →0,se considera un espacio spline Sr

d() para una suavidad r ≥ 0 y el gradod > r sobre una triangulación de D con || sucientemente pequeñas. Laaproximación Sα,ρ ∈ Sr

d() de α es

Sα,ρ = arg mınβ∈Sr

d()E[(Y − ⟨β,X⟩)2] + ρξr(β). (1.13)

Sea ϕ1, . . . , ϕm una base para Srd(), entonces Sα =

∑mj=1 cjϕj.

E(⟨m∑i=1

ciϕi, X⟩)2 + ρ∥m∑i=1

ciϕi∥2r = 0 (1.14)

La estimación empírica de Sα,ρ. Sea Xi, i = 1, . . . , n una sucecsión de va-riables aleatorias funcional tal que sólo el polinomio cero es perpendicular al

13

Page 14: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

subespacio generado por X1, . . . , Xn, excepto en un evento cuya probabili-

dad pn tiende a cero cuando n→ +∞. La estimación empírica Sα,ρ,n ∈ Srd()

es la solución de

Sα,ρ,n = arg mınβ∈Sr

d()

1

n

n∑i=1

(Yi − ⟨β,Xi⟩)2 + ρ∥β∥2r, (1.15)

con ρ > 0 el parámetro suavizado. La solución de la minimización está dada

por Sα,ρ,n =∑m

i=1 cn,iϕi con vector de coecientes cn = (cn,i, i = 1, . . . ,m)

que satisface Ancn = bn, donde

An =

[1

n

n∑l=1

⟨ϕi, Xl⟩⟨ϕj, Xl⟩+ ρξr(ϕi, ϕj)

]i,j=1,,m

y

bn =

[1

n

n∑l=1

Yl⟨ϕj, Xl⟩

]j=1,,m

=

[1

n

n∑l=1

(f(Xl) + ϵl)⟨ϕj, Xl⟩

]j=1,,m

Para demostrar que Sα,ρ,n se aproxima a Sα,ρ, en la probabilidad. Porsimplicidad, se considera el caso donde la penalidad es igual a cero como lasentradas de A−An y b− b son exactamente los mismos con o sin penalización.Para los detalles de teoremas y lemas que se ha usado para la demostración(ver Guillas y Lai, 2009)

1.4.2. Aproximación de Funcionales Lineal basado enObservaciones Discreta

Sea X las observaciones sobre algunos puntos diseñado sk, k = 1, . . . , Nen D. Sea SX la aproximación spline en forma de cuadrado mínimo discretode X asumiendo que sk, k = 1, . . . , N se distribuye uniformemente sobre de D con respecto a Sr

d(). Consideramos αS que resuelve el siguienteproblema de minimización :

αS = argmınβ∈H

E[Y − ⟨β, SX⟩)2] + ρ∥β∥2r. (1.16)

Se busca aproximar SαS ∈ Srd() de αS tal que

SαS = arg mınβ∈Sr

d()E[Y − ⟨β, SX⟩)2] + ρ∥β∥2r. (1.17)

14

Page 15: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Primero se analiza como αS se aproxima a α.

F (β) = E[(Y − ⟨β,X⟩)2]

es una estricta función convexa y así FS(β) = E[(Y − ⟨β,X⟩)2] + ρ∥β∥2r

La estimación empírica de Sα basado en observaciones discretas de super-

cies aleatorias Xi, i = 1, . . . , n. La estimación empírica Sα,ρ,n ∈ Srd() es la

solución de

Sα,ρ,n = arg mınβ∈Sr

d()

1

n

n∑i=1

[Yi − ⟨β, SXi⟩)2] + ρ∥β∥2r.

La solución de la minimización de la ecuación anterior está dada por

Sα,ρ,n =m∑i=1

cn,iϕi

con ϕ1, . . . , ϕn una base de Srd() y con coeciente vector cn = (cn,i, i =

1, . . . ,m) que satisface Ancn = bn, y

An =

[1

n

n∑l=1

⟨ϕi, SXl⟩⟨ϕj, SXl

⟩+ ρξr(ϕi, ϕj)

]i,j=1,...,m

donde SXles el cuadrado mínimo discreto en forma de Xl y

bn =

[1

n

n∑l=1

Yl⟨ϕj, SXl⟩

]j=1,...,m

Para los detalles de teoremas y lemas que se ha usado para la demostración

de la estimación empírica Sα,ρ,n ∈ Srd() (ver Guillas y Lai, 2009)

1.5. Estructuras de datos funcionales con de-

pendencia espacial

El proceso funcional espacial se dene

Xs : s ∈ D ⊆ Rd (1.18)

15

Page 16: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

donde s es una función de datos genéricos en el espacio Euclideano d-dimensional,el conjunto D ⊆ Rd puede ser jo o aleatorio, y Xs son variables aleatoriasfuncional, denido como elementos aleatorios tomando valores en un espaciode dimensión innita (o espacio funcional). Por lo general Xs, para cada sjo, es una función real de [a, b] ⊆ R a R.

En el análisis de datos espacial univariante o multivariante, la naturalezade los conjuntos D que se permite clasicar datos espaciales funcionales. Da-tos funcional Geoestadística que aparecen cuando D es un subconjunto jode Rd con un volumen positivos y n puntos s1, . . . , Sn, en D que se eligenpara observar las funciones aleatorias Xi, i = 1, . . . , n. Cuando se tiene unpatrón de puntos de mercado funcional marcó el punto, cuando una funcióncompleta se observa en cada punto generada por un proceso estándar de pun-to. Datos de área Funcionales (o de datos funcional en red) corresponden alcaso de D ser un conjunto jo y contable.

A continuación, los tres tipos clásicos de estructuras de datos espaciales(datos geoestadísticos, los patrones de punto, y los datos de área) que se pue-den combinar con datos funcionales (ver Delicado, Giraldo, Comas y Mateu,2010), donde se aplica las tres estructuras de datos espaciales en datos detemperaturas de 35 estaciones meteorológicas de Canadá)

1.5.1. Datos Funcional Geostadística

Sea el proceso aleatorio funcional (1.18) es de segundo orden jo e isó-tropo, es decir, las funciones de media y la varianza son constantes y lacovarianza sólo depende de la distancia entre los puntos de muestreo (sinembargo, la metodología también se podría desarrollar sin asumir estas con-diciones). Además, tenga en cuenta que por cada jo t0 ∈ [a, b], la secciónnito-dimensional Xs(t0) es una función aleatoria escalar denida en un es-pacio de probabilidad. Formalmente es,

E(Xs(t)) = m(t) y V (Xs(t)) = σ2(t) para todo t ∈ [a, b] y ∀s ∈ D

Cov(Xs(t), Xs+h(u)) = C(h; t, u), con h el vector de retraso espacial, ypara todo t, u ∈ [a, b] Esto asegura que la varianza del proceso asociadoC(0; t, u) existe y es nito. Usamos la notación de C(h, t) de C(h; t, t).

1.5.2. Datos Funcional asociado con procesos puntos

Los objetivos del estudio de los procesos de punto con una marca defuncionales son esencialmente los mismos que en otros procesos puntuales

16

Page 17: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

marcados. La pregunta más importante es la de saber si hay dependenciaespacial en las marcas funcionales. Tenga en cuenta que el patrón de puntoes un estándar único y el tipo de marca es diferente.

Sea h(·, ·) una prueba funcional que participan dos funciones (por ejem-plo, h(f, g) podría ser una medida de similitud entre las funciones f y g), ysea λ(2)(r), r ∈ R+, ser la usual densidad producto de segundo orden, para

el proceso de punto estacionario e isotrópicoΨ, sea λ(2)f (r) la versión contra-

partida de esta densidad de un proceso punto de mercado funcional, es decir,λ(2)f (r) es la densidad asociada a la medida de momento factorial funcional de

segundo orden, (cuando esta medida es absolutamente continua con respectoa la medida de Lebesgue)

α(2)f (A1 × A2) = E

[ =∑S1,S2∈Ψ

h(XS1 , XS2)IA1×A2(S1, S2)

]

donde A1, A2 ⊆ R2. La función correlación de margen funcional (Comas etal., 2008) es denido como

gf (r) =λ(2)f (r)

λ(2)(r)E[h(XS1 , XS2)]

donde r = ∥s1 − s2∥. Comas et al. (2008) propone a estimar gf (r) en laventana de observación W por

gf (r) =1

2πrλ2p|W |

=∑S1,S2∈Ψ

h(XS1 , XS2)K(∥S1 − S2∥ − r)

E[h(XS1 , XS2)]e(S1, ∥S1 − S2∥)

donde Ψ es el patrón punto observado, λp es un estimador de la intensidadde puntos, K(·) es una función núcleo que es no negativo y simétrica conrespecto a la origen, y e(·) es un factor para corregir los efectos de borde.

1.5.3. Datos Areal Funcional

Los datos de área funcional consiste en determinar la pirámide de pobla-ción. Los objetivos para este tipo de espacio por la FDA son similares a lasque se reeren los datos de área univariante o multivariante: la detección dela dependencia espacial (a través de pruebas de autocorrelación espacial), laidenticación de agrupaciones espaciales, y para el modelado de la depen-dencia espacial (por ejemplo, a través de modelos de regresión espacial) son

17

Page 18: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

probablemente las más importantes. La disimilitud se calcula a partir de lainformación disponible en cada área. Por lo tanto, se puede aplicar a cualquiertipo de característica observable, siempre que la disimilitud (o distancia) sepuede denir entre cualquier par de observaciones.

Cuando se trabaja con las pirámides de población, que son casos particu-lares de funciones de densidad, la distancia adecuada entre ellas es la versiónsimétrica de la divergencia Kullback-Leibler

dKL(fi, fj) =

b∫a

log

(fi(x)

fj(x)

)fi(x)dx+

b∫a

log

(fj(x)

fi(x)

)fj(x)dx

1.6. Métodos Cokriging para datos funcional

espacial

En un modelo funcional lineal con dependencia espacial, la estimación dela regresividad se reduce a un problema cokriging multivariado para la elec-ción adecuada de los espacios funcionales. El problema del kriging en el casode dimensión innita bajo ciertas condiciones de regularidad de las funciones.El método se ilustra con el análisis de datos de perles de temperatura en elOcéano Antártico, donde los mamíferos marinos se utilizan como muestras.Para mas detalles el método y la aplicación (ver Nerini, Monestiez y Manté,2010; y Nerini y Monestiez, 2008)

1.6.1. Modelo lineal espacial para datos funcionales

Se considera un conjunto de curvas de E = yi, i = 1, . . . , n muestra enn ubicaciones espacial aleatorias xi sobre el dominio D. Cada yi(t) es unaobservación única de Yi(t), una función aleatoria en xi ubicación donde elargumento t varía en un intervalo compacto τ de R. La función de Yi tomavalores en un Espacio de Hilbert reproducción del núcleo (RKHS) H de lasfunciones en τ donde ⟨·, ·⟩H denota su producto interno y ∥ · ∥H la normaasociada. Bajo los supuestos de estacionariedad de segundo orden, la funciónde media µ que es la misma en cualquier punto del dominio y que se suponeque es desconocido

E(Yi) = µ, ∀xi ∈ D

El operador de covarianza lineal Cij : H → H entre Yi en la ubicación xi y

18

Page 19: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Yj en la ubicación xj = xi + h se dene como sigue

Cij(f) = E[(Yi − µ)⊗ (Yj − µ)(f)] = E(, Yi − µ⟩H(Yj − µ)), f ∈ H.

Para estimar Y0, la curva en lugar desconocido x0, con el modelo lineal (Cue-vas et al. y Cardot et al.)

Y0 =n∑

i=1

Bi(Yi),

donde Bi es un operador lineal.

El estimator Y0 imparcial debe ser realizada por minimizar

E∥Y0 − Y0∥2H

Cada función Yi expresado en términos de una combinación lineal de funcio-nes bases (ϕ1, . . . , ϕp) de H

Yi(t) =

p∑i=1

αk(xi)ϕk(t) = α′Φ(t)i

donde αi = (α1(xi), . . . , αp(xi))′es el p-vector de los coecientes de ubicación

xi y Φ(t) = (ϕ1(t), . . . , ϕp(t))′los p-vectores de funciones bases.

La hipótesis de estacionariedad de la función aleatoria Y − I expresadoen ϕ base ortonormal reduce a los supuestos estacionariedad multivariadoclásicos en los coecientes de la expansión

E(αi) = a, ∀xi ∈ D

Cij = E[(αi − a)(αj − a)

′]donde la media a es un p-vector de coecientes, Cij la matriz de covarian-za cruzada p × p con las entradas de cov(αk(xi), αl(xj)), k, l = 1, . . . , p. La

estimación de Y0 se logra a través de los coecientes de cokriging

α0 =n∑

i=1

B′αii

donde las Bi matrices p× p, con entradas bikl, son matrices de ponderaciónque reduce al mínimo

traza(var(α0 − α0)).

19

Page 20: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Capítulo 2

Estimación de MáximoVerisimilitud Funcional delModelo ARH(p)

Los modelos Autorregresivos Hilbert (ARH) representan secuencias dedatos funcional. La diagonalización de los modelos ARH(1) y ARH(p) conp >1, en términos de la descomposición espectral del operador autocorrela-ción involucrado en una versión funcional del patrón de oscilación principal(POP). En la implementación del método de estimación de proyección ML(máxima verosimilitud), se considera la diagonalización de las bases Rieszdual del operador de autocorrelación. Las estimaciones de proyección máxi-ma verosimilitud del operador autocorrelación, y los operadores covarianzade las innovaciones funcionales y los ruidos de observación que se obtienenmediante la combinación de ltrado de Kalman y suavizado con el algoritmoEM. La implementación del algoritmo ltros de Kalman se realiza en térmi-nos de las series denido por los Coecientes POP del proceso de interés, asícomo en términos de la transformación POP de los momentos de segundoorden condicional involucrados.

2.1. Formulación del modelo

Sea H un real separable del espacio Hilbert de funciones denido en undominio limitado D ⊂ Rn con el producto interno ⟨·, ·⟩H , y con norma aso-ciada ∥ · ∥H . Consideramos Zt, t ∈ N son un proceso valuado Hilbert conmedia cero en H, es decir, para cada t ∈ N, Zt ∈ H, donde para todo t ≥ 0, Zt

es denido en el espacio probabilístico básico (Ω, A, P ). En el caso ARH(1),

20

Page 21: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Z satisface la siguiente ecuación:

Zt(x) = A[Zt−1](x) + vt(x), x ∈ D, t ∈ N∗. (2.1)

donde v es un fuerte ruido blanco de Hilbert, es decir, una sucesión de varia-bles aleatorias Hilbert valuado independientes e idénticamente distribuidassobre H satisfaciendo

E(∥Vt∥2H) = σ2v <∞

incorrelacionada con la condición inicial aleatoria Z0 ∈ H, que tiene varian-za funcional nita, es decir, un operador covarianza traza. El operador deautocorrelación A es un operador acotado denido en un dominio denso enH.

2.1.1. El caso ARH(p)

El modelo ARH(p) proporciona un modelo más exible que está dado porla ecuación estado:

Zt(x) = A1(Zt−1)(x)+ · · ·+Ap(Zt−p)(x)+vt(x), t ∈ N∗, x ∈ D ⊆ Rn, (2.2)

donde v es un fuerte ruido blanco de Hilbert, incorrelacionada con las con-diciones iniciales aleatorias. Los parámetros funcionales Ak, k = 1, . . . , p, sonlos parámetros de autocorrelación involucrado en la ecuación 2.2, que sondenidos en H.

2.2. Diagonalización y Filtro de Kalma en el

caso ARH(1)

La proyección de las ecuaciones estado (2.1), el operador de autocorrela-ción A admite una descomposición espectral.

El operador A debe satisfacer las siguientes ecuaciones:

Aψi = λiψi, i ∈ N,A∗ϕi = λiϕi, i ∈ N, (2.3)

donde A∗ denota el operador adjunto de A, ψi, i ∈ N y ϕi, i ∈ N sonlos sistemas de autofunciones derecha e izquierda asociado con A y A∗, res-pectivamente y con los puntos espectros λi, i ∈ N (ver, por ejemplo, Dau-tray y Lions 1992; Dunford and Schwartz 1971). Los sistemas ψi, i ∈ N

21

Page 22: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

y ϕi, i ∈ N son bases Riesz dual, es decir, son bases de H y su H∗ dualsatisfaciendo:

⟨ϕi, ψi⟩H = δi,j, i, j ∈ N

Equivalentemente,Φ∗Ψ = I, (2.4)

con I que representa el operador identidad, y Φ y Ψ ser los operadores deproyección en los sistemas correspondientes ϕi : i ∈ N y ψi : i ∈ N. De laecuación (2.3) y (2.4), se tiene que el operador A admite la diagonalización

A = ΨΛΦ∗,

en términos de los sistemas izquierda ϕi : i ∈ N y derecha ψi : i ∈ N. Sedenota Λ como el operador diagonal denido por la secuencia de autovaloresλi, i ∈ N. Entonces,

A[Zt−1](·) = ΨΛΦ∗[Zt−1](·),y, de la ecuación (2.4), tenemos

Φ∗Zt = ΛΦ∗Zt−1 + Φ∗vt.

Es decir, se obtiene la ecuación diagonal autorregresivo

aj(t) = λjaj(t− 1) + vj(t), j ∈ N, (2.5)

en términos de los coecientes aleatorios temporal (coecientes POP funcio-nal)

aj(t) = ⟨Zt(.), ϕj(.)⟩H , t ≥ 0, j ∈ N

vj(t) = ⟨vt(.), ϕj(.)⟩H , t < 0, j ∈ N

Equivalentemente, el operador A admite una representación integral de sen-tido débil en término del núcleo espectral

kA(x, y) =∑i∈N

λiψi(x)ϕi(y).

2.2.1. Filtro y suavizado Kalman

La implementación de la recursión del ltro de Kalman, partimos de laecuación estado

a(t) = Λa(t− 1) + v(t), (2.6)

donde, para cada tiempo t ∈ N,a(t) = (a1(t), . . . , aM(t))∗, v(t) = (v1(t), . . . , vM(t))∗, y Λ denota la matrizdiagonal M ×M con entrada de los autovalores λi, i = 1, . . . ,M .

22

Page 23: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

2.2.2. Filtro Kalman forward

De la Ecuación 2.6. La información muestral es denido por el siguientemodelo observación:

Yt = Zt + ϵt, (2.7)

donde ϵ representa un fuerte ruido blanco Hilbert con media cero, es decir,ϵt ∈ H, para todo t ≥ 0, y

E(∥ϵt∥2H) = σ2ϵ <∞,

para todo t ≥ 0. Proceso ϵ se supone que está correlacionado con Z.

De las observaciones de proceso Y hasta un tiempo t, se calcula el esti-mador de los coecientes POP del proceso de interés Z:

a(t|t) = a(t|t− 1) +Kt(Yt −Ψa(t|t− 1),

donde a(t|t) = E(a(t)|Yt, . . . , Yt) y a(t|t − 1) = E(a(t)|Yt−1, . . . , Y1). Aquí,Kt es el operador ganancia, es decir, el ltro que dene el efecto suavizadoen los datos funcional espacial, dado por

Kt = Pt|t−1Ψ∗(Rϵ +ΨPt−1|t−1Ψ

∗)−1,

en término del operador covarianza Rϵ del ruido de observación, y el momentocondicional de segundo orden

Pt|t−1 = var(a(t)t−1, . . . , Y1) = ΛPt|t−1Λ +Qt,

denotado por Pt = E((a(t) − a(t|t))(a(t) − a(t|t))∗) y ser Qt = Φ∗MRvΦM el

operador covarianza de los coecientes POP de vt. El error cuadrado mediofuncional está dado por

Pt|t = Pt|t−1 −KtΨPt|t−1,

y la predicción de un paso adelante es calculado como

a(t|t− 1) = Λa(t− 1|t− 1).

Los valores iniciales considerado son

a(0|0) = 0,

P0|0 = E(a(0)a(0)∗),

con a(0) = (a1(0), . . . , aM(0))∗ ser el vector constituido por la secuenciatruncada de coecientes POP de la condición inicial aleatoria,

Z0(·) ≃M∑i=1

ai(0)Ψi(·).

23

Page 24: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

2.3. Diagonalización y Filtro de Kalma en el

caso ARH(p)

Los operadores de autocorrelación Ak, k = 1 . . . , p admite una descom-posición espectral en términos de bases Riesz dual. La diagonalización de losoperadores autocorrelación de la ecuación estado es obtenido por la proyec-ción en los p sistemas de autofunción derecha involucrado en la factorizaciónmultiespectral.

Ak = ΨkΛkΦ∗k, k = 1, . . . , p, (2.8)

donde Λk denota un operador diagonal denido por la secuencia de autova-lores λik, i ∈ N, k = 1, . . . , p, y

Φ∗kΨl = I, para k = l,

Φ∗kΨl = 0, para k = l, (2.9)

con I y 0 que representa el operador identidad y nulo en H, los opera-dores de proyección Ψk y Φk para k = 1, . . . , p, en los sistemas autofun-ción de izquierda y derecha ψik : i ∈ N y ϕik : i ∈ N, y factorizandoAk, . . . , k = 1, . . . , p, sus operadores adjuntos.

La diagonalización de la ecuación estado (2.2) se obtiene de la ecuación (2.8)y (2.9):

p⊕k=1

Φ∗kZt =

p⊕k=1

ΛkΦ∗kZt−k +

p⊕k=1

Φ∗kvt.

Para el caso donde Φk = Φ, y Ψk = Ψ, para k = 1, . . . , p, las autofuncionesde derecha e izquierda asociada a las bases generado en el espacio H. Encualquier función g in H admite la descomposición ortogonal

g(x) = H∑j∈N

gjψj(x),

para todo x, donde gj = ⟨g, ϕj⟩H y ⟨ϕi, ψj⟩H = δij. Entonces la diagonaliza-ción de la ecuación estado (2.2)

aj(t) =

p∑k=1

λjkaj(t− k) + vj(t), (2.10)

en términos de los coecientes POP

aj(t) = ⟨Zt(·), ϕj(·)⟩H , t ≥ 0, j ∈ N (2.11)

24

Page 25: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

vj(t) = ⟨vt(·), ϕj(·)⟩H , t ≥ 0, j ∈ N (2.12)

donde λjk, j ∈ N, k = 1, . . . , p, son los operadores de espectro discretoAk, k = 1, . . . , p.

2.3.1. Filtro y suavizado Kalman

En la implementación del ltro Kalman en una formulación vectorial trun-cada de la ecuación diagonal (2.10), es decir, se tiene su formulación dimen-sional nita (ver salmerón y Ruiz-Medina 2009a):

a(t) = Λ1a(t− 1) + Λ2a(t− 2) + . . .+ Λpa(t− p) + v(t), (2.13)

donde, para cada tiempo t ≥ 0, y M representa el orden de truncamiento

a(t− k)M×1 = (a1(t− k), . . . , aM(t− k))∗, k = 0, . . . , p,

v(t)M×1 = Φ∗Mvt = (v1(t), . . . , vM(t))∗.

Así, Λk, k = 1, . . . , p, denota la matriz diagonal M × M con las entra-das de autovalores λjk, j = 1, . . . ,M, k = 1, . . . , p, que dene el espectrodiscreto de las correspondientes proyección dimensional nita de operadoresAk, k = 1, . . . , p. El símbolo ∗ denota transposición.

Ahora, la ecuación (2.13) en versión vectorial que está formulado por laimplementación de ltro de Kalman:

a(t) = Λa(t− 1) + v(t), (2.14)

donde,

a =

a(t)

a(t− 1)...

a(t− (p− 1))

pM×1

, v(t) =

v(t)0...0

pM×1

a(t−1) =

a(t− 1)a(t− 2)

...a(t− (p− 1))a(t− p)

pM×1

, Λ =

Λ1 Λ2 . . . Λp−1 Λp

I 0 . . . 0 00 I . . . 0 0...

......

...0 0 . . . I 0

pM×pM

con I denotando la matriz identidad M ×M , y con 0 la matriz nula M ×M .La matriz de transsición Λ describe la dinámica de los sistemas en términos

25

Page 26: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

de los puntos espectros de los operadores de autocorrelación. La estructuracovarianza de los procesos de innovación proyectada v está dado por

Q =

Φ∗

MRvΦM 0 . . . 00 0 . . . 0. . . . . . . . . . . .0 0 . . . 0

pM×pM

(2.15)

donde Rv es el operador covarianza de los v procesos innovación Hilbertvaluado.

2.3.2. Filtro Kalman forward

El ltro de kalma del estimador condicional POP se extiende en la formavectorial

at|t = at|t−1 +Kt(Yt −Ψat|t−1),

con Yt denido como en la Ecuación 2.7, y

at|t−1 = Λat−1|t−1,

Ψ = (Ψ1,Ψ2, . . . ,Ψp).

Aquí, para i = 1, . . . , p,Ψi = ΨM Para cada t ≥ 0, el operador ganancia estádenido como

Kt = Pt|t−1Ψ∗(Rϵ +ΨPt|t−1Ψ

∗)−1,

en término del operador covarianza Rϵ, y el operador covarianza a priori delerror de estimación del estado funcional

Pt|t−1 = ΛPt−1|t−1Λ∗ +Q

t,

con Pt|t, el operador covarianza estimado del error de estimación de estadofuncional, que viene dado por

Pt|t = Pt|t−1 −KtΨPt|t−1,

Los valores iniciales considerado son

a0|0 = (0, . . . , 0)∗pM×1,

P0|0 = diag(Φ∗MRZ1

0ΦM , . . . ,Φ

∗MRZp

0ΦM),

donde diag(·) denota una matriz diagonal, y RZi0, i = 1, . . . , p, respectiva-

mente denota los operadores covarianza de Zi0, i = 1, . . . , p, las condiciones

iniciales aleatorias Hilbert.

26

Page 27: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

2.3.3. Suavizado Kalman backward

De los estimadores previos, el suavizado Kalman backward es implemen-tado siguiendo la recursión:

E(a(t− 1) | Yt1 , . . . , YtT ) = at−1|t−1 + (Pt−1|t−1Λ∗(Pt|t−1)

−1)

×(E(a(t) | Yt1 , . . . , YtT )− Λat−1|t−1)

V ar(a(t− 1) | Yt1 , . . . , YtT ) = Pt−1|t−1 + (Pt−1|t−1Λ∗(Pt|t−1)

−1)

×(V ar(a(t) | Yt1 , . . . , YtT )− Pt|t−1)

×(Pt−1|t−1Λ∗(Pt|t−1)

−1)∗,

para t = T, . . . , 1, donde, * es la transposición.

2.4. Algoritmo EM

Esta sección proporciona la implementación del algoritmo EM para laestimación del parámetro del modelo ARH(p).

2.4.1. Estimaciones iniciales

En el caso estacionario, los valores del parámetro inicial son calculado apartir de estimadores funcional imparcial del espacio y de operadores cova-rianza cruzada.

RY0(ϕ) = E[Y0⟨Y0, ϕ⟩H ], ∀ϕ ∈ D(RY0),

RY0Y1(ϕ) = E[Y0⟨Y1, ϕ⟩H ], ∀ϕ ∈ D(RY0Y1),

donde D(A) denota el dominio del operador A.

En el caso donde Rϵ es diagonal, los siguientes estimadores de momentoson considerado:

RTZ0

=1

T

(T∑i=1

Yi ⊗ Yi

)−

(1

T

T∑i=1

Yi

)⊗

(1

T

T∑i=1

Yi

)− σ2

ϵ I,

RTZ0Z1

=1

T − 1

(T−1∑i=1

Yi ⊗ Yi+1

)−

(1

T − 1

T−1∑i=1

Yi

)⊗

(1

T − 1

T−1∑i=1

Yi+1

),

27

Page 28: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

donde las funciones f y g en H, f ⊗ g representa el operador que asociaa cada función h en H, y σ2

ϵ es calculado a partir del efecto nugget delsemivariograma funcional experimental

γ(∆t) =1

2N(∆t)

∑i,j∈S(∆t)

∥Yti − Yti∥2H , (2.16)

conS(∆t) = (i, j) | |ti − tj| = ∆t,

y N(∆t) es el número de pares en S(δt).

En el caso donde el ruido de observación tiene un operador covarianzano diagonal, consideramos como valor inicial para Rϵ el estimador obtenidoa partir de la proyección del modelo de observación funcional (2.15) en elsistema de autofunciones de RZ0 . Especicamente, de

Φ∗RZ0 = ΛΦ∗,

tenemosΦ∗Rϵ = Φ∗RY0 − ΛΦ∗, (2.17)

desde RZ0 = ΦΛΦ∗, y ΦΦ∗ = I, con I denotando el operador identidad, y Φ

como el operador proyección en el sistema autofunción asociado con RZ0 , Λrepresenta como el operador diagonal denido a partir del punto espectro deRZ0 .

En el caso, el estimador basado en momento funcional del operador co-varianza cruzada son denido comoRY0Yk

= (RZ0Zk)

=1

T − k

[T−k∑i=1

Yi ⊗ Yi+k

]−

[1

T − k

T−k∑i=1

Yi

]⊗

[1

T − k

T−k∑i=1

Yi+k

], (2.18)

para k = 1, . . . , p. Finalmente, el estimador incial de A1, . . . , Ap son obteni-do de la Ec. 2.18 siguiendo la usual ecuación asociado con la autoregresivodinámico de orden p (ver, por ejemplo, Bosq 2000).

2.4.2. Pasos E y M

Sea vt, t ∈ N y ϵt, t ∈ N una secuencia de ruido de innovación yobservación en sentido fuerte ruido blanco Hilbertiano Gausiana. Es decir,vt(·), t ∈ N y ϵt(·), t ∈ N son sucesión de variable aleatorias (valor H)

28

Page 29: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

valuado Hilbert Gausiana centrado distribuido identicamente con operadorescovarianza traza Rv y Rϵ. Bajo la normalidad de las condiciones inicial alea-toria, la secuencia funcional espacial Zt, t ∈ N y Yt, t ∈ N son tambiénGausiana.

El paso E

En el caso ARH(1) el cálculo del paso expectación, consideramos la apro-ximación de la matriz (2.14) de la ecuación estado funcional (2.1), y la recur-sión Kalman forward y backward. Por lo tanto, bajo la supuesta distribuciónGausiana, para cada t > 0, v(t) = Φ∗

Mvt sigue una distribución normalcon vector de media cero, y con matriz covarianza Φ∗

MRvΦM , con ΦM , eloperador proyección por las M autofunciones derecha asociado con las pri-merasM valores singulares en orden decreciente y ϵ(t) = Φ∗

Mϵt tambien sigueuna distribución normal con vector de media cero, y con la matriz covarian-za Φ∗

MRϵΦM . Como son independientes, entonces el log-verosimilitud basadoPOP de los datos funcional completo tiene la siguiente expresión en el tiempoestacionario de procesos v y ϵ:

C + logfZ0 +T

2log|Φ∗

MRvΦM | − T

2log|Φ∗

MRϵΦM |

−1

2

T∑i=1

(a(ti)− Λa(ti − 1))∗(Φ∗MRvΦM)−1(a(ti)− Λa(ti − 1))

−1

2

T∑i=1

(ϵ(ti))∗(Φ∗

MRϵΦM)−1(ϵ(ti)).

Considerando que el efecto de la condición inicial aleatoria es insignicanteen el tiempo t1, . . . , tT , desde resultados estándar en forma cuadrática, laexpectación condicional de los 'datos completos' dado los 'datos incompletos'es calculado como

C − T

2log|Φ∗

MRvΦM | − T

2log|Φ∗

MRϵΦM |

−1

2tr(Φ∗

MRvΦM)−1(CZ − ΛB∗Z −BZΛ + ΛAZΛ)

,

−1

2tr(Φ∗

MRϵΦM)−1Cϵ

, (2.19)

donde tr denota la traza, y

CZ =T∑i=1

E(a(ti)a(ti)∗|Yt1 , . . . , TtT )

29

Page 30: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

BZ =T∑i=1

E(a(ti)a(ti − 1)∗|Yt1 , . . . , TtT )

AZ =T∑i=1

E(a(ti − 1)a(ti − 1)∗|Yt1 , . . . , TtT )

CZ =T∑i=1

E(Φ∗Mϵti(Φ

∗Mϵti)

∗|Yt1 , . . . , TtT )

El paso M

Diferenciando (2.19) con respecto a Λ,Φ∗MRvΦM , y Φ∗

MRvΦM , y aplicandopropiedades de diferenciación básica de la traza, la estimación de máximaverosimilitud de los parámetros del modelo calculado en el paso M estándados por

Λ = diag[BZ ](diag[AZ ])−1

Φ∗M×M RvΦM×M =

1

T

T∑i=1

E

[(a(ti)− Λa(ti − 1)

)(a(ti)− Λa(ti − 1)

)T|Y1, . . . , YT

]=

1

T

[CZ −BZΛ− ΛBT

Z + ΛAZΛ],

Φ∗M×M RvΦM×M = Cϵ|T,

donde diag[A] denota la diagonal de la matriz A.

2.4.3. El caso ARH(p)

Una formulación similar del algoritmo EM puede ser derivado, conside-rando la aproximación vectorial (2.12) de la ecuación estado funcional (2.2).Especicamente, considerando, como antes, los procesos v y ϵ para ser esta-cionario en el tiempo, la verosimilitud está dada por

C +

p∑i=1

logfZi0− T

2log|Q| − T

2log|Rϵ|

−1

2

T∑i=1

(a(ti)− Λa(ti − 1))∗(Q)−1(a(ti)− Λa(ti − 1))

−1

2

T∑i=1

(ϵti)∗ (

)−1 (ϵti),

30

Page 31: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

donde Q está denido como en la Ec. 2.13, y Rϵ = E(ϵ(ti)ϵ(ti)∗, para i =

1, . . . , T , con

ϵ(ti) =

Φ∗ϵti0...0

.

La expectación condicional es entonces calculado como

C − T

2log |Q| − T

2log |Rϵ|

−1

2tr(Q)−1

(CZ − ΛB∗Z −BZΛ

∗ + ΛAZΛ∗),

−1

2tr(Rϵ

)Cϵ

,

donde, como antes, tr denota la traza y

CZ =T∑i=1

E(a(ti)a(ti)∗|Yt1 , . . . , YtT )

BZ =T∑i=1

E(a(ti)a(ti − 1)∗|Yt1 , . . . , YtT )

AZ =T∑i=1

E(a(ti − 1)a(ti − 1)∗|Yt1 , . . . , YtT )

Cϵ =T∑i=1

E(ϵ(ti)ϵ(ti)∗|Yt1 , . . . , YtT ).

Los estimadores verosimilitud se da entonces por

Λ = diag[BZ(diag[AZ ])−1

Q =1

T

[CZ −BZΛ− ΛB

T

Z + ΛAZΛT,

Rϵ = Cϵ/T.

31

Page 32: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

2.5. Generación del proceso

En la generación de los procesos de interés Z, del modelo de observa-ción funcional (2.1), se considera tres familias de operadores autocorrelaciónintegral, dado por los soguientes núcleos:

Núcleo Exponencial:

k(z; θ) =1

θexp

−∥z∥

θ

,

Núcleo Cauchy:

k(z; δ) =1

δ ∗ π(1 +

(∥z∥+7

δ

)2) ,Núcleo Gamma:

k(z;α) =1

α2∗ ∥z∥ ∗ exp

−∥z∥

α

,

donde ∥z∥ denota la distancia entre las locaciones espaciales, y θ, δ y α sonparámetros escalar de los núcleos Exponencial, Cauchy y Gamma. Tener encuenta, que en el caso de las secuencias de datos funcional espacial, sonlos A operadores de autocorrelación que representan la interacción espaciotemporal. Los tres modelos de autocorrelación proporciona diferente nivelesde interacción espacio temporal, que depende del grosor de las colas de susnúcleos.

32

Page 33: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Capítulo 3

Estimación Lineal MínimoCuadrática en Modelos ARH(1)mediante Proyección

3.1. Introducción

Como se comentó anteriormente, en este capítulo se desarrolla la exten-sión del modelo de observación funcional, afectado por un fuerte ruido blancode Hilbert, se obtendrá proyectando la base de autofunción sobre los opera-dores de auto-covarianza. El análisis estadístico de datos espacio-temporalrequiere proyecciones ortonormales que permitan reducir la elevada dimen-sión de los problemas que se plantean en este análisis (ver Ruiz-Medina yFernández-Pascual (2010), Wikle y Cressie (1999)). Trabajaremos en el aná-lisis de secuencias de datos funcionales espaciales desde la perspectiva pro-porcionada por los modelos de series autorregresivas hilbertianas. Por tanto,se estudia el caso de la extensión del modelo Autorregresivo de Hilbert deorden uno, ARH(1).

Se realizó una extensa revisión literaria dedicada a la introducción demodelos de covarianza espacio-temporal separables y no separables, en el ca-so de molelos denidos en tiempo y espacio continuos (ver, De Iaco, Myers,Posa; Ma, Gneiting; Porcua, Mateua, Zinib y Pini; Stein) y de técnicas ymétodos en la estimación de modelos con datos funcionales espaciales (ver,Guillas y Lai; Delicado, Giraldo, Comas y Mateu; Nerini y Monestiez; Nerini,Monestiez y Manté). Los modelos Autorregresivos Hilbert son consideradosa representar secuencias de datos funcional. Estas secuencias pueden estarconstituidos, por ejemplo, segmentos de secuencias biológicas, por las imá-

33

Page 34: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

genes en el análisis espacio-temporal de la deformación de dos dimensionesy el movimiento de las células de las series temporales de imágenes de vídeodigital, etc.. Las condiciones para un cálculo estable de la solución al proble-ma ltrado funcional asociado son establecidas en función de los espectrosde operador de covarianza del proceso de interés y de la observación de ruidoHilbert. Las diferentes familias covarianza espacio-temporal recientemente sehan introducido y analizado como una herramienta para el modelado estadís-tico de datos espacio-temporal (ver Berg et al. 2008; Gneiting 2002; Kelbertet al. 2005; Ma 2005; Porcu y Mateu 2007; Stein 2005; entre otros).

Los operadores covarianza de las innovaciones funcionales y los ruidos deobservación se obtienen mediante la combinación de ltrado de Kalman ysuavizado. Tenga en cuenta que las bases de autofunciones aquí considera-dos para la proyección del problema de la estimación de parámetro son dedimensiones innitas.

Especicamente, se realizará la implementación del estimador lineal mí-nimo cuadrático de la ecuación de estados funcional en el modelo ARH(1)afectado por un fuerte ruido blanco, mediante proyección en la base de au-tofunciones empíricas del operador de autocovarianza del proceso ARH(1).La proyección de la ecuación de estados funcional en el sistema de base deautofunciones, junto con las proyecciones en dicho sistema de los momentosde segundo orden condicionados a los datos funcionales espaciales, permitirála implementación del ltrado de Kalman para series funcionales autorregre-sivas.

3.2. Resolución de la Ecuación Estimación Fun-

cional mediante Proyección

El siguiente modelo es una extensión del modelo ARH(1) afectado por unfuerte ruido blanco de Hilbert de observación.

Zt = Yt + ϵt = WYt−1 + ηt + ϵt, t ∈ N (3.1)

donde Zt ∈ H, ηt ∈ H, ϵt ∈ H. La función aleatoria Zt se dene como unproceso observable, Yt−1 se dene como el proceso de interés en el pasadoinmediato, ηt es un ruido blanco Hilbert y ϵt es un ruido blanco de observaciónhilbertiano, en sentido fuerte, es decir, una sucesión de variables aleatoriasindepedientes e idénticamente distribuidas sobre H satisfaciendo

E[∥ϵt∥2H ] = σ2ϵ <∞, (3.2)

34

Page 35: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Se supone que ϵt es incorrelado con la condición inicial Y0 y ηt. El objetivofundamental de este capítulo es la estimación de Y en el presente o instante ta partir de la observación del proceso Zt, incorporando la dinámica autorre-gresiva en el tiempo t = 1, . . . , T . La estimación del operador W se realizaráa partir de la ecuación:

RYtYt−1 = WRYt−1Yt−1 = WR00, (3.3)

donde se sustituye el operador auto-covarianza R00 = RY = E[Yt ⊗ Yt] y eloperador de covarianza cruzado RYt−1Yt = R10 = R01 = E[Yt−1 ⊗ Yt] por suversiones empíricas dadas por

R00 =1

T

T∑t=1

Yt ⊗ Yt,

R10 = R01 =1

T

T∑t=1

Yt−1 ⊗ Yt.

Para la inversión de la versión empírica de la ecuación integral (3.3), se pro-yectará en la base ortogonal de autofunciones del operador de auto-covarianzaempírico R00, es decir, se proyecta en la base que satisface:

R00ϕk(·) = λkϕk(·), k ∈ N,

donde la base de sistemas de autofunciones ϕk; k ∈ N y los autovaloresλk; k ∈ N.

Sustituyendo las siguientes expresiones

Yt−1(y) =∞∑k=1

akt−1ϕk(y) (3.4)

W (x, y) =∞∑l=1

wl(x)ϕl(y), (3.5)

donde se utilizrá en los cálculos subsiguientes el hecho de que, bajo las condi-ciones asumidas, la descomposición espectral empírica converge a la teórica,es decir,

R00 = Φ∗ΛΦ −→ Φ∗ΛΦ = R00,

cuando T −→ ∞. Por tanto,

W = Φ∗R10Φ[Φ∗R00Φ]

−1 = Φ∗R10ΦΛ−1,

35

Page 36: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

es un estimador consistente.

El modelo de observación (3.1) proyectado, haciendo uso de la dinámicaautorregresiva que verica el proceso de interés Y, y considerando la condiciónΦ∗Φ = I se expresa como sigue:

at = Hat−1 + Jηt(x, y) + Jϵt(x, y), t ∈ N, (x, y) ∈ D ⊆ Rn

donde, como antes, at = Φ∗Yt, es decir en forma matricial akt , k = 1, . . . ,M ,donde M es el nivel de truncamiento del número de proyecciones que se tienenen cuenta en el procesos de interés y Φ∗W = B ≡ b1, . . . , bT. Asumiendo

T ≥M y (Φ∗Φ)−1 no singular y donde J = Φ(Φ∗Φ)−1 y la matrizM×M,H ≡JB. En este caso se considera un sistema de T ecuaciones del tiempo deobservacion, en cada proyección del proceso de interés.

3.3. Predicción optima mediante el ltro de Kal-

man

El predictor óptimo de at observaciones dadas hasta un tiempo t se ex-presa en forma recursiva en términos de un ltro de Kalman (Kalman, 1960;Meinfold Singpurwalla, 1983)

at|t ≡ Eat|Yt, . . . , Y1 = at|t−1 +KtYt − Φat|t−1 (3.6)

El funcional del cuadrado medio del error está dado por

Pt|t ≡ E[(at)− at|t)(at − at|t)∗] = Pt|t−1 +KtΦPt|t−1 (3.7)

para t ≥ 1, con cuadrado medio de predicción de errores. Kt, es el operadorde la ganancia, es decir el ltro que dene el efecto suavizado en los datosfuncionales espaciales, dado por

Kt = Pt|t−1Φ∗(Rη +Rϵ + ΦPt|t−1Φ

∗)−1 (3.8)

donde Rη = Φ∗RηΦ, es el operador covarianza de la observación del ruido, y

Rϵ = Φ∗RϵΦ, el operador covarianza del ruido de observación del proceso, enel sentido mas fuerte.

Las predicciones en un paso delante, está dado por

at|t−1 = Hat−1|t−1, (3.9)

36

Page 37: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Pt|t−1 ≡ varat|Yt−1, . . . , Y1 = HPt−1|t−1H∗, (3.10)

Para iniciar la recursión Kalman, asumiremos que a0|0 ≡ 0 y P0|0 ≡ JCYk0 J∗,

donde la estimación de CYk0 = CYk

0

Ahora, se considera la predicción del proceso Yt basado en el predictorltro de Kalman at|t. El predictor óptimo es entonces:

Yt|t−1 = Φ∗at|t + C ′ϵ(C

Y0 )

−1Yt, (3.11)

dondeCY

0 ≡ covYt, Yt,

Cϵ(·) ≡ Eϵ(·, t)v(t)

Cϵ(·, ·) ≡ Ev(·, t)v(·, t),

también se tieneY ∗t−1 ≡ Yt−1, . . . , Y1

La ecuación está derivado como

Yt−1|t ≡ EYt−1|Yt, Y ∗t−1

= EΦ∗at−1 + ϵt|Yt, Y ∗t−1

= Φ∗Eat−1|Yt, Y ∗t−1+ Eϵt|Yt, Y ∗

t−1= Φ∗at−1|t + Eϵ·|tϵt(covYt, Yt)−1Yt= Φ∗at−1|t + C

′ϵ.(C

Y0 )

−1Yt

(3.12)

donde Cϵ(·, ·) ≡ Eϵ(·, t), ϵ(·, t) es fácil ver si ϵ(·, t) y Yt tiene un conjuntode distribución Gaussiana multivariada.

La varianza condicional de la predicción del error para Yt está dado por

varYt−1 − Yt−1|t|Yt, Y ∗t−1 = varYt−1|Yt, Y ∗

t−1

Entonces

varYt−1|Yt, Y ∗t−1 = varΦ∗at−1 + ϵt|Yt, Y ∗

t−1= varΦ∗at−1|Yt, Y ∗

t−1+ varϵt|Yt, Y ∗t−1

+ 2covΦ∗at−1, ϵt|Yt, Y ∗t−1

(3.13)

37

Page 38: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Ahora de la Ecuación (3.7), notese que

varΦ∗at−1|Yt, Y ∗t−1 = Φ∗Pt|tΦ (3.14)

y siguiendo lo asumido en (3.12), obtenemos

varϵt|Yt, Y ∗t−1 = Eϵt, ϵt − (Eϵt|Yt, Y ∗

t−1)2= Cϵ(·, ·)− Cϵ(·)′(CY

0 )−1Cϵ(·)

(3.15)

Analizando el tercer término, se tiene covΦ∗at−1, ϵt = 0

covΦ∗at−1, ϵt = E[covΦ∗at−1, ϵt|Yt, Y ∗t−1]+cov[EΦ∗at−1, ϵt|Yt, Y ∗

t−1] = 0(3.16)

entonces

E[covΦ∗at−1, ϵt|Yt, Y ∗t−1] = −cov[EΦ∗at−1, ϵt|Yt, Y ∗

t−1]

Luego de lo asumido Gaussiano, podemos obtener

covΦ∗at−1, ϵt|Yt, Y ∗t−1 = −cov[EΦ∗at−1|Yt, Y ∗

t−1, Eϵt|Yt, Y ∗t−1]

= −cov[Φ∗Eat−1|Yt, Y ∗t−1, Cϵ(·)′(CY

0 )−1Yt]

= −cov[Φ∗at−1|t, Cϵ(·)′(CY0 )

−1Yt]

= −Φ∗cov[at−1|t, Yt](CY0 )

−1Cϵ(·)

(3.17)

Finalmente, sustituyendo (3.14), (3.15) y (3.17) en (3.13), se tiene

varYt−1|Yt, Y ∗t−1 = Φ∗Pt|tΦ + Cϵ(·, ·)− Cϵ(·)′(CY

0 )−1Cϵ(·)

− 2Φ∗cov[at−1|t, Yt](CY0 )

−1Cϵ(·)como

varYt−1 − Yt−1|t|Yt, Y ∗t−1 = varYt−1|Yt, Y ∗

t−1Por lo tanto, se tiene

varYt−1 − Yt−1|t|Yt, Y ∗t−1 = Φ∗Pt|tΦ + Cϵ(·, ·)− Cϵ(·)′(CY

0 )−1Cϵ(·)

− 2Φ∗cov[at−1|t, Yt](CY0 )

−1Cϵ(·)

queda demostrado el predictor óptimo y la predicción varianza del error

38

Page 39: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

3.4. Conclusión

Lo que me motivó realizar este trabajo, son los procesos físicos, biológi-cos, medio ambiente, geofísico, que incluyen la variabilidad en el espacio y eltiempo, y la aplicación en la medicina y la economía. Como resultado de lasdicultades causadas por grandes conjuntos de datos y el modelado de lasinteracciones de espacio, tiempo y espacio temporal, los métodos tradicionalespacio-tiempo son limitadores. El avance de las nuevas tecnologías, que hapermitido el diseño de sofísticados dispositivos para la medición y procesa-miento de información, se ha incrementado el número de situaciones dondese dispone de información muestral funcional. En la práctica, uno puede usarcualquier procedimiento de predicción estocástica o no estocástica para ob-tener Y, proceso de observación. Algoritmicamente predecimos Y, procesoen la red de predicción en cada tiempo t = 1, . . ., T. Para obtener el nucleosuavizado del operador autocovarianza, se podría usar los más sosticadosprocedimientos suavizado espacio-temporal, según nuestra propuesta, la pro-yección de las autofunciones sobre los operadores autocovartianza y medianteel ltro de Kalman, para la elección del algoritmo suavizado espacio-tiempo.Mi interés después de haber desarrollado la estimación lineal por mínimocuadrados en el modelo ARH(1) mediante la proyección de autofunciones enel operador auto-covarianza, es realizar una simulación usando el softwareMatLab, la implementación desarrollada en este trabajo. Sin embargo, se-rá un estudio a futuro para la continuación del trabajo en la simulación enMatlab y aplicación en datos reales, para el interesado en el tema.

39

Page 40: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

Bibliografía

[1] Abramovich, F. y Angelini, C. (2006).Testing in midex eects FANOVAmodels. Journal of Statistical Planning and Inference, 136, 4326-4348.

[2] Abramovich, F., Antoniadis, A., Sapatinas, T. y Vidakovic, B. (2004).Optimal testing in functional analysis of variance models. InternationalJournal of Wavelets, Multiresolution and Information Processing, 2, 323-349.

[3] Angulo, J.M., Ruiz-Medina, M.D. y Anh, V.V. (2000). Estimation andof fractional generalized random elds. Journal of the Australian Mat-hematical Society Series A, 69, 1-26.

[4] Besse, P., Cardot, H. y Stephenson, D. (2000). Autoregressive forecastingof some functional climatic variations. Scandinavian Journal os Statis-tics, 27, 673-687.

[5] Bertino, L., Evensen, G. y Wackernagel, H. (2003). Sequential data as-similation techniques in oceanography. International Statistical Review,71, 223-241.

[6] Bogaert, P. (1996). Comparison of kriging techniques in a space-timecontext. Mathematical Geology, 28, 73-86.

[7] Bosq, D. (2000). Linear Processes in Function Spaces, New York. Sprin-ger.

[8] Bosq, D. (2007). General linear processes in Hilbert spaces and predic-tion. Journal of Statistical Planning and Inference, 137, 879-894.

[9] Brillinger, D. R. (1973). The analysis of time series collected in an ex-periemnt design. Multivariate analysis, III, Krishnaiah, P:R: (ed.), Aca-demic Presss, 241-256.

40

Page 41: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

[10] Brillinger, D. R. (1980). Some aspect of the analysis of evoked responseexperiments. Statistics and related topics, Csörgö, M., Dawson, D.A.,Rao, J.N.K. and Saleh, A.K. (eds), North-Holland, 15-168.

[11] Bretherton, C.S., Smith, C. y Wallace, J.M.. (1992). An intercompari-son of methods for nding coupled patterns in climate data. journal ofclimate, 5, 541-560.

[12] Brown, P.E., Karesen, K.F., Roberts, G.O. y Tonellato, S. (2000). Blur-generated non-separable space-time models. Journal of the Royal Sta-tistical Society Series B, 62, 847-860.

[13] Clarkson, D.B., Fraley, C., Gu, C.C. y Ramsay, J.O. (2005).S+functional data analysis user's guide, New York, Springer-Verlag.

[14] Cressie, N.A. (1993). Statistics for spatial Data, Wiley.

[15] Cressie, N., Irwin, M:E: y Johannesson, G. (2002). Spatial temporalnonlinear ltering based on hierarchical statistical models. Sociedad deEstadística e Investigación Operativa Test, 11(2), 249-302.

[16] Cressie, N. y Huang, H.C. (1999). Classes of nonseparable, spatiotempo-ral stationary covariance functions. Journal of the American StatisticalAssociation, 352, 3651-3685.

[17] Cohn, S. y Todling, R. (1996). Appropiate data assimilation schemes forstable and unstable dynamics. Journal of the Meteorological Society ofJapan, 74(1), 63-75.

[18] Collins, M. (1997). The EM algorithm. In fulllment of the WrittenPreliminary Exam II PhD requirement.

[19] Damon, J. y Guillas, S. (2005). Estimation and Simulation of Autorre-gresive Hilbertian processes with Exogenous Variables. Statistical Infe-rence for Stochastic Processes, 8, 185-204.

[20] Da Prato, G. y Zabczyk, J. (2002). Second Order Partial DierentialEquations in Hilbert Spaces. London Mathematical Society Lecture NoteSeries 293, Cambridge University Press.

[21] Dautray, R. y Lions, J.L.. (1992). Mathematical Analysis and Numeri-cal Mothods for Science and Technology. Vol. 3, Spectraal Theory andApplications, Springer-Verlag.

41

Page 42: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

[22] De Iaco, S., Myers, D.E. y Posa, D. (2002). Nonseparable Space-TimeCovariance Models: Some Parametric Families. Mathematical Geology,34, 23-42.

[23] Delicado, P., Giraldo, R., Comas, C., y Mateu, J. (2010). Statistic forspatial functional data: some recent contributions. Environmetrics, 21,224-239.

[24] Dempster, A.P., Laird, N.M. y Rubin, D.B. (1977). Maximum likelihoodfrom incomplete data via the EM algorithm. Journal of the Royal Sta-tistical Society. Series B (Methodological), 39, 1-38.

[25] Dhrymes, P.J. (1978). Mathematical for Econometrics, Springer-Verlag.

[26] Diggle, P.J., Liang, K.Y. y Zeger, S.L. (1994). Analysis of LongitudinalData. Oxford, Clarendon Press.

[27] Doucet, A., de Freitas, N. y Gordon N. (2001). Sequential Monte Carlomethods in practice. New York.

[28] Dunford, N. y Schwartz, J.T. (1971). Linear Operators, Part III, SpectralOperator. Wiley Interscience.

[29] Eubank, R.L. y Hart, J.D. (1992). Testing goodness-of-t in regressionvia order selection criteria. The annals of Statistics, 20, 1412-1425.

[30] Eubank, R.L. y LaRiccia, V.N. (1992). Asymptotic comparison ofCramér-von Mises and non-parametric function estimation techniquesfor testing goodness-of-t. The Annals of Statistics, 20, 2071-2086.

[31] Epperson, B.K. (2000). Spatial and space-time correlations in ecologicalmodels. Ecological Modelling, 132, 63-76.

[32] Fan, J. (1996). Test of signicance based on wavelet thresholding andneyman's truncation. Journal of American Statistical Association, 91,674-688.

[33] Fan, J. y Lin, S.J. (1998). Test of signicance when data are curves.Journal of American Statistical Association, 93, 1007-1021.

[34] Ferraty, F. y Vieu, P. (2006). Nonparametric Functional Data Analysis.Springer Series in Statistics. New York, Springer.

[35] Gelfand, A., Ghosh, S., Knight, J. y Sirmans, C. (1998). Spatiotem-poral modeling of residential sales data. Journal Business EconomicalStatistics, 16, 312-321.

42

Page 43: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

[36] Glahn, H.R. (1968). Canonical correlation and its relationship to dis-criminant analysis and multiple regression. Lournal of the atmosphericsciences, 25, 23-31.

[37] Glasbey, C.A., Graham, R. y Hunter, A.G.M. (2001). Spatiotemporalvariability of solar energy across a region: a statistical modelling ap-proach. Solar Energy, 70, 373-381.

[38] Ghil, M., Allen, M.R., Dettinger, M.D., Ide, K., Kondrashov, D., Mann,M.E., Robertson, A.W., Saunders, D., Tian, Y., Varadi, F. y Yiou, P.(2002). Advanced spectral methods for climatic time series. Reviews ofGeophysics, 40, 3-1;3-40.

[39] Gneiting, T. (2002). Stationary covariance functions for space-time data.Journal of the American Statistical Association, 97, 590-600.

[40] Godtliebseu, F., Chu, C.K., Sorbye, S.H. y Torheim, G. (2001). An es-timator for functional data with application to MRI. Medical Imaging,20, 36-44.

[41] Gutiérrez Jáimez, r. y González carmona, A. (1991). Introducción alanálisis Multivariante, Universidad de Granada.

[42] Guttorp, P., Meiring, W. y Sampson, P. (1994). A space-time analysisof ground-level ozone data. Environmetrics, 5, 241-254.

[43] Guillas, S. (2001). Rates of convergence of autocorrelation estimates forautoregressive Hilbertian processes. Statistics Probability Letters, 55,281-291.

[44] Guillas, S. y Lai, M.J.(2009). Bivariate Splines for Spatial FunctionalRegression Models. Journal of Nonparametric Statistics, 00, 1-31.

[45] Hall, P. y Hart, J.D. (1990). Bootstrap test for dierence between meansin nonparametric regression. Journal of Americam Statistical Associa-tion, 85, 1039-1049.

[46] Hall, P., Poskitt, D.S. y Presnell, B. (2001). A functional data-analyticapproach to signal discrimination. Technometrics, 43, 1-9.

[47] Handcock, M y Wallis, J. (1994). An approach to statistical spatialtem-poral modeling of meteorogical elds. Journal of American StatisticalAssociation, 89, 368-390.

43

Page 44: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

[48] Haslett, J. y Raftery, A.E. (1989). Space-time modelling with long-memory dependence: assessing Ireland's wind power resource. AppliedStatistics, 38, 1-21.

[49] Hasselmann, K. (1988). PIPs and POPs: The reduction of complex dyna-mical systems using principal interaction and oscillation patterns. Jour-nal of Geophysical interaction, 93, 11015-11021.

[50] Higdon, D. (1999). A process-convolution approach to modelling tem-peratures in the north Atlantic Ocean. Environmental and EcologicalStatistics, 5, 173-190.

[51] Holden, L., Natvig, B., Sannan, S. y Bungum H. (2000). Modeling spatialand temporal dependencies between earthquakes. Statistical Research,13.

[52] Huang, H.C. y Cressie, N. (1996). Spatio-temporal prediction of snowwater equivalent using the Kalman lter. Computational Statistics andData Analysis, 822, 159-175.

[53] Hutson, V. y Pym, J.S. (1980). Applications of Functional Analysis andOperator Theory, Academics Press Inc.

[54] Inglot, T. y Ledwina, T. (1996). Asymptotic optimality of data-drivenNeyman's tests for uniformity. The Annals of Statistics, 24, 1982-2019.

[55] Kalman, R.E. (1960). A new approach to linear ltering and predictionproblems. Transaction of the ASME - Journal of Basic Engineering,35-45.

[56] Lavine, M y Lozier, S. (1999). A Markov random eld spatio-temporalanalysis of ocean temperature. Environmental and Ecological Statistics,6, 249-273.

[57] Ledwina, T. (1994). Data-driven version of Neymans smooth test of t.Journal of American Statistical Association, 89, 1000-1005.

[58] Lohmann, G. y Bohn, S. (2002). Using replicator dynamics for analzingFMRI data of the human brain. Medical Imaging, 21, 485-492.

[59] Lorenz, E.N. (1956). Empirical orthogonal functions and statistical weat-her prediction. Scientic Report Number 1, Statistical Forecasting Pro-ject, MIT, 49.

44

Page 45: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

[60] Ma, C. (2003). Spatio-temporal stationary covariance models. Journalof Multivariate Analysis, 86, 97-107.

[61] Ma, C. (2003). Families of spatio-temporal stationary covariance models.Journal of Statistical Planning and Inference, 116, 489-501.

[62] Ma, C. (2003). Nonstationary covariance functions that model space-time interactions. Statistics Probability Letters, 61, 411-419.

[63] Mardia, K.V., Goodall, C., Redfern, E.J. y Alonso, F.J. (1998). TheKriged Kalman lter. Test, 7, 217-287.

[64] Mas, A. (2007). Weak convergence in the functional autoregressive mo-del. Journal of Multivariate Analysis, 98, 1231-1261.

[65] Matheron, G. (1962). Traite de Geoestatistique Apliquee, Tome I, Me-moires du Bureau de Recherches Geologiques et minieres, 24. EditionsBureau de Recherches Geologiques et Minieres, París.

[66] McLachlan, G. y Krishnan, T. (1997). The EM Algorithm and Exten-sions. Wiley series in probability and statistics. John Wiley Sons.

[67] Meyer, Y. (1992). wavelet and Operators. cambridge University Press.

[68] Müller, H.G. (2005). Functional modelling and classication of longitu-dinal data. Scandinavian Journal of Statistics, 32, 223-240.

[69] Müller, H.G. y Stadmüller, U. (2005). Generalized functional models.Annals of Statistics, 33, 774-885.

[70] Nan, F.Y. y Nowak, R.D. (1999). Generalized likelihood ratio detectionfor fMRI using complex data. Medical Imaging, 18, 320-329.

[71] Nerini, D. y Monestiez, P. (2008). A Cokriging method for spatial fun-ctional data with applications in oceanology. First International Works-hop on Functional and Operatorial Statistics. Toulouse.

[72] Nerini, D., Monestiez, P. y Manté, C. (2010). Cokriging for spatial fun-ctional data. Journal of Multivariate Analysis, 101, 409-418.

[73] Nychka, D., Wikle, C. y Royle, J.A. (2002). Multiresolution models fornonstationary spatial covariance functions. Statistical Modelling: An in-ternational Journal.

45

Page 46: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

[74] Pfeifer, P. y Deutsch, S. (1980). Stationarity and invertibility regions forlow order STARMA models. Communications in Statistics and Simula-tion Computation, 9, 551-562.

[75] Porcua, E., Mateua, J., Zinib, A. y Pini, R. (2007). Modelling spatio-temporal data: A new variogram and covariance structure proposal. Sta-tistics Probability Letters, 77, 83-89.

[76] Preisendorfer, R.W. (1988). Principal component analysis in meteoro-logy and oceanography. Elsevier, 425.

[77] Ramm, A.G. (1990). random Fields Estimation Theory, Longman, Es-sex.

[78] Ramsay, J.O. y Silverman, B.W. (2005). Functional Data Analysis.Springer Series in Statistics.

[79] Renshaw, E. y Särkkä, A. (2001). Gibbs point processes for studyingthe development of spatio-temporal stochastic processes. ComputationalStatistics and Data Analysis, 36, 85-105.

[80] Ruiz-Medina, M.D. (2008). Wavelet thresholding methods applied to tes-ting signicance dierences between autoregressive Hilbertian processes.First International Workshop on Functional and Operatorial Statistics(Toulouse, June 19-21, 2008).

[81] Ruiz-Medina, M.D., Alonso, F.J., Angulo, J.M. y Bueso, M.C. (2003).Functional stochastic modelling and prediction of spatio-temporal pro-cesses. Journal of Geophysical Research, 108(D24), 9003.

[82] Ruiz-Medina, M.D. y Angulo, J.M. (2002). Spatio-temporal lteringusing wavelets. Stochastic and Environmental Research and Risk As-sessement, 16), 241-266.

[83] Ruiz-Medina, M.D., Alonso, F.J. y Fernández-Pascual, R. (2007).Wavelet-vaguelette decomposition of spatiotemporal random elds. Sto-chastic and Environmental Research and Risk Assessement, 21, 273-281.

[84] Ruiz-Medina, M.D., Salmerón, R. y Angulo, J.M. (2007). Kalman lte-ring from POP-based diagonalization of ARH(1). Computational Statis-tics and Data Analysis, 51(10), 4994-5008.

[85] Ruiz-Medina, M.D. y Salmerón, R. (2008). Maximum-likelihood estima-tion of functional parameters in autoregressive Hilbertian processes.

46

Page 47: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

[86] Ruiz-Medina, M.D. y Fernández-Pascual, R. (2010). Spatiotemporal l-tering from fractal spatial functional data sequence. Stochastic and En-vironmental Research and Risk Assessement, 24, 527-538.

[87] Ruiz-Medina, M.D. y Salmerón R. (2010). Functional maximum-likelihood estimation of ARH(p) models. Stochastic and EnvironmentalResearch and Risk Assessement, 24, 131-146.

[88] Ruttimann, U.E., Unser, M., Rawlings, R.R., Rio, D., Ramsey, N.F.,Mattay, V.S., Hommer, D.W., Frank, J.A. y Weinberger, D.R. (1998).Statistical Analysis of Functional MRI Data in the Wavelet Domain.Medical Imaging, 17, 142-154.

[89] Salmerón R. y Ruiz-Medina, M.D. (2008). Multispectral decompositionof FAR(p) models. Stochastic and Environmental Research and Risk As-sessement, DOI: 10.1007/s00477-008-0213.

[90] Salmerón R. (2008). Análisis estadístico de datos espacio.temporales me-diante modelos funcionales de series temporales. Tesis Doctoral en Es-tadística e Investigación Operativa. Granada: Universidad de Granada,Facultad de Ciencias.

[91] sansó, B., Guenni, L. (1999). Venezuelan rainfall data analysed by usinga Bayesian space-time model. Applied Statistics, 48, 345-362.

[92] Shubov, M.A. (1997). Nonselfadjoint operators generated by the equa-tion of a nonhomegeneous damped string. Transactions of the AmericanMathematical Society, 349, 4481-4499.

[93] Shumway, R.H. (1988). Applied statistical time series analysis, Prentice-Hall.

[94] Smith, R. y Robinson, P. (1997). A Bayesian approach to the modellingof spatial-temporal precipitation data. Lectures Notes in Statistics, 121,237-269.

[95] Solo, V., Brown, E.N. y Long, C.J. (2003). Spatial Wavelets for tempo-rally correlated FMRI. International Conference on Imagen ProcessingICIP03, II, 843-846.

[96] Stein, M. (2003). Space-time covariance functions. Journal of the Ame-rican Statistical Association, 100, 310-321.

47

Page 48: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

[97] Stoer, D. (1986). Estimation and identication of space-time ARMAXmodels in the presence of missing data. Journal of American StatisticalAssociation, 81, 762-772.

[98] Stroud, J., Müller, P. y Sansó, BJ. (1999). Dynamic models for spatio-temporal data. Technical report 99-20, Institute of Statistics and Deci-sion Sciences, Duke University.

[99] Triebel, H. (1978). Interpolation Theory, Function Spaces, DierentialOperators.North-Holland Publishing. Co. Amsterdam.

[100] Van Leeuwen, P.J. (2002). A variance-minimizing lter for large-scaleapplications. Monthly Weather Review.

[101] Von Storch, H., Bürger, G., Schnur, R. y Von Storch, J.S. (1995). Prin-cipal oscillation patterns: a review. Journal of Climate, 8, 377-400.

[102] Von Storch, H., Bruns, T., Fischer-Bruns, I y Hasselmann, K. (1998).Principal oscillation patterns analysis of the 30 to 60 days oscillation in ageneral circulation model equatorial troposphere. Journal of GeophysicalResearch, 93, 11022-11036.

[103] Vogel, C.R. y Wade, J.C. (1994). Iterative SVD-based methods for ill-posed problems. SIAM Journal on Scientic Computing, 15, 736-754.

[104] Waller, L. A., Carlin, B.P., Xia H. y Gelfang, A.E. (1996). Hierarchi-cal spatio-temporal mapping of disease rates. Journaal of the AmericanStatistical Association, 92, 607-617.

[105] Welch, G. y Bishop, G. (2006). An introduction to the kalman lter.SIGGRAPH 2001 Course.

[106] Wikle, C.K. (2001). A kernel-based spectral approach for spatio-temporal dynamic models. Proceedings of the 1st Spanish Workshop onSpatio-Temporal Modelling of Environmental Processes (METMA), Be-nicassim, Castellón (Spain), 28-31 october, 167-180.

[107] Wikle, C.K. (2002). A kernel-based spectral model for non-Gaussianspatio-temporal processes. Statistical Modelling: An International Jour-nal, 2, 299-314.

[108] Wikle, C.K. (2003). Spatio-temporal methods in climatology. Encyclo-pedia of life Support Systems. París: EOLSS.

48

Page 49: Estimación Lineal Mínimo Cuadrática en Modelos ARH(1

[109] Wikle, C.K., Berliner, M. y Cressie, N. (1999). Hierachical Bayesianspace-time models. Environmental Ecological and Statistics, 5, 117-154.

[110] Wikle, C.K. y Cressie, N. (1999). A dimension-reduction approach tospace-time Kalman ltering. Biometrika, 86, 815-829.

[111] Wikle, C.K., Milli, R.F. y Berliner, L.M. (1999). Spatio-temporal hie-rarchical bayesian modelling: Tropical Ocean Surface Winds. JASA, Ap-plications and case Studies.

[112] Yao, F., Müller, H.G., Cliord, A.J., Dueker, S.R., Lin Follett, J., Buch-holz, B.A.Y. y Vogel, J.S. (2003). Shrinkage estimation for functionalprincipal component scores with application to the population kinetics ofplasma folate, Biometrics 59, 676-685.

[113] Yao, F., Müller, H.G., Wang, J.L. (2005). Functional data analysis forsparse longitudinal dataJournal of the American statistical Association,100, 577-590.

49