modelos

6
MODELOS PARAMÉTRICOS DE LA MATRIZ DE VARIANZAS-COVARIANZAS EN ELAJUSTE DE FUNCIONES DE PERFIL J. G. Álvarez González, A. D. Ruiz González y M. Barrio Anta Departamento de Ingeniería Agroforestal. Escuela Politécnica Superior. Universidad de Santiago de Compostela. Campus Universitario s/n. 27002–LUGO (España). Correo electrónico: [email protected] Resumen El empleo de funciones de perfil se ha generalizado durante las últimas décadas debido a su fle- xibilidad para estimar los volúmenes de árboles individuales hasta diferentes diámetros en punta del- gada o con distintas longitudes de troza. Estas funciones se obtienen, generalmente, al ajustar mode- los matemáticos a datos obtenidos por mediciones de diámetros a diferentes alturas en el tronco de un árbol. Se trata, por tanto de mediciones repetidas en cada una de las unidades de muestreo (árbol). La metodología comúnmente aplicada en el análisis de modelos de regresión con este tipo de datos se basa en establecer un modelo paramétrico para la matriz de varianzas-covarianzas. En este traba- jo se analizan diversas estructuras de dicha matriz y se comparan empleando datos reales de análisis de troncos de Pinus radiata en Galicia. Palabras clave: Datos longitudinales, Dependencia espacial, Autocorrelación, Modelos espaciales INTRODUCCIÓN Las funciones de perfil son ecuaciones que relacionan el diámetro o el radio del tronco de un árbol con la altura a la que se alcanza ese diáme- tro o radio. Su uso se ha generalizado durante las últimas décadas debido a su flexibilidad para esti- mar los volúmenes de árboles individuales hasta diferentes diámetros en punta delgada o con dis- tintas longitudes de troza. Estas funciones se obtienen, generalmente, al ajustar modelos mate- máticos a datos obtenidos por mediciones de diá- metros a diferentes alturas en el tronco de un árbol, por lo que es razonable pensar que la varia- bilidad entre las medidas de cada árbol sea menor que entre árboles, no pudiéndose considerar por tanto como observaciones independientes. Es decir, existe una dependencia espacial (autocorre- lación) en los datos y los errores, con lo que se viola un supuesto básico para estimar un modelo de regresión mediante mínimos cuadrados ordi- narios, que asume que los errores son indepen- dientes e idénticamente distribuidos. Para solventar el problema de la autocorrela- ción en el ajuste han surgido diferentes metodo- logías, siendo los modelos con coeficientes ale- atorios y los modelos paramétricos de la matriz de varianzas-covarianzas de los datos las más utilizadas (GREGOIRE et al., 1995; TASISSA & BURKHART, 1998; GARBER & MAGUIRE, 2003). En este trabajo se ha empleado esta última meto- dología porque presenta algunas ventajas impor- tantes para el ajuste de funciones de perfil (NUÑEZ-ANTÓN Y ZIMMERMAN, 2001): (i) permi- te obtener de una forma más eficiente los esti- madores de los parámetros del modelo que rela- ciona la variable dependiente con las variables independientes; (ii) permite obtener estimadores 297 ISSN: 1575-2410 © 2004 Sociedad Española de Ciencias Forestales Cuad. Soc. Esp. Cien. For. 18: 297-302 (2004) «Actas de la Reunión de Modelización Forestal»

Upload: yolpello

Post on 14-Dec-2015

212 views

Category:

Documents


0 download

DESCRIPTION

modelos

TRANSCRIPT

Page 1: Modelos

MODELOS PARAMÉTRICOS DE LA MATRIZ DEVARIANZAS-COVARIANZAS EN EL AJUSTE DEFUNCIONES DE PERFIL

J. G. Álvarez González, A. D. Ruiz González y M. Barrio Anta

Departamento de Ingeniería Agroforestal. Escuela Politécnica Superior. Universidad de Santiago deCompostela. Campus Universitario s/n. 27002–LUGO (España). Correo electrónico: [email protected]

Resumen

El empleo de funciones de perfil se ha generalizado durante las últimas décadas debido a su fle-xibilidad para estimar los volúmenes de árboles individuales hasta diferentes diámetros en punta del-gada o con distintas longitudes de troza. Estas funciones se obtienen, generalmente, al ajustar mode-los matemáticos a datos obtenidos por mediciones de diámetros a diferentes alturas en el tronco deun árbol. Se trata, por tanto de mediciones repetidas en cada una de las unidades de muestreo (árbol).La metodología comúnmente aplicada en el análisis de modelos de regresión con este tipo de datosse basa en establecer un modelo paramétrico para la matriz de varianzas-covarianzas. En este traba-jo se analizan diversas estructuras de dicha matriz y se comparan empleando datos reales de análisisde troncos de Pinus radiata en Galicia.

Palabras clave: Datos longitudinales, Dependencia espacial, Autocorrelación, Modelos espaciales

INTRODUCCIÓN

Las funciones de perfil son ecuaciones querelacionan el diámetro o el radio del tronco de unárbol con la altura a la que se alcanza ese diáme-tro o radio. Su uso se ha generalizado durante lasúltimas décadas debido a su flexibilidad para esti-mar los volúmenes de árboles individuales hastadiferentes diámetros en punta delgada o con dis-tintas longitudes de troza. Estas funciones seobtienen, generalmente, al ajustar modelos mate-máticos a datos obtenidos por mediciones de diá-metros a diferentes alturas en el tronco de unárbol, por lo que es razonable pensar que la varia-bilidad entre las medidas de cada árbol sea menorque entre árboles, no pudiéndose considerar portanto como observaciones independientes. Esdecir, existe una dependencia espacial (autocorre-lación) en los datos y los errores, con lo que se

viola un supuesto básico para estimar un modelode regresión mediante mínimos cuadrados ordi-narios, que asume que los errores son indepen-dientes e idénticamente distribuidos.

Para solventar el problema de la autocorrela-ción en el ajuste han surgido diferentes metodo-logías, siendo los modelos con coeficientes ale-atorios y los modelos paramétricos de la matrizde varianzas-covarianzas de los datos las másutilizadas (GREGOIRE et al., 1995; TASISSA &BURKHART, 1998; GARBER & MAGUIRE, 2003).En este trabajo se ha empleado esta última meto-dología porque presenta algunas ventajas impor-tantes para el ajuste de funciones de perfil(NUÑEZ-ANTÓN Y ZIMMERMAN, 2001): (i) permi-te obtener de una forma más eficiente los esti-madores de los parámetros del modelo que rela-ciona la variable dependiente con las variablesindependientes; (ii) permite obtener estimadores

297ISSN: 1575-2410© 2004 Sociedad Española de Ciencias Forestales

Cuad. Soc. Esp. Cien. For. 18: 297-302 (2004) «Actas de la Reunión de Modelización Forestal»

Page 2: Modelos

más adecuados para los errores estándar de losestimadores de dichos parámetros; (iii) enmuchos casos, permite solucionar de formaefectiva los problemas de falta de datos o dediferente número de mediciones entre indivi-duos; y (iv) puede emplearse aún cuando elnúmero de mediciones sea muy grande en com-paración con el número de individuos.

MATERIAL Y MÉTODOS

Los datos empleados en este trabajo provie-nen de un total de 30 árboles seleccionados alea-toriamente entre la muestra de 365 árboles conque se ajustó la función de perfil de la especie enGalicia (CASTEDO Y ÁLVAREZ, 2000). La muestraoriginal proviene de 61 parcelas establecidas enmasas regulares de Pinus radiata con edadescomprendidas entre 5 y 41 años. Dichas parcelasse han distribuido por toda Galicia tratando decubrir las diferentes calidades de estación y demodo que, en la muestra final de árboles medidos,estuviesen adecuadamente representadas las prin-cipales combinaciones de diámetros normales yalturas. Cada árbol fue apeado y dividido en tro-zas de longitud comprendida entre 1 y 2,5 metros,siendo en su mayoría de un metro de longitud.

En cada troza se midió la longitud con cintamétrica y aproximación al centímetro, el diáme-tro basal en cruz con forcípula milimétrica y elespesor de corteza radial en milímetros. Asímismo se midieron el diámetro normal y el diá-metro a 4 metros en cruz, ambos en milímetros,la altura total con cinta métrica centimétrica y,por último, se estimaron los volúmenes totalescon y sin corteza cubicando cada troza median-te la fórmula de Smalian.

Por tanto, los datos procedentes del análisisde tronco corresponden a mediciones de diáme-tro en alturas no equidistantes entre sí ni coinci-dentes de unos individuos a otros, es decir, setrata de datos no rectangulares, lo que imponeuna limitación a algunas de las matrices devarianzas-covarianzas a utilizar en la modeliza-ción de la estructura del error. En la figura 1,donde se muestran los perfiles de los 30 árbolesseleccionados, se puede observar como las altu-ras de medición no son las mismas en todos losindividuos y las distancias entre unas medicio-nes y otras tampoco son constantes.

Para evitar este inconveniente se ha emplea-do la función de perfil ajustada a la especie enGalicia para estimar los valores de los diámetrosrelativos (cociente entre el diámetro a una ciertaaltura relativa y el diámetro normal) a 10 alturas

298

J.G. ÁLVAREZ GOZÁLEZ et al. «Modelos paramétricos de la matriz de varianzas-covarianzas en el ajuste de funciones de perfil»

Figura 1. Perfiles de los 30 árboles seleccionados en los que se observa que las mediciones no se realizan a las mis-mas alturas y las distancias entre mediciones no son constantes

0

10

20

30

40

50

60

70

80

0 5 10 15 20 25 30 35 40

Alturas (m)

Mediciones a diferentes alturas

Mediciones no equidistantes

0

10

20

30

40

50

60

70

80

0 5 10 15 20 25 30 35 40

Diá

met

ros

(cm

)

Page 3: Modelos

relativas (cociente entre la altura del árbol a laque se mide el diámetro y la altura total) equi-distantes e iguales para cada árbol correspon-dientes a dividir la altura total en diez partesiguales. Por tanto las 10 alturas relativas emple-adas para cada árbol se corresponden con valo-res que van desde 0,1 hasta 1 con una equidis-tancia de 0,1. La expresión matemática de lafunción de perfil ajustada a la especie es lasiguiente (CASTEDO Y ÁLVAREZ, 2000):

(1)

donde r es el radio con corteza correspondientea la altura h, en cm; D es el diámetro normal concorteza, en cm; h es la altura en metros desde labase del árbol hasta el punto donde se alcanza eldiámetro d; H es la altura total del árbol, en m yb0, b1 y b2 son los parámetros obtenidos en elajuste y cuyos valores son 0,45034; 0,76913 y0,05076, respectivamente.

En la tabla 1 se muestran los datos de lasmedias y las varianzas de los diámetros relativosa las diferentes alturas relativas obtenidos alemplear la función de perfil. También se mues-tran los valores de los coeficientes de correla-

ción entre los valores de los diámetros relativosa las diferentes alturas relativas. Se puede obser-var como el valor medio de los diámetros relati-vos decrece, como es lógico, por lo que no setrata de un valor estacionario y, por tanto, esnecesario emplear un modelo para representardicha variación. Por otra parte, la varianza de losdiámetros relativos muestra variaciones aunque,con el propósito de simplificar el análisis se va aconsiderar estacionaria, es decir, se asume queexiste homogeneidad de varianzas. En cuanto alos valores del coeficiente de correlación lineal,se observa que existen fuertes correlacionesentre todos los diámetros relativos, que los valo-res decrecen muy ligeramente a medida que lasmediciones están más alejadas y que las correla-ciones sub-diagonales se pueden considerarestacionarias, es decir, las correlaciones entrecualquier diámetro relativo y el diámetro relati-vo a n mediciones anteriores (donde n varia de 1a 9) es constante.

Finalmente se cuenta con dos bases de datospara realizar los ajustes: la original, con medi-ciones no equidistantes y con diferente númeropara cada individuo; y la construida con la fun-ción de perfil en la que las mediciones son equi-distantes en altura relativa y hay el mismonúmero por individuo.

Entre las matrices empleadas con la base dedatos original para corregir los posibles proble-mas de dependencia de los errores se han inclui-do modelos espaciales que tienen en cuenta la

299

Cuad. Soc. Esp. Cien. For. 18: 297-302 (2004) «Actas de la Reunión de Modelización Forestal»

( )

⋅⋅⋅−

⋅−

⋅+

+

−−⋅

⋅−+

⋅=

−⋅

−⋅

−⋅

⋅−

−⋅−⋅

)3,1(0

)3,1(

3,10

3,10)3,1(0

2

22

1

1

1

12

11

2

1

11

21

Hb

Hbhb

Hb

b

hb

HbHb

e

eDbe

e

eDbD

e

eDb

D

e

Dbr

Altura relativa 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90

Medias 0,93 0,84 0,77 0,69 0,61 0,52 0,41 0,29 0,16

Varianzas: 0,0002 0,0002 0,0001 0,0002 0,0001 0,0002 0,0001 0,0001 0,0001

N 30 30 30 30 30 30 30 30 30

Corr.: 1,00000,9998 1,00000,9996 0,9999 1,00000,9993 0,9998 0,9999 1,00000,9989 0,9996 0,9998 0,9999 1,00000,9984 0,9993 0,9996 0,9998 0,9999 1,00000,9979 0,9989 0,9994 0,9996 0,9998 0,9999 1,00000,9973 0,9984 0,9990 0,9994 0,9996 0,9998 0,9999 1,00000,9965 0,9979 0,9985 0,9990 0,9993 0,9996 0,9998 0,9999 1,0000

Tabla 1. Valores medios y varianzas de los diámetros relativos de los 30 árboles a alturas relativas equidistantes. Sepresentan también las correlaciones entre dichos diámetros relativos y la línea discontinua muestra como las correla-ciones sub-diagonales se pueden considerar constantes

Page 4: Modelos

300

J.G. ÁLVAREZ GOZÁLEZ et al. «Modelos paramétricos de la matriz de varianzas-covarianzas en el ajuste de funciones de perfil»

Matrices empleadas para la base de datos originalModelo simple sin dependencia de errores Modelo potencial

Modelo exponencial Modelo Gaussiano

Modelo lineal

Matrices empleadas para la base de datos construida a partir de la función de perfilModelo simple sin dependencia de errores Modelo de simetría compuesta

Modelo autorregresivo de orden 1 Modelo autorregresivo de media móvil

Modelo Toeplitz en una banda Modelo Toeplitz en dos bandas

1000

0100

0010

0001

1000

0100

0010

0001

1

1111

1111

1111

1111

434241

343231

242321

141312

2 ≤⋅

⋅−⋅−⋅−

⋅−⋅−⋅−

⋅−⋅−⋅−

⋅−⋅−⋅−

ijd

ddd

ddd

ddd

ddd

ρ

ρρρ

ρρρ

ρρρ

ρρρ

σ

−−−

−−−

−−−

−−−

1

1

1

1

2

243

2

242

2

241

2

234

2

232

2

231

2

224

2

223

2

221

2

214

2

213

2

212

2

ρρρ

ρρρ

ρρρ

ρρρ

σ

ddd

ddd

ddd

ddd

eee

eee

eee

eee

−−−

−−−

−−−

−−−

1

1

1

1

434241

343231

242321

141312

2

θθθ

θθθ

θθθ

θθθ

σ

ddd

ddd

ddd

ddd

eee

eee

eee

eee

10

1

1

01

12

112

211

21

2

σσ

σσσ

σσσ

σσ

σ

100

10

01

001

1

11

11

1

2

σ

σσ

σσ

σ

σ

Tabla 2. Matrices empleadas para modelizar la estructura del error en la base de datos original y en la base de datosconstruida a partir de la función de perfil. Donde σ 2 es la varianza, dij es la distancia entre la medición i y la medi-ción j y los restantes parámetros (σ1, σ2, ρ y γ) definen el tipo de dependencia entre los errores

Page 5: Modelos

influencia que tiene la distancia entre las medi-ciones en la correlación entre dichos errores.Estas matrices no han sido utilizadas en el casode la base de datos originada con la función deperfil. En la tabla 2 se muestran las expresionesde las matrices utilizadas en el caso de que sólose contase con cuatro mediciones.

Puesto que el objetivo de este estudio no esanalizar los resultados de diferentes funcionesde perfil sino caracterizar la estructura del error,para modelizar la estructura de la media se haempleado un modelo totalmente saturado, esdecir, un modelo lineal en el que intervienentodas las variables que afectan al proceso, queen este caso son la altura en la base de datos ori-ginal y la altura relativa en la base de datos cons-truida a partir de la función de perfil.

Para realizar los ajustes se han asumido unaserie hipótesis de partida: (i) las mediciones rea-lizadas en árboles distintos son independientesentre sí; (ii) la variable dependiente está normal-mente distribuida y (iii) las varianzas de los erro-res son homogéneas. La estimación de los pará-metros se ha realizado por máxima verosimilitudrestringida o residual (para más detalles ver LIT-TELL et al., 1996) empleando el procedimientoMIXED del programa SAS (SAS INSTITUTE INC.,2001). Por último, la comparación entre modelosse ha basado en el cálculo de los valores del Cri-

terio de Información de Akaike (AICd) y del Cri-terio de Información Bayesiano (BICd) en dife-rencias (BURNHAM & ANDERSON, 2000).

RESULTADOS Y DISCUSIÓN

En la tabla 3 se muestran los resultadosobtenidos para el ajuste de los datos originales,es decir, con distinto número de observacionespor individuo y con mediciones no equidistan-tes entre sí. Como era de esperar, los peoresresultados corresponden al modelo simple dematriz de varianzas-covarianzas en el que no setiene en cuenta la dependencia de errores. Conel resto de los modelos la precisión del ajuste esbastante similar, aunque los valores más bajosde los criterios de información de Akaike yBayesiano en diferencias se obtienen al emple-ar un modelo potencial para la matriz de varian-zas-covarianzas. En este modelo se asume quela dependencia entre las mediciones decrece amedida que estas se van espaciando, y la rela-ción entre ellas viene dada por un término decorrelación (ρ) elevado a la distancia, en valorabsoluto, que separa ambas mediciones en eltronco del árbol.

En la tabla 4 se muestran los resultadosobtenidos al emplear la base de datos construi-

301

Cuad. Soc. Esp. Cien. For. 18: 297-302 (2004) «Actas de la Reunión de Modelización Forestal»

Modelo AICd BICdSimple 12,0 13,4Potencial 0,0 0,0Exponencial 2,1 3,4Gaussiano 2,1 3,4Lineal 3,3 3,9

Modelo AICd BICdSimple 547,6 544,8Simetría compuesta 0,0 0,0Autorregresivo orden 1 14,0 12,6Autorregresivo de media móvil 280,5 279,1Toeplitz de una banda 471,9 469,1Toeplitz de dos bandas 305,6 304,2

Tabla 3. Resultados del ajuste de diferentes matrices de varianzas-covarianzas a la base de datos original

Tabla 4. Resultados del ajuste de diferentes matrices de varianzas-covarianzas a la base de datos construida a partirde la función de perfil

Page 6: Modelos

da a partir de la función de perfil. De nuevo, lospeores resultados corresponden al modelo sim-ple de matriz varianzas-covarianzas, poniendode relieve que la inclusión de un factor quetenga en cuenta la dependencia entre medicio-nes mejora la precisión del modelo ajustado.Los mejores resultados se han obtenido con elmodelo de simetría compuesta en el que seasume que la correlación entre los errores esconstante. Esto puede deberse a la fuerte esta-cionariedad que se apreciaba en la base de datosoriginada mediante el empleo de la función deperfil, pero que en realidad no es frecuente eneste tipo de estudios, por lo que no parece acon-sejable emplear este tipo de estructura a no serque un análisis previo de los datos indique locontrario. Por otra parte, el modelo autorregre-sivo de orden 1 también presenta buenos resul-tados con la ventaja de que las correlaciones noson constantes, sino que su valor decrece amedida que las mediciones se van alejando a lolargo del tronco.

De estos resultados se puede concluir que:(i) independientemente de la estructura de datosempleada, la modelización del error mejora laprecisión del modelo; (ii) cuando se emplea unaestructura de datos original parece convenientemodelizar la estructura del error empleandomodelos espaciales sencillos, como por ejemploun modelo potencial; y (iii) en el caso de que secuente con datos rectangulares y equidistantesen el espacio, un modelo autorregresivo deorden 1 o un modelo de covarianzas constantespodría ser suficiente, dependiendo de la estacio-nariedad de las correlaciones entre mediciones.

Por último, destacar que todos los modelosutilizados pueden adaptarse de forma sencillapara tener en cuenta una posible falta de homo-geneidad de varianzas en los datos de partida,aunque esto podría suponer mayores dificulta-des para lograr la convergencia del método deestimación de los parámetros.

Agradecimientos

Este trabajo ha sido financiado por elMinisterio de Ciencia y Tecnología mediante elproyecto “Crecimiento y evolución de las masasde pinar en Galicia” del Plan Nacional I+D+I(2000-2003).

BIBLIOGRAFÍA

BURNHAM, K.P. & ANDERSON D.R.; 2000. Modelselection and inference: a practical informa-tion-theoretic approach. Springer-Verlag.Berlin.

CASTEDO, F. Y ÁLVAREZ GONZÁLEZ, J.G.; 2000.Construcción de una tarifa de cubicacióncon clasificación de productos para Pinusradiata D. Don en Galicia basada en una fun-ción de perfil del tronco. Inv. Agr., Sist. Rec.For. 9(2): 253-268.

GARBER, S.M. & MAGUIRE D.A.; 2003.Modelling stem taper of three centralOregon species using mixed effects modelsand autoregressive error structures. For.Ecol. Manage. 179: 507-522.

GREGOIRE, T.G.; SCHABENBERGER, O. & BARRET,J.P.; 1995. Linear modelling of irregularlyspaced, unbalanced, longitudinal data frompermanent plot measurements. Can. J. For.Res. 25: 137-156.

LITTELL, R.C.; MILLIKEN, G.A.; STROUP, W.W. &WOLFINGER R.D.; 1996. SAS System forMixed Models. SAS Institute Inc. Cary, NC.

NUÑEZ-ANTÓN, V. Y ZIMMERMAN, D.L.; 2001.Modelización de datos longitudinales conestructuras de covarianza no estacionarias:modelos de coeficientes aleatorios frente amodelos alternativos. Qüestió 25(2): 225-262.

SAS INSTITUTE INC.; 2001. SAS/STATTM User’sGuide, Relase 8.2. Cary, N.C. USA.

TASSISA, G. & BURKHART H.E.; 1998. An appli-cation of mixed effects análisis to modelingthinnings effects on stem profile of loblollypine. For. Ecol. Manage. 103: 87-101.

302

J.G. ÁLVAREZ GOZÁLEZ et al. «Modelos paramétricos de la matriz de varianzas-covarianzas en el ajuste de funciones de perfil»