comparacion de dos metodos de … · para optar al ascenso en la categoría de asistente, de...

117
UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE AGRONOMÍA INSTITUTO DE EDAFOLOGÍA COMPARACION DE DOS METODOS DE CARTOGRAFIA DIGITAL CON UN ESTUDIO AGROLOGICO CONVENCIONAL EN LA CUENCA DEL RIO CANOABO, ESTADO CARABOBO. Víctor A. Sevilla L. Maracay, Diciembre 2014.

Upload: vonhan

Post on 24-Sep-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

UNIVERSIDAD CENTRAL DE VENEZUELA

FACULTAD DE AGRONOMÍA

INSTITUTO DE EDAFOLOGÍA

COMPARACION DE DOS METODOS DE CARTOGRAFIA DIGITAL

CON UN ESTUDIO AGROLOGICO CONVENCIONAL EN LA CUENCA

DEL RIO CANOABO, ESTADO CARABOBO.

Víctor A. Sevilla L.

Maracay, Diciembre 2014.

ii

UNIVERSIDAD CENTRAL DE VENEZUELA

FACULTAD DE AGRONOMÍA

INSTITUTO DE EDAFOLOGÍA

COMPARACION DE DOS METODOS DE CARTOGRAFIA DIGITAL

CON UN ESTUDIO AGROLOGICO CONVENCIONAL EN LA CUENCA

DEL RIO CANOABO, ESTADO CARABOBO.

Víctor A. Sevilla L.

Trabajo presentado ante el Consejo de la Facultad de Agronomía, como parte de las pruebas

para optar al ascenso en la categoría de ASISTENTE, de conformidad con el Artículo 89 de la

Ley de Universidades y con los Artículos 63, 66, 79, 80 y 81 del Reglamento del Personal

Docente y de Investigación de la Universidad Central de Venezuela.

iii

UNIVERSIDAD CENTRAL DE VENEZUELA

FACULTAD DE AGRONOMÍA

INSTITUTO DE EDAFOLOGÍA

COMPARACION DE DOS METODOS DE CARTOGRAFIA DIGITAL

CON UN ESTUDIO AGROLOGICO CONVENCIONAL EN LA CUENCA

DEL RIO CANOABO, ESTADO CARABOBO.

Tutor:

Dr. Juan A. Comerma G.

Maracay, Diciembre 2014.

iv

DEDICATORIA

A la memoria de mis padres y tía.

A mis locos de siempre, Esmeralda, Tiago y José.

Y al nuevo integrante, Aarón (toco toco).

v

AGRADECIMIENTO.

Como siempre, gracias a Dios y a nuestro Señor Jesús Cristo, por todo.

Mi agradecimiento sincero a:

A la Universidad Central de Venezuela, mi casa de estudios.

A mi Tutor, Sr. Juan Comerma, por su paciencia y ejemplos.

A los profesores Jesús Viloria y Ángel Valera, por compartir su gran conocimiento conmigo.

A las profesoras Deyanira lobo y Corina Pineda por su empuje, cada quien a su manera muy

particular.

A los profesores Carlos Marín y Naly Núñez por su colaboración.

A Francia Medina mi mano derecha.

A Pao-Pao mi otra mano derecha, de siempre.

A Antonio Medina, la gorda y Chan por siempre estar pendiente.

A German y Trina por su apoyo.

A la gente de EMBRAPA Suelos Brasil.

Y finalmente a mi familia y amigos, que estuvieron conmigo detrás del muro de los lamentos.

vi

RESUMEN

El objetivo de este estudio, fue comparar la eficacia en el mapeo de suelos de montaña de dos

métodos de cartografía digital. Uno basado en inteligencia artificial (neuro-borroso) y otro en

estadística y geoestadistica (regresión-kriging). Ambos fueron aplicados en la cuenca

hidrográfica del Rio Canoabo, en el norcentro de Venezuela, y la comparación se realizó

contrastando los resultados obtenidos por cada método contra un levantamiento convencional

de suelos realizado con anterioridad en la misma cuenca. Para esta comparación se emplearon

los índices de concordancia (IC) y el coeficiente kappa (CK). Ambos métodos se apoyaron en

covariables ambientales extraídas del modelo digital de elevación y de imágenes de satélite

para obtener sus resultados, y solo en el método regresión-kriging, se emplearon 50 puntos de

observación de suelos. El método neuro-borroso realizó una clasificación no supervisada

utilizando una red de agrupamiento borroso de Kohonen (FKCN) y el método regresión-

kriging se basó en una regresión lineal múltiple más el kriging de los errores. Los resultados

indican que el enfoque neuro-borroso tuvo una coincidencia de moderada a alta con el mapa

de clases de suelos hecho de manera convencional (IC 59 % y CK 47 %), especialmente en los

suelos ubicados en las laderas altas bajo bosque nublado y bosque semideciduo montano bajo.

Por el otro lado el método de regresión-kriging obtuvo una concordancia de moderada a baja

con respecto al mapa convencional de clases de suelos (IC 43 % y CK 26 %). Es importante

señalar que aunque su concordancia resulto baja, este método logro mapear siete propiedades

de suelos (arena, limo, arcilla 0-20 cm, arcilla 20-50 cm, materia orgánica, pH 0-20 cm y pH

50-200 cm) de manera muy eficaz, mostrando coeficientes de determinación (R2) altos de 0.59

hasta 0.93. Las covariables ambientales de mayor importancia para la separación de clases

fisiográficas y mapear las propiedades de los suelos resultaron la altura (modelo digital de

elevación), la orientación de la ladera, la pendiente, el mapa de meses húmedos, el índice de

vegetación normalizado y el índice de humedad topográfico. Finalmente se sugiere que ambos

métodos de cartografía digital pudieran ser considerados complementarios, donde el método

neuro-borroso podría establecer las posibles unidades cartográficas, y apoyar un plan racional

de muestreo de los suelos, seguido por el método regresión-kriging, que empleando los

resultados de los suelos caracterizados, podría obtener una distribución espacial más precisa

de las propiedades de estos suelos en la región, así como mostrar la variabilidad interna en las

unidades cartográficas finales de suelos. Seguramente, esta combinación aumenta la

efectividad y eficiencia en comparación con un levantamiento convencional de suelos.

vii

ABSTRACT

The objective of this study was to compare the effectiveness of two digital soil mapping

procedures in mountain soils. One was based on artificial intelligence (neural fuzzy) and the

other in statistics and geostatistics (regression-krigging).Both were applied in the watershed of

rio Canoabo, at northern Venezuela. The comparison was made validating the results with a

previous conventional soil survey method carried out in the same watershed. For the

comparison were used the Concordance index (CI) and the Kappa Coefficient (KC). Both

digital mapping methods were based on environmental covariates obtained from a digital

elevation model and satellite images, and only in the case of regression-kriggin, 50 previous

soil characterization sites were also used. The neural-fuzzy method carried out a non-

supervised classification using a Fuzzy Kohonen Clustering Network (FKCN), while the

regression-krigging was based on a multiple lineal regression plus the krigging of the errors.

Results indicate that the neuro-fuzzy approach had a moderate to high concordance with the

conventional soil map (CI 59% and KC 47%), especially for the soils located in the high side

slopes under foggy forest and montane semideciduos forest. On the other side, the regression-

krigging had a moderate to low concordance with the conventional map (CI 43% and KC

26%). It is important to point out that, even though the concordance was low, this method was

able to map effectively seven soil properties (sand, silt, clay 0-20cm , clay 20-50cm, organic

matter, pH 0-20cm, pH 50-200cm), with a high Coefficient of Determination ( R2

0.59 up to

0.93). The most important environmental covariates for the separation of physiographic

classes and mapping soil properties were altitude (from the digital elevation model), side slope

orientation, slope, the map of wet months, the normalized vegetation index and the wetness

topographic index. Finally, it is suggested that both digital soil mapping procedures can be

considered as complementary, where the neuro-fuzzy method could establish the cartographic

units and support a rational plan of soil sampling, followed by the regression-krigging using

the soil results, and obtain a more precise spatial distribution of these soil properties in the

region as well as show the internal variability in the final soil cartographic units. Surely, the

combination will increase efectiveness and eficiency in comparison to a conventional soil

survey.

viii

TABLA DE CONTENIDO

1. INTRODUCCION --------------------------------------------------------------------------------------------------------- 1

2. HIPOTESIS ----------------------------------------------------------------------------------------------------------------- 3

3. OBJETIVO GENERAL -------------------------------------------------------------------------------------------------- 3

4. OBJETIVOS ESPECIFICOS ------------------------------------------------------------------------------------------- 3 5. REVISIÓN DE LITERATURA ----------------------------------------------------------------------------------------- 4

5.1. INTELIGENCIA ARTIFICIAL --------------------------------------------------------------------------------------- 4

5.1.1. Redes neuronales ---------------------------------------------------------------------------------------------------- 5

5.1.1.1. Definición de redes neuronales ------------------------------------------------------------------------------- 5

5.1.1.2. Características de las redes neuronales ----------------------------------------------------------------------- 5

5.1.1.3. Ventajas de las redes neuronales ------------------------------------------------------------------------------ 6

5.1.1.4. Desventajas de las redes neuronales -------------------------------------------------------------------------- 6

5.1.1.5. Modelo o estructura de un sistema neuronal artificial------------------------------------------------------ 7

a) La neurona --------------------------------------------------------------------------------------------------------- 7

b) Arquitectura de redes neuronales ------------------------------------------------------------------------------- 8

c) Aprendizaje de la red neuronal ---------------------------------------------------------------------------------- 8

5.1.1.6. Mapas auto organizados (SOM) de Kohonen. -------------------------------------------------------------- 9 5.1.1.7. Las Redes neuronales en estudio de clasificaciones ambientales. ---------------------------------------- 9

5.1.2. La Logica borrosa o difusa. -------------------------------------------------------------------------------------- 10

5.1.2.1. La Lógica borrosa en estudios de clasificaciones ambientales. ----------------------------------------- 11

5.1.3. Sistemas neuroborrosos (Redes neuronales y lógica borrosa). ---------------------------------------------- 12

5.2. REGRESIÓN–KRIGING -------------------------------------------------------------------------------------------- 13

5.2.1. Características y cálculos del método de regresion-kriging. ------------------------------------------------- 14

5.2.2. El método de regresión-kriging en estudios ambientales. ---------------------------------------------------- 16

5.3. COEFICIENTES DE CONCORDANCIA. ------------------------------------------------------------------------ 18

6. MATERIALES Y METODOS ---------------------------------------------------------------------------------------- 20 6.1. UBICACIÓN DEL ÁREA DE ESTUDIO. ------------------------------------------------------------------------- 21

6.2. CARACTERIZACIÓN DEL ÁREA DE ESTUDIO. ------------------------------------------------------------- 21 6.3. METODOS DE CARTOGRAFIA DIGITAL DE SUELOS. ---------------------------------------------------- 28

6.3.1. Método Neuro-Borroso. ------------------------------------------------------------------------------------------ 28

6.3.1.1. Materiales. ----------------------------------------------------------------------------------------------------- 28

a) Información temática empleada ------------------------------------------------------------------------------- 28

b) Aplicaciones informáticas utilizadas: ------------------------------------------------------------------------ 28

6.3.1.2. Procedimientos. ----------------------------------------------------------------------------------------------- 28

a) Adecuación de la información empleada. -------------------------------------------------------------------- 28

b) Diseño del Modelo Digital de Elevación (MDE). ---------------------------------------------------------- 29

c) Obtención de covariables ambientales.----------------------------------------------------------------------- 29

d) Agrupación o clasificación neuro-borrosa. ------------------------------------------------------------------ 31

6.3.2. Metodo Regresión-Kriging (RK). ------------------------------------------------------------------------------- 35

6.3.2.1. Materiales. ----------------------------------------------------------------------------------------------------- 35 a) Información temática empleada. ------------------------------------------------------------------------------ 35

b) Aplicaciones informáticas utilizadas. ------------------------------------------------------------------------ 38

6.3.2.2. Procedimientos. ----------------------------------------------------------------------------------------------- 38

a) Revisión de los datos puntuales de suelos. ------------------------------------------------------------------ 38

b) Estimaciones de los valores de las propiedades en las profundidades solicitadas (Spline). ----------- 38

c) Obtención de la información sobre covariables ambientales (MDE e imágenes LANDSAT). ------- 39

d) Preparación de las covariables ambientales. ----------------------------------------------------------------- 40

e) Cálculo del índice de vegetación normalizado (NDVI). --------------------------------------------------- 40

f) Calculo de las variables morfométricas. --------------------------------------------------------------------- 40

g) Relacionar las propiedades de los suelos con los valores de las covariables ambientales. ------------ 41

h) Cálculo estadístico de la regresión lineal múltiple en estadístico “R”. ----------------------------------- 41 i) Interpolación kriging de los residuos o errores en estadístico “R”. --------------------------------------- 42

j) Obtención de los mapas finales de cada propiedad a diferentes profundidades. ------------------------ 42

k) Validación. ------------------------------------------------------------------------------------------------------- 42

6.4. COMPARACIÓN DE LOS METODOS CARTOGRAFICOS CONTRA UN MAPA CONVENCIONAL. --------------------- 45

ix

6.4.1. Concordancia entre el método neuro-borroso y el levantamiento Convencional: ------------------------ 45

6.4.2. Concordancia entre el método regresion-kriging y el levantamiento Convencional: --------------------- 47

7. RESULTADOS Y DISCUSIÓN --------------------------------------------------------------------------------------- 48 7.1. RESULTADOS DEL MÉTODO NEURO–BORROSO. --------------------------------------------------------- 48

7.1.1. Modelo digital de elevación (MDE) obtenido: ---------------------------------------------------------------- 48

7.1.2. Descripción de las Variables morfométricas y el Índice de vegetación normalizado (NDVI). --------- 50

7.1.3. Agrupamiento o clasificación neuro-borrosa. ----------------------------------------------------------------- 53

7.1.3.1. Índice de borrosidad adecuado. ----------------------------------------------------------------------------- 53

7.1.3.2. Número óptimo de clases. ----------------------------------------------------------------------------------- 54

7.1.3.3. Cartografía de clases fisiográficas. ------------------------------------------------------------------------- 55

7.1.3.4. Características centrales de las clases. --------------------------------------------------------------------- 56 7.1.3.5. Clases tentativas de suelos ----------------------------------------------------------------------------------- 59

7.1.4. Relevancia de las covariables ambientales en la clasificacion neuro-borrosa ----------------------------- 60

7.2. RESULTADOS DEL METODO REGRESION–KRIGING. ---------------------------------------------------- 61

7.2.1. Arena (0 – 20 cm) ------------------------------------------------------------------------------------------------- 62

7.2.2. Limo (0 – 20 cm) -------------------------------------------------------------------------------------------------- 66

7.2.3. Arcilla (0 – 20 cm) ------------------------------------------------------------------------------------------------ 70

7.2.4. Arcilla (20 – 50 cm) ---------------------------------------------------------------------------------------------- 74

7.2.5. Materia orgánica (0 – 20 cm) ------------------------------------------------------------------------------------ 78

7.2.6. pH (0 – 20 cm) ---------------------------------------------------------------------------------------------------- 82

7.2.7. pH (50 – 200 cm) ------------------------------------------------------------------------------------------------- 86

7.3. COMPARACIÓN DE LOS METODOS CARTOGRAFICOS CONTRA UN MAPA DE SUELOS

REALIZADO DE MANERA CONVENCIONAL. --------------------------------------------------------------------- 90

7.3.1. Concordancia entre el método neuro-borroso y el levantamiento Convencional ------------------------- 90

7.3.2. Concordancia entre el método regresion-kriging y el levantamiento Convencional --------------------- 93

8. CONCLUSIONES ------------------------------------------------------------------------------------------------------- 97

9. REFERENCIAS BIBLIOGRAFICAS ------------------------------------------------------------------------------ 100

x

INDICE DE CUADROS

Cuadro 1. Suelos de la cuenca del Rio Canoabo. ............................................................................................. 27

Cuadro 2. Covariables ambientales empleadas en el método de regresión–kriging. .......................................... 37

Cuadro 3. Propiedades de los suelos cartografiadas digitalmente por regresión–kriging. .................................. 39

Cuadro 4. Variables morfometricas empleadas en regresion-kriging ................................................................ 40

Cuadro 5. Interpretación del valor de K........................................................................................................... 46

Cuadro 6. Características del MDE generados en la zona de estudio. ............................................................... 50

Cuadro 7. Parámetros estadísticos descriptivos del MDE de la Cuenca del Río Canoabo. ................................. 53

Cuadro 8. Datos de los centroides de cada clase obtenida en la cuenca del Rio Canoabo. ................................. 56

Cuadro 9. Pesos de las distancias entre clases.................................................................................................. 60

Cuadro 10. Valores originales de Arena (%). .................................................................................................. 62

Cuadro 11. Estadísticos de validación del modelo de regresion-kriging (arena). ............................................... 65

Cuadro 12. Valores originales de limo (%). ..................................................................................................... 66

Cuadro 13. Estadísticos de validación del modelo de regresion-kriging (limo). ................................................ 69

Cuadro 14. Valores originales de arcilla (%). .................................................................................................. 70

Cuadro 15. Estadísticos de validación del modelo de regresion-kriging (arcilla 0-20 cm). ................................ 73

Cuadro 16. Valor original arcilla 20-50 cm (%). .............................................................................................. 74

Cuadro 17. Estadísticos de validación del modelo de regresion-kriging (arcilla 20-50 cm). .............................. 77

Cuadro 18. Valor original de materia orgánica (%). ......................................................................................... 78

Cuadro 19 Estadísticos de validación del modelo de regresion-kriging (MO). .................................................. 81

Cuadro 20. Valores originales de pH (0 – 20 cm). ........................................................................................... 82

Cuadro 21. Estadísticos de validación del modelo de regresion-kriging (pH 0-20 cm). ..................................... 85

Cuadro 22. Valor original de pH (50 – 200 cm). .............................................................................................. 86

Cuadro 23. Estadísticos de validación del modelo de regresion-kriging (pH 50-200 cm). ................................. 89

Cuadro 24. Clases fisiográficas del mapa producido por el método neuro-borroso. .......................................... 90

Cuadro 25. Matriz de errores entre clases (métodos convencional y neuro-borroso) ......................................... 91

Cuadro 26. Reporte de exactitud (métodos convencional y neuro-borroso) ...................................................... 92

Cuadro 27. Estadísticos generales (métodos convencional y neuro-borroso) .................................................... 93

Cuadro 28. Clases fisiográficas del mapa producido por el método regresion-kriging....................................... 93

Cuadro 29. Matriz de errores entre clases (métodos convencional y regresion-kriging) .................................... 94

Cuadro 30. Reporte de exactitud (métodos convencional y regresion-kriging) ................................................. 95

Cuadro 31. Estadísticos generales (métodos convencional y regresion-kriging) ............................................... 95

xi

INDICE DE FIGURAS

Figura 1. Modelo de neurona estándar. _________________________________________________________ 8

Figura 2. Esquema metodológico empleado en el trabajo. __________________________________________ 20

Figura 3. Ubicación relativa del área de estudio. _________________________________________________ 21

Figura 4. Mapa del modelo digital de precipitación media anual. ____________________________________ 22

Figura 5. Mapa del modelo digital de números de meses húmedos. __________________________________ 23

Figura 6. Mapa de Erosión actual. ____________________________________________________________ 24

Figura 7. Mapa de suelos de la cuenca del Rio Canoabo, levantado de manera convencional. ______________ 27

Figura 8. Localización de las 40 observaciones de campo en la Cuenca del Rio Canoabo _________________ 36

Figura 9. Ejemplo de salida de función SPLINE. _________________________________________________ 39

Figura 10. Hoja cartográfica a escala 1:25.000, curvas de nivel e hidrografía de la Cuenca ________________ 48

Figura 11. Modelo digital de elevación mostrando los perfiles topográficos ____________________________ 49

Figura 12. Variables morfométricas empleadas. _________________________________________________ 51

Figura 13. Variables morfométricas e Índice de vegetación normalizado empleados. _____________________ 52

Figura 14. Variación del FPI en función del número de clases y el exponente borroso (θ) ________________ 54

Figura 15 Variación de la MPE y el FPI en función del número de clases._____________________________ 54

Figura 16. Mapa de unidades clases fisiográficas producto de la clasificación neuro-borrosa. ______________ 55

Figura 17. Gráfico de la variación del peso de las distancias entre clases. ______________________________ 61

Figura 18. Histograma de arena (%). __________________________________________________________ 62

Figuras 19 y 20. RLM, coeficientes de regresión y valores medidos y estimados (arena). _________________ 62

Figura 21. Características de los residuos o errores del modelo de regresión (arena). _____________________ 63

Figura 22. Semivariograma de los residuos de arena. _____________________________________________ 63

Figuras 23 y 24. Mapa de arena kriging residuos y Mapa arena por regresión __________________________ 64

Figura 25. Mapa de arena por regresión–kriging. _________________________________________________ 64

Figura 26. Histograma de limo (%). ___________________________________________________________ 66

Figuras 27 y 28. RLM, coeficientes de regresión y valores medidos y estimados (limo). __________________ 66

Figura 29. Características de los residuos o errores del modelo de regresión (limo). _____________________ 67

Figura 30. Semivariograma de los residuos de limo. ______________________________________________ 67

Figuras 31 y 32. Mapa de limo kriging residuos y Mapa limo por regresión ____________________________ 68

Figura 33. Mapa de limo por regresion–kriging. _________________________________________________ 68

Figura 34. Histograma de arcilla (%). _________________________________________________________ 70

Figuras 35 y 36. RLM, coeficientes regresión y valor medido y estimado (arcilla 0-20 cm). _______________ 70

Figura 37. Características de los residuos o errores del modelo de regresión (arcilla 0-20 cm). _____________ 71

Figura 38. Semivariograma de los residuos de la arcilla 0-20 cm. ____________________________________ 71

Figuras 39 y 40. Mapa de arcilla (0-20 cm) kriging residuos y Mapa arcilla por regresión _________________ 72

Figura 41. Mapa de arcilla (0-20 cm) por regresión–kriging.________________________________________ 72

Figura 42. Histograma arcilla 20-50 cm (%). ____________________________________________________ 74

Figuras 43 y 44. RLM, coeficientes de regresión y valores de arcilla medidos y estimados (arcilla 20-50 cm). _ 74

Figura 45. Características de los residuos o errores del modelo regresión (arcilla 20-50 cm). ______________ 75

Figura 46. Semivariograma de los residuos de arcilla (20-50 cm). ___________________________________ 75

Figuras 47 y 48. Mapa de arcilla (20-50 cm) kriging residuos y Mapa arcilla por regresión. _______________ 76

Figura 49. Mapa de arcilla (20-50 cm) por regresion–kriging._______________________________________ 76

Figura 50. Histograma de materia orgánica (%). _________________________________________________ 78

xii

Figuras 51 y 52. RLM, coeficientes de regresión y valores medidos y estimados de MO __________________ 78

Figura 53. Características de los residuos o errores del modelo regresión (materia orgánica). ______________ 79

Figura 54. Semivariograma de los residuos de materia orgánica. ____________________________________ 79

Figuras 55 y 56. Mapas de materia orgánica kriging residuos y por regresión __________________________ 80

Figura 57. Mapa de materia orgánica por regresion–kriging. ________________________________________ 80

Figura 58. Histograma de pH (0-20 cm). _______________________________________________________ 82

Figuras 59 y 60. RLM, coeficientes regresión y valores de medidos y estimados (pH 0-20 cm) _____________ 82

Figura 61. Características de los residuos o errores del modelo de regresión (pH 0-20 cm). ________________ 83

Figura 62. Semivariograma de los residuos de pH 0-20 cm. ________________________________________ 83

Figuras 63 y 64. Mapa de pH (0 – 20 cm) kriging residuos y Mapa pH por regresión ____________________ 84

Figura 65. Mapa de pH (0 – 20 cm) por regresión–kriging. _________________________________________ 84

Figura 66. Histograma de pH (50-200 cm). _____________________________________________________ 86

Figuras 67 y 68. RLM, coeficientes regresión y valores medidos y estimados (pH 50-200 cm). ____________ 86

Figura 69. Características de los residuos o errores del modelo de regresión (pH 50-200 cm). ______________ 87

Figura 70. Semivariograma de los residuos de pH 50-200 cm. ______________________________________ 87

Figuras 71 y 72. Mapa de pH (50 - 200 cm) kriging residuos y Mapa pH por regresión. __________________ 88

Figura 73. Mapa de pH (50 – 200 cm) por regresión–kriging. _______________________________________ 88

Figura 74. Mapa de clases de suelos convencional y Mapa de clases neuro-borrosas. ____________________ 91

Figura 75. Mapa de clases de suelos convencional y Mapa de clases regresion-kriging. ___________________ 94

1

1. INTRODUCCION

En Venezuela, aproximadamente el 50 % del territorio se corresponde con el paisaje de

montañas, caracterizado por altas pendientes, relieves escarpados y con una cobertura de

vegetación boscosa o con sabanas antrópicas y matorrales. Esto lo hace un territorio sujeto a

degradación, con pocas vías de accesos, y aunque es una zona valiosa en recursos naturales,

carece de inventarios adecuados, precisos y actualizados, que apoyen la realización de planes

para regular su uso y conservación. El suelo es un ejemplo de estos recursos y no escapa de

esta problemática, ya que para realizar un estudio de los mismos se requiere una importante

cantidad de observaciones de campo y bien distribuida espacialmente, lo cual es muy

dificultoso, costoso y demanda una importante inversión en recurso humano y tiempo.

Para tratar de solventar esta problemática los investigadores de suelos se han venido apoyando

en buena medida en herramientas como la informática, la teledetección y en los sistemas de

información geográficas. Ellos permiten la captura, manejo y análisis de abundante

información de aspectos ambientales geográficamente localizados, que en otros tiempos era

casi imposible realizar. Aunado a estas herramientas, el desarrollo de aplicaciones

informáticas han venido perfeccionando técnicas de mapeo de suelos como la inteligencia

artificial, donde se destacan las redes neuronales artificiales (RNA) y la lógica borrosa o

difusa (LB) y también la estadística y geoestadística con modelos de regresión e interpolación

(regresión-kriging). Dichas técnicas tienen la bondad de manejar e integrar variables de

factores formadores de suelo creando modelos matemáticos que permiten predecir y estimar

las características de los suelos en sitios donde no se ha podido llegar por su limitado acceso.

En buena medida, estos modelos neuro-borrosos y de regresión-kriging, son especialmente

eficientes en interpretar factores formadores como el relieve y la vegetación, prediciendo

cambios en el suelo asociados a formas de terrenos y coberturas vegetales diferentes. A su vez,

especialmente la vegetación refleja cambios del balance hídrico (clima) y de la naturaleza de

los materiales originarios. Todos los anteriores factores de formación son considerados claves

para una buena cartografía de los suelos en regiones de montañas.

Particularmente la cuenca del Rio Canoabo es un ejemplo de un área montañosa con función

estratégica de reservorio de agua y suplencia de este recurso a un número importantes de

poblaciones al Nor-Oeste del estado Carabobo. En ella se han realizados diversos estudios

agroecologicos, incluyendo un mapa de suelos convencional. Sin embargo, algunas partes de

la cuenca, principalmente de difícil acceso por su relieve escarpado y vegetación boscosa,

requieren de precisar algunas características de sus suelos, mejorando por ende su calidad. Es

por eso que en este trabajo se desea aplicar técnicas más avanzadas y actualizadas de

2

cartografía digital y comparar su fiabilidad con un mapa original realizado con técnicas

convencionales.

Finalmente en bueno señalar que la cuenca ha venido presentando signos de degradación

ambiental a consecuencia de factores antrópicos y naturales. Como causas principales se

tienen la falta de cultura conservacionista, la tala, la quema, el vertido de aguas servidas a los

drenajes naturales y la carencia de estímulo para la preservación de los ecosistemas. Esto ha

provocado procesos de deforestación, erosión, sedimentación y contaminación que reducen la

capacidad productiva de las tierras y la vida útil del embalse. Las anteriores amenazas ponen

en riesgo la estabilidad del medio y comprometen los servicios ambientales que presta la

cuenca, tales como la producción de agua, el intercambio gaseoso (producción de oxígeno y

captura de CO2), el resguardo de la flora y la fauna, la belleza paisajística, la producción de

alimentos y el establecimiento de poblaciones. De allí la necesidad de un estudio más preciso

donde el suelo es clave para la formulación y la puesta en marcha de planes de regulación de

uso y conservación.

3

2. HIPOTESIS

Las metodologías de cartografía digital basados en inteligencia artificial y geoestadisticas,

tales como las redes neuronales, lógica difusa, regresión y kriging, permiten, a través del

manejo y análisis de los factores de formación pertinentes, predecir la ocurrencia de los suelos,

los cuales en zonas montañosas podrían generar mapas más precisos y rápidos que con el

método convencional.

3. OBJETIVO GENERAL

Comparar dos metodologías de cartografía digital, una basada en tecnologías neuro-borrosa y

la otra empleando métodos de regresión-kriging, frente a un mapa de suelos elaborado

convencionalmente en la cuenca del Rio Canoabo del estado Carabobo.

4. OBJETIVOS ESPECIFICOS

4.1. Cartografiar digitalmente las clases fisiográficas como clases tentativas de suelos en la

cuenca del Rio Canoabo, empleando una combinación de métodos de inteligencia

artificial como son las redes neuronales y la lógica difusa (neuro-borroso).

4.2. Cartografiar digitalmente las propiedades de los suelos de la cuenca del Rio Canoabo

empleando la metodología estadística y geoestadistica denominada “regresión-kriging”.

4.3. Comparar estadísticamente los mapas de clases tentativas de suelos y propiedades de los

suelos, obtenidos en los objetivos anteriores con un mapa de suelos realizado con

anterioridad de manera convencional.

4

5. REVISIÓN DE LITERATURA

Es frecuente en el país que las montañas carezcan de estudios de suelos adecuados, precisos y

actualizados, debidos principalmente a que un estudio edáfico requiere una buena cantidad de

observaciones de campo que estén bien distribuidas. Esto tiende a ser dificultoso, costoso y

demandante de esfuerzo humano y tiempo. Para tratar de solventar esta situación los agrologos

se han venido apoyando en técnicas digitales de mapeo de suelos, como son la inteligencia

artificial, donde destacan las redes neuronales artificiales (RNA), la lógica borrosa o difusa

(LB) y también la estadística y geoestadística con modelos de regresión e interpolación

(regresión-kriging). Dichas técnicas tienen la bondad de manejar, integrar y analizar variables

de factores formadores de suelo, a partir de modelos matemáticos que permita predecir las

características de los suelos en sitios donde no se ha podido llegar por su limitado acceso.

Motivado por lo anterior, en esta sección, se realiza una breve revisión de literatura sobre las

técnicas de inteligencia artificial, estadística y geoestadistica y su aplicación en estudios de

suelos.

5.1. INTELIGENCIA ARTIFICIAL

Esta revisión de literatura sobre inteligencia artificial especialmente en redes neuronales y

lógica borrosa, pretende investigar sobre técnicas de clasificación que permitan agrupar

valores de atributos topográficos en función de su similitud y producir clases fisiográficas o

clases tentativas de suelos expresadas en mapas de su distribución y variabilidad espacial. En

donde cada objeto (o píxel) puede presentar cierto grado de pertenencia a diferentes clases.

A lo largo del tiempo han existido diferentes definiciones de inteligencia artificial, algunas

son.

Charniak y McDermott, (1985) la definieron como “El estudio de las facultades mentales

mediante el uso de modelos computacionales”.

Se podría decir que la inteligencia artificial es la rama de la informática que desarrolla

procesos que imitan a la inteligencia de los seres vivos. La principal aplicación de esta ciencia

es la creación de máquinas para la automatización de tareas que requieran un comportamiento

inteligente; es decir, se basa en un conjunto de algoritmos cuyo objetivo es imitar el

razonamiento humano a través de una lógica deductiva o manipulación de símbolos (Martín

del Brío y Sanz, 2007).

Dentro de la Inteligencia artificial se encuentran algunas técnicas como las redes neuronales

(RNA) y la Lógica Borrosa o difusa (LB), las cuales están inspiradas en las soluciones que la

5

naturaleza ha encontrado durante millones de años de evolución a numerosos problemas que

toman en cuenta el tratamiento de cantidades masivas de información, redundante, imprecisa y

ruidosa (Martín del Brío y Sanz, 2007).

5.1.1. Redes neuronales

5.1.1.1. Definición de redes neuronales

Las llamadas redes neurales o modelos conexionistas son sistemas informáticos reticular (de

inspiración neuronal) que aprende de la experiencia mediante la auto-modificación de sus

conexiones. Ellos han venido progresando desde mediados de los años ochenta empleándose

como herramientas de predicción y clasificación (Hectht-Nielsen, 1987; Hilera y Martínez,

1995).

Una red neuronal artificial es un sistema de procesamiento de información que tiene ciertas

aptitudes en común con las redes neuronales biológicas como: el procesamiento de

información ocurre en muchos elementos simples llamados neuronas, las señales son

transferidas entre neuronas a través de enlaces de conexión, cada conexión tiene un peso

asociado, el cual, típicamente multiplica a la señal transmitida y finalmente cada neurona

aplica una función de activación (usualmente no lineal) a su entrada de red (suma de entradas

pesadas) para determinar su salida (Fausett, 1994).

5.1.1.2. Características de las redes neuronales

Los principios y características de las redes neuronales artificiales, que la capacitan para poder

resolver problemas complejos son citados por Hilera y Martínez, (1995):

Aprendizaje adaptativo: Su comportamiento es en función de un entrenamiento con una serie

de ejemplos ilustrativos. Es adaptativa porque puede modificarse constantemente con el fin de

adaptarse a nuevas condiciones de trabajo.

Auto organización: Mientras que el aprendizaje es un proceso donde se modifica la

información interna de la red neuronal artificial, la auto organización consiste en la

modificación de la red completa con el fin de llevar a cabo un objetivo específico. La red

puede responder a datos o situaciones que no ha experimentado antes, pero que puede inferir

sobre la base de su entrenamiento. Esta característica es muy útil sobre todo cuando la

información de entrada es poco clara o se encuentra incompleta.

Tolerancia a fallos: Las redes neuronales artificiales poseen una alta capacidad de tolerancia a

fallos. Se entiende por ello que las redes pueden reconocer patrones de información con ruido,

distorsión o incompletos, pero que, además, pueden seguir trabajando aunque se destruya parte

6

de la red. La explicación se encuentra en que mientras la computación tradicional almacena la

información en espacios únicos, localizados y direccionales, las redes neuronales lo hacen de

forma distribuida y con un alto grado de redundancia.

Operación en tiempo real: Las redes neuronales artificiales reconocen patrones en tiempo real,

debido a que trabajan en paralelo actualizando todas sus instancias simultáneamente.

Fácil inserción en la tecnología existente: Es relativamente sencillo obtener chips

especializados para redes neuronales que mejoran su capacidad en ciertas tareas

5.1.1.3. Ventajas de las redes neuronales

Las RNA no son la panacea que permite resolver todos los problemas, sino que están

orientadas a un determinado tipo de tareas. Podemos destacar tres características del problema

que hacen aconsejable la utilización de las RNA (Martín del Brío y Sanz, 2007): a) que no se

disponga de un conjunto de reglas sistemáticas que describan completamente el problema, b)

que los datos a emplear sean imprecisos, incoherentes o con ruido y c) el problema es de

elevada dimensionalidad, es decir, el número de variables de entrada es demasiado grande

como para que un modelo convencional aprenda a solucionar el problema en un tiempo

razonable. Cuando no se dan estas circunstancias puede ser más aconsejable optar por

solucionar el problema mediante un modelo derivado de la estadística. Por tanto, no debemos

concebir las RNA como una alternativa, sino más bien como un complemento a los modelos

convencionales ya establecidos. Otras ventajas consisten en la habilidad de las neuronas de

calcular funciones de salida no lineales, lo cual capacitan a la red para resolver problemas

complejos o no lineales y, es por esto que en numerosas aplicaciones se consiguen RNA con

errores mucho menores que los proporcionadas por la estadística. (Palmer, 1999).

5.1.1.4. Desventajas de las redes neuronales

Con respecto a las limitaciones que presentan las redes neuronales artificiales, una de las más

importantes consiste en que, es difícil comprender la naturaleza de las representaciones

internas generadas por la red para responder ante un problema determinado. Es decir, no

sabemos cómo el sistema interrelaciona las diferentes variables de entrada con los pesos de las

conexiones entre neuronas para elaborar una solución (Rzempoluck, 1998). Esta limitación

contrasta con los diferentes modelos estadísticos, los cuales permiten observar los parámetros

o pesos relativos que el modelo otorga a cada una de las variables que intervienen en el

modelo.

7

5.1.1.5. Modelo o estructura de un sistema neuronal artificial

Un sistema neuronal se compone de los siguientes elementos: conjunto de neuronas, patrón de

conexiones (arquitectura) y aprendizaje.

a) La neurona

El primer modelo de red neuronal fue propuesto en 1943 por McCulloch y Pitts en función de

un modelo computacional de actividad nerviosa. Este modelo era un modelo binario, donde

cada neurona tenía un umbral prefijado, y sirvió de base para los modelos posteriores.

Por su parte Martin del Brio (1995), menciona que la neurona es un dispositivo simple de

cálculo que, a partir de un vector de entradas x(t) provenientes del exterior o de otras

neuronas, proporciona una única respuesta o salida yi(t). Los elementos esenciales que

constituyen la neurona de etiqueta i son los siguientes:

• Un conjunto de entradas xj(t) y de pesos sinápticos wij.

• Una regla de propagación hi(t) = s(wij, xj(t)).

• Una función de activación yi(t) = fi(yi(t-1), hi(t)), que proporciona su salida yi(t).

Las entradas xj(t) y salidas de la neurona artificial pueden ser binarias o continuas,

dependiendo del modelo y de la aplicación.

La regla de propagación hi(t), a partir de las entradas de la neurona y de sus pesos

proporciona el valor del potencial postsináptico. La regla más habitual es lineal, llevando a

cabo la suma de las entradas ponderada con los pesos sinápticos. A esta expresión se suele

añadir un parámetro adicional i denominado umbral (θ)

La función de activación o de transferencia f(.) proporciona a partir del potencial postsináptico

hi(t) y del estado de activación anterior de la neurona yi(t-1), su estado de activación actual

yi(t). Las formas funcionales más empleadas en las redes neuronales son la función identidad

(función lineal) y la escalón, empleada en la neurona original de McCulloch yPitts (1943).

Teniendo en cuenta las consideraciones anteriores, el modelo de neurona estándar suele

escribirse (Ver figura 1) de la siguiente manera:

8

Figura 1. Modelo de neurona estándar.

b) Arquitectura de redes neuronales

Las neuronas que componen una red neuronal se organizan de forma jerárquica formando

capas. Una capa es un conjunto de neuronas cuyas entradas de información provienen del

exterior o de otra capa de neuronas y cuyas salidas de información se dirigen al mismo destino

(que puede ser otra capa de neuronas). En este sentido, se distinguen tres tipos de capas: la

capa de entrada recibe la información del exterior; las capas ocultas son aquellas cuyas

entradas y salidas se encuentran dentro del sistema y, por tanto, no tienen contacto con el

exterior; finalmente, la capa de salida envía la respuesta de la red al exterior (Hilera y

Martínez, 1995; Palmer, 1999).

Dependiendo de la estructura de la red neuronal existen varias tipologías, algunas de estas son:

Perceptrón (McCulloch y Pitts, 1943); Propagación hacia atrás (backpropagation) (Rumelhart,

1986) la más ampliamente empleada en la actualidad; Mapas Autoorganizados (Kohonen,

1982), esta última combinada con la lógica borrosa conforma el fundamento conceptual de las

redes neuro-borrosas. (Valera y Viloria, 2009).

c) Aprendizaje de la red neuronal

La fase de aprendizaje es el proceso por el cual una red neuronal modifica sus pesos en

respuesta a una información de entrada. Los cambios durante el aprendizaje se reducen a la

modificación y creación de conexiones entre neuronas (Haykin, 1994).

Se pueden describir dos tipos básicos de aprendizaje, el supervisado y el no supervisado.

Aprendizaje supervisado. En este tipo se presenta a la red un conjunto de patrones, junto con

la salida deseada u objetivo. La red iterativamente ajusta sus pesos hasta que su salida tiende a

9

ser la deseada, utilizando para ello información detallada del error que en cada paso comete.

De este modo, la red neuronal es capaz de estimar relaciones entrada/salida sin necesidad de

proponer una cierta forma funcional de partida. El Aprendizaje no supervisado o

autoorganizado. Es donde se le presentan a la red multitud de patrones, pero sin adjuntar la

respuesta deseada. El sistema, por medio de la regla de aprendizaje definida, debe reconocer

en ellos regularidades, extraer rasgos, estimar densidades de probabilidad o agruparlos según

su similitud (Martin del Brio, 1995).

5.1.1.6. Mapas auto organizados (SOM) de Kohonen.

Este modelo (SOM) surge ante la curiosidad de Teuvo Kohonen, interesado en comprender la

clasificación natural que hace el cerebro en cuanto a su funcionalidad (Kohonen, 1997).

Los SOM, son una técnica de clasificación no supervisada, que permite: (1) agrupación de un

conjunto de píxeles con valores de atributos topográficos en función de su similitud, (2)

producción de unidades morfométricas con el centro de las clases, para cada unidad generada,

(3) cálculo de estimados de la distancia relativa entre cada cluster, y (4) la representación

bidimensional de la clasificación en forma de un mapa que muestra la distribución espacial de

las clases morfométricas con valores y variabilidad espacial similar (Klein et al, 2007).

5.1.1.7. Las Redes neuronales en estudio de clasificaciones ambientales.

Existen pocos trabajos aplicando redes neuronales en la evaluación de la distribución espacial

de suelos y formas de terreno. A continuación algunos de interés.

Zhu (2000) realizó una investigación en el bosque experimental de Lubrecht al occidente de

Montana, EEUUAA, para evaluar la utilidad de las redes neuronales en el diseño de un

modelo de similitud sobre la variación espacial de propiedades del suelo. El enfoque empleó

una red neuronal de Perceptron Multicapa; las seis variables de entradas fueron altitud, grado

de pendiente, orientación, cobertura vegetal, perfil de curvatura y la formación geológica, y la

salida de la red fue un conjunto de valores de similitud para un grupo de clases de suelos

existentes. El autor empleo el programa NEURAL entrenado utilizando un algoritmo de

gradiente conjugado en combinación con una técnica de simulación, para el aprendizaje de las

relaciones entre el conjunto de suelos existentes y sus factores ambientales. Una vez

entrenadas, las RNA fueron utilizadas para computarizar en cada localización de un área la

similitud de los valores del suelo para el grupo de clases de suelos existentes. El estudio

demostró que la información espacial de suelos derivada del enfoque red neuronal revela un

gran detalle espacial y tiene una calidad mayor que la derivada de mapas de suelos

convencionales. Para validar la exactitud de la prueba se aplicó el coeficiente kappa obtenido

de la matriz de confusión, y los resultados indicaron que la red neuronal obtuvo un porcentaje

10

de aciertos del 77%, clasificando de forma correcta 49 de 52 puntos, lo cual mejora la cantidad

de aciertos obtenidos en un estudio anterior realizado por Zhu (1997), en donde se utilizó una

metodología basada en el conocimiento de expertos. La ventaja de utilizar el enfoque de RNA

sobre el enfoque basado en el conocimiento es que las primeras no están limitadas por la

disponibilidad de edafólogos expertos en un área determinada.

5.1.2. La Logica borrosa o difusa.

La teoría de conjuntos borrosos fue introducida por Lotfi A. Zadeh en 1965, y en ella reside la

idea de que los elementos clave en el pensamiento humano no son números, sino etiquetas

lingüísticas. Estas etiquetas permiten que los objetos pasen de pertenecer de una clase a otra de

forma suave y flexible. En un conjunto clásico se asigna el valor 0 ó 1 a cada elemento para

indicar la pertenencia o no a dicho conjunto. Esta función puede generalizarse de forma que

los valores asignados a los elementos del conjunto caigan en un rango particular, y con ello

indiquen el grado de pertenencia de los elementos al conjunto en cuestión. Esta función se

llama “función de pertenencia” y el conjunto por ella definida “Conjunto Borroso”. La función

de pertenencia μA

por la que un conjunto borroso A se define, siendo [0, 1] el intervalo de

números reales que incluye los extremos, tiene la forma:

μA=X→[0, 1]

Es decir, mientras que en un conjunto clásico los elementos pertenecen o no pertenecen a él

totalmente, en los conjuntos borrosos hay grados de pertenencia en referencia a un universo

local. Las funciones de pertenencia más comunes son: GAMMA, LAMBDA y Pi o

trapezoidal.

Pérez (2005) cita algunas de las situaciones donde se puede aplicar la lógica borrosa y algunas

de sus aplicaciones

• En procesos complejos, si no existe un modelo de solución sencillo.

• Cuando haya que introducir la experiencia de un operador “experto” que se base en

conceptos imprecisos.

• Cuando ciertas partes del sistema a controlar son desconocidas y no pueden medirse de

forma fiable (con errores posibles).

• Cuando el ajuste de una variable puede producir el desajuste de otras.

• En general, cuando se quieran representar y operar con conceptos que tengan

imprecisión o incertidumbre.

11

5.1.2.1. La Lógica borrosa en estudios de clasificaciones ambientales.

Algunos estudios de lógica borrosa en esta materia son los siguientes:

Irvin et al. (1997), utilizaron el método de clasificación de conjuntos borrosos, mediante el

algoritmo fuzzy k-means (FCM) y técnicas de clasificación no supervisada (ISODATA), para

clasificar el paisaje de un área estudio al Sur-Oeste de Wisconsin, EEUUAA. Cada pixel se

agrupo de acuerdo a su grado de membresía en una clase de forma de terreno. Estas clases

fueron determinadas por agrupamiento natural de los datos en el espacio. Los atributos

utilizados para la clasificación fueron la altitud, pendiente, plano y perfil de curvatura, índice

de humedad y radiación solar. La clasificación ISODATA asigna los píxeles a una clase,

mientras que el conjunto borroso asigna una clase de membresía a cada píxel. Estos métodos

de clasificación pueden proporcionar utilidad para el análisis estadístico y para la

determinación de esquemas de muestreo. Los métodos de clasificación numérica proporcionan

una alternativa a la utilización de fotografías aéreas para la delineación manual de formas de

terreno, ya que éste es un proceso subjetivo que requiere mucho conocimiento del paisaje en

estudio. Los autores concluyeron que el método dividió el paisaje en clases significativas que

también fueron espacialmente coherentes.

Zhu et al. (2001) aplicaron la lógica borrosa para desarrollar un modelo de similitud de

inferencia suelo-paisaje. A partir de dicho modelo se establecieron un conjunto de técnicas de

inferencia automatizada para la cartografía de los suelos y demostraron que el modelo borroso

de inferencia suelo-paisaje es más ventajoso que el enfoque convencional de estudio de suelos.

Los autores concluyeron que la calidad de la información edáfica derivada del modelo borroso

de inferencia fue muy cercana a la realidad, en cuanto a nivel de detalle espacial y grado de

precisión de los atributos. Además, el modelo permitió mejorar la eficiencia del estudio de

suelos y las actualizaciones subsecuentes a través de la disminución de tiempo y costo. Sin

embargo, el grado de éxito del modelo borroso de inferencia suelo-paisaje depende

mayormente de la disponibilidad y calidad de los datos ambientales, y la calidad del

conocimiento de las relaciones suelo-ambiente en el área de estudio.

Klingseisen et al. (2007) realizaron un análisis geomorfométrico del paisaje utilizando un

enfoque SIG semi-automatizado, al occidente de Australia. Ellos emplearon el software

LANDFORM para la clasificación de la forma del terreno (crestas, áreas planas, depresiones y

laderas), basado en atributos topográficos como la curvatura o el percentil de elevación. En la

evaluación se utilizó un algoritmo de conjuntos borrosos para comparar la similitud entre el

mapa generado por el programa LANDFORM y la foto-interpretación visual dirigida por un

experto sobre la misma área. Los resultados arrojaron que debido a la transición gradual en la

que ocurren las formas de terreno dentro del paisaje, el enfoque borroso proporcionó un medio

12

excelente para evaluar el grado de concordancia entre las categorías de formas de terreno

derivados con el software LANDFORM, en comparación con las clases definidas por un

experto en interpretación de fotografías aéreas, método tradicionalmente aplicado al

levantamiento de suelos. Considerando la similitud entre categorías, los mapas mostraron una

similitud promedio de 62,9 % y la discordancia fue principalmente localizada en las zonas

planas y áreas de pendientes simples dónde el foto-interpretador manifestó el mayor grado de

dificultad para separarlas claramente.

5.1.3. Sistemas neuroborrosos (Redes neuronales y lógica borrosa).

La integración de redes neuronales auto organizadas (SOM) (Mapas auto organizados de

Kohonen) y los conjuntos borrosos c-medias (FCM) han dado paso a un modelo denominado

red de agrupamiento borroso de Kohonen (FKCN, Fuzzy Kohonen Clustering Net) (Lin y Lee,

1996). Esto ha sido posible debido a que ambas técnicas se basan en el procesamiento de

cantidades masivas de información, redundante, imprecisa, incierta y con ruido. Por lo tanto,

ambos enfoques son útiles para modelar procesos complejos no lineales (Martín del Brío y

Sanz, 2007). Además este modelo trata de superar las desventajas de ambas técnicas,

combinando la capacidad de aprendizaje y adaptación de las redes neuronales y el poder de la

interpretación lingüística de la lógica borrosa durante el proceso de clasificación, en las cuales

cada objeto (o píxel) puede presentar cierto grado de pertenencia a diferentes clases. (Valera y

Viloria, 2009) y (Viloria 2007).

Son escasos los trabajos de investigación que tomen en cuenta la combinación de las dos

técnicas de inteligencia computacional mencionadas. En Venezuela, se ha dado un paso

importante en la utilización de tecnologías de inteligencia artificial computacional en el área

de clasificación de paisajes y predicción de atributos del suelo con los trabajos de Viloria

(2007).

Viloria (2007) desarrolló un sistema clasificador del terreno por Fuzzy Kohonen, el cual

permite predecir atributos del suelo por medio de clasificaciones digitales del paisaje. El

estudio se realizó con datos derivados de una imagen satelital y un modelo digital de elevación

(MDE) de un sector de la cuenca del Río Caramacate, estado Aragua. A partir de estos datos

se clasificó el paisaje del área de estudio por medio de tres modelos de redes neuronales: una

red de agrupamiento borroso de Kohonen (FKCN) y dos mapas auto organizados (SOM)

unidimensional con distintas funciones de vecindad. El estudio reveló que el mejor modelo

correspondió al FKCN. Este modelo constituye una representación continua del paisaje en dos

sentidos: primero, porque el paisaje es representado por una matriz de píxeles y segundo

13

porque la clasificación de cada píxel es borrosa, representada por un vector de membresía para

diferentes clases.

Valera y Viloria, (2009), utilizaron un procedimiento geomorfométrico, a partir del análisis de

atributos topográficos en la cuenca del Río Güey, y realizaron una clasificación no supervisada

basada en una red de agrupamiento borroso de Kohonen (FKCN). Este método emplea un

conjunto de algoritmos computarizados que automáticamente permitió la extracción y la

clasificación de propiedades morfométricas de un modelo digital de elevación (MDE) y de

imágenes de satélite. En este sentido, se realizaron evaluaciones de MDE de diferentes

resoluciones espaciales (8, 10, 15 y 20 m) mediante un sistema clasificador del terreno por

Fuzzy Kohonen, y se obtuvo un promedio de 11 clases morfométricas con la utilización de 9

atributos topográficos y el índice de vegetación normalizado (NDVI). Estos resultados indican

que el enfoque neuro-borroso permite una rápida estimación de la distribución espacial de

unidades de terreno homogéneas morfológicamente mediante la clasificación de píxeles, cuya

representatividad depende de la resolución espacial del MDE empleado. Estas herramientas de

inteligencia artificial aparte de ser rápidas y precisas, son de gran apoyo y utilidad para las

clasificaciones cualitativas realizadas por los expertos.

Viloria et al. (2011), realizaron una clasificación cuantitativa de unidades de paisaje mediante

la aplicación de técnicas de inteligencia artificial en paisajes montañosos venezolanos, ellos

seleccionaron dos cuencas hidrográficas (Río Güey y Río Caramacate). En la evaluación se

utilizó el procedimiento geomorfométrico a partir del análisis de atributos topográficos e

índices derivados del MDE e imágenes satelitales. Emplearon una clasificación no supervisada

utilizando una red de agrupamiento borroso de Kohonen (FKCN) que permitió

automáticamente la extracción y clasificación de propiedades morfométricas. Los resultados

indicaron que el enfoque neuro-borroso permite una rápida estimación de la distribución

espacial de unidades de terreno homogéneas morfológicamente mediante la clasificación de

píxeles, constituyendo una importante alternativa de apoyo al experto para la definición de

unidades geomorfológicas, planificación del muestreo de suelos, predicción de propiedades

edáficas y estudio de las relaciones suelo-paisaje.

5.2. REGRESIÓN–KRIGING

La finalidad de esta revisión de literatura sobre el método de regresion-kriging busca conocer

los fundamentos de este método cartográfico y saber sus bondades sobre la predicción y

mapeo de propiedades de los suelos.

14

5.2.1. Características y cálculos del método de regresion-kriging.

Odeth et al, (1994), describe el método de regresión-kriging como una combinación de

técnicas estadísticas y geoestadisticas, cuya función es predecir propiedades de los suelos en

lugares no conocidos a partir de variables ambientales e información de suelos de sitios

muestreados. Este método combina el modelo paramétrico de regresión lineal múltiple y la

técnica de interpolación kriging.

El método regresión-kriging se enmarca en el modelo suelo-paisaje, el cual ha sido descrito

por diferentes autores como Jenny, (1941); Burrough y McDonnell, (1998) y McBratney et al

(2003), y se refiere al modelado de las propiedades del suelo como función de variables del

paisaje (ambientales) localizadas en el espacio. Este modelo permite modelar y comprender

como las propiedades de los suelos se distribuyen espacialmente y cambian de acuerdo con las

variaciones en las variables ambientales que representan los factores de formación de los

suelos. También permite incorporar la dependencia espacial de las propiedades.

De acuerdo con la teoría de las variables regionalizadas, la variación espacial puede ser

descompuesta en tres (3) componentes: la tendencia global (Sx,y), la tendencia local

estructurada (lx,y) y el ruido residual aleatorio (). Así, en la estructura del modelo suelo-

paisaje, la estimación de una propiedad del suelo (Sx,y) en un lugar no visitado se hace

mediante la adicción de los tres componentes que describen su variación espacial, quedando la

siguiente ecuación (Burrough y McDonnell, (1998) y McBratney et al (2003)):

Sx,y = gx,y + lx,y +

gx,y es una función/relación determinística que representa la tendencia espacial global entre la

propiedad del suelo (Sx,y) y las covariables ambientales (Fx,y), el método de regresión lineal

múltiple se utilizan para tratar este componente, es decir:

gx,y = (Fx,y)

lx,y es una función/relación estocástica que representa la tendencia espacial local observada en

la propiedad del suelo (Sx,y), después de considerar o modelar la tendencia espacial global

(gx,y), los métodos geoestadisticos se utilizan para tratar este componente.

Y representa los residuos espacialmente independientes después del modelado de las

tendencias espaciales globales y locales. En otras palabras, son los residuos del modelo.

Por ende el cálculo se inicia con la tendencia global gx,y, a través de la regresión lineal múltiple

donde una propiedad del suelo es función de las covariables ambientales, como se puede ver

en la ecuación siguiente:

15

𝑌 = (𝑋) +

Dónde: Y depende de X; Y constituye la variable dependiente y X son las variables

independientes; representa los errores del modelo, es decir, la variación en Y que no se

explica por X.

Como Y es función de varias covariables entonces la ecuación quedaría:

𝑌 = 𝛽0 + ∑ 𝛽𝑖𝑥𝑖 + 𝜀

𝑛

𝑖=1

𝑌 = 𝛽0 + 𝛽𝑖𝑥1 + 𝛽2𝑥2 + ⋯ + 𝛽𝑛𝑥𝑛 + 𝜀

Los parámetros () constituyen los coeficientes de regresión y se ajustan basándose en algún

criterio de minimización de errores, como la suma de residuos al cuadrado. McBratney et al

(2003); Odeth et al (1994).

Los supuestos que debe cumplir la regresión lineal múltiple incluyen: independencia de los

valores de Y; linealidad entre las variables Y y X; falta de multicolinealidad en las variables

X; ausencia de valores atípicos; independencia de los errores del modelo (); normalidad de ;

la media de debe ser 0; homocedasticidad (varianza constante) de en relación con las

variables Y y X. McBratney et al (2003); Odeth et al (1994).

Del cálculo anterior se obtiene los residuos que serán interpolados en el siguiente paso,

mediante geoestadistica, la cual estudia la dependencia estadística para propiedades

representadas en el espacio. Se traduce en que una propiedad se correlaciona consigo misma

(auto correlación espacial) o con otra variable (correlación cruzada) en el espacio. Auto

correlación espacial positiva significa que las observaciones que están juntas son más

similares que las observaciones más separadas. Suponiendo que una variable aleatoria este

espacialmente auto correlacionado, la hipótesis intrínseca permite representar su variación

espacial solo como función de la distancia de separación o lag (h). (Goovaerts, (1997); Chiles

y Delfiner (1999) y Webster y Oliver (2007).

El cálculo continuo con el estudio de la semivarianza (y), la cual es una medida de la

disimilitud espacial entre puntos separados por una cierta distancia (h), esta se calcula como

una función de h, donde h es la distancia entre pares de puntos en el espacio. (Webster y

Oliver (2006).

𝑦(ℎ) = 1

2𝑛(ℎ)∑ {𝑧(𝑥𝑖) − 𝑧(𝑥𝑖 + ℎ)}𝑛(ℎ)

𝑖=12

16

Para caracterizar aún más la dependencia espacial y permitir el cálculo de pesos para la

interpolación (kriging), se debe ajustar una función o modelo en el semivariograma, esto

constituye el semivariograma ajustado, lo que se puede hacer visualmente, por ensayo y error,

por mínimos cuadrados o por máxima verosimilitud. (Webster y Oliver (2006).

Luego se interpola con kriging los residuos, que significa estimar el valor de los residuos de

un propiedad de los suelos en una ubicación no visitada basado en valores de datos de

ubicaciones circundantes, el valor estimado es la suma ponderada de los valores de los puntos

cercanos, donde los pesos por lo general disminuyen con la distancia de separación, el método

de interpolación en regresión-kriging es estocástico. Todos los estimadores kriging son

variantes de esta fórmula (Goovaerts, (1997):

𝑧(𝑥0) − 𝑚(𝑥0) = ∑ 𝑖{𝑧(𝑥𝑖) − 𝑚(𝑥𝑖)}

𝑛

𝑖=1

Dónde: z(x0) y z(xi) son los valores en la ubicación objetivo y en las ubicaciones cercana,

respectivamente; m(x0) y m(xi) son los valores esperados (medias) de z(x0) y z(xi); n es el

número de observaciones en una vecindad local usados para estimar z(x0); y son los pesos,

derivados de la función de semivariograma ajustado.

Finalmente se restan los cálculos de la regresión lineal múltiple (tendencia global – gx,y) y los

residuos interpolados por kriging (tendencia local - lx,y), según la formula siguiente y se

obtiene los mapas de la propiedad de interés (Sx,y). McBratney et al (2003); Odeth et al (1994).

Sx,y = gx,y + lx,y +

5.2.2. El método de regresión-kriging en estudios ambientales.

Existen pocos trabajos investigativos empleando este método que combina análisis estadísticos

de regresión lineal múltiples y geoestadística (kriging), a continuación algunos de ellos.

Odeh et al. (1994), sugirieron que el modelo digital de elevación (MDE) proporcionan una

buena manera de derivar la forma del relieve, el cual es un atributo que puede utilizarse para la

predicción del suelo. Ellos compararon diferentes técnicas geoestadísticas de kriging y

cokriging (regresión múltiple lineal, kriging ordinario, kriging universal, Cokriging y

regresion-kriging) para predecir cuatro propiedades del suelo. Los resultados arrojaron que el

método de regresión-kriging obtuvo el menor error medio cuadrático. Todos los métodos que

implican kriging-covariables (atributos de forma de relieve) tienen un efecto más suavizado en

17

los valores predichos, reduciendo así al mínimo la influencia de los valores atípicos en el

rendimiento de la predicción. Los métodos de regresión-kriging son prometedores para

predecir propiedades con escasos puntos de suelos, a partir de observaciones densas de la

forma de relieve o atributos derivados del MDE. Los valores atípicos en el conjunto de datos,

fueron más evidentes en la regresión lineal múltiple, kriging ordinario y kriging universal que

en regresión-kriging. Hubo una clara ventaja en el uso del método de regresión-kriging, en

aquellas propiedades que tenían una pequeña correlación con la forma de relieve.

Knotters et al. (1995), compararon dos métodos de interpolación como el co-kriging y kriging

combinados ambos con regresión para estimar una propiedad. Estos dos métodos se aplicaron

para mejorar la interpolación de la profundidad de capas blandas medida a través de barreno.

Se predijo la presencia de capas blandas en los suelos a partir de observaciones utilizando un

modelo de regresión exponencial. Estas predicciones fueron tratadas como mediciones

residuos en kriging. Los resultados de este tipo de kriging se compararon con los de co-kriging

para varios espaciamientos. Las capas blandas no se detectaron dentro de la profundidad de

barreno de 1,20 m en el 10% de las ubicaciones. Se prestó especial atención a estas

observaciones de las capas blandas en el ajuste del modelo de regresión y en las

interpolaciones. Kriging combinado con la regresión dio mejores resultados que co-kriging en

la predicción de las capas blandas. Además, en regresión-kriging son menos los parámetros

del modelo necesarios para hacer la estimación.

Odeth, et al (1995), trabajaron con varios métodos para predecir espacialmente propiedades

del suelo, a partir de atributos de formas de relieve. Los métodos probados fueron kriging

ordinario, kriging universal, regresión multi-lineal, cokriging isotópica, cokriging heterotópico

y regresión-kriging. La predicción por kriging ordinario y kriging universal fue relativamente

pobre ya que los métodos no utilizan covariables predictoras como atributos del terreno.

Cokriging heterotópico superó cokriging isotópica porque el primero hace uso de la

información local de las covariables. El método de regresión-kriging funciono generalmente

bien. Tanto la regresión-kriging y heterotópico Cokriging funcionan bien cuando las variables

del suelo se predicen con un modelo digital de elevación de mayor resolución espacial y

cuando se emplea información local. La regresión-kriging funciona generalmente mejor y es,

quizás, más flexible que cokriging heterotópico.

McBratney et al (2000), mencionan en su investigación que el método hibrido de regresión-

kriging combina un modelo de regresión lineal simple o múltiple, o árboles de regresión con

kriging simple u ordinarios de los residuos de la regresión. La suposición aquí es que el

determinismo compone la ecuación para estimar la propiedad del suelo, explicada por

el modelo de regresión, mientras que los residuos del modelo representan la variable

18

espacialmente distribuida pero dependiente de la ecuación de regresión. Si las variables

exógenas utilizadas en la ecuación de regresión están disponibles más densamente que la

propiedad a estimar, la ecuación se puede usar entonces para predecir la propiedad en esos

lugares.

Hengl et al (2004). Establecieron un marco metodológico para la predicción espacial de

propiedades de los suelos, basado en el método regresión-kriging, el cual se describe y

compara con kriging ordinario y regresión simple. Las propiedades objetivos se ajustan

mediante regresión paso a paso y los residuos son interpolados utilizando kriging. Un método

de visualización genérico se utiliza para ver simultáneamente las predicciones y la

incertidumbre asociada. El marco fue probado usando 135 perfiles de suelo en Croacia,

dividido en 100 perfiles para la interpolación y 35 para la validación. Se predijeron tres

propiedades: materia orgánica, pH y espesor de la capa superior de los suelos. Se emplearon

para la estimación seis parámetros y nueve unidades cartográficas de suelos. La eficiencia de

la predicción fue evaluada usando el error medio y error cuadrático medio (RMSE) de la

predicción en los perfiles de validación. Los resultados muestran que el marco propuesto

mejora la eficiencia de las predicciones. Por otra parte, se aseguró de la normalidad de los

residuos y que los valores de predicción estuvieran dentro de la gama física de una propiedad.

La materia orgánica alcanzó el menor RMSE relativo (regresión-kriging) frente al kriging

ordinario (53,3% versus 66,5%). Para el espesor de la capa superior del suelo logró un RMSE

relativamente inferior (66,5% frente a 83,3%) y un sesgo menor que kriging ordinario (0,15

frente a 0,69 cm). La predicción de pH fue difícil con los tres métodos. Este marco

metodológico abre la posibilidad de desarrollar un algoritmo de paquetes informáticos que

puede ser implementado en SIG para interpolar datos del perfil del suelo a partir de datos

existentes.

5.3. COEFICIENTES DE CONCORDANCIA.

Lo que se pretende con esta revisión de literatura sobre índices de concordancias, es encontrar

algunas técnicas estadísticas que puedan ser útiles para realizar la comparación entre los

resultados de los métodos de cartografía digital empleados en este estudio con respecto al

mapa de suelos realizado de manera convencional.

Las técnicas más utilizadas para el análisis de concordancia entre métodos y observadores son

el índice de concordancia (Arguellos, 2013) y el coeficiente kappa de Cohen (1960).

El Índice de concordancia es la primera aproximación a la concordancia entre métodos;

resulta, por tanto, la más intuitiva. Simplemente expresa el porcentaje de acuerdo entre ellos,

19

es decir, en qué medida hubo coincidencia en la clasificación entre métodos en relación al total

de elementos examinados. El problema que plantea este índice básico es que una parte de ese

acuerdo, en principio desconocida, puede deberse exclusivamente al azar. Para eliminar la

parte que puede atribuirse solamente al azar, se dispone del coeficiente kappa elaborado por

Cohen en 1960.

El coeficiente kappa relaciona el acuerdo, más allá del debido al azar, con el acuerdo potencial

también más allá del azar. En esencia, el proceso de elaboración del índice es el siguiente: se

calcula la diferencia entre la proporción de acuerdo observado y la proporción de acuerdo

esperado por azar; si ésta es igual a cero, entonces el grado de acuerdo que se ha observado

puede atribuirse enteramente al azar; si la diferencia es positiva, ello indica que el grado de

acuerdo es mayor que el que cabría esperar si solo estuviera operando el azar y viceversa: en

el caso (ciertamente improbable) en que la diferencia fuera negativa entonces los datos

estarían exhibiendo menos acuerdo que el que se espera solo por concepto de azar. Kappa es el

cociente entre esa cantidad y el acuerdo máximo que se puede esperar sin intervención del

azar (Arguellos, 2013).

La siguiente pregunta que surge sobre el coeficiente kappa es: ¿qué valor de kappa se puede

considerar como indicador de buena concordancia? No hay una respuesta exacta; lo que se

considera adecuado o no va a depender del problema que se esté estudiando. Landis y Koch

(1977) propusieron una escala de interpretación del valor de kappa que considera como

aceptable un valor mayor o igual a 0,40 y excelentes los valores superiores a 0,75.

Algunos de los elementos del coeficiente de Kappa son la Sensibilidad y la Especificidad. La

primera se refiere a la probabilidad de que un punto de muestreo sea clasificado como X si en

realidad es X, es decir, es lo que se conoce como la proporción de verdaderos positivos. Esto

es conceptualmente similar y computacionalmente idéntico al concepto de "Precisión del

productor". Y la Especificidad es la probabilidad de que un punto de muestra no será

clasificada como X si no es X, es decir la proporción de verdaderos negativos (Jenness, 2007).

20

6. MATERIALES Y METODOS

El esquema metodológico seguido para lograr los objetivos, se puede observar en la figura 2.

Figura 2. Esquema metodológico empleado en el trabajo.

Ubicación del área de estudio

Métodos de cartografía digital de suelo

METODO NEURO-BORROSO METODO REGRESIÓN-KRIGING

Revisión de la información de

suelos.

Estimación de la propiedad a profundidad fija

(Spline)

Obtención de las covariables ambientales

Obtención de la regresión lineal

Interpolación kriging de los residuos

Obtención de los mapas finales de cada

propiedad a diferentes profundidades

Comparación de ambos métodos de

cartografía digitales con un

levantamiento convencional.

Adecuación de información empleada

Diseño del modelo digital de elevación

(DEM)

Obtención de covariables ambientales

Agrupación o clasificación neuro-borrosa

CONCLUSIONES FINALES

Caracterización del área de estudio

21

6.1. UBICACIÓN DEL ÁREA DE ESTUDIO.

El estudio se realizó en la cuenca del Rio Canoabo, localizada en la vertiente norte de la

cordillera de la costa, al Noroeste del estado Carabobo. Políticamente pertenece a la parroquia

Canoabo en el municipio Bejuma del mencionado estado. Sus coordenadas son: Ymin:

1.131.660; Xmin: 570.460; Ymax: 1.153.560 y Xmax: 587.400. En la figura 3 se puede

observar la ubicación de la cuenca con tramados diagonales.

Figura 3. Ubicación relativa del área de estudio.

6.2. CARACTERIZACIÓN DEL ÁREA DE ESTUDIO.

La cuenca posee una superficie de 14.508 ha, recorridas de Sureste a Noroeste por un estrecho

valle central, bordeado por sendas montañas cubiertas por bosques densos prístinos,

matorrales y herbazales fuertemente intervenidos. El aprovechamiento de las tierras es

mayoritariamente como conucos, siembras de café, cacao, musáceas y cítricos, además de una

incipiente ganadería, principalmente en el piedemonte. La principal función de la cuenca es

producir y reservar agua para los pobladores del eje San Pablo – Urama – Morón y Puerto

Cabello, para lo cual cuenta con el embalse de Canoabo.

Características físico-naturales relevantes dentro de la cuenca del Rio Canoabo.

Estudios realizados por Sevilla et al (2009a); Sevilla y Comerma, (2009b); Sevilla et al

(2009c) y Sevilla y Comerma, (2009d). Describieron algunas características de la cuenca.

Altura: La cuenca en su mayoría está dominada por montañas, disectadas en el centro por

un valle estrecho. Las alturas van desde 135 msnm en el Norte a 1700 msnm hacia el Sur en

los Cerros El Marquero, al Oeste (1650 msnm) y Cerro de Paja al Este con 1700 msnm.

22

Clima: En la cuenca se nota una zonalidad vertical y concéntrica, donde la temperatura

media anual va desde 16 ºC hasta 25,5 ºC, correspondiéndose las zonas frías a la parte alta

al Sur, y las temperaturas cálidas a lo largo del Valle del Río Canoabo. La evaporación

muestra un patrón bimodal con máximos en marzo y septiembre y los mínimos en febrero,

julio y diciembre. Los valores promedios mensuales van de 138 mm hasta unos 183 mm.

En cuanto a la ETo las zonas de máxima evapotranspiración (más de 1400 mm anual), son

las áreas de máximas temperaturas en el valle del Río Canoabo, y subiendo por las laderas

hacia las montañas a más de 1600 msnm en el sector de Cerro de Paja, se consiguen valores

menores a 600 mm de ETo anual. La Precipitación, se comporta muy uniforme, con

intervalos entre los 1000 y 1200 mm promedios anuales; sin embargo, se puede decir que

existen dos grandes situaciones. La primera y más frecuente representada por áreas donde

llueve entre 1115 mm y 1290 mm, que están bajo un bosque nublado a más de 800 msnm,

donde se observan diferentes efectos como: orogenia, lluvia horizontal (nubosidad),

abundante roció y frente frío del Norte. La segunda situación, corresponde a zonas más

secas, bajo bosque deciduo, ubicadas en el centro de la cuenca, donde llueve entre 1000

mm y 1038 mm. En la figura 4 se muestra que la distribución de la precipitación es

semiconcéntrica. encontrándose las zonas de mayor precipitación al Sureste en el sector

montañoso.

Figura 4. Mapa del modelo digital de precipitación media anual.

23

Meses Húmedos: Se ha considerado un mes húmedo aquel en donde la precipitación es mayor

que ½ ETo. En la cuenca la zona más húmeda se encuentra al Sur con diez a doce meses

húmedos al año, debido a su precipitación de 1200 mm, unido a su altura que va de 800 a 1700

msnm, lo que hace que este bajos las nubes gran parte del día, y las hojas, ramas y tallos,

inclusive el suelo atrapan gotas de agua de la llamada lluvia horizontal. Por último, parece

haber un importante aporte de agua por parte del rocío o condensación del agua, debido a las

bajas temperaturas nocturnas. El caso contrario son las áreas más secas, con seis meses secos

(precipitación menor que ½ Eto), ubicadas en la parte baja del valle del Río Canoabo, donde

las temperaturas son más altas y hay más evaporación. (Figura 5).

Figura 5. Mapa del modelo digital de números de meses húmedos.

Cobertura Vegetal y Uso actual: los herbazales se presentan en el 25% de la cuenca, los

bosques deciduos, semideciduos y nublados abarcan un 30%, los matorrales 19%, el uso

agrícola en un 19 %, y el resto (7%) lo ocupan áreas urbanas y el embalse (Lores, 2006).

Geología: el 83 % de la cuenca está sobre la formación Las Brisas, específicamente el

Complejo San Julián; otro 9 % yace sobre la formación Granito Guaremal, y por último un

8 % sobre la formación Peña de Mora. En ellas predominan las rocas metamórficas foliadas

de esquistos cuarzo-feldespáticos-moscovíticos del Complejo San Julián y, por otro lado,

gneises y augengneis en Peña de Mora, ambas con una edad geológica del Jurásico-

Cretácico (Palmaven, 1999).

24

Relieve y pendientes: un 68 % de la cuenca es dominada por laderas de montañas,

rodeando el piedemonte y el valle. El segundo relieve en abundancia, son las faldas de

laderas con un 14 %. Otro tipo de relieve de importancia lo constituye el piedemonte (7%),

envolviendo todo el valle central de Sur a Norte. El relieve de valle, ubicado en la parte

más baja de la cuenca ocupa un 4 %. En este último ocurren procesos de acumulación de

material aluvial y es propenso a sufrir inundaciones. El restante 7 % está dominado por

lomas y vigas. En cuanto a las pendientes, dominan los terrenos entre 20 – 45 %, abarcando

un 65 % de la cuenca. Los terrenos de 45 a 60 % de pendiente son los segundos en

extensión (10 %), ubicadas hacia el Oeste. Las tierras con más de 60 % de pendiente se

extienden el 8 % del territorio. Un 6 % de la cuenca posee pendiente moderada de 8 a 20 %,

y solo 11 % de la superficie poseen de ligera a ninguna limitación en cuanto a pendiente,

son las áreas planas del valle y el piedemonte.

Erosión: La cuenca presenta una erosión ligera a imperceptible en el 75 % de su superficie,

erosión moderada en cerca del 14 % y una erosión fuerte en un 11 %. Las áreas que tienen

ligera erosión corresponden con zonas que mantienen una mayor cobertura vegetal,

independientemente de los tipos de pendientes que predominan (figura 6). Las zonas con

erosión moderada y fuerte están asociadas a actividades antrópicas que han eliminado la

cobertura vegetal y están concentradas en el piedemonte y lomas que rodean el valle del

Rio Canoabo. La erosión fuerte está cercana al valle y tienen o han tenido actividad

ganadera promoviendo la formación de terracetas, así como importantes pérdida de suelo.

Figura 6. Mapa de Erosión actual.

25

Suelos.

Sevilla y Comerma (2009b) realizaron un estudio de los suelos de la cuenca del Río Canoabo,

fundamentado en la teoría de los factores formadores de suelo (S = f(Material parental,

Relieve, Clima, Biota, y Tiempo)), (Jenny, 1941). Dicho estudio partió de un proceso de

superposición e integración de los factores de formación, expresados por delineaciones de

paisajes, geología, cobertura vegetal, clases de pendientes, números de meses húmedos y zona

de vida, todo empleando tecnología SIG. De esta integración se conformaron las unidades

homogéneas preliminares de suelo. Seguidamente, utilizando la vialidad, los centros poblados

y la variabilidad de los suelos, se seleccionaron 50 sitios de observaciones de campo, es decir

una densidad de una (1) muestra por cada 290 ha. Según Avery (1987), esta densidad de

observaciones se corresponde con niveles de intensidad de levantamientos de suelos entre 3° y

4° orden.

Los sitios de observaciones incluyeron cortes de carretera, puntos de barrenos y calicatas. En

ellos se desarrollaron tres grandes aspectos que proporcionaron valiosa información para la

caracterización y clasificación de los suelos: (i) la descripción del entorno; (ii) descripción

morfológica del perfil del suelo y (iii) la toma de muestra para análisis de laboratorio. El

primer punto caracterizo las formaciones geológicas, paisaje, pendiente, forma de la

pendiente, microrelieve, erosión, drenaje, ocurrencia de inundaciones, cobertura vegetal y uso

actual de las tierras. En el segundo punto se describe morfológicamente el perfil del suelo,

incluyendo: la profundidad efectiva de los suelos, horizontes diagnósticos, textura,

pedregosidad, color de los suelos, presencia de moteado o gleisado, estructura, compacidad,

consistencia, actividad biológica, cantidad y tamaños de raíces y porosidad. Por último se hizo

el muestreo de suelos para luego realizar análisis en el laboratorio que arrojo información

sobre: texturas, pH, materia orgánica, cationes disponibles, y conductividad eléctrica.

Se trató en lo posible que cada unidad preliminar de suelos tuviese un punto de chequeo, sin

embargo por razones de inaccesibilidad o simplemente por cuestiones de tiempo y

presupuesto, algunas unidades carecieron del mismo. Para solventar esto se optó por un

modelo de pedotransferencia simple, basado en los factores formadores de suelos y en los

puntos ya levantados. A una unidad no chequeada se le asignó un punto caracterizado de la

unidad más cercana que poseía similares condiciones, en cuanto a vegetación, geomorfología,

la pendiente, el grado de erosión y los números de meses húmedos. Cada punto de muestreo

caracterizado contó de resultados de los análisis de laboratorio, además de su clasificación

taxonómica hasta nivel de subgrupo (USDA, 2003), y con el procedimiento de

pedotransferencia mencionado se logró asignar a la totalidad de las delineaciones del mapa de

suelo su unidad Cartográfica.

26

Los principales resultados de este estudio, se pueden ver en la figura 7 y en el cuadro 1. Donde

se manifiesta que los suelos de la cuenca son bastante uniformes. El 68 % son Haplustalfs, el

28 % son Hapludults y el restante 4 % Haplustepts. Lo anterior se debe a la uniformidad de los

materiales parentales, dominados por gneises o esquistos de similar composición y de un

grado mediano de desarrollo. Esto último evidenciado por la presencia de procesos de

acumulación de materia orgánica e iluviación de arcilla produciendo un endopedón argílico.

Lo anterior es común en el 95% de los suelos de los órdenes Alfisol y Ultisol. Estos suelos

fueron separados debido al grado de lavado o de acidificación de los suelos. Así, los Ultisoles

o Hapludults, con muy bajo contenido de bases aun a grandes profundidades, se concentran en

las zonas más húmedas del bosque nublado, mientras los Alfisoles o Haplustalfs, se

concentran en zonas más bajas y con mayor número de meses secos. Ambos suelos tienen una

distribución concéntrica, siguiendo las curvas de nivel, factor que controla en esta cuenca la

precipitación y por ende es un importante factor de formación.

En la cuenca, se presenta una clara Climosecuencia, siendo este el principal factor

diferenciador de los suelos. Esta climosecuencia se expresa, por una parte en el mayor lavado

de los suelos en las zonas más húmedas (Ultisoles) y por otra, la mayor acumulación de

materia orgánica en los suelo de climas más fríos, más húmedos y con mayor cobertura

vegetal (Humic Hapludults). Por otro lado, existen otras diferencias entre los suelos de la

cuenca, que se reflejan en los subgrupos, donde se pueden encontrar los Typic como

dominantes a excepción de los Humic o más ricos en materia orgánica que ocurren en los

sitios más altos y boscosos. Los subgrupos Inceptic y Lithic que manifiestan haber sido

erosionados y truncados en el perfil, y los subgrupos Ultic de los suelos Haplustalfs, que

reflejan un mayor grado de lavado de bases y consecuentemente un estado transicional hacia

los Ultisoles más lavados.

Como un resumen general los suelos de la cuenca son:

ácidos en superficie reflejando el material parental y el tiempo de evolución o de

lavado por la lluvia,

de profundidad mediana a alta reflejando que, a pesar de las pendientes fuertes que

predominan, los paisajes son estables, ayudado esto por la buena cobertura vegetal,

Contenidos medios de materia orgánica como reflejo de la cobertura vegetal o los usos

predominantes de pastizales o plantaciones; la principal excepción son los altos

valores y hasta lo profundo, de las zonas más altas, húmedas y de menor temperatura,

Texturas predominantemente medias (Francosas), lo cual es un reflejo de la naturaleza

y uniformidad del material parental; sólo en la partes del piedemonte más sujetas a

27

erosión hay concentraciones residuales de esqueleto grueso (grava) en superficie.

Los suelos son de colores pardos o rojizos, reflejando el material parental y la buena

condición de drenaje.

Figura 7. Mapa de suelos de la cuenca del Rio Canoabo, levantado de manera convencional.

Cuadro 1. Suelos de la cuenca del Rio Canoabo.

Clases Descripción Superficie ha

1 Laderas – bosque deciduo – complejo de Typic Haplustalfs,

Inceptic Haplustalfs y Lithic Ustorthen

1787

2 Laderas – bosque deciduo – consociación de Typic Haplustalfs 2812

3 Laderas – bosque nublado – consociación Humic Hapludults 4035

4 Laderas – bosque semideciduo – asociación Typic Haplustalfs y

Ultic Haplustalfs

3842

5 Piedemonte – bosque deciduo – asociación Typic Haplustalfs y

typic Haplustepts

1167

6 Valle – bosque deciduo – complejo de Fluventic Haplustepts,

Aquic Haplustepts y Vertic Epiaquepts

631

7 Embalse del Rio Canoabo 234

Total 14.508

28

6.3. METODOS DE CARTOGRAFIA DIGITAL DE SUELOS.

6.3.1. Método Neuro-Borroso.

6.3.1.1. Materiales.

Para la utilización del método neuro–borroso se requirió la información temática y las

aplicaciones informáticas siguientes:

a) Información temática empleada

Hojas cartográficas a escala 1:25.000 del Instituto Geográfico de Venezuela Simón

Bolívar (IGVSB), específicamente las cartas: 6547-III-NE, 6547-III-SE, 6547-II-SO,

6547-II.NO, 6546-IV-NE y 6546-I-NO.

Imágenes satelitales del sensor Landsat ETM+, concretamente las bandas 03 (rojo) y 04

(infrarrojo cercano), ambas con una resolución espacial de 30 m, descargadas de la

página de “Earth Science Data Interface (ESDI)”

(http://glcfapp.glcf.umd.edu:8080/esdi/index.jsp), tomadas el 18 de marzo del 2000.

Estas imágenes fueron geométricamente corregidas, además de modificar su resolución

espacial de 30 m a 20 m para adecuarla al resto de la información empleada.

Información de las formaciones geológicas producidas por Palmaven (1999).

b) Aplicaciones informáticas utilizadas:

Hoja de cálculo “Surfer”.

Algoritmo Fuzzy Kohonen Clustering Network (FKCN) (Viloria, 2077).

Programa de algoritmos “Fuzzy K means” (Fuzme 3.5) (Minasmy y McBratney, 2002).

Gestores de información geográfica “SAGAGIS”, “Arcview 3,2” y “ArcGis 9.2”.

Arcinfo Workstation.

6.3.1.2. Procedimientos.

Los pasos ejecutados para cartografiar las clases fisiográficas en la cuenca del Rio Canoabo,

mediante el método neuro–borroso, se describen a continuación:

a) Adecuación de la información empleada.

Toda la información fue corregida cartográficamente y estandarizada atributivamente, como se

menciona a continuación:

Georreferenciación de las hojas cartográficas, estableciendo el sistema de proyección:

Universal Transversal de Mercator (UTM), huso 19 norte y datum Regven.

29

Vectorización de los elementos geográficos de las mencionadas hojas cartográficas,

específicamente las curvas de nivel, hidrografía y perímetro de la cuenca. Para esto se

empleó el gestor de información geográfica Arcview 3.2.

Asignación de cotas a las curvas de nivel vectorizadas.

Corrección de sentido natural de drenaje de los ríos vectorizados. Para esto se empleó el

gestor de información geográfica Arcgis.

b) Diseño del Modelo Digital de Elevación (MDE).

El paso siguiente fue la generación de un modelo simplificado continuo de la superficie del

terreno que muestra las variaciones en la altura media sobre el nivel del mar, es decir, un

modelo digital de elevación (MDE). Para esto se empleó la herramienta llamada Topogrid de

Arcinfo Workstation, la cual se basa en el modelo desarrollado por Hutchinson (1988). La

resolución espacial de salida del MDE fue calculada para 10 m, 20 m y 30 m; sin embargo,

quedó como resolución de trabajo el MDE de 20 m, debido, entre varios aspectos, a estar

próxima al valor recomendado por la “regla del pulgar” de un tercio de la escala de trabajo

(1:50.000), es decir 16,7 m cercana a 20 m., además de ser la resolución intermedia que

requiere mucho menos recursos computacionales que la de 10 m, y su expresión en cuanto al

paisaje es mejor que la de 30 m (Valera y Viloria, 2009).

c) Obtención de covariables ambientales.

Para la aplicación del método neuro–borroso en la cuenca del Rio Canoabo se emplearon diez

covariables ambientales. Nueve de ellas corresponden a variables morfométricas derivadas del

MDE, y la décima es el índice de vegetación normalizado (Normalised.difference.vegetati –

NDVI (Rouse et al 1974)). Las variables morfométricas son una serie de elementos derivados

del modelo digital de elevación, la orientación de las laderas, el índice de humedad

topográficos, el área de captación, el perfil y plano de curvatura, la pendiente y el Factor LS.

Ellos pueden expresar de manera cuantitativa y en una superficie continua, la posible

influencia del relieve en las características actuales de los suelo. Ejemplo puede ser la

influencia del relieve en la acumulación de agua en los suelos, en la reducción del horizonte

superficial, en la estabilidad de los suelos, en la acumulación de materia orgánica (zonas altas

con bajas temperaturas), etc.

Para obtener estas variables morfométricas se le aplicó al MDE un conjunto de algoritmos

agrupados en la función “Basic Terrain Analysis” de la aplicación SAGAGIS. Este modelo

poseía un tamaño de celdas o pixeles de 20m x 20m. A continuación se hace una breve

descripción de cada una de las Covariables ambientales.

30

Altura sobre el nivel del mar o modelo digital de elevación (Mde20b): Este parámetro

es homólogo al MDE, el cual se genera mediante un procedimiento de interpolación

diseñado para tomar como datos de entrada las curvas de nivel, las cotas de altura, y la

hidrografía. Comúnmente se utilizan métodos de interpolación local, tales como la distancia

inversa ponderada (IDW), o interpolaciones sin perder la continuidad de la superficie, como

el Kriging y Spline (Hutchinson, 1988).

Altura sobre el canal de drenaje o altura relativa (Altitude_.above): Referida a la altura

del terreno circundante con respecto al punto más bajo, que corresponde a la red de drenaje.

Pendiente (Slope): Definido como el cambio de elevación del terreno que influye sobre las

tasas de flujo de agua y sedimento. Es decir, es el ángulo existente entre el vector normal a

la superficie en un punto y la vertical, siendo la tasa de cambio de la altitud obtenida al

realizar un desplazamiento horizontal. La pendiente corresponde a la derivada de primer

orden de la altitud. (Burrough y McDonnell, 1998). Está pendiente se calculó utilizando la

ecuación de Zeverbergen y Thorne (1987), la cual utiliza un algoritmo de diferencia finita

de segundo orden, ajustado a los cuatros vecinos más cercanos en la ventana de píxeles.

Factor LS (LS.Factor): Se generó a partir de la Ecuación Universal de Pérdida de Suelo

(USLE) de Wischmeier y Smith (1978). Investigadores como Desmet y Govers (1996), han

aplicado algoritmos de flujo, a partir de un MDE para determinar la longitud acumulada del

flujo superficial y, a partir de allí, el factor topográfico LS. Mintegui (1988) mostro que en

una aplicación de SIG se modifica la ecuación de la USLE, para áreas con relieve abrupto,

por lo cual el factor LS se asocia con un valor de “l” según la clase de pendiente derivadas

de un MDE, donde estas relaciones son convertidas en expresiones algebraicas, mediante

regresión lineal con el propósito de disponer de una función aplicable a cada pixel del

raster.

Orientación de la ladera (Aspect): Es el ángulo existente entre el vector que señala el

Norte y la proyección sobre el plano horizontal del vector normal a la superficie en ese

punto. Para el cálculo de este parámetro se utiliza una derivada de primer orden, en cuya

ecuación se identifica la dirección de la pendiente, y toma la tasa máxima de cambio en el

valor de cada celda con respecto a sus vecinos (Burrough y McDonell, 1998).

Plano y perfil de curvatura (Plan.curvature y Profile.curvature): Se puede definir

como la tasa de cambio en la pendiente en el entorno de un punto determinado y depende

de la altitud. Su cálculo se basó en el algoritmo de Zeverbergen y Thorne (1987), el cual

corresponde a la derivada de segundo orden de la altitud (Burrough y McDonnell, 1998).

Ésta es calculada por la interpolación de la superficie local que utiliza un kernel o grupos de

31

celdas de 3 x 3 del MDE, con el punto de interés en el centro y se puede dividir en sus

partes direccionales perfil de curvatura y plano de curvatura.

Índice de humedad topográfico (Wetness.Index): Representa una medida teórica de la

acumulación del flujo hídrico en cualquier punto dentro de una cuenca, lo que permite

obtener un modelo de las áreas susceptibles a desencadenar movimientos en masas;

también puede utilizarse como base para estimar la humedad del suelo en un sitio y detectar

áreas inestables, debido a los efectos topográficos superficiales sobre la respuesta

hidrológica. La metodología de cálculo es compleja y sistemática, y está compuesta por las

variables: área de captación del drenaje y pendiente local. La fórmula para calcular el

índice de humedad topográfico es la siguiente:

ù =ln (A / tan ) j

Donde, ù es el índice de humedad topográfico; A: representa el área de captación del

drenaje y j: representa la pendiente local para un punto determinado.

El índice de humedad fue determinado según la ecuación:

I Humedad = ln (Area/Pend) (Gessler et al. 1995); (Wilson y Gallant, 2000).

Área de captación (Catchment.Area): Es el área de drenaje contribuyente a un punto

específico de la cuenca y se obtuvo mediante el algoritmo de Tarboton et al. (1991), el cual

utiliza un polinomio cuadrático con nueve términos.

Índice de vegetación normalizado (Normalized.Difference.vegetati - NDVI): Esta

variable fue descrita por primera vez por Rouse et al (1974), y la misma comprueba el vigor

de la vegetación o por el contrario la débil vitalidad. Es un índice usado para estimar la

cantidad, calidad y desarrollo de la vegetación con base a la medición de la intensidad de la

radiación solar que la vegetación emite o refleja. Su ecuación es la siguiente:

𝑁𝐷𝑉𝐼 =IRCercano − Rojo

IRCercano + Rojo

Acá el NDVI se calculó en SAGAGIS, ya que esta aplicación posee este proceso

incorporado siguiendo los pasos “Modules\imagen\tools\vegetation índices\vegetation

index[slope.based], y empleando las bandas 3 (Rojo) y 4 (InfraRojo cercano).

d) Agrupación o clasificación neuro-borrosa.

El método neuro-borroso combina la potencialidad de las redes neuronales y la lógica borrosa

o difusa, desarrollando una técnica integral de clasificación no supervisada denominada red de

agrupamiento borroso de Kohonen o Fuzzy Kohonen Clustering Network (FKCN) (Bezdeck

32

et al., 1992; Lin y Lee, 1996), que conjuga un algoritmo de mapas auto organizados o self

organizing map (SOM) (Kohonen, 1982) y el algoritmo Fuzzy C-means (Bezdeck, 1981). De

esta manera, las RNA intentan construir un modelo matemático que consta de un conjunto de

funciones sencillas vinculadas por sus pesos, mientras que los métodos de clasificación

borrosa tienen la capacidad de modelar la variación continua del relieve de acuerdo con los

valores de una función de pertenencia (Viloria et al, 2011).

La agrupación borrosa de datos involucra la minimización de la suma de los errores

cuadráticos dentro de las clases de agrupamiento, bajo las siguientes condiciones: a) la suma

de las membrecías de cada objeto (en este caso celda o pixel) a las clases es a igual a uno (1);

b) la suma de las membrecías de los objetos a cada clase es mayor que cero (0) y c) la función

de membrecía pertenece al dominio cero (0) a uno (1).

El algoritmo empleado para la agrupación fue el “Fuzzy K means” (Minasmy y McBratney,

2002) disponible en el programa Fuzme, el cual utiliza una función que incluye aspectos

como: distancia cuadrática entre el valor correspondiente a los datos individuales y el vector

que representa el centroide de la clase, de acuerdo con la definición escogida de la distancia

(Euclidiana, diagonal o Mahalanobis); exponente de borrosidad, el cual determina el grado

de borrosidad de la solución final; µi* membrecía de los individuos a la clase y α parámetro

que determina el valor promedio de µi*.

Cuando el exponente de borrosidad es igual o cercano a 1 la agrupación o clasificación

borrosa es una participación rígida (no borrosa), a medida que él se aproxima al infinito la

solución se aproxima al grado más alto de borrosidad. Para determinar los grados de

membrecía (µi*, para las clases) se debe solucionar la ecuación:

Una vez determinados los grados de membrecía, se calculan los centroides de las clases (CK)

por medio de la ecuación:

33

Para lograr esta clasificación borrosa se deben realizar una serie de pasos que comprenden,

entre otras cosas, la preparación de la información o covariables a emplear, su exportación a

formatos aceptados por los respectivos programas de trabajo, generación de matrices de datos

donde se engloban toda la información de las variables, las corridas en el programa Fuzme con

diferentes exponentes de borrosidad y números de clases, la determinación del exponente

borroso y el número de clase adecuado, y finalmente la creación y despliegue de los mapas. A

continuación se describen brevemente cada uno de estos pasos:

Preparación de la información: consiste en lograr una precisión cartográfica y atributiva

adecuada de todas las capas incluidas en el proceso, es decir, las covariables deben estar en

la misma proyección cartográfica (UTM, Huso 19N) y datum Regven, además de calzar

exactamente una sobre otra y no poseer datos vacíos (NoData).

Exportación a formato texto (Asccii): exportar todas las variables geomorfométricas

generadas en SAGAGIS, y el Índice de vegetación a archivos ascii (*.asc). En los archivos

resultante se debe verificar la concordancia del número de columnas y filas, coordenadas de

latitud y longitud, y resolución espacial.

Generación de matriz de datos: A partir de todos los archivos ascii de cada covariable

geomorfometricas y el Índice de vegetación normalizado se creó una matriz de datos, es

decir, un solo archivo (extensión *.dat), apoyados en la aplicación FKCN (Viloria, 2007).

En este archivo resultante que se corresponde con una capa resumen cada celda o pixel

posee un valor de cada una de las covariables utilizadas para realizar la clasificación

borrosa.

Procesamiento en fuzme 3.5: Este último archivo resume la matriz creada en el punto

anterior, y es utilizado en la aplicación “FUZME 3.5”, para realizar la clasificación borrosa.

Para esto se especifican los siguientes aspectos:

- Directorio de salida.

- Localización y nombre del archivo de datos (resumen o matriz).

- Método de cálculo de distancia métrica: “Mahalanobis”

- Corridas con múltiples exponente fuzzy: Inicio (1.0); final(1.5) y pasos (0.1)

- Iteraciones máximas: 10

- Criterio de parada: 0.0001

- Número de clases mínima y máxima: 6 y 12.

- Algoritmo: Fuzzy-K-means (Fuzme 3.5).

34

El procedimiento genera varios archivos de salida, como el de resumen, en donde se

encuentran, entre otros, el (exponente borroso) para cada clase, el FPI (índice de

borrosidad), la MPE (entropía de participación modificada) y la (-dj/d) derivada de la

función objetiva con respecto a la derivada del exponente de borrosidad. Todos estos

parámetros son posteriormente empleados para determinar el exponente borroso ideal y el

número de clase correcto.

Selección del exponente de borrosidad: Un elemento clave para generar una apropiada

clasificación borrosa es la identificación del valor correcto del exponente de borrosidad ().

Odeth et al (1992a) sugirió en base a su experiencia con datos de suelos un valor de ()

entre 1,2 a 1,5. Sin embargo, en este estudio, para seleccionar el valor de exponente de

borrosidad (), se aplicó el procedimiento propuesto por el mismo Odeth et al (1992a), que

es generar diferentes clasificaciones con distintas combinaciones de exponente de

borrosidad () (en este estudio desde 1,0 a 1,5) y diferentes números de clases (desde 6 a 12

clases). Para cada una de estas combinaciones resultante se tomó la derivada de la función

objetivo con respecto a la derivada del exponente de borrosidad (-dj/d) y con ella se

trazaron curvas de la variación de (-dj/d) en función del () para cada clase. El valor ideal

de () correspondería al menor máximo de (-dj/d) de las diferentes curvas de números de

clases.

Selección del número de clases: Para seleccionar el número de clases se siguió el

procedimiento sugerido también por Odeth et al (1992a), el cual genera diferentes

clasificaciones o agrupaciones borrosas para diferentes números de clases (en este estudio

desde 6 a 12 clases) y exponente de borrosidad (desde 1,0 a 1,5), y para cada agrupamiento

obtenido se calculó el índice de borrosidad logrado (FPI) y la entropía de partición

modificada (MPE). El primero estima el grado de borrosidad generado por cada número

específico de clases. Cuando el FPI es 0, ninguna membrecía se distribuye entre cualquier

par de clases, es decir las clases son no borrosas, porque en el conjunto de datos existen

subestructuras muy bien diferenciadas entre sí. Por el contrario cuando el FPI es 1 la

borrosidad en los datos es máxima. De este modo la minimización del FPI indica un

número óptimo de clases borrosas que refleja mejor las subestructuras presentes en el

espacio multidimensional definido por el conjunto de datos. Por otra parte, el MPE

determina el grado de desorden creado por cada número específico de clases. Para

determinar el número óptimo de clases borrosas se presume que la minimización del MPE

es consistente con la maximización de la cantidad de información acerca de las

subestructuras generadas dentro del espacio multivariado.

35

Creación de topología y archivos asociados (centroides y mapas): Una vez obtenidos el

índice de borrosidad ideal () y el número de clases correctas, mediante el procedimiento

anteriormente mencionado, se continua corriendo el Programa FKCN (Viloria, 2007) para

obtener los archivos de salidas que proporcionan las características centrales de cada clases

(centroides) y los datos para evaluar el efecto de cada variable en la clasificación borrosa.

Además se obtiene el mapa producto de la clasificación en formato ascii.

Filtrado de las clases: Para mejorar la visualización de las clases obtenidas por lógica

difusa, se procede a realizar una generalización de dichas clases empleando un análisis

espacial de vecindad, específicamente un subconjunto o kernel de 3 x 3 celdas. Esto se

logra a través de métodos de filtrados en la aplicación arcinfo Workstation.

Clases fisiográficas: Es importante señalar que las salidas del método neuro-borroso

fueron denominadas “Clases fisiográficas”, principalmente debido a que son calculadas a

partir de atributos de relieve derivados de un modelo digital de elevación, además de un

índice de vegetación normalizado.

Despliegue en SIG: Empleando la aplicación Arcview 3.2, se importa el archivo ascii

producido por FKCN, y se muestra en una vista de la misma aplicación.

Clases tentativas de suelos: Un paso posterior, es la transformación de las “Clases

fisiográficas” a “Clases tentativas de suelos”, mediante el otorgamiento a cada una de ellas

del tipo de suelo representativo. Según el criterio de mayor correspondencia espacial,

apoyados en estudios edáficos previos realizados por Sevilla y Comerma 2009b. En otras

palabras se superpuso el mapa de “Clases fisiográficas” sobre el Mapa de suelos y se

observó a qué clase de suelos correspondían mayoritariamente las “Clases fisiográficas” del

mapa neuro-borroso.

6.3.2. Metodo Regresión-Kriging (RK).

6.3.2.1. Materiales.

Dentro de los materiales empleados para el método regresión-kriging se incluyeron tanto la

información de suelos recabada en el método convencional, curvas de nivel, hidrografía, las

covariables ambientales, así como las aplicaciones informáticas (software) empleadas para

lograr los objetivos planteados.

a) Información temática empleada.

En cuanto a la información para aplicar la metodología de regresión-kriging, se emplearon 40

observaciones de campo (barrenos y perfiles de suelos) de los 50 realizados en el estudio de

36

suelos convencional (Sevilla y Comerma, 2009b), por estos, tener más completas sus

caracterizaciones. La ubicación dentro de la cuenca de dichos puntos se puede observar en la

figura 8.

Figura 8. Localización de las 40 observaciones de campo en la Cuenca del Rio Canoabo

Además de las observaciones de campo, se emplearon treinta y una (31) covariables

ambientales, algunas provenientes de estudios previos como las formaciones geológicas

(Palmaven, 1999), el riesgo de erosión, la precipitación, la erosión actual, etc., y otras

diseñadas en este trabajo, las cuales son mencionadas en el cuadro 2.

37

Cuadro 2. Covariables ambientales empleadas en el método de regresión–kriging.

N° Covariable ambientales Nombre de la capa

1 Precipitación media anual mdprea620

2 Numero de meses húmedos mdnmhu20

3 Temperatura media anual mdtempa20

4 Evapotranspiración media anual mdetoa20

5 Zona de vida mdzonavi20

6 Imagen Landsat (Banda 1) i20000318_1c

7 Imagen Landsat (Banda 2) i20000318_2c

8 Imagen Landsat (Banda 3) i20000318_3c

9 Imagen Landsat (Banda 4) i20000318_4c

10 Imagen Landsat (Banda 5) i20000318_5c

11 Imagen Landsat (Banda 6a) i20000318_61c

12 Imagen Landsat (Banda 6b) i20000318_62c

13 Imagen Landsat (Banda 7) i20000318_7c

14 Índice de vegetación Normalizado Normalized.Difference.Vegetati

15 Formaciones geológicas mdgeolo20a

16 Modelo digital de elevación Mde20b

17 Pendiente Slope

18 Sombreado Analytical.Hillshading

19 Orientación de la pendiente Aspect

20 Erosión actual mderoac20

21 Factor LS LS.Factor

22 Factor R factor_20r

23 Riesgo de erosión actual ea720

24 Riesgo de erosión potencial ep720

25 Plan de curvatura Plan.Curvature

26 Perfil de curvatura Profile.Curvature

27 Índice de convergencia Convergence.Index

28 Área de captación Catchment.Area

29 Índice de humedad Wetness.Index

30 Altitude_.above Altitude_.above

31 Channel_Network Channel_Network

38

b) Aplicaciones informáticas utilizadas.

Por otro lado, para generar la cartografía digital de las propiedades de los suelos de la Cuenca

del Rio Canoabo bajo esta metodología, se emplearon las siguientes aplicaciones informáticas

(software):

Estadístico R.

RSTUDIO (Interface para R).

SAGAGIS.

CALC (Libreoffice).

6.3.2.2. Procedimientos.

Los pasos que se ejecutaron para lograr cartografiar las propiedades de los suelos consideradas

mediante el método de regresion-kriging se describen a continuación:

a) Revisión de los datos puntuales de suelos.

Los datos de suelos empleados fueron cuarenta (40) observaciones de campo geográficamente

referenciadas, en donde se describieron sus horizontes y las propiedades pertinentes, como

son: Arena, limo, Arcilla, Materia orgánica, pH. Los datos de estas propiedades fueron

analizados para determinar la presencia de datos anómalos mediante la metodología formulada

por Tukey (1977). Así pues se eliminaron observaciones con datos atípicos, y también se

revisó que todos los horizontes tuviesen datos de las propiedades de interés y que las

profundidades iniciales y final de los horizontes estuviesen correctas.

b) Estimaciones de los valores de las propiedades en las profundidades solicitadas (Spline).

Como es conocido la descripción de los perfiles de suelos viene dada por horizontes

pedogeneticos, los cuales no tienen una profundidad ni espesor constante, por tal razón y por

la necesidad de cartografiar las propiedades a una misma profundidad, se debe estimar el valor

de cada una de ellas a cierta profundidad. En este trabajo se cartografiaron digitalmente cinco

(5) propiedades de suelos a una profundidad uniforme de 0 a 20 cm, y dos de ellas en dos

profundidades mayores del perfil del suelo, dando como resultados 7 propiedades a estimar,

los cuales se resumen en el cuadro 3.

Para lograr el valor de cada propiedad a la profundidad constante que expresa el cuadro 3 se

utilizó la función llamada SPLINE (Malone et al, 2009), en este caso llamada

“DepthFunctions”. Dicha función spline se aplicó mediante un script en estadístico “R” a los

datos de cada propiedad, tomando una pequeña base de datos del atributo, la cual estaba

constituida por un identificador único del perfil de suelos, el valor de la propiedad y las

39

profundidades de inicio y final de los horizontes de cada perfil u observación de campo. Una

imagen ilustrativa de la salida de esta función se muestra en la Figura 9.

Cuadro 3. Propiedades de los suelos cartografiadas digitalmente por regresión–kriging.

N° Atributo Profundidad Nombre Unidad

1 Arena 0 - 20 cm ARE_0_20 %

2 Limo 0 - 20 cm LIM_0_20 %

3 Arcilla 0 - 20 cm ARC_0_20 %

4 Arcilla 20 - 50 cm ARC_20_50 %

5 Materia orgánica 0 - 20 cm MOR_2_20 %

6 pH 0 - 20 cm Ph_0_20 -

7 pH 50 - 200 cm PH_50_200 -

Figura 9. Ejemplo de salida de función SPLINE.

c) Obtención de la información sobre covariables ambientales (MDE e imágenes LANDSAT).

Lo que se menciona como covariables ambientales, no son más que aquellas variables

físico-naturales que pueden representar a los factores formadores de suelos propuestos por

40

Jenny (1941). En este caso las principales fuentes de covariables ambientales consideradas

fueron el modelo digital de elevación (MDE), el cual fue diseñado con una resolución

espacial de 20 m y las imágenes del sensor remoto LANDSAT (ETM+), específicamente

las bandas 1, 2, 3, 4, 5, 6a, 6b, 7. El modelo de elevación dio pie a las llamadas variables

morfometricas, mediante procedimientos incluidos en SAGAGIS y por otro lado, las

imágenes de LANDSAT dieron origen al índice de vegetación normalizado (NDVI). La

fuente de las imágenes satelitales fue la NASA y se descargaron de internet.

d) Preparación de las covariables ambientales.

Esta preparación de las covariables ambientales consistió en proyectarlas cartográficamente

a Universal Transverso de Mercator (UTM) en los Husos 19, datum Regven. También se

corrigieron los “hundimientos” del modelo digital de elevación productos del proceso de

interpolación de los valores de las curvas de nivel a través del procedimiento en SAGAGIS:

“Modules\TerrainAnalysis\Preprocessing\fillSinks”.

e) Cálculo del índice de vegetación normalizado (NDVI).

En este caso el NDVI se calculó en SAGAGIS mediante el proceso

“Modules\imagen\tools\vegetation índices\vegetation index[slope.based], empleando los

mosaicos de las bandas 3 (Rojo) y 4 (InfraRojo Cercano).

f) Calculo de las variables morfométricas.

Las variables morfométricas empleadas fueron generadas a partir del modelo digital de

elevación en SAGAGIS, mediante el procedimiento “Modules\Terrain Analysis\Basic

terrain analysis” en SAGAGIS, las cuales se pueden observar en el cuadro 4.

Cuadro 4. Variables morfometricas empleadas en regresion-kriging

Variable morfométrica Descripción

Slope Pendiente

Aspect Orientacion de la ladera

Plan curvature Plano de curvatura

Profile curvature Perfil de curvatura

convergence index Indice de convergencia

Catchment area Area de captacion

Catchment slope Pendiente de captación

LS-factor Factor LS

Elevation Altura

Analytical.Hillshading Sombreado

41

g) Relacionar las propiedades de los suelos con los valores de las covariables ambientales.

Para estimar los valores de propiedades de suelos en sitios no muestreados, a partir de datos

puntuales de suelos y las covariables ambientales, se debe primero adicionar a los datos de

los perfiles u observaciones de suelos estimados con la función Spline, los valores de las 31

covariables que se consideraron pertinentes.

Para esto se sobreponen los perfiles de suelos con las covariables, utilizando el

procedimiento en SAGAGIS “Modules\Shapes\Grid\Gridvalues\Addgridvaluestopoints”, y

mediante esto cada perfil de suelo tiene el valor correspondiente de cada covariable para

ese sitio. Así se obtiene un archivo en formato txt con los mencionados valores para ser

utilizados en el análisis estadístico paramétrico de regresión lineal múltiple.

h) Cálculo estadístico de la regresión lineal múltiple en estadístico “R”.

Con los datos del punto anterior y empleando las aplicaciones R y Rstudio se abrió un

script para realizar el análisis paramétrico de regresión lineal múltiple, lo que permitió

obtener una ecuación de regresión con sus respectivos intercepto y coeficientes para cada

propiedad estimada y cada profundidad de las mismas. Los principales pasos en este

proceso fueron: lectura de datos de suelos (40 perfiles u observaciones de suelos),

separación del grupo de datos en dos subgrupos: uno para la calibración del modelo de

regresión y otro para la validación del mismo, análisis exploratorio de datos para eliminar

datos atípicos, determinación del coeficiente de correlación entre las covariables

ambientales y la propiedad a estimar, cálculo de la regresión lineal múltiple con todas las

covariables ambientales (31), análisis de varianza para revisar la significancia del modelo y

de las covariables, verificación del cumplimiento de los supuestos de uniformidad de los

valores, independencia de los valores de las propiedades, linealidad entre las variables x e y

(se deja que el modelo decida si las relaciones son lineales o no, lo que se reflejará en la

significancia de los coeficientes), falta de multicolinealidad entre las variables (se

comprueba mediante el cálculo de los factores de inflación de la varianza), verificación de

la normalidad de los errores mediante un histograma y la prueba de Shapiro-Wilk (1965), y

se evalúa la homoscedasticidad o Varianza constante de los errores en relación con las

variables x e y, mediante la prueba Breusch-Pagan (1979). Para eliminar covariables no

significativas para el modelo se empleó el algoritmo de selección de variables paso a paso

(stepwise), y finalmente se obtuvo la ecuación según el R2 ajustado y los residuos o errores

entre el valor real y los valores estimados por la regresión en cada uno de los puntos de

suelo que se introdujo al principio. Este proceso genera un archivo contentivo de estos

residuos para el próximo paso, que es el kriging de los residuos o errores.

42

i) Interpolación kriging de los residuos o errores en estadístico “R”.

La interpolación de los residuos desde los puntos de suelos a zonas no muestreadas se

realizó mediante geoestadistica, más específicamente el kriging ordinario, el cual es un

método de interpolación óptimo basado en regresión en función de los valores en

ubicaciones circundantes, ponderadas de acuerdo con los valores de covarianza o

semivarianza espacial y constituyen un buen estimador lineal no sesgado. Para realizar esta

interpolación se emplearon las aplicaciones “R” y “Rstudio” donde se utilizó un script

proporcionado por EMBRAPA Suelos, sobre el kriging de los residuos. Los pasos fueron:

lecturas de los datos de residuos o errores proveniente del paso anterior; posicionamiento

geográficos de los datos; establecimiento de la extensión del área de estudio; generación del

variograma empírico; ajuste del modelo de variograma; creación del modelo matemático de

interpolación definitivo con cada uno de sus elementos considerando una meseta parcial

con el valor de la varianza de la muestra; estimando visualmente el alcance a partir del

variograma empírico, así como el efecto nugget, y se eligió el tipo de modelo (esférico,

gaussiano), según el error medio cuadrático (EMC) resultante de sus corridas, el modelo

que diera menor EMC era el seleccionado y, finalmente se generó el kriging ordinario,

obteniéndose un archivo de los resultados.

j) Obtención de los mapas finales de cada propiedad a diferentes profundidades.

Para obtener los mapas finales se procedió a ejecutar la ecuación de regresión múltiple

obtenida de cada propiedad del suelo en la aplicación SAGAGIS. En ella se encontraba

desplegada cada una de las covariables ambientales consideradas significativas para el

modelo. Este proceso fue realizado en “Gridcalculator”. Luego se desplegó el mapa de

kriging de los residuos obtenido en el paso anterior y posteriormente se sumaron ambas

capas (regresión y kriging) para obtener el mapa final producto de la metodología

“regresion-kriging”.

k) Validación.

Análisis de incertidumbre del modelo de regresión múltiple (RLM): En el inicio de

este trabajo se dividieron los datos (40 perfiles u observaciones de suelos) en dos

subgrupos, uno para ser utilizados en la calibración o “entrenamiento” y así determinar los

parámetros del modelo, y otro subgrupo para la validación o verificación de los resultados.

Entonces se obtuvo un grupo de 32 perfiles (80%) para el cálculo y 8 perfiles (20 %) para

la validación, este último grupo de datos se seleccionó de forma aleatoria. Ambos

conjuntos de datos fueron sometidos a un análisis exploratorio que permitió verificar

valores atípicos que pudieran perjudicar la evaluación.

43

Dos índices fueron empleados para evaluar la calidad de los resultados: uno la desviación

residual estándar (Residual Standard Error (drp)) y otro el coeficiente de determinación

(Multiple R-squared). La drp resulta de la diferencia entre los valores observados (OBS) y

los correspondientes de predicción (PRED) que son los llamados residuos (RES) y su

fórmula es:

RESi = PREDi - OBSi

Donde i son los índices de cada observación.

El drp se calcula mediante siguiente fórmula:

𝒅𝒓𝒑 = √(∑(RESi)2/n-p-1))

Dónde: n: es el número de observaciones y p es el número de variables independientes

Por otro lado el coeficiente de determinación (R2) es el que mide la fuerza de la relación

entre la variable dependiente (estimada) y las demás variables independientes (predictores)

que intervienen en el modelo. La fórmula es la siguiente:

R2 = Variación predicción / variación total.

Dónde:

Variación de Predicción = ∑(PREDi – media(OBS))2

Variación total = ∑(OBSi – media(OBS))2

El coeficiente de determinación R2 es ajustado (R

2 Ajust) debido a que el número de

variables predictores influye en este coeficiente. Entonces la fórmula es:

R2 Ajust = 1- (1-R2) * (n-1)/(n-p-1)

Dónde: n: número de observaciones y p: número de variables independientes.

Esto es importante para solo incluir las variables que realmente contribuyen con mejorar la

predicción del modelo. Aunque la desviación residual estándar (drp) es un indicador de la

calidad de los resultados en las mismas unidades de las observaciones, es recomendable

verificar los valores máximos y mínimos de los residuos que darán más elementos para

evaluar la calidad de los resultados.

Análisis de incertidumbre del modelo de kriging de los residuos: Para el análisis de

incertidumbre de los resultados de este procedimiento, se relacionaron los datos dejados

para la validación (8 perfiles u observaciones de campo) con los datos obtenidos con la

44

interpolación de Kriging. Este procedimiento ofrece los errores mínimos y máximos,

observando la magnitud de los mismos.

También, se realizó una validación cruzada de los resultados del kriging de los residuos,

esta vez empleando los datos que se emplearon para la elaboración del semivariograma y

el modelo teórico. Esto fue posible corriendo 32 veces el kriging eliminando cada vez una

observación, luego se compararon el resultado del kriging con el valor de la observación

dejado afuera, así 32 veces. Con esto se calcula el error medio cuadrático (EMC), que es

útil como un índice de certeza de los resultados del proceso de kriging de los residuos.

Dónde: n = número de observaciones, vi = residuos observado, vi = residuos estimado.

Análisis de Sensibilidad de las covariables ambientales: Con este análisis se busca

determinar el efecto de las covariables ambientales en el modelo de predicción. El cual se

pudiera exponer de la siguiente manera:

Variable a estimar = f(Covariable1, covariable2,…., covariable n).

Considerando que el coeficiente de determinación (R2) es la fuerza de la relación entre la

variable dependiente (estimada) y las demás variables independientes (covariables

ambientales), entonces lo que se quiere determinar cuál es la contribución de cada variable

a la formación de este R2. Para hacer esto se emplearan la función “Forward Stepwise”.

Esta función inicialmente realizaría la regresión lineal con una sola variable independiente

y se determina cuál de estas tuvo el mayor valor de R2, este será la contribución del R

2 de

la variable encontrada. Se agrega una a una covariable junto a las del paso anterior y se

determina cuál de estas tuvo el mayor R2. La diferencia de R

2 de este paso con el anterior

será la contribución de esta segunda covariable. Así sucesivamente se continua hasta la

última covariable y se ordenan de mayor a menor la contribución de cada una de ellas en el

R2 total.

45

6.4. COMPARACIÓN DE LOS METODOS CARTOGRAFICOS CONTRA UN MAPA

CONVENCIONAL.

Para saber cuál de los métodos de cartografía digital empleados concordó más con el mapa de

suelos convencional, se comparó cada uno de ellos empleando el “Índice de concordancia” y

el coeficiente “Kappa”, los cuales miden el grado de concordancia o de acuerdo (Cohen 1960;

Jenness y Judson, 2007 y Arguellos 2013).

Para poder lograr la comparación de los mapas producidos, con respecto al mapa de suelos

levantado convencionalmente, los primeros deben poseer el mismo número de clases que este

último y además, que la denominación o numeración de dichas clases en ambos mapas sea la

misma.

El mapa de suelos levantado convencionalmente de la cuenca del Rio Canoabo por Sevilla y

Comerma (2009b) consto de seis (6) unidades cartográficas de suelos, clasificadas

taxonómicamente y una (1) clase adicional correspondiente al embalse del Rio Canoabo.

A continuación se describe la metodología empleada para lograr la comparación para cada

método de cartografía digital.

6.4.1. Concordancia entre el método neuro-borroso y el levantamiento Convencional:

El método neuro-borroso agrupo los suelos de la cuenca en once (11) “Clases fisiográficas”.

Luego estas clases son transformadas en “Clases tentativas de suelos” y para lograr la

comparación de estas últimas con el mapa de suelos convencional, se debe realizar una

correspondencia entre las clases de ambos mapas, por similitud cartográfica y geográfica. Es

decir se igualan el número de clases y se denominó cada “Clase tentativa de suelos” igual que

su correspondiente clase en el mapa de suelo convencional, es decir se le asigna el mismo

número.

Posteriormente se procede a asignar los valores de clases de ambos mapas a un grupo de

57.912 puntos de observación distribuidos en una cuadricula espaciada cada 20 m en toda la

superficie de la cuenca. Ello buscaría la coincidencia entre clases de ambos métodos

cartográfico (neuro-borroso y convencional). Para ello fue empleado el índice de concordancia

y el coeficiente Kappa calculado a través de una extensión del Sistema de información

geográfico Arcview 3.2, programada por Jenness y Judson (2007).

El índice de concordancia se calcula mediante la siguiente formula:

𝑃𝐺 =(𝑎1 + 𝑎2 + 𝑎3 … + 𝑎𝑛)

𝑁

46

Dónde:

a1 = número de aciertos entre las clase 1; a2 = número de aciertos entre las clase 2.

a3 = número de aciertos entre las clase 3, n = número total de clases.

N = número total de observaciones.

El coeficiente Kappa calcula el porcentaje de acuerdos entre los dos métodos, su fórmula es la

siguiente:

𝐾 =𝑃𝑜 − 𝑃𝑒

1 − 𝑃𝑒

Siendo:

𝑃𝑜 =𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑐𝑢𝑒𝑟𝑑𝑜𝑠

𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑐𝑢𝑒𝑟𝑑𝑜𝑠 + 𝑛𝑢𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑑𝑒𝑠𝑐𝑢𝑒𝑟𝑑𝑜𝑠

𝑃𝑒 = ∑(𝑝𝑖1 𝑥 𝑝𝑖2)

𝑛

𝑖=1

Dónde:

n = números de categorías; i = número de la categoría (de 1 hasta n);

pi1 = proporción de ocurrencias de la categoría i para el método 1;

pi2 = proporción de ocurrencias de la categoría i para el método 2.

A la hora de interpretar el valor de K es útil disponer de una escala como la muestra el cuadro

5.

Cuadro 5. Interpretación del valor de K.

Valor de K Fuerza de la concordancia

< 0.20 pobre

0.21 – 0.40 débil

0.41 – 0.60 Moderado

0.61 – 0.80 Alto

0.81 – 1.00 Muy Alto

Fuente: Landis y Koch, 1977

47

6.4.2. Concordancia entre el método regresion-kriging y el levantamiento Convencional:

El método regresión–kriging no produce un mapa de clases de suelos directamente, sino

mapas de propiedades de los suelos como: arena, limo, arcilla, pH y materia orgánica. Para

lograr comparar estos productos con el mapa de clases de suelo levantado convencionalmente,

primero se procedió a crear un mapa de “Clases de propiedades de los suelos”, apoyado en el

método neuro-borroso.

A este mapa de “Clases de propiedades de suelos” se le realizo la correspondencia entre sus

clases y la del mapa convencional de suelos, según similitud cartográfica y geográfica. Es

decir denominar cada clase igual que su correspondiente espacial clase en el mapa

convencional, y asignándole el mismo número para poder compararlos. Finalmente se le dio el

valor de las “Clases de propiedades de suelos” a los 52.331 puntos de observación dispuestos

en una cuadricula espaciada cada 20 m sobre la cuenca. Estos puntos ya poseían las clases del

mapa convencional y con esto finalmente se calculó el índice de concordancia y el coeficiente

Kappa para conocer el grado de concordancia entre ambos métodos.

48

7. RESULTADOS Y DISCUSIÓN

7.1. RESULTADOS DEL MÉTODO NEURO–BORROSO.

Los resultados de la agrupación o clasificación de las tierras de la cuenca del Rio Canoabo,

mediante el método neuro–borroso, son los siguientes:

7.1.1. Modelo digital de elevación (MDE) obtenido:

Como se mencionó anteriormente El MDE generado presentó una resolución espacial de 20 m

y forma rectangular, lo que facilitó la aplicación de los algoritmos matemáticos y el

procesamiento para producir los atributos topográficos. La figura 10 muestra los elementos

geográficos originados y necesarios para generar el MDE (hojas cartográficas, curvas de nivel

e hidrografía).

Figura 10. Hoja cartográfica a escala 1:25.000, curvas de nivel e hidrografía de la Cuenca

En la figura 11 se pueden apreciar algunos de los atributos expuestos por el MDE. En este

caso, tres perfiles topográficos. Uno con rumbo Sur-Norte (Perfil A) y otros dos con rumbo

Oeste-Este, uno en la parte norte de la cuenca (Perfil B) y otro en la parte Sur (Perfil C). En

ellos se pudo observar el desnivel encontrado y el relieve cambiante de la cuenca.

Resumiendo, el MDE evidencio la disposición de un estrecho valle central, correspondiente al

Rio Canoabo con orientación Sur-Este a Nor-Este, rodeado por un piedemonte estrecho y

laderas de montañas con un relieve más accidentado. La variación de altura está comprendida

entre 118 y 1745 msnm. Los perfiles topográficos mencionados mostraron que en el perfil A

49

contrastan las zonas montañosas altas ubicadas al Sur (“Cerro de Paja”) y luego la zonas bajas

del valle del Rio Canoabo interceptado aproximadamente a los 14.000 m por las estribaciones

de la Fila “La Justa”, finalmente se observa la desembocadura del rio “Canoabo” en el rio

“Temerla” (salida de la cuenca). En el perfil B (línea superior), se observan dos picos

correspondientes a la Fila “La Media Luna” (Oeste) y la Fila “La Justa” (Este) las cuales son

los límites de la Cuenca, y encierran en la parte central el cauce del río Canoabo. En el perfil C

(línea inferior) se detalla la parte alta de la cuenca, donde se observan dos picos, el primer pico

al Oeste correspondiente al sector “Capa” con una altura aproximada de 1150 msnm, seguido

de la depresión del rio “Capa”, continuada por una loma que lo separa del rio “San Antonio”,

para finalmente subir a la fila “La Justa” a unos 1600 msnm al extremo Este. Las

características de la capa raster del modelo digital de elevación se muestran en el cuadro 6.

Figura 11. Modelo digital de elevación mostrando los perfiles topográficos

50

Cuadro 6. Características del MDE generados en la zona de estudio.

CARACTERÍSTICAS DESCRIPCIÓN

Número de columnas 761

Número de filas 885

Número de celdas 673.485

Coordenada longitud mínima (m) 572.510,3125

Coordenada latitud mínima (m) 1.134.352,125

Resolución espacial (m) 20

Área de la celda (m2) 400

Área total (ha) 26.939,4

7.1.2. Descripción de las Variables morfométricas y el Índice de vegetación normalizado

(NDVI).

A partir del MDE se obtuvieron las variables morfométricas, las cuales se muestran en las

figuras 12 y 13, y sus respectivos estadísticos en el cuadro 7. De estos datos resalta la poca

variabilidad en el índice de humedad dentro de la cuenca y por el contrario el alto coeficiente

de variación en el plano y perfil de coberturas.

Estas variables morfométricas fueron seleccionadas como parámetros de entrada para el

método neuro-borroso, debido a la experiencia obtenida en trabajos previos como los de

Valera y Viloria (2009) y Nunez et al (2013), quienes encontraron una alta relación entre las

propiedades de los suelos y las variables morfométricas altura, orientación de laderas,

gradiente de pendiente, plano y perfil de curvatura, área de captación, índice topográfico de

humedad y el NDVI.

En este estudio se probaron, basado en el método de ensayo y error, diferentes combinaciones

de variables morfométricas, y el resultado reveló que las covariables: altitud, altura sobre el

canal de drenaje, la pendiente, el NDVI, el factor LS, el plano de curvatura, el perfil de

curvatura, índice topográfico de humedad y el área de captación; expresaron mejor la

agrupación borrosa y la disposición de las clases en el paisaje. El índice de vegetación

normalizado (NDVI), fue producto del procesamiento de la imagen satelital Landsat ETM+.

Estas variables morfometricas y el NDVI se pueden observar en la figura 13.

51

Figura 12. Variables morfométricas empleadas.

52

Figura 13. Variables morfométricas e Índice de vegetación normalizado empleados.

53

Cuadro 7. Parámetros estadísticos descriptivos del MDE de la Cuenca del Río Canoabo.

VARIABLE MEDIA MINIMO MAXIMO DESVIACION

ESTANDAR

CV (%)

Altitud (msnm) 659 118 1745 357 54

Altura sobre el canal de

drenaje (m)

68,5 0 434 73,4 107

Pendiente 0,31 0 1,03 0,16 52

Factor LS 69,6 0 4066 72,45 104

Orientación de la ladera 3,26 0 6,28 1,95 60

Plano de curvatura 0,000063 -0,125 0,061 0,0053 8.551

Perfil de curvatura -0,000053 -0,110 0,089 0,0054 -10.264

Índice de humedad 9,97 6,144 25,42 2,22 22

Área de Captación 200506,5 400 147879104 3035286,6 1.514

NDVI (adimensional) 0,35 -0,415 0,596 0,1312 37

7.1.3. Agrupamiento o clasificación neuro-borrosa.

La obtención de los parámetros necesarios para realizar la clasificación neuro-borrosa y sus

correspondientes resultados se describen a continuación.

7.1.3.1. Índice de borrosidad adecuado.

Diferentes estudios publicados sobre clasificación borrosa de suelos, han determinado el

número de clases adecuada, de acuerdo a la experiencia o intuición de los investigadores.

Otros han aplicado funciones matemáticas que intentan resolver esta incógnita. En este estudio

se empleó el método de graficar las curvas de FPI (índice de rendimiento borroso) contra el

número de clases exploradas, las cuales fueron un total de 7 clases (6 a 12), un rango de

variación del Φ comprendido entre 1,10 y 1,50 y observar el valor de borrosidad media. Para

esto se corrió el programa Fuzme 3.5. El resultado de graficar lo anterior se observa en la

figura 14.

De la figura 14 se desprendió que hay poca variación del índice de rendimiento borroso (FPI)

en función del número de clases. Pero, si existe una importante variación de este índice según

sea el coeficiente borroso comprendido entre 1,10 y 1,50. Esto llevó a establecer como

coeficiente borroso ideal el 1.2, ya que las curvas de valores de FPI para los coeficiente

borrosos de 1,50; 1,40; 1,30 muestran valores de FPI cercanos a 1, lo que implica una total

borrosidad y no existe distinción entre clases. Por el contrario la curva de FPI para coeficiente

de borrosidad de 1,1 presentó valores de FPI bajos en todas las clases entre 0,2 a 0,1 lo que

expresa límites entre clases muy discretos y se pierde la borrosidad del modelo y los límites

54

entre las clases tienden a ser abruptos, lo cual tampoco es ideal. De allí que un valor de 1.2 es

un punto intermedio de borrosidad y discreción.

Figura 14. Variación del FPI en función del número de clases y el exponente borroso (θ)

7.1.3.2. Número óptimo de clases.

El número de clases ideal se obtuvo primero graficando la variación de la Entropía de

Partición Modificada (MPE) y el índice de rendimiento borroso (FPI) en función del número

de clases, lo que se presenta en la figura 15, allí se nota poca variación de los valores de MPE

(0.35 a 0.40) y FPI (=0.39 a 0.45) entre las clases y que su tendencia es hacia la estabilidad.

Por tal razón el número de clases podría haber sido cualquiera, sin embargo cuando se

estudiaron los mapas de los diferentes números de clases, el número de clase 11 comenzó a

separarse clases fisiográficas claves en la cuenca, como eran las laderas donde aparecían

suelos erosionados. Ver Figura 16. Esto ayudo a indicar el número de clase óptimo.

Figura 15 Variación de la MPE y el FPI en función del número de clases.

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

1.10

6 7 8 9 10 11 12

FP

I

Número de clases

1.1

1.2

1.31.4

1.5

0.10

0.30

0.50

0.70

0.90

1.10

6 7 8 9 10 11 12

FP

I o

MP

E

Número de Clases

FPI

MPE

55

7.1.3.3. Cartografía de clases fisiográficas.

La figura 16 muestra el resultado del agrupamiento neuro-borroso de los suelos de la cuenca

empleando el sistema clasificador de paisaje Fuzzy Kohonen (Viloria, 2007) y los parámetros

como el coeficiente o índice de borrosidad (1.2) y los números óptimos de clases (11).

Figura 16. Mapa de unidades clases fisiográficas producto de la clasificación neuro-borrosa.

La figura 16 muestra el mapa de “Clases fisiográficas” resultado del método neuro-borroso.

Este mapa se generalizo un poco, simplemente uniendo algunas de sus clases, que por

experiencia de campo no merecían estar separadas, y que el método considero separarlas solo

por que pertenecían a laderas opuestas (Oriente y occidente de la cuenca). Todo esto se realizó

con el fin de facilitar su entendimiento y mejorar la comparación con el mapa de suelos

convencional. Las clases que se unieron fueron las clases 3 y 7 (áreas marrón oscuras), las

clases 2, 5 y 10 (áreas marrón claro) y las clases 6 y 11 (áreas naranja).

Por otro lado también se notó que las clases fisiográficas 2, 5 y 10 (laderas bajo bosque

semideciduo) con unas 3920 ha, fueron las más frecuentes, luego le siguieron las clases 6 y 11

(laderas bajo bosque deciduo) con unas 3295 ha; continuaron las clases 3 y 7 (laderas altas

56

bajo bosque nublado) con unas 3239 ha; la clase 1 (piedemonte bajo bosque deciduo) con unas

1614 ha; la clase 4 (laderas bajo bosques deciduos con erosión) con 1546 ha; la clase 8 (valle

bajo bosque deciduo) con unas 395 ha y, finalmente la que menos superficies tiene fue la clase

9 con 267 ha.

7.1.3.4. Características centrales de las clases.

Las características típicas de cada una de las once (11) clases fisiográficas en que se

estratificó la cuenca, se obtuvieron de los centroides producidos por el programa FKCN

(Viloria 2007) y se pueden observar de manera resumida en el cuadro 8.

Cuadro 8. Datos de los centroides de cada clase obtenida en la cuenca del Rio Canoabo.

Clase

Alt

ura

pro

med

io Altura

relativa

sobre el

canal de

drenaje

Pen

die

nte

NDVI

Factor de

erosión

del relieve

Orie

nta

ció

n

Pla

no

d

e

cu

rv

atu

ra

Perfi

l d

e

cu

rv

atu

ra

Índ

ice

de

hu

med

ad

Área

de c

ap

tació

n

msnm m % adim adim - adim adim adim adim

1 338 19 15 0.35 42 W -0.06 -0.08 10.9 54830.6

2 836 215 38 0.38 59 W 0.08 0.13 8.8 3635.8

3 1109 57 30 0.36 74 NW -0.02 -0.01 10.1 27262.3

4 433 29 26 0.13 48 E 0.05 -0.01 9.8 25554.3

5 572 121 50 0.43 90 E 0.07 0.06 8.8 5617.5

6 534 68 44 0.38 86 SW 0.05 0.01 9.1 9752.5

7 1011 52 30 0.40 76 NE -0.03 -0.01 10.0 28276.0

8 287 1 3 0.11 37 NW -0.08 -0.09 17.6 4936632.5

9 1328 173 38 0.24 63 SE 0.08 0.11 8.9 4556.0

10 514 42 36 0.37 82 NW 0.02 -0.01 9.5 24294.1

11 370 21 21 0.40 66 NE -0.08 -0.11 10.9 427819.8

A continuación se presenta una descripción de cada una de las clases fisiográficas obtenidas

para la cuenca, basándose en algunos datos del cuadro 8 y siguiendo una secuencia que va

desde las zonas más bajas y centrales del valle del Rio Canoabo, siguiendo por el

piedemonte y laderas hasta terminar en las zonas más altas de las crestas de las montañas

(Figura 16):

57

La clase 8 pertenece al valle de Rio Canoabo, y atraviesa la cuenca por el centro en sentido

Sureste a Noroeste, principalmente orientado hacia el Noroeste, con una altura promedio de

287 msnm. Este valle es muy plano con menos de 3 % de pendiente, su forma topográfica

predominante es cóncava (esto lo indica el signo negativo de valor del plano y perfil de

curvatura), lo cual favorece la acumulación de agua en los suelos, de allí su alto índice de

humedad y de posibilidad de captar agua. Actualmente se encuentra altamente intervenida,

debido al establecimiento de las poblaciones de Canoabo, Sabaneta y Santa Ana; además la

vegetación natural fue desplazada en algunos lugares por cultivos introducidos como

cítricos, musáceas, caña de azúcar y cacao. El potencial de erosión en este valle es muy

bajo. Superficie 395 ha.

La clase 1 está ubicada en el margen oriental del valle del Rio Canoabo y corresponde a un

piedemonte y faldas de laderas, los cuales tienen una orientación al oeste y su altura

promedio es de 338 msnm. Las pendientes son moderadas a bajas (15 %), su forma

topográfica generalmente es cóncava, lo cual da una moderada posibilidad de captar agua.

Está cubierto por un bosque deciduo de moderada a baja intervención; sin embargo, existen

algunas zonas muy intervenidas asociadas a la población de Canoabo. El potencial de

erosión es bajo. Superficie 1.614 ha.

La clase 4 corresponde al piedemonte y laderas bajas y medias, altamente erosionadas,

ubicadas a ambos lados del valle del Rio Canoabo, pero especialmente en las laderas

occidentales, por tal razón principalmente se orientan hacia el Este, su alturas van desde

300 msnm en el valle a unos 800 msnm en las laderas media-alta; sin embargo,

fundamentalmente se concentran en los 433 msnm. Esta área posee una pendiente

moderada de unos 26 %, con forma topográfica compleja (cóncava-convexa) que

compromete su potencial de captar agua. La zona está fuertemente intervenida por la

ganadería actualmente sin prácticas de conservación, lo que ha promovido procesos

erosivos, y como consecuencia sus tierras han perdido la capacidad productiva emergiendo

una vegetación herbácea rala de mala calidad e inclusive suelos desnudos. El potencial de

erosión es moderado; no obstante el manejo inadecuado de las tierras lo hacen muy alto.

Superficie 1.546 ha).

La clase 11 se ubica en las laderas bajas a medias, ubicadas al oeste de la cuenca, su

orientación es hacia el Noreste y poseen una altura promedio de 370 msnm. Poseen

pendientes moderadas de 21 % y su forma topográfica es ligeramente cóncava, lo que

favorece la captación de agua. Estas laderas están actualmente cubiertas por matorrales,

bosques deciduos y semideciduos de moderada a alta intervención. Su potencial de erosión

es moderado a alto debido a las pendientes y a la alta intervención humana que en este lado

58

de la cuenca se manifiesta con más fuerza, mediante la implantación de cultivos de cítricos

(mandarina), ocumo y ganadería. Superficie 1.493 ha.

La clase 6 son las laderas medias a altas, ubicadas en la parte oriental de la cuenca, poseen

orientación hacia el Suroeste y una altura promedio de 534 msnm. Las pendientes son altas

de 44 % y forma topográfica ligeramente convexa, favoreciendo poco la captación de agua.

Estas laderas están cubiertas por matorrales y bosque semideciduo de moderada a baja

intervención. Su potencial de erosión es muy alto. Superficie 1.802 ha.

La clase 5 son las laderas medias ubicadas al norte de la cuenca, las cuales culminan en la

llamada fila de “La Media Luna”, está orientada hacia el Este, su altura ronda los 572

msnm. Posee altas pendientes (50%) y una forma topográfica convexa, lo que compromete

la captación y acumulación de agua en sus suelos. Estas montañas están cubiertas

densamente por un bosque deciduo y matorrales. Su potencial de erosión es muy alto,

debido a su pendiente, longitud de las laderas y su forma convexa. Superficie 1.184 ha.

La clase 10 son las laderas medias concentradas al Sureste de la cuenca, por tal razón su

orientación es hacia Noroeste; su altura es en promedio de unos 514 msnm. Posee

pendientes de 36 % y su forma topográfica es compleja convexa-cóncava, comprometiendo

la acumulación de agua y favoreciendo los procesos erosivos. Están cubiertas por bosques

deciduos, semideciduos y matorrales, de moderada a baja intervención. Su potencial de

erosión es muy alto. Superficie 1.877 ha.

La clase 2 se corresponde con la fila “La Justa” al oriente de la cuenca. Está ubicada a una

altura promedio de 836 msnm y su orientación es hacia el oeste, las pendiente son de

moderada a altas (38 %), la forma topográfica es convexa, la vegetación es abundante

especialmente bosques nublados con epifitas. El potencial de captar agua es bajo por su

forma topográfica y el riesgo de erosión es moderado por las pendientes y su forma

convexa. Superficie 859 ha.

La clase 3 son laderas de montañas ubicadas en el extremo suroriental de la cuenca

orientadas al Noroeste a unos 1109 msnm. Sus pendientes son de moderadas a altas (30 %),

la forma topográfica es moderadamente cóncava favoreciendo poco la acumulación de

agua. Está cubierta por unos espesos bosques nublados intervenidos en algunas zonas para

la siembra de café y cítricos (mandarina). El potencial de erosión es muy alto debido a las

pendientes y a la longitud continua de las laderas; no obstante, actualmente no se evidencia

la erosión debido a la protección que le brinda la cobertura vegetal, es decir, es una zona

que está en un estado de equilibrio precario. Superficie 1.578 ha.

La clase 7 son también laderas de montañas altas (1011 msnm), ubicadas en el extremo

59

suroccidental de la cuenca, en el sector denominado “Las Marías”, principalmente están

orientadas hacia el Noreste y poseen unas moderadas a altas pendientes (30 %). Su forma

topográfica es cóncava, favoreciendo en algo la acumulación de agua. Estas laderas están

cubiertas por un extenso bosque semideciduo seco premontano y nublado (húmedo

montano bajo). Su potencial de erosión es muy alto; sin embargo, se mantiene en estable en

un equilibrio precario debido a la vegetación que lo protege del impacto de la gota de

lluvia. Superficie 1.661 ha.

La clase 9 son crestas altas con alturas entre 1300 y 1740 msnm, se ubican en dos puntos

opuestos de la cuenca uno en el vértice Suroeste (Cerro “El Marquero”) y el otro en el

vértice Sureste (“Cerro de Paja”), se corresponden con los puntos más altos y se orientan, el

primero hacia el Noreste y el segundo hacia el Noroeste. Las pendientes rondan los 38 % y

la forma topográfica es convexa. La vegetación presente es baja tanto por la intervención

humana, como por el cambio de las condiciones climáticas de la misma (temperatura,

humedad entre otros). En esta zona de altura el bosque nublado da paso a una vegetación

herbácea, de allí el nombre de "Cerro de Paja". El potencial de erosión es alto por sus

pendientes y su convexidad, aunque la vegetación tiende a protegerla. Superficie 267 ha.

El embalse del Rio Canoabo posee una superficie de 233 ha.

7.1.3.5. Clases tentativas de suelos

Finalmente se identificaron las anteriores “Clases fisiográficas” obtenidas por el método

neuro-borroso, con los tipos de suelos encontrados en un estudio agrologico previo

realizado por Sevilla y Comerma (2009b). Esto se efectuó superponiendo las clases

fisiográficas con el mapa de suelos y observando que suelos coincidían con las clases. Los

resultados fueron las siguientes clases tentativas de suelos:

Clases 2, 5 y 10: Laderas – bosque semideciduo – asociación Typic Haplustalfs y Ultic

Haplustalfs, 3.920 ha. Correspondería a la clase convencional 4. Ver figura 7.

Clases 6 y 11: Laderas – bosque deciduo – consociación de Typic Haplustalfs, 3.295 ha.

Correspondería a la clase convencional 2. Ver figura 7.

Clases 3 y 7: Laderas – bosque nublado – consociación Humic Hapludults, 3.239 ha.

Correspondería a la clase convencional 3. Ver figura 7.

Clase 1: Piedemonte – bosque deciduo – asociación Typic Haplustalfs y Typic

Haplustepts, 1614 ha. Correspondería a la clase convencional 5. Ver figura 7.

Clase 4: Laderas – bosque deciduo – complejo de Typic Haplustalfs, Inceptic

Haplustalfs y Lithic Ustorthen, 1546 ha. Correspondería a la clase convencional 1. Ver

60

figura 7.

Clase 8: Valle – bosque deciduo – complejo de Fluventic Haplustepts, Aquic

Haplustepts y Vertic Epiaquepts, 395 ha. Correspondería a la clase convencional 6. Ver

figura 7.

Clase 9: no identificada 267 ha;

Embalse: 233 ha.

7.1.4. Relevancia de las covariables ambientales en la clasificacion neuro-borrosa

Finalmente se puede establecer cuales variables empleadas en la agrupación tuvieron mayor

influencia en la separación de las 11 clases. Para eso se determinó el peso de las distancias

entre capas, lo cual se puede observar en el cuadro 9 y la figura 17. En ellos se muestra el

promedio, la desviación estándar y el coeficiente de variación entre las distancias de cada

clase.

Cuadro 9. Pesos de las distancias entre clases.

Clases

Alt

ura

(al

tu)

Altura

relativa

sobre el

canal de

drenaje

(alre) Pen

die

nte

(

pen

d)

ND

VI Factor de

erosión del

relieve (fals)

Ori

enta

ción (

aspe)

Plano de

curvatura

(curp)

Perfil de

curvatura

(curpe)

Índice de

humedad

(inwe)

Área de

captación

(arca)

A (1) -0.73 -0.91 -0.71 0.52 -0.98 0.42 0.34 0.10 -0.51 -1.00

B (2) -0.12 -0.01 -0.30 0.58 -0.97 0.51 0.36 0.12 -0.72 -1.00

C (3) 0.22 -0.74 -0.44 0.54 -0.96 0.65 0.34 0.10 -0.59 -1.00

D (4) -0.61 -0.87 -0.51 0.08 -0.98 -0.39 0.35 0.10 -0.62 -1.00

E (5) -0.44 -0.44 -0.11 0.67 -0.96 -0.62 0.35 0.11 -0.72 -1.00

F (6) -0.49 -0.69 -0.19 0.57 -0.96 0.20 0.35 0.11 -0.70 -1.00

G (7) 0.10 -0.76 -0.43 0.62 -0.96 -0.68 0.34 0.10 -0.60 -1.00

H (8) -0.79 -1.00 -0.95 0.04 -0.98 0.68 0.34 0.10 0.19 -0.93

I (9) 0.49 -0.20 -0.30 0.30 -0.97 -0.34 0.35 0.11 -0.71 -1.00

J (10) -0.51 -0.80 -0.32 0.56 -0.96 0.77 0.35 0.10 -0.65 -1.00

K (11) -0.69 -0.90 -0.59 0.61 -0.97 -0.67 0.34 0.09 -0.50 -0.99

Media -0.326 -0.665 -0.441 0.464 -0.968 0.048 0.347 0.104 -0.558 -0.993

Desviación 0.410 0.301 0.230 0.209 0.008 0.563 0.007 0.007 0.247 0.019

CV 125.7 45.2 52.2 45.1 0.9 1182.2 1.9 7.0 44.3 1.9

61

Figura 17. Gráfico de la variación del peso de las distancias entre clases.

Como se puede ver las variables morfométricas factor de erosión del relieve (fals), el plano y

perfil de curvatura (curp y curpe) y el área de captación (arca) arrojaron los menores

coeficiente de variación, es decir, que son muy parecidos en las 11 clases, por tanto no aportan

ninguna diferencia para separar las mismas. Por tanto, podrían prescindirse de ellas; sin

embargo, es útil emplearlas en su mayoría para que se pueda hacer una descripción completa

de las características naturales de cada clase.

Por el contrario las covariables que ayudan más a establecer las clases fisiográficas son en

orden de importancia: la orientación de las laderas (Aspe), la altura sobre el nivel medio del

mar (Alre), la pendiente (pend), y los índices de humedad (inwe) y de vegetación (ndvi).

Se nota que la forma y cantidad de radiación solar que reciben los suelos, el piso altitudinal

donde se ubican, la diferencia en sus pendientes y su cobertura vegetal, son las variables más

importantes a la hora de diferenciar clases fisiográficas.

7.2. RESULTADOS DEL METODO REGRESION–KRIGING.

A continuación se describen los resultados obtenidos al aplicar la metodología regresión-

kriging sobre un conjunto de variables morfometricas, el índice de vegetación normalizado y

los puntos de observación de los suelos en la cuenca del Rio Canoabo. Es así como se logró

cartografiar siete propiedades (arena, limo, arcilla0-20, arcilla20-50, pH0-20, pH50-200 y

materia orgánica).

-1.00

-0.80

-0.60

-0.40

-0.20

0.00

0.20

0.40

0.60

0.80

1.00

A B C D E F G H I J K

Pes

os

de

la C

apa

de

dis

tan

cia

Clases fisiograficas

altu

alre

pend

ndvi

fals

aspe

curp

curpe

inwe

arca

62

7.2.1. Arena (0 – 20 cm)

Mediante la función Spline se obtuvieron los valores de arena para los 40 puntos de

observación a una profundidad de 0 a 20 cm, encontrándose valores entre 20 % y 78 %. En el

cuadro 10 se muestran los datos de arena y en la figura 18 se presenta el histograma de

frecuencia. Para la calibración del análisis de regresión lineal múltiple (RLM) solo se

emplearon 32 de los 40 puntos originales y los otros 8 se dejaron para validar el modelo. Los

valores de arena del grupo de calibración también se incluyen en el cuadro 10.

Cuadro 10. Valores originales de Arena (%).

Datos Min Q1 Mediana Media Q3 Max

Originales 20,24 50 58,17 57,01 64,30 78

Calibración 34,35 50 60,82 57,93 65,32 72,12

Figura 18. Histograma de arena (%).

Del histograma de datos originales (Figura 18) se aprecia que los valores de arena tienden a la

normalidad, lo que se evidencia en la similitud de los valores de la mediana con respecto a la

media, los valores entre 60 y 70 % de arena ocurren con mayor frecuencia.

Los resultados de la RLM (Figura 19) arrojo que las covariables significativas fueron el

modelo digital de elevación, las imágenes satelitales (bandas 4 y 7), el índice de vegetación

normalizado y el área de captación, todas de alta significancia, excepto la última. El

coeficiente de determinación ajustado (R2) fue de 0,6719. En la figura 19 se pueden ver los

coeficientes de cada covariable, y en la figura 20 se muestra un graficó con la relación de los

valores de arenas medidos y los estimados por esta regresión.

Figuras 19 y 20. RLM, coeficientes de regresión y valores medidos y estimados (arena).

63

En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de

observación y compararlos con los datos medidos, se encontró que el máximo error era de -

10,88 % de arena, un mínimo muy cercano a cero (1,87x10-16

%) y, la mediana era de 1,31 %

(figura 21). También se comprobó la normalidad del comportamiento de dichos residuos

mediante la prueba de Shapiro-Wilk (0,21) que al ser mayor de 0.05 indica normalidad, y

también la homoscedasticidad (varianza constante) de los errores en relación con las variables

independientes y dependiente, mediante la prueba Breusch-Pagan (0,38), que al ser mayor de

0.05 indica que hay heteroscedasticidad.

Figura 21. Características de los residuos o errores del modelo de regresión (arena).

A partir de los residuos o errores se construyó un gráfico de semivarianza (Figura 22); de allí

se puede extraer que la varianza es de 21,92, el nugget es 4,42, el sill parcial es 18,50 y la

dependencia espacial es de 1710 m. Al realizar una validación cruzada entre los valores

medidos y los estimados por el kriging, el error medio cuadrático (EMC) fue de 4,65 %. Se le

ajustó a un modelo matemático esférico para la interpolación con kriging ordinario, y el mapa

de residuos obtenido se muestra en la figura 23.

Figura 22. Semivariograma de los residuos de arena.

64

Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables

significativas fue calculado el mapa de arena para toda la cuenca en SAGAGIS, el cual se

muestra en la figura 24. Finalmente en SAGAGIS se sumaron los mapas productos de la

ecuación de regresión y el de kriging de los residuos, y así se obtuvo el mapa definitivo del

atributo arena, visto en la figura 25.

Figuras 23 y 24. Mapa de arena kriging residuos y Mapa arena por regresión

Figura 25. Mapa de arena por regresión–kriging.

La figura 25 muestra un mapa de distribución de los porcentajes de arena bastante natural,

dispuesta en la cuenca en forma de una herradura que tiene su apertura hacia el norte. Este

65

mapa expresa que la arena disminuye con la altura y se incrementa cuando la cobertura vegetal

es menor, especialmente en suelos que han sido erosionados. También se nota que en las zonas

deprimidas con altas posibilidad de captar humedad es más alto el porcentaje de arena.

Análisis de Incertidumbre de la estimación del contenido de arena: En el cuadro 11, se

muestran los estadísticos de validación del modelo regresión-kriging aplicado al contenido de

arena.

Cuadro 11. Estadísticos de validación del modelo de regresion-kriging (arena).

De ellos se desprende que el modelo de regresión es positivo, ya que posee altos R2 y R

2aju

(0.74 y 0,67, respectivamente). Aplicando la ecuación de regresión a los datos dejados para la

validación se obtuvo un ERS bajo de 5,26 % y también se encontró que el 62 % de los puntos

tenían un error menor a 7 % de arena. En cuanto al kriging de los residuos el EMC fue bajo

(4,65 %), y con respecto a las diferencias (errores) mínimos y máximos de los puntos de

validación, se encontró un mínimo de 0,43 % y el máximo de 31 %, ambos en el proceso de

kriging. La suma de los valores absolutos de los errores refleja que en el caso de la arena el

kriging de los residuos no mejora la predicción. En cuanto a la sensibilidad de las covariables

ambientales y su contribución al R2, se tiene que de mayor a menor importancia se ordena: el

Índice de vegetación Normalizado (0,29), Modelo digital de elevación (0,21), Imagen Landsat

(Banda 4) (0,16), Área de captación (0,04) e Imagen Landsat (Banda 7) (0,02).

Parámetros estadísticos RLM Calibración RLM Validación Kriging residuos

Error Residual estándar (ERS) 5,26 % 5,26 % -

Coeficiente de determinación (R2) 0,74 - -

R2 ajustados (R2aju) 0,67 - -

Error mínimo 1,87x10-16

% 0,58 % 0,43 %

Error máximo -10,88 % 24,02 % 31,35 %

Frecuencia de errores - 62 % < 7 %

Error medio cuadrático (EMC) - - 4,65 %

Suma de los valores absolutos de los errores - 61,86 % 77,45 %

66

7.2.2. Limo (0 – 20 cm)

Mediante la función Spline se obtuvieron los valores de limo para los 40 puntos de

observación a una profundidad de 0 a 20 cm, encontrándose valores entre 14 % y 61 %. El

cuadro 12 muestra los datos sobre el limo y en la figura 26, se presenta el histograma de su

frecuencia. Para la calibración del análisis de regresión lineal múltiple (RLM) solo se

emplearon 32 de los 40 puntos originales y los otros 8 se dejaron para validar el modelo. Los

valores de limo del grupo de calibración también se incluyen en el cuadro 12.

Cuadro 12. Valores originales de limo (%).

Datos Min Q1 Mediana Media Q3 Max

Originales 14 17,9 21,82 24,23 27,68 61,09

Calibración 14 19 21,93 23,18 27,12 38,33

Figura 26. Histograma de limo (%).

El histograma de datos originales (Figura 26) muestra que los valores de limo tienden a la

normalidad, lo que se evidencia en la similitud de los valores de la mediana y media, los

valores entre 20 y 25 % de limo ocurren con mayor frecuencia. Sin embargo, los valores

extremos superiores a 50 % fueron corregidos y por eso en los valores de calibración el

máximo es 38,33 %.

La figura 27 muestra los resultados de la RLM, los cuales arrojaron que las covariables

significativas fueron el factor R, orientación de la pendiente, modelo digital de elevación y el

Channel_Network, todas ellas de alta significancia. La figura 27 también muestra que el

coeficiente de determinación ajustado (R2) fue de 0,718, y la figura 28 muestra un graficó con

la relación de los valores de limo medidos y los estimados por esta regresión.

Figuras 27 y 28. RLM, coeficientes de regresión y valores medidos y estimados (limo).

67

En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de

observación y compararlos con los datos medidos, se encontró que el máximo error era de -

7,75 % de limo, un mínimo muy cercano a cero (5,76x10-17

%) y, la mediana era de 0,27 %

(figura 29). También se comprobó la normalidad del comportamiento de dichos residuos

mediante la prueba de Shapiro-Wilk (0,64) que al ser mayor de 0.05 indica normalidad, y

también la Homoscedasticidad (varianza constante) de los errores en relación con las variables

independientes y dependiente, mediante la prueba Breusch-Pagan (0,62), que al ser mayor de

0.05 indica que hay heteroscedasticidad.

Figura 29. Características de los residuos o errores del modelo de regresión (limo).

A partir de los residuos o errores se construyó un gráfico de semivarianza (figura 30), de allí

se puede extraer que la varianza es de 8,95, el nugget es 0, el sill parcial es 8,95 y la

dependencia espacial es de 982 m. Al realizar una validación cruzada entre los valores

medidos y los estimados por el kriging, el error medio cuadrático (EMC) fue de 2,60 %. Se le

ajusto un modelo matemático gaussiano para la interpolación con kriging ordinario, y el mapa

de residuos obtenido se muestra en la figura 31.

Figura 30. Semivariograma de los residuos de limo.

68

Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables

significativas fue calculado el mapa de limo para toda la cuenca en SAGAGIS, el cual se

muestra en la figura 32. Finalmente en SAGAGIS se sumaron los mapas productos de la

ecuación de regresión y el de kriging de los residuos, y así se obtuvo el mapa definitivo del

atributo, visto en la figura 33.

Figuras 31 y 32. Mapa de limo kriging residuos y Mapa limo por regresión

Figura 33. Mapa de limo por regresion–kriging.

La figura 33 muestra un mapa de limo de regular naturalidad, encontrándose valores mayores

en las laderas altas del Sur de la cuenca y especialmente en las laderas occidentales. Esto

podría deberse en principio a un material geológico ligeramente diferente (Grupo San Julián).

69

Los valores menores se encuentran más hacia el norte especialmente hacia la fila de “La

Media Luna” donde predominan un material geológico de la formación Peña de Mora.

Continúa la tendencia como en la arena, de que a mayor altura menor % limo.

Análisis de Incertidumbre de la estimación del contenido de limo: En el cuadro 13, se

muestran los estadísticos de validación del modelo regresión-kriging aplicado al limo.

Cuadro 13. Estadísticos de validación del modelo de regresion-kriging (limo).

El modelo de regresión es positivo, ya que posee altos R2 y R

2aju (0.76 y 0,71)

respectivamente. Aplicando la ecuación de regresión a los datos dejados para la validación se

obtuvo un ERS bajo de 3,26 % y también se encontró que el 38 % de los puntos tenían un

error menor a 4 % de limo. En cuanto al kriging de los residuos el EMC fue bajo de 2,60 %, y

con respecto a las diferencias (errores) mínimos y máximos de los puntos de validación, se

encontró un mínimo de 3,12 % y el máximo de 13,69 %, ambos en el proceso de kriging. La

suma de los valores absolutos de los errores refleja que en el caso del limo el kriging de los

residuos mejora la predicción. En cuanto a la sensibilidad de las covariables ambientales y su

contribución a la formación del R2, se tiene que de mayor a menor importancia se ordena asi:

la Orientación de la pendiente (0,21), Factor R (0,20), Modelo digital de elevación (0,17), y

Channel_Network (0,16).

Parámetros estadísticos RLM Calibración RLM Validación Kriging residuos

Error Residual estándar (ERS) 3,26 % 3,26 % -

Coeficiente de determinación (R2) 0,76 - -

Coeficiente de determinación ajustados (R2aju) 0,71 - -

Error mínimo 5,76x10-17 % 3,85 % 3,12 %

Error máximo -7,75 % 13,44 % 13,69 %

Frecuencia de errores - 38 % < 4 %

Error medio cuadrático (EMC) - - 2,60 %

Suma de los valores absolutos de los errores - 66,62 % 61,51 %

70

7.2.3. Arcilla (0 – 20 cm)

Mediante la función Spline se obtuvieron los valores de arcilla para los 40 puntos de

observación a una profundidad de 0 a 20 cm, encontrándose valores entre 8 % y 28 %. El

cuadro 14 muestra datos sobre la arcilla y en la figura 34, se ve el histograma de su frecuencia.

Para la calibración del análisis de regresión lineal múltiple (RLM) solo se emplearon 32 de los

40 puntos originales y los otros 8 se dejaron para validar el modelo. Los valores de arcilla del

grupo de calibración también se incluyen en el cuadro 14.

Cuadro 14. Valores originales de arcilla (%).

Datos Min Q1 Mediana Media Q3 Max

Originales 8 14,7 19,74 18,77 22,06 28,87

Calibración 8 14,68 19,83 18,86 22,23 28,87

Figura 34. Histograma de arcilla (%).

Los valores de arcilla tienden a comportarse de manera normal lo que se evidencia en la

similitud de los valores de la mediana con respecto a la media, los valores entre 20 y 25 % de

arcilla ocurren con mayor frecuencia entre los puntos de observación (figura 34).

Los resultados de la RLM arrojaron que las covariables significativas (figura 35) fueron el

riesgo de erosión potencial, las imágenes satelitales (bandas 1 y 5), la temperatura media

anual, el sombreado, orientación de la pendiente, Índice de humedad y altitude_.above. Siendo

las imágenes las de mayor significancia, su coeficiente de determinación ajustado (R2) fue de

0,6185. La figura 36 muestra un graficó con la relación de los valores de arcillas medidos y los

estimados por esta regresión.

Figuras 35 y 36. RLM, coeficientes regresión y valor medido y estimado (arcilla 0-20 cm).

71

En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de

observación y compararlos con los datos medidos, se encontró que el máximo error era de

6,37 % de arcilla, un mínimo muy cercano a cero (1,13x10-16

%) y, la mediana era de -0,43 %

(figura 37). También se comprobó la normalidad del comportamiento de dichos residuos

mediante la prueba de Shapiro-Wilk (0,41) que al ser mayor de 0.05 indica normalidad, y

también la Homoscedasticidad (varianza constante) de los errores en relación con las variables

independientes y dependiente, mediante la prueba Breusch-Pagan (0,43), que al ser mayor de

0.05 indica que hay heteroscedasticidad.

Figura 37. Características de los residuos o errores del modelo de regresión (arcilla 0-20 cm).

A partir de los residuos o errores se construyó un gráfico de semivarianza (figura 38), de allí

se puede extraer que la varianza es de 21,92, el nugget es 4,42, el sill parcial es 18,50 y la

dependencia espacial es de 1710 m. Al realizar una validación cruzada entre los valores

medidos y los estimados por el kriging el error medio cuadrático (EMC) fue de 2,77 %. Se le

ajusto un modelo matemático esférico para la interpolación con kriging ordinario, y el mapa

de residuos obtenido se muestra en la figura 39.

Figura 38. Semivariograma de los residuos de la arcilla 0-20 cm.

72

Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables

significativas fue calculado el mapa de arcilla para toda la cuenca en SAGAGIS, el cual

muestra en la figura 40. Finalmente en SAGAGIS se sumaron los mapas productos de la

ecuación de regresión y el de kriging de los residuos, y así se obtuvo el mapa definitivo del

atributo, visto en la figura 41.

Figuras 39 y 40. Mapa de arcilla (0-20 cm) kriging residuos y Mapa arcilla por regresión

Figura 41. Mapa de arcilla (0-20 cm) por regresión–kriging.

La figura 41 muestra un mapa de arcillas (0-20cm) con un patrón de distribución poco claro.

Aunque la covariable geología no se consideró relevante, se aprecia que en las zonas donde la

73

formación geológica es Peña de Mora, los valores de arcillas son menores (al Norte “Fila la

Media Luna”) igual que en el limo; por el contrario los valores de arcillas se incrementan con

la altura hacia las laderas del Sur donde la formación geológica es San Julián. Los suelos con

mayor riesgo de erosión potencial, mayor índice de humedad (depresiones) y mayor altura

presentaron mayores valores de arcilla.

Análisis de Incertidumbre de la estimación del contenido de arcilla: En el cuadro 15, se

muestran los estadísticos de validación del modelo regresión-kriging aplicado a la arcilla.

Cuadro 15. Estadísticos de validación del modelo de regresion-kriging (arcilla 0-20 cm).

En este caso el modelo de regresión es positivo, ya que posee altos R2 y R

2aju (0.73 y 0,61)

respectivamente. Aplicando la ecuación de regresión a los datos dejados para la validación se

obtuvo un ERS bajo de 3,45 % y también se encontró que el 50 % de los puntos tenían un

error menor a 6 % de arcilla. En cuanto al kriging de los residuos el EMC fue bajo de 2,77 %,

y con respecto a las diferencias (errores) mínimos y máximos de los puntos de validación, se

encontró un mínimo de 0,33 % y el máximo de 10,14 %, ambos en el proceso de kriging. La

suma de los valores absolutos de los errores refleja que en el caso de la arcilla el kriging de los

residuos mejora la predicción. En cuanto a la sensibilidad de las covariables ambientales y su

contribución al R2, se tiene que de mayor a menor importancia se ordena así: la temperatura

media anual (0,26), la imagen satelitales (bandas 5) (0,16), riesgo de erosión potencial (0,06),

índice de humedad (0,06), el sombreado (0,05), altitude_.above (0,04), la imagen satelitales

(bandas 1) (0,04), y la orientación de la pendiente (0,03).

Parámetros estadísticos RLM

Calibración

RLM

Validación

Kriging

residuos

Error Residual estándar (ERS) 3,45 % 3,45 % -

Coeficiente de determinación (R2) 0,73 - -

Coeficiente de determinación ajustados

(R2aju)

0,61 - -

Error mínimo 1,13x10-16

% 3,12 % 0,33 %

Error máximo 6,37 % 12,34 % 10,14 %

Frecuencia de errores - 50 % < 6 %

Error medio cuadrático (EMC) - - 2,77 %

Suma de los valores absolutos de los errores - 52,76 % 43,41 %

74

7.2.4. Arcilla (20 – 50 cm)

Esta propiedad fue evaluada en dos profundidades, una de 0 – 20 cm (resultado anterior) y otra

de 20 – 50 cm, con el objetivo de conseguir algún incremento en el porcentaje de arcillas al

aumentar la profundidad, lo que reflejaría la presencia de un endopedon argilico.

Característico de suelos del orden alfisoles y ultisoles.

Mediante la función Spline se obtuvieron los valores de arcilla para 40 puntos de observación

a una profundidad de 20 a 50 cm, encontrándose valores entre 8 % y 39 %. En el cuadro 16 se

muestran los datos de arcilla y en la figura 42, se presenta el histograma de frecuencia. Para la

calibración de la RLM solo se emplearon 32 de los 40 puntos y los otros 8 se dejaron para

validar el modelo. Los valores de arcilla de calibración se incluyen en el cuadro 16.

Cuadro 16. Valor original arcilla 20-50 cm (%).

Datos Min Q1 Mediana Media Q3 Max

Originales 8 20,99 25,77 25,09 29,76 39,36

Calibración 8 18,94 25,77 24,23 28,38 39,36

Figura 42. Histograma arcilla 20-50 cm (%).

Los valores de arcilla tienden a la normalidad y los valores entre 25 y 30 % de arcilla ocurren

con mayor frecuencia (figura 42). Los resultados de la RLM (figura 43) arrojaron que las

covariables significativas fueron la precipitación median anual, las imágenes satelitales

(bandas 2,4 y 7) y los meses húmedos. El coeficiente de determinación ajustado (R2) fue de

0,7173 y finalmente la figura 44 muestra un graficó con la relación de los valores de arcillas

medidos y los estimados por esta regresión.

Figuras 43 y 44. RLM, coeficientes de regresión y valores de arcilla medidos y estimados

(arcilla 20-50 cm).

75

En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de

observación y compararlos con los datos medidos, se encontró que el máximo error era de

9,35 % de arcilla, un mínimo muy cercano a cero (2,46x10-17

%) y, la mediana era de -0,43 %

(figura 45). También se comprobó la normalidad del comportamiento de dichos residuos

mediante la prueba de Shapiro-Wilk (0,64) que al ser mayor de 0.05 indica normalidad, y

también la Homoscedasticidad (varianza constante) de los errores en relación con las variables

independientes y dependiente, mediante la prueba Breusch-Pagan (0,75), que al ser mayor de

0.05 indica que hay heteroscedasticidad.

Figura 45. Características de los residuos o errores del modelo regresión (arcilla 20-50 cm).

A partir de los residuos o errores se construyó un gráfico de semivarianza (figura 46), de allí

se puede extraer que la varianza es de 13,41, el nugget es 2,62, el sill parcial es 9,89 y la

dependencia espacial es de 851 m. Al realizar una validación cruzada entre los valores

medidos y los estimados por el kriging el error medio cuadrático (EMC) fue de 3,9 %. Se le

ajustó un modelo matemático gaussiano para la interpolación con kriging ordinario, y el mapa

de residuos obtenido se muestra en la figura 47.

Figura 46. Semivariograma de los residuos de arcilla (20-50 cm).

76

Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables

significativas fue calculado el mapa de arcilla para toda la cuenca en SAGAGIS (figura 48), y

finalmente en SAGAGIS se sumaron los mapas productos de la ecuación de regresión y el de

kriging de los residuos, y así se obtuvo el mapa definitivo del atributo (figura 49).

Figuras 47 y 48. Mapa de arcilla (20-50 cm) kriging residuos y Mapa arcilla por regresión.

Figura 49. Mapa de arcilla (20-50 cm) por regresion–kriging.

La figura 49 muestra el mapa de arcilla a una profundidad entre 20 y 50 cm. En él se observa

que esta propiedad se distribuye de acuerdo a la precipitación y humedad. Los valores

mayores se encuentran tanto en la parte Norte a salidas de la cuenca donde desemboca el rio

Canoabo al Temerla, como al extremo Sureste en las laderas altas del sector Palmichal, ambas

77

zonas tienen la mayor cantidad de precipitación al año. Por el contrario los valores menores de

arcilla en el subsuelo se encuentran en el área central donde llueve menos y en las laderas

occidentales que se orientan hacia el Este, donde se aprecia mayor radiación diario y una

vegetación de menor porte. De manera general para los rangos de lluvia de la zona, a mayor

precipitación mayor iluviacion por ende mayor cantidad de arcilla en el subsuelo, por esta

razón los suelos que dominan en la cuenca son los alfisoles y ultisoles.

Análisis de Incertidumbre de la estimación de la arcilla: En el cuadro 17, se muestran los

estadísticos de validación del modelo regresión-kriging aplicado al contenido de arcilla.

Cuadro 17. Estadísticos de validación del modelo de regresion-kriging (arcilla 20-50 cm).

El modelo de regresión es positivo, ya que posee altos R2 y R

2aju (0.77 y 0,71)

respectivamente. Aplicando la ecuación de regresión a los datos dejados para la validación se

obtuvo un ERS bajo de 4,07 % y también se encontró que el 55 % de los puntos tenían un

error menor a 9 % de arcilla. En cuanto al kriging de los residuos el EMC fue bajo de 3,9 %, y

con respecto a las diferencias (errores) mínimos y máximos de los puntos de validación, se

encontró un mínimo de 0,55 % y el máximo de 15,69 %, ambos en el proceso de kriging. La

suma de los valores absolutos de los errores refleja que en el caso de la arcilla 20 – 50 cm el

kriging de los residuos mejora la predicción. En cuanto a la sensibilidad de las covariables

ambientales y su contribución a la formación del R2, se tiene que de mayor a menor

importancia se ordena así: imagen satelital (Banda 2) (0,29), precipitación median anual

(0,27), imagen satelital (bandas 4) (0,12), numero de meses húmedos (0,06), imagen satelital

(Banda 7) (0,01).

Parámetros estadísticos RLM

Calibración

RLM

Validación

Kriging

residuos

Error Residual estándar (ERS) 4,07 % 4,07 % -

Coeficiente de determinación (R2) 0,77 - -

Coeficiente de determinación ajustados

(R2aju)

0,71 - -

Error mínimo 2,47x10-17

% 1,95 % 0,55 %

Error máximo 9,35 % 16,77 % 15,69 %

Frecuencia de errores - 55 % < 9 %

Error medio cuadrático (EMC) - - 3,9 %

Suma de los valores absolutos de los errores - 75,32 % 70,45 %

78

7.2.5. Materia orgánica (0 – 20 cm)

Mediante la función Spline se obtuvieron los valores de materia orgánica (MO) para los 40

puntos de observación a una profundidad de 0 a 20 cm, encontrándose valores entre 0,44 % y

6,5 %. El cuadro 18 muestra datos sobre MO y en la figura 50, se ve el histograma de su

frecuencia. Para la calibración del análisis de regresión lineal múltiple (RLM) solo se

emplearon 32 de los 40 puntos originales y los otros 8 se dejaron para validar el modelo. Los

valores de materia orgánica del grupo de calibración también se incluyen en el cuadro 18.

Cuadro 18. Valor original de materia orgánica (%).

Datos Min Q1 Mediana Media Q3 Max

Originales 0,44 2,02 2,7 2,83 3,4 6,5

Calibración 0,87 2,06 2,89 2,79 3,43 4,8

Figura 50. Histograma de materia orgánica (%).

Del histograma se aprecia que los valores de MO tienden a la normalidad, lo que se evidencio

en la similitud de los valores de la mediana con respecto a la media, los valores entre 2 y 4 %

de materia orgánica ocurren con mayor frecuencia (figura 50).

La figura 51, muestra los resultados de la RLM, arrojando que las covariables significativas

fueron el Índice de vegetación normalizado, el modelo digital de elevación, el

channel_network y número de meses húmedos. Su coeficiente de determinación ajustado (R2)

fue de 0,68 y finalmente la figura 52 muestra un graficó con la relación de los valores de

materia orgánica medidos y los estimados por esta regresión.

Figuras 51 y 52. RLM, coeficientes de regresión y valores medidos y estimados de MO

79

En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de

observación y compararlos con los datos medidos, se encontró que el máximo error era de

0,81 % de MOS, un mínimo muy cercano a cero (1,04x10-16

%) y, la mediana era de 0,05 %

(figura 53). También se comprobó la normalidad del comportamiento de dichos residuos

mediante la prueba de Shapiro-Wilk (0,27) que al ser mayor de 0.05 indica normalidad, y

también la homoscedasticidad (varianza constante) de los errores en relación con las variables

independientes y dependiente, mediante la prueba Breusch-Pagan (0,81), que al ser mayor de

0.05 indica que hay heteroscedasticidad.

Figura 53. Características de los residuos o errores del modelo regresión (materia orgánica).

A partir de los residuos o errores se construyó un gráfico de semivarianza (figura 54), de allí

se puede extraer que la varianza es de 0,19, el nugget es 0,06, el sill parcial es 0,13 y la

dependencia espacial es de 4164 m. Al realizar una validación cruzada entre los valores

medidos y los estimados por el kriging el error medio cuadrático (EMC) fue de 0,42 %. Se le

ajustó un modelo matemático esférico para la interpolación con kriging ordinario, y el mapa

de residuos obtenido se muestra en la figura 55.

Figura 54. Semivariograma de los residuos de materia orgánica.

80

Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables

significativas fue calculado el mapa de materia orgánica para toda la cuenca en SAGAGIS, el

cual muestra en la figura 56, y finalmente en SAGAGIS se sumaron los mapas productos de la

ecuación de regresión y el de kriging de los residuos, y así se obtuvo el mapa definitivo del

atributo, visto en la figura 57.

Figuras 55 y 56. Mapas de materia orgánica kriging residuos y por regresión

Figura 57. Mapa de materia orgánica por regresion–kriging.

La figura 57 muestra el mapa de materia orgánica de la cuenca, en el mismo se aprecia lo

concéntrico que se distribuye, encontrándose los valores más bajos en el centro de la cuenca,

en el valle, y va incrementado a medida que la altura sobre el nivel de mal se hace mayor. Este

81

comportamiento se debe a que a mayor altura, la temperatura decrece, la humedad aumenta, y

la vegetación se hace más densa, hasta llegar al bosque nublado en las laderas altas, y allí la

abundante vegetación favorece la producción de materia orgánica y las bajas temperaturas

reducen la tasa de descomposición de la materia orgánica, favoreciendo su acumulación.

Análisis de Incertidumbre de la estimación de la materia orgánica: En el cuadro 19, se

muestran los estadísticos de validación del modelo regresión-kriging aplicado a la materia

orgánica.

Cuadro 19 Estadísticos de validación del modelo de regresion-kriging (MO).

El modelo de regresión es positivo, ya que posee altos R2 y R

2aju (0.73 y 0,68)

respectivamente. Aplicando la ecuación de regresión a los datos dejados para la validación se

obtuvo un ERS bajo de 0,48 % y también se encontró que el 75 % de los puntos tenían un

error menor a 0,14 % de materia orgánica. En cuanto al kriging de los residuos el EMC fue

bajo de 0,42 %, y con respecto a las diferencias (errores) mínimos y máximos de los puntos de

validación, se encontró un mínimo de 0,03 % y el máximo de 1,57 %, ambos en el proceso de

kriging. La suma de los valores absolutos de los errores refleja que en el caso de la materia

orgánica el kriging de los residuos no mejora la predicción. En cuanto a la sensibilidad de las

covariables ambientales y su contribución a la formación del R2, se tiene que de mayor a

menor importancia se ordena así: Índice de vegetación normalizado (0,33), channel_network

(0,19), modelo digital de elevación (0,14), y número de meses húmedos (0,06).

Parámetros estadísticos RLM

Calibración

RLM

Validación

Kriging

residuos

Error Residual estándar (ERS) 0,48 % 0,48 % -

Coeficiente de determinación (R2) 0,73 - -

Coeficiente de determinación ajustados

(R2aju)

0,68 - -

Error mínimo 1,04x10-17

% 0,02 % 0,03 %

Error máximo 0,81 % 1,39 % 1,57 %

Frecuencia de errores - 75 % < 0,14

Error medio cuadrático (EMC) - - 0,42 %

Suma de los valores absolutos de los errores - 3,44 % 4,09 %

82

7.2.6. pH (0 – 20 cm)

Mediante la función Spline se obtuvieron los valores de pH para los 40 puntos de observación

a una profundidad de 0 a 20 cm, encontrándose valores entre 3,7 y 8,1. El cuadro 20 muestra

datos sobre pH y en la figura 58, se ve el histograma de su frecuencia. Para la calibración del

análisis de regresión lineal múltiple (RLM) solo se emplearon 32 de los 40 puntos originales y

los otros 8 se dejaron para validar el modelo. Los valores de pH del grupo de calibración

también se pueden ver en el cuadro 20.

Cuadro 20. Valores originales de pH (0 – 20 cm).

Datos Min Q1 Mediana Media Q3 Max

Originales 3,7 4,7 4,8 5,1 5,1 8,1

Calibración 3,7 4,7 4,8 4,9 5,1 6,1

Figura 58. Histograma de pH (0-20 cm).

Del histograma (figura 58) se aprecia que los valores de pH tienden a la normalidad, lo que se

evidencia en la similitud de los valores de la mediana con respecto a la media, los valores

entre 4,5 y 5,5 de pH ocurren con mayor frecuencia entre los puntos de observación.

Los resultados de la RLM (figura 59), arrojaron que las covariables significativas fueron el

riesgo de erosión potencial, formaciones geológicas, índice de humedad y número de meses

húmedos, todas de moderada significancia, su coeficiente de determinación ajustado (R2) fue

de 0,52. En la figura 60 se ve un graficó con la relación de los valores de pH medidos y los

estimados por esta regresión.

Figuras 59 y 60. RLM, coeficientes regresión y valores de medidos y estimados (pH 0-20 cm)

83

En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de

observación y compararlos con los datos medidos, se encontró que el máximo error era de

0,66 de pH, un mínimo muy cercano a cero (2,5x10-17

) y, la mediana era de 0,02 (figura 61).

También se comprobó la normalidad del comportamiento de dichos residuos mediante la

prueba de Shapiro-Wilk (0,74) que al ser mayor de 0.05 indica normalidad, y también la

Homoscedasticidad (varianza constante) de los errores en relación con las variables

independientes y dependiente, mediante la prueba Breusch-Pagan (0,62), que al ser mayor de

0.05 indica que hay heteroscedasticidad.

Figura 61. Características de los residuos o errores del modelo de regresión (pH 0-20 cm).

A partir de los residuos o errores se construyó un gráfico de semivarianza (figura 62), de allí

se puede extraer que la varianza es de 0,112 el nugget es 0,045 el sill parcial es 0,067 y la

dependencia espacial es de 1143 m. Al realizar una validación cruzada entre los valores

medidos y los estimados por el kriging el error medio cuadrático (EMC) fue de 0,3. Se le

ajusto un modelo matemático esférico para la interpolación con kriging ordinario, y el mapa

de residuos obtenido se muestra en la figura 63.

Figura 62. Semivariograma de los residuos de pH 0-20 cm.

84

Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables

significativas fue calculado el mapa de pH para toda la cuenca en SAGAGIS, el cual muestra

en la figura 64. Finalmente en SAGAGIS se sumaron los mapas productos de la ecuación de

regresión y el de kriging de los residuos, y así se obtuvo el mapa definitivo del atributo, visto

en la Figura 65.

Figuras 63 y 64. Mapa de pH (0 – 20 cm) kriging residuos y Mapa pH por regresión

Figura 65. Mapa de pH (0 – 20 cm) por regresión–kriging.

La figura 65 muestra el mapa de pH superficial, donde se puede ver que su distribución esta

influenciadas por factores como la geología, aspecto este que es el material originario de los

suelos. En este sentido la formación de Granito Guaremal ubicada en el centro de la cuenca

presento los pH más altos. Otro factor es la humedad (número de meses húmedos y el índice

85

de humedad topográficos), es decir a mayor número de meses húmedos menor pH, debido a

que los suelos están expuestos con más frecuencias a procesos de lavados de cationes por las

precipitaciones, lo que favorece la disminución del pH de los suelo. Es bueno señalar que se

encontró que suelos con pH bajos poseen mayor riesgo de erosión potencial. Tal vez, esto se

deba a que la baja fertilidad de los suelos ácidos, imposibilita sostener una densa cobertura

vegetal protectora de la superficie al impacto de la gota de lluvia.

Análisis de Incertidumbre de la estimación del pH: En el cuadro 21, se muestran los

estadísticos de validación del modelo regresión-kriging aplicado a los valores de pH.

Cuadro 21. Estadísticos de validación del modelo de regresion-kriging (pH 0-20 cm).

De ellos se desprende que el modelo de regresión es positivo, ya que posee moderados R2 y

R2aju (0.59 y 0,52) respectivamente. Aplicando la ecuación de regresión a los datos dejados

para la validación se obtuvo un ERS bajo de 0,33 y también se encontró que el 50 % de los

puntos tenían un error menor a 0,2 de pH. En cuanto al kriging de los residuos el EMC fue

bajo de 0,3, y con respecto a las diferencias (errores) mínimos y máximos de los puntos de

validación, se encontró un mínimo de 0,06 y el máximo de 0,76, ambos en el proceso de

kriging. La suma de los valores absolutos de los errores refleja que en el caso del pH el kriging

de los residuos no mejora la predicción. En cuanto a la sensibilidad de las covariables

ambientales y su contribución a la formación del R2, se tiene que de mayor a menor

importancia se ordena así: formaciones geológicas (0,28), riesgo de erosión potencial (0,14),

numero de meses húmedos (0,11) y, índice de humedad (0,04).

Parámetros estadísticos RLM

Calibración

RLM

Validación

Kriging

residuos

Error Residual estándar (ERS) 0,33 0,33 -

Coeficiente de determinación (R2) 0,59 - -

Coeficiente de determinación ajustados

(R2aju)

0,52 - -

Error mínimo 2,53x10-17

0,006 0,06

Error máximo 0,66 0,87 0,76

Frecuencia de errores - 50 % < 0,2

Error medio cuadrático (EMC) - - 0,3

Suma de los valores absolutos de los errores - 2,35 2,37

86

7.2.7. pH (50 – 200 cm)

Esta propiedad se evaluó en dos profundidades una de 0 - 20 cm (resultado anterior) y otra de

50 – 200 cm, para identificar suelos con pH bajos a grandes profundidades, que podrían

identificar suelos del orden ultisol, los cuales poseen baja saturación con base a 180 cm.

Mediante la función Spline se obtuvieron los valores de pH para los 40 puntos a una

profundidad de 50 a 200 cm, encontrándose valores entre 4,21 y 5,2. El cuadro 22 muestra

datos sobre el pH y en la figura 66, se puede ver el histograma. Para la calibración del análisis

de regresión lineal múltiple (RLM) se emplearon 32 de los 40 puntos y los otros 8 se dejaron

para validar el modelo. Los valores de pH de calibración se incluyen en el cuadro 22.

Cuadro 22. Valor original de pH (50 – 200 cm).

Datos Min Q1 Mediana Media Q3 Max

Originales 4,21 4,6 5,1 5,3 5,2 9

Calibración 4,2 4,6 5,2 5,3 5,4 8,1

Figura 66. Histograma de pH (50-200 cm).

Se aprecia que los pH tienden a no comportarse de manera normal. Los valores entre 4 y 6 de

pH ocurren con mayor frecuencia (figura 66). Los resultados de la RLM (figura 67) arrojaron

que las covariables significativas fueron el riesgo de erosión potencial, modelo digital de

elevación, índice de convergencia e imagen Landsat (Banda 6a), su coeficiente de

determinación ajustado (R2) fue de 0,91. En la figura 68 se observa un graficó con la relación

de los valores de pH medidos y los estimados por esta regresión.

Figuras 67 y 68. RLM, coeficientes regresión y valores medidos y estimados (pH 50-200 cm).

87

En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de

observación y compararlos con los datos medidos, se encontró que el máximo error era de

0,58 de pH, un mínimo muy cercano a cero (2,53x10-18

) y, la mediana era de 0,037 (figura 69).

También se comprobó la normalidad del comportamiento de dichos residuos mediante la

prueba de Shapiro-Wilk (0,99) que al ser mayor de 0.05 indica normalidad, y también la

Homoscedasticidad (varianza constante) de los errores en relación con las variables

independientes y dependiente, mediante la prueba Breusch-Pagan (0,77), que al ser mayor de

0.05 indica que hay heteroscedasticidad.

Figura 69. Características de los residuos o errores del modelo de regresión (pH 50-200 cm).

A partir de los residuos o errores se construyó un gráfico de semivarianza (figura 70), de allí

se puede extraer que la varianza es de 0,11 el nugget es 0,068 el sill parcial es 0,037 y la

dependencia espacial es de 982 m. Al realizar una validación cruzada entre los valores

medidos y los estimados por el kriging el error medio cuadrático (EMC) fue de 0,28. Se le

ajusto un modelo matemático gaussiano para la interpolación con kriging ordinario, y el mapa

de residuos obtenido se muestra en la figura 71.

Figura 70. Semivariograma de los residuos de pH 50-200 cm.

88

Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables

significativas fue calculado el mapa de pH para toda la cuenca en SAGAGIS, el cual muestra

en la figura 72. Finalmente en SAGAGIS se sumaron los mapas productos de la ecuación de

regresión y el de kriging de los residuos, y así se obtuvo el mapa definitivo del atributo, visto

en la figura 73.

Figuras 71 y 72. Mapa de pH (50 - 200 cm) kriging residuos y Mapa pH por regresión.

Figura 73. Mapa de pH (50 – 200 cm) por regresión–kriging.

La figura 73, muestra el mapa de pH de los suelos a la profundidad de 50 a 200 cm. En él se

observa una distribución poco clara, sin embargo se puede ver que los valores más bajos de

pH, son frecuentes en suelos con mayor humedad al año y donde las precipitaciones han

89

tenido el tiempo necesario para provocar el lavado intenso de cationes hasta en profundidad.

Los valores más altos de pH se encuentran en el Valle central en zonas bajas. Finalmente se

observó que suelos con pH bajos y poca cobertura vegetal presentan mayor riesgo de erosión,

probablemente porque su cobertura vegetal es menor y proveen poca protección contra el

impacto de la gota de lluvia.

Análisis de Incertidumbre de la estimación del pH: En el cuadro 23, se muestran los

estadísticos de validación del modelo regresión-kriging aplicado del pH.

Cuadro 23. Estadísticos de validación del modelo de regresion-kriging (pH 50-200 cm).

El modelo de regresión es positivo, ya que posee altos R2 y R

2aju (0.93 y 0,91)

respectivamente. Aplicando la ecuación de regresión a los datos dejados para la validación se

obtuvo un ERS bajo de 0,3 y también se encontró que el 60 % de los puntos tenían un error

menor a 0,5 de pH. En cuanto al kriging de los residuos el EMC fue bajo de 0,28, y con

respecto a las diferencias (errores) mínimos y máximos de los puntos de validación, se

encontró un mínimo de 0,02 y el máximo de 1,39 ambos en el proceso de kriging. La suma de

los valores absolutos de los errores refleja que en el caso del pH el kriging de los residuos

mejora la predicción. En cuanto a la sensibilidad de las covariables ambientales y su

contribución a la formación del R2, se tiene que de mayor a menor importancia se ordena así:

el riesgo de erosión potencial (0,58), modelo digital de elevación (0,23), imagen Landsat

(Banda 6a) (0,06), índice de convergencia (0,05).

Parámetros estadísticos RLM

Calibración

RLM

Validación

Kriging

residuos

Error Residual estándar (ERS) 0,3 0,3 -

Coeficiente de determinación (R2) 0,93 - -

Coeficiente de determinación ajustados

(R2aju)

0,91 - -

Error mínimo 2,08x10-18

0,05 0,02

Error máximo 0,58 1,48 1,39

Frecuencia de errores - 60 % < 0,5

Error medio cuadrático (EMC) - - 0,28

Suma de los valores absolutos de los errores - 2,75 2,65

90

7.3. COMPARACIÓN DE LOS METODOS CARTOGRAFICOS CONTRA UN

MAPA DE SUELOS REALIZADO DE MANERA CONVENCIONAL.

A continuación se describen los resultados de las comparaciones entre los métodos de

cartografía digital empleados en este estudio.

7.3.1. Concordancia entre el método neuro-borroso y el levantamiento Convencional

El método neuro-borroso agrupo los suelos de la cuenca en once (11) clases, más una clase

adicional correspondiente al embalse del Rio Canoabo. Pero al no coincidir la cantidad, ni la

denominación de las clases con las del mapa convencional, se procedió a reclasificarlo, es

decir llevar estas once (11) clases a seis (6) y se denominó cada clase igual que en el mapa de

suelo convencional. (Ver cuadro 24, figura 16 y figura 7).

Cuadro 24. Clases fisiográficas del mapa producido por el método neuro-borroso.

Método neuro-borroso

Clase fisiográficas salidas del

método neuro-borroso

Reclasificada según mapa de

método convencional

1 5

2 4

3 3

4 1

5 4

6 2

7 3

8 6

9 3

10 4

11 2

15 7

La figura 74 muestra la distribución espacial de la clase de ambos métodos (convencional y

neuro-borroso). En ellas se aprecia mucha concordancia en cuanto a las clases y su alcance,

especialmente en las clases 3 y 4. Llama la atención la precisión del modelo neuro-borroso

para colocar el límite entre las clases 3 y 4, el cual coincide casi con exactitud con el mostrado

en el mapa convencional, esta línea se relacionó con variables de altura y clima, las cuales

reflejan un cambio evidente en la vegetación y por ende en los suelos. Así también se observó

91

como el NDVI ejerce un gran peso en la identificación de la clase 1, la cual se caracteriza por

un mayor grado de erosión de los suelos. (Ver figura 74).

Figura 74. Mapa de clases de suelos convencional y Mapa de clases neuro-borrosas.

Para cuantificar un poco estos resultados de concordancia se muestran los resultados del

cuadro 25.

Cuadro 25. Matriz de errores entre clases (métodos convencional y neuro-borroso)

ID 1 2 3 4 5 6 7 SUMA

SUMA 1 3119 941 51 680 1023 358 3 6175

2 717 2042 5 1767 910 541 2 5984

3 51 58 14679 2528 0 0 0 17316

4 2134 5353 1319 10531 164 0 2 19503

5 1076 1664 8 919 1977 780 3 6427

6 53 45 1 32 576 867 1 1575

7 7 4 0 0 6 1 914 932

SUMA 7157 10107 16063 16457 4656 2547 925 57912

El anterior cuadro 25, muestra la matriz de errores, donde se ven los éxitos de clasificación de

los puntos de observación a lo largo de la diagonal (color verde) y la no concordancia en los

triángulos superiores e inferiores de esta diagonal. Los valores de referencia (mapa

convencional) se encuentran en las columnas y los valores de clasificación (mapa neuro-

borroso) en las filas. Como se ve la clase con mayor acierto fue la 3 con 14.679 puntos

92

correctos de un total de 16.063, seguida de la clase 4 (10.531 puntos de 16.457) y clase 1 con

3.119 puntos de un total de 7.157. La clase 7 no se analizó ya que es embalse del Rio

Canoabo.

Por otro lado el cuadro 26 reporta la exactitud del método neuro-borroso mediante diferentes

parámetros, donde resalta que para las clases 3 y 4 el modelo reflejo la mayor precisión de

productor (Sensibilidad), con valores próximos a 1, las clases 1 (0.43) y 5 (0.42) fueron

moderadamente acertadas y las clases que mostraron mayor dificultad de ser reconocidas por

el modelo fueron la clase 7 (0.34) y la clase 2 (0.20).

Cuadro 26. Reporte de exactitud (métodos convencional y neuro-borroso)

Clases Precisión de

productor

Precisión

de usuario Especificidad

Error por

omisión Error por comisión

1 0.435797 0.505101 0.939789 0.564203 0.060211

2 0.202038 0.341243 0.917540 0.797962 0.082460

3 0.913839 0.847713 0.936988 0.086161 0.063012

4 0.639910 0.539968 0.783573 0.360090 0.216427

5 0.424613 0.307609 0.916441 0.575387 0.083559

6 0.340400 0.550476 0.987212 0.659600 0.012788

7 0.988108 0.980687 0.999684 0.011892 0.000316

De manera general el modelo neuro-borroso evidencio un Índice de concordancia (IC) o

sensibilidad de moderada a alta de 0.58, es decir casi el 60 % de los casos fueron acertados. La

probabilidad de que un punto de observación no fue clasificado como de una clase cuando no

pertenecía a esa clase (Especificidad) resulto alta de 0.93. La proporción de puntos no

clasificados como de una clase, cuando en realidad es de ella (Error por omisión), resulto

moderada a baja con un valor de 0.41. La Proporción de puntos clasificados como de una clase

cuando se observa en realidad no ser de ella (Error por comisión), fue de muy baja con un

valor de 0.06, y el coeficiente Kappa que trata de eliminar el efecto del azar en la predicción

de la concordancia resulto moderada con un valor de 0.47. En este caso, el valor de p

<0,00001 sugiere el modelo es casi seguro que predice la distribución de las clases mejor que

el azar (Ver cuadro 27).

93

Cuadro 27. Estadísticos generales (métodos convencional y neuro-borroso)

Parámetros Valor Parámetros Valor

Indice de concordancia (IC) 0.589325 Error por omisión global 0.410675

Clasificación errónea global 0.410675 Error por comisión global 0.068446

Sensibilidad global 0.589325 Coeficiente Kappa (CK) 0.473344

Especificidad global 0.931554 P < 0.00001

7.3.2. Concordancia entre el método regresion-kriging y el levantamiento Convencional

Este método produjo un mapa de “Propiedades de suelos” con siete (7) clases, el cual

resulto de combinar seis (6) propiedades (arena, limo, arcilla 0-20 cm, arcilla 20-50 cm,

pH 0-20 cm y pH 50-200cm). Estas clases fueron reclasificadas buscando la mayor

concordancias con el mapa de suelos realizado convencionalmente (Ver cuadro 28 y figura

75).

Cuadro 28. Clases fisiográficas del mapa producido por el método regresion-kriging.

Método regresion-kriging

Clase de Propiedades de los suelos,

salida del método regresión-kriging

Reclasificada según mapa

de método convencional

1 3

2 1

4 6

5 4

6 2

7 3

8 3

La figura 75. Muestra que de las sietes clase del mapa regresion-kriging solo coincidieron

cinco (5) clases de suelos en el mapa convencional (Clases: 1, 2, 3, 4 y 6). Sin embargo

aunque no aparecen todas las seis clases de suelos del mapa convencional, las cinco que

aparecen se corresponden espacialmente muy bien, especialmente la clase 3 y 1.

94

Figura 75. Mapa de clases de suelos convencional y Mapa de clases regresion-kriging.

Para cuantificar esta comparación se muestran la matriz de errores en el cuadro 29, donde se

aprecia que el modelo tuvo una alta precisión en la clasificación de los suelos clase 3 (12.578

puntos de 16.063) y una moderada precisión en clasificar los suelos clase 1 (3.096 puntos de

7.157). Sin embargo en las demás clases su precisión fue baja como en la clase 4 (2749 puntos

de 16.457) donde el modelo fue incapaz de clasificarlo bien.

Cuadro 29. Matriz de errores entre clases (métodos convencional y regresion-kriging)

CLASES 1 2 3 4 6 SUMA

1 3096 2335 153 1737 765 8086

2 1898 3601 882 5736 184 12301

3 972 1040 12578 5131 498 20219

4 853 2399 1198 2749 193 7392

6 338 732 1252 1104 907 4333

SUMA 7157 10107 16063 16457 2547 52331

El cuadro 30 complementa lo mencionado anteriormente donde se observa que las clase 3

tiene una sensibilidad (precisión de productor) alta con un valor de 078, las clases 1 (0.43), la

clase 2 (0.35) y la clase 6 (0.35) con valores moderados y la clase 4 presento el valor menor de

precisión 0.16.

95

Cuadro 30. Reporte de exactitud (métodos convencional y regresion-kriging)

Clases Precisión de

productor

Precisión de

usuario Especificidad Error por omisión Error por comisión

1 0.432583 0.382884 0.889538 0.567417 0.110462

2 0.356288 0.292740 0.793956 0.643712 0.206044

3 0.783042 0.622088 0.789318 0.216958 0.210682

4 0.167041 0.371889 0.870575 0.832959 0.129425

6 0.356105 0.209324 0.931183 0.643895 0.068817

De manera general el modelo regresion-kriging mostro un índice de concordancia o

sensibilidad moderada de 0.43, es decir solo el 40 % de los casos fueron concordante con el

mapa convencional. La probabilidad de que un punto de observación no fue clasificado como

de una clase cuando no pertenecía a esa clase (Especificidad) resulto alta de 0.85. La

proporción de puntos no clasificados como de una clase, cuando en realidad es de ella (Error

por omisión), resulto moderada a alta con un valor de 0.56. La Proporción de puntos

clasificados como de una clase cuando se observa en realidad no ser de ella (Error por

comisión), fue bajo con un valor de 0.14, y El coeficiente Kappa que trata de eliminar el efecto

del azar en la concordancia resulto bajo con un valor de 0.26. En este caso, el valor de p

<0,00001 sugiere el modelo es casi seguro que predice la distribución de las clases mejor que

el azar (Ver cuadro 31).

Cuadro 31. Estadísticos generales (métodos convencional y regresion-kriging)

Parámetros Valor Parámetros Valor

Índice de concordancia (IC) 0.438192 Error por omisión global 0.561808

Clasificación errónea global 0.561808 Error por comisión global 0.140452

Sensibilidad global 0.438192 Coeficiente Kappa (CK) 0.266972

Especificidad global 0.859548 P < 0.00001

Finalmente al analizar el Índice de concordancia (IC) y el coeficiente kappa (CK) obtenidos

por ambos métodos cartográficos (neuro-borroso y regresión kriging). Se podría señalar que el

método neuro-borroso resulto mejor al compararlo con un levantamiento de suelo

convencional. Tal vez debido a que su filosofía u objetivo sea la de obtener una clasificación o

estratificación de la superficie de las tierras, aspecto que es muy parecido a la

fotointerpretación que realiza un experto agrologo para obtener las unidades fisiográficas o

96

preliminares de suelo en un levantamiento convencional. Por el contario la regresión kriging

se basa fundamentalmente en la generación de mapas continuos de propiedades de los suelos.

Aspecto que no necesariamente expresaría separaciones claras en las unidades de suelos. Por

lo tanto debido a los objetivos de cada método, se podría decir que ellos no son contrarios,

más bien pueden se complementarios.

97

8. CONCLUSIONES

A partir de los resultados obtenidos, se puede concluir lo siguiente:

Se considera importante el estudio de métodos de cartografía digital de suelos, especialmente

en suelos de montañas con relieves accidentados y vegetación boscosa, de gran frecuencia en

el país. Ello es debido a que dichos métodos tienen la bondad de manejar, integrar e interpretar

abundante información de variables ambientales (factores formadores) y aplicar sus modelos

matemáticos para estratificar el área de estudio en clases fisiográficas que apoyen al foto-

interprete, y predecir propiedades de los suelos en sitios de difícil acceso. Todos los anteriores

se considerado clave para una buena cartografía de los suelos en regiones de montañas.

Por otro lado el modelo digital de elevación evidencio en la cuenca un relieve montañoso

dispuesto en forma de herradura con su abertura hacia el extremo norte. Estas montañas

envuelven el estrecho y alargado valle del Rio Canoabo, y esta característica favoreció la

aplicación de los métodos de cartografía digital, ya que estos se comportan mejor en relieves

accidentados.

Método neuro-borroso

Mediante la aplicación del método neuro-borroso, se lograron separar los suelos de la cuenca

en once clases fisiográficas o clases tentativas de suelos, en lo cual, se notó que la altura sobre

el nivel medio del mar, la orientación de las laderas, la pendiente, la cobertura vegetal y el

índice de humedad son las variables más importantes a la hora de diferenciar clases

fisiográficas. Por el contrario el perfil y el plano de curvatura del terreno y el área de captación

no aportaron para la separación de las clases.

No todas las clases fisiográficas tuvieron la misma consistencia para mostrarse en las

diferentes corridas del método neuro-borroso. Es así que los suelos en laderas altas bajo

bosque nublado, los suelos en laderas medias bajo bosques semideciduos y los suelos en

ladera bajas erosionados, fueron las clases tentativas de suelos más consistentes en todas las

corridas. El resto de clases podría o no aparecer.

Los resultados del método neuro-borroso también arrojaron que si la superficie del terreno es

cónvexa, las pendientes son altas y la cobertura vegetal es baja, las áreas muestran alto riesgo

de erosión.

La comparación de los resultados del método neuro-borroso con el mapa levantado

convencionalmente mostró una buena concordancia especialmente en la distribución espacial,

alcance y límites de las unidades cartográficas. Ello ocurrió así, especialmente en las clases

con suelos en laderas altas bajo bosque nublados y los suelos en ladera medias bajo bosques

98

semideciduos, donde la concordancia alcanzo un 91 % y 63 % respectivamente. Por el

contrario donde no mostro fortaleza el método fue en los suelos planos de los valles con 31 %

de concordancia y en las laderas bajas donde coincidió solo en el 20 % de los casos. Sin

embargo de manera general el método neuro-borroso tuvo un índice de concordancia (IC) de

moderado a alto en toda la cuenca, rondando el 60 % (Sensibilidad de 0,58) y un coeficiente

kappa (CK) moderado de 0,47.

Método regresión-kriging

Por otro lado el modelo de regresion-kriging cartografió adecuadamente las siete propiedades

consideradas en este estudio (arena, limo, arcilla0-20 cm, arcilla20-50 cm, materia orgánica,

pH0-20 cm y pH50-200 cm), evidencia de esto fueron los altos coeficiente de determinación

resultantes, los cuales, están entre 0,59 y 0,93. Además cuando se aplicó el modelo a los

puntos dejados para su validación, los errores obtenidos en el caso de las texturas fueron

menores al 7 %, en la materia orgánica menor a 0,14 y en el pH los errores no resultaron

mayores a 0,2.

Para el método regresión-kriging, las variables más importantes para estimar las propiedades

de los suelos fueron la altura sobre el nivel medio del mar, el número de meses húmedo, el

índice de vegetación y el riesgo de erosión. De manera general se podría señalar que en la

cuenca del Rio Canoabo mientras mayor sea la altura sobre el nivel medio del mar, la

humedad y la cobertura vegetal especialmente bosques densos, el contenido de arena, limo y

los niveles de pH en superficie y profundidad tienden a disminuir. Por el contrario en estas

mismas condiciones la arcilla en superficie y en profundidad y la materia orgánica presentan

valores mayores.

La geología aunque fue significativa en pocas propiedades estudiadas (solo en pH 0- 20 cm),

resulta una variable importante para explicar los resultados.

Al comparar los resultados del método regresión-kriging con el mapa levantado

convencionalmente, este mostró una moderada concordancia, especialmente en la distribución

espacial y en algunos de los límites de las unidades cartográficas. En algunas clases como la

correspondiente a suelos en laderas altas bajo bosque nublados su concordancia fue alta (78

%), y moderada (43 %) en los suelos en ladera bajas erosionados. Por el contrario donde no

mostro fortaleza el método fue en los suelos en ladera medias bajo bosques semideciduos,

donde coincidió solo en el 16 % de los casos. Esta variación reflejó que el método de

regresión-kriging tuviera un Índice de concordancia (IC) moderado en toda la cuenca,

rondando el 40 % de concordancia (Sensibilidad de 0,43) y un coeficiente kappa (CK) bajo de

0,26.

99

Comparacion de métodos de cartografía digital

Ambos métodos cartográficos tienen sus bondades, como que son basados en aspectos

matemáticos, estadísticos y geoestadisticos como redes neuronales, lógica borrosa o difusa, y

kriging cuya trayectoria es largamente comprobada. También que son sencillos de aplicar y la

información básica requerida es de fácil acceso como los modelos digital de elevación para

extraer información fisiográfica, y las imágenes de satélites para proporcionar aspectos de

vegetación y clima, los cuales, pueden descargarse de internet gratuitamente para estudios a

escalas medias. Además sus resultados son muy aceptables como se pudo ver en la cuenca del

Rio Canoabo. Sin embargo para el método regresión-kriging se necesita, además de la ya

mencionada información, ciertos datos edáficos previos productos del análisis de muestras de

suelos, lo que lo hace más costoso.

Aunque el objetivo de este estudio fue la comparación de dos métodos de cartografía digital,

los resultados obtenidos y el estudio detallado de la metodología arrojo que más bien pudieran

ser tecnologías complementarias a realizarse en secuencia. Primero la neuro-borrosa para

establecer las posibles unidades cartográficas fisiográficas con un mayor detalle y precisión

que la fotointerpretación, y apoyar la planificación racional del muestreo de suelos en campo,

lo que podría reducir la cantidad de muestras economizando el trabajo y haciéndolo más

efectivo y eficiente. Posteriormente el método regresión-kriging realizado luego de obtener los

datos de laboratorio de las muestras de suelos, podría lograr una distribución espacial más

precisa de esas propiedades de los suelos y posteriormente proveer a las unidades cartográficas

preliminares con datos de dichas propiedades, incluyendo ahora su variabilidad espacial

interna.

100

9. REFERENCIAS BIBLIOGRAFICAS

Arguellos, E. 2013. Analisis epidemiologico de datos. Modulo de ayuda sobre Concordancia y

Consistencia. Aplicación informatica “Epidat 4.0”. 43 p.

Avery, B. 1987. Soil survey methods: a review, in Technical Monograph, Editor: Silsoe: Soil

Survey & Land Resource Centre. 86 p.

Bezdek, J.C. 1981. Pattern Recognition with Fuzzy Objective Function Algorithms. Plenum

Press, New York.

Bezdek, J.C.; E.C. Tsao; N.R. Pal. 1992. Fuzzy Kohonen Clustering Networks, in Proc. IEEE

Int. Conf. on Fuzzy Systems, 1992 (San Diego), pp. 1035-1043.

Breusch, T.S. y A.R. Pagan. 1979. A Simple Test for Heteroscedaticity and Random

Coefficient Variation. Econometrica, vol. 47. pp. 1287-1294.

Burrough, P.A.; R.A. Mcdonnel. 1998. Principles of geographical information systems.

Oxford, Oxford University Press New York. 333 p.

Charniak, E. y McDermott, D. 1985. Introduction to Artificial Intelligence. Universidad de

Michigan. Addison-Wesley Pub.Company. 701 p.

Chiles, J. y P. Delfiner. 1999. Geostatistics: modeling spatial undertainty. John Wiley and

Sons, New York.

Cohen, J. 1960. A coefficient of agreement for nominal scales. Educ Psyclzol Meas; 20: pp

37-46.

Desmet, P. y Govers, G. 1996. A GIS procedure for automatically calculating the USLE LS

factor on topographically complex landscape units. Journal of soil and water conservation.

51: pp 427-433.

Fausett, L. 1994. Fundamental of Neural Networks: Architectures, Algorithms, and

Aplications. Prentice Hall. New Jersey. 461 p.

Gessler, P.E.; I.D. Moore; N.J. Mckenzie; P.J., Ryan. 1995. Soil-landscape modelling and the

spatial prediction of soil attributes. Int. J. Geogr. Inf. Syst, 94: pp 421-432.

Goovaerts, P. 1997. Geostatistics for natural resources evaluation. Oxford University press,

New York.

Haykin, S. 1994. Adaptive Filter Theory, Third Edition, Englewood Cliffs, NJ: Prentice-Hall.

101

Hecht-Nielsen, R. 1987. Counter-Propagation Networks. IEEE First International Conference

on Neural Networks, Volume II, 1987.

Hengl, T. ; G. Heuvelink y A. Stein. 2004. A generic framework for spatial prediction of soil

variables based on regression-kriging, Geoderma Volumen 120, año 2004, pp 75–93.

Hilera G.; V. Martínez. 1995. Redes neuronales artificiales: fundamentos, modelos y

aplicaciones. Madrid, RA-MA. 389 p.

Hutchinson, J.N. 1988. “Morphological and geotechnical parameters of landslides in relation

to geology and hydrogeology”. In Ch. Bonnard (Ed.): Landslides. Proceedings 5th

International Conference on Landslides. Lausanne. Vol. 1: pp 3-35.

Irvin, B.J.; S.J. Ventura; B.K. Slater. 1997. Fuzzy and isodata classification of landform

elements from digital terrain data in Pleasant Valley, Wisconsin. Geoderma, 77 (2-4): pp

137-154.

Jenness, J. y J. Judson. 2007. Cohen’s Kappa and Classification Table Metrics 2.1a: An

ArcView 3x Extension for Accuracy Assessment of Spatially-Explicit Models. Wildlife

Biologist, GIS Analyst Jenness Enterprises.

Jenny, H. 1941. Factors of soil formation: a system of quantitative pedology. McGraw-Hill,

New York. 281 p.

Klein, E.; I. Chollett; C. Castillo. 2007. Mapas auto organizados para la extracción de patrones

espaciales en datos satelitales hipertemporales. II Jornadas Nacionales de Geomática. 3 al

5 de Octubre, 2007, Caracas.

Klingseisen, B.; G. Metternicht; G. Paulus. 2007. Geomorphometric landscape analysis using

a semi-automated GIS-approach. Environmental Modelling & Software, pp 1-13.

Knotters, M.; D. Brus; J. Voshaar. 1995. A comparison of kriging, co-kriging and kriging

combined with regression for spatial interpolation of horizon depth with censored

observations. Geoderma, Volume 67, Number 3, August 1995, pp. 227-246(20)

Kohonen, T. 1982. Analysis of a simple self-organizing process. Biological Cybernetics, 44:

pp 135-140.

Kohonen, T. 1997. Self-Organizing-Maps. Springer, Berlin, Second edition. 362 p.

Landis J. y G. Koch. 1977. The measurement of observeragreement for categorical data.

Biometrics; 33: pp 159-74.

Lin, C.; C. Lee. 1996. Neural fuzzy systems. Prentice Hall, Inc. New Jersey, USA. 797 p.

102

Lores, C. 2006. Caracterizacion de la Cobertura Vegetal y el Uso Actual de la Cuenca del río

Canoabo. Informe tecnico. PEQUIVEN, Moron. 40 p.

Malone, B.; A. Mcbratney; B. Minasny, y G. Laslett. 2009 Mapping continuous depth

functions of soils carbón storage and available water capacity. Geoderma.

Martín del Brío, B. y A. Sanz. 2007. Redes Neuronales y Sistemas Borrosos. 3ª edición.

Alfaomega Grupo Editor, S.A. de C.V. México. 404 p.

Martin del Brio, B. y C. Seerano. 1995. Fundamentos de las redes neuronales artificiales:

hardware y software. Dpto. Ingeniería Eléctrica y Electrónica Escuela Universitaria de

Ingeniería Técnica Industrial Universidad de Zaragoza. 23 p.

McBratney, A.; O. Inakwu.; B. Odeh, ; T. Bishop; M. Dunbar y T. Shatar. 2000. An overview

of pedometric techniques for use in soil survey. Geoderma, Volumen 97, año 2000, pp

293–327.

McBratney, A. B.; M. Mendoza; B. Minasny. 2003. On digital soil mapping. Geoderma, 117:

pp 3-52.

McCulloch, W.S. y W.H. Pitts. 1943. A Logical Calculus of the Ideas Immanent in Neural

Nets", Bulletin of Mathematical Biophysics, Volume 5.

Minasny B. y A.B. Mcbratney. 2002. FuzME version 3.0. Australian Centre for Precision

Agriculture. McMillan Building A05, The University of Sydney, NSW 2006. [On line]:

http://www.usyd.edu.au/su/agric/acpa.

Mintegui, J. 1988. Análisis de la influencia del relieve en la erosión hídrica. Hipótesis de

estudio para correlacionar la pendiente con la longitud del declive en un terreno. V.

Asamblea Nacional de Geodesia y Geoficica. pp 2229 – 2245. Madrid.

Núñez, Y., J. A. Viloria. Y M.C.Pineda. 2013. Cartografía digital de unidades

geomorfométricas en la cuenca del río Tucutunemo, Venezuela. En: V Jornadas

Nacionales de Geomática y IX Jornadas de Educación en Percepción Remota en el ámbito

de Mercosur. MCTI-FIIDT-CPDI, Caracas. pp 319-323.

Odeh, I.O.A.; A.B. Mcbratney y D.J. Chittleborough. 1992a. Soil pattern recognition with

fuzzy c-means: application to classification and soil landform interrelationships. Soil Sci.

Soc. Am. J. 56: pp 505- 516.

Odeh, I.O.A., A. McBratney, y D. Chittleborough. 1994. Spatial prediction of soil properties

from landform attributes derived from a digital elevation model. Geoderma 63, pp 197–

214.

103

Odeh, I.O.A.; A. McBratney, y D. Chittleborough. 1995. Further results on prediction of soil

properties from terrain attributes: heterotopic cokriging and regression-kriging.

Geoderma, Volume 67, Issues 3–4, August 1995, pp 215–226.

PALMAVEN. 1999. Proyecto “Desarrollo Regional Occidente. Capitulo Carabobo (DRO-

Carabobo)”. Guacara. Estado Carabobo.

Palmer, A. y J.J. Montaño. 1999. ¿Qué son las redes neuronales artificiales? Aplicaciones

realizadas en el ámbito de las adicciones. Adicciones, 11(3): pp 243-255.

Perez , R. 2005. Procesado y Optimización de Espectros Raman mediante Técnicas de Lógica

Difusa: Aplicación a la Identificación de Materiales Pictóricos. Tesis doctoral. Universitat

Politècnica de Catalunya. 182 p.

Rzempoluck, E. J. 1998. Neural network data analysis using Simulnet. Simon Fraser

University. Burnaby. B.C. Canadá. ISBN: 0-387-98255-8. pp. 1-3, 13-75.

Rouse, J.W.; R.H. Haas; J.A. Schell y D.W. Deering. 1974. Monitoring vegetation systems in

the Great Plains with ERTS. p. 309–317. In Proc. ERTS-1 Symp., 3rd, Greenbelt, MD. pp

10–15 Dec. 1973. Vol. 1. NASA SP-351. NASA, Washington, DC.

Rumelhart, D.E.; J.L. McClelland y PDP Research Group. 1986. Parallel Distributed

Processing. Explorations in the Microstructure of Cognition. Cambridge, MA: MIT Press.

Sevilla, V.; J. Comerma y O. Silva. 2009a. Caracterización de la cuenca del río Canoabo en el

estado Carabobo, Venezuela. I. Análisis climático y Producción de aguas. Agronomía

Trop. 59(1): pp 33-44.

Sevilla, V. y J. Comerma. 2009b. Caracterización de la cuenca del río Canoabo en el estado

Carabobo, Venezuela. II. Suelos y Tierras. Agronomía Trop. 59(2): pp 149-160.

Sevilla, V.; J. Comerma y O. Silva. 2009c. Caracterización de la cuenca del río Canoabo en el

estado Carabobo, Venezuela. III. La erosión de los suelos. Agronomía Trop. 59(3): pp

249-264.

Sevilla, V. y J. Comerma. 2009d. Caracterización de la cuenca del río Canoabo en el estado

Carabobo, Venezuela. IV. Zonificacion Agroecologica. Agronomía Trop. 59(3): pp 265-

273.

Shapiro, S. y M. Wilk. 1965. An Analysis of Variance Test for Normality (Complete Samples)

Biometrika, Vol. 52, No. 3/4. pp. 591-611.

Soil Survey Staff. 2003. Keys to Soil Taxonomy. Ninth Edition. [on line]

http://soils.usda.gov/technical/classification/tax_keys/keysweb.pdf.

104

Tarboton, D.G.; R.L. Bras y I. Rodriguez-Iturbe. 1991. On the extraction of channel networks

from digital elevation data. Hydrological Processes 5: pp 81-100.

Tukey, J.W. 1977. Exploratory Data Analysis. Reading, Massachussets: Addison-Wesley.

Valera, A. y J. Viloria, J. 2009. Aplicación de técnicas de inteligencia artificial en el modelado

de unidades de paisaje en la cuenca del Río Güey, Maracay - estado Aragua. XVIII

Congreso Venezolano de la Ciencia del Suelo. Sociedad Venezolana de la Ciencia del

Suelo, Santa Bárbara del Zulia, Venezuela.

Viloria, A. 2007. Estimación de Modelos de clasificación de paisaje y predicción de atributos

de suelos a partir de imágenes satelitales y modelos digitales de elevación. Trabajo

Especial de Grado. Universidad Central de Venezuela. Caracas, Venezuela. 88 p.

Viloria, J. A.; A. Valera, y A. Viloria. 2011. Clasificación geomorfométrica de paisajes

montañosos venezolanos. IV Jornadas Nacionales de Geomática. Fundación instituto de

Ingeniería, Caracas, Venezuela.

Wilson, J.P. y J.C. Gallant. 2000. Terrain Analysis: Principles and Applications. John Wiley &

Sons, 479 p.

Wischmeier, W.H. y D.D. Smith. 1978. "Predicting Rainfall Erosion Losses: A Guide to

Conservation Planning." Agriculture Handbook No. 537. USDA/Science and Education

Administration, US. Govt. Printing Office, Washington, DC. 58 p.

Webster, R. y M. Oliver.2006. Modeling spatial variation of soil as random functions. In

Grunwald, S. (Ed.) Environmental soil-landscape modeling: geographic information

technologies and pedometrics. CRC Press, Boca Raton. p. 241-287.

Webster, R. y M. Oliver. 2007. Geostatistics for environmental scientists. 2nd

. Ed. John Wiley

and Sons, Chichester.

Zadeh, L.A. 1965. Fuzzy sets. Information and Control. 8: pp 338-353.

Zevenbergen, L.W. y C.R. Thorne. 1987. Quantitative analysis of land surface topography.

Earth Surface Processes and Landforms, 12: pp 47-56.

Zhu, A.X. 1997. A similarity model for representing soil spatial information. Geoderma, 77:

pp 217–242.

Zhu, A.X. 2000. Mapping soil landscape as spatial continua: The neural network approach.

Department of Geography, University of Wisconsin, Madison. Water Resources

Research. 3: pp 663-677.

105

Zhu, A.X.; B. Hudson; J. Burt; K. Lubich y D. Simonson. 2001. Soil mapping using GIS,

expert knowledge and fuzzy logic. Soil Sci. Soc. Am. J. 65: pp 1463-1472.