comparacion de dos metodos de … · para optar al ascenso en la categoría de asistente, de...
TRANSCRIPT
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE AGRONOMÍA
INSTITUTO DE EDAFOLOGÍA
COMPARACION DE DOS METODOS DE CARTOGRAFIA DIGITAL
CON UN ESTUDIO AGROLOGICO CONVENCIONAL EN LA CUENCA
DEL RIO CANOABO, ESTADO CARABOBO.
Víctor A. Sevilla L.
Maracay, Diciembre 2014.
ii
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE AGRONOMÍA
INSTITUTO DE EDAFOLOGÍA
COMPARACION DE DOS METODOS DE CARTOGRAFIA DIGITAL
CON UN ESTUDIO AGROLOGICO CONVENCIONAL EN LA CUENCA
DEL RIO CANOABO, ESTADO CARABOBO.
Víctor A. Sevilla L.
Trabajo presentado ante el Consejo de la Facultad de Agronomía, como parte de las pruebas
para optar al ascenso en la categoría de ASISTENTE, de conformidad con el Artículo 89 de la
Ley de Universidades y con los Artículos 63, 66, 79, 80 y 81 del Reglamento del Personal
Docente y de Investigación de la Universidad Central de Venezuela.
iii
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE AGRONOMÍA
INSTITUTO DE EDAFOLOGÍA
COMPARACION DE DOS METODOS DE CARTOGRAFIA DIGITAL
CON UN ESTUDIO AGROLOGICO CONVENCIONAL EN LA CUENCA
DEL RIO CANOABO, ESTADO CARABOBO.
Tutor:
Dr. Juan A. Comerma G.
Maracay, Diciembre 2014.
iv
DEDICATORIA
A la memoria de mis padres y tía.
A mis locos de siempre, Esmeralda, Tiago y José.
Y al nuevo integrante, Aarón (toco toco).
v
AGRADECIMIENTO.
Como siempre, gracias a Dios y a nuestro Señor Jesús Cristo, por todo.
Mi agradecimiento sincero a:
A la Universidad Central de Venezuela, mi casa de estudios.
A mi Tutor, Sr. Juan Comerma, por su paciencia y ejemplos.
A los profesores Jesús Viloria y Ángel Valera, por compartir su gran conocimiento conmigo.
A las profesoras Deyanira lobo y Corina Pineda por su empuje, cada quien a su manera muy
particular.
A los profesores Carlos Marín y Naly Núñez por su colaboración.
A Francia Medina mi mano derecha.
A Pao-Pao mi otra mano derecha, de siempre.
A Antonio Medina, la gorda y Chan por siempre estar pendiente.
A German y Trina por su apoyo.
A la gente de EMBRAPA Suelos Brasil.
Y finalmente a mi familia y amigos, que estuvieron conmigo detrás del muro de los lamentos.
vi
RESUMEN
El objetivo de este estudio, fue comparar la eficacia en el mapeo de suelos de montaña de dos
métodos de cartografía digital. Uno basado en inteligencia artificial (neuro-borroso) y otro en
estadística y geoestadistica (regresión-kriging). Ambos fueron aplicados en la cuenca
hidrográfica del Rio Canoabo, en el norcentro de Venezuela, y la comparación se realizó
contrastando los resultados obtenidos por cada método contra un levantamiento convencional
de suelos realizado con anterioridad en la misma cuenca. Para esta comparación se emplearon
los índices de concordancia (IC) y el coeficiente kappa (CK). Ambos métodos se apoyaron en
covariables ambientales extraídas del modelo digital de elevación y de imágenes de satélite
para obtener sus resultados, y solo en el método regresión-kriging, se emplearon 50 puntos de
observación de suelos. El método neuro-borroso realizó una clasificación no supervisada
utilizando una red de agrupamiento borroso de Kohonen (FKCN) y el método regresión-
kriging se basó en una regresión lineal múltiple más el kriging de los errores. Los resultados
indican que el enfoque neuro-borroso tuvo una coincidencia de moderada a alta con el mapa
de clases de suelos hecho de manera convencional (IC 59 % y CK 47 %), especialmente en los
suelos ubicados en las laderas altas bajo bosque nublado y bosque semideciduo montano bajo.
Por el otro lado el método de regresión-kriging obtuvo una concordancia de moderada a baja
con respecto al mapa convencional de clases de suelos (IC 43 % y CK 26 %). Es importante
señalar que aunque su concordancia resulto baja, este método logro mapear siete propiedades
de suelos (arena, limo, arcilla 0-20 cm, arcilla 20-50 cm, materia orgánica, pH 0-20 cm y pH
50-200 cm) de manera muy eficaz, mostrando coeficientes de determinación (R2) altos de 0.59
hasta 0.93. Las covariables ambientales de mayor importancia para la separación de clases
fisiográficas y mapear las propiedades de los suelos resultaron la altura (modelo digital de
elevación), la orientación de la ladera, la pendiente, el mapa de meses húmedos, el índice de
vegetación normalizado y el índice de humedad topográfico. Finalmente se sugiere que ambos
métodos de cartografía digital pudieran ser considerados complementarios, donde el método
neuro-borroso podría establecer las posibles unidades cartográficas, y apoyar un plan racional
de muestreo de los suelos, seguido por el método regresión-kriging, que empleando los
resultados de los suelos caracterizados, podría obtener una distribución espacial más precisa
de las propiedades de estos suelos en la región, así como mostrar la variabilidad interna en las
unidades cartográficas finales de suelos. Seguramente, esta combinación aumenta la
efectividad y eficiencia en comparación con un levantamiento convencional de suelos.
vii
ABSTRACT
The objective of this study was to compare the effectiveness of two digital soil mapping
procedures in mountain soils. One was based on artificial intelligence (neural fuzzy) and the
other in statistics and geostatistics (regression-krigging).Both were applied in the watershed of
rio Canoabo, at northern Venezuela. The comparison was made validating the results with a
previous conventional soil survey method carried out in the same watershed. For the
comparison were used the Concordance index (CI) and the Kappa Coefficient (KC). Both
digital mapping methods were based on environmental covariates obtained from a digital
elevation model and satellite images, and only in the case of regression-kriggin, 50 previous
soil characterization sites were also used. The neural-fuzzy method carried out a non-
supervised classification using a Fuzzy Kohonen Clustering Network (FKCN), while the
regression-krigging was based on a multiple lineal regression plus the krigging of the errors.
Results indicate that the neuro-fuzzy approach had a moderate to high concordance with the
conventional soil map (CI 59% and KC 47%), especially for the soils located in the high side
slopes under foggy forest and montane semideciduos forest. On the other side, the regression-
krigging had a moderate to low concordance with the conventional map (CI 43% and KC
26%). It is important to point out that, even though the concordance was low, this method was
able to map effectively seven soil properties (sand, silt, clay 0-20cm , clay 20-50cm, organic
matter, pH 0-20cm, pH 50-200cm), with a high Coefficient of Determination ( R2
0.59 up to
0.93). The most important environmental covariates for the separation of physiographic
classes and mapping soil properties were altitude (from the digital elevation model), side slope
orientation, slope, the map of wet months, the normalized vegetation index and the wetness
topographic index. Finally, it is suggested that both digital soil mapping procedures can be
considered as complementary, where the neuro-fuzzy method could establish the cartographic
units and support a rational plan of soil sampling, followed by the regression-krigging using
the soil results, and obtain a more precise spatial distribution of these soil properties in the
region as well as show the internal variability in the final soil cartographic units. Surely, the
combination will increase efectiveness and eficiency in comparison to a conventional soil
survey.
viii
TABLA DE CONTENIDO
1. INTRODUCCION --------------------------------------------------------------------------------------------------------- 1
2. HIPOTESIS ----------------------------------------------------------------------------------------------------------------- 3
3. OBJETIVO GENERAL -------------------------------------------------------------------------------------------------- 3
4. OBJETIVOS ESPECIFICOS ------------------------------------------------------------------------------------------- 3 5. REVISIÓN DE LITERATURA ----------------------------------------------------------------------------------------- 4
5.1. INTELIGENCIA ARTIFICIAL --------------------------------------------------------------------------------------- 4
5.1.1. Redes neuronales ---------------------------------------------------------------------------------------------------- 5
5.1.1.1. Definición de redes neuronales ------------------------------------------------------------------------------- 5
5.1.1.2. Características de las redes neuronales ----------------------------------------------------------------------- 5
5.1.1.3. Ventajas de las redes neuronales ------------------------------------------------------------------------------ 6
5.1.1.4. Desventajas de las redes neuronales -------------------------------------------------------------------------- 6
5.1.1.5. Modelo o estructura de un sistema neuronal artificial------------------------------------------------------ 7
a) La neurona --------------------------------------------------------------------------------------------------------- 7
b) Arquitectura de redes neuronales ------------------------------------------------------------------------------- 8
c) Aprendizaje de la red neuronal ---------------------------------------------------------------------------------- 8
5.1.1.6. Mapas auto organizados (SOM) de Kohonen. -------------------------------------------------------------- 9 5.1.1.7. Las Redes neuronales en estudio de clasificaciones ambientales. ---------------------------------------- 9
5.1.2. La Logica borrosa o difusa. -------------------------------------------------------------------------------------- 10
5.1.2.1. La Lógica borrosa en estudios de clasificaciones ambientales. ----------------------------------------- 11
5.1.3. Sistemas neuroborrosos (Redes neuronales y lógica borrosa). ---------------------------------------------- 12
5.2. REGRESIÓN–KRIGING -------------------------------------------------------------------------------------------- 13
5.2.1. Características y cálculos del método de regresion-kriging. ------------------------------------------------- 14
5.2.2. El método de regresión-kriging en estudios ambientales. ---------------------------------------------------- 16
5.3. COEFICIENTES DE CONCORDANCIA. ------------------------------------------------------------------------ 18
6. MATERIALES Y METODOS ---------------------------------------------------------------------------------------- 20 6.1. UBICACIÓN DEL ÁREA DE ESTUDIO. ------------------------------------------------------------------------- 21
6.2. CARACTERIZACIÓN DEL ÁREA DE ESTUDIO. ------------------------------------------------------------- 21 6.3. METODOS DE CARTOGRAFIA DIGITAL DE SUELOS. ---------------------------------------------------- 28
6.3.1. Método Neuro-Borroso. ------------------------------------------------------------------------------------------ 28
6.3.1.1. Materiales. ----------------------------------------------------------------------------------------------------- 28
a) Información temática empleada ------------------------------------------------------------------------------- 28
b) Aplicaciones informáticas utilizadas: ------------------------------------------------------------------------ 28
6.3.1.2. Procedimientos. ----------------------------------------------------------------------------------------------- 28
a) Adecuación de la información empleada. -------------------------------------------------------------------- 28
b) Diseño del Modelo Digital de Elevación (MDE). ---------------------------------------------------------- 29
c) Obtención de covariables ambientales.----------------------------------------------------------------------- 29
d) Agrupación o clasificación neuro-borrosa. ------------------------------------------------------------------ 31
6.3.2. Metodo Regresión-Kriging (RK). ------------------------------------------------------------------------------- 35
6.3.2.1. Materiales. ----------------------------------------------------------------------------------------------------- 35 a) Información temática empleada. ------------------------------------------------------------------------------ 35
b) Aplicaciones informáticas utilizadas. ------------------------------------------------------------------------ 38
6.3.2.2. Procedimientos. ----------------------------------------------------------------------------------------------- 38
a) Revisión de los datos puntuales de suelos. ------------------------------------------------------------------ 38
b) Estimaciones de los valores de las propiedades en las profundidades solicitadas (Spline). ----------- 38
c) Obtención de la información sobre covariables ambientales (MDE e imágenes LANDSAT). ------- 39
d) Preparación de las covariables ambientales. ----------------------------------------------------------------- 40
e) Cálculo del índice de vegetación normalizado (NDVI). --------------------------------------------------- 40
f) Calculo de las variables morfométricas. --------------------------------------------------------------------- 40
g) Relacionar las propiedades de los suelos con los valores de las covariables ambientales. ------------ 41
h) Cálculo estadístico de la regresión lineal múltiple en estadístico “R”. ----------------------------------- 41 i) Interpolación kriging de los residuos o errores en estadístico “R”. --------------------------------------- 42
j) Obtención de los mapas finales de cada propiedad a diferentes profundidades. ------------------------ 42
k) Validación. ------------------------------------------------------------------------------------------------------- 42
6.4. COMPARACIÓN DE LOS METODOS CARTOGRAFICOS CONTRA UN MAPA CONVENCIONAL. --------------------- 45
ix
6.4.1. Concordancia entre el método neuro-borroso y el levantamiento Convencional: ------------------------ 45
6.4.2. Concordancia entre el método regresion-kriging y el levantamiento Convencional: --------------------- 47
7. RESULTADOS Y DISCUSIÓN --------------------------------------------------------------------------------------- 48 7.1. RESULTADOS DEL MÉTODO NEURO–BORROSO. --------------------------------------------------------- 48
7.1.1. Modelo digital de elevación (MDE) obtenido: ---------------------------------------------------------------- 48
7.1.2. Descripción de las Variables morfométricas y el Índice de vegetación normalizado (NDVI). --------- 50
7.1.3. Agrupamiento o clasificación neuro-borrosa. ----------------------------------------------------------------- 53
7.1.3.1. Índice de borrosidad adecuado. ----------------------------------------------------------------------------- 53
7.1.3.2. Número óptimo de clases. ----------------------------------------------------------------------------------- 54
7.1.3.3. Cartografía de clases fisiográficas. ------------------------------------------------------------------------- 55
7.1.3.4. Características centrales de las clases. --------------------------------------------------------------------- 56 7.1.3.5. Clases tentativas de suelos ----------------------------------------------------------------------------------- 59
7.1.4. Relevancia de las covariables ambientales en la clasificacion neuro-borrosa ----------------------------- 60
7.2. RESULTADOS DEL METODO REGRESION–KRIGING. ---------------------------------------------------- 61
7.2.1. Arena (0 – 20 cm) ------------------------------------------------------------------------------------------------- 62
7.2.2. Limo (0 – 20 cm) -------------------------------------------------------------------------------------------------- 66
7.2.3. Arcilla (0 – 20 cm) ------------------------------------------------------------------------------------------------ 70
7.2.4. Arcilla (20 – 50 cm) ---------------------------------------------------------------------------------------------- 74
7.2.5. Materia orgánica (0 – 20 cm) ------------------------------------------------------------------------------------ 78
7.2.6. pH (0 – 20 cm) ---------------------------------------------------------------------------------------------------- 82
7.2.7. pH (50 – 200 cm) ------------------------------------------------------------------------------------------------- 86
7.3. COMPARACIÓN DE LOS METODOS CARTOGRAFICOS CONTRA UN MAPA DE SUELOS
REALIZADO DE MANERA CONVENCIONAL. --------------------------------------------------------------------- 90
7.3.1. Concordancia entre el método neuro-borroso y el levantamiento Convencional ------------------------- 90
7.3.2. Concordancia entre el método regresion-kriging y el levantamiento Convencional --------------------- 93
8. CONCLUSIONES ------------------------------------------------------------------------------------------------------- 97
9. REFERENCIAS BIBLIOGRAFICAS ------------------------------------------------------------------------------ 100
x
INDICE DE CUADROS
Cuadro 1. Suelos de la cuenca del Rio Canoabo. ............................................................................................. 27
Cuadro 2. Covariables ambientales empleadas en el método de regresión–kriging. .......................................... 37
Cuadro 3. Propiedades de los suelos cartografiadas digitalmente por regresión–kriging. .................................. 39
Cuadro 4. Variables morfometricas empleadas en regresion-kriging ................................................................ 40
Cuadro 5. Interpretación del valor de K........................................................................................................... 46
Cuadro 6. Características del MDE generados en la zona de estudio. ............................................................... 50
Cuadro 7. Parámetros estadísticos descriptivos del MDE de la Cuenca del Río Canoabo. ................................. 53
Cuadro 8. Datos de los centroides de cada clase obtenida en la cuenca del Rio Canoabo. ................................. 56
Cuadro 9. Pesos de las distancias entre clases.................................................................................................. 60
Cuadro 10. Valores originales de Arena (%). .................................................................................................. 62
Cuadro 11. Estadísticos de validación del modelo de regresion-kriging (arena). ............................................... 65
Cuadro 12. Valores originales de limo (%). ..................................................................................................... 66
Cuadro 13. Estadísticos de validación del modelo de regresion-kriging (limo). ................................................ 69
Cuadro 14. Valores originales de arcilla (%). .................................................................................................. 70
Cuadro 15. Estadísticos de validación del modelo de regresion-kriging (arcilla 0-20 cm). ................................ 73
Cuadro 16. Valor original arcilla 20-50 cm (%). .............................................................................................. 74
Cuadro 17. Estadísticos de validación del modelo de regresion-kriging (arcilla 20-50 cm). .............................. 77
Cuadro 18. Valor original de materia orgánica (%). ......................................................................................... 78
Cuadro 19 Estadísticos de validación del modelo de regresion-kriging (MO). .................................................. 81
Cuadro 20. Valores originales de pH (0 – 20 cm). ........................................................................................... 82
Cuadro 21. Estadísticos de validación del modelo de regresion-kriging (pH 0-20 cm). ..................................... 85
Cuadro 22. Valor original de pH (50 – 200 cm). .............................................................................................. 86
Cuadro 23. Estadísticos de validación del modelo de regresion-kriging (pH 50-200 cm). ................................. 89
Cuadro 24. Clases fisiográficas del mapa producido por el método neuro-borroso. .......................................... 90
Cuadro 25. Matriz de errores entre clases (métodos convencional y neuro-borroso) ......................................... 91
Cuadro 26. Reporte de exactitud (métodos convencional y neuro-borroso) ...................................................... 92
Cuadro 27. Estadísticos generales (métodos convencional y neuro-borroso) .................................................... 93
Cuadro 28. Clases fisiográficas del mapa producido por el método regresion-kriging....................................... 93
Cuadro 29. Matriz de errores entre clases (métodos convencional y regresion-kriging) .................................... 94
Cuadro 30. Reporte de exactitud (métodos convencional y regresion-kriging) ................................................. 95
Cuadro 31. Estadísticos generales (métodos convencional y regresion-kriging) ............................................... 95
xi
INDICE DE FIGURAS
Figura 1. Modelo de neurona estándar. _________________________________________________________ 8
Figura 2. Esquema metodológico empleado en el trabajo. __________________________________________ 20
Figura 3. Ubicación relativa del área de estudio. _________________________________________________ 21
Figura 4. Mapa del modelo digital de precipitación media anual. ____________________________________ 22
Figura 5. Mapa del modelo digital de números de meses húmedos. __________________________________ 23
Figura 6. Mapa de Erosión actual. ____________________________________________________________ 24
Figura 7. Mapa de suelos de la cuenca del Rio Canoabo, levantado de manera convencional. ______________ 27
Figura 8. Localización de las 40 observaciones de campo en la Cuenca del Rio Canoabo _________________ 36
Figura 9. Ejemplo de salida de función SPLINE. _________________________________________________ 39
Figura 10. Hoja cartográfica a escala 1:25.000, curvas de nivel e hidrografía de la Cuenca ________________ 48
Figura 11. Modelo digital de elevación mostrando los perfiles topográficos ____________________________ 49
Figura 12. Variables morfométricas empleadas. _________________________________________________ 51
Figura 13. Variables morfométricas e Índice de vegetación normalizado empleados. _____________________ 52
Figura 14. Variación del FPI en función del número de clases y el exponente borroso (θ) ________________ 54
Figura 15 Variación de la MPE y el FPI en función del número de clases._____________________________ 54
Figura 16. Mapa de unidades clases fisiográficas producto de la clasificación neuro-borrosa. ______________ 55
Figura 17. Gráfico de la variación del peso de las distancias entre clases. ______________________________ 61
Figura 18. Histograma de arena (%). __________________________________________________________ 62
Figuras 19 y 20. RLM, coeficientes de regresión y valores medidos y estimados (arena). _________________ 62
Figura 21. Características de los residuos o errores del modelo de regresión (arena). _____________________ 63
Figura 22. Semivariograma de los residuos de arena. _____________________________________________ 63
Figuras 23 y 24. Mapa de arena kriging residuos y Mapa arena por regresión __________________________ 64
Figura 25. Mapa de arena por regresión–kriging. _________________________________________________ 64
Figura 26. Histograma de limo (%). ___________________________________________________________ 66
Figuras 27 y 28. RLM, coeficientes de regresión y valores medidos y estimados (limo). __________________ 66
Figura 29. Características de los residuos o errores del modelo de regresión (limo). _____________________ 67
Figura 30. Semivariograma de los residuos de limo. ______________________________________________ 67
Figuras 31 y 32. Mapa de limo kriging residuos y Mapa limo por regresión ____________________________ 68
Figura 33. Mapa de limo por regresion–kriging. _________________________________________________ 68
Figura 34. Histograma de arcilla (%). _________________________________________________________ 70
Figuras 35 y 36. RLM, coeficientes regresión y valor medido y estimado (arcilla 0-20 cm). _______________ 70
Figura 37. Características de los residuos o errores del modelo de regresión (arcilla 0-20 cm). _____________ 71
Figura 38. Semivariograma de los residuos de la arcilla 0-20 cm. ____________________________________ 71
Figuras 39 y 40. Mapa de arcilla (0-20 cm) kriging residuos y Mapa arcilla por regresión _________________ 72
Figura 41. Mapa de arcilla (0-20 cm) por regresión–kriging.________________________________________ 72
Figura 42. Histograma arcilla 20-50 cm (%). ____________________________________________________ 74
Figuras 43 y 44. RLM, coeficientes de regresión y valores de arcilla medidos y estimados (arcilla 20-50 cm). _ 74
Figura 45. Características de los residuos o errores del modelo regresión (arcilla 20-50 cm). ______________ 75
Figura 46. Semivariograma de los residuos de arcilla (20-50 cm). ___________________________________ 75
Figuras 47 y 48. Mapa de arcilla (20-50 cm) kriging residuos y Mapa arcilla por regresión. _______________ 76
Figura 49. Mapa de arcilla (20-50 cm) por regresion–kriging._______________________________________ 76
Figura 50. Histograma de materia orgánica (%). _________________________________________________ 78
xii
Figuras 51 y 52. RLM, coeficientes de regresión y valores medidos y estimados de MO __________________ 78
Figura 53. Características de los residuos o errores del modelo regresión (materia orgánica). ______________ 79
Figura 54. Semivariograma de los residuos de materia orgánica. ____________________________________ 79
Figuras 55 y 56. Mapas de materia orgánica kriging residuos y por regresión __________________________ 80
Figura 57. Mapa de materia orgánica por regresion–kriging. ________________________________________ 80
Figura 58. Histograma de pH (0-20 cm). _______________________________________________________ 82
Figuras 59 y 60. RLM, coeficientes regresión y valores de medidos y estimados (pH 0-20 cm) _____________ 82
Figura 61. Características de los residuos o errores del modelo de regresión (pH 0-20 cm). ________________ 83
Figura 62. Semivariograma de los residuos de pH 0-20 cm. ________________________________________ 83
Figuras 63 y 64. Mapa de pH (0 – 20 cm) kriging residuos y Mapa pH por regresión ____________________ 84
Figura 65. Mapa de pH (0 – 20 cm) por regresión–kriging. _________________________________________ 84
Figura 66. Histograma de pH (50-200 cm). _____________________________________________________ 86
Figuras 67 y 68. RLM, coeficientes regresión y valores medidos y estimados (pH 50-200 cm). ____________ 86
Figura 69. Características de los residuos o errores del modelo de regresión (pH 50-200 cm). ______________ 87
Figura 70. Semivariograma de los residuos de pH 50-200 cm. ______________________________________ 87
Figuras 71 y 72. Mapa de pH (50 - 200 cm) kriging residuos y Mapa pH por regresión. __________________ 88
Figura 73. Mapa de pH (50 – 200 cm) por regresión–kriging. _______________________________________ 88
Figura 74. Mapa de clases de suelos convencional y Mapa de clases neuro-borrosas. ____________________ 91
Figura 75. Mapa de clases de suelos convencional y Mapa de clases regresion-kriging. ___________________ 94
1
1. INTRODUCCION
En Venezuela, aproximadamente el 50 % del territorio se corresponde con el paisaje de
montañas, caracterizado por altas pendientes, relieves escarpados y con una cobertura de
vegetación boscosa o con sabanas antrópicas y matorrales. Esto lo hace un territorio sujeto a
degradación, con pocas vías de accesos, y aunque es una zona valiosa en recursos naturales,
carece de inventarios adecuados, precisos y actualizados, que apoyen la realización de planes
para regular su uso y conservación. El suelo es un ejemplo de estos recursos y no escapa de
esta problemática, ya que para realizar un estudio de los mismos se requiere una importante
cantidad de observaciones de campo y bien distribuida espacialmente, lo cual es muy
dificultoso, costoso y demanda una importante inversión en recurso humano y tiempo.
Para tratar de solventar esta problemática los investigadores de suelos se han venido apoyando
en buena medida en herramientas como la informática, la teledetección y en los sistemas de
información geográficas. Ellos permiten la captura, manejo y análisis de abundante
información de aspectos ambientales geográficamente localizados, que en otros tiempos era
casi imposible realizar. Aunado a estas herramientas, el desarrollo de aplicaciones
informáticas han venido perfeccionando técnicas de mapeo de suelos como la inteligencia
artificial, donde se destacan las redes neuronales artificiales (RNA) y la lógica borrosa o
difusa (LB) y también la estadística y geoestadística con modelos de regresión e interpolación
(regresión-kriging). Dichas técnicas tienen la bondad de manejar e integrar variables de
factores formadores de suelo creando modelos matemáticos que permiten predecir y estimar
las características de los suelos en sitios donde no se ha podido llegar por su limitado acceso.
En buena medida, estos modelos neuro-borrosos y de regresión-kriging, son especialmente
eficientes en interpretar factores formadores como el relieve y la vegetación, prediciendo
cambios en el suelo asociados a formas de terrenos y coberturas vegetales diferentes. A su vez,
especialmente la vegetación refleja cambios del balance hídrico (clima) y de la naturaleza de
los materiales originarios. Todos los anteriores factores de formación son considerados claves
para una buena cartografía de los suelos en regiones de montañas.
Particularmente la cuenca del Rio Canoabo es un ejemplo de un área montañosa con función
estratégica de reservorio de agua y suplencia de este recurso a un número importantes de
poblaciones al Nor-Oeste del estado Carabobo. En ella se han realizados diversos estudios
agroecologicos, incluyendo un mapa de suelos convencional. Sin embargo, algunas partes de
la cuenca, principalmente de difícil acceso por su relieve escarpado y vegetación boscosa,
requieren de precisar algunas características de sus suelos, mejorando por ende su calidad. Es
por eso que en este trabajo se desea aplicar técnicas más avanzadas y actualizadas de
2
cartografía digital y comparar su fiabilidad con un mapa original realizado con técnicas
convencionales.
Finalmente en bueno señalar que la cuenca ha venido presentando signos de degradación
ambiental a consecuencia de factores antrópicos y naturales. Como causas principales se
tienen la falta de cultura conservacionista, la tala, la quema, el vertido de aguas servidas a los
drenajes naturales y la carencia de estímulo para la preservación de los ecosistemas. Esto ha
provocado procesos de deforestación, erosión, sedimentación y contaminación que reducen la
capacidad productiva de las tierras y la vida útil del embalse. Las anteriores amenazas ponen
en riesgo la estabilidad del medio y comprometen los servicios ambientales que presta la
cuenca, tales como la producción de agua, el intercambio gaseoso (producción de oxígeno y
captura de CO2), el resguardo de la flora y la fauna, la belleza paisajística, la producción de
alimentos y el establecimiento de poblaciones. De allí la necesidad de un estudio más preciso
donde el suelo es clave para la formulación y la puesta en marcha de planes de regulación de
uso y conservación.
3
2. HIPOTESIS
Las metodologías de cartografía digital basados en inteligencia artificial y geoestadisticas,
tales como las redes neuronales, lógica difusa, regresión y kriging, permiten, a través del
manejo y análisis de los factores de formación pertinentes, predecir la ocurrencia de los suelos,
los cuales en zonas montañosas podrían generar mapas más precisos y rápidos que con el
método convencional.
3. OBJETIVO GENERAL
Comparar dos metodologías de cartografía digital, una basada en tecnologías neuro-borrosa y
la otra empleando métodos de regresión-kriging, frente a un mapa de suelos elaborado
convencionalmente en la cuenca del Rio Canoabo del estado Carabobo.
4. OBJETIVOS ESPECIFICOS
4.1. Cartografiar digitalmente las clases fisiográficas como clases tentativas de suelos en la
cuenca del Rio Canoabo, empleando una combinación de métodos de inteligencia
artificial como son las redes neuronales y la lógica difusa (neuro-borroso).
4.2. Cartografiar digitalmente las propiedades de los suelos de la cuenca del Rio Canoabo
empleando la metodología estadística y geoestadistica denominada “regresión-kriging”.
4.3. Comparar estadísticamente los mapas de clases tentativas de suelos y propiedades de los
suelos, obtenidos en los objetivos anteriores con un mapa de suelos realizado con
anterioridad de manera convencional.
4
5. REVISIÓN DE LITERATURA
Es frecuente en el país que las montañas carezcan de estudios de suelos adecuados, precisos y
actualizados, debidos principalmente a que un estudio edáfico requiere una buena cantidad de
observaciones de campo que estén bien distribuidas. Esto tiende a ser dificultoso, costoso y
demandante de esfuerzo humano y tiempo. Para tratar de solventar esta situación los agrologos
se han venido apoyando en técnicas digitales de mapeo de suelos, como son la inteligencia
artificial, donde destacan las redes neuronales artificiales (RNA), la lógica borrosa o difusa
(LB) y también la estadística y geoestadística con modelos de regresión e interpolación
(regresión-kriging). Dichas técnicas tienen la bondad de manejar, integrar y analizar variables
de factores formadores de suelo, a partir de modelos matemáticos que permita predecir las
características de los suelos en sitios donde no se ha podido llegar por su limitado acceso.
Motivado por lo anterior, en esta sección, se realiza una breve revisión de literatura sobre las
técnicas de inteligencia artificial, estadística y geoestadistica y su aplicación en estudios de
suelos.
5.1. INTELIGENCIA ARTIFICIAL
Esta revisión de literatura sobre inteligencia artificial especialmente en redes neuronales y
lógica borrosa, pretende investigar sobre técnicas de clasificación que permitan agrupar
valores de atributos topográficos en función de su similitud y producir clases fisiográficas o
clases tentativas de suelos expresadas en mapas de su distribución y variabilidad espacial. En
donde cada objeto (o píxel) puede presentar cierto grado de pertenencia a diferentes clases.
A lo largo del tiempo han existido diferentes definiciones de inteligencia artificial, algunas
son.
Charniak y McDermott, (1985) la definieron como “El estudio de las facultades mentales
mediante el uso de modelos computacionales”.
Se podría decir que la inteligencia artificial es la rama de la informática que desarrolla
procesos que imitan a la inteligencia de los seres vivos. La principal aplicación de esta ciencia
es la creación de máquinas para la automatización de tareas que requieran un comportamiento
inteligente; es decir, se basa en un conjunto de algoritmos cuyo objetivo es imitar el
razonamiento humano a través de una lógica deductiva o manipulación de símbolos (Martín
del Brío y Sanz, 2007).
Dentro de la Inteligencia artificial se encuentran algunas técnicas como las redes neuronales
(RNA) y la Lógica Borrosa o difusa (LB), las cuales están inspiradas en las soluciones que la
5
naturaleza ha encontrado durante millones de años de evolución a numerosos problemas que
toman en cuenta el tratamiento de cantidades masivas de información, redundante, imprecisa y
ruidosa (Martín del Brío y Sanz, 2007).
5.1.1. Redes neuronales
5.1.1.1. Definición de redes neuronales
Las llamadas redes neurales o modelos conexionistas son sistemas informáticos reticular (de
inspiración neuronal) que aprende de la experiencia mediante la auto-modificación de sus
conexiones. Ellos han venido progresando desde mediados de los años ochenta empleándose
como herramientas de predicción y clasificación (Hectht-Nielsen, 1987; Hilera y Martínez,
1995).
Una red neuronal artificial es un sistema de procesamiento de información que tiene ciertas
aptitudes en común con las redes neuronales biológicas como: el procesamiento de
información ocurre en muchos elementos simples llamados neuronas, las señales son
transferidas entre neuronas a través de enlaces de conexión, cada conexión tiene un peso
asociado, el cual, típicamente multiplica a la señal transmitida y finalmente cada neurona
aplica una función de activación (usualmente no lineal) a su entrada de red (suma de entradas
pesadas) para determinar su salida (Fausett, 1994).
5.1.1.2. Características de las redes neuronales
Los principios y características de las redes neuronales artificiales, que la capacitan para poder
resolver problemas complejos son citados por Hilera y Martínez, (1995):
Aprendizaje adaptativo: Su comportamiento es en función de un entrenamiento con una serie
de ejemplos ilustrativos. Es adaptativa porque puede modificarse constantemente con el fin de
adaptarse a nuevas condiciones de trabajo.
Auto organización: Mientras que el aprendizaje es un proceso donde se modifica la
información interna de la red neuronal artificial, la auto organización consiste en la
modificación de la red completa con el fin de llevar a cabo un objetivo específico. La red
puede responder a datos o situaciones que no ha experimentado antes, pero que puede inferir
sobre la base de su entrenamiento. Esta característica es muy útil sobre todo cuando la
información de entrada es poco clara o se encuentra incompleta.
Tolerancia a fallos: Las redes neuronales artificiales poseen una alta capacidad de tolerancia a
fallos. Se entiende por ello que las redes pueden reconocer patrones de información con ruido,
distorsión o incompletos, pero que, además, pueden seguir trabajando aunque se destruya parte
6
de la red. La explicación se encuentra en que mientras la computación tradicional almacena la
información en espacios únicos, localizados y direccionales, las redes neuronales lo hacen de
forma distribuida y con un alto grado de redundancia.
Operación en tiempo real: Las redes neuronales artificiales reconocen patrones en tiempo real,
debido a que trabajan en paralelo actualizando todas sus instancias simultáneamente.
Fácil inserción en la tecnología existente: Es relativamente sencillo obtener chips
especializados para redes neuronales que mejoran su capacidad en ciertas tareas
5.1.1.3. Ventajas de las redes neuronales
Las RNA no son la panacea que permite resolver todos los problemas, sino que están
orientadas a un determinado tipo de tareas. Podemos destacar tres características del problema
que hacen aconsejable la utilización de las RNA (Martín del Brío y Sanz, 2007): a) que no se
disponga de un conjunto de reglas sistemáticas que describan completamente el problema, b)
que los datos a emplear sean imprecisos, incoherentes o con ruido y c) el problema es de
elevada dimensionalidad, es decir, el número de variables de entrada es demasiado grande
como para que un modelo convencional aprenda a solucionar el problema en un tiempo
razonable. Cuando no se dan estas circunstancias puede ser más aconsejable optar por
solucionar el problema mediante un modelo derivado de la estadística. Por tanto, no debemos
concebir las RNA como una alternativa, sino más bien como un complemento a los modelos
convencionales ya establecidos. Otras ventajas consisten en la habilidad de las neuronas de
calcular funciones de salida no lineales, lo cual capacitan a la red para resolver problemas
complejos o no lineales y, es por esto que en numerosas aplicaciones se consiguen RNA con
errores mucho menores que los proporcionadas por la estadística. (Palmer, 1999).
5.1.1.4. Desventajas de las redes neuronales
Con respecto a las limitaciones que presentan las redes neuronales artificiales, una de las más
importantes consiste en que, es difícil comprender la naturaleza de las representaciones
internas generadas por la red para responder ante un problema determinado. Es decir, no
sabemos cómo el sistema interrelaciona las diferentes variables de entrada con los pesos de las
conexiones entre neuronas para elaborar una solución (Rzempoluck, 1998). Esta limitación
contrasta con los diferentes modelos estadísticos, los cuales permiten observar los parámetros
o pesos relativos que el modelo otorga a cada una de las variables que intervienen en el
modelo.
7
5.1.1.5. Modelo o estructura de un sistema neuronal artificial
Un sistema neuronal se compone de los siguientes elementos: conjunto de neuronas, patrón de
conexiones (arquitectura) y aprendizaje.
a) La neurona
El primer modelo de red neuronal fue propuesto en 1943 por McCulloch y Pitts en función de
un modelo computacional de actividad nerviosa. Este modelo era un modelo binario, donde
cada neurona tenía un umbral prefijado, y sirvió de base para los modelos posteriores.
Por su parte Martin del Brio (1995), menciona que la neurona es un dispositivo simple de
cálculo que, a partir de un vector de entradas x(t) provenientes del exterior o de otras
neuronas, proporciona una única respuesta o salida yi(t). Los elementos esenciales que
constituyen la neurona de etiqueta i son los siguientes:
• Un conjunto de entradas xj(t) y de pesos sinápticos wij.
• Una regla de propagación hi(t) = s(wij, xj(t)).
• Una función de activación yi(t) = fi(yi(t-1), hi(t)), que proporciona su salida yi(t).
Las entradas xj(t) y salidas de la neurona artificial pueden ser binarias o continuas,
dependiendo del modelo y de la aplicación.
La regla de propagación hi(t), a partir de las entradas de la neurona y de sus pesos
proporciona el valor del potencial postsináptico. La regla más habitual es lineal, llevando a
cabo la suma de las entradas ponderada con los pesos sinápticos. A esta expresión se suele
añadir un parámetro adicional i denominado umbral (θ)
La función de activación o de transferencia f(.) proporciona a partir del potencial postsináptico
hi(t) y del estado de activación anterior de la neurona yi(t-1), su estado de activación actual
yi(t). Las formas funcionales más empleadas en las redes neuronales son la función identidad
(función lineal) y la escalón, empleada en la neurona original de McCulloch yPitts (1943).
Teniendo en cuenta las consideraciones anteriores, el modelo de neurona estándar suele
escribirse (Ver figura 1) de la siguiente manera:
8
Figura 1. Modelo de neurona estándar.
b) Arquitectura de redes neuronales
Las neuronas que componen una red neuronal se organizan de forma jerárquica formando
capas. Una capa es un conjunto de neuronas cuyas entradas de información provienen del
exterior o de otra capa de neuronas y cuyas salidas de información se dirigen al mismo destino
(que puede ser otra capa de neuronas). En este sentido, se distinguen tres tipos de capas: la
capa de entrada recibe la información del exterior; las capas ocultas son aquellas cuyas
entradas y salidas se encuentran dentro del sistema y, por tanto, no tienen contacto con el
exterior; finalmente, la capa de salida envía la respuesta de la red al exterior (Hilera y
Martínez, 1995; Palmer, 1999).
Dependiendo de la estructura de la red neuronal existen varias tipologías, algunas de estas son:
Perceptrón (McCulloch y Pitts, 1943); Propagación hacia atrás (backpropagation) (Rumelhart,
1986) la más ampliamente empleada en la actualidad; Mapas Autoorganizados (Kohonen,
1982), esta última combinada con la lógica borrosa conforma el fundamento conceptual de las
redes neuro-borrosas. (Valera y Viloria, 2009).
c) Aprendizaje de la red neuronal
La fase de aprendizaje es el proceso por el cual una red neuronal modifica sus pesos en
respuesta a una información de entrada. Los cambios durante el aprendizaje se reducen a la
modificación y creación de conexiones entre neuronas (Haykin, 1994).
Se pueden describir dos tipos básicos de aprendizaje, el supervisado y el no supervisado.
Aprendizaje supervisado. En este tipo se presenta a la red un conjunto de patrones, junto con
la salida deseada u objetivo. La red iterativamente ajusta sus pesos hasta que su salida tiende a
9
ser la deseada, utilizando para ello información detallada del error que en cada paso comete.
De este modo, la red neuronal es capaz de estimar relaciones entrada/salida sin necesidad de
proponer una cierta forma funcional de partida. El Aprendizaje no supervisado o
autoorganizado. Es donde se le presentan a la red multitud de patrones, pero sin adjuntar la
respuesta deseada. El sistema, por medio de la regla de aprendizaje definida, debe reconocer
en ellos regularidades, extraer rasgos, estimar densidades de probabilidad o agruparlos según
su similitud (Martin del Brio, 1995).
5.1.1.6. Mapas auto organizados (SOM) de Kohonen.
Este modelo (SOM) surge ante la curiosidad de Teuvo Kohonen, interesado en comprender la
clasificación natural que hace el cerebro en cuanto a su funcionalidad (Kohonen, 1997).
Los SOM, son una técnica de clasificación no supervisada, que permite: (1) agrupación de un
conjunto de píxeles con valores de atributos topográficos en función de su similitud, (2)
producción de unidades morfométricas con el centro de las clases, para cada unidad generada,
(3) cálculo de estimados de la distancia relativa entre cada cluster, y (4) la representación
bidimensional de la clasificación en forma de un mapa que muestra la distribución espacial de
las clases morfométricas con valores y variabilidad espacial similar (Klein et al, 2007).
5.1.1.7. Las Redes neuronales en estudio de clasificaciones ambientales.
Existen pocos trabajos aplicando redes neuronales en la evaluación de la distribución espacial
de suelos y formas de terreno. A continuación algunos de interés.
Zhu (2000) realizó una investigación en el bosque experimental de Lubrecht al occidente de
Montana, EEUUAA, para evaluar la utilidad de las redes neuronales en el diseño de un
modelo de similitud sobre la variación espacial de propiedades del suelo. El enfoque empleó
una red neuronal de Perceptron Multicapa; las seis variables de entradas fueron altitud, grado
de pendiente, orientación, cobertura vegetal, perfil de curvatura y la formación geológica, y la
salida de la red fue un conjunto de valores de similitud para un grupo de clases de suelos
existentes. El autor empleo el programa NEURAL entrenado utilizando un algoritmo de
gradiente conjugado en combinación con una técnica de simulación, para el aprendizaje de las
relaciones entre el conjunto de suelos existentes y sus factores ambientales. Una vez
entrenadas, las RNA fueron utilizadas para computarizar en cada localización de un área la
similitud de los valores del suelo para el grupo de clases de suelos existentes. El estudio
demostró que la información espacial de suelos derivada del enfoque red neuronal revela un
gran detalle espacial y tiene una calidad mayor que la derivada de mapas de suelos
convencionales. Para validar la exactitud de la prueba se aplicó el coeficiente kappa obtenido
de la matriz de confusión, y los resultados indicaron que la red neuronal obtuvo un porcentaje
10
de aciertos del 77%, clasificando de forma correcta 49 de 52 puntos, lo cual mejora la cantidad
de aciertos obtenidos en un estudio anterior realizado por Zhu (1997), en donde se utilizó una
metodología basada en el conocimiento de expertos. La ventaja de utilizar el enfoque de RNA
sobre el enfoque basado en el conocimiento es que las primeras no están limitadas por la
disponibilidad de edafólogos expertos en un área determinada.
5.1.2. La Logica borrosa o difusa.
La teoría de conjuntos borrosos fue introducida por Lotfi A. Zadeh en 1965, y en ella reside la
idea de que los elementos clave en el pensamiento humano no son números, sino etiquetas
lingüísticas. Estas etiquetas permiten que los objetos pasen de pertenecer de una clase a otra de
forma suave y flexible. En un conjunto clásico se asigna el valor 0 ó 1 a cada elemento para
indicar la pertenencia o no a dicho conjunto. Esta función puede generalizarse de forma que
los valores asignados a los elementos del conjunto caigan en un rango particular, y con ello
indiquen el grado de pertenencia de los elementos al conjunto en cuestión. Esta función se
llama “función de pertenencia” y el conjunto por ella definida “Conjunto Borroso”. La función
de pertenencia μA
por la que un conjunto borroso A se define, siendo [0, 1] el intervalo de
números reales que incluye los extremos, tiene la forma:
μA=X→[0, 1]
Es decir, mientras que en un conjunto clásico los elementos pertenecen o no pertenecen a él
totalmente, en los conjuntos borrosos hay grados de pertenencia en referencia a un universo
local. Las funciones de pertenencia más comunes son: GAMMA, LAMBDA y Pi o
trapezoidal.
Pérez (2005) cita algunas de las situaciones donde se puede aplicar la lógica borrosa y algunas
de sus aplicaciones
• En procesos complejos, si no existe un modelo de solución sencillo.
• Cuando haya que introducir la experiencia de un operador “experto” que se base en
conceptos imprecisos.
• Cuando ciertas partes del sistema a controlar son desconocidas y no pueden medirse de
forma fiable (con errores posibles).
• Cuando el ajuste de una variable puede producir el desajuste de otras.
• En general, cuando se quieran representar y operar con conceptos que tengan
imprecisión o incertidumbre.
11
5.1.2.1. La Lógica borrosa en estudios de clasificaciones ambientales.
Algunos estudios de lógica borrosa en esta materia son los siguientes:
Irvin et al. (1997), utilizaron el método de clasificación de conjuntos borrosos, mediante el
algoritmo fuzzy k-means (FCM) y técnicas de clasificación no supervisada (ISODATA), para
clasificar el paisaje de un área estudio al Sur-Oeste de Wisconsin, EEUUAA. Cada pixel se
agrupo de acuerdo a su grado de membresía en una clase de forma de terreno. Estas clases
fueron determinadas por agrupamiento natural de los datos en el espacio. Los atributos
utilizados para la clasificación fueron la altitud, pendiente, plano y perfil de curvatura, índice
de humedad y radiación solar. La clasificación ISODATA asigna los píxeles a una clase,
mientras que el conjunto borroso asigna una clase de membresía a cada píxel. Estos métodos
de clasificación pueden proporcionar utilidad para el análisis estadístico y para la
determinación de esquemas de muestreo. Los métodos de clasificación numérica proporcionan
una alternativa a la utilización de fotografías aéreas para la delineación manual de formas de
terreno, ya que éste es un proceso subjetivo que requiere mucho conocimiento del paisaje en
estudio. Los autores concluyeron que el método dividió el paisaje en clases significativas que
también fueron espacialmente coherentes.
Zhu et al. (2001) aplicaron la lógica borrosa para desarrollar un modelo de similitud de
inferencia suelo-paisaje. A partir de dicho modelo se establecieron un conjunto de técnicas de
inferencia automatizada para la cartografía de los suelos y demostraron que el modelo borroso
de inferencia suelo-paisaje es más ventajoso que el enfoque convencional de estudio de suelos.
Los autores concluyeron que la calidad de la información edáfica derivada del modelo borroso
de inferencia fue muy cercana a la realidad, en cuanto a nivel de detalle espacial y grado de
precisión de los atributos. Además, el modelo permitió mejorar la eficiencia del estudio de
suelos y las actualizaciones subsecuentes a través de la disminución de tiempo y costo. Sin
embargo, el grado de éxito del modelo borroso de inferencia suelo-paisaje depende
mayormente de la disponibilidad y calidad de los datos ambientales, y la calidad del
conocimiento de las relaciones suelo-ambiente en el área de estudio.
Klingseisen et al. (2007) realizaron un análisis geomorfométrico del paisaje utilizando un
enfoque SIG semi-automatizado, al occidente de Australia. Ellos emplearon el software
LANDFORM para la clasificación de la forma del terreno (crestas, áreas planas, depresiones y
laderas), basado en atributos topográficos como la curvatura o el percentil de elevación. En la
evaluación se utilizó un algoritmo de conjuntos borrosos para comparar la similitud entre el
mapa generado por el programa LANDFORM y la foto-interpretación visual dirigida por un
experto sobre la misma área. Los resultados arrojaron que debido a la transición gradual en la
que ocurren las formas de terreno dentro del paisaje, el enfoque borroso proporcionó un medio
12
excelente para evaluar el grado de concordancia entre las categorías de formas de terreno
derivados con el software LANDFORM, en comparación con las clases definidas por un
experto en interpretación de fotografías aéreas, método tradicionalmente aplicado al
levantamiento de suelos. Considerando la similitud entre categorías, los mapas mostraron una
similitud promedio de 62,9 % y la discordancia fue principalmente localizada en las zonas
planas y áreas de pendientes simples dónde el foto-interpretador manifestó el mayor grado de
dificultad para separarlas claramente.
5.1.3. Sistemas neuroborrosos (Redes neuronales y lógica borrosa).
La integración de redes neuronales auto organizadas (SOM) (Mapas auto organizados de
Kohonen) y los conjuntos borrosos c-medias (FCM) han dado paso a un modelo denominado
red de agrupamiento borroso de Kohonen (FKCN, Fuzzy Kohonen Clustering Net) (Lin y Lee,
1996). Esto ha sido posible debido a que ambas técnicas se basan en el procesamiento de
cantidades masivas de información, redundante, imprecisa, incierta y con ruido. Por lo tanto,
ambos enfoques son útiles para modelar procesos complejos no lineales (Martín del Brío y
Sanz, 2007). Además este modelo trata de superar las desventajas de ambas técnicas,
combinando la capacidad de aprendizaje y adaptación de las redes neuronales y el poder de la
interpretación lingüística de la lógica borrosa durante el proceso de clasificación, en las cuales
cada objeto (o píxel) puede presentar cierto grado de pertenencia a diferentes clases. (Valera y
Viloria, 2009) y (Viloria 2007).
Son escasos los trabajos de investigación que tomen en cuenta la combinación de las dos
técnicas de inteligencia computacional mencionadas. En Venezuela, se ha dado un paso
importante en la utilización de tecnologías de inteligencia artificial computacional en el área
de clasificación de paisajes y predicción de atributos del suelo con los trabajos de Viloria
(2007).
Viloria (2007) desarrolló un sistema clasificador del terreno por Fuzzy Kohonen, el cual
permite predecir atributos del suelo por medio de clasificaciones digitales del paisaje. El
estudio se realizó con datos derivados de una imagen satelital y un modelo digital de elevación
(MDE) de un sector de la cuenca del Río Caramacate, estado Aragua. A partir de estos datos
se clasificó el paisaje del área de estudio por medio de tres modelos de redes neuronales: una
red de agrupamiento borroso de Kohonen (FKCN) y dos mapas auto organizados (SOM)
unidimensional con distintas funciones de vecindad. El estudio reveló que el mejor modelo
correspondió al FKCN. Este modelo constituye una representación continua del paisaje en dos
sentidos: primero, porque el paisaje es representado por una matriz de píxeles y segundo
13
porque la clasificación de cada píxel es borrosa, representada por un vector de membresía para
diferentes clases.
Valera y Viloria, (2009), utilizaron un procedimiento geomorfométrico, a partir del análisis de
atributos topográficos en la cuenca del Río Güey, y realizaron una clasificación no supervisada
basada en una red de agrupamiento borroso de Kohonen (FKCN). Este método emplea un
conjunto de algoritmos computarizados que automáticamente permitió la extracción y la
clasificación de propiedades morfométricas de un modelo digital de elevación (MDE) y de
imágenes de satélite. En este sentido, se realizaron evaluaciones de MDE de diferentes
resoluciones espaciales (8, 10, 15 y 20 m) mediante un sistema clasificador del terreno por
Fuzzy Kohonen, y se obtuvo un promedio de 11 clases morfométricas con la utilización de 9
atributos topográficos y el índice de vegetación normalizado (NDVI). Estos resultados indican
que el enfoque neuro-borroso permite una rápida estimación de la distribución espacial de
unidades de terreno homogéneas morfológicamente mediante la clasificación de píxeles, cuya
representatividad depende de la resolución espacial del MDE empleado. Estas herramientas de
inteligencia artificial aparte de ser rápidas y precisas, son de gran apoyo y utilidad para las
clasificaciones cualitativas realizadas por los expertos.
Viloria et al. (2011), realizaron una clasificación cuantitativa de unidades de paisaje mediante
la aplicación de técnicas de inteligencia artificial en paisajes montañosos venezolanos, ellos
seleccionaron dos cuencas hidrográficas (Río Güey y Río Caramacate). En la evaluación se
utilizó el procedimiento geomorfométrico a partir del análisis de atributos topográficos e
índices derivados del MDE e imágenes satelitales. Emplearon una clasificación no supervisada
utilizando una red de agrupamiento borroso de Kohonen (FKCN) que permitió
automáticamente la extracción y clasificación de propiedades morfométricas. Los resultados
indicaron que el enfoque neuro-borroso permite una rápida estimación de la distribución
espacial de unidades de terreno homogéneas morfológicamente mediante la clasificación de
píxeles, constituyendo una importante alternativa de apoyo al experto para la definición de
unidades geomorfológicas, planificación del muestreo de suelos, predicción de propiedades
edáficas y estudio de las relaciones suelo-paisaje.
5.2. REGRESIÓN–KRIGING
La finalidad de esta revisión de literatura sobre el método de regresion-kriging busca conocer
los fundamentos de este método cartográfico y saber sus bondades sobre la predicción y
mapeo de propiedades de los suelos.
14
5.2.1. Características y cálculos del método de regresion-kriging.
Odeth et al, (1994), describe el método de regresión-kriging como una combinación de
técnicas estadísticas y geoestadisticas, cuya función es predecir propiedades de los suelos en
lugares no conocidos a partir de variables ambientales e información de suelos de sitios
muestreados. Este método combina el modelo paramétrico de regresión lineal múltiple y la
técnica de interpolación kriging.
El método regresión-kriging se enmarca en el modelo suelo-paisaje, el cual ha sido descrito
por diferentes autores como Jenny, (1941); Burrough y McDonnell, (1998) y McBratney et al
(2003), y se refiere al modelado de las propiedades del suelo como función de variables del
paisaje (ambientales) localizadas en el espacio. Este modelo permite modelar y comprender
como las propiedades de los suelos se distribuyen espacialmente y cambian de acuerdo con las
variaciones en las variables ambientales que representan los factores de formación de los
suelos. También permite incorporar la dependencia espacial de las propiedades.
De acuerdo con la teoría de las variables regionalizadas, la variación espacial puede ser
descompuesta en tres (3) componentes: la tendencia global (Sx,y), la tendencia local
estructurada (lx,y) y el ruido residual aleatorio (). Así, en la estructura del modelo suelo-
paisaje, la estimación de una propiedad del suelo (Sx,y) en un lugar no visitado se hace
mediante la adicción de los tres componentes que describen su variación espacial, quedando la
siguiente ecuación (Burrough y McDonnell, (1998) y McBratney et al (2003)):
Sx,y = gx,y + lx,y +
gx,y es una función/relación determinística que representa la tendencia espacial global entre la
propiedad del suelo (Sx,y) y las covariables ambientales (Fx,y), el método de regresión lineal
múltiple se utilizan para tratar este componente, es decir:
gx,y = (Fx,y)
lx,y es una función/relación estocástica que representa la tendencia espacial local observada en
la propiedad del suelo (Sx,y), después de considerar o modelar la tendencia espacial global
(gx,y), los métodos geoestadisticos se utilizan para tratar este componente.
Y representa los residuos espacialmente independientes después del modelado de las
tendencias espaciales globales y locales. En otras palabras, son los residuos del modelo.
Por ende el cálculo se inicia con la tendencia global gx,y, a través de la regresión lineal múltiple
donde una propiedad del suelo es función de las covariables ambientales, como se puede ver
en la ecuación siguiente:
15
𝑌 = (𝑋) +
Dónde: Y depende de X; Y constituye la variable dependiente y X son las variables
independientes; representa los errores del modelo, es decir, la variación en Y que no se
explica por X.
Como Y es función de varias covariables entonces la ecuación quedaría:
𝑌 = 𝛽0 + ∑ 𝛽𝑖𝑥𝑖 + 𝜀
𝑛
𝑖=1
𝑌 = 𝛽0 + 𝛽𝑖𝑥1 + 𝛽2𝑥2 + ⋯ + 𝛽𝑛𝑥𝑛 + 𝜀
Los parámetros () constituyen los coeficientes de regresión y se ajustan basándose en algún
criterio de minimización de errores, como la suma de residuos al cuadrado. McBratney et al
(2003); Odeth et al (1994).
Los supuestos que debe cumplir la regresión lineal múltiple incluyen: independencia de los
valores de Y; linealidad entre las variables Y y X; falta de multicolinealidad en las variables
X; ausencia de valores atípicos; independencia de los errores del modelo (); normalidad de ;
la media de debe ser 0; homocedasticidad (varianza constante) de en relación con las
variables Y y X. McBratney et al (2003); Odeth et al (1994).
Del cálculo anterior se obtiene los residuos que serán interpolados en el siguiente paso,
mediante geoestadistica, la cual estudia la dependencia estadística para propiedades
representadas en el espacio. Se traduce en que una propiedad se correlaciona consigo misma
(auto correlación espacial) o con otra variable (correlación cruzada) en el espacio. Auto
correlación espacial positiva significa que las observaciones que están juntas son más
similares que las observaciones más separadas. Suponiendo que una variable aleatoria este
espacialmente auto correlacionado, la hipótesis intrínseca permite representar su variación
espacial solo como función de la distancia de separación o lag (h). (Goovaerts, (1997); Chiles
y Delfiner (1999) y Webster y Oliver (2007).
El cálculo continuo con el estudio de la semivarianza (y), la cual es una medida de la
disimilitud espacial entre puntos separados por una cierta distancia (h), esta se calcula como
una función de h, donde h es la distancia entre pares de puntos en el espacio. (Webster y
Oliver (2006).
𝑦(ℎ) = 1
2𝑛(ℎ)∑ {𝑧(𝑥𝑖) − 𝑧(𝑥𝑖 + ℎ)}𝑛(ℎ)
𝑖=12
16
Para caracterizar aún más la dependencia espacial y permitir el cálculo de pesos para la
interpolación (kriging), se debe ajustar una función o modelo en el semivariograma, esto
constituye el semivariograma ajustado, lo que se puede hacer visualmente, por ensayo y error,
por mínimos cuadrados o por máxima verosimilitud. (Webster y Oliver (2006).
Luego se interpola con kriging los residuos, que significa estimar el valor de los residuos de
un propiedad de los suelos en una ubicación no visitada basado en valores de datos de
ubicaciones circundantes, el valor estimado es la suma ponderada de los valores de los puntos
cercanos, donde los pesos por lo general disminuyen con la distancia de separación, el método
de interpolación en regresión-kriging es estocástico. Todos los estimadores kriging son
variantes de esta fórmula (Goovaerts, (1997):
𝑧(𝑥0) − 𝑚(𝑥0) = ∑ 𝑖{𝑧(𝑥𝑖) − 𝑚(𝑥𝑖)}
𝑛
𝑖=1
Dónde: z(x0) y z(xi) son los valores en la ubicación objetivo y en las ubicaciones cercana,
respectivamente; m(x0) y m(xi) son los valores esperados (medias) de z(x0) y z(xi); n es el
número de observaciones en una vecindad local usados para estimar z(x0); y son los pesos,
derivados de la función de semivariograma ajustado.
Finalmente se restan los cálculos de la regresión lineal múltiple (tendencia global – gx,y) y los
residuos interpolados por kriging (tendencia local - lx,y), según la formula siguiente y se
obtiene los mapas de la propiedad de interés (Sx,y). McBratney et al (2003); Odeth et al (1994).
Sx,y = gx,y + lx,y +
5.2.2. El método de regresión-kriging en estudios ambientales.
Existen pocos trabajos investigativos empleando este método que combina análisis estadísticos
de regresión lineal múltiples y geoestadística (kriging), a continuación algunos de ellos.
Odeh et al. (1994), sugirieron que el modelo digital de elevación (MDE) proporcionan una
buena manera de derivar la forma del relieve, el cual es un atributo que puede utilizarse para la
predicción del suelo. Ellos compararon diferentes técnicas geoestadísticas de kriging y
cokriging (regresión múltiple lineal, kriging ordinario, kriging universal, Cokriging y
regresion-kriging) para predecir cuatro propiedades del suelo. Los resultados arrojaron que el
método de regresión-kriging obtuvo el menor error medio cuadrático. Todos los métodos que
implican kriging-covariables (atributos de forma de relieve) tienen un efecto más suavizado en
17
los valores predichos, reduciendo así al mínimo la influencia de los valores atípicos en el
rendimiento de la predicción. Los métodos de regresión-kriging son prometedores para
predecir propiedades con escasos puntos de suelos, a partir de observaciones densas de la
forma de relieve o atributos derivados del MDE. Los valores atípicos en el conjunto de datos,
fueron más evidentes en la regresión lineal múltiple, kriging ordinario y kriging universal que
en regresión-kriging. Hubo una clara ventaja en el uso del método de regresión-kriging, en
aquellas propiedades que tenían una pequeña correlación con la forma de relieve.
Knotters et al. (1995), compararon dos métodos de interpolación como el co-kriging y kriging
combinados ambos con regresión para estimar una propiedad. Estos dos métodos se aplicaron
para mejorar la interpolación de la profundidad de capas blandas medida a través de barreno.
Se predijo la presencia de capas blandas en los suelos a partir de observaciones utilizando un
modelo de regresión exponencial. Estas predicciones fueron tratadas como mediciones
residuos en kriging. Los resultados de este tipo de kriging se compararon con los de co-kriging
para varios espaciamientos. Las capas blandas no se detectaron dentro de la profundidad de
barreno de 1,20 m en el 10% de las ubicaciones. Se prestó especial atención a estas
observaciones de las capas blandas en el ajuste del modelo de regresión y en las
interpolaciones. Kriging combinado con la regresión dio mejores resultados que co-kriging en
la predicción de las capas blandas. Además, en regresión-kriging son menos los parámetros
del modelo necesarios para hacer la estimación.
Odeth, et al (1995), trabajaron con varios métodos para predecir espacialmente propiedades
del suelo, a partir de atributos de formas de relieve. Los métodos probados fueron kriging
ordinario, kriging universal, regresión multi-lineal, cokriging isotópica, cokriging heterotópico
y regresión-kriging. La predicción por kriging ordinario y kriging universal fue relativamente
pobre ya que los métodos no utilizan covariables predictoras como atributos del terreno.
Cokriging heterotópico superó cokriging isotópica porque el primero hace uso de la
información local de las covariables. El método de regresión-kriging funciono generalmente
bien. Tanto la regresión-kriging y heterotópico Cokriging funcionan bien cuando las variables
del suelo se predicen con un modelo digital de elevación de mayor resolución espacial y
cuando se emplea información local. La regresión-kriging funciona generalmente mejor y es,
quizás, más flexible que cokriging heterotópico.
McBratney et al (2000), mencionan en su investigación que el método hibrido de regresión-
kriging combina un modelo de regresión lineal simple o múltiple, o árboles de regresión con
kriging simple u ordinarios de los residuos de la regresión. La suposición aquí es que el
determinismo compone la ecuación para estimar la propiedad del suelo, explicada por
el modelo de regresión, mientras que los residuos del modelo representan la variable
18
espacialmente distribuida pero dependiente de la ecuación de regresión. Si las variables
exógenas utilizadas en la ecuación de regresión están disponibles más densamente que la
propiedad a estimar, la ecuación se puede usar entonces para predecir la propiedad en esos
lugares.
Hengl et al (2004). Establecieron un marco metodológico para la predicción espacial de
propiedades de los suelos, basado en el método regresión-kriging, el cual se describe y
compara con kriging ordinario y regresión simple. Las propiedades objetivos se ajustan
mediante regresión paso a paso y los residuos son interpolados utilizando kriging. Un método
de visualización genérico se utiliza para ver simultáneamente las predicciones y la
incertidumbre asociada. El marco fue probado usando 135 perfiles de suelo en Croacia,
dividido en 100 perfiles para la interpolación y 35 para la validación. Se predijeron tres
propiedades: materia orgánica, pH y espesor de la capa superior de los suelos. Se emplearon
para la estimación seis parámetros y nueve unidades cartográficas de suelos. La eficiencia de
la predicción fue evaluada usando el error medio y error cuadrático medio (RMSE) de la
predicción en los perfiles de validación. Los resultados muestran que el marco propuesto
mejora la eficiencia de las predicciones. Por otra parte, se aseguró de la normalidad de los
residuos y que los valores de predicción estuvieran dentro de la gama física de una propiedad.
La materia orgánica alcanzó el menor RMSE relativo (regresión-kriging) frente al kriging
ordinario (53,3% versus 66,5%). Para el espesor de la capa superior del suelo logró un RMSE
relativamente inferior (66,5% frente a 83,3%) y un sesgo menor que kriging ordinario (0,15
frente a 0,69 cm). La predicción de pH fue difícil con los tres métodos. Este marco
metodológico abre la posibilidad de desarrollar un algoritmo de paquetes informáticos que
puede ser implementado en SIG para interpolar datos del perfil del suelo a partir de datos
existentes.
5.3. COEFICIENTES DE CONCORDANCIA.
Lo que se pretende con esta revisión de literatura sobre índices de concordancias, es encontrar
algunas técnicas estadísticas que puedan ser útiles para realizar la comparación entre los
resultados de los métodos de cartografía digital empleados en este estudio con respecto al
mapa de suelos realizado de manera convencional.
Las técnicas más utilizadas para el análisis de concordancia entre métodos y observadores son
el índice de concordancia (Arguellos, 2013) y el coeficiente kappa de Cohen (1960).
El Índice de concordancia es la primera aproximación a la concordancia entre métodos;
resulta, por tanto, la más intuitiva. Simplemente expresa el porcentaje de acuerdo entre ellos,
19
es decir, en qué medida hubo coincidencia en la clasificación entre métodos en relación al total
de elementos examinados. El problema que plantea este índice básico es que una parte de ese
acuerdo, en principio desconocida, puede deberse exclusivamente al azar. Para eliminar la
parte que puede atribuirse solamente al azar, se dispone del coeficiente kappa elaborado por
Cohen en 1960.
El coeficiente kappa relaciona el acuerdo, más allá del debido al azar, con el acuerdo potencial
también más allá del azar. En esencia, el proceso de elaboración del índice es el siguiente: se
calcula la diferencia entre la proporción de acuerdo observado y la proporción de acuerdo
esperado por azar; si ésta es igual a cero, entonces el grado de acuerdo que se ha observado
puede atribuirse enteramente al azar; si la diferencia es positiva, ello indica que el grado de
acuerdo es mayor que el que cabría esperar si solo estuviera operando el azar y viceversa: en
el caso (ciertamente improbable) en que la diferencia fuera negativa entonces los datos
estarían exhibiendo menos acuerdo que el que se espera solo por concepto de azar. Kappa es el
cociente entre esa cantidad y el acuerdo máximo que se puede esperar sin intervención del
azar (Arguellos, 2013).
La siguiente pregunta que surge sobre el coeficiente kappa es: ¿qué valor de kappa se puede
considerar como indicador de buena concordancia? No hay una respuesta exacta; lo que se
considera adecuado o no va a depender del problema que se esté estudiando. Landis y Koch
(1977) propusieron una escala de interpretación del valor de kappa que considera como
aceptable un valor mayor o igual a 0,40 y excelentes los valores superiores a 0,75.
Algunos de los elementos del coeficiente de Kappa son la Sensibilidad y la Especificidad. La
primera se refiere a la probabilidad de que un punto de muestreo sea clasificado como X si en
realidad es X, es decir, es lo que se conoce como la proporción de verdaderos positivos. Esto
es conceptualmente similar y computacionalmente idéntico al concepto de "Precisión del
productor". Y la Especificidad es la probabilidad de que un punto de muestra no será
clasificada como X si no es X, es decir la proporción de verdaderos negativos (Jenness, 2007).
20
6. MATERIALES Y METODOS
El esquema metodológico seguido para lograr los objetivos, se puede observar en la figura 2.
Figura 2. Esquema metodológico empleado en el trabajo.
Ubicación del área de estudio
Métodos de cartografía digital de suelo
METODO NEURO-BORROSO METODO REGRESIÓN-KRIGING
Revisión de la información de
suelos.
Estimación de la propiedad a profundidad fija
(Spline)
Obtención de las covariables ambientales
Obtención de la regresión lineal
Interpolación kriging de los residuos
Obtención de los mapas finales de cada
propiedad a diferentes profundidades
Comparación de ambos métodos de
cartografía digitales con un
levantamiento convencional.
Adecuación de información empleada
Diseño del modelo digital de elevación
(DEM)
Obtención de covariables ambientales
Agrupación o clasificación neuro-borrosa
CONCLUSIONES FINALES
Caracterización del área de estudio
21
6.1. UBICACIÓN DEL ÁREA DE ESTUDIO.
El estudio se realizó en la cuenca del Rio Canoabo, localizada en la vertiente norte de la
cordillera de la costa, al Noroeste del estado Carabobo. Políticamente pertenece a la parroquia
Canoabo en el municipio Bejuma del mencionado estado. Sus coordenadas son: Ymin:
1.131.660; Xmin: 570.460; Ymax: 1.153.560 y Xmax: 587.400. En la figura 3 se puede
observar la ubicación de la cuenca con tramados diagonales.
Figura 3. Ubicación relativa del área de estudio.
6.2. CARACTERIZACIÓN DEL ÁREA DE ESTUDIO.
La cuenca posee una superficie de 14.508 ha, recorridas de Sureste a Noroeste por un estrecho
valle central, bordeado por sendas montañas cubiertas por bosques densos prístinos,
matorrales y herbazales fuertemente intervenidos. El aprovechamiento de las tierras es
mayoritariamente como conucos, siembras de café, cacao, musáceas y cítricos, además de una
incipiente ganadería, principalmente en el piedemonte. La principal función de la cuenca es
producir y reservar agua para los pobladores del eje San Pablo – Urama – Morón y Puerto
Cabello, para lo cual cuenta con el embalse de Canoabo.
Características físico-naturales relevantes dentro de la cuenca del Rio Canoabo.
Estudios realizados por Sevilla et al (2009a); Sevilla y Comerma, (2009b); Sevilla et al
(2009c) y Sevilla y Comerma, (2009d). Describieron algunas características de la cuenca.
Altura: La cuenca en su mayoría está dominada por montañas, disectadas en el centro por
un valle estrecho. Las alturas van desde 135 msnm en el Norte a 1700 msnm hacia el Sur en
los Cerros El Marquero, al Oeste (1650 msnm) y Cerro de Paja al Este con 1700 msnm.
22
Clima: En la cuenca se nota una zonalidad vertical y concéntrica, donde la temperatura
media anual va desde 16 ºC hasta 25,5 ºC, correspondiéndose las zonas frías a la parte alta
al Sur, y las temperaturas cálidas a lo largo del Valle del Río Canoabo. La evaporación
muestra un patrón bimodal con máximos en marzo y septiembre y los mínimos en febrero,
julio y diciembre. Los valores promedios mensuales van de 138 mm hasta unos 183 mm.
En cuanto a la ETo las zonas de máxima evapotranspiración (más de 1400 mm anual), son
las áreas de máximas temperaturas en el valle del Río Canoabo, y subiendo por las laderas
hacia las montañas a más de 1600 msnm en el sector de Cerro de Paja, se consiguen valores
menores a 600 mm de ETo anual. La Precipitación, se comporta muy uniforme, con
intervalos entre los 1000 y 1200 mm promedios anuales; sin embargo, se puede decir que
existen dos grandes situaciones. La primera y más frecuente representada por áreas donde
llueve entre 1115 mm y 1290 mm, que están bajo un bosque nublado a más de 800 msnm,
donde se observan diferentes efectos como: orogenia, lluvia horizontal (nubosidad),
abundante roció y frente frío del Norte. La segunda situación, corresponde a zonas más
secas, bajo bosque deciduo, ubicadas en el centro de la cuenca, donde llueve entre 1000
mm y 1038 mm. En la figura 4 se muestra que la distribución de la precipitación es
semiconcéntrica. encontrándose las zonas de mayor precipitación al Sureste en el sector
montañoso.
Figura 4. Mapa del modelo digital de precipitación media anual.
23
Meses Húmedos: Se ha considerado un mes húmedo aquel en donde la precipitación es mayor
que ½ ETo. En la cuenca la zona más húmeda se encuentra al Sur con diez a doce meses
húmedos al año, debido a su precipitación de 1200 mm, unido a su altura que va de 800 a 1700
msnm, lo que hace que este bajos las nubes gran parte del día, y las hojas, ramas y tallos,
inclusive el suelo atrapan gotas de agua de la llamada lluvia horizontal. Por último, parece
haber un importante aporte de agua por parte del rocío o condensación del agua, debido a las
bajas temperaturas nocturnas. El caso contrario son las áreas más secas, con seis meses secos
(precipitación menor que ½ Eto), ubicadas en la parte baja del valle del Río Canoabo, donde
las temperaturas son más altas y hay más evaporación. (Figura 5).
Figura 5. Mapa del modelo digital de números de meses húmedos.
Cobertura Vegetal y Uso actual: los herbazales se presentan en el 25% de la cuenca, los
bosques deciduos, semideciduos y nublados abarcan un 30%, los matorrales 19%, el uso
agrícola en un 19 %, y el resto (7%) lo ocupan áreas urbanas y el embalse (Lores, 2006).
Geología: el 83 % de la cuenca está sobre la formación Las Brisas, específicamente el
Complejo San Julián; otro 9 % yace sobre la formación Granito Guaremal, y por último un
8 % sobre la formación Peña de Mora. En ellas predominan las rocas metamórficas foliadas
de esquistos cuarzo-feldespáticos-moscovíticos del Complejo San Julián y, por otro lado,
gneises y augengneis en Peña de Mora, ambas con una edad geológica del Jurásico-
Cretácico (Palmaven, 1999).
24
Relieve y pendientes: un 68 % de la cuenca es dominada por laderas de montañas,
rodeando el piedemonte y el valle. El segundo relieve en abundancia, son las faldas de
laderas con un 14 %. Otro tipo de relieve de importancia lo constituye el piedemonte (7%),
envolviendo todo el valle central de Sur a Norte. El relieve de valle, ubicado en la parte
más baja de la cuenca ocupa un 4 %. En este último ocurren procesos de acumulación de
material aluvial y es propenso a sufrir inundaciones. El restante 7 % está dominado por
lomas y vigas. En cuanto a las pendientes, dominan los terrenos entre 20 – 45 %, abarcando
un 65 % de la cuenca. Los terrenos de 45 a 60 % de pendiente son los segundos en
extensión (10 %), ubicadas hacia el Oeste. Las tierras con más de 60 % de pendiente se
extienden el 8 % del territorio. Un 6 % de la cuenca posee pendiente moderada de 8 a 20 %,
y solo 11 % de la superficie poseen de ligera a ninguna limitación en cuanto a pendiente,
son las áreas planas del valle y el piedemonte.
Erosión: La cuenca presenta una erosión ligera a imperceptible en el 75 % de su superficie,
erosión moderada en cerca del 14 % y una erosión fuerte en un 11 %. Las áreas que tienen
ligera erosión corresponden con zonas que mantienen una mayor cobertura vegetal,
independientemente de los tipos de pendientes que predominan (figura 6). Las zonas con
erosión moderada y fuerte están asociadas a actividades antrópicas que han eliminado la
cobertura vegetal y están concentradas en el piedemonte y lomas que rodean el valle del
Rio Canoabo. La erosión fuerte está cercana al valle y tienen o han tenido actividad
ganadera promoviendo la formación de terracetas, así como importantes pérdida de suelo.
Figura 6. Mapa de Erosión actual.
25
Suelos.
Sevilla y Comerma (2009b) realizaron un estudio de los suelos de la cuenca del Río Canoabo,
fundamentado en la teoría de los factores formadores de suelo (S = f(Material parental,
Relieve, Clima, Biota, y Tiempo)), (Jenny, 1941). Dicho estudio partió de un proceso de
superposición e integración de los factores de formación, expresados por delineaciones de
paisajes, geología, cobertura vegetal, clases de pendientes, números de meses húmedos y zona
de vida, todo empleando tecnología SIG. De esta integración se conformaron las unidades
homogéneas preliminares de suelo. Seguidamente, utilizando la vialidad, los centros poblados
y la variabilidad de los suelos, se seleccionaron 50 sitios de observaciones de campo, es decir
una densidad de una (1) muestra por cada 290 ha. Según Avery (1987), esta densidad de
observaciones se corresponde con niveles de intensidad de levantamientos de suelos entre 3° y
4° orden.
Los sitios de observaciones incluyeron cortes de carretera, puntos de barrenos y calicatas. En
ellos se desarrollaron tres grandes aspectos que proporcionaron valiosa información para la
caracterización y clasificación de los suelos: (i) la descripción del entorno; (ii) descripción
morfológica del perfil del suelo y (iii) la toma de muestra para análisis de laboratorio. El
primer punto caracterizo las formaciones geológicas, paisaje, pendiente, forma de la
pendiente, microrelieve, erosión, drenaje, ocurrencia de inundaciones, cobertura vegetal y uso
actual de las tierras. En el segundo punto se describe morfológicamente el perfil del suelo,
incluyendo: la profundidad efectiva de los suelos, horizontes diagnósticos, textura,
pedregosidad, color de los suelos, presencia de moteado o gleisado, estructura, compacidad,
consistencia, actividad biológica, cantidad y tamaños de raíces y porosidad. Por último se hizo
el muestreo de suelos para luego realizar análisis en el laboratorio que arrojo información
sobre: texturas, pH, materia orgánica, cationes disponibles, y conductividad eléctrica.
Se trató en lo posible que cada unidad preliminar de suelos tuviese un punto de chequeo, sin
embargo por razones de inaccesibilidad o simplemente por cuestiones de tiempo y
presupuesto, algunas unidades carecieron del mismo. Para solventar esto se optó por un
modelo de pedotransferencia simple, basado en los factores formadores de suelos y en los
puntos ya levantados. A una unidad no chequeada se le asignó un punto caracterizado de la
unidad más cercana que poseía similares condiciones, en cuanto a vegetación, geomorfología,
la pendiente, el grado de erosión y los números de meses húmedos. Cada punto de muestreo
caracterizado contó de resultados de los análisis de laboratorio, además de su clasificación
taxonómica hasta nivel de subgrupo (USDA, 2003), y con el procedimiento de
pedotransferencia mencionado se logró asignar a la totalidad de las delineaciones del mapa de
suelo su unidad Cartográfica.
26
Los principales resultados de este estudio, se pueden ver en la figura 7 y en el cuadro 1. Donde
se manifiesta que los suelos de la cuenca son bastante uniformes. El 68 % son Haplustalfs, el
28 % son Hapludults y el restante 4 % Haplustepts. Lo anterior se debe a la uniformidad de los
materiales parentales, dominados por gneises o esquistos de similar composición y de un
grado mediano de desarrollo. Esto último evidenciado por la presencia de procesos de
acumulación de materia orgánica e iluviación de arcilla produciendo un endopedón argílico.
Lo anterior es común en el 95% de los suelos de los órdenes Alfisol y Ultisol. Estos suelos
fueron separados debido al grado de lavado o de acidificación de los suelos. Así, los Ultisoles
o Hapludults, con muy bajo contenido de bases aun a grandes profundidades, se concentran en
las zonas más húmedas del bosque nublado, mientras los Alfisoles o Haplustalfs, se
concentran en zonas más bajas y con mayor número de meses secos. Ambos suelos tienen una
distribución concéntrica, siguiendo las curvas de nivel, factor que controla en esta cuenca la
precipitación y por ende es un importante factor de formación.
En la cuenca, se presenta una clara Climosecuencia, siendo este el principal factor
diferenciador de los suelos. Esta climosecuencia se expresa, por una parte en el mayor lavado
de los suelos en las zonas más húmedas (Ultisoles) y por otra, la mayor acumulación de
materia orgánica en los suelo de climas más fríos, más húmedos y con mayor cobertura
vegetal (Humic Hapludults). Por otro lado, existen otras diferencias entre los suelos de la
cuenca, que se reflejan en los subgrupos, donde se pueden encontrar los Typic como
dominantes a excepción de los Humic o más ricos en materia orgánica que ocurren en los
sitios más altos y boscosos. Los subgrupos Inceptic y Lithic que manifiestan haber sido
erosionados y truncados en el perfil, y los subgrupos Ultic de los suelos Haplustalfs, que
reflejan un mayor grado de lavado de bases y consecuentemente un estado transicional hacia
los Ultisoles más lavados.
Como un resumen general los suelos de la cuenca son:
ácidos en superficie reflejando el material parental y el tiempo de evolución o de
lavado por la lluvia,
de profundidad mediana a alta reflejando que, a pesar de las pendientes fuertes que
predominan, los paisajes son estables, ayudado esto por la buena cobertura vegetal,
Contenidos medios de materia orgánica como reflejo de la cobertura vegetal o los usos
predominantes de pastizales o plantaciones; la principal excepción son los altos
valores y hasta lo profundo, de las zonas más altas, húmedas y de menor temperatura,
Texturas predominantemente medias (Francosas), lo cual es un reflejo de la naturaleza
y uniformidad del material parental; sólo en la partes del piedemonte más sujetas a
27
erosión hay concentraciones residuales de esqueleto grueso (grava) en superficie.
Los suelos son de colores pardos o rojizos, reflejando el material parental y la buena
condición de drenaje.
Figura 7. Mapa de suelos de la cuenca del Rio Canoabo, levantado de manera convencional.
Cuadro 1. Suelos de la cuenca del Rio Canoabo.
Clases Descripción Superficie ha
1 Laderas – bosque deciduo – complejo de Typic Haplustalfs,
Inceptic Haplustalfs y Lithic Ustorthen
1787
2 Laderas – bosque deciduo – consociación de Typic Haplustalfs 2812
3 Laderas – bosque nublado – consociación Humic Hapludults 4035
4 Laderas – bosque semideciduo – asociación Typic Haplustalfs y
Ultic Haplustalfs
3842
5 Piedemonte – bosque deciduo – asociación Typic Haplustalfs y
typic Haplustepts
1167
6 Valle – bosque deciduo – complejo de Fluventic Haplustepts,
Aquic Haplustepts y Vertic Epiaquepts
631
7 Embalse del Rio Canoabo 234
Total 14.508
28
6.3. METODOS DE CARTOGRAFIA DIGITAL DE SUELOS.
6.3.1. Método Neuro-Borroso.
6.3.1.1. Materiales.
Para la utilización del método neuro–borroso se requirió la información temática y las
aplicaciones informáticas siguientes:
a) Información temática empleada
Hojas cartográficas a escala 1:25.000 del Instituto Geográfico de Venezuela Simón
Bolívar (IGVSB), específicamente las cartas: 6547-III-NE, 6547-III-SE, 6547-II-SO,
6547-II.NO, 6546-IV-NE y 6546-I-NO.
Imágenes satelitales del sensor Landsat ETM+, concretamente las bandas 03 (rojo) y 04
(infrarrojo cercano), ambas con una resolución espacial de 30 m, descargadas de la
página de “Earth Science Data Interface (ESDI)”
(http://glcfapp.glcf.umd.edu:8080/esdi/index.jsp), tomadas el 18 de marzo del 2000.
Estas imágenes fueron geométricamente corregidas, además de modificar su resolución
espacial de 30 m a 20 m para adecuarla al resto de la información empleada.
Información de las formaciones geológicas producidas por Palmaven (1999).
b) Aplicaciones informáticas utilizadas:
Hoja de cálculo “Surfer”.
Algoritmo Fuzzy Kohonen Clustering Network (FKCN) (Viloria, 2077).
Programa de algoritmos “Fuzzy K means” (Fuzme 3.5) (Minasmy y McBratney, 2002).
Gestores de información geográfica “SAGAGIS”, “Arcview 3,2” y “ArcGis 9.2”.
Arcinfo Workstation.
6.3.1.2. Procedimientos.
Los pasos ejecutados para cartografiar las clases fisiográficas en la cuenca del Rio Canoabo,
mediante el método neuro–borroso, se describen a continuación:
a) Adecuación de la información empleada.
Toda la información fue corregida cartográficamente y estandarizada atributivamente, como se
menciona a continuación:
Georreferenciación de las hojas cartográficas, estableciendo el sistema de proyección:
Universal Transversal de Mercator (UTM), huso 19 norte y datum Regven.
29
Vectorización de los elementos geográficos de las mencionadas hojas cartográficas,
específicamente las curvas de nivel, hidrografía y perímetro de la cuenca. Para esto se
empleó el gestor de información geográfica Arcview 3.2.
Asignación de cotas a las curvas de nivel vectorizadas.
Corrección de sentido natural de drenaje de los ríos vectorizados. Para esto se empleó el
gestor de información geográfica Arcgis.
b) Diseño del Modelo Digital de Elevación (MDE).
El paso siguiente fue la generación de un modelo simplificado continuo de la superficie del
terreno que muestra las variaciones en la altura media sobre el nivel del mar, es decir, un
modelo digital de elevación (MDE). Para esto se empleó la herramienta llamada Topogrid de
Arcinfo Workstation, la cual se basa en el modelo desarrollado por Hutchinson (1988). La
resolución espacial de salida del MDE fue calculada para 10 m, 20 m y 30 m; sin embargo,
quedó como resolución de trabajo el MDE de 20 m, debido, entre varios aspectos, a estar
próxima al valor recomendado por la “regla del pulgar” de un tercio de la escala de trabajo
(1:50.000), es decir 16,7 m cercana a 20 m., además de ser la resolución intermedia que
requiere mucho menos recursos computacionales que la de 10 m, y su expresión en cuanto al
paisaje es mejor que la de 30 m (Valera y Viloria, 2009).
c) Obtención de covariables ambientales.
Para la aplicación del método neuro–borroso en la cuenca del Rio Canoabo se emplearon diez
covariables ambientales. Nueve de ellas corresponden a variables morfométricas derivadas del
MDE, y la décima es el índice de vegetación normalizado (Normalised.difference.vegetati –
NDVI (Rouse et al 1974)). Las variables morfométricas son una serie de elementos derivados
del modelo digital de elevación, la orientación de las laderas, el índice de humedad
topográficos, el área de captación, el perfil y plano de curvatura, la pendiente y el Factor LS.
Ellos pueden expresar de manera cuantitativa y en una superficie continua, la posible
influencia del relieve en las características actuales de los suelo. Ejemplo puede ser la
influencia del relieve en la acumulación de agua en los suelos, en la reducción del horizonte
superficial, en la estabilidad de los suelos, en la acumulación de materia orgánica (zonas altas
con bajas temperaturas), etc.
Para obtener estas variables morfométricas se le aplicó al MDE un conjunto de algoritmos
agrupados en la función “Basic Terrain Analysis” de la aplicación SAGAGIS. Este modelo
poseía un tamaño de celdas o pixeles de 20m x 20m. A continuación se hace una breve
descripción de cada una de las Covariables ambientales.
30
Altura sobre el nivel del mar o modelo digital de elevación (Mde20b): Este parámetro
es homólogo al MDE, el cual se genera mediante un procedimiento de interpolación
diseñado para tomar como datos de entrada las curvas de nivel, las cotas de altura, y la
hidrografía. Comúnmente se utilizan métodos de interpolación local, tales como la distancia
inversa ponderada (IDW), o interpolaciones sin perder la continuidad de la superficie, como
el Kriging y Spline (Hutchinson, 1988).
Altura sobre el canal de drenaje o altura relativa (Altitude_.above): Referida a la altura
del terreno circundante con respecto al punto más bajo, que corresponde a la red de drenaje.
Pendiente (Slope): Definido como el cambio de elevación del terreno que influye sobre las
tasas de flujo de agua y sedimento. Es decir, es el ángulo existente entre el vector normal a
la superficie en un punto y la vertical, siendo la tasa de cambio de la altitud obtenida al
realizar un desplazamiento horizontal. La pendiente corresponde a la derivada de primer
orden de la altitud. (Burrough y McDonnell, 1998). Está pendiente se calculó utilizando la
ecuación de Zeverbergen y Thorne (1987), la cual utiliza un algoritmo de diferencia finita
de segundo orden, ajustado a los cuatros vecinos más cercanos en la ventana de píxeles.
Factor LS (LS.Factor): Se generó a partir de la Ecuación Universal de Pérdida de Suelo
(USLE) de Wischmeier y Smith (1978). Investigadores como Desmet y Govers (1996), han
aplicado algoritmos de flujo, a partir de un MDE para determinar la longitud acumulada del
flujo superficial y, a partir de allí, el factor topográfico LS. Mintegui (1988) mostro que en
una aplicación de SIG se modifica la ecuación de la USLE, para áreas con relieve abrupto,
por lo cual el factor LS se asocia con un valor de “l” según la clase de pendiente derivadas
de un MDE, donde estas relaciones son convertidas en expresiones algebraicas, mediante
regresión lineal con el propósito de disponer de una función aplicable a cada pixel del
raster.
Orientación de la ladera (Aspect): Es el ángulo existente entre el vector que señala el
Norte y la proyección sobre el plano horizontal del vector normal a la superficie en ese
punto. Para el cálculo de este parámetro se utiliza una derivada de primer orden, en cuya
ecuación se identifica la dirección de la pendiente, y toma la tasa máxima de cambio en el
valor de cada celda con respecto a sus vecinos (Burrough y McDonell, 1998).
Plano y perfil de curvatura (Plan.curvature y Profile.curvature): Se puede definir
como la tasa de cambio en la pendiente en el entorno de un punto determinado y depende
de la altitud. Su cálculo se basó en el algoritmo de Zeverbergen y Thorne (1987), el cual
corresponde a la derivada de segundo orden de la altitud (Burrough y McDonnell, 1998).
Ésta es calculada por la interpolación de la superficie local que utiliza un kernel o grupos de
31
celdas de 3 x 3 del MDE, con el punto de interés en el centro y se puede dividir en sus
partes direccionales perfil de curvatura y plano de curvatura.
Índice de humedad topográfico (Wetness.Index): Representa una medida teórica de la
acumulación del flujo hídrico en cualquier punto dentro de una cuenca, lo que permite
obtener un modelo de las áreas susceptibles a desencadenar movimientos en masas;
también puede utilizarse como base para estimar la humedad del suelo en un sitio y detectar
áreas inestables, debido a los efectos topográficos superficiales sobre la respuesta
hidrológica. La metodología de cálculo es compleja y sistemática, y está compuesta por las
variables: área de captación del drenaje y pendiente local. La fórmula para calcular el
índice de humedad topográfico es la siguiente:
ù =ln (A / tan ) j
Donde, ù es el índice de humedad topográfico; A: representa el área de captación del
drenaje y j: representa la pendiente local para un punto determinado.
El índice de humedad fue determinado según la ecuación:
I Humedad = ln (Area/Pend) (Gessler et al. 1995); (Wilson y Gallant, 2000).
Área de captación (Catchment.Area): Es el área de drenaje contribuyente a un punto
específico de la cuenca y se obtuvo mediante el algoritmo de Tarboton et al. (1991), el cual
utiliza un polinomio cuadrático con nueve términos.
Índice de vegetación normalizado (Normalized.Difference.vegetati - NDVI): Esta
variable fue descrita por primera vez por Rouse et al (1974), y la misma comprueba el vigor
de la vegetación o por el contrario la débil vitalidad. Es un índice usado para estimar la
cantidad, calidad y desarrollo de la vegetación con base a la medición de la intensidad de la
radiación solar que la vegetación emite o refleja. Su ecuación es la siguiente:
𝑁𝐷𝑉𝐼 =IRCercano − Rojo
IRCercano + Rojo
Acá el NDVI se calculó en SAGAGIS, ya que esta aplicación posee este proceso
incorporado siguiendo los pasos “Modules\imagen\tools\vegetation índices\vegetation
index[slope.based], y empleando las bandas 3 (Rojo) y 4 (InfraRojo cercano).
d) Agrupación o clasificación neuro-borrosa.
El método neuro-borroso combina la potencialidad de las redes neuronales y la lógica borrosa
o difusa, desarrollando una técnica integral de clasificación no supervisada denominada red de
agrupamiento borroso de Kohonen o Fuzzy Kohonen Clustering Network (FKCN) (Bezdeck
32
et al., 1992; Lin y Lee, 1996), que conjuga un algoritmo de mapas auto organizados o self
organizing map (SOM) (Kohonen, 1982) y el algoritmo Fuzzy C-means (Bezdeck, 1981). De
esta manera, las RNA intentan construir un modelo matemático que consta de un conjunto de
funciones sencillas vinculadas por sus pesos, mientras que los métodos de clasificación
borrosa tienen la capacidad de modelar la variación continua del relieve de acuerdo con los
valores de una función de pertenencia (Viloria et al, 2011).
La agrupación borrosa de datos involucra la minimización de la suma de los errores
cuadráticos dentro de las clases de agrupamiento, bajo las siguientes condiciones: a) la suma
de las membrecías de cada objeto (en este caso celda o pixel) a las clases es a igual a uno (1);
b) la suma de las membrecías de los objetos a cada clase es mayor que cero (0) y c) la función
de membrecía pertenece al dominio cero (0) a uno (1).
El algoritmo empleado para la agrupación fue el “Fuzzy K means” (Minasmy y McBratney,
2002) disponible en el programa Fuzme, el cual utiliza una función que incluye aspectos
como: distancia cuadrática entre el valor correspondiente a los datos individuales y el vector
que representa el centroide de la clase, de acuerdo con la definición escogida de la distancia
(Euclidiana, diagonal o Mahalanobis); exponente de borrosidad, el cual determina el grado
de borrosidad de la solución final; µi* membrecía de los individuos a la clase y α parámetro
que determina el valor promedio de µi*.
Cuando el exponente de borrosidad es igual o cercano a 1 la agrupación o clasificación
borrosa es una participación rígida (no borrosa), a medida que él se aproxima al infinito la
solución se aproxima al grado más alto de borrosidad. Para determinar los grados de
membrecía (µi*, para las clases) se debe solucionar la ecuación:
Una vez determinados los grados de membrecía, se calculan los centroides de las clases (CK)
por medio de la ecuación:
33
Para lograr esta clasificación borrosa se deben realizar una serie de pasos que comprenden,
entre otras cosas, la preparación de la información o covariables a emplear, su exportación a
formatos aceptados por los respectivos programas de trabajo, generación de matrices de datos
donde se engloban toda la información de las variables, las corridas en el programa Fuzme con
diferentes exponentes de borrosidad y números de clases, la determinación del exponente
borroso y el número de clase adecuado, y finalmente la creación y despliegue de los mapas. A
continuación se describen brevemente cada uno de estos pasos:
Preparación de la información: consiste en lograr una precisión cartográfica y atributiva
adecuada de todas las capas incluidas en el proceso, es decir, las covariables deben estar en
la misma proyección cartográfica (UTM, Huso 19N) y datum Regven, además de calzar
exactamente una sobre otra y no poseer datos vacíos (NoData).
Exportación a formato texto (Asccii): exportar todas las variables geomorfométricas
generadas en SAGAGIS, y el Índice de vegetación a archivos ascii (*.asc). En los archivos
resultante se debe verificar la concordancia del número de columnas y filas, coordenadas de
latitud y longitud, y resolución espacial.
Generación de matriz de datos: A partir de todos los archivos ascii de cada covariable
geomorfometricas y el Índice de vegetación normalizado se creó una matriz de datos, es
decir, un solo archivo (extensión *.dat), apoyados en la aplicación FKCN (Viloria, 2007).
En este archivo resultante que se corresponde con una capa resumen cada celda o pixel
posee un valor de cada una de las covariables utilizadas para realizar la clasificación
borrosa.
Procesamiento en fuzme 3.5: Este último archivo resume la matriz creada en el punto
anterior, y es utilizado en la aplicación “FUZME 3.5”, para realizar la clasificación borrosa.
Para esto se especifican los siguientes aspectos:
- Directorio de salida.
- Localización y nombre del archivo de datos (resumen o matriz).
- Método de cálculo de distancia métrica: “Mahalanobis”
- Corridas con múltiples exponente fuzzy: Inicio (1.0); final(1.5) y pasos (0.1)
- Iteraciones máximas: 10
- Criterio de parada: 0.0001
- Número de clases mínima y máxima: 6 y 12.
- Algoritmo: Fuzzy-K-means (Fuzme 3.5).
34
El procedimiento genera varios archivos de salida, como el de resumen, en donde se
encuentran, entre otros, el (exponente borroso) para cada clase, el FPI (índice de
borrosidad), la MPE (entropía de participación modificada) y la (-dj/d) derivada de la
función objetiva con respecto a la derivada del exponente de borrosidad. Todos estos
parámetros son posteriormente empleados para determinar el exponente borroso ideal y el
número de clase correcto.
Selección del exponente de borrosidad: Un elemento clave para generar una apropiada
clasificación borrosa es la identificación del valor correcto del exponente de borrosidad ().
Odeth et al (1992a) sugirió en base a su experiencia con datos de suelos un valor de ()
entre 1,2 a 1,5. Sin embargo, en este estudio, para seleccionar el valor de exponente de
borrosidad (), se aplicó el procedimiento propuesto por el mismo Odeth et al (1992a), que
es generar diferentes clasificaciones con distintas combinaciones de exponente de
borrosidad () (en este estudio desde 1,0 a 1,5) y diferentes números de clases (desde 6 a 12
clases). Para cada una de estas combinaciones resultante se tomó la derivada de la función
objetivo con respecto a la derivada del exponente de borrosidad (-dj/d) y con ella se
trazaron curvas de la variación de (-dj/d) en función del () para cada clase. El valor ideal
de () correspondería al menor máximo de (-dj/d) de las diferentes curvas de números de
clases.
Selección del número de clases: Para seleccionar el número de clases se siguió el
procedimiento sugerido también por Odeth et al (1992a), el cual genera diferentes
clasificaciones o agrupaciones borrosas para diferentes números de clases (en este estudio
desde 6 a 12 clases) y exponente de borrosidad (desde 1,0 a 1,5), y para cada agrupamiento
obtenido se calculó el índice de borrosidad logrado (FPI) y la entropía de partición
modificada (MPE). El primero estima el grado de borrosidad generado por cada número
específico de clases. Cuando el FPI es 0, ninguna membrecía se distribuye entre cualquier
par de clases, es decir las clases son no borrosas, porque en el conjunto de datos existen
subestructuras muy bien diferenciadas entre sí. Por el contrario cuando el FPI es 1 la
borrosidad en los datos es máxima. De este modo la minimización del FPI indica un
número óptimo de clases borrosas que refleja mejor las subestructuras presentes en el
espacio multidimensional definido por el conjunto de datos. Por otra parte, el MPE
determina el grado de desorden creado por cada número específico de clases. Para
determinar el número óptimo de clases borrosas se presume que la minimización del MPE
es consistente con la maximización de la cantidad de información acerca de las
subestructuras generadas dentro del espacio multivariado.
35
Creación de topología y archivos asociados (centroides y mapas): Una vez obtenidos el
índice de borrosidad ideal () y el número de clases correctas, mediante el procedimiento
anteriormente mencionado, se continua corriendo el Programa FKCN (Viloria, 2007) para
obtener los archivos de salidas que proporcionan las características centrales de cada clases
(centroides) y los datos para evaluar el efecto de cada variable en la clasificación borrosa.
Además se obtiene el mapa producto de la clasificación en formato ascii.
Filtrado de las clases: Para mejorar la visualización de las clases obtenidas por lógica
difusa, se procede a realizar una generalización de dichas clases empleando un análisis
espacial de vecindad, específicamente un subconjunto o kernel de 3 x 3 celdas. Esto se
logra a través de métodos de filtrados en la aplicación arcinfo Workstation.
Clases fisiográficas: Es importante señalar que las salidas del método neuro-borroso
fueron denominadas “Clases fisiográficas”, principalmente debido a que son calculadas a
partir de atributos de relieve derivados de un modelo digital de elevación, además de un
índice de vegetación normalizado.
Despliegue en SIG: Empleando la aplicación Arcview 3.2, se importa el archivo ascii
producido por FKCN, y se muestra en una vista de la misma aplicación.
Clases tentativas de suelos: Un paso posterior, es la transformación de las “Clases
fisiográficas” a “Clases tentativas de suelos”, mediante el otorgamiento a cada una de ellas
del tipo de suelo representativo. Según el criterio de mayor correspondencia espacial,
apoyados en estudios edáficos previos realizados por Sevilla y Comerma 2009b. En otras
palabras se superpuso el mapa de “Clases fisiográficas” sobre el Mapa de suelos y se
observó a qué clase de suelos correspondían mayoritariamente las “Clases fisiográficas” del
mapa neuro-borroso.
6.3.2. Metodo Regresión-Kriging (RK).
6.3.2.1. Materiales.
Dentro de los materiales empleados para el método regresión-kriging se incluyeron tanto la
información de suelos recabada en el método convencional, curvas de nivel, hidrografía, las
covariables ambientales, así como las aplicaciones informáticas (software) empleadas para
lograr los objetivos planteados.
a) Información temática empleada.
En cuanto a la información para aplicar la metodología de regresión-kriging, se emplearon 40
observaciones de campo (barrenos y perfiles de suelos) de los 50 realizados en el estudio de
36
suelos convencional (Sevilla y Comerma, 2009b), por estos, tener más completas sus
caracterizaciones. La ubicación dentro de la cuenca de dichos puntos se puede observar en la
figura 8.
Figura 8. Localización de las 40 observaciones de campo en la Cuenca del Rio Canoabo
Además de las observaciones de campo, se emplearon treinta y una (31) covariables
ambientales, algunas provenientes de estudios previos como las formaciones geológicas
(Palmaven, 1999), el riesgo de erosión, la precipitación, la erosión actual, etc., y otras
diseñadas en este trabajo, las cuales son mencionadas en el cuadro 2.
37
Cuadro 2. Covariables ambientales empleadas en el método de regresión–kriging.
N° Covariable ambientales Nombre de la capa
1 Precipitación media anual mdprea620
2 Numero de meses húmedos mdnmhu20
3 Temperatura media anual mdtempa20
4 Evapotranspiración media anual mdetoa20
5 Zona de vida mdzonavi20
6 Imagen Landsat (Banda 1) i20000318_1c
7 Imagen Landsat (Banda 2) i20000318_2c
8 Imagen Landsat (Banda 3) i20000318_3c
9 Imagen Landsat (Banda 4) i20000318_4c
10 Imagen Landsat (Banda 5) i20000318_5c
11 Imagen Landsat (Banda 6a) i20000318_61c
12 Imagen Landsat (Banda 6b) i20000318_62c
13 Imagen Landsat (Banda 7) i20000318_7c
14 Índice de vegetación Normalizado Normalized.Difference.Vegetati
15 Formaciones geológicas mdgeolo20a
16 Modelo digital de elevación Mde20b
17 Pendiente Slope
18 Sombreado Analytical.Hillshading
19 Orientación de la pendiente Aspect
20 Erosión actual mderoac20
21 Factor LS LS.Factor
22 Factor R factor_20r
23 Riesgo de erosión actual ea720
24 Riesgo de erosión potencial ep720
25 Plan de curvatura Plan.Curvature
26 Perfil de curvatura Profile.Curvature
27 Índice de convergencia Convergence.Index
28 Área de captación Catchment.Area
29 Índice de humedad Wetness.Index
30 Altitude_.above Altitude_.above
31 Channel_Network Channel_Network
38
b) Aplicaciones informáticas utilizadas.
Por otro lado, para generar la cartografía digital de las propiedades de los suelos de la Cuenca
del Rio Canoabo bajo esta metodología, se emplearon las siguientes aplicaciones informáticas
(software):
Estadístico R.
RSTUDIO (Interface para R).
SAGAGIS.
CALC (Libreoffice).
6.3.2.2. Procedimientos.
Los pasos que se ejecutaron para lograr cartografiar las propiedades de los suelos consideradas
mediante el método de regresion-kriging se describen a continuación:
a) Revisión de los datos puntuales de suelos.
Los datos de suelos empleados fueron cuarenta (40) observaciones de campo geográficamente
referenciadas, en donde se describieron sus horizontes y las propiedades pertinentes, como
son: Arena, limo, Arcilla, Materia orgánica, pH. Los datos de estas propiedades fueron
analizados para determinar la presencia de datos anómalos mediante la metodología formulada
por Tukey (1977). Así pues se eliminaron observaciones con datos atípicos, y también se
revisó que todos los horizontes tuviesen datos de las propiedades de interés y que las
profundidades iniciales y final de los horizontes estuviesen correctas.
b) Estimaciones de los valores de las propiedades en las profundidades solicitadas (Spline).
Como es conocido la descripción de los perfiles de suelos viene dada por horizontes
pedogeneticos, los cuales no tienen una profundidad ni espesor constante, por tal razón y por
la necesidad de cartografiar las propiedades a una misma profundidad, se debe estimar el valor
de cada una de ellas a cierta profundidad. En este trabajo se cartografiaron digitalmente cinco
(5) propiedades de suelos a una profundidad uniforme de 0 a 20 cm, y dos de ellas en dos
profundidades mayores del perfil del suelo, dando como resultados 7 propiedades a estimar,
los cuales se resumen en el cuadro 3.
Para lograr el valor de cada propiedad a la profundidad constante que expresa el cuadro 3 se
utilizó la función llamada SPLINE (Malone et al, 2009), en este caso llamada
“DepthFunctions”. Dicha función spline se aplicó mediante un script en estadístico “R” a los
datos de cada propiedad, tomando una pequeña base de datos del atributo, la cual estaba
constituida por un identificador único del perfil de suelos, el valor de la propiedad y las
39
profundidades de inicio y final de los horizontes de cada perfil u observación de campo. Una
imagen ilustrativa de la salida de esta función se muestra en la Figura 9.
Cuadro 3. Propiedades de los suelos cartografiadas digitalmente por regresión–kriging.
N° Atributo Profundidad Nombre Unidad
1 Arena 0 - 20 cm ARE_0_20 %
2 Limo 0 - 20 cm LIM_0_20 %
3 Arcilla 0 - 20 cm ARC_0_20 %
4 Arcilla 20 - 50 cm ARC_20_50 %
5 Materia orgánica 0 - 20 cm MOR_2_20 %
6 pH 0 - 20 cm Ph_0_20 -
7 pH 50 - 200 cm PH_50_200 -
Figura 9. Ejemplo de salida de función SPLINE.
c) Obtención de la información sobre covariables ambientales (MDE e imágenes LANDSAT).
Lo que se menciona como covariables ambientales, no son más que aquellas variables
físico-naturales que pueden representar a los factores formadores de suelos propuestos por
40
Jenny (1941). En este caso las principales fuentes de covariables ambientales consideradas
fueron el modelo digital de elevación (MDE), el cual fue diseñado con una resolución
espacial de 20 m y las imágenes del sensor remoto LANDSAT (ETM+), específicamente
las bandas 1, 2, 3, 4, 5, 6a, 6b, 7. El modelo de elevación dio pie a las llamadas variables
morfometricas, mediante procedimientos incluidos en SAGAGIS y por otro lado, las
imágenes de LANDSAT dieron origen al índice de vegetación normalizado (NDVI). La
fuente de las imágenes satelitales fue la NASA y se descargaron de internet.
d) Preparación de las covariables ambientales.
Esta preparación de las covariables ambientales consistió en proyectarlas cartográficamente
a Universal Transverso de Mercator (UTM) en los Husos 19, datum Regven. También se
corrigieron los “hundimientos” del modelo digital de elevación productos del proceso de
interpolación de los valores de las curvas de nivel a través del procedimiento en SAGAGIS:
“Modules\TerrainAnalysis\Preprocessing\fillSinks”.
e) Cálculo del índice de vegetación normalizado (NDVI).
En este caso el NDVI se calculó en SAGAGIS mediante el proceso
“Modules\imagen\tools\vegetation índices\vegetation index[slope.based], empleando los
mosaicos de las bandas 3 (Rojo) y 4 (InfraRojo Cercano).
f) Calculo de las variables morfométricas.
Las variables morfométricas empleadas fueron generadas a partir del modelo digital de
elevación en SAGAGIS, mediante el procedimiento “Modules\Terrain Analysis\Basic
terrain analysis” en SAGAGIS, las cuales se pueden observar en el cuadro 4.
Cuadro 4. Variables morfometricas empleadas en regresion-kriging
Variable morfométrica Descripción
Slope Pendiente
Aspect Orientacion de la ladera
Plan curvature Plano de curvatura
Profile curvature Perfil de curvatura
convergence index Indice de convergencia
Catchment area Area de captacion
Catchment slope Pendiente de captación
LS-factor Factor LS
Elevation Altura
Analytical.Hillshading Sombreado
41
g) Relacionar las propiedades de los suelos con los valores de las covariables ambientales.
Para estimar los valores de propiedades de suelos en sitios no muestreados, a partir de datos
puntuales de suelos y las covariables ambientales, se debe primero adicionar a los datos de
los perfiles u observaciones de suelos estimados con la función Spline, los valores de las 31
covariables que se consideraron pertinentes.
Para esto se sobreponen los perfiles de suelos con las covariables, utilizando el
procedimiento en SAGAGIS “Modules\Shapes\Grid\Gridvalues\Addgridvaluestopoints”, y
mediante esto cada perfil de suelo tiene el valor correspondiente de cada covariable para
ese sitio. Así se obtiene un archivo en formato txt con los mencionados valores para ser
utilizados en el análisis estadístico paramétrico de regresión lineal múltiple.
h) Cálculo estadístico de la regresión lineal múltiple en estadístico “R”.
Con los datos del punto anterior y empleando las aplicaciones R y Rstudio se abrió un
script para realizar el análisis paramétrico de regresión lineal múltiple, lo que permitió
obtener una ecuación de regresión con sus respectivos intercepto y coeficientes para cada
propiedad estimada y cada profundidad de las mismas. Los principales pasos en este
proceso fueron: lectura de datos de suelos (40 perfiles u observaciones de suelos),
separación del grupo de datos en dos subgrupos: uno para la calibración del modelo de
regresión y otro para la validación del mismo, análisis exploratorio de datos para eliminar
datos atípicos, determinación del coeficiente de correlación entre las covariables
ambientales y la propiedad a estimar, cálculo de la regresión lineal múltiple con todas las
covariables ambientales (31), análisis de varianza para revisar la significancia del modelo y
de las covariables, verificación del cumplimiento de los supuestos de uniformidad de los
valores, independencia de los valores de las propiedades, linealidad entre las variables x e y
(se deja que el modelo decida si las relaciones son lineales o no, lo que se reflejará en la
significancia de los coeficientes), falta de multicolinealidad entre las variables (se
comprueba mediante el cálculo de los factores de inflación de la varianza), verificación de
la normalidad de los errores mediante un histograma y la prueba de Shapiro-Wilk (1965), y
se evalúa la homoscedasticidad o Varianza constante de los errores en relación con las
variables x e y, mediante la prueba Breusch-Pagan (1979). Para eliminar covariables no
significativas para el modelo se empleó el algoritmo de selección de variables paso a paso
(stepwise), y finalmente se obtuvo la ecuación según el R2 ajustado y los residuos o errores
entre el valor real y los valores estimados por la regresión en cada uno de los puntos de
suelo que se introdujo al principio. Este proceso genera un archivo contentivo de estos
residuos para el próximo paso, que es el kriging de los residuos o errores.
42
i) Interpolación kriging de los residuos o errores en estadístico “R”.
La interpolación de los residuos desde los puntos de suelos a zonas no muestreadas se
realizó mediante geoestadistica, más específicamente el kriging ordinario, el cual es un
método de interpolación óptimo basado en regresión en función de los valores en
ubicaciones circundantes, ponderadas de acuerdo con los valores de covarianza o
semivarianza espacial y constituyen un buen estimador lineal no sesgado. Para realizar esta
interpolación se emplearon las aplicaciones “R” y “Rstudio” donde se utilizó un script
proporcionado por EMBRAPA Suelos, sobre el kriging de los residuos. Los pasos fueron:
lecturas de los datos de residuos o errores proveniente del paso anterior; posicionamiento
geográficos de los datos; establecimiento de la extensión del área de estudio; generación del
variograma empírico; ajuste del modelo de variograma; creación del modelo matemático de
interpolación definitivo con cada uno de sus elementos considerando una meseta parcial
con el valor de la varianza de la muestra; estimando visualmente el alcance a partir del
variograma empírico, así como el efecto nugget, y se eligió el tipo de modelo (esférico,
gaussiano), según el error medio cuadrático (EMC) resultante de sus corridas, el modelo
que diera menor EMC era el seleccionado y, finalmente se generó el kriging ordinario,
obteniéndose un archivo de los resultados.
j) Obtención de los mapas finales de cada propiedad a diferentes profundidades.
Para obtener los mapas finales se procedió a ejecutar la ecuación de regresión múltiple
obtenida de cada propiedad del suelo en la aplicación SAGAGIS. En ella se encontraba
desplegada cada una de las covariables ambientales consideradas significativas para el
modelo. Este proceso fue realizado en “Gridcalculator”. Luego se desplegó el mapa de
kriging de los residuos obtenido en el paso anterior y posteriormente se sumaron ambas
capas (regresión y kriging) para obtener el mapa final producto de la metodología
“regresion-kriging”.
k) Validación.
Análisis de incertidumbre del modelo de regresión múltiple (RLM): En el inicio de
este trabajo se dividieron los datos (40 perfiles u observaciones de suelos) en dos
subgrupos, uno para ser utilizados en la calibración o “entrenamiento” y así determinar los
parámetros del modelo, y otro subgrupo para la validación o verificación de los resultados.
Entonces se obtuvo un grupo de 32 perfiles (80%) para el cálculo y 8 perfiles (20 %) para
la validación, este último grupo de datos se seleccionó de forma aleatoria. Ambos
conjuntos de datos fueron sometidos a un análisis exploratorio que permitió verificar
valores atípicos que pudieran perjudicar la evaluación.
43
Dos índices fueron empleados para evaluar la calidad de los resultados: uno la desviación
residual estándar (Residual Standard Error (drp)) y otro el coeficiente de determinación
(Multiple R-squared). La drp resulta de la diferencia entre los valores observados (OBS) y
los correspondientes de predicción (PRED) que son los llamados residuos (RES) y su
fórmula es:
RESi = PREDi - OBSi
Donde i son los índices de cada observación.
El drp se calcula mediante siguiente fórmula:
𝒅𝒓𝒑 = √(∑(RESi)2/n-p-1))
Dónde: n: es el número de observaciones y p es el número de variables independientes
Por otro lado el coeficiente de determinación (R2) es el que mide la fuerza de la relación
entre la variable dependiente (estimada) y las demás variables independientes (predictores)
que intervienen en el modelo. La fórmula es la siguiente:
R2 = Variación predicción / variación total.
Dónde:
Variación de Predicción = ∑(PREDi – media(OBS))2
Variación total = ∑(OBSi – media(OBS))2
El coeficiente de determinación R2 es ajustado (R
2 Ajust) debido a que el número de
variables predictores influye en este coeficiente. Entonces la fórmula es:
R2 Ajust = 1- (1-R2) * (n-1)/(n-p-1)
Dónde: n: número de observaciones y p: número de variables independientes.
Esto es importante para solo incluir las variables que realmente contribuyen con mejorar la
predicción del modelo. Aunque la desviación residual estándar (drp) es un indicador de la
calidad de los resultados en las mismas unidades de las observaciones, es recomendable
verificar los valores máximos y mínimos de los residuos que darán más elementos para
evaluar la calidad de los resultados.
Análisis de incertidumbre del modelo de kriging de los residuos: Para el análisis de
incertidumbre de los resultados de este procedimiento, se relacionaron los datos dejados
para la validación (8 perfiles u observaciones de campo) con los datos obtenidos con la
44
interpolación de Kriging. Este procedimiento ofrece los errores mínimos y máximos,
observando la magnitud de los mismos.
También, se realizó una validación cruzada de los resultados del kriging de los residuos,
esta vez empleando los datos que se emplearon para la elaboración del semivariograma y
el modelo teórico. Esto fue posible corriendo 32 veces el kriging eliminando cada vez una
observación, luego se compararon el resultado del kriging con el valor de la observación
dejado afuera, así 32 veces. Con esto se calcula el error medio cuadrático (EMC), que es
útil como un índice de certeza de los resultados del proceso de kriging de los residuos.
Dónde: n = número de observaciones, vi = residuos observado, vi = residuos estimado.
Análisis de Sensibilidad de las covariables ambientales: Con este análisis se busca
determinar el efecto de las covariables ambientales en el modelo de predicción. El cual se
pudiera exponer de la siguiente manera:
Variable a estimar = f(Covariable1, covariable2,…., covariable n).
Considerando que el coeficiente de determinación (R2) es la fuerza de la relación entre la
variable dependiente (estimada) y las demás variables independientes (covariables
ambientales), entonces lo que se quiere determinar cuál es la contribución de cada variable
a la formación de este R2. Para hacer esto se emplearan la función “Forward Stepwise”.
Esta función inicialmente realizaría la regresión lineal con una sola variable independiente
y se determina cuál de estas tuvo el mayor valor de R2, este será la contribución del R
2 de
la variable encontrada. Se agrega una a una covariable junto a las del paso anterior y se
determina cuál de estas tuvo el mayor R2. La diferencia de R
2 de este paso con el anterior
será la contribución de esta segunda covariable. Así sucesivamente se continua hasta la
última covariable y se ordenan de mayor a menor la contribución de cada una de ellas en el
R2 total.
45
6.4. COMPARACIÓN DE LOS METODOS CARTOGRAFICOS CONTRA UN MAPA
CONVENCIONAL.
Para saber cuál de los métodos de cartografía digital empleados concordó más con el mapa de
suelos convencional, se comparó cada uno de ellos empleando el “Índice de concordancia” y
el coeficiente “Kappa”, los cuales miden el grado de concordancia o de acuerdo (Cohen 1960;
Jenness y Judson, 2007 y Arguellos 2013).
Para poder lograr la comparación de los mapas producidos, con respecto al mapa de suelos
levantado convencionalmente, los primeros deben poseer el mismo número de clases que este
último y además, que la denominación o numeración de dichas clases en ambos mapas sea la
misma.
El mapa de suelos levantado convencionalmente de la cuenca del Rio Canoabo por Sevilla y
Comerma (2009b) consto de seis (6) unidades cartográficas de suelos, clasificadas
taxonómicamente y una (1) clase adicional correspondiente al embalse del Rio Canoabo.
A continuación se describe la metodología empleada para lograr la comparación para cada
método de cartografía digital.
6.4.1. Concordancia entre el método neuro-borroso y el levantamiento Convencional:
El método neuro-borroso agrupo los suelos de la cuenca en once (11) “Clases fisiográficas”.
Luego estas clases son transformadas en “Clases tentativas de suelos” y para lograr la
comparación de estas últimas con el mapa de suelos convencional, se debe realizar una
correspondencia entre las clases de ambos mapas, por similitud cartográfica y geográfica. Es
decir se igualan el número de clases y se denominó cada “Clase tentativa de suelos” igual que
su correspondiente clase en el mapa de suelo convencional, es decir se le asigna el mismo
número.
Posteriormente se procede a asignar los valores de clases de ambos mapas a un grupo de
57.912 puntos de observación distribuidos en una cuadricula espaciada cada 20 m en toda la
superficie de la cuenca. Ello buscaría la coincidencia entre clases de ambos métodos
cartográfico (neuro-borroso y convencional). Para ello fue empleado el índice de concordancia
y el coeficiente Kappa calculado a través de una extensión del Sistema de información
geográfico Arcview 3.2, programada por Jenness y Judson (2007).
El índice de concordancia se calcula mediante la siguiente formula:
𝑃𝐺 =(𝑎1 + 𝑎2 + 𝑎3 … + 𝑎𝑛)
𝑁
46
Dónde:
a1 = número de aciertos entre las clase 1; a2 = número de aciertos entre las clase 2.
a3 = número de aciertos entre las clase 3, n = número total de clases.
N = número total de observaciones.
El coeficiente Kappa calcula el porcentaje de acuerdos entre los dos métodos, su fórmula es la
siguiente:
𝐾 =𝑃𝑜 − 𝑃𝑒
1 − 𝑃𝑒
Siendo:
𝑃𝑜 =𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑐𝑢𝑒𝑟𝑑𝑜𝑠
𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑐𝑢𝑒𝑟𝑑𝑜𝑠 + 𝑛𝑢𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑑𝑒𝑠𝑐𝑢𝑒𝑟𝑑𝑜𝑠
𝑃𝑒 = ∑(𝑝𝑖1 𝑥 𝑝𝑖2)
𝑛
𝑖=1
Dónde:
n = números de categorías; i = número de la categoría (de 1 hasta n);
pi1 = proporción de ocurrencias de la categoría i para el método 1;
pi2 = proporción de ocurrencias de la categoría i para el método 2.
A la hora de interpretar el valor de K es útil disponer de una escala como la muestra el cuadro
5.
Cuadro 5. Interpretación del valor de K.
Valor de K Fuerza de la concordancia
< 0.20 pobre
0.21 – 0.40 débil
0.41 – 0.60 Moderado
0.61 – 0.80 Alto
0.81 – 1.00 Muy Alto
Fuente: Landis y Koch, 1977
47
6.4.2. Concordancia entre el método regresion-kriging y el levantamiento Convencional:
El método regresión–kriging no produce un mapa de clases de suelos directamente, sino
mapas de propiedades de los suelos como: arena, limo, arcilla, pH y materia orgánica. Para
lograr comparar estos productos con el mapa de clases de suelo levantado convencionalmente,
primero se procedió a crear un mapa de “Clases de propiedades de los suelos”, apoyado en el
método neuro-borroso.
A este mapa de “Clases de propiedades de suelos” se le realizo la correspondencia entre sus
clases y la del mapa convencional de suelos, según similitud cartográfica y geográfica. Es
decir denominar cada clase igual que su correspondiente espacial clase en el mapa
convencional, y asignándole el mismo número para poder compararlos. Finalmente se le dio el
valor de las “Clases de propiedades de suelos” a los 52.331 puntos de observación dispuestos
en una cuadricula espaciada cada 20 m sobre la cuenca. Estos puntos ya poseían las clases del
mapa convencional y con esto finalmente se calculó el índice de concordancia y el coeficiente
Kappa para conocer el grado de concordancia entre ambos métodos.
48
7. RESULTADOS Y DISCUSIÓN
7.1. RESULTADOS DEL MÉTODO NEURO–BORROSO.
Los resultados de la agrupación o clasificación de las tierras de la cuenca del Rio Canoabo,
mediante el método neuro–borroso, son los siguientes:
7.1.1. Modelo digital de elevación (MDE) obtenido:
Como se mencionó anteriormente El MDE generado presentó una resolución espacial de 20 m
y forma rectangular, lo que facilitó la aplicación de los algoritmos matemáticos y el
procesamiento para producir los atributos topográficos. La figura 10 muestra los elementos
geográficos originados y necesarios para generar el MDE (hojas cartográficas, curvas de nivel
e hidrografía).
Figura 10. Hoja cartográfica a escala 1:25.000, curvas de nivel e hidrografía de la Cuenca
En la figura 11 se pueden apreciar algunos de los atributos expuestos por el MDE. En este
caso, tres perfiles topográficos. Uno con rumbo Sur-Norte (Perfil A) y otros dos con rumbo
Oeste-Este, uno en la parte norte de la cuenca (Perfil B) y otro en la parte Sur (Perfil C). En
ellos se pudo observar el desnivel encontrado y el relieve cambiante de la cuenca.
Resumiendo, el MDE evidencio la disposición de un estrecho valle central, correspondiente al
Rio Canoabo con orientación Sur-Este a Nor-Este, rodeado por un piedemonte estrecho y
laderas de montañas con un relieve más accidentado. La variación de altura está comprendida
entre 118 y 1745 msnm. Los perfiles topográficos mencionados mostraron que en el perfil A
49
contrastan las zonas montañosas altas ubicadas al Sur (“Cerro de Paja”) y luego la zonas bajas
del valle del Rio Canoabo interceptado aproximadamente a los 14.000 m por las estribaciones
de la Fila “La Justa”, finalmente se observa la desembocadura del rio “Canoabo” en el rio
“Temerla” (salida de la cuenca). En el perfil B (línea superior), se observan dos picos
correspondientes a la Fila “La Media Luna” (Oeste) y la Fila “La Justa” (Este) las cuales son
los límites de la Cuenca, y encierran en la parte central el cauce del río Canoabo. En el perfil C
(línea inferior) se detalla la parte alta de la cuenca, donde se observan dos picos, el primer pico
al Oeste correspondiente al sector “Capa” con una altura aproximada de 1150 msnm, seguido
de la depresión del rio “Capa”, continuada por una loma que lo separa del rio “San Antonio”,
para finalmente subir a la fila “La Justa” a unos 1600 msnm al extremo Este. Las
características de la capa raster del modelo digital de elevación se muestran en el cuadro 6.
Figura 11. Modelo digital de elevación mostrando los perfiles topográficos
50
Cuadro 6. Características del MDE generados en la zona de estudio.
CARACTERÍSTICAS DESCRIPCIÓN
Número de columnas 761
Número de filas 885
Número de celdas 673.485
Coordenada longitud mínima (m) 572.510,3125
Coordenada latitud mínima (m) 1.134.352,125
Resolución espacial (m) 20
Área de la celda (m2) 400
Área total (ha) 26.939,4
7.1.2. Descripción de las Variables morfométricas y el Índice de vegetación normalizado
(NDVI).
A partir del MDE se obtuvieron las variables morfométricas, las cuales se muestran en las
figuras 12 y 13, y sus respectivos estadísticos en el cuadro 7. De estos datos resalta la poca
variabilidad en el índice de humedad dentro de la cuenca y por el contrario el alto coeficiente
de variación en el plano y perfil de coberturas.
Estas variables morfométricas fueron seleccionadas como parámetros de entrada para el
método neuro-borroso, debido a la experiencia obtenida en trabajos previos como los de
Valera y Viloria (2009) y Nunez et al (2013), quienes encontraron una alta relación entre las
propiedades de los suelos y las variables morfométricas altura, orientación de laderas,
gradiente de pendiente, plano y perfil de curvatura, área de captación, índice topográfico de
humedad y el NDVI.
En este estudio se probaron, basado en el método de ensayo y error, diferentes combinaciones
de variables morfométricas, y el resultado reveló que las covariables: altitud, altura sobre el
canal de drenaje, la pendiente, el NDVI, el factor LS, el plano de curvatura, el perfil de
curvatura, índice topográfico de humedad y el área de captación; expresaron mejor la
agrupación borrosa y la disposición de las clases en el paisaje. El índice de vegetación
normalizado (NDVI), fue producto del procesamiento de la imagen satelital Landsat ETM+.
Estas variables morfometricas y el NDVI se pueden observar en la figura 13.
53
Cuadro 7. Parámetros estadísticos descriptivos del MDE de la Cuenca del Río Canoabo.
VARIABLE MEDIA MINIMO MAXIMO DESVIACION
ESTANDAR
CV (%)
Altitud (msnm) 659 118 1745 357 54
Altura sobre el canal de
drenaje (m)
68,5 0 434 73,4 107
Pendiente 0,31 0 1,03 0,16 52
Factor LS 69,6 0 4066 72,45 104
Orientación de la ladera 3,26 0 6,28 1,95 60
Plano de curvatura 0,000063 -0,125 0,061 0,0053 8.551
Perfil de curvatura -0,000053 -0,110 0,089 0,0054 -10.264
Índice de humedad 9,97 6,144 25,42 2,22 22
Área de Captación 200506,5 400 147879104 3035286,6 1.514
NDVI (adimensional) 0,35 -0,415 0,596 0,1312 37
7.1.3. Agrupamiento o clasificación neuro-borrosa.
La obtención de los parámetros necesarios para realizar la clasificación neuro-borrosa y sus
correspondientes resultados se describen a continuación.
7.1.3.1. Índice de borrosidad adecuado.
Diferentes estudios publicados sobre clasificación borrosa de suelos, han determinado el
número de clases adecuada, de acuerdo a la experiencia o intuición de los investigadores.
Otros han aplicado funciones matemáticas que intentan resolver esta incógnita. En este estudio
se empleó el método de graficar las curvas de FPI (índice de rendimiento borroso) contra el
número de clases exploradas, las cuales fueron un total de 7 clases (6 a 12), un rango de
variación del Φ comprendido entre 1,10 y 1,50 y observar el valor de borrosidad media. Para
esto se corrió el programa Fuzme 3.5. El resultado de graficar lo anterior se observa en la
figura 14.
De la figura 14 se desprendió que hay poca variación del índice de rendimiento borroso (FPI)
en función del número de clases. Pero, si existe una importante variación de este índice según
sea el coeficiente borroso comprendido entre 1,10 y 1,50. Esto llevó a establecer como
coeficiente borroso ideal el 1.2, ya que las curvas de valores de FPI para los coeficiente
borrosos de 1,50; 1,40; 1,30 muestran valores de FPI cercanos a 1, lo que implica una total
borrosidad y no existe distinción entre clases. Por el contrario la curva de FPI para coeficiente
de borrosidad de 1,1 presentó valores de FPI bajos en todas las clases entre 0,2 a 0,1 lo que
expresa límites entre clases muy discretos y se pierde la borrosidad del modelo y los límites
54
entre las clases tienden a ser abruptos, lo cual tampoco es ideal. De allí que un valor de 1.2 es
un punto intermedio de borrosidad y discreción.
Figura 14. Variación del FPI en función del número de clases y el exponente borroso (θ)
7.1.3.2. Número óptimo de clases.
El número de clases ideal se obtuvo primero graficando la variación de la Entropía de
Partición Modificada (MPE) y el índice de rendimiento borroso (FPI) en función del número
de clases, lo que se presenta en la figura 15, allí se nota poca variación de los valores de MPE
(0.35 a 0.40) y FPI (=0.39 a 0.45) entre las clases y que su tendencia es hacia la estabilidad.
Por tal razón el número de clases podría haber sido cualquiera, sin embargo cuando se
estudiaron los mapas de los diferentes números de clases, el número de clase 11 comenzó a
separarse clases fisiográficas claves en la cuenca, como eran las laderas donde aparecían
suelos erosionados. Ver Figura 16. Esto ayudo a indicar el número de clase óptimo.
Figura 15 Variación de la MPE y el FPI en función del número de clases.
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
1.10
6 7 8 9 10 11 12
FP
I
Número de clases
1.1
1.2
1.31.4
1.5
0.10
0.30
0.50
0.70
0.90
1.10
6 7 8 9 10 11 12
FP
I o
MP
E
Número de Clases
FPI
MPE
55
7.1.3.3. Cartografía de clases fisiográficas.
La figura 16 muestra el resultado del agrupamiento neuro-borroso de los suelos de la cuenca
empleando el sistema clasificador de paisaje Fuzzy Kohonen (Viloria, 2007) y los parámetros
como el coeficiente o índice de borrosidad (1.2) y los números óptimos de clases (11).
Figura 16. Mapa de unidades clases fisiográficas producto de la clasificación neuro-borrosa.
La figura 16 muestra el mapa de “Clases fisiográficas” resultado del método neuro-borroso.
Este mapa se generalizo un poco, simplemente uniendo algunas de sus clases, que por
experiencia de campo no merecían estar separadas, y que el método considero separarlas solo
por que pertenecían a laderas opuestas (Oriente y occidente de la cuenca). Todo esto se realizó
con el fin de facilitar su entendimiento y mejorar la comparación con el mapa de suelos
convencional. Las clases que se unieron fueron las clases 3 y 7 (áreas marrón oscuras), las
clases 2, 5 y 10 (áreas marrón claro) y las clases 6 y 11 (áreas naranja).
Por otro lado también se notó que las clases fisiográficas 2, 5 y 10 (laderas bajo bosque
semideciduo) con unas 3920 ha, fueron las más frecuentes, luego le siguieron las clases 6 y 11
(laderas bajo bosque deciduo) con unas 3295 ha; continuaron las clases 3 y 7 (laderas altas
56
bajo bosque nublado) con unas 3239 ha; la clase 1 (piedemonte bajo bosque deciduo) con unas
1614 ha; la clase 4 (laderas bajo bosques deciduos con erosión) con 1546 ha; la clase 8 (valle
bajo bosque deciduo) con unas 395 ha y, finalmente la que menos superficies tiene fue la clase
9 con 267 ha.
7.1.3.4. Características centrales de las clases.
Las características típicas de cada una de las once (11) clases fisiográficas en que se
estratificó la cuenca, se obtuvieron de los centroides producidos por el programa FKCN
(Viloria 2007) y se pueden observar de manera resumida en el cuadro 8.
Cuadro 8. Datos de los centroides de cada clase obtenida en la cuenca del Rio Canoabo.
Clase
Alt
ura
pro
med
io Altura
relativa
sobre el
canal de
drenaje
Pen
die
nte
NDVI
Factor de
erosión
del relieve
Orie
nta
ció
n
Pla
no
d
e
cu
rv
atu
ra
Perfi
l d
e
cu
rv
atu
ra
Índ
ice
de
hu
med
ad
Área
de c
ap
tació
n
msnm m % adim adim - adim adim adim adim
1 338 19 15 0.35 42 W -0.06 -0.08 10.9 54830.6
2 836 215 38 0.38 59 W 0.08 0.13 8.8 3635.8
3 1109 57 30 0.36 74 NW -0.02 -0.01 10.1 27262.3
4 433 29 26 0.13 48 E 0.05 -0.01 9.8 25554.3
5 572 121 50 0.43 90 E 0.07 0.06 8.8 5617.5
6 534 68 44 0.38 86 SW 0.05 0.01 9.1 9752.5
7 1011 52 30 0.40 76 NE -0.03 -0.01 10.0 28276.0
8 287 1 3 0.11 37 NW -0.08 -0.09 17.6 4936632.5
9 1328 173 38 0.24 63 SE 0.08 0.11 8.9 4556.0
10 514 42 36 0.37 82 NW 0.02 -0.01 9.5 24294.1
11 370 21 21 0.40 66 NE -0.08 -0.11 10.9 427819.8
A continuación se presenta una descripción de cada una de las clases fisiográficas obtenidas
para la cuenca, basándose en algunos datos del cuadro 8 y siguiendo una secuencia que va
desde las zonas más bajas y centrales del valle del Rio Canoabo, siguiendo por el
piedemonte y laderas hasta terminar en las zonas más altas de las crestas de las montañas
(Figura 16):
57
La clase 8 pertenece al valle de Rio Canoabo, y atraviesa la cuenca por el centro en sentido
Sureste a Noroeste, principalmente orientado hacia el Noroeste, con una altura promedio de
287 msnm. Este valle es muy plano con menos de 3 % de pendiente, su forma topográfica
predominante es cóncava (esto lo indica el signo negativo de valor del plano y perfil de
curvatura), lo cual favorece la acumulación de agua en los suelos, de allí su alto índice de
humedad y de posibilidad de captar agua. Actualmente se encuentra altamente intervenida,
debido al establecimiento de las poblaciones de Canoabo, Sabaneta y Santa Ana; además la
vegetación natural fue desplazada en algunos lugares por cultivos introducidos como
cítricos, musáceas, caña de azúcar y cacao. El potencial de erosión en este valle es muy
bajo. Superficie 395 ha.
La clase 1 está ubicada en el margen oriental del valle del Rio Canoabo y corresponde a un
piedemonte y faldas de laderas, los cuales tienen una orientación al oeste y su altura
promedio es de 338 msnm. Las pendientes son moderadas a bajas (15 %), su forma
topográfica generalmente es cóncava, lo cual da una moderada posibilidad de captar agua.
Está cubierto por un bosque deciduo de moderada a baja intervención; sin embargo, existen
algunas zonas muy intervenidas asociadas a la población de Canoabo. El potencial de
erosión es bajo. Superficie 1.614 ha.
La clase 4 corresponde al piedemonte y laderas bajas y medias, altamente erosionadas,
ubicadas a ambos lados del valle del Rio Canoabo, pero especialmente en las laderas
occidentales, por tal razón principalmente se orientan hacia el Este, su alturas van desde
300 msnm en el valle a unos 800 msnm en las laderas media-alta; sin embargo,
fundamentalmente se concentran en los 433 msnm. Esta área posee una pendiente
moderada de unos 26 %, con forma topográfica compleja (cóncava-convexa) que
compromete su potencial de captar agua. La zona está fuertemente intervenida por la
ganadería actualmente sin prácticas de conservación, lo que ha promovido procesos
erosivos, y como consecuencia sus tierras han perdido la capacidad productiva emergiendo
una vegetación herbácea rala de mala calidad e inclusive suelos desnudos. El potencial de
erosión es moderado; no obstante el manejo inadecuado de las tierras lo hacen muy alto.
Superficie 1.546 ha).
La clase 11 se ubica en las laderas bajas a medias, ubicadas al oeste de la cuenca, su
orientación es hacia el Noreste y poseen una altura promedio de 370 msnm. Poseen
pendientes moderadas de 21 % y su forma topográfica es ligeramente cóncava, lo que
favorece la captación de agua. Estas laderas están actualmente cubiertas por matorrales,
bosques deciduos y semideciduos de moderada a alta intervención. Su potencial de erosión
es moderado a alto debido a las pendientes y a la alta intervención humana que en este lado
58
de la cuenca se manifiesta con más fuerza, mediante la implantación de cultivos de cítricos
(mandarina), ocumo y ganadería. Superficie 1.493 ha.
La clase 6 son las laderas medias a altas, ubicadas en la parte oriental de la cuenca, poseen
orientación hacia el Suroeste y una altura promedio de 534 msnm. Las pendientes son altas
de 44 % y forma topográfica ligeramente convexa, favoreciendo poco la captación de agua.
Estas laderas están cubiertas por matorrales y bosque semideciduo de moderada a baja
intervención. Su potencial de erosión es muy alto. Superficie 1.802 ha.
La clase 5 son las laderas medias ubicadas al norte de la cuenca, las cuales culminan en la
llamada fila de “La Media Luna”, está orientada hacia el Este, su altura ronda los 572
msnm. Posee altas pendientes (50%) y una forma topográfica convexa, lo que compromete
la captación y acumulación de agua en sus suelos. Estas montañas están cubiertas
densamente por un bosque deciduo y matorrales. Su potencial de erosión es muy alto,
debido a su pendiente, longitud de las laderas y su forma convexa. Superficie 1.184 ha.
La clase 10 son las laderas medias concentradas al Sureste de la cuenca, por tal razón su
orientación es hacia Noroeste; su altura es en promedio de unos 514 msnm. Posee
pendientes de 36 % y su forma topográfica es compleja convexa-cóncava, comprometiendo
la acumulación de agua y favoreciendo los procesos erosivos. Están cubiertas por bosques
deciduos, semideciduos y matorrales, de moderada a baja intervención. Su potencial de
erosión es muy alto. Superficie 1.877 ha.
La clase 2 se corresponde con la fila “La Justa” al oriente de la cuenca. Está ubicada a una
altura promedio de 836 msnm y su orientación es hacia el oeste, las pendiente son de
moderada a altas (38 %), la forma topográfica es convexa, la vegetación es abundante
especialmente bosques nublados con epifitas. El potencial de captar agua es bajo por su
forma topográfica y el riesgo de erosión es moderado por las pendientes y su forma
convexa. Superficie 859 ha.
La clase 3 son laderas de montañas ubicadas en el extremo suroriental de la cuenca
orientadas al Noroeste a unos 1109 msnm. Sus pendientes son de moderadas a altas (30 %),
la forma topográfica es moderadamente cóncava favoreciendo poco la acumulación de
agua. Está cubierta por unos espesos bosques nublados intervenidos en algunas zonas para
la siembra de café y cítricos (mandarina). El potencial de erosión es muy alto debido a las
pendientes y a la longitud continua de las laderas; no obstante, actualmente no se evidencia
la erosión debido a la protección que le brinda la cobertura vegetal, es decir, es una zona
que está en un estado de equilibrio precario. Superficie 1.578 ha.
La clase 7 son también laderas de montañas altas (1011 msnm), ubicadas en el extremo
59
suroccidental de la cuenca, en el sector denominado “Las Marías”, principalmente están
orientadas hacia el Noreste y poseen unas moderadas a altas pendientes (30 %). Su forma
topográfica es cóncava, favoreciendo en algo la acumulación de agua. Estas laderas están
cubiertas por un extenso bosque semideciduo seco premontano y nublado (húmedo
montano bajo). Su potencial de erosión es muy alto; sin embargo, se mantiene en estable en
un equilibrio precario debido a la vegetación que lo protege del impacto de la gota de
lluvia. Superficie 1.661 ha.
La clase 9 son crestas altas con alturas entre 1300 y 1740 msnm, se ubican en dos puntos
opuestos de la cuenca uno en el vértice Suroeste (Cerro “El Marquero”) y el otro en el
vértice Sureste (“Cerro de Paja”), se corresponden con los puntos más altos y se orientan, el
primero hacia el Noreste y el segundo hacia el Noroeste. Las pendientes rondan los 38 % y
la forma topográfica es convexa. La vegetación presente es baja tanto por la intervención
humana, como por el cambio de las condiciones climáticas de la misma (temperatura,
humedad entre otros). En esta zona de altura el bosque nublado da paso a una vegetación
herbácea, de allí el nombre de "Cerro de Paja". El potencial de erosión es alto por sus
pendientes y su convexidad, aunque la vegetación tiende a protegerla. Superficie 267 ha.
El embalse del Rio Canoabo posee una superficie de 233 ha.
7.1.3.5. Clases tentativas de suelos
Finalmente se identificaron las anteriores “Clases fisiográficas” obtenidas por el método
neuro-borroso, con los tipos de suelos encontrados en un estudio agrologico previo
realizado por Sevilla y Comerma (2009b). Esto se efectuó superponiendo las clases
fisiográficas con el mapa de suelos y observando que suelos coincidían con las clases. Los
resultados fueron las siguientes clases tentativas de suelos:
Clases 2, 5 y 10: Laderas – bosque semideciduo – asociación Typic Haplustalfs y Ultic
Haplustalfs, 3.920 ha. Correspondería a la clase convencional 4. Ver figura 7.
Clases 6 y 11: Laderas – bosque deciduo – consociación de Typic Haplustalfs, 3.295 ha.
Correspondería a la clase convencional 2. Ver figura 7.
Clases 3 y 7: Laderas – bosque nublado – consociación Humic Hapludults, 3.239 ha.
Correspondería a la clase convencional 3. Ver figura 7.
Clase 1: Piedemonte – bosque deciduo – asociación Typic Haplustalfs y Typic
Haplustepts, 1614 ha. Correspondería a la clase convencional 5. Ver figura 7.
Clase 4: Laderas – bosque deciduo – complejo de Typic Haplustalfs, Inceptic
Haplustalfs y Lithic Ustorthen, 1546 ha. Correspondería a la clase convencional 1. Ver
60
figura 7.
Clase 8: Valle – bosque deciduo – complejo de Fluventic Haplustepts, Aquic
Haplustepts y Vertic Epiaquepts, 395 ha. Correspondería a la clase convencional 6. Ver
figura 7.
Clase 9: no identificada 267 ha;
Embalse: 233 ha.
7.1.4. Relevancia de las covariables ambientales en la clasificacion neuro-borrosa
Finalmente se puede establecer cuales variables empleadas en la agrupación tuvieron mayor
influencia en la separación de las 11 clases. Para eso se determinó el peso de las distancias
entre capas, lo cual se puede observar en el cuadro 9 y la figura 17. En ellos se muestra el
promedio, la desviación estándar y el coeficiente de variación entre las distancias de cada
clase.
Cuadro 9. Pesos de las distancias entre clases.
Clases
Alt
ura
(al
tu)
Altura
relativa
sobre el
canal de
drenaje
(alre) Pen
die
nte
(
pen
d)
ND
VI Factor de
erosión del
relieve (fals)
Ori
enta
ción (
aspe)
Plano de
curvatura
(curp)
Perfil de
curvatura
(curpe)
Índice de
humedad
(inwe)
Área de
captación
(arca)
A (1) -0.73 -0.91 -0.71 0.52 -0.98 0.42 0.34 0.10 -0.51 -1.00
B (2) -0.12 -0.01 -0.30 0.58 -0.97 0.51 0.36 0.12 -0.72 -1.00
C (3) 0.22 -0.74 -0.44 0.54 -0.96 0.65 0.34 0.10 -0.59 -1.00
D (4) -0.61 -0.87 -0.51 0.08 -0.98 -0.39 0.35 0.10 -0.62 -1.00
E (5) -0.44 -0.44 -0.11 0.67 -0.96 -0.62 0.35 0.11 -0.72 -1.00
F (6) -0.49 -0.69 -0.19 0.57 -0.96 0.20 0.35 0.11 -0.70 -1.00
G (7) 0.10 -0.76 -0.43 0.62 -0.96 -0.68 0.34 0.10 -0.60 -1.00
H (8) -0.79 -1.00 -0.95 0.04 -0.98 0.68 0.34 0.10 0.19 -0.93
I (9) 0.49 -0.20 -0.30 0.30 -0.97 -0.34 0.35 0.11 -0.71 -1.00
J (10) -0.51 -0.80 -0.32 0.56 -0.96 0.77 0.35 0.10 -0.65 -1.00
K (11) -0.69 -0.90 -0.59 0.61 -0.97 -0.67 0.34 0.09 -0.50 -0.99
Media -0.326 -0.665 -0.441 0.464 -0.968 0.048 0.347 0.104 -0.558 -0.993
Desviación 0.410 0.301 0.230 0.209 0.008 0.563 0.007 0.007 0.247 0.019
CV 125.7 45.2 52.2 45.1 0.9 1182.2 1.9 7.0 44.3 1.9
61
Figura 17. Gráfico de la variación del peso de las distancias entre clases.
Como se puede ver las variables morfométricas factor de erosión del relieve (fals), el plano y
perfil de curvatura (curp y curpe) y el área de captación (arca) arrojaron los menores
coeficiente de variación, es decir, que son muy parecidos en las 11 clases, por tanto no aportan
ninguna diferencia para separar las mismas. Por tanto, podrían prescindirse de ellas; sin
embargo, es útil emplearlas en su mayoría para que se pueda hacer una descripción completa
de las características naturales de cada clase.
Por el contrario las covariables que ayudan más a establecer las clases fisiográficas son en
orden de importancia: la orientación de las laderas (Aspe), la altura sobre el nivel medio del
mar (Alre), la pendiente (pend), y los índices de humedad (inwe) y de vegetación (ndvi).
Se nota que la forma y cantidad de radiación solar que reciben los suelos, el piso altitudinal
donde se ubican, la diferencia en sus pendientes y su cobertura vegetal, son las variables más
importantes a la hora de diferenciar clases fisiográficas.
7.2. RESULTADOS DEL METODO REGRESION–KRIGING.
A continuación se describen los resultados obtenidos al aplicar la metodología regresión-
kriging sobre un conjunto de variables morfometricas, el índice de vegetación normalizado y
los puntos de observación de los suelos en la cuenca del Rio Canoabo. Es así como se logró
cartografiar siete propiedades (arena, limo, arcilla0-20, arcilla20-50, pH0-20, pH50-200 y
materia orgánica).
-1.00
-0.80
-0.60
-0.40
-0.20
0.00
0.20
0.40
0.60
0.80
1.00
A B C D E F G H I J K
Pes
os
de
la C
apa
de
dis
tan
cia
Clases fisiograficas
altu
alre
pend
ndvi
fals
aspe
curp
curpe
inwe
arca
62
7.2.1. Arena (0 – 20 cm)
Mediante la función Spline se obtuvieron los valores de arena para los 40 puntos de
observación a una profundidad de 0 a 20 cm, encontrándose valores entre 20 % y 78 %. En el
cuadro 10 se muestran los datos de arena y en la figura 18 se presenta el histograma de
frecuencia. Para la calibración del análisis de regresión lineal múltiple (RLM) solo se
emplearon 32 de los 40 puntos originales y los otros 8 se dejaron para validar el modelo. Los
valores de arena del grupo de calibración también se incluyen en el cuadro 10.
Cuadro 10. Valores originales de Arena (%).
Datos Min Q1 Mediana Media Q3 Max
Originales 20,24 50 58,17 57,01 64,30 78
Calibración 34,35 50 60,82 57,93 65,32 72,12
Figura 18. Histograma de arena (%).
Del histograma de datos originales (Figura 18) se aprecia que los valores de arena tienden a la
normalidad, lo que se evidencia en la similitud de los valores de la mediana con respecto a la
media, los valores entre 60 y 70 % de arena ocurren con mayor frecuencia.
Los resultados de la RLM (Figura 19) arrojo que las covariables significativas fueron el
modelo digital de elevación, las imágenes satelitales (bandas 4 y 7), el índice de vegetación
normalizado y el área de captación, todas de alta significancia, excepto la última. El
coeficiente de determinación ajustado (R2) fue de 0,6719. En la figura 19 se pueden ver los
coeficientes de cada covariable, y en la figura 20 se muestra un graficó con la relación de los
valores de arenas medidos y los estimados por esta regresión.
Figuras 19 y 20. RLM, coeficientes de regresión y valores medidos y estimados (arena).
63
En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de
observación y compararlos con los datos medidos, se encontró que el máximo error era de -
10,88 % de arena, un mínimo muy cercano a cero (1,87x10-16
%) y, la mediana era de 1,31 %
(figura 21). También se comprobó la normalidad del comportamiento de dichos residuos
mediante la prueba de Shapiro-Wilk (0,21) que al ser mayor de 0.05 indica normalidad, y
también la homoscedasticidad (varianza constante) de los errores en relación con las variables
independientes y dependiente, mediante la prueba Breusch-Pagan (0,38), que al ser mayor de
0.05 indica que hay heteroscedasticidad.
Figura 21. Características de los residuos o errores del modelo de regresión (arena).
A partir de los residuos o errores se construyó un gráfico de semivarianza (Figura 22); de allí
se puede extraer que la varianza es de 21,92, el nugget es 4,42, el sill parcial es 18,50 y la
dependencia espacial es de 1710 m. Al realizar una validación cruzada entre los valores
medidos y los estimados por el kriging, el error medio cuadrático (EMC) fue de 4,65 %. Se le
ajustó a un modelo matemático esférico para la interpolación con kriging ordinario, y el mapa
de residuos obtenido se muestra en la figura 23.
Figura 22. Semivariograma de los residuos de arena.
64
Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables
significativas fue calculado el mapa de arena para toda la cuenca en SAGAGIS, el cual se
muestra en la figura 24. Finalmente en SAGAGIS se sumaron los mapas productos de la
ecuación de regresión y el de kriging de los residuos, y así se obtuvo el mapa definitivo del
atributo arena, visto en la figura 25.
Figuras 23 y 24. Mapa de arena kriging residuos y Mapa arena por regresión
Figura 25. Mapa de arena por regresión–kriging.
La figura 25 muestra un mapa de distribución de los porcentajes de arena bastante natural,
dispuesta en la cuenca en forma de una herradura que tiene su apertura hacia el norte. Este
65
mapa expresa que la arena disminuye con la altura y se incrementa cuando la cobertura vegetal
es menor, especialmente en suelos que han sido erosionados. También se nota que en las zonas
deprimidas con altas posibilidad de captar humedad es más alto el porcentaje de arena.
Análisis de Incertidumbre de la estimación del contenido de arena: En el cuadro 11, se
muestran los estadísticos de validación del modelo regresión-kriging aplicado al contenido de
arena.
Cuadro 11. Estadísticos de validación del modelo de regresion-kriging (arena).
De ellos se desprende que el modelo de regresión es positivo, ya que posee altos R2 y R
2aju
(0.74 y 0,67, respectivamente). Aplicando la ecuación de regresión a los datos dejados para la
validación se obtuvo un ERS bajo de 5,26 % y también se encontró que el 62 % de los puntos
tenían un error menor a 7 % de arena. En cuanto al kriging de los residuos el EMC fue bajo
(4,65 %), y con respecto a las diferencias (errores) mínimos y máximos de los puntos de
validación, se encontró un mínimo de 0,43 % y el máximo de 31 %, ambos en el proceso de
kriging. La suma de los valores absolutos de los errores refleja que en el caso de la arena el
kriging de los residuos no mejora la predicción. En cuanto a la sensibilidad de las covariables
ambientales y su contribución al R2, se tiene que de mayor a menor importancia se ordena: el
Índice de vegetación Normalizado (0,29), Modelo digital de elevación (0,21), Imagen Landsat
(Banda 4) (0,16), Área de captación (0,04) e Imagen Landsat (Banda 7) (0,02).
Parámetros estadísticos RLM Calibración RLM Validación Kriging residuos
Error Residual estándar (ERS) 5,26 % 5,26 % -
Coeficiente de determinación (R2) 0,74 - -
R2 ajustados (R2aju) 0,67 - -
Error mínimo 1,87x10-16
% 0,58 % 0,43 %
Error máximo -10,88 % 24,02 % 31,35 %
Frecuencia de errores - 62 % < 7 %
Error medio cuadrático (EMC) - - 4,65 %
Suma de los valores absolutos de los errores - 61,86 % 77,45 %
66
7.2.2. Limo (0 – 20 cm)
Mediante la función Spline se obtuvieron los valores de limo para los 40 puntos de
observación a una profundidad de 0 a 20 cm, encontrándose valores entre 14 % y 61 %. El
cuadro 12 muestra los datos sobre el limo y en la figura 26, se presenta el histograma de su
frecuencia. Para la calibración del análisis de regresión lineal múltiple (RLM) solo se
emplearon 32 de los 40 puntos originales y los otros 8 se dejaron para validar el modelo. Los
valores de limo del grupo de calibración también se incluyen en el cuadro 12.
Cuadro 12. Valores originales de limo (%).
Datos Min Q1 Mediana Media Q3 Max
Originales 14 17,9 21,82 24,23 27,68 61,09
Calibración 14 19 21,93 23,18 27,12 38,33
Figura 26. Histograma de limo (%).
El histograma de datos originales (Figura 26) muestra que los valores de limo tienden a la
normalidad, lo que se evidencia en la similitud de los valores de la mediana y media, los
valores entre 20 y 25 % de limo ocurren con mayor frecuencia. Sin embargo, los valores
extremos superiores a 50 % fueron corregidos y por eso en los valores de calibración el
máximo es 38,33 %.
La figura 27 muestra los resultados de la RLM, los cuales arrojaron que las covariables
significativas fueron el factor R, orientación de la pendiente, modelo digital de elevación y el
Channel_Network, todas ellas de alta significancia. La figura 27 también muestra que el
coeficiente de determinación ajustado (R2) fue de 0,718, y la figura 28 muestra un graficó con
la relación de los valores de limo medidos y los estimados por esta regresión.
Figuras 27 y 28. RLM, coeficientes de regresión y valores medidos y estimados (limo).
67
En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de
observación y compararlos con los datos medidos, se encontró que el máximo error era de -
7,75 % de limo, un mínimo muy cercano a cero (5,76x10-17
%) y, la mediana era de 0,27 %
(figura 29). También se comprobó la normalidad del comportamiento de dichos residuos
mediante la prueba de Shapiro-Wilk (0,64) que al ser mayor de 0.05 indica normalidad, y
también la Homoscedasticidad (varianza constante) de los errores en relación con las variables
independientes y dependiente, mediante la prueba Breusch-Pagan (0,62), que al ser mayor de
0.05 indica que hay heteroscedasticidad.
Figura 29. Características de los residuos o errores del modelo de regresión (limo).
A partir de los residuos o errores se construyó un gráfico de semivarianza (figura 30), de allí
se puede extraer que la varianza es de 8,95, el nugget es 0, el sill parcial es 8,95 y la
dependencia espacial es de 982 m. Al realizar una validación cruzada entre los valores
medidos y los estimados por el kriging, el error medio cuadrático (EMC) fue de 2,60 %. Se le
ajusto un modelo matemático gaussiano para la interpolación con kriging ordinario, y el mapa
de residuos obtenido se muestra en la figura 31.
Figura 30. Semivariograma de los residuos de limo.
68
Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables
significativas fue calculado el mapa de limo para toda la cuenca en SAGAGIS, el cual se
muestra en la figura 32. Finalmente en SAGAGIS se sumaron los mapas productos de la
ecuación de regresión y el de kriging de los residuos, y así se obtuvo el mapa definitivo del
atributo, visto en la figura 33.
Figuras 31 y 32. Mapa de limo kriging residuos y Mapa limo por regresión
Figura 33. Mapa de limo por regresion–kriging.
La figura 33 muestra un mapa de limo de regular naturalidad, encontrándose valores mayores
en las laderas altas del Sur de la cuenca y especialmente en las laderas occidentales. Esto
podría deberse en principio a un material geológico ligeramente diferente (Grupo San Julián).
69
Los valores menores se encuentran más hacia el norte especialmente hacia la fila de “La
Media Luna” donde predominan un material geológico de la formación Peña de Mora.
Continúa la tendencia como en la arena, de que a mayor altura menor % limo.
Análisis de Incertidumbre de la estimación del contenido de limo: En el cuadro 13, se
muestran los estadísticos de validación del modelo regresión-kriging aplicado al limo.
Cuadro 13. Estadísticos de validación del modelo de regresion-kriging (limo).
El modelo de regresión es positivo, ya que posee altos R2 y R
2aju (0.76 y 0,71)
respectivamente. Aplicando la ecuación de regresión a los datos dejados para la validación se
obtuvo un ERS bajo de 3,26 % y también se encontró que el 38 % de los puntos tenían un
error menor a 4 % de limo. En cuanto al kriging de los residuos el EMC fue bajo de 2,60 %, y
con respecto a las diferencias (errores) mínimos y máximos de los puntos de validación, se
encontró un mínimo de 3,12 % y el máximo de 13,69 %, ambos en el proceso de kriging. La
suma de los valores absolutos de los errores refleja que en el caso del limo el kriging de los
residuos mejora la predicción. En cuanto a la sensibilidad de las covariables ambientales y su
contribución a la formación del R2, se tiene que de mayor a menor importancia se ordena asi:
la Orientación de la pendiente (0,21), Factor R (0,20), Modelo digital de elevación (0,17), y
Channel_Network (0,16).
Parámetros estadísticos RLM Calibración RLM Validación Kriging residuos
Error Residual estándar (ERS) 3,26 % 3,26 % -
Coeficiente de determinación (R2) 0,76 - -
Coeficiente de determinación ajustados (R2aju) 0,71 - -
Error mínimo 5,76x10-17 % 3,85 % 3,12 %
Error máximo -7,75 % 13,44 % 13,69 %
Frecuencia de errores - 38 % < 4 %
Error medio cuadrático (EMC) - - 2,60 %
Suma de los valores absolutos de los errores - 66,62 % 61,51 %
70
7.2.3. Arcilla (0 – 20 cm)
Mediante la función Spline se obtuvieron los valores de arcilla para los 40 puntos de
observación a una profundidad de 0 a 20 cm, encontrándose valores entre 8 % y 28 %. El
cuadro 14 muestra datos sobre la arcilla y en la figura 34, se ve el histograma de su frecuencia.
Para la calibración del análisis de regresión lineal múltiple (RLM) solo se emplearon 32 de los
40 puntos originales y los otros 8 se dejaron para validar el modelo. Los valores de arcilla del
grupo de calibración también se incluyen en el cuadro 14.
Cuadro 14. Valores originales de arcilla (%).
Datos Min Q1 Mediana Media Q3 Max
Originales 8 14,7 19,74 18,77 22,06 28,87
Calibración 8 14,68 19,83 18,86 22,23 28,87
Figura 34. Histograma de arcilla (%).
Los valores de arcilla tienden a comportarse de manera normal lo que se evidencia en la
similitud de los valores de la mediana con respecto a la media, los valores entre 20 y 25 % de
arcilla ocurren con mayor frecuencia entre los puntos de observación (figura 34).
Los resultados de la RLM arrojaron que las covariables significativas (figura 35) fueron el
riesgo de erosión potencial, las imágenes satelitales (bandas 1 y 5), la temperatura media
anual, el sombreado, orientación de la pendiente, Índice de humedad y altitude_.above. Siendo
las imágenes las de mayor significancia, su coeficiente de determinación ajustado (R2) fue de
0,6185. La figura 36 muestra un graficó con la relación de los valores de arcillas medidos y los
estimados por esta regresión.
Figuras 35 y 36. RLM, coeficientes regresión y valor medido y estimado (arcilla 0-20 cm).
71
En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de
observación y compararlos con los datos medidos, se encontró que el máximo error era de
6,37 % de arcilla, un mínimo muy cercano a cero (1,13x10-16
%) y, la mediana era de -0,43 %
(figura 37). También se comprobó la normalidad del comportamiento de dichos residuos
mediante la prueba de Shapiro-Wilk (0,41) que al ser mayor de 0.05 indica normalidad, y
también la Homoscedasticidad (varianza constante) de los errores en relación con las variables
independientes y dependiente, mediante la prueba Breusch-Pagan (0,43), que al ser mayor de
0.05 indica que hay heteroscedasticidad.
Figura 37. Características de los residuos o errores del modelo de regresión (arcilla 0-20 cm).
A partir de los residuos o errores se construyó un gráfico de semivarianza (figura 38), de allí
se puede extraer que la varianza es de 21,92, el nugget es 4,42, el sill parcial es 18,50 y la
dependencia espacial es de 1710 m. Al realizar una validación cruzada entre los valores
medidos y los estimados por el kriging el error medio cuadrático (EMC) fue de 2,77 %. Se le
ajusto un modelo matemático esférico para la interpolación con kriging ordinario, y el mapa
de residuos obtenido se muestra en la figura 39.
Figura 38. Semivariograma de los residuos de la arcilla 0-20 cm.
72
Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables
significativas fue calculado el mapa de arcilla para toda la cuenca en SAGAGIS, el cual
muestra en la figura 40. Finalmente en SAGAGIS se sumaron los mapas productos de la
ecuación de regresión y el de kriging de los residuos, y así se obtuvo el mapa definitivo del
atributo, visto en la figura 41.
Figuras 39 y 40. Mapa de arcilla (0-20 cm) kriging residuos y Mapa arcilla por regresión
Figura 41. Mapa de arcilla (0-20 cm) por regresión–kriging.
La figura 41 muestra un mapa de arcillas (0-20cm) con un patrón de distribución poco claro.
Aunque la covariable geología no se consideró relevante, se aprecia que en las zonas donde la
73
formación geológica es Peña de Mora, los valores de arcillas son menores (al Norte “Fila la
Media Luna”) igual que en el limo; por el contrario los valores de arcillas se incrementan con
la altura hacia las laderas del Sur donde la formación geológica es San Julián. Los suelos con
mayor riesgo de erosión potencial, mayor índice de humedad (depresiones) y mayor altura
presentaron mayores valores de arcilla.
Análisis de Incertidumbre de la estimación del contenido de arcilla: En el cuadro 15, se
muestran los estadísticos de validación del modelo regresión-kriging aplicado a la arcilla.
Cuadro 15. Estadísticos de validación del modelo de regresion-kriging (arcilla 0-20 cm).
En este caso el modelo de regresión es positivo, ya que posee altos R2 y R
2aju (0.73 y 0,61)
respectivamente. Aplicando la ecuación de regresión a los datos dejados para la validación se
obtuvo un ERS bajo de 3,45 % y también se encontró que el 50 % de los puntos tenían un
error menor a 6 % de arcilla. En cuanto al kriging de los residuos el EMC fue bajo de 2,77 %,
y con respecto a las diferencias (errores) mínimos y máximos de los puntos de validación, se
encontró un mínimo de 0,33 % y el máximo de 10,14 %, ambos en el proceso de kriging. La
suma de los valores absolutos de los errores refleja que en el caso de la arcilla el kriging de los
residuos mejora la predicción. En cuanto a la sensibilidad de las covariables ambientales y su
contribución al R2, se tiene que de mayor a menor importancia se ordena así: la temperatura
media anual (0,26), la imagen satelitales (bandas 5) (0,16), riesgo de erosión potencial (0,06),
índice de humedad (0,06), el sombreado (0,05), altitude_.above (0,04), la imagen satelitales
(bandas 1) (0,04), y la orientación de la pendiente (0,03).
Parámetros estadísticos RLM
Calibración
RLM
Validación
Kriging
residuos
Error Residual estándar (ERS) 3,45 % 3,45 % -
Coeficiente de determinación (R2) 0,73 - -
Coeficiente de determinación ajustados
(R2aju)
0,61 - -
Error mínimo 1,13x10-16
% 3,12 % 0,33 %
Error máximo 6,37 % 12,34 % 10,14 %
Frecuencia de errores - 50 % < 6 %
Error medio cuadrático (EMC) - - 2,77 %
Suma de los valores absolutos de los errores - 52,76 % 43,41 %
74
7.2.4. Arcilla (20 – 50 cm)
Esta propiedad fue evaluada en dos profundidades, una de 0 – 20 cm (resultado anterior) y otra
de 20 – 50 cm, con el objetivo de conseguir algún incremento en el porcentaje de arcillas al
aumentar la profundidad, lo que reflejaría la presencia de un endopedon argilico.
Característico de suelos del orden alfisoles y ultisoles.
Mediante la función Spline se obtuvieron los valores de arcilla para 40 puntos de observación
a una profundidad de 20 a 50 cm, encontrándose valores entre 8 % y 39 %. En el cuadro 16 se
muestran los datos de arcilla y en la figura 42, se presenta el histograma de frecuencia. Para la
calibración de la RLM solo se emplearon 32 de los 40 puntos y los otros 8 se dejaron para
validar el modelo. Los valores de arcilla de calibración se incluyen en el cuadro 16.
Cuadro 16. Valor original arcilla 20-50 cm (%).
Datos Min Q1 Mediana Media Q3 Max
Originales 8 20,99 25,77 25,09 29,76 39,36
Calibración 8 18,94 25,77 24,23 28,38 39,36
Figura 42. Histograma arcilla 20-50 cm (%).
Los valores de arcilla tienden a la normalidad y los valores entre 25 y 30 % de arcilla ocurren
con mayor frecuencia (figura 42). Los resultados de la RLM (figura 43) arrojaron que las
covariables significativas fueron la precipitación median anual, las imágenes satelitales
(bandas 2,4 y 7) y los meses húmedos. El coeficiente de determinación ajustado (R2) fue de
0,7173 y finalmente la figura 44 muestra un graficó con la relación de los valores de arcillas
medidos y los estimados por esta regresión.
Figuras 43 y 44. RLM, coeficientes de regresión y valores de arcilla medidos y estimados
(arcilla 20-50 cm).
75
En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de
observación y compararlos con los datos medidos, se encontró que el máximo error era de
9,35 % de arcilla, un mínimo muy cercano a cero (2,46x10-17
%) y, la mediana era de -0,43 %
(figura 45). También se comprobó la normalidad del comportamiento de dichos residuos
mediante la prueba de Shapiro-Wilk (0,64) que al ser mayor de 0.05 indica normalidad, y
también la Homoscedasticidad (varianza constante) de los errores en relación con las variables
independientes y dependiente, mediante la prueba Breusch-Pagan (0,75), que al ser mayor de
0.05 indica que hay heteroscedasticidad.
Figura 45. Características de los residuos o errores del modelo regresión (arcilla 20-50 cm).
A partir de los residuos o errores se construyó un gráfico de semivarianza (figura 46), de allí
se puede extraer que la varianza es de 13,41, el nugget es 2,62, el sill parcial es 9,89 y la
dependencia espacial es de 851 m. Al realizar una validación cruzada entre los valores
medidos y los estimados por el kriging el error medio cuadrático (EMC) fue de 3,9 %. Se le
ajustó un modelo matemático gaussiano para la interpolación con kriging ordinario, y el mapa
de residuos obtenido se muestra en la figura 47.
Figura 46. Semivariograma de los residuos de arcilla (20-50 cm).
76
Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables
significativas fue calculado el mapa de arcilla para toda la cuenca en SAGAGIS (figura 48), y
finalmente en SAGAGIS se sumaron los mapas productos de la ecuación de regresión y el de
kriging de los residuos, y así se obtuvo el mapa definitivo del atributo (figura 49).
Figuras 47 y 48. Mapa de arcilla (20-50 cm) kriging residuos y Mapa arcilla por regresión.
Figura 49. Mapa de arcilla (20-50 cm) por regresion–kriging.
La figura 49 muestra el mapa de arcilla a una profundidad entre 20 y 50 cm. En él se observa
que esta propiedad se distribuye de acuerdo a la precipitación y humedad. Los valores
mayores se encuentran tanto en la parte Norte a salidas de la cuenca donde desemboca el rio
Canoabo al Temerla, como al extremo Sureste en las laderas altas del sector Palmichal, ambas
77
zonas tienen la mayor cantidad de precipitación al año. Por el contrario los valores menores de
arcilla en el subsuelo se encuentran en el área central donde llueve menos y en las laderas
occidentales que se orientan hacia el Este, donde se aprecia mayor radiación diario y una
vegetación de menor porte. De manera general para los rangos de lluvia de la zona, a mayor
precipitación mayor iluviacion por ende mayor cantidad de arcilla en el subsuelo, por esta
razón los suelos que dominan en la cuenca son los alfisoles y ultisoles.
Análisis de Incertidumbre de la estimación de la arcilla: En el cuadro 17, se muestran los
estadísticos de validación del modelo regresión-kriging aplicado al contenido de arcilla.
Cuadro 17. Estadísticos de validación del modelo de regresion-kriging (arcilla 20-50 cm).
El modelo de regresión es positivo, ya que posee altos R2 y R
2aju (0.77 y 0,71)
respectivamente. Aplicando la ecuación de regresión a los datos dejados para la validación se
obtuvo un ERS bajo de 4,07 % y también se encontró que el 55 % de los puntos tenían un
error menor a 9 % de arcilla. En cuanto al kriging de los residuos el EMC fue bajo de 3,9 %, y
con respecto a las diferencias (errores) mínimos y máximos de los puntos de validación, se
encontró un mínimo de 0,55 % y el máximo de 15,69 %, ambos en el proceso de kriging. La
suma de los valores absolutos de los errores refleja que en el caso de la arcilla 20 – 50 cm el
kriging de los residuos mejora la predicción. En cuanto a la sensibilidad de las covariables
ambientales y su contribución a la formación del R2, se tiene que de mayor a menor
importancia se ordena así: imagen satelital (Banda 2) (0,29), precipitación median anual
(0,27), imagen satelital (bandas 4) (0,12), numero de meses húmedos (0,06), imagen satelital
(Banda 7) (0,01).
Parámetros estadísticos RLM
Calibración
RLM
Validación
Kriging
residuos
Error Residual estándar (ERS) 4,07 % 4,07 % -
Coeficiente de determinación (R2) 0,77 - -
Coeficiente de determinación ajustados
(R2aju)
0,71 - -
Error mínimo 2,47x10-17
% 1,95 % 0,55 %
Error máximo 9,35 % 16,77 % 15,69 %
Frecuencia de errores - 55 % < 9 %
Error medio cuadrático (EMC) - - 3,9 %
Suma de los valores absolutos de los errores - 75,32 % 70,45 %
78
7.2.5. Materia orgánica (0 – 20 cm)
Mediante la función Spline se obtuvieron los valores de materia orgánica (MO) para los 40
puntos de observación a una profundidad de 0 a 20 cm, encontrándose valores entre 0,44 % y
6,5 %. El cuadro 18 muestra datos sobre MO y en la figura 50, se ve el histograma de su
frecuencia. Para la calibración del análisis de regresión lineal múltiple (RLM) solo se
emplearon 32 de los 40 puntos originales y los otros 8 se dejaron para validar el modelo. Los
valores de materia orgánica del grupo de calibración también se incluyen en el cuadro 18.
Cuadro 18. Valor original de materia orgánica (%).
Datos Min Q1 Mediana Media Q3 Max
Originales 0,44 2,02 2,7 2,83 3,4 6,5
Calibración 0,87 2,06 2,89 2,79 3,43 4,8
Figura 50. Histograma de materia orgánica (%).
Del histograma se aprecia que los valores de MO tienden a la normalidad, lo que se evidencio
en la similitud de los valores de la mediana con respecto a la media, los valores entre 2 y 4 %
de materia orgánica ocurren con mayor frecuencia (figura 50).
La figura 51, muestra los resultados de la RLM, arrojando que las covariables significativas
fueron el Índice de vegetación normalizado, el modelo digital de elevación, el
channel_network y número de meses húmedos. Su coeficiente de determinación ajustado (R2)
fue de 0,68 y finalmente la figura 52 muestra un graficó con la relación de los valores de
materia orgánica medidos y los estimados por esta regresión.
Figuras 51 y 52. RLM, coeficientes de regresión y valores medidos y estimados de MO
79
En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de
observación y compararlos con los datos medidos, se encontró que el máximo error era de
0,81 % de MOS, un mínimo muy cercano a cero (1,04x10-16
%) y, la mediana era de 0,05 %
(figura 53). También se comprobó la normalidad del comportamiento de dichos residuos
mediante la prueba de Shapiro-Wilk (0,27) que al ser mayor de 0.05 indica normalidad, y
también la homoscedasticidad (varianza constante) de los errores en relación con las variables
independientes y dependiente, mediante la prueba Breusch-Pagan (0,81), que al ser mayor de
0.05 indica que hay heteroscedasticidad.
Figura 53. Características de los residuos o errores del modelo regresión (materia orgánica).
A partir de los residuos o errores se construyó un gráfico de semivarianza (figura 54), de allí
se puede extraer que la varianza es de 0,19, el nugget es 0,06, el sill parcial es 0,13 y la
dependencia espacial es de 4164 m. Al realizar una validación cruzada entre los valores
medidos y los estimados por el kriging el error medio cuadrático (EMC) fue de 0,42 %. Se le
ajustó un modelo matemático esférico para la interpolación con kriging ordinario, y el mapa
de residuos obtenido se muestra en la figura 55.
Figura 54. Semivariograma de los residuos de materia orgánica.
80
Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables
significativas fue calculado el mapa de materia orgánica para toda la cuenca en SAGAGIS, el
cual muestra en la figura 56, y finalmente en SAGAGIS se sumaron los mapas productos de la
ecuación de regresión y el de kriging de los residuos, y así se obtuvo el mapa definitivo del
atributo, visto en la figura 57.
Figuras 55 y 56. Mapas de materia orgánica kriging residuos y por regresión
Figura 57. Mapa de materia orgánica por regresion–kriging.
La figura 57 muestra el mapa de materia orgánica de la cuenca, en el mismo se aprecia lo
concéntrico que se distribuye, encontrándose los valores más bajos en el centro de la cuenca,
en el valle, y va incrementado a medida que la altura sobre el nivel de mal se hace mayor. Este
81
comportamiento se debe a que a mayor altura, la temperatura decrece, la humedad aumenta, y
la vegetación se hace más densa, hasta llegar al bosque nublado en las laderas altas, y allí la
abundante vegetación favorece la producción de materia orgánica y las bajas temperaturas
reducen la tasa de descomposición de la materia orgánica, favoreciendo su acumulación.
Análisis de Incertidumbre de la estimación de la materia orgánica: En el cuadro 19, se
muestran los estadísticos de validación del modelo regresión-kriging aplicado a la materia
orgánica.
Cuadro 19 Estadísticos de validación del modelo de regresion-kriging (MO).
El modelo de regresión es positivo, ya que posee altos R2 y R
2aju (0.73 y 0,68)
respectivamente. Aplicando la ecuación de regresión a los datos dejados para la validación se
obtuvo un ERS bajo de 0,48 % y también se encontró que el 75 % de los puntos tenían un
error menor a 0,14 % de materia orgánica. En cuanto al kriging de los residuos el EMC fue
bajo de 0,42 %, y con respecto a las diferencias (errores) mínimos y máximos de los puntos de
validación, se encontró un mínimo de 0,03 % y el máximo de 1,57 %, ambos en el proceso de
kriging. La suma de los valores absolutos de los errores refleja que en el caso de la materia
orgánica el kriging de los residuos no mejora la predicción. En cuanto a la sensibilidad de las
covariables ambientales y su contribución a la formación del R2, se tiene que de mayor a
menor importancia se ordena así: Índice de vegetación normalizado (0,33), channel_network
(0,19), modelo digital de elevación (0,14), y número de meses húmedos (0,06).
Parámetros estadísticos RLM
Calibración
RLM
Validación
Kriging
residuos
Error Residual estándar (ERS) 0,48 % 0,48 % -
Coeficiente de determinación (R2) 0,73 - -
Coeficiente de determinación ajustados
(R2aju)
0,68 - -
Error mínimo 1,04x10-17
% 0,02 % 0,03 %
Error máximo 0,81 % 1,39 % 1,57 %
Frecuencia de errores - 75 % < 0,14
Error medio cuadrático (EMC) - - 0,42 %
Suma de los valores absolutos de los errores - 3,44 % 4,09 %
82
7.2.6. pH (0 – 20 cm)
Mediante la función Spline se obtuvieron los valores de pH para los 40 puntos de observación
a una profundidad de 0 a 20 cm, encontrándose valores entre 3,7 y 8,1. El cuadro 20 muestra
datos sobre pH y en la figura 58, se ve el histograma de su frecuencia. Para la calibración del
análisis de regresión lineal múltiple (RLM) solo se emplearon 32 de los 40 puntos originales y
los otros 8 se dejaron para validar el modelo. Los valores de pH del grupo de calibración
también se pueden ver en el cuadro 20.
Cuadro 20. Valores originales de pH (0 – 20 cm).
Datos Min Q1 Mediana Media Q3 Max
Originales 3,7 4,7 4,8 5,1 5,1 8,1
Calibración 3,7 4,7 4,8 4,9 5,1 6,1
Figura 58. Histograma de pH (0-20 cm).
Del histograma (figura 58) se aprecia que los valores de pH tienden a la normalidad, lo que se
evidencia en la similitud de los valores de la mediana con respecto a la media, los valores
entre 4,5 y 5,5 de pH ocurren con mayor frecuencia entre los puntos de observación.
Los resultados de la RLM (figura 59), arrojaron que las covariables significativas fueron el
riesgo de erosión potencial, formaciones geológicas, índice de humedad y número de meses
húmedos, todas de moderada significancia, su coeficiente de determinación ajustado (R2) fue
de 0,52. En la figura 60 se ve un graficó con la relación de los valores de pH medidos y los
estimados por esta regresión.
Figuras 59 y 60. RLM, coeficientes regresión y valores de medidos y estimados (pH 0-20 cm)
83
En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de
observación y compararlos con los datos medidos, se encontró que el máximo error era de
0,66 de pH, un mínimo muy cercano a cero (2,5x10-17
) y, la mediana era de 0,02 (figura 61).
También se comprobó la normalidad del comportamiento de dichos residuos mediante la
prueba de Shapiro-Wilk (0,74) que al ser mayor de 0.05 indica normalidad, y también la
Homoscedasticidad (varianza constante) de los errores en relación con las variables
independientes y dependiente, mediante la prueba Breusch-Pagan (0,62), que al ser mayor de
0.05 indica que hay heteroscedasticidad.
Figura 61. Características de los residuos o errores del modelo de regresión (pH 0-20 cm).
A partir de los residuos o errores se construyó un gráfico de semivarianza (figura 62), de allí
se puede extraer que la varianza es de 0,112 el nugget es 0,045 el sill parcial es 0,067 y la
dependencia espacial es de 1143 m. Al realizar una validación cruzada entre los valores
medidos y los estimados por el kriging el error medio cuadrático (EMC) fue de 0,3. Se le
ajusto un modelo matemático esférico para la interpolación con kriging ordinario, y el mapa
de residuos obtenido se muestra en la figura 63.
Figura 62. Semivariograma de los residuos de pH 0-20 cm.
84
Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables
significativas fue calculado el mapa de pH para toda la cuenca en SAGAGIS, el cual muestra
en la figura 64. Finalmente en SAGAGIS se sumaron los mapas productos de la ecuación de
regresión y el de kriging de los residuos, y así se obtuvo el mapa definitivo del atributo, visto
en la Figura 65.
Figuras 63 y 64. Mapa de pH (0 – 20 cm) kriging residuos y Mapa pH por regresión
Figura 65. Mapa de pH (0 – 20 cm) por regresión–kriging.
La figura 65 muestra el mapa de pH superficial, donde se puede ver que su distribución esta
influenciadas por factores como la geología, aspecto este que es el material originario de los
suelos. En este sentido la formación de Granito Guaremal ubicada en el centro de la cuenca
presento los pH más altos. Otro factor es la humedad (número de meses húmedos y el índice
85
de humedad topográficos), es decir a mayor número de meses húmedos menor pH, debido a
que los suelos están expuestos con más frecuencias a procesos de lavados de cationes por las
precipitaciones, lo que favorece la disminución del pH de los suelo. Es bueno señalar que se
encontró que suelos con pH bajos poseen mayor riesgo de erosión potencial. Tal vez, esto se
deba a que la baja fertilidad de los suelos ácidos, imposibilita sostener una densa cobertura
vegetal protectora de la superficie al impacto de la gota de lluvia.
Análisis de Incertidumbre de la estimación del pH: En el cuadro 21, se muestran los
estadísticos de validación del modelo regresión-kriging aplicado a los valores de pH.
Cuadro 21. Estadísticos de validación del modelo de regresion-kriging (pH 0-20 cm).
De ellos se desprende que el modelo de regresión es positivo, ya que posee moderados R2 y
R2aju (0.59 y 0,52) respectivamente. Aplicando la ecuación de regresión a los datos dejados
para la validación se obtuvo un ERS bajo de 0,33 y también se encontró que el 50 % de los
puntos tenían un error menor a 0,2 de pH. En cuanto al kriging de los residuos el EMC fue
bajo de 0,3, y con respecto a las diferencias (errores) mínimos y máximos de los puntos de
validación, se encontró un mínimo de 0,06 y el máximo de 0,76, ambos en el proceso de
kriging. La suma de los valores absolutos de los errores refleja que en el caso del pH el kriging
de los residuos no mejora la predicción. En cuanto a la sensibilidad de las covariables
ambientales y su contribución a la formación del R2, se tiene que de mayor a menor
importancia se ordena así: formaciones geológicas (0,28), riesgo de erosión potencial (0,14),
numero de meses húmedos (0,11) y, índice de humedad (0,04).
Parámetros estadísticos RLM
Calibración
RLM
Validación
Kriging
residuos
Error Residual estándar (ERS) 0,33 0,33 -
Coeficiente de determinación (R2) 0,59 - -
Coeficiente de determinación ajustados
(R2aju)
0,52 - -
Error mínimo 2,53x10-17
0,006 0,06
Error máximo 0,66 0,87 0,76
Frecuencia de errores - 50 % < 0,2
Error medio cuadrático (EMC) - - 0,3
Suma de los valores absolutos de los errores - 2,35 2,37
86
7.2.7. pH (50 – 200 cm)
Esta propiedad se evaluó en dos profundidades una de 0 - 20 cm (resultado anterior) y otra de
50 – 200 cm, para identificar suelos con pH bajos a grandes profundidades, que podrían
identificar suelos del orden ultisol, los cuales poseen baja saturación con base a 180 cm.
Mediante la función Spline se obtuvieron los valores de pH para los 40 puntos a una
profundidad de 50 a 200 cm, encontrándose valores entre 4,21 y 5,2. El cuadro 22 muestra
datos sobre el pH y en la figura 66, se puede ver el histograma. Para la calibración del análisis
de regresión lineal múltiple (RLM) se emplearon 32 de los 40 puntos y los otros 8 se dejaron
para validar el modelo. Los valores de pH de calibración se incluyen en el cuadro 22.
Cuadro 22. Valor original de pH (50 – 200 cm).
Datos Min Q1 Mediana Media Q3 Max
Originales 4,21 4,6 5,1 5,3 5,2 9
Calibración 4,2 4,6 5,2 5,3 5,4 8,1
Figura 66. Histograma de pH (50-200 cm).
Se aprecia que los pH tienden a no comportarse de manera normal. Los valores entre 4 y 6 de
pH ocurren con mayor frecuencia (figura 66). Los resultados de la RLM (figura 67) arrojaron
que las covariables significativas fueron el riesgo de erosión potencial, modelo digital de
elevación, índice de convergencia e imagen Landsat (Banda 6a), su coeficiente de
determinación ajustado (R2) fue de 0,91. En la figura 68 se observa un graficó con la relación
de los valores de pH medidos y los estimados por esta regresión.
Figuras 67 y 68. RLM, coeficientes regresión y valores medidos y estimados (pH 50-200 cm).
87
En cuanto a los residuos o errores de estimación de la ecuación al aplicarla en los sitios de
observación y compararlos con los datos medidos, se encontró que el máximo error era de
0,58 de pH, un mínimo muy cercano a cero (2,53x10-18
) y, la mediana era de 0,037 (figura 69).
También se comprobó la normalidad del comportamiento de dichos residuos mediante la
prueba de Shapiro-Wilk (0,99) que al ser mayor de 0.05 indica normalidad, y también la
Homoscedasticidad (varianza constante) de los errores en relación con las variables
independientes y dependiente, mediante la prueba Breusch-Pagan (0,77), que al ser mayor de
0.05 indica que hay heteroscedasticidad.
Figura 69. Características de los residuos o errores del modelo de regresión (pH 50-200 cm).
A partir de los residuos o errores se construyó un gráfico de semivarianza (figura 70), de allí
se puede extraer que la varianza es de 0,11 el nugget es 0,068 el sill parcial es 0,037 y la
dependencia espacial es de 982 m. Al realizar una validación cruzada entre los valores
medidos y los estimados por el kriging el error medio cuadrático (EMC) fue de 0,28. Se le
ajusto un modelo matemático gaussiano para la interpolación con kriging ordinario, y el mapa
de residuos obtenido se muestra en la figura 71.
Figura 70. Semivariograma de los residuos de pH 50-200 cm.
88
Con la ecuación de regresión resultante del proceso de RLM y las capas de covariables
significativas fue calculado el mapa de pH para toda la cuenca en SAGAGIS, el cual muestra
en la figura 72. Finalmente en SAGAGIS se sumaron los mapas productos de la ecuación de
regresión y el de kriging de los residuos, y así se obtuvo el mapa definitivo del atributo, visto
en la figura 73.
Figuras 71 y 72. Mapa de pH (50 - 200 cm) kriging residuos y Mapa pH por regresión.
Figura 73. Mapa de pH (50 – 200 cm) por regresión–kriging.
La figura 73, muestra el mapa de pH de los suelos a la profundidad de 50 a 200 cm. En él se
observa una distribución poco clara, sin embargo se puede ver que los valores más bajos de
pH, son frecuentes en suelos con mayor humedad al año y donde las precipitaciones han
89
tenido el tiempo necesario para provocar el lavado intenso de cationes hasta en profundidad.
Los valores más altos de pH se encuentran en el Valle central en zonas bajas. Finalmente se
observó que suelos con pH bajos y poca cobertura vegetal presentan mayor riesgo de erosión,
probablemente porque su cobertura vegetal es menor y proveen poca protección contra el
impacto de la gota de lluvia.
Análisis de Incertidumbre de la estimación del pH: En el cuadro 23, se muestran los
estadísticos de validación del modelo regresión-kriging aplicado del pH.
Cuadro 23. Estadísticos de validación del modelo de regresion-kriging (pH 50-200 cm).
El modelo de regresión es positivo, ya que posee altos R2 y R
2aju (0.93 y 0,91)
respectivamente. Aplicando la ecuación de regresión a los datos dejados para la validación se
obtuvo un ERS bajo de 0,3 y también se encontró que el 60 % de los puntos tenían un error
menor a 0,5 de pH. En cuanto al kriging de los residuos el EMC fue bajo de 0,28, y con
respecto a las diferencias (errores) mínimos y máximos de los puntos de validación, se
encontró un mínimo de 0,02 y el máximo de 1,39 ambos en el proceso de kriging. La suma de
los valores absolutos de los errores refleja que en el caso del pH el kriging de los residuos
mejora la predicción. En cuanto a la sensibilidad de las covariables ambientales y su
contribución a la formación del R2, se tiene que de mayor a menor importancia se ordena así:
el riesgo de erosión potencial (0,58), modelo digital de elevación (0,23), imagen Landsat
(Banda 6a) (0,06), índice de convergencia (0,05).
Parámetros estadísticos RLM
Calibración
RLM
Validación
Kriging
residuos
Error Residual estándar (ERS) 0,3 0,3 -
Coeficiente de determinación (R2) 0,93 - -
Coeficiente de determinación ajustados
(R2aju)
0,91 - -
Error mínimo 2,08x10-18
0,05 0,02
Error máximo 0,58 1,48 1,39
Frecuencia de errores - 60 % < 0,5
Error medio cuadrático (EMC) - - 0,28
Suma de los valores absolutos de los errores - 2,75 2,65
90
7.3. COMPARACIÓN DE LOS METODOS CARTOGRAFICOS CONTRA UN
MAPA DE SUELOS REALIZADO DE MANERA CONVENCIONAL.
A continuación se describen los resultados de las comparaciones entre los métodos de
cartografía digital empleados en este estudio.
7.3.1. Concordancia entre el método neuro-borroso y el levantamiento Convencional
El método neuro-borroso agrupo los suelos de la cuenca en once (11) clases, más una clase
adicional correspondiente al embalse del Rio Canoabo. Pero al no coincidir la cantidad, ni la
denominación de las clases con las del mapa convencional, se procedió a reclasificarlo, es
decir llevar estas once (11) clases a seis (6) y se denominó cada clase igual que en el mapa de
suelo convencional. (Ver cuadro 24, figura 16 y figura 7).
Cuadro 24. Clases fisiográficas del mapa producido por el método neuro-borroso.
Método neuro-borroso
Clase fisiográficas salidas del
método neuro-borroso
Reclasificada según mapa de
método convencional
1 5
2 4
3 3
4 1
5 4
6 2
7 3
8 6
9 3
10 4
11 2
15 7
La figura 74 muestra la distribución espacial de la clase de ambos métodos (convencional y
neuro-borroso). En ellas se aprecia mucha concordancia en cuanto a las clases y su alcance,
especialmente en las clases 3 y 4. Llama la atención la precisión del modelo neuro-borroso
para colocar el límite entre las clases 3 y 4, el cual coincide casi con exactitud con el mostrado
en el mapa convencional, esta línea se relacionó con variables de altura y clima, las cuales
reflejan un cambio evidente en la vegetación y por ende en los suelos. Así también se observó
91
como el NDVI ejerce un gran peso en la identificación de la clase 1, la cual se caracteriza por
un mayor grado de erosión de los suelos. (Ver figura 74).
Figura 74. Mapa de clases de suelos convencional y Mapa de clases neuro-borrosas.
Para cuantificar un poco estos resultados de concordancia se muestran los resultados del
cuadro 25.
Cuadro 25. Matriz de errores entre clases (métodos convencional y neuro-borroso)
ID 1 2 3 4 5 6 7 SUMA
SUMA 1 3119 941 51 680 1023 358 3 6175
2 717 2042 5 1767 910 541 2 5984
3 51 58 14679 2528 0 0 0 17316
4 2134 5353 1319 10531 164 0 2 19503
5 1076 1664 8 919 1977 780 3 6427
6 53 45 1 32 576 867 1 1575
7 7 4 0 0 6 1 914 932
SUMA 7157 10107 16063 16457 4656 2547 925 57912
El anterior cuadro 25, muestra la matriz de errores, donde se ven los éxitos de clasificación de
los puntos de observación a lo largo de la diagonal (color verde) y la no concordancia en los
triángulos superiores e inferiores de esta diagonal. Los valores de referencia (mapa
convencional) se encuentran en las columnas y los valores de clasificación (mapa neuro-
borroso) en las filas. Como se ve la clase con mayor acierto fue la 3 con 14.679 puntos
92
correctos de un total de 16.063, seguida de la clase 4 (10.531 puntos de 16.457) y clase 1 con
3.119 puntos de un total de 7.157. La clase 7 no se analizó ya que es embalse del Rio
Canoabo.
Por otro lado el cuadro 26 reporta la exactitud del método neuro-borroso mediante diferentes
parámetros, donde resalta que para las clases 3 y 4 el modelo reflejo la mayor precisión de
productor (Sensibilidad), con valores próximos a 1, las clases 1 (0.43) y 5 (0.42) fueron
moderadamente acertadas y las clases que mostraron mayor dificultad de ser reconocidas por
el modelo fueron la clase 7 (0.34) y la clase 2 (0.20).
Cuadro 26. Reporte de exactitud (métodos convencional y neuro-borroso)
Clases Precisión de
productor
Precisión
de usuario Especificidad
Error por
omisión Error por comisión
1 0.435797 0.505101 0.939789 0.564203 0.060211
2 0.202038 0.341243 0.917540 0.797962 0.082460
3 0.913839 0.847713 0.936988 0.086161 0.063012
4 0.639910 0.539968 0.783573 0.360090 0.216427
5 0.424613 0.307609 0.916441 0.575387 0.083559
6 0.340400 0.550476 0.987212 0.659600 0.012788
7 0.988108 0.980687 0.999684 0.011892 0.000316
De manera general el modelo neuro-borroso evidencio un Índice de concordancia (IC) o
sensibilidad de moderada a alta de 0.58, es decir casi el 60 % de los casos fueron acertados. La
probabilidad de que un punto de observación no fue clasificado como de una clase cuando no
pertenecía a esa clase (Especificidad) resulto alta de 0.93. La proporción de puntos no
clasificados como de una clase, cuando en realidad es de ella (Error por omisión), resulto
moderada a baja con un valor de 0.41. La Proporción de puntos clasificados como de una clase
cuando se observa en realidad no ser de ella (Error por comisión), fue de muy baja con un
valor de 0.06, y el coeficiente Kappa que trata de eliminar el efecto del azar en la predicción
de la concordancia resulto moderada con un valor de 0.47. En este caso, el valor de p
<0,00001 sugiere el modelo es casi seguro que predice la distribución de las clases mejor que
el azar (Ver cuadro 27).
93
Cuadro 27. Estadísticos generales (métodos convencional y neuro-borroso)
Parámetros Valor Parámetros Valor
Indice de concordancia (IC) 0.589325 Error por omisión global 0.410675
Clasificación errónea global 0.410675 Error por comisión global 0.068446
Sensibilidad global 0.589325 Coeficiente Kappa (CK) 0.473344
Especificidad global 0.931554 P < 0.00001
7.3.2. Concordancia entre el método regresion-kriging y el levantamiento Convencional
Este método produjo un mapa de “Propiedades de suelos” con siete (7) clases, el cual
resulto de combinar seis (6) propiedades (arena, limo, arcilla 0-20 cm, arcilla 20-50 cm,
pH 0-20 cm y pH 50-200cm). Estas clases fueron reclasificadas buscando la mayor
concordancias con el mapa de suelos realizado convencionalmente (Ver cuadro 28 y figura
75).
Cuadro 28. Clases fisiográficas del mapa producido por el método regresion-kriging.
Método regresion-kriging
Clase de Propiedades de los suelos,
salida del método regresión-kriging
Reclasificada según mapa
de método convencional
1 3
2 1
4 6
5 4
6 2
7 3
8 3
La figura 75. Muestra que de las sietes clase del mapa regresion-kriging solo coincidieron
cinco (5) clases de suelos en el mapa convencional (Clases: 1, 2, 3, 4 y 6). Sin embargo
aunque no aparecen todas las seis clases de suelos del mapa convencional, las cinco que
aparecen se corresponden espacialmente muy bien, especialmente la clase 3 y 1.
94
Figura 75. Mapa de clases de suelos convencional y Mapa de clases regresion-kriging.
Para cuantificar esta comparación se muestran la matriz de errores en el cuadro 29, donde se
aprecia que el modelo tuvo una alta precisión en la clasificación de los suelos clase 3 (12.578
puntos de 16.063) y una moderada precisión en clasificar los suelos clase 1 (3.096 puntos de
7.157). Sin embargo en las demás clases su precisión fue baja como en la clase 4 (2749 puntos
de 16.457) donde el modelo fue incapaz de clasificarlo bien.
Cuadro 29. Matriz de errores entre clases (métodos convencional y regresion-kriging)
CLASES 1 2 3 4 6 SUMA
1 3096 2335 153 1737 765 8086
2 1898 3601 882 5736 184 12301
3 972 1040 12578 5131 498 20219
4 853 2399 1198 2749 193 7392
6 338 732 1252 1104 907 4333
SUMA 7157 10107 16063 16457 2547 52331
El cuadro 30 complementa lo mencionado anteriormente donde se observa que las clase 3
tiene una sensibilidad (precisión de productor) alta con un valor de 078, las clases 1 (0.43), la
clase 2 (0.35) y la clase 6 (0.35) con valores moderados y la clase 4 presento el valor menor de
precisión 0.16.
95
Cuadro 30. Reporte de exactitud (métodos convencional y regresion-kriging)
Clases Precisión de
productor
Precisión de
usuario Especificidad Error por omisión Error por comisión
1 0.432583 0.382884 0.889538 0.567417 0.110462
2 0.356288 0.292740 0.793956 0.643712 0.206044
3 0.783042 0.622088 0.789318 0.216958 0.210682
4 0.167041 0.371889 0.870575 0.832959 0.129425
6 0.356105 0.209324 0.931183 0.643895 0.068817
De manera general el modelo regresion-kriging mostro un índice de concordancia o
sensibilidad moderada de 0.43, es decir solo el 40 % de los casos fueron concordante con el
mapa convencional. La probabilidad de que un punto de observación no fue clasificado como
de una clase cuando no pertenecía a esa clase (Especificidad) resulto alta de 0.85. La
proporción de puntos no clasificados como de una clase, cuando en realidad es de ella (Error
por omisión), resulto moderada a alta con un valor de 0.56. La Proporción de puntos
clasificados como de una clase cuando se observa en realidad no ser de ella (Error por
comisión), fue bajo con un valor de 0.14, y El coeficiente Kappa que trata de eliminar el efecto
del azar en la concordancia resulto bajo con un valor de 0.26. En este caso, el valor de p
<0,00001 sugiere el modelo es casi seguro que predice la distribución de las clases mejor que
el azar (Ver cuadro 31).
Cuadro 31. Estadísticos generales (métodos convencional y regresion-kriging)
Parámetros Valor Parámetros Valor
Índice de concordancia (IC) 0.438192 Error por omisión global 0.561808
Clasificación errónea global 0.561808 Error por comisión global 0.140452
Sensibilidad global 0.438192 Coeficiente Kappa (CK) 0.266972
Especificidad global 0.859548 P < 0.00001
Finalmente al analizar el Índice de concordancia (IC) y el coeficiente kappa (CK) obtenidos
por ambos métodos cartográficos (neuro-borroso y regresión kriging). Se podría señalar que el
método neuro-borroso resulto mejor al compararlo con un levantamiento de suelo
convencional. Tal vez debido a que su filosofía u objetivo sea la de obtener una clasificación o
estratificación de la superficie de las tierras, aspecto que es muy parecido a la
fotointerpretación que realiza un experto agrologo para obtener las unidades fisiográficas o
96
preliminares de suelo en un levantamiento convencional. Por el contario la regresión kriging
se basa fundamentalmente en la generación de mapas continuos de propiedades de los suelos.
Aspecto que no necesariamente expresaría separaciones claras en las unidades de suelos. Por
lo tanto debido a los objetivos de cada método, se podría decir que ellos no son contrarios,
más bien pueden se complementarios.
97
8. CONCLUSIONES
A partir de los resultados obtenidos, se puede concluir lo siguiente:
Se considera importante el estudio de métodos de cartografía digital de suelos, especialmente
en suelos de montañas con relieves accidentados y vegetación boscosa, de gran frecuencia en
el país. Ello es debido a que dichos métodos tienen la bondad de manejar, integrar e interpretar
abundante información de variables ambientales (factores formadores) y aplicar sus modelos
matemáticos para estratificar el área de estudio en clases fisiográficas que apoyen al foto-
interprete, y predecir propiedades de los suelos en sitios de difícil acceso. Todos los anteriores
se considerado clave para una buena cartografía de los suelos en regiones de montañas.
Por otro lado el modelo digital de elevación evidencio en la cuenca un relieve montañoso
dispuesto en forma de herradura con su abertura hacia el extremo norte. Estas montañas
envuelven el estrecho y alargado valle del Rio Canoabo, y esta característica favoreció la
aplicación de los métodos de cartografía digital, ya que estos se comportan mejor en relieves
accidentados.
Método neuro-borroso
Mediante la aplicación del método neuro-borroso, se lograron separar los suelos de la cuenca
en once clases fisiográficas o clases tentativas de suelos, en lo cual, se notó que la altura sobre
el nivel medio del mar, la orientación de las laderas, la pendiente, la cobertura vegetal y el
índice de humedad son las variables más importantes a la hora de diferenciar clases
fisiográficas. Por el contrario el perfil y el plano de curvatura del terreno y el área de captación
no aportaron para la separación de las clases.
No todas las clases fisiográficas tuvieron la misma consistencia para mostrarse en las
diferentes corridas del método neuro-borroso. Es así que los suelos en laderas altas bajo
bosque nublado, los suelos en laderas medias bajo bosques semideciduos y los suelos en
ladera bajas erosionados, fueron las clases tentativas de suelos más consistentes en todas las
corridas. El resto de clases podría o no aparecer.
Los resultados del método neuro-borroso también arrojaron que si la superficie del terreno es
cónvexa, las pendientes son altas y la cobertura vegetal es baja, las áreas muestran alto riesgo
de erosión.
La comparación de los resultados del método neuro-borroso con el mapa levantado
convencionalmente mostró una buena concordancia especialmente en la distribución espacial,
alcance y límites de las unidades cartográficas. Ello ocurrió así, especialmente en las clases
con suelos en laderas altas bajo bosque nublados y los suelos en ladera medias bajo bosques
98
semideciduos, donde la concordancia alcanzo un 91 % y 63 % respectivamente. Por el
contrario donde no mostro fortaleza el método fue en los suelos planos de los valles con 31 %
de concordancia y en las laderas bajas donde coincidió solo en el 20 % de los casos. Sin
embargo de manera general el método neuro-borroso tuvo un índice de concordancia (IC) de
moderado a alto en toda la cuenca, rondando el 60 % (Sensibilidad de 0,58) y un coeficiente
kappa (CK) moderado de 0,47.
Método regresión-kriging
Por otro lado el modelo de regresion-kriging cartografió adecuadamente las siete propiedades
consideradas en este estudio (arena, limo, arcilla0-20 cm, arcilla20-50 cm, materia orgánica,
pH0-20 cm y pH50-200 cm), evidencia de esto fueron los altos coeficiente de determinación
resultantes, los cuales, están entre 0,59 y 0,93. Además cuando se aplicó el modelo a los
puntos dejados para su validación, los errores obtenidos en el caso de las texturas fueron
menores al 7 %, en la materia orgánica menor a 0,14 y en el pH los errores no resultaron
mayores a 0,2.
Para el método regresión-kriging, las variables más importantes para estimar las propiedades
de los suelos fueron la altura sobre el nivel medio del mar, el número de meses húmedo, el
índice de vegetación y el riesgo de erosión. De manera general se podría señalar que en la
cuenca del Rio Canoabo mientras mayor sea la altura sobre el nivel medio del mar, la
humedad y la cobertura vegetal especialmente bosques densos, el contenido de arena, limo y
los niveles de pH en superficie y profundidad tienden a disminuir. Por el contrario en estas
mismas condiciones la arcilla en superficie y en profundidad y la materia orgánica presentan
valores mayores.
La geología aunque fue significativa en pocas propiedades estudiadas (solo en pH 0- 20 cm),
resulta una variable importante para explicar los resultados.
Al comparar los resultados del método regresión-kriging con el mapa levantado
convencionalmente, este mostró una moderada concordancia, especialmente en la distribución
espacial y en algunos de los límites de las unidades cartográficas. En algunas clases como la
correspondiente a suelos en laderas altas bajo bosque nublados su concordancia fue alta (78
%), y moderada (43 %) en los suelos en ladera bajas erosionados. Por el contrario donde no
mostro fortaleza el método fue en los suelos en ladera medias bajo bosques semideciduos,
donde coincidió solo en el 16 % de los casos. Esta variación reflejó que el método de
regresión-kriging tuviera un Índice de concordancia (IC) moderado en toda la cuenca,
rondando el 40 % de concordancia (Sensibilidad de 0,43) y un coeficiente kappa (CK) bajo de
0,26.
99
Comparacion de métodos de cartografía digital
Ambos métodos cartográficos tienen sus bondades, como que son basados en aspectos
matemáticos, estadísticos y geoestadisticos como redes neuronales, lógica borrosa o difusa, y
kriging cuya trayectoria es largamente comprobada. También que son sencillos de aplicar y la
información básica requerida es de fácil acceso como los modelos digital de elevación para
extraer información fisiográfica, y las imágenes de satélites para proporcionar aspectos de
vegetación y clima, los cuales, pueden descargarse de internet gratuitamente para estudios a
escalas medias. Además sus resultados son muy aceptables como se pudo ver en la cuenca del
Rio Canoabo. Sin embargo para el método regresión-kriging se necesita, además de la ya
mencionada información, ciertos datos edáficos previos productos del análisis de muestras de
suelos, lo que lo hace más costoso.
Aunque el objetivo de este estudio fue la comparación de dos métodos de cartografía digital,
los resultados obtenidos y el estudio detallado de la metodología arrojo que más bien pudieran
ser tecnologías complementarias a realizarse en secuencia. Primero la neuro-borrosa para
establecer las posibles unidades cartográficas fisiográficas con un mayor detalle y precisión
que la fotointerpretación, y apoyar la planificación racional del muestreo de suelos en campo,
lo que podría reducir la cantidad de muestras economizando el trabajo y haciéndolo más
efectivo y eficiente. Posteriormente el método regresión-kriging realizado luego de obtener los
datos de laboratorio de las muestras de suelos, podría lograr una distribución espacial más
precisa de esas propiedades de los suelos y posteriormente proveer a las unidades cartográficas
preliminares con datos de dichas propiedades, incluyendo ahora su variabilidad espacial
interna.
100
9. REFERENCIAS BIBLIOGRAFICAS
Arguellos, E. 2013. Analisis epidemiologico de datos. Modulo de ayuda sobre Concordancia y
Consistencia. Aplicación informatica “Epidat 4.0”. 43 p.
Avery, B. 1987. Soil survey methods: a review, in Technical Monograph, Editor: Silsoe: Soil
Survey & Land Resource Centre. 86 p.
Bezdek, J.C. 1981. Pattern Recognition with Fuzzy Objective Function Algorithms. Plenum
Press, New York.
Bezdek, J.C.; E.C. Tsao; N.R. Pal. 1992. Fuzzy Kohonen Clustering Networks, in Proc. IEEE
Int. Conf. on Fuzzy Systems, 1992 (San Diego), pp. 1035-1043.
Breusch, T.S. y A.R. Pagan. 1979. A Simple Test for Heteroscedaticity and Random
Coefficient Variation. Econometrica, vol. 47. pp. 1287-1294.
Burrough, P.A.; R.A. Mcdonnel. 1998. Principles of geographical information systems.
Oxford, Oxford University Press New York. 333 p.
Charniak, E. y McDermott, D. 1985. Introduction to Artificial Intelligence. Universidad de
Michigan. Addison-Wesley Pub.Company. 701 p.
Chiles, J. y P. Delfiner. 1999. Geostatistics: modeling spatial undertainty. John Wiley and
Sons, New York.
Cohen, J. 1960. A coefficient of agreement for nominal scales. Educ Psyclzol Meas; 20: pp
37-46.
Desmet, P. y Govers, G. 1996. A GIS procedure for automatically calculating the USLE LS
factor on topographically complex landscape units. Journal of soil and water conservation.
51: pp 427-433.
Fausett, L. 1994. Fundamental of Neural Networks: Architectures, Algorithms, and
Aplications. Prentice Hall. New Jersey. 461 p.
Gessler, P.E.; I.D. Moore; N.J. Mckenzie; P.J., Ryan. 1995. Soil-landscape modelling and the
spatial prediction of soil attributes. Int. J. Geogr. Inf. Syst, 94: pp 421-432.
Goovaerts, P. 1997. Geostatistics for natural resources evaluation. Oxford University press,
New York.
Haykin, S. 1994. Adaptive Filter Theory, Third Edition, Englewood Cliffs, NJ: Prentice-Hall.
101
Hecht-Nielsen, R. 1987. Counter-Propagation Networks. IEEE First International Conference
on Neural Networks, Volume II, 1987.
Hengl, T. ; G. Heuvelink y A. Stein. 2004. A generic framework for spatial prediction of soil
variables based on regression-kriging, Geoderma Volumen 120, año 2004, pp 75–93.
Hilera G.; V. Martínez. 1995. Redes neuronales artificiales: fundamentos, modelos y
aplicaciones. Madrid, RA-MA. 389 p.
Hutchinson, J.N. 1988. “Morphological and geotechnical parameters of landslides in relation
to geology and hydrogeology”. In Ch. Bonnard (Ed.): Landslides. Proceedings 5th
International Conference on Landslides. Lausanne. Vol. 1: pp 3-35.
Irvin, B.J.; S.J. Ventura; B.K. Slater. 1997. Fuzzy and isodata classification of landform
elements from digital terrain data in Pleasant Valley, Wisconsin. Geoderma, 77 (2-4): pp
137-154.
Jenness, J. y J. Judson. 2007. Cohen’s Kappa and Classification Table Metrics 2.1a: An
ArcView 3x Extension for Accuracy Assessment of Spatially-Explicit Models. Wildlife
Biologist, GIS Analyst Jenness Enterprises.
Jenny, H. 1941. Factors of soil formation: a system of quantitative pedology. McGraw-Hill,
New York. 281 p.
Klein, E.; I. Chollett; C. Castillo. 2007. Mapas auto organizados para la extracción de patrones
espaciales en datos satelitales hipertemporales. II Jornadas Nacionales de Geomática. 3 al
5 de Octubre, 2007, Caracas.
Klingseisen, B.; G. Metternicht; G. Paulus. 2007. Geomorphometric landscape analysis using
a semi-automated GIS-approach. Environmental Modelling & Software, pp 1-13.
Knotters, M.; D. Brus; J. Voshaar. 1995. A comparison of kriging, co-kriging and kriging
combined with regression for spatial interpolation of horizon depth with censored
observations. Geoderma, Volume 67, Number 3, August 1995, pp. 227-246(20)
Kohonen, T. 1982. Analysis of a simple self-organizing process. Biological Cybernetics, 44:
pp 135-140.
Kohonen, T. 1997. Self-Organizing-Maps. Springer, Berlin, Second edition. 362 p.
Landis J. y G. Koch. 1977. The measurement of observeragreement for categorical data.
Biometrics; 33: pp 159-74.
Lin, C.; C. Lee. 1996. Neural fuzzy systems. Prentice Hall, Inc. New Jersey, USA. 797 p.
102
Lores, C. 2006. Caracterizacion de la Cobertura Vegetal y el Uso Actual de la Cuenca del río
Canoabo. Informe tecnico. PEQUIVEN, Moron. 40 p.
Malone, B.; A. Mcbratney; B. Minasny, y G. Laslett. 2009 Mapping continuous depth
functions of soils carbón storage and available water capacity. Geoderma.
Martín del Brío, B. y A. Sanz. 2007. Redes Neuronales y Sistemas Borrosos. 3ª edición.
Alfaomega Grupo Editor, S.A. de C.V. México. 404 p.
Martin del Brio, B. y C. Seerano. 1995. Fundamentos de las redes neuronales artificiales:
hardware y software. Dpto. Ingeniería Eléctrica y Electrónica Escuela Universitaria de
Ingeniería Técnica Industrial Universidad de Zaragoza. 23 p.
McBratney, A.; O. Inakwu.; B. Odeh, ; T. Bishop; M. Dunbar y T. Shatar. 2000. An overview
of pedometric techniques for use in soil survey. Geoderma, Volumen 97, año 2000, pp
293–327.
McBratney, A. B.; M. Mendoza; B. Minasny. 2003. On digital soil mapping. Geoderma, 117:
pp 3-52.
McCulloch, W.S. y W.H. Pitts. 1943. A Logical Calculus of the Ideas Immanent in Neural
Nets", Bulletin of Mathematical Biophysics, Volume 5.
Minasny B. y A.B. Mcbratney. 2002. FuzME version 3.0. Australian Centre for Precision
Agriculture. McMillan Building A05, The University of Sydney, NSW 2006. [On line]:
http://www.usyd.edu.au/su/agric/acpa.
Mintegui, J. 1988. Análisis de la influencia del relieve en la erosión hídrica. Hipótesis de
estudio para correlacionar la pendiente con la longitud del declive en un terreno. V.
Asamblea Nacional de Geodesia y Geoficica. pp 2229 – 2245. Madrid.
Núñez, Y., J. A. Viloria. Y M.C.Pineda. 2013. Cartografía digital de unidades
geomorfométricas en la cuenca del río Tucutunemo, Venezuela. En: V Jornadas
Nacionales de Geomática y IX Jornadas de Educación en Percepción Remota en el ámbito
de Mercosur. MCTI-FIIDT-CPDI, Caracas. pp 319-323.
Odeh, I.O.A.; A.B. Mcbratney y D.J. Chittleborough. 1992a. Soil pattern recognition with
fuzzy c-means: application to classification and soil landform interrelationships. Soil Sci.
Soc. Am. J. 56: pp 505- 516.
Odeh, I.O.A., A. McBratney, y D. Chittleborough. 1994. Spatial prediction of soil properties
from landform attributes derived from a digital elevation model. Geoderma 63, pp 197–
214.
103
Odeh, I.O.A.; A. McBratney, y D. Chittleborough. 1995. Further results on prediction of soil
properties from terrain attributes: heterotopic cokriging and regression-kriging.
Geoderma, Volume 67, Issues 3–4, August 1995, pp 215–226.
PALMAVEN. 1999. Proyecto “Desarrollo Regional Occidente. Capitulo Carabobo (DRO-
Carabobo)”. Guacara. Estado Carabobo.
Palmer, A. y J.J. Montaño. 1999. ¿Qué son las redes neuronales artificiales? Aplicaciones
realizadas en el ámbito de las adicciones. Adicciones, 11(3): pp 243-255.
Perez , R. 2005. Procesado y Optimización de Espectros Raman mediante Técnicas de Lógica
Difusa: Aplicación a la Identificación de Materiales Pictóricos. Tesis doctoral. Universitat
Politècnica de Catalunya. 182 p.
Rzempoluck, E. J. 1998. Neural network data analysis using Simulnet. Simon Fraser
University. Burnaby. B.C. Canadá. ISBN: 0-387-98255-8. pp. 1-3, 13-75.
Rouse, J.W.; R.H. Haas; J.A. Schell y D.W. Deering. 1974. Monitoring vegetation systems in
the Great Plains with ERTS. p. 309–317. In Proc. ERTS-1 Symp., 3rd, Greenbelt, MD. pp
10–15 Dec. 1973. Vol. 1. NASA SP-351. NASA, Washington, DC.
Rumelhart, D.E.; J.L. McClelland y PDP Research Group. 1986. Parallel Distributed
Processing. Explorations in the Microstructure of Cognition. Cambridge, MA: MIT Press.
Sevilla, V.; J. Comerma y O. Silva. 2009a. Caracterización de la cuenca del río Canoabo en el
estado Carabobo, Venezuela. I. Análisis climático y Producción de aguas. Agronomía
Trop. 59(1): pp 33-44.
Sevilla, V. y J. Comerma. 2009b. Caracterización de la cuenca del río Canoabo en el estado
Carabobo, Venezuela. II. Suelos y Tierras. Agronomía Trop. 59(2): pp 149-160.
Sevilla, V.; J. Comerma y O. Silva. 2009c. Caracterización de la cuenca del río Canoabo en el
estado Carabobo, Venezuela. III. La erosión de los suelos. Agronomía Trop. 59(3): pp
249-264.
Sevilla, V. y J. Comerma. 2009d. Caracterización de la cuenca del río Canoabo en el estado
Carabobo, Venezuela. IV. Zonificacion Agroecologica. Agronomía Trop. 59(3): pp 265-
273.
Shapiro, S. y M. Wilk. 1965. An Analysis of Variance Test for Normality (Complete Samples)
Biometrika, Vol. 52, No. 3/4. pp. 591-611.
Soil Survey Staff. 2003. Keys to Soil Taxonomy. Ninth Edition. [on line]
http://soils.usda.gov/technical/classification/tax_keys/keysweb.pdf.
104
Tarboton, D.G.; R.L. Bras y I. Rodriguez-Iturbe. 1991. On the extraction of channel networks
from digital elevation data. Hydrological Processes 5: pp 81-100.
Tukey, J.W. 1977. Exploratory Data Analysis. Reading, Massachussets: Addison-Wesley.
Valera, A. y J. Viloria, J. 2009. Aplicación de técnicas de inteligencia artificial en el modelado
de unidades de paisaje en la cuenca del Río Güey, Maracay - estado Aragua. XVIII
Congreso Venezolano de la Ciencia del Suelo. Sociedad Venezolana de la Ciencia del
Suelo, Santa Bárbara del Zulia, Venezuela.
Viloria, A. 2007. Estimación de Modelos de clasificación de paisaje y predicción de atributos
de suelos a partir de imágenes satelitales y modelos digitales de elevación. Trabajo
Especial de Grado. Universidad Central de Venezuela. Caracas, Venezuela. 88 p.
Viloria, J. A.; A. Valera, y A. Viloria. 2011. Clasificación geomorfométrica de paisajes
montañosos venezolanos. IV Jornadas Nacionales de Geomática. Fundación instituto de
Ingeniería, Caracas, Venezuela.
Wilson, J.P. y J.C. Gallant. 2000. Terrain Analysis: Principles and Applications. John Wiley &
Sons, 479 p.
Wischmeier, W.H. y D.D. Smith. 1978. "Predicting Rainfall Erosion Losses: A Guide to
Conservation Planning." Agriculture Handbook No. 537. USDA/Science and Education
Administration, US. Govt. Printing Office, Washington, DC. 58 p.
Webster, R. y M. Oliver.2006. Modeling spatial variation of soil as random functions. In
Grunwald, S. (Ed.) Environmental soil-landscape modeling: geographic information
technologies and pedometrics. CRC Press, Boca Raton. p. 241-287.
Webster, R. y M. Oliver. 2007. Geostatistics for environmental scientists. 2nd
. Ed. John Wiley
and Sons, Chichester.
Zadeh, L.A. 1965. Fuzzy sets. Information and Control. 8: pp 338-353.
Zevenbergen, L.W. y C.R. Thorne. 1987. Quantitative analysis of land surface topography.
Earth Surface Processes and Landforms, 12: pp 47-56.
Zhu, A.X. 1997. A similarity model for representing soil spatial information. Geoderma, 77:
pp 217–242.
Zhu, A.X. 2000. Mapping soil landscape as spatial continua: The neural network approach.
Department of Geography, University of Wisconsin, Madison. Water Resources
Research. 3: pp 663-677.