España 2013
Raquel HERNÁNDEZ CANTERO
Grado en Matemáticas
“Análisis multivariante”
Consumos energéticos por Comunidad Autónoma
ÍNDICE
- Introducción (objetivo)
- Análisis de las Componentes Principales (ACP)
- Datos. ACP normado o sin normar.
- Valores Propios.
- Correlaciones entre variables
- Interpretación de las Componentes Principales
- Proyecciones
- Elementos atípicos
- Otras tablas
- Clasificación Automática
- Dendograma y corte.
- Estabilización por centros móviles.
- Composición y caracterización de las clases.
- Otras tablas
- Otros estudios y comentarios
- Informe final / Conclusiones
Introducción
Como nos han intentado concienciar en los últimos años, las fuentes de energía son un
elemento muy importante en nuestro día a día, del que dependemos continuamente
cada vez que hacemos una acción tan simple como encender la luz o la calefacción, o
arrancar nuestro coche. Lo alarmante no es esta dependencia, sino el hecho de que
algunas no son inagotables ni renovables.
En cualquier medio de comunicación podemos oír hablar de la crisis energética
mundial. Se tratan temas como la caducidad de los combustibles fósiles frente a la
sostenibilidad energética, se habla de la seguridad del abastecimiento de las energías,
o de la seguridad de la energía nuclear frente a la seguridad medio ambiental, de las
claves de la esperanza del cambio climático, etc.
Pues bien, el interés por este tema me llevó a acceder a la página del INE en busca de
datos relacionados con el tema y me decanté por una tabla de datos que me atraía por
su sencillez. La tabla escogida, tratará, por lo tanto, del consumo de las diferentes
fuentes de energía por Comunidad Autónoma relativa al año 2013.
Datos obtenidos de: http://www.ine.es/jaxi/tabla.do?path=/t04/p01/cnae09/serie/l0/&file=01003.px&type=pcaxis
&L=0
También se puede encontrar nuestra matriz de datos en datos_energéticos.xls
Me llamaron la atención los datos contundentes que encontré: el equilibrio del
consumo entre CC.AA y la puesta de manifiesto de unas variables muy correlacionadas.
Para poder explicar estos curiosos resultados, accedí a internet y en cualquier artículo
sobre consumo de energía en España, se hablaba de la existencia de un Plan
Energético Nacional (PEN), de la existencia de redes de distribución de energía, como
la Red Eléctrica Nacional (REN). Red Básica de Gaseoductos (RBG), Compañía Logística
de Hidrocarburos (CLH).
En un principio, la idea era obtener información sobre los comportamientos de las
diferentes Comunidades Autónomas en la distribución de las diferentes fuentes
energéticas, para así tratar de ver cómo emplearlos de la manera más eficiente posible,
ya sea centrándose en determinadas Comunidades, en determinadas áreas de energía
(electricidad, gas, gasóleo, fueloil, alternativas como los biocombustibles…), en ambos,
etc.
Sin embargo, posteriormente, lo que hemos obtenido de este estudio es que la
existencia de la Comisión Nacional de la Energía (con su PEN) condiciona totalmente los
resultados.
También hemos elaborado una clasificación de las Comunidades Autónomas que nos
proporciona mayor información.
Por tanto, procedamos a realizar con el programa SPAD, un análisis ACP y algo de
clasificación automática / análisis cluster.
Pasos a realizar: - Incorporo los datos a un fichero Excel: datos_energéticos.xls - Recopilo la información que me interesa (en la llamada Hoja1 de dicho documento) y selecciono dentro de la hoja de cálculo el grupo de celdas que me interesa pasar a SPAD para hacer el análisis y le asigno un nombre. Guardo y cierro. - Creo una base SPAD, como energías.sba, importando los datos del Excel. Guardo dicha base. - Selecciono la base creada para hacer el análisis. - Inserto método ACP (COPRI). - Selecciono individuos, variables y parámetros del ACP, indicando si vamos a hacer un análisis normado o sin normar. - Guardo y ejecuto filière. Ejecuto filière: - Doble clic en el icono de resultados para ver las tablas obtenidas. - Doble clic en el icono de gráficos para crear las gráficas deseadas dando a Graphique>Nouveau y seleccionando los puntos a dibujar. Para añadir el análisis cluster: - Se inserta un método nuevo. Méthodes> Classification y seleccionamos uno para la clasificación automática en general y otro para la descripción de clases de nuestro dendograma. - Se procede de forma similar para ejecutar y obtener la información que deseamos.
Se podría decir que el objetivo es…
Objetivo: obtener información sobre cuáles son los tipos de comportamientos que están
llevando a cabo las diferentes Comunidades Autónomas.
Finalmente haremos una comparación de los resultados obtenidos.
Análisis de Componentes Principales (ACP)
Datos.
Antes de hacer nuestro análisis, veamos los datos que tenemos. Nuestra matriz consta de 17 Comunidades Autónomas (19 si contamos con Ceuta y Melilla, pero las hemos suprimido, puesto que no disponíamos de la información requerida) y se observan las 8 variables siguientes:
elec – Electricidad gas – Gas gaso – Gasóleo fuel – Fueloil otrp – Otros productos petrolíferos carb – Carbón y coque bioc – Biocombustibles calo – Calor y otros consumos energéticos Otras variables que podrían haber entrado en juego son “Carbón y derivados” y “Otros consumos energéticos”, pero no disponíamos tampoco de los datos suficientes. El total de los consumos energéticos (en las diferentes Comunidades Autónomas) lo hemos considerado como ilustrativo. Obtenemos pues:
Se pueden encontrar también datos de este tipo en el documento Excel que nos proporciona también SPAD (se encuentran en ACPenergexcel.xls).
De las 17 Comunidades Autónomas tratadas, las 17 utilizan estos diferentes tipos de
recursos energéticos, con lo cual no hay un recurso que destaque por ser el que se utiliza
en todas o en la mayoría de las Comunidades ni ninguno que destaque porque apenas
se utiliza en una o dos Comunidades Autónomas.
Pasemos pues, a fijarnos en las medias obtenidas, son bastantes variadas, y pensándolo,
esto está influido por el número de consumidores (empresas, población en cada una de
las Comunidades Autónomas).
Las desviaciones típicas abarcan valores desde 3227.28 hasta el 304037.06
ANÁLISIS DE COMPONENTES PRINCIPALES NORMADO
Utilizaremos un ACP para estudiar estos datos. Disponemos de 8 variables cuantitativas x 17
individuos (C.Autónomas).
Fijándonos en las varianzas (ecart-type^2), nos damos cuenta de que son algo diferentes y no veo razón alguna por la que deberíamos conservar la variabilidad y respetar las escalas de medida originales (sería el caso ACP sin normar con la matriz de covarianzas). Hemos escogido ACP normado (método basado en la matriz de correlación) porque de esta forma daremos la misma importancia a cada una de las 8 variables
Valores Propios
Los valores propios de la matriz XtX nos proporcionan información sobre las inercias que se recogen en cada uno de los 8 ejes factoriales definidos por los vectores propios de dicha matriz. Las inercias, por otro lado, nos indicarán cómo de buena es la representación de los puntos en cada uno de los ejes
Cabe destacar que el primer eje factorial recoge más de la mitad de la información (65,97%) y el primer plano, el 81,87%. Con el tercer eje alcanzaríamos ya incluso un 90.39%, es decir, el mejor espacio de dimensión 3 formado por los tres primeros ejes factoriales, recoge un 90.39% de la información. Los tres-cuatro primeros ejes recogen mucha inercia. Se podría despreciar el resto. Como además se trata de un ACP normado la suma de los valores propios es igual al número de variables, esto no hace más que reafirmarnos en la idea de que con tan solo los dos primeros ejes factoriales (con valores propios 5.2779 y 1.2719, respectivamente), nos valdría.
Correlaciones entre variables
Las correlaciones entre las 8 variables originales son todas positivas.
Hay correlaciones muy altas en general, por ejemplo, entre gaso-elec (0,92), es decir,
hay una correlación alta entre electricidad y gasóleo. Otra correlación similar a esta, sería la
existente entre electricidad y gas (0,91). También podemos destacar la que hay entre carb
(carbón y coque)-elec (0.87), o entre gaso-gas (0.87), o carb-gaso (0.81)…
Después hay bastante correlación también entre carb-gas (0.76), carb-bioc (0.75), carb-
calo (0.73), calo-elec (0.71), otrp-calo (0.71), otrp-bioc (0.70), calo-gaso (0.70), otrp-carb (0.66),
bioc-fuel (0.63), calo-gas (0.63)…
Si nos encontramos con correlaciones tan altas (como por ejemplo entre electricidad y
gas) es porque el volumen de consumidores en cada Comunidad Autónoma es determinante.
Obtenemos más información relacionada con las correlaciones a través del gráfico de
puntos variable, puesto que las correlaciones entre variables normadas son las mismas que
entre las variables originales.
incluyendo las variables ilustrativas.
Podemos completar la información sobre la correlación variables-ejes, con estas tablas:
No hay que confundir una gráfica del tipo anterior con la que presentamos a continuación, es
decir, cuidado porque no es lo mismo la posición del punto variable en el plano factorial que la
dirección de crecimiento de una variable.
Interpretación de las componentes principales.
Primer eje:
0.40 elec + 0.37 gas + 0.40 gaso + 0.17 fuel + 0.34 otrp + 0.41 carb + 0.33 bioc + 0.35 calo
El primer factor recoge un 65.97% de información
La primera Componente Principal posee correlaciones bastante altas (0.77-0.93, exceptuando el
0.40)
Valores altos de este primer factor, por tanto, van asociados con valores altos de todas las
variables (algo menos con fueloil).
Esto nos quiere decir que las Comunidades Autónomas representadas en la zona positiva del eje
1, serán aquellas que tienen un alto consumo, más o menos en general, de todas las variables.
Segundo eje:
0.20 elec + 0.37 gas + 0.12 gaso -0.73 fuel -0.14 otrp (+ 0 carb) -0.47 bioc + 0.18 calo
El segundo factor recoge un 15.90% de información.
La segunda Componente Principal está algo correlada positivamente con gas,
prácticamente incorrelada con carb (correlación 0.01) y negativamente correlada con fuel (-
0.83) y bioc (-0.53), y se puede decir que en menor medida con otrp (-0.16).
Valores altos de este segundo factor van asociados con valores altos de gas y con valores bajos de fuel y bioc. (Valores bajos de este segundo factor van asociados con valores bajos de gas y con valores altos de fuel y bioc). Esto nos quiere decir también que las Comunidades Autónomas representadas en la zona positiva del eje 2, serán aquellas que hacen un consumo bajo de fuel y biocombustibles y sin embargo, hacen un gran uso de gas. (En la zona negativa del eje 2, estarán los países con valores bajos de gas, pero con un gran consumo en biocombustibles y fueloil.) Tercer eje:
-0.29 elec – 0.26 gas -0.31 gaso -0.35 fuel + 0.67otrp -0.02carb + 0.10 bioc + 0.42 calo
El tercer factor recoge ya sólo el 8.52% de información
La tercera Componente Principal, a grandes rasgos, está correlada positivamente con
otrp (0.55) y se puede decir que un poco con calo (0.34). Por otro lado, está prácticamente
incorrelada con bioc (0.08) y algo correlada negativamente con fuel.
Valores altos de este tercer factor van asociados con valores altos de otrp y calo. A su
vez, también están asociados con valores bajos de fuel.
Esto nos quiere decir, en cuánto a la representación, que las Comunidades que se encuentran en la zona positiva del eje 3 serán aquellos con consumos altos de otrp y calo, es decir, por encima de la media en otros productos petrolíferos y calor y otros consumos energéticos, pero con muy poco consumo con respecto de la media en fueloil. El resto de los ejes: Se haría igual, pero con estos primeros nos vale.
Proyecciones
Fijándonos en las contribuciones relativas c.r. (COSINUS CARRES en SPAD), vemos si estos puntos
están bien representados o no. Los que tienen un valor de c.r alto (próximo a 1) estarán bien
representados.
Un indicador también de esta c.r, es el grosor de los puntos en la siguiente gráfica para los ejes
factoriales 1-2
Vemos que, por lo general, los puntos están muy bien representados, a excepción quizás de
Navarra o Murcia.
Elementos atípicos
La nube presenta un aspecto bastante compacto, exceptuando algunos elementos
(CC.AA.) concretos. Los que están algo más distantes, son por ejemplo Andalucía y Cataluña.
Suena razonable, puesto que al ser las Comunidades Autónomas con mayor número de
consumidores, tendrán valores altos de consumo en todas las fuentes energéticas. Quizás algo
menos en fueloil, esto puede ser porque esta fuente de energía se utiliza más como suplente o
apoyo energético, en zonas dónde la redes energéticas (REN, RBG, CLH) no tienen tan fácil
acceso.
Por eso, Canarias y Baleares, al tener un carácter insular, están situadas a la izquierda de la
gráfica. En general, presentarán valores bajos de consumos energéticos, pero valores más altos
que la media en fueloil.
Podemos hablar también de Galicia. Si se sitúa un poco a la derecha, es porque en general tendrá
consumos energéticos altos y esto es debido, sin duda al número de consumidores (es la quinta
Comunidad con mayor consumidores / población). Pero, lo más destacable, es que se sitúa muy
abajo en la gráfica (valores muy negativos para el factor 2), lo que nos indica que tiene consumo
de gas relativamente bajo y valores altos de fuel y biocombustibles. Esto es debido a que la red
de distribución de gas está menos desarrollada por peor acceso.
Otras tablas que nos proporciona SPAD de interés.
Clasificación Automática (Cluster)
Hecho ya el ACP, pasamos a la clasificación de las Comunidades Autónomas según sus consumos,
para clasificarlas según características similares y saber si existen diferencias entre sus
propiedades.
Como no tenemos un número excesivamente alto de Comunidades y de variables, empezaremos
con una clasificación jerárquica (utilizando el método de la inercia de Ward).
Tras realizar dicha clasificación, y un corte en el dendograma, se procederá a realizar una
estabilización por centros móviles, para mejorar si se puede la calidad de la partición.
Después de hacer la estabilización por centros móviles, haremos algunos comentarios sobre las
clases, sus propiedades…
Dendograma y corte
Si realizáramos el corte en 2 o 3 clases, apenas se verían las diferencias entre las Comunidades
(si es que las hay).
Si, por el contrario, hiciéramos un dendograma con un corte que nos defina 7 o más clases,
estaríamos haciendo demasiadas clases para los escasos individuos de los que disponemos.
Sin embargo, si observamos el gráfico, para algo intermedio como sería 5 clases tan sólo se
recogería un 1% de las observaciones en la quinta clase y en el resto un 0%. Lo mismo pasa para
el resto de cortes. Luego, realmente es difícil hacer un buen corte.
Al final, nos hemos decantado por 7 clases porque salen agrupaciones cuanto menos curiosas,
como explicaremos más adelante.
Presentamos a continuación el gráfico / histograma de los índices de agregación, que nos podría
ayudar para esta elección.
Estabilización por centros móviles
Discutido el corte en el dendograma, vamos a realizar una estabilización por centros móviles.
Buscaremos los centros de gravedad, ver cuáles son los individuos más cercanos…para intentar
buscar clases más precisas.
Se irán midiendo las inercias intraclases e interclases, intentando que la primera sea lo menor
posible e intentando maximizar la segunda. Nos fijaremos sobre todo en ambas inercias al
principio del proceso y al final, para comprobar si la estabilización nos ha mejorado algo.
Viendo los resultados, se observa que con 2 iteraciones el proceso se ha detenido, pues ya no
se podía maximizar o minimizar las inercias correspondientes.
QUOTIENT lo que nos indica es la división de la inercia interclases entre la inercia total.
Se ve que la inercia interclases (entre las clases escogidas) no se ha ido haciendo mayor con el
paso de las iteraciones, con lo cual la estabilización no nos ha servido para hacer una mejora.
Aquí vemos, que tampoco en ninguna de las 7 clases la inercia intraclases ha aumentado.
Por tanto, no podemos extraer mucha información de esto.
En principio la clase de menor inercia interna será la de mayor calidad, pero eso también
depende del número de individuos que tenga (las de inercia 0 son las que tienen un solo
individuo y se entiende el por qué), pero ¿y las demás?
Por ello, para determinar esta calidad podemos observar la inercia dividida por el número de
individuos.
Como no se han producido cambios, la clase de más calidad (obviando las de sólo un individuo)
sigue siendo la 7 (0.0115 de inercia intra), formada por 4 Comunidades Autónomas. La siguiente
mejor es la cuarta clase, aunque también es verdad que sólo consta de dos individuos. Después
van la 5 y la 6, con 3 y 5 individuos respectivamente.
Cabe destacar, que la clase de mayor calidad (y con diferencia con respecto a las demás), no es
la que tiene menos individuos, sino la 7 que incluye 4 Comunidades.
Composición y caracterización de las clases
Ahora, estudiaremos un poco las 7 clases más por separado, lo que puede ser interesante. Indicaremos los individuos que las componen, sus propiedades y características…
Pero antes, podemos prestar atención a datos como la ubicación de los centros, o (si es posible)
ver cuáles de las 8 variables presentan mayores diferencias al considerar una clase u otra (tabla
ANOVA).
UBICACIÓN/SITUACIÓN DE LOS CENTROS
Antes de la consolidación / estabilización por centros móviles
Después (en este caso nos da igual)
Si nos fijamos en la columna DISTO las clases 4, 5 y 6 son las más cercanas al origen de
coordenadas, por lo que estarán formadas por Comunidades Autónomas con consumos de
energía (en los diferentes campos) en torno a la media. Sin embargo, la cuarta clase se puede
decir que presentará unas características un poco peores, porque tiene todas las coordenadas
en los distintos ejes negativas. Entre la clase 5 y 6, hay que destacar que en la 5, la coordenada
en el primer eje es positiva, mientras que en la 6 no (pero sin olvidar que la 6 tiene algo menos
de distancia al origen).
Las más alejadas serán las clases 2, 1 y 3 (por orden de alejamiento).
Finalmente, podríamos pasar pues, a considerar cada clase.
CLASE 1
Andalucía presenta aproximadamente más de un millón de consumidores estables, de diferencia
con la siguiente, que sería Cataluña. Es por esto, que dichas Comunidades, aunque tuviéramos
un número de clases más pequeño, van a tener su propia clase y estar separadas del resto.
CLASE 2
Podríamos hacer comentarios similares a los expuestos en la clase 1. Existe aproximadamente
una diferencia de un millón de consumidores entre Cataluña y Madrid.
Es por tanto conveniente, fijarse en una tabla que pondremos más adelante sobre la distribución
de consumidores / población en las diferentes CC.AA.
CLASE 3
Galicia, como hemos comentado anteriormente, era un elemento atípico, por eso, al separar en
estas 7 clases, ha formado la suya propia.
CLASE 4
Ambas Comunidades Autónomas tienen un bajo número de consumidores, de ahí que puedan
tener características similares. (Tercer y cuarto lugar por la cola en la tabla que veremos).
CLASE 5
Si están en la misma clase Castilla y León, el País Vasco y la Comunidad Valenciana es porque
tienen características similares, es decir, propiedades no destacables.
A su vez, aparecen también prácticamente juntas en la tabla de consumidores (ordenada ésta
de mayor a menor).
CLASE 6
La clase 6, como vemos, es la que tiene mayor número de individuos, formada por Castilla-la
Mancha, Cantabria, Madrid, Murcia y Aragón.
Es más, si en vez de definir 7 clases, hubiéramos definido menos, como por ejemplo 5, se habrían
juntado ésta y la siguiente clase en una clase con la mayoría de las Comunidades (una clase con
9 individuos).
CLASE 7
Es destacable que las islas aparezcan en la misma clase, algo que era de esperar por cuestiones
de difícil acceso de las redes de distribución. Extremadura y la Rioja tendrán también
propiedades similares en cuanto a consumos de energías.
En las tablas que nos ofrece SPAD, se puede ver más información para ver qué variables de esta
clase están significativamente por encima de la media general y qué variables están
significativamente por debajo.
Como vemos, hay una variable (carbón y coque) que presenta un valor mayor que la media.
En resumen, las clases están compuestas por el número de individuos que vienen a continuación
(en la columna EFFECTIF) y se pueden representar gráficamente de la siguiente forma:
Otras tablas que nos proporciona SPAD
Otros estudios y comentarios
FUENTE: diferentes páginas
web + INE HabitantesEmpresas
activas
Total
consumidores
estables
turismo
estacionalCLASES
TOTAL
CONSUMOS
ENERGÉTICOS
Andalucia 8.388.875 256.135 8.645.010 7.880.090 1 1.207.766
Cataluña 7.416.237 336.114 7.752.351 15.588.203 2 2.330.958
Madrid 6.378.297 314.623 6.692.920 4.224.986 6 474.400
C. Valenciana 4.956.427 178.299 5.134.726 5.971.523 5 1.347.450
Galicia 2.747.626 10.052 2.757.678 853.225 3 943.453
Castilla y León 2.495.689 82.957 2.578.646 905.942 5 746.083
País Vasco 2.167.166 80.446 2.247.612 1.466.382 5 1.172.001
Canarias 2.114.845 77.113 2.191.958 10.632.679 7 86.953
Castilla la Mancha 2.075.197 57.996 2.133.193 157.015 6 449.439
Murcia 1.461.803 43.770 1.505.573 620.920 6 328.793
Aragón 1.331.301 48.603 1.379.904 259.615 6 512.396
Baleares 1.115.841 49.210 1.165.051 11.111.328 7 29.780
Extremadura 1.096.421 30.471 1.126.892 162.710 7 130.266
Asturias 1.058.975 38.936 1.097.911 232.745 4 561.954
Navarra 636.450 21.886 658.336 228.338 4 407.875
Cantabria 587.682 20.689 608.371 310.699 6 264.684
La Rioja 315.223 11.242 326.465 54.673 7 91.572
En esta tabla, los consumidores no están ponderados, lo que significa que cuenta lo mismo una
fábrica de gran consumo energético que un individuo (persona física). Esto nos puede producir
ciertas anomalías en el estudio que podemos extraer de ella.
Madrid al estar centrada en la península (es decir, por ella pasan todas las redes energéticas)
favorece el ahorro de consumos. En contraste, está el caso de Galicia.
Las CC.AA. más industrializadas ofrecen unas cifras de mayor consumo por razones obvias. (*)
Entonces lo que se extrae en general, es que existe una cierta relación entre el total de los
consumos energéticos y el total de consumidores y su carácter.
El sector turismo también aporta algo aunque no sea población estable.
(*)Puede observarse como sectores altamente planificados afectan a las estadísticas.
INFORME FINAL
Objetivo: Obtener información sobre cuáles son los tipos de comportamientos que
están llevando a cabo las diferentes Comunidades Autónomas.
Datos. Contamos con 17 Comunidades Autónomas y 8 variables: elec – Electricidad gas – Gas gaso – Gasóleo fuel – Fueloil otrp – Otros productos petrolíferos carb – Carbón y coque bioc – Biocombustibles calo – Calor y otros consumos energéticos
Resumen ACP y Análisis Cluster (Grupos y elementos atípicos)
Tenemos en general un estudio y unos datos bastantes peculiares. Hay que tener en cuenta que
estamos ante un sector muy intervenido por su carácter estratégico, que influye directamente
en la economía de los países. Esto queda demostrado con la existencia de un Plan Estratégico
Nacional (PEN) y un organismo central que lo elabora (la Comisión Nacional de la Energía), la
existencia de redes de distribución también de ámbito nacional, con el establecimiento de
impuestos especiales para compensar el coste de los productos, etc. Y así conseguir un precio al
consumidor que sea más o menos uniforme en todas las CC.AA.
Madrid al estar centrada en la península (es decir, por ella pasan todas las redes energéticas)
favorece el ahorro de consumos. En contraste, está el caso de Galicia.
Las CC.AA. más industrializadas ofrecen las cifras de mayor consumo por razones obvias.
Resumiendo, existirá una cierta relación entre el total de los consumos energéticos y el total de
consumidores y su carácter.
ACP
En general, vamos a tener una nube de proyecciones bastante compacta. Pero podemos
destacar algunos elementos como:
- Andalucía y Cataluña: Comunidades Autónomas con un mayor número de consumidores y que
tendrán valores altos de consumo en todas las fuentes energéticas. Algo menos en fueloil, esto
puede ser porque esta fuente de energía se utiliza más como suplente o apoyo energético, en
zonas dónde la redes energéticas no tienen tan fácil acceso.
- Canarias y Baleares, van a estar influidas por su carácter insular. Están situadas a la izquierda
de la gráfica que nos representa las proyecciones para los factores 1 y 2. En general, presentarán
valores bajos de consumos energéticos, pero valores más altos que la media en fueloil.
- Galicia. Si se sitúa un poco a la derecha de la gráfica obtenida, es porque en general tendrá
consumos energéticos altos (tener en cuenta que es la quinta Comunidad con mayor nº
consumidores / población). Se sitúa también muy abajo en la gráfica (valores muy negativos para
el factor 2), lo que nos indica que tiene un consumo de gas relativamente bajo y valores altos de
fuel y biocombustibles.
CLUSTER
Hiciéramos el corte que hiciéramos en el dendograma no iba a ser bueno. Hemos elegido 7
clases, porque salen agrupaciones interesantes (a pesar de que aparecerán clases con un solo
elemento).
Clase 1: Formada por Andalucía. Aunque tuviéramos un número de clases más pequeño, tanto
Andalucía como Cataluña van a tener su propia clase y estar separadas del resto (curiosamente
coinciden con las CC.AA. que tienen mayor número de consumidores).
Clase 2: Formada también por un solo individuo, Cataluña. Comentarios similares a los
expuestos en la clase 1.
Clase 3: Galicia. Como hemos comentado en ACP, era un elemento atípico y que al separar en
estas 7 clases, tiene su propia clase.
Clase 4: Asturias y Navarra. Tienen un bajo número de consumidores, de ahí que puedan tener
características similares (y no destacables).
Clase 5: Castilla y León, el País Vasco y la Comunidad Valenciana tendrán propiedades similares,
sin destacar nada en concreto.
Clase 6: Es la que tiene mayor número de individuos, formada por Castilla-la Mancha, Cantabria,
Madrid, Murcia y Aragón. Cabe mencionar, que si en vez de definir 7 clases, hubiéramos definido
menos, como por ejemplo 5, se habrían juntado ésta y la siguiente clase en una clase con la
mayoría de las Comunidades (una clase con 9 individuos).
Clase 7: Destacable que las islas aparezcan en la misma clase, algo que era de esperar por
cuestiones de difícil acceso de las redes de distribución. Extremadura y la Rioja tendrán también
propiedades similares en cuanto a consumos de energías.