análisis de cluster k-means algoritmos de clasifiaciÓn ... · análisis de cluster k-means...

10
Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN Técnicas jerárquicas (pasos sucesivos): Procedimientos ascendentes o aglomerativos Descendentes o divisivos Técnicas no jerárquicas o de partición (determinar el número de grupos): Procedimiento K- Means Combinación de medidas de distancia y/o semejanza con algoritmos de clasificación: los más utilizados son el “del vecino más próximo” o “promedio entre grupos” con la “distancia euclidea al cuadrado”

Upload: others

Post on 08-Sep-2019

11 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN ... · Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN Técnicas jerárquicas (pasos sucesivos): Procedimientos ascendentes

Análisis de Cluster K-means

ALGORITMOS DE CLASIFIACIÓN

� Técnicas jerárquicas (pasos sucesivos): � Procedimientos ascendentes o aglomerativos� Descendentes o divisivos

� Técnicas no jerárquicas o de partición (determinar elnúmero de grupos): � Procedimiento K- Means

� Combinación de medidas de distancia y/o semejanza con algoritmosde clasificación: los más utilizados son el “del vecino más próximo”o “promedio entre grupos” con la “distancia euclidea al cuadrado”

Page 2: Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN ... · Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN Técnicas jerárquicas (pasos sucesivos): Procedimientos ascendentes

Ejemplo

Aplicación del análisis de cluster a una encuesta de actitudes políticasObjetivo: Conocer la composición interna del electorado de un partido político, el peso de las diferentes tendencias dentro del partido. Los resultados analizados corresponden a una encuesta sobre actitud política, a partir de los que se quiere saber la estructura de ese electorado potencial de derecha: componente de centro, derecha tradicional y católica, derecha liberal...

Page 3: Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN ... · Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN Técnicas jerárquicas (pasos sucesivos): Procedimientos ascendentes

Procedimiento: Técnica no Jerárquica o dePartición, K-MEANS

Definir previamente un número de gruposTipificar las variables y Análisis de Componentes Principales si fuera necesario

Análisis de resultadosDistancia de los componentes de cada grupo a su centroide

Distancia de los componentes de otros grupos al centroide del grupo 1

Page 4: Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN ... · Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN Técnicas jerárquicas (pasos sucesivos): Procedimientos ascendentes

Esta tabla recoge la distancia de cada elemento del grupoa su centroide de modo que puede observarse si por término medio esta es grandeo pequeña, indicando unamayor o menor cohesión del grupo. Todo ello también puederepresentarse gráficamente dela partir del siguiente gráfico:

Page 5: Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN ... · Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN Técnicas jerárquicas (pasos sucesivos): Procedimientos ascendentes
Page 6: Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN ... · Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN Técnicas jerárquicas (pasos sucesivos): Procedimientos ascendentes

La visión conjunta de las distribucionesde frecuencia permite ver la nitidez y fuerza de la tendencia del cluster 1. Vemos que la mayor parte de los Componentes del grupo 1 se solapancon los componentes de otros grupos, loque indica la inconsistencia del grupo 1, ya que hay elementos de otros grupos más cercanos al centroide del cluster 1,que muchos de los componentes de este grupo, aun estando más cercanos a los centroides de sus respectivos grupos.También pude observarse gráficamentequé grupo es el más distante del 1, en este caso el nº 5

Page 7: Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN ... · Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN Técnicas jerárquicas (pasos sucesivos): Procedimientos ascendentes
Page 8: Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN ... · Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN Técnicas jerárquicas (pasos sucesivos): Procedimientos ascendentes

Es importante observar elcomportamiento de las Variables en cada cluster para descubrir la tendencia que se esconde en él. Las variables representativas en cada grupo serán aquellas que presenten un rango devariación pequeño y con valores cercanos a la media (con valores altos),y una desviación típica también pequeña

Page 9: Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN ... · Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN Técnicas jerárquicas (pasos sucesivos): Procedimientos ascendentes

En este caso puede observarse que las variables más importantes para darsentido a este grupo, son las relativas a la cercaníaa los líderes y a los partidos

Page 10: Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN ... · Análisis de Cluster K-means ALGORITMOS DE CLASIFIACIÓN Técnicas jerárquicas (pasos sucesivos): Procedimientos ascendentes

Análisis de Cluster

Esta matriz nos informa de la distancia entre los centroides de los Grupos. Si estos están demasiadoPróximos difícilmente podemos hablarde tendencias naturales dentro del electorado.

El ANÁLISIS DE VARIANZA nos Informa sobre que variables son las que más discriminan a los grupos, es decir que más homogéneos son los grupos respecto a ellas y más diferentes entre sí; más claras las diferentes tendencias