el proceso de agrupamiento k

ASIGNATURA:

Aprendizaje

PROYECTO FINAL

“Aplicación en datos de sismos a nivel nacional”

Introducción.-Un terremoto (del latín: terra «tierra» y motus «movimiento»), también llamado seísmo o sismo (del griego σεισμός: «temblor» o «temblorde tierra») es un fenómeno de sacudida brusca y pasajera de la corteza terrestre producido por la liberación de energía acumulada en formade ondas sísmicas. Los más comunes se producen por la ruptura de fallas geológicas. También pueden ocurrir por otras causas como, porejemplo, fricción en el borde de placas tectónicas, procesos volcánicos o incluso ser producidos por el hombre al realizar pruebas dedetonaciones nucleares subterráneas.El punto de origen de un terremoto se denomina hipocentro. El epicentro es el punto de la superficie terrestre directamente sobre elhipocentro. Dependiendo de su intensidad y origen, un terremoto puede causar desplazamientos de la corteza terrestre, corrimientos detierras, tsunamis o actividad volcánica. Para la medición de la energía liberada por un terremoto se emplean diversas escalas entre las quela escala de Richter es la más conocida y utilizada en los medios de comunicación.K -means es un método de agrupamiento, que tiene como objetivo la [partición [de un conjunto]] n observaciones en k grupos en el que cadaobservación pertenece al grupo más cercano a la media. Es un método utilizado en mineria de datos.La agrupación del conjunto de datos puede ilustrarse en una partición del espacio de datos en celdas de Voronoi.El problema es computacionalmente difícil (NP-hard). Sin embargo, hay eficientes heurísticas que se emplean comúnmente y convergenrápidamente a un óptimo local. Estos suelen ser similares a los algoritmos expectation-maximization de mezclas de distribucionesgausianas por medio de un enfoque de refinamiento iterativo empleado por ambos algoritmos. Además, los dos algoritmos usan los centrosque los grupos utilizan para modelar los datos, sin embargo k-means tiende a encontrar grupos de extensión espacial comparable, mientrasque el mecanismo expectation-maximization permite que los grupos que tengan formas diferentes.DescripciónDado un conjunto de observaciones (x1, x2, …, xn), donde cada observación es un vector real de d dimensiones, k-means construye unapartición de las observaciones en kconjuntos (k = n) S = {S1, S2, …, Sk}a fin de minimizar la suma de los cuadrados dentro de cada grupo (WCSS):

donde µi es la media de puntos en Si.Desarrollo:-

El proceso de agrupamiento k-medias es simple, Inicialmente se determina el número de grupos K y se asume el centroide o centro de esosgrupos. Para determinar los centroides hay dos alternativas practicas: la primera es tomar de forma aleatoria K objetos como centroidesiniciales y la segunda es tomar los primeros K objetos en secuencia.Luego el algoritmo ejecuta los siguientes tres pasos hasta que alcance el criterio de convergencia, es decir que los objetos no se muevan degrupo.1.-Se determina el o los centroides iniciales de acuerdo al número de cluster esperado.

2.-Se determina la distancia de cada objeto con relación a los centroides.

3.-Se agrupan los objetos con base en la distancia mínima.Los puntos capturados.

En el ejemplo se realizaron las siguientes iteraciones.

Paso 1.-los centroides elegidos son:Iteración K=1Z1(1) = X1 (1,3.3)Z2(1) = X18 (10,6.4)Datos de la primer iteración.

Paso 2.-Calculando las distancias de cada punto a cada una de las clases existentes.

w1(1)={x1,x2,x3,x4,..x9} N1= 9w1(1)={x10,x11,x12,x13,..x20} N1= 11grafica obtenida.-

Tercera iteración.-

Cuarta iteración.-

x=(3.1) x(8.4)(3.8) (3.9)como no son los mismosAgrupando los terminos tenemos quew1(1)={x1,x2,x3,x4,..x9,x10,x11} N1= 11w1(1)={x12,x13,..x20} N1= 9como:Z1(3)=z1(4) yz2(3)=z2(4)se encuentra la estabilidad en el algoritmoFIN

Aplicaciones:

Agrupamiento k-means cuando se usan heurísticas como el algoritmo de Lloyd es fácil de implementarincluso para largos conjuntos de datos. Por lo que ha sido ampliamente usado en muchas áreascomo segmentación de mercados, visión por computadoras, geoestadística, and astronomy to [[Data Miningin Agriculture| agriculture]]. También se usa como preprocesamiento para otros algoritmos, por ejemplopara buscar una configuración inicial.

Referencias.-http://profesores.fi-b.unam.mx/ana/APUNTES_RP/Capitulo3.pdfhttp://www2.ssn.unam.mx:8080/website/jsp/Cuaderno1/ch3.html#DETERMINACIONhttp://people.revoledu.com/kardi/tutorial/kMean/EjemploNumerico.htmhttp://es.wikipedia.org/wiki/K-means

http://www2.ssn.unam.mx:8080/website/jsp/Cuaderno1/ch3.html

http://people.revoledu.com/kardi/tutorial/kMean/EjemploNumerico.htm

el proceso de agrupamiento k

Documents