iii - clustering-1...k - means clustering nsebuah algoritma untuk mengelompokkan data, berdasar pada...
TRANSCRIPT
+
PEMODELAN SISTEMNI KETUT DEWI ARI JAYANTI, ST., M.KOM
Murthy, DNP et al; Mathematical Modeling : A Tool For Problem Solving In Engineering, Physical, Biological and Social Sciences”
Togar M. Simatupang, Pemodelan Sistem; Nindita Klaten, 1995. Askin; Analysis and Modelling of Manufacturing Systems”, 1993.
+
CLUSTERING
+ILUSTRASI CLUSTERING
+ILUSTRASI CLUSTERING cont’d
+ILUSTRASI CLUSTERING cont’d
+ILUSTRASI CLUSTERING cont’d
+CLUSTER
+CLUSTERING
+CLASSIFICATION vs CLUSTERING
+CLASSIFICATION
+CLASSIFICATION
+CLUSTERING
+CLUSTERING
+KARAKTERISTIK CLUSTERING
+PARTITIONING CLUSTERING
+HIERARCHICAL CLUSTERING
+OVERLAPPING CLUSTERING
+HYBRID
+ALGORITMA CLUSTERING
+ALGORITMA CLUSTERING
+K - MEANS CLUSTERING
J. Macqueen (1967)
J. A. Hartigan dan M. A. Wong (1975)
Tentukan berapa banyak cluster yang ingin dibentuk ?
Nilai K = jumlah cluster
Ex. K = 5
Tentukan titik pusat cluster (centroid) awal secara acak
Setiap dataset akan menemukan centroid terdekatnya yaitu dengan menghitung jarak setiap data ke masing-masing centroid menggunakan rumus korelasi antar dua objek.
Ex. Euclidean DistanceKesamaan Cosine
Setiap centroid akan menemukan centroid baru.
Centroid berpindah.
Hal ini akan terus berulang sampai terminated.
DONE
+K - MEANS CLUSTERING
n Sebuah algoritma untuk mengelompokkan data, berdasar pada atribut-atribut / feature – feature kedalam K kelompok (group).
n K merupakan bilangan integer positive.
n Pengelompokkan dilakukan dengan meminimalisasi jumlah jarak setiap data ke cluster nya.
+
+
EXAMPLE
+
EUCLIDEAN DISTANCE
+Example
OBJECT DATA Weight Index Ph
Medicine A 1 1
Medicine B 2 1
Medicine C4 3
Medicine D5 4
n K = 2
+
+ Tentukan Centroid
Dinyatakan centroid awal : Medicine A dan Medicine B.
C1 = (1,1) ; C2 = (2,1)
+ Tentukan Jarak Object terhadap Centroid
Euclidean Distance
p1(x1, y1) ; p2(x2, y2)
D = √ (x1 – x2)2 + (y1 – y2)2
A B C D
1 2 4 5 X
1 1 3 4 Y
Ex. : Jarak Medicine B (2,1) terhadap centroid pertama C1 = (1,1)
C1 = (1,1) ; √ (2 – 1)2 + (1 – 1)2 = 1 , jarak terhadap centroid kedua C2 = (2,1)
C2 = (2,1) ; √ (2 – 2)2 + (1 – 1)2 = 0
+ A B C D
0 1 3,61 5 C1
1 0 2,83 4,24 C2
D0 =
A B C D
1 0 0 0 G1
0 1 1 1 G2
1 = True
0 = False
G0 =
+Tentukan centroid baru
èBerdasar pada keanggotaan group (cluster)
G1 memiliki 1 member : medicine A
G2 memiliki 3 member : medicine B, medicine C, medicine D
Centroid baru merupakan rata2 koordinat dari membershipnya
C2 = 2 + 4 + 5 , 1 + 3 + 4 ,3 3
=11 8
33
+
NEXT....
+ 4. Lakukan Clustering dengan algoritma K-Means Clustering dan Eucludian Distance terhadap data berikut .
Dimana nilai K = 2 dan centroid awal Person #3 (35, 65) Person #7 (34, 48)
OBJECT DATA Age Weight
Person #1 25 50
Person #2 26 48
Person #3 35 65
Person #4 67 60
Person #5 55 65
Person #6 53 60
Person #7 34 48
Person #8 48 50