pert 9-analisis cluster
Post on 10-Oct-2015
40 Views
Preview:
DESCRIPTION
TRANSCRIPT
-
ANALISIS GEROMBOL
(Cluster Analysis)
Novi Hidayat P
-
CLUSTER ANALYSIS Cluster Analysis adalah suatu teknik analisis multivariate metode interdependen,
dengan tujuan meringkas data dengan penggerombolan obyek (responden)
sehingga terbentuk beberapa kelompok, disebut cluster. Obyek di dalam suatu
cluster lebih mirip dibandingkan antar cluster. Kemiripan ini sudah didasarkan
pada sekumpulan variabel secara simultan.
KEGUNAAN
identifikasi banyaknya cluster dari sekumpulan obyek identifikasi karakteristik setiap cluster prediksi jumlah anggota masing-masing subpopulasi berdasarkan perhitungan anggota setiap cluster yang diperoleh dari data sampel
BASIS KLASTERING DAN INPUT
Pengelompokka dibuat berbasis pada kesamaan (similiarities) atau jaraknya (disimiliarities)
Input yang diperlukan berupa ukuran kesamaan atau data dimana kesamaan dapat dihitung
-
CLUSTER ANALYSIS Analisis Cluster dalam beberapa bidang keilmuan
Dalam analisis Pemasaran, Cluster analysis dapat digunakan untuk (a) mengetahui
segmentasi dan menentukan target pasar yang dituju; (b) mengetahui positioning produk
dan menentukan pengembangan produk baru; (c) Memilih pasar yang akan dipilih untuk
produk baru perusahaan.
Dalam analisis penelitian pendidikan, data untuk clustering dapat berupa data siswa,
orang tua, jenis kelamin atau nilai ujian. Clustering merupakan metode penting untuk
memahami dan utilitas dari cluster dalam penelitian pendidikan, msialnya untuk
pengelompokkan siswa ataupun sekolah.
-
CLUSTER ANALYSIS Ukuran ketakmiripan
Ukuran jarak yang sering digunakan adalah jarak euclidean (d) dengan
mengukur proximity pada ruang dua dimensi sehingga jarak antara dua
observasi menunjukkan kesamaan. Secara Umum Jarak euclid antara 2
amatan dengan p variabel dinyatakan sebagai
p
k
kjki XXdij1
2)(
Ukuran Mikowski dan Mahalanobis m
p
k
m
jkik XXdij
/1
1
)(
jt
j Sdij XXXX ii 1
-
CLUSTER ANALYSIS Ukuran kemiripan
Sifat-sfat ukuran ketakmiripan:
d(uv) 0
d(uu)= 0
d(uv)= d(vu)
d(uv) akan meningkat nilainya dengan semakin tak miripnya gerombol u dan v
Nilai jarak tersebut akan disajikan dalam matriks jarak yang disebut dengan
matriks proksimitas/proximity
(2) Asumsi Analisis Gerombol
Data antar pengamatan (case) independen
Sampel diambil secara random
Antar variabel tdak saling bebas (berkorelasi)
Data untuk seluruh variabel minimal memiliki skala interval
(terutama bila ukuran kemiripan yang digunakan adalah jarak)
-
CLUSTER ANALYSIS
Metode analisis :
1) Hirarki (berjenjang) :
- Terstruktur
- Dapat ditelusuri penggerombolan suatu objek dengan objek lainnya
- Stabil
- Banyak kelompok belum diketahui
- Output berupa dendogram
- pemotongan : jarak lompatan terjauh
2) Tidak Berhirarki :
- Tidak terstruktur
- Banyak kelompok ditentukan terlebih dahulu (diketahui)
- Menggunakan Iterasi
- Kurang Stabil
- Output : anggota kelompok dan centroid
-
CLUSTER ANALYSIS Metode yang sering digunakan untuk pengelompokan obyek pada
Hierarchical clustering adalah
Metode penggumpalan (agglomeratif)
Setiap obyek dianggap sebagai suatu gerombol/cluster,
kemudian dikelompokkan dengan obyek yang memeiliki jarak
terdekat
Metode pembagian (divisive)
Bekerja dengan membagi 2 berdasarkan jumlah objek,
dipisahkan dengan dicari obyek yang mempunyai jarak terjauh
-
CLUSTER ANALYSIS Hirarki (berjenjang)
Metode yang sering digunakan untuk pengelompokan obyek pada
Hierarchical clustering adalah metode penggumpalan
(agglomeratif)
Terdapat 7 metode pengelompokkan
Agglomerative yang sering
dipergunakan untuk perhitungan jarak
antar cluster dengan obyek atau
dengan cluster lain di dalam
penggerombolan berjenjang, yaitu
single lingkage (pautan tunggal),
complete linkage (pautan lengkap,
avarage linkage (pautan rata-rata),
centroid, median, minimum variance,
ward
-
CLUSTER ANALYSIS Hirarki (berjenjang)
Untuk teknik pengelompokkan dengan metode Divisive ada 2
metode yang sering digunakan yaitu :
A splinter- Average Distance Method
Automatic Interaction Detection
-
CLUSTER ANALYSIS Hirarki (berjenjang)
Output : berupa dendogram
Z
K
-
CLUSTER ANALYSIS Hirarki (berjenjang)
Latihan:
Diketahui data variabel pendidikan dan pendapatan untuk 6 amatan
adalah sebagai berikut:
Nilai Pendapatan: 5,6,15,16,25,30
Nilai Pendidikan: 5,6,14,15,20,19
Dengan menggunakan metode Pautan tunggal
-
CLUSTER ANALYSIS Hasil
Pendapatan Pendidikan Kelompok
5 5 1
6 6 1
15 14 2
16 15 2
25 20 2
30 19 2
-
CLUSTER ANALYSIS APLIKASI
Suatu penelitian dilakukan dengan cara survey, bertujuan ingin
mengetahui peta karakteristik anak jalanan. Bilamana mapping ini
dapat dilakukan, diharapkan dapat dikembangkan model pembinaan
yang efektif.
Variabel yang diamati adalah pendidikan, alasan dan keinginan
selengkapnya dapat dilihat pada Materi Bahasan Analisis Faktor.
Analisis dilakukan dengan program SPSS
-
Data ini akan digunakan untuk membuat pemetaan karakteristik anak
jalanan dengan analisis cluster.
Dat Pendididkan Alasan Menjadi Anak Jalanan dan
Keinginan Anak Jalanan
-
CLUSTER ANALYSIS HASIL ANALISIS
Koefisien agglomerasi menghasilkan lompatan (selisih) terbesar dari
stage 98 ke 99, yaitu dari 8.814 ke 12.466. Dengan demikian dapAt
diketahui bahwa dari 100 anak jalanan tersebut membentuk 2 cluster.
-
CLUSTER ANALYSIS HASIL ANALISIS
Penempatan setiap obyek (case) ke dalam cluster dapat dilihat pada
tabel di bawah ini.
-
CLUSTER ANALYSIS HASIL ANALISIS
Anak jalanan yang berjumlah 100 orang membentuk dua cluster
dan untuk melakukan identifikasi karakteristik setiap cluster
dilakukan analisis diskriptif.
Karakteristik cluster 1 adalah pendidikan orang tua cukup tinggi akan tetapi
pendidikan anak tidak terurus, mereka menjadi anak jalanan bukan karena
keadaan (ekonomi) dan sebenarnya mereka tidak ingin menjadi anak jalanan.
Tampaknya anak jalanan di dalam kelompok ini lebih disebabkan karena
sangat kurangnya perhatian orang tua.
-
CLUSTER ANALYSIS HASIL ANALISIS
Karakteristik cluster 2 adalah pendidikan orang tua rendah, untuk
bisa bertahan hidup mereka harus menjadi anak jalanan sehingga
ada keinginan yang tinggi untuk menjadi anak jalanan. Pada
cluster ini, tampaknya mereka menjadi anak jalanan
dilatarbelakangi kondisi ekonomi keluarga.
Pembinaan anak jalanan pada cluster 1 seharusnya berbeda
dengan pada cluster 2. Dengan kata lain, dari hasil pemetaan
(mapping) ini selanjutnya dapat dirancang model dan program
pembinaan anak jalanan yang efektif.
-
CLUSTER ANALYSIS Tidak Hirarki (tidak berjenjang)
Pada analisis gerombol tidak berjenjang jumlah cluster harus
ditetapkan terlebih dahulu sebelum kita melakukan analisis data.
Dengan kata lain, non hierarchical clustering digunakan bilamana
jumlah gerombol dapat ditentukan sebelum analisis dilakukan.
Penentuan jumlah cluster dapat didasarkan pada rurjukan teoritis,
kondisional, common sense, dan atau tujuan penelitian.
Metode yang banyak digunakan adalah Metode K-rataan (K -
mean Method).
-
CLUSTER ANALYSIS APLIKASI
Suatu penelitian dilakukan dengan tujuan untuk mengetahui karakteristik
karyawan. Bilamana terdapat beberapa kelompok karaktersitik, maka pada
setiap kelompok ingin diketahui faktor apa yang dominan berpengaruh
terhadap kinerjanya (perform). Variabel yang diamati adalah loyalitas,
motivasi, kepuasan dan kinerja.
Pengembangan model dan program pembinaan karyawan guna
meningkatkan kinerjanya ditetapkan hanya 2 macam. Oleh karena itu,
karyawan akan dikelompokkan menjadi 2, selanjutnya akan diidentifikasi
karakteristik dari dari setiap kelompok. Informasi ini akan digunakan
sebagai bahan pengembangan model dan program pembinaan karyawan.
Mengingat jumlah cluster (kelompok) sudah ditetapkan terlebih
dahulu, maka analisis untuk penggerombolan yang paling tepat
adalah analisis gerombol tidak berjenjang. Hasil analisis data,
menggunakan SPSS, disajikan sebagai berikut.
-
CLUSTER ANALYSIS HASIL ANALISIS
Kelompok (cluster) 1 beranggotakan
49 orang karyawan, dengan center
(mean) untuk semua variabel positif.
Dengan demikian, pada kelompok ini
upaya pembinaan diarahkan untuk
lebih meningkatkan kinerja.
-
CLUSTER ANALYSIS HASIL ANALISIS
Kelompok 2 beranggotakan 46 orang karyawan, dengan center
semuanya negatif. Sehingga pada kelompok ini diperlukan upaya
pembinaan yang tujuannya adalah perbaikan berbagai aspek perilaku
karyawan.
Kemudian pada kelompok 2 ini akan diidentifikasi faktor apa yang dominan
berpengaruh terhadap kinerja (perform)
-
CLUSTER ANALYSIS UKURAN EVALUASI KLUSTER
1. Root Mean Square Standart Deviation (RMSSTD)
Tidak ada kriteria khusus, untuk pengelompokkan yang baik niali tsb harus kecil
2. R-Square (RS)
RS bernilai antara 0 dan 1, semakin esar nilai RS seamkin baik pengelompokkan yang
dilakukan
*Dengan nilai SS diperoleh dari tabel One-way ANOVA niali amatan yang sudah dikelompokkan*
variabelsemua df pooled
variabelsemua SS pooledRMSSTD
SStotal
SSbetweenRS
-
CLUSTER ANALYSIS
7377,083,2028,498
3,1763,341
RS
-
TERIMA KASIH
top related