pert 9-analisis cluster

ANALISIS GEROMBOL

(Cluster Analysis)

Novi Hidayat P

CLUSTER ANALYSIS Cluster Analysis adalah suatu teknik analisis multivariate metode interdependen,

dengan tujuan meringkas data dengan penggerombolan obyek (responden)

sehingga terbentuk beberapa kelompok, disebut cluster. Obyek di dalam suatu

cluster lebih mirip dibandingkan antar cluster. Kemiripan ini sudah didasarkan

pada sekumpulan variabel secara simultan.

KEGUNAAN

identifikasi banyaknya cluster dari sekumpulan obyek identifikasi karakteristik setiap cluster prediksi jumlah anggota masing-masing subpopulasi berdasarkan perhitungan anggota setiap cluster yang diperoleh dari data sampel

BASIS KLASTERING DAN INPUT

Pengelompokka dibuat berbasis pada kesamaan (similiarities) atau jaraknya (disimiliarities)

Input yang diperlukan berupa ukuran kesamaan atau data dimana kesamaan dapat dihitung

CLUSTER ANALYSIS Analisis Cluster dalam beberapa bidang keilmuan

Dalam analisis Pemasaran, Cluster analysis dapat digunakan untuk (a) mengetahui

segmentasi dan menentukan target pasar yang dituju; (b) mengetahui positioning produk

dan menentukan pengembangan produk baru; (c) Memilih pasar yang akan dipilih untuk

produk baru perusahaan.

Dalam analisis penelitian pendidikan, data untuk clustering dapat berupa data siswa,

orang tua, jenis kelamin atau nilai ujian. Clustering merupakan metode penting untuk

memahami dan utilitas dari cluster dalam penelitian pendidikan, msialnya untuk

pengelompokkan siswa ataupun sekolah.

CLUSTER ANALYSIS Ukuran ketakmiripan

Ukuran jarak yang sering digunakan adalah jarak euclidean (d) dengan

mengukur proximity pada ruang dua dimensi sehingga jarak antara dua

observasi menunjukkan kesamaan. Secara Umum Jarak euclid antara 2

amatan dengan p variabel dinyatakan sebagai

p

k

kjki XXdij1

2)(

Ukuran Mikowski dan Mahalanobis m

p

k

m

jkik XXdij

/1

1

)(

jt

j Sdij XXXX ii 1

CLUSTER ANALYSIS Ukuran kemiripan

Sifat-sfat ukuran ketakmiripan:

d(uv) 0

d(uu)= 0

d(uv)= d(vu)

d(uv) akan meningkat nilainya dengan semakin tak miripnya gerombol u dan v

Nilai jarak tersebut akan disajikan dalam matriks jarak yang disebut dengan

matriks proksimitas/proximity

(2) Asumsi Analisis Gerombol

Data antar pengamatan (case) independen

Sampel diambil secara random

Antar variabel tdak saling bebas (berkorelasi)

Data untuk seluruh variabel minimal memiliki skala interval

(terutama bila ukuran kemiripan yang digunakan adalah jarak)

CLUSTER ANALYSIS

Metode analisis :

1) Hirarki (berjenjang) :

- Terstruktur

- Dapat ditelusuri penggerombolan suatu objek dengan objek lainnya

- Stabil

- Banyak kelompok belum diketahui

- Output berupa dendogram

- pemotongan : jarak lompatan terjauh

2) Tidak Berhirarki :

- Tidak terstruktur

- Banyak kelompok ditentukan terlebih dahulu (diketahui)

- Menggunakan Iterasi

- Kurang Stabil

- Output : anggota kelompok dan centroid

CLUSTER ANALYSIS Metode yang sering digunakan untuk pengelompokan obyek pada

Hierarchical clustering adalah

Metode penggumpalan (agglomeratif)

Setiap obyek dianggap sebagai suatu gerombol/cluster,

kemudian dikelompokkan dengan obyek yang memeiliki jarak

terdekat

Metode pembagian (divisive)

Bekerja dengan membagi 2 berdasarkan jumlah objek,

dipisahkan dengan dicari obyek yang mempunyai jarak terjauh

CLUSTER ANALYSIS Hirarki (berjenjang)

Metode yang sering digunakan untuk pengelompokan obyek pada

Hierarchical clustering adalah metode penggumpalan

(agglomeratif)

Terdapat 7 metode pengelompokkan

Agglomerative yang sering

dipergunakan untuk perhitungan jarak

antar cluster dengan obyek atau

dengan cluster lain di dalam

penggerombolan berjenjang, yaitu

single lingkage (pautan tunggal),

complete linkage (pautan lengkap,

avarage linkage (pautan rata-rata),

centroid, median, minimum variance,

ward


Untuk teknik pengelompokkan dengan metode Divisive ada 2

metode yang sering digunakan yaitu :

A splinter- Average Distance Method

Automatic Interaction Detection


Output : berupa dendogram

Z

K


Latihan:

Diketahui data variabel pendidikan dan pendapatan untuk 6 amatan

adalah sebagai berikut:

Nilai Pendapatan: 5,6,15,16,25,30

Nilai Pendidikan: 5,6,14,15,20,19

Dengan menggunakan metode Pautan tunggal

CLUSTER ANALYSIS Hasil

Pendapatan Pendidikan Kelompok

5 5 1

6 6 1

15 14 2

16 15 2

25 20 2

30 19 2

CLUSTER ANALYSIS APLIKASI

Suatu penelitian dilakukan dengan cara survey, bertujuan ingin

mengetahui peta karakteristik anak jalanan. Bilamana mapping ini

dapat dilakukan, diharapkan dapat dikembangkan model pembinaan

yang efektif.

Variabel yang diamati adalah pendidikan, alasan dan keinginan

selengkapnya dapat dilihat pada Materi Bahasan Analisis Faktor.

Analisis dilakukan dengan program SPSS

Data ini akan digunakan untuk membuat pemetaan karakteristik anak

jalanan dengan analisis cluster.

Dat Pendididkan Alasan Menjadi Anak Jalanan dan

Keinginan Anak Jalanan

CLUSTER ANALYSIS HASIL ANALISIS

Koefisien agglomerasi menghasilkan lompatan (selisih) terbesar dari

stage 98 ke 99, yaitu dari 8.814 ke 12.466. Dengan demikian dapAt

diketahui bahwa dari 100 anak jalanan tersebut membentuk 2 cluster.


Penempatan setiap obyek (case) ke dalam cluster dapat dilihat pada

tabel di bawah ini.


Anak jalanan yang berjumlah 100 orang membentuk dua cluster

dan untuk melakukan identifikasi karakteristik setiap cluster

dilakukan analisis diskriptif.

Karakteristik cluster 1 adalah pendidikan orang tua cukup tinggi akan tetapi

pendidikan anak tidak terurus, mereka menjadi anak jalanan bukan karena

keadaan (ekonomi) dan sebenarnya mereka tidak ingin menjadi anak jalanan.

Tampaknya anak jalanan di dalam kelompok ini lebih disebabkan karena

sangat kurangnya perhatian orang tua.


Karakteristik cluster 2 adalah pendidikan orang tua rendah, untuk

bisa bertahan hidup mereka harus menjadi anak jalanan sehingga

ada keinginan yang tinggi untuk menjadi anak jalanan. Pada

cluster ini, tampaknya mereka menjadi anak jalanan

dilatarbelakangi kondisi ekonomi keluarga.

Pembinaan anak jalanan pada cluster 1 seharusnya berbeda

dengan pada cluster 2. Dengan kata lain, dari hasil pemetaan

(mapping) ini selanjutnya dapat dirancang model dan program

pembinaan anak jalanan yang efektif.

CLUSTER ANALYSIS Tidak Hirarki (tidak berjenjang)

Pada analisis gerombol tidak berjenjang jumlah cluster harus

ditetapkan terlebih dahulu sebelum kita melakukan analisis data.

Dengan kata lain, non hierarchical clustering digunakan bilamana

jumlah gerombol dapat ditentukan sebelum analisis dilakukan.

Penentuan jumlah cluster dapat didasarkan pada rurjukan teoritis,

kondisional, common sense, dan atau tujuan penelitian.

Metode yang banyak digunakan adalah Metode K-rataan (K -

mean Method).

CLUSTER ANALYSIS APLIKASI

Suatu penelitian dilakukan dengan tujuan untuk mengetahui karakteristik

karyawan. Bilamana terdapat beberapa kelompok karaktersitik, maka pada

setiap kelompok ingin diketahui faktor apa yang dominan berpengaruh

terhadap kinerjanya (perform). Variabel yang diamati adalah loyalitas,

motivasi, kepuasan dan kinerja.

Pengembangan model dan program pembinaan karyawan guna

meningkatkan kinerjanya ditetapkan hanya 2 macam. Oleh karena itu,

karyawan akan dikelompokkan menjadi 2, selanjutnya akan diidentifikasi

karakteristik dari dari setiap kelompok. Informasi ini akan digunakan

sebagai bahan pengembangan model dan program pembinaan karyawan.

Mengingat jumlah cluster (kelompok) sudah ditetapkan terlebih

dahulu, maka analisis untuk penggerombolan yang paling tepat

adalah analisis gerombol tidak berjenjang. Hasil analisis data,

menggunakan SPSS, disajikan sebagai berikut.


Kelompok (cluster) 1 beranggotakan

49 orang karyawan, dengan center

(mean) untuk semua variabel positif.

Dengan demikian, pada kelompok ini

upaya pembinaan diarahkan untuk

lebih meningkatkan kinerja.


Kelompok 2 beranggotakan 46 orang karyawan, dengan center

semuanya negatif. Sehingga pada kelompok ini diperlukan upaya

pembinaan yang tujuannya adalah perbaikan berbagai aspek perilaku

karyawan.

Kemudian pada kelompok 2 ini akan diidentifikasi faktor apa yang dominan

berpengaruh terhadap kinerja (perform)

CLUSTER ANALYSIS UKURAN EVALUASI KLUSTER

1. Root Mean Square Standart Deviation (RMSSTD)

Tidak ada kriteria khusus, untuk pengelompokkan yang baik niali tsb harus kecil

2. R-Square (RS)

RS bernilai antara 0 dan 1, semakin esar nilai RS seamkin baik pengelompokkan yang

dilakukan

*Dengan nilai SS diperoleh dari tabel One-way ANOVA niali amatan yang sudah dikelompokkan*

variabelsemua df pooled

variabelsemua SS pooledRMSSTD

SStotal

SSbetweenRS

CLUSTER ANALYSIS

7377,083,2028,498

3,1763,341

RS

TERIMA KASIH

pert 9-analisis cluster

Documents

analisis cluster - statistika terapan | teori dan … ·...

pembahasan analisis cluster hirarki

analisis dan peramalan keuangan pert.05-06

garcia - analisis cluster

analisis penerapan sistem penjadwalan dengan metode pert …

penerapan analisis cluster dengan software

pert-7 analisis biaya finansial

analisis pemberian limbah pert anian abu...

analisis pemberian limbah pert anian abu sekam …

analisis cluster terhadap spektra inframerah fenol

analisis cluster dengan metode k-means pada …

analisis cluster pada dokumen teks

analisis cluster.7

analisis social cluster pada bank-bank komersial

analisis cluster spss

pert 11 analisis hirarki i

ii analisis network dengan metode pert dalam proses produksi...

unidad ii. analisis cluster

analisis cluster metode k-means (rizka f_1311100126)

analisis network dengan metode pert dalam proses produksi...