salmiati_analisis gerombol pd pengklasifikasian provinsi di indonesia bedasarkan indikator kesehatan
TRANSCRIPT
PENERAPAN ANALISIS KOMPONEN UTAMA DAN ANALISIS GEROMBOL PADA PENGKLASIFIKASIAN
PROVINSI DI INDONESIA BERDASARKAN INDIKATOR KESEHATAN
SKRIPSI
SALMIATI
JURUSAN MATEMATIKA DAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI PAPUA
MANOKWARI 2010
PENERAPAN ANALISIS KOMPONEN UTAMA DAN ANALISIS GEROMBOL PADA PENGKLASIFIKASIAN
PROVINSI DI INDONESIA BERDASARKAN INDIKATOR KESEHATAN
SALMIATI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains dari Universitas Negeri Papua
JURUSAN MATEMATIKA DAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI PAPUA MANOKWARI
2010
ABSTRAK
SALMIATI. 2010. Penerapan Analisis Komponen Utama Dan Analisis Gerombol Pada Pengklasifikasian Provinsi Di Indonesia Berdasarkan Indikator Kesehatan Masyarakat Tahun 2009. Dibimbing oleh Ir. Benidiktus Tanujaya, M. Si dan Nurhaida, M. Sc.
Tujuan penelitian ini adalah untuk mengelompokkan provinsi di Indonesia berdasarkan variabel kesehatan. Penelitian menggunakan menggunakan analisis komponen utama dan analisis gerombol. Hasil analisis gerombol melalui analisis komponen utama, jika pemotongan dendogram jarak Euclidean dari 3.00 sampai 5.04, dan pada analisis gerombol tanpa analisis komponen utama, jika pemotongan dendogram jarak Euclidean dari 5.42 sampai 9.35, maka kelompok provinsi-provinsi indikator sama yaitu pada jumlah gerombol 2, 3, dan 4. Pada Analisis gerombol melalui analisis komponen utama, jika pemotongan dendogram jarak Euclidean kurang dari 1.80, dan analisis gerombol tanpa analisis komponen utama, jika pemotongan jarak Euclidean kurang dari 4.47, maka provinsi-provinsi yang relatif berbeda yaitu pada jumlah gerombol 5. Dengan menggunakan analisis komponen utama, dari 33 provinsi dan 13 variabel, maka terbentuk tiga komponen. Besarnya persentase kumulatif keragaman yang mampu diterangkan oleh ketiga faktor dari total keragaman adalah 81,59 persen.
RIWAYAT HIDUP
Penulis dilahirkan pada tanggal 16 April 1985 di Nabire sebagai putri
sulung dari enam bersaudara, dari Ayah bernama Sadeng dan Ibu bernama
Masaria. Pada tahun1990 penulis memulai pendidikan formal di Sekolah Dasar
dan Tamat pada tahun 1996. Pada tahun yang sama penulis melanjutkan
pendidikan di Sekolah Lanjutan Tingkat Pertama Negeri I Nabire dan tamat pada
tahun 1999. Pada tahun yang sama penulis melanjutkan pendidikan di Sekolah
Menengah Umum Negeri I Nabire dan tamat pada tahun 2002. Kemudian pada
tahun yang sama melalui jalur SLSB penulis diterima di Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Cenderawasih,
dimana penulis tercatat sebagai mahasiswa sampai dengan tahun 2004.
Setelah melalui beberapa saat terminal akademis penulis kembali aktif dan
terdaftar tahun 2005 sebagai mahasiswa dengan status transfer pada Jurusan
Matematika dan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Negeri Papua.
Pada tahun 2007 penulis melaksanakan PKL di Kantor Badan Pusat Statistik
Kabupaten Manokwari dan SMA Negeri 1 Manokwari. Selain itu penulis juga
aktif dalam berbagai organisasi intern kampus diantaranya Himpunan Mahasiswa
Matematika dan Statistika dan Unit Kegiatan Mahasiswa Forum Komunikasi
Mahasiswa Islam (UKM FKMI) UNIPA.
DAFTAR ISI Halaman DAFTAR ISI .............................................................................................. i
DAFTAR GAMBAR ................................................................................. iii
DAFTAR TABEL ..................................................................................... iv
DAFTAR LAMPIRAN ............................................................................. v
DAFTAR SIMBOL ................................................................................... vi
I PENDAHULUAN ............................................................................ 1 1.1 Latar Belakang ......................................................................... 1 1.2 Rumusan Masalah .................................................................... 3 1.3 Tujuan Penelitian ..................................................................... 3 1.4 Manfaat Penelitian ................................................................... 3
II LANDASAN TEORI ....................................................................... 4 2.1 Aljabar Matriks dan Vektor Acak .......................................... 4 2.2 Statistika Deskriptif Data Multivariat ...................................... 8 2.3 Analisis Komponen Utama ...................................................... 10 2.4 Analisis Gerombol ................................................................... 19
III METODOLOGI PENELITIAN ..................................................... 25 3.1 Sumber Data ............................................................................. 25 3.2 Variabel .................................................................................... 25 3.3 Metode Analisis ....................................................................... 26
IV HASIL DAN PEMBAHASAN 4.1 Hasil Penelitian ........................................................................ 29 4.1.1 Deskripsi variabel kesehatan .......................................... 29 4.1.2 Analisis Komponen Utama ............................................. 30 1. Transformasi ............................................................... 30 2. Matriks Korelasi ......................................................... 30 3. Vektor Ciri dan akar ciri dari Matrik Korelasi ........... 30 4. matriks Loading Komponen ....................................... 32 4.1.3 Analisis Gerombol .......................................................... 34 1. Pengelompokkan Setelah Analisis Komponen Utama 35 2. Pengelompokkan Tanpa Analisis Komponen Utama . 36 4.2 Pembahasan .............................................................................. 37 4.2.1 Persamaan Gerombol Yang Terbentuk ........................... 37 4.2.2 Perbedaan Gerombol Yang Terbentuk ............................ 38
V PENUTUP 5.1 Kesimpulan .............................................................................. 40 5.2 Saran ......................................................................................... 41
ii
DAFTAR PUSTAKA ................................................................................ 42
LAMPIRAN ............................................................................................... 43
iii
DAFTAR GAMBAR
Halaman
2.1 Dendogram dengan 5 Pengamatan ........................................... 23
4.1 Dendogram Hasil Analisis Gerombol Digunakan Setelah Digunakan Setelah Analisis Komponen Utama (Minitab 14) .. 35 4.2 Dendogram Hasil Analisis Gerombol Tanpa Analisis Komponen Utama ................................................................... 36
iv
DAFTAR TABEL
Halaman
4.1 Hasil ouput deskripsi ................................................................ 29
4.2 Komponen Utama, Akar Ciri dan Proporsi Keragaman .......... 31
4.3 Matriks Loading Komponen Setelah Rotasi ............................ 32
4.4 Komponen, Variabel dan Presentase Kumulatif ...................... 33
4.5 Pengelompokkan Provinsi Berdasarkan Skor Komponen Utama Yang Terbentuk ......................................... 34 4.6 Hasil Penggerombolan Provinsi Berdasarkan Skor Komponen Utama ............................................................ 35 4.7 Hasil Penggerombolan Provinsi Berdasarkan Variabel Awal .......................................................................... 36
v
DAFTAR LAMPIRAN
Halaman
1 Data Pengamatan awal ....................................................................... 43
2 Data Baku Z ....................................................................................... 44
3 Matriks Korelasi ................................................................................ 45
4 Gerombol yang terbentuk .................................................................. 46
5 Hasil output deskrptif ........................................................................ 48
6 Informasi Tambahan .......................................................................... 49
7 Menentukan Matriks Korelasi, Akar Ciri, Vektor dan Skor Komponen Utama dengan Menggunakan Program Microsof Excel .................................................................................. 50
vi
DAFTAR SIMBOL
p = jumlah variabel X = variabel asal/peubah Y = Komponen Utama µ = vektor mean λ = akar ciri A′ = transpose dari matriks A I = matriks identitas e = vektor ciri x = rata-rata hitung x = vektor rata-rata
2s = ragam sampel ∑ = matriks kovarians/matriks ragam peragam R = matriks korelasi Z = variabel baku dari hasil transformasi data awal s = simpangan baku D = matriks jarak k = banyaknya komponen utama r = koefisien korelasi
ia = koefisien dari variabel X ke i Tr = Trace matriks
2σ = ragam populasi r = koefisien korelasi sampel S = matriks kovarians T = matriks transformasi Ψ = varians spesifik n = satuan pengamatan
25
III METODE PENELITIAN
3.1 Sumber Data
Data yang digunakan dalam penelitian ini adalah data sekunder yang
diperoleh dari Badan Pusat Statistik (BPS) yang telah dipublikasikan dalam
bentuk buku dengan judul Statistik Kesejahteraan Rakyat 2009.
3.2 Variabel
Terdapat 18 variabel pada bidang kesehatan disetiap provinsi, namun tidak
semua datanya lengkap. Adapun 13 variabel yang datanya lengkap dipilih untuk
mewakili beberapa variabel dibidang kesehatan masyarakat. Berikut adalah
varaibel-variabel yang digunakan.
1. X1 = Persentase balita dan penolong kelahiran terakhir yang ditangani
oleh dokter
2. X2 = Persentase balita dan penolong kelahiran terakhir yang ditangani
oleh bidan
3. X3 = Persentase balita dan penolong kelahiran terakhir yang ditangani
oleh tenaga medis lain
4. X4 = Persentase balita dan penolong kelahiran terakhir yang ditangani
oleh dukun
5. X5 = Persentase balita dan penolong kelahiran terakhir yang ditangani
oleh famili
6. X6 = Persentase balita yang pernah mendapat imunisasi campak
7. X7 = Persentase penduduk yang mengobati sendiri secara modern
8. X8 = Persentase penduduk yang mengobati sendiri secara tradisional
9. X9 = Jumlah desa dan sarana kesehatan rumah sakit
10. X10 = Jumlah desa dan sarana kesehatan rumah sakit bersalin
11. X11 = Jumlah desa dan sarana kesehatan poliklinik
12. X12 = Jumlah desa dan sarana kesehatan puskesmas
13. X13 = Jumlah desa dan sarana kesehatan apotik
26
3.3 Metode Analisis
Metode analisis yang digunakan dalam penelitian ini adalah analisis
deskrptif, analisis komponen utama (Principal Component Analysis) dan analisis
gerombol (Cluster Analysis).
3.3.1 Analisis Deskriptif
Analisis deskriptif adalah metode analisis sederhana yang bertujuan untuk
mempermudah penafsiran dan penjelasan dengan menganalisis tabel, grafik atau
diagram. Analisis deskriptif ini digunakan sebagai pendukung untuk menambah
dan mempertajam analisis yang dilakukan, membantu memahami masalah-
masalah yang diteliti serta memberikan gambaran umum tentang suatu fenomena
yang terjadi.
3.3.2 Analisis Komponen Utama dan Analisis Gerombol
Berikut analisis data yang digunakan dalam penelitian ini. Analisis data
dibagi menjadi analisis data yaitu langkah-langkah 1-5, adalah langkah-langkah
untuk analisis komponen utama, selanjutnya langkah 6-7 adalah langkah-langkah
untuk analisis gerombol.
1. Transformasi
Berdasarkan variabel di atas diketahui bahwa satuan pengukuran dari
variabel-variabel tersebut mempunyai satuan pengukuran berbeda, maka
satuan pengukuran itu perlu dibakukan dengan jalan melakukan transformasi
variabel X ke dalam variabel baku Z, dengan menggunakan rumus pada
Persamaan (2.17).
2. Menentukan matriks korelasi
Data yang telah ditransformasi lalu ditentukan matriks korelasi R, dengan
Persamaan (2.15).
3. Tentukan vektor ciri (koefisien pembobot komponen utama) dan akar ciri dari
matriks korelasi.
Vektor ciri yang berhubungan dengan akar ciri terbesar λ yang diturunkan
dari matriks korelasi R. Terlihat dari nilai akar ciri yang mempunyai nilai
27
lebih besar dari satu ( )1≥λ atau presentase kumulatif keragaman data yang
minimal 75 % atau lebih.
4. Tentukan komponen utama
Dalam analisis komponen utama dari p buah komponen utama yang ada
dipilih k buah komponen utama yang telah mampu menerangkan keragaman
data cukup tinggi sekitar 75% atau lebih. Penentuan komponen utama,
menggunakan persamaan 2.26.
5. Tabel matriks loading komponen
Dengan melihat komponen pembobot dapat ditentukan pembobot pada setiap
peubah terhadap tiga komponen utama tersebut (ekstraksi). Mekanisme rotasi
adalah dengan membuat korelasi peubah hanya dominan terhadap 1
komponen. Caranya dengan membuat korelasi peubah mendekati nilai mutlak
1 dan 0 pada setiap komponen, sehingga memudahkan dalam interpretasi
peubah.
6. Analisis gerombol berdasarkan k komponen utama
Setelah ditentukan k buah komponen utama, maka data Komponen Utama
(KU) digunakan sebagai data awal dalam analisis gerombol.
7. Interpretasi
Provinsi yang berada dalam suatu gerombol menerangkan tipe variabel
kesehatan yang lebih serupa.
Seluruh proses analisis data tersebut diperoleh dengan bantuan software
Minitab 15, SPSS 16.0 dan Microsoft Excel.
3.3.3 Analisis gerombol dari data awal
Untuk melakukan analisis gerombol ada beberapa proses yang harus
dilakukan. Proses analisis gerombol tersebut meliputi :
1. Menentukan ukuran kemiripan antar dua objek.
Sesuai prinsip daftar gerombol yaitu mengelompokkan objek yang
mempunyai kemiripan, maka proses pertama adalah mengukur seberapa jauh
ada kesamaan antar objek. Jarak yang paling umum digunakan adalah jarak
Euclidean (Persamaan 2.41).
28
2. Membuat Gerombol
Proses gerombol atau pengelompokan data dilakukan dengan metode
hirarki adalah rataan group (group average). Metode ini akan
mengelompokkan dua objek yang mempunyai jarak terdekat dahulu.
3. Interprestasi Gerombol
Setelah gerombol terbentuk, baik dengan metode hirarki, langkah
selanjutnya melakukan interpretasi terhadap gerombol yang terbentuk, yang
pada intinya memberi nama spesifik untuk menggambar isi gerombol tersebut.