perancangan aplikasi clustering sebagai sumber …eprints.ums.ac.id/35905/4/halaman depan.pdf ·...

17
PERANCANGAN APLIKASI CLUSTERING SEBAGAI SUMBER INFORMASI PENENTU KELAS KONSENTRASI BAGI MAHASISWA INFORMATIKA UMS DENGAN ALGORITMA K-MEANS SKRIPSI Disusun sebagai salah satu syarat menyelesaikan Jenjang Strata I pada Program Studi Informatika Fakultas Komunikasi dan Informatika Universitas Muhammadiyah Surakarta Oleh : DIAN SETIAWAN L200110020 PROGRAM STUDI INFORMATIKA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA 2015

Upload: others

Post on 27-Dec-2019

1 views

Category:

Documents


0 download

TRANSCRIPT

PERANCANGAN APLIKASI CLUSTERING SEBAGAI SUMBER INFORMASI

PENENTU KELAS KONSENTRASI BAGI MAHASISWA INFORMATIKA UMS

DENGAN ALGORITMA K-MEANS

SKRIPSI

Disusun sebagai salah satu syarat menyelesaikan Jenjang Strata I

pada Program Studi Informatika Fakultas Komunikasi dan Informatika

Universitas Muhammadiyah Surakarta

Oleh :

DIAN SETIAWAN

L200110020

PROGRAM STUDI INFORMATIKA

FAKULTAS KOMUNIKASI DAN INFORMATIKA

UNIVERSITAS MUHAMMADIYAH SURAKARTA

2015

ii

iii

iv

v

PERSEMBAHAN

Dengan mengucap syukur alhamdulillah atas rahmad dan hidayah Allah SWT,

akan kupersembahkan karya ini kepada orang-orang yang saya sayangi :

1. Ibu, Ayah, kakak dan seluruh keluarga tercinta yang selalu mendo’akan serta

mendukung setiap langkahku dalam meraih kesuksesan baik di dunia dan

akhirat.

2. Bapak Husni Thamrin, ST., MT., Ph.D selaku Dekan Fakultas Komunikasi

dan Informatika Universitas Muhammadiyah Surakarta.

3. Bapak Dr. Heru Supriyono, M.Sc. selaku ketua Program Studi Informatika.

4. Bapak Drs. Sujalwo, M. Kom. selaku Pembimbing Akademik

5. Bapak Yusuf Sulistyo Nugroho, ST., M. Eng. selaku Pembimbing yang telah

memberikan tema skripsi serta banyak membantu dalam memberikan

petunjuk dan saran-saran dalam penyusunan skripsi ini.

6. Biro Skripsi Mas Adjie yang sudah membantu dalam jalannya proses skripsi

ini.

7. Keluarga besar Informatika UMS yang telah banyak memberikan ilmu dan

pengalamannya.

8. Teman-teman HIMATIF dan BEM FKI UMS yang telah memberiku banyak

pengalaman dan kenangan selama ini.

9. Buat Diah seseorang yang selalu memberi semangat, kasih sayang, dan

motivasi selama masa-masa dalam menyelesaikan studi ini.

10. Sahabat terbaikku Novi dan Aulia yang selalu ada dalam setiap keadaanku

dan selalu memberikan semangat.

vi

11. Teman-teman terbaikku Muh. Amin, Rendi, Fajar, Anggun, Neda, Idha,

Reza, Unun, dan Alim yang selalu memberikan motivasi, nasehat dan

semangat.

12. Teman-teman Kontrakan Cholil, Marwanto, dan Agus yang selalu

memotivasi untuk lembur dalam menyelesaikan skripsi ini.

13. Teman-teman Informatika UMS 2011 kelas B yang menemaniku dan

memberi kenangan indah pada masa kuliahku selama ini.

14. Teman-teman Informatika angkatan 2011 yang telah menemaniku berjuang

menempuh gelar sarjana bersama-sama.

15. Teman-teman Galang Harapan yang selama ini selalu memberikan suport

serta nasehat dalam masa-masa studiku.

16. Semua pihak yang tidak dapat saya sebutkan satu persatu atas semua hal yang

telah diberikan.

vii

KATA PENGANTAR

Assalaamu’alaikum Warohmatullohi Wabarakatuh

Dengan mengucapkan syukur kehadirat Allah SWT yang telah melimpahkan rahmat,

hidayah serta nikmat yang tiada terkira kepada hamba-Nya, sehingga penyusun dapat

menyelesaikan skripsi ini dengan judul “Perancangan Aplikasi Clustering Sebagai

Sumber Informasi Penentu Kelas Konsentrasi Bagi Mahasiswa Informatika UMS

Dengan Algoritma K-Means”.

Skripsi ini disusun untuk memenuhi kurikulum pada Fakultas Komunikasi

dan Informatika Jurusan Informatika Universitas Muhammadiyah Surakarta, sebagai

kewajiban mahasiswa dalam rangka menyelesaikan program sarjana komputer.

Dengan segala kemampuan yang optimal, penyusun telah berusaha untuk

menyelesaikan skripsi ini, namun demikian penyusun menyadari bahwa skripsi ini

tentunya masih jauh dari sempurna. Oleh karena itu penyusun mengharapkan dengan

sangat saran serta kritik yang bersifat membangun untuk perbaikan. Akhirnya

penyusun berharap semoga skripsi ini dapat bermanfaat bagi penyusun khususnya,

serta pembaca pada umumnya dalam menambah pengetahuan dan wawasan ilmu

pengetahuan khususnya mengenai data mining. Amin

Wassalaamu’alaikum Warohmatullohi Wabarokatuh.

Surakarta, 20 Juni 2015

Penulis

viii

ABSTRAK

Program Studi Informatika di UMS memiliki tiga konsentrasi jurusan yaitu Sistem

Informasi dan Enterprise, Jaringan Komputer dan Multimedia, serta Rekayasa

Perangkat Lunak dan Animasi. Dengan adanya tiga konsentrasi penjurusan maka

mahasiswa diwajibkan untuk memilih salah satu dari konsentrasi yang ada, pada

akhir semester 4. Saat ini dalam menentukan konsentrasi hanya berdasarkan dari

keinginan mahasiswa itu sendiri tanpa adanya suatu sistem yang memberikan

pertimbangan bagi mahasiswa dalam memilih konsentrasi jurusan.

Dengan melakukan perancangan aplikasi clustering k-means, diharapkan

dapat digunakan sebagai bahan pertimbagan bagi mahasiswa serta sebagai sumber

informasi penentu kelas konsentrasi bagi mahasiswa informatika dalam memilih

konsentrasi jurusan. Variabel yang digunakan untuk proses clustering k-means

adalah nilai mata kuliah yang dominan pada masing-masing konsentrasi dari

semester 1 sampai 4, variabel konsentrasi Sistem Informasi dan Enterprise

(Pemrograman Web Dasar, Algoritma dan Pemrograman, Pengantar Sistem

Informasi, Sistem Basis Data). Jaringan Komputer dan Multimedia (Komunikasi

Data, Jaringan Komputer, Prak. Jaringan Komputer, Sistem Operasi). Rekayasa

Perangkat Lunak dan Animasi (Aljabar Linier dan Matriks, Algoritma dan Struktur

Data, Struktur Diskret 2, Sistem Digital).

Hasil clustering dengan algoritma k-means diperoleh data berdasarkan

sampel sebanyak 312 data dibagi menjadi 2 yaitu angkatan informatika 2011 dan

2012. Angkatan 2011 sebanyak 154 data diperoleh data cluster sebanyak 78 masuk

ke cluster 1 dengan titik centroid (3,333 ; 3,548 ; 3,098) dan 17 data masuk ke

cluster 2 dengan titik centroid (0,915 ; 1,110 ; 0,773) serta 60 data masuk ke cluster

3 dengan titik centroid (2,682 ; 3,221 ; 1,880). Sedangkan untuk data angkatan 2012

diperoleh data cluster sebanyak 69 masuk ke cluster 1 dengan titik centroid (3,359 ;

3,577 ; 3,188), dan 18 data masuk ke cluster 2 dengan titik centroid (0,944 ; 1,383 ;

1,262) serta 64 data masuk ke cluster 3 dengan titik centroid (2,486 ; 3,368 ; 2,250).

Pada cluster 1 maka akan direkomendasikan untuk mengambil konsentrasi Jaringan

Komputer dan Multimedia, untuk anggota cluster 2 maka akan direkomendasikan

untuk konsentrasi Rekayasa Perangkat Lunak dan Animasi sedangkan untuk anggota

cluster 3 akan rekomendasikan untuk masuk ke kelas konsentrasi Sistem Informasi

dan Enterprise.

Kata Kunci : Algoritma K-Means, Data Mining, Jurusan, Kelas Konsentrasi,

Metode Clustering.

ix

DAFTAR ISI

JUDUL ..................................................................................... i

PERSETUJUAN ..................................................................... ii

PENGESAHAN ...................................................................... iii

DAFTAR KONTRIBUSI ........................................................ iv

PERSEMBAHAN ................................................................... v

KATA PENGANTAR ............................................................. viii

ABSTRAK . ............................................................................. ix

DAFTAR ISI ........................................................................... x

DAFTAR TABEL ................................................................... xiv

DAFTAR PERSAMAAN ....................................................... xv

DAFTAR GAMBAR .............................................................. xvi

DAFTAR LAMPIRAN ........................................................... xvii

BAB 1 PENDAHULUAN .................................................................. 1

1.1 Latar Belakang .......................................................... 1

1.2 Rumusan Masalah .................................................... 3

1.3 Batasan Masalah ...................................................... 3

1.4 Tujuan Penelitian ..................................................... 4

1.5 Manfaat Penelitian ................................................... 4

1.6 Sistematika Penulisan .............................................. 5

BAB 2 TINJAUAN PUSTAKA ........................................................ 7

2.1 Telaah Penelitian ...................................................... 7

2.2 Landasan Teori ......................................................... 12

x

2.2.1 Kelas Konsentrasi ...................................................... 12

2.2.2 Data Mining ............................................................... 13

2.2.3 Metode Clustering...................................................... 14

2.2.4 Algoritma K-Means.................................................... 15

2.2.5 MySQL ....................................................................... 16

2.2.6 Java............................................................................. 17

2.2.7 NetBeans .................................................................... 17

BAB 3 METODE PENELITIAN ..................................................... 18

3.1 Waktu dan Tempat Penelitian .................................. 18

3.2 Peralatan Utama dan Pendukung ............................. 18

3.3 Diagram Alir Penelitian .. .......................................... 19

3.4 Langkah Penelitian .. .................................................. 21

3.4.1 Identifikasi Masalah .................................................. 21

3.4.2 Pengumpulan Data dan Penentuan Kebutuhan .......... 22

3.4.3 Kelengkapan data dan kebutuhan .............................. 26

3.4.3.1 Cleaning Data ........................................................... 26

3.4.3.2 Penentuan Sampel ..................................................... 27

3.4.4 Perancangan Aplikasi Data Mining .......................... 27

3.4.4.1 Pengubahan Parameter Nilai .. ................................... 27

3.4.4.2 Menetukan Metode .. ................................................. 28

BAB 4 ANALISA DATA DAN HASIL ........................................... 32

1.1 Analisa Data dan Hasil Clustering K-Means ............. 32

1.1.1 Menentukan Atribut ................................................... 32

1.1.2 Menentukan Sampel ................................................... 33

1.1.3 Pengolahan Data ....................................................... 33

xi

1.1.4 Inisialisasi Data Nilai dari Huruf ke Angka .. ............ 34

1.2 Proses Perhitungan Clustering dengan Algoritma

K-Means.. ................................................................... 36

1.2.1 Menentukan Jumlah Cluster .. ................................... 36

1.2.2 Menghitung Nilai Centroid Awal .. ........................... 36

1.2.3 Menghitung Dataset ke 1.. ........................................ 37

1.2.4 Menghitung Dataset ke 2 .. ....................................... 38

1.2.5 Menghitung Dataset ke 3 .. ....................................... 39

1.2.6 Menghitung Dataset ke 4 .. ....................................... 40

1.2.7 Menghitung Dataset ke 5 .. ....................................... 41

1.2.8 Menghitung Dataset ke 6 .. ....................................... 42

1.2.9 Menghitung Dataset ke 7 .. ....................................... 43

1.2.10 Menghitung Dataset ke 8 .. ....................................... 45

1.2.11 Menghitung Dataset ke 9 .. ....................................... 46

1.2.12 Menghitung Dataset ke 10 .. ..................................... 47

1.2.13 Hasil Centoid Akhir .. ................................................ 48

1.3 Implementasi Clustering Algoritma K-Means

dengan Pemrograman Java Netbeans 7.4 ................. 49

1.3.1 Pembuatan Form Aplikasi ......................................... 49

1.3.2 Menu Utama ............................................................... 50

1.3.3 Menu Clustering .. ..................................................... 50

1.3.4 Menu Bar ................................................................... 52

1.3.5 Menu About.. .............................................................. 53

1.4 Tahap Pengujian Sistem ............................................ 54

1.4.1 Proses Clustering ...................................................... 54

1.4.2 Hasil Clustering ........................................................ 55

xii

BAB 5 DISKUSI DAN KESIMPULAN ............................................ 58

5.1 Kesimpulan .............................................................. 58

5.2 Saran ......................................................................... 59

DAFTAR PUSTAKA ............................................................. 60

PROFIL PENULIS .................................................................. 62

LAMPIRAN ............................................................................ 63

xiii

DAFTAR TABEL

3.1 Daftar Atribut .. ............................................................................. 23

3.2 Daftar Perubahan Parameter Nilai .. ............................................. 28

4.1 Menentukan Atribut .. ................................................................... 32

4.2 Daftar Mata Kuliah yang Berhubungan dengan Konsentrasi .. .... 34

4.3 Inisialisasi Data Nilai Mata Kuliah .. ............................................ 34

4.4 Nilai Rata-rata Konsentrasi .. ........................................................ 35

4.5 Nilai Rata-rata Masing-masing Kolom .. ...................................... 36

4.6 Nilai Centroid Awal .. ................................................................... 36

4.7 Hasil Centroid Akhir .................................................................... 48

4.8 Data Final Centroid Data 2011 .. .................................................. 56

4.9 Menentukan Konsentrasi dan Cluster Data 2011 .. ...................... 56

4.10 Data Final Centroid Data 2012 .. .................................................. 57

4.11 Menentukan Konsentrasi dan Cluster Data 2012 .. ...................... 57

xiv

DAFTAR PERSAMAAN

(3.1) Rumus Slovin ............................................................................... 27

(3.2) Rumus Euclidien Distance Space ................................................ 31

xv

DAFTAR GAMBAR

2.1 Langkah-langkah Melakukan Data Mining . ................................ 13

2.2 Flowchart K-Means . .................................................................... 15

3.1 Diagram Alir Penelitian .. ............................................................. 20

3.2 Flowchart Kinerja K-Means .. ...................................................... 29

4.1 Hasil Centroid dan Cluster Dataset ke 1 .. ................................... 37

4.2 Hasil Centroid dan Cluster Dataset ke 2 .. ................................... 38

4.3 Hasil Centroid dan Cluster Dataset ke 3 .. ................................... 39

4.4 Hasil Centroid dan Cluster Dataset ke 4 .. ................................... 40

4.5 Hasil Centroid dan Cluster Dataset ke 5 .. ................................... 41

4.6 Hasil Centroid dan Cluster Dataset ke 6 .. ................................... 42

4.7 Hasil Centroid dan Cluster Dataset ke 7 .. ................................... 43

4.8 Hasil Centroid dan Cluster Dataset ke 8 .. ................................... 45

4.9 Hasil Centroid dan Cluster Dataset ke 9 .. ................................... 46

4.10 Hasil Centroid dan Cluster Dataset ke 10 .. ................................. 47

4.11 Menu Pallete.. ............................................................................... 49

4.12 Tampilan Form Utama .. ............................................................... 50

4.13 Tampilan Form Import Data Mysql .. ........................................... 51

4.14 Tampilan Form Import Data CSV .. ............................................. 52

4.15 Tampilan Menu Item Petunjuk .. .................................................. 53

4.16 Menu Form About .. ...................................................................... 53

4.17 Tampilan View Profil Dosen Pembimbing .. ................................ 54

xvi

4.18 Proses Clustering .. ....................................................................... 55

4.19 Tampilan Hasil Clustering .. ......................................................... 56

xvii

DAFTAR LAMPIRAN

A Data Pelatihan Clustering K-Means ................................................ 63

B Script Program NetBeans ............................................................... 66