penerapan text mining untuk membantu keputusan … · daftar pustaka [1] kusnawi. (2007). pengantar...

7
PENERAPAN TEXT MINING UNTUK MEMBANTU KEPUTUSAN PENGAMBILAN MATAKULIAH DENGAN KETERKAITAN MATERI MENGGUNAKAN METODE ASSOCIATION RULES ANALYSIS PADA FAKULTAS INFORMATIKA IT TELKOM Riski Pratama¹, Hetti Hidayati², Shaufiah³ ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom Abstrak Kebutuhan akan informasi di bidang pendidikan khususnya tingkat universitas dinilai cenderung meningkat. Salah satunya adalah kebutuhan mahasiswa akan informasi mengenai materi yang diajarkan dari matakuliah yang ada di Fakultas Informatika IT Telkom. Banyaknya matakuliah dengan materi yang cukup banyak dan berbeda-beda sehingga hanya dapat memberikan sebagian kecil informasi. Karena itu diperlukan sebuah sistem yang dapat mengolah data matakuliah tersebut menjadi informasi tambahan berupa keterkaitan materi. Hasil yang diharapkan berupa informasi sekelompok matakuliah berdasarkan materi tertentu yang memiliki keterkaitan. Dari hasil tersebut diharapkan dapat membantu mahasiswa dalam menentukan keputusan pengambilan matakuliah berdasarkan keterkaitan materi. Informasi-informasi tersebut menghasilkan materi-materi apa saja yang terdapat di dalam suatu matakuliah dan juga keterkaitan dari suatu materi. Kata Kunci : Text Mining, Parsing, Stemming, Stopwords Removal, Algoritma Apriori, Frequent Itemsets, Association Rules Abstract The need for information in the field of education, especially at university level assessed is likely to increase. One is the need for information about the material students are taught from the course in the Faculty of Informatics IT Telkom. The number of subjects with a lot of material and different so that can only provide a small portion of information. Therefore we need a system that can process data is subject to additional information in the form of linkage material. Results are expected in the form of information based on certain material group of subjects that have relevance. From these results are expected to assist students in determining the course of decision-making based on linkage material. Such information should produce any material contained in a subject and relevance of the material. Keywords : Text Mining, Parsing, Stemming, Stopwords Removal, Apriori Algorithm, Frequent itemsets,Association Rules Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2012 Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Upload: others

Post on 12-Sep-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PENERAPAN TEXT MINING UNTUK MEMBANTU KEPUTUSAN … · DAFTAR PUSTAKA [1] Kusnawi. (2007). Pengantar Solusi Data Mining .Yogyakarta. [2] Soumen, C. (2003). Mining The Web : Discovering

PENERAPAN TEXT MINING UNTUK MEMBANTU KEPUTUSAN PENGAMBILANMATAKULIAH DENGAN KETERKAITAN MATERI MENGGUNAKAN METODE

ASSOCIATION RULES ANALYSIS PADA FAKULTAS INFORMATIKA IT TELKOM

Riski Pratama¹, Hetti Hidayati², Shaufiah³

¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

AbstrakKebutuhan akan informasi di bidang pendidikan khususnya tingkat universitas dinilai cenderungmeningkat. Salah satunya adalah kebutuhan mahasiswa akan informasi mengenai materi yangdiajarkan dari matakuliah yang ada di Fakultas Informatika IT Telkom. Banyaknya matakuliahdengan materi yang cukup banyak dan berbeda-beda sehingga hanya dapat memberikan sebagiankecil informasi. Karena itu diperlukan sebuah sistem yang dapat mengolah data matakuliahtersebut menjadi informasi tambahan berupa keterkaitan materi. Hasil yang diharapkan berupainformasi sekelompok matakuliah berdasarkan materi tertentu yang memiliki keterkaitan.

Dari hasil tersebut diharapkan dapat membantu mahasiswa dalam menentukan keputusanpengambilan matakuliah berdasarkan keterkaitan materi. Informasi-informasi tersebutmenghasilkan materi-materi apa saja yang terdapat di dalam suatu matakuliah dan jugaketerkaitan dari suatu materi.

Kata Kunci : Text Mining, Parsing, Stemming, Stopwords Removal, Algoritma Apriori, FrequentItemsets, Association Rules

AbstractThe need for information in the field of education, especially at university level assessed is likelyto increase. One is the need for information about the material students are taught from thecourse in the Faculty of Informatics IT Telkom. The number of subjects with a lot of material anddifferent so that can only provide a small portion of information. Therefore we need a system thatcan process data is subject to additional information in the form of linkage material. Results areexpected in the form of information based on certain material group of subjects that haverelevance.

From these results are expected to assist students in determining the course of decision-makingbased on linkage material. Such information should produce any material contained in a subjectand relevance of the material.

Keywords : Text Mining, Parsing, Stemming, Stopwords Removal, Apriori Algorithm, Frequentitemsets,Association Rules

Powered by TCPDF (www.tcpdf.org)

Tugas Akhir - 2012

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Page 2: PENERAPAN TEXT MINING UNTUK MEMBANTU KEPUTUSAN … · DAFTAR PUSTAKA [1] Kusnawi. (2007). Pengantar Solusi Data Mining .Yogyakarta. [2] Soumen, C. (2003). Mining The Web : Discovering

1

BAB I PENDAHULUAN

1.1 Latar Belakang

Semakin ketatnya pembelajaran di perguruan tinggi menuntut mahasiswa dapat menentukan

langkah-langkah yang harus diambil untuk mempermudah dalam pembelajaran setiap

semesternya.Untuk itu, setiap mahasiswa harus dapat melakukan beberapa evaluasi yang

bertujuan untuk mengetahui informasi berupa materi yang diajarkan dalam matakuliah dan lebih

baik juga mengetahui keterkaitan materi satu dengan materi lainnya. Evaluasi tersebut dilakukan

untuk membantu mahasiswa dalam menentukan langkah pengambilan mata kuliah setiap

semesternya agar dapat meringankan selama menjalani matakuliah yang diambil tersebut

dikarenakan matakuliah memiliki hubungan materi yang saling mendukung dalam belajar.

Mahasiswa mengalami kesulitan dalam mencari sekelompok matakuliah berdasarkan materi

tertentu, misalnya seluruh matakuliah yang mengandung materi “aljabar”. Mahasiswa biasanya

mencari informasi berupa keterkaitan matakuliah dengan bertanya kepada senior yang sudah

mengambil matakuliah tersebut sebelumnya. Pencarian informasi tersebut masih bersifat manual

dan tidak menutup kemungkinan bahwa informasi tersebut masih bisa saja salah atau tidak

diberikan lebih detailnya.

Diharapkan apabila mahasiswa mencari matakuliah yang berhubungan dengan “aljabar”, maka

seharusnya ditampilkan matakuliah lainnya yang dimana isinya mengandung materi “aljabar”

beserta matakuliah lain yang juga mengandung materi penting yang berhubungan dengan materi

“aljabar” tersebut, misalnya materi penting “Himpunan”, “Enumerasi” dan materi penting lainnya

yang berasosiasi dengan materi-materi di atas. Mungkin juga materi penting lain yang dianggap

tidak ada hubungannya dapat berasosiasi dengan materi yang dicari oleh mahasiswa.

Dengan mempertimbangkan kondisi diatas maka pada Tugas Akhir ini,maka akan dibangun dan

di analisis bagaimana membangun suatu sistem yang dapat membantu mahasiswa dalam

menentukan pengambilan mata kuliah yang memiliki keterkaitan materi dengan menerapkan Text

Mining dan menggunakan metode Association Rules Analysis.

Tugas Akhir - 2012

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Page 3: PENERAPAN TEXT MINING UNTUK MEMBANTU KEPUTUSAN … · DAFTAR PUSTAKA [1] Kusnawi. (2007). Pengantar Solusi Data Mining .Yogyakarta. [2] Soumen, C. (2003). Mining The Web : Discovering

2

Penggunaan text mining disebabkan karena data mentah yang akan diteliti dan diolah adalah

materi dari matakuliah yang bertipe text dan karena data yang diolah ditujukan untuk olahan data

text yang cukup besar. Metode Association Rules Analysis digunakan karena metode ini adalah

salah satu metode data mining yang digunakan di dalam menemukan hubungan asosiasi yang

menarik pada sekumpulan data yang besar.

Sistem Text Mining yang dibangun dengan menggunakan metode Association Rules Analysis

akan melakukan pem-filter-an, penyimpanan kata penting pada tiap materi dalam matakuliah,

menemukan dan menganalisa relasi antar materi, dan kemudian menampilkan hasil analisa

tersebut kepada user. Dengan sistem ini nantinya diperoleh list matakuliah dari yang paling

berhubungan dengan matakuliah yang dipilih oleh user sampai dengan yang paling sedikit

hubungannya dengan matakuliah yang dipilih.

1.2 Rumusan Masalah

Berdasarkan latar belakang permasalahan di atas, maka perumusan masalah yang akan diangkat

dalam Tugas Akhir ini, yaitu :

1. Bagaimana menerapkan Text Mining menggunakan metode Association Rules Analysis agar

dapat membantu mahasiswa dalam menentukan pengambilan matakuliah yang saling

memiliki keterkaitan materi ?

2. Bagaimana menganalisa asosiasi antar materi dari matakuliah dan bagaimana cara untuk

menampilkan hasil tersebut sebagai informasi kepada user?

1.3 Tujuan

Berdasarkan perumusan masalah di atas, maka tujuan dari Tugas Akhir ini, yaitu :

1. Penerapan Text Mining menggunakan metode Association Rules Analysis dapat memberikan

informasi berupa keterkaitan matakuliah berdasarkan asosiasi materinya.

2. Penerapan Text Mining menggunakan metode Association Rules Analysis dapat memberikan

rekomendasi dan membantu keputusan mahasiswa dalam menentukan pengambilan

matakuliah yang saling memiliki keterkaitan materi.

Tugas Akhir - 2012

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Page 4: PENERAPAN TEXT MINING UNTUK MEMBANTU KEPUTUSAN … · DAFTAR PUSTAKA [1] Kusnawi. (2007). Pengantar Solusi Data Mining .Yogyakarta. [2] Soumen, C. (2003). Mining The Web : Discovering

3

1.4 Batasan Masalah

Adapun batasan masalah pada tugas akhir ini, yaitu:

1. Kurikulum yang digunakan yaitu kurikulum tahun ajaran 2008.

2. Raw data yang digunakan untuk preprocessing berupa silabus dari matakuliah.

3. Dokumen yang di preprocessing hanya dokumen dalam bahasa indonesia.

4. Hasil penerapan Text Mining menggunakan metode Association Rules Analysis hanya bersifat

memberikan informasi berupa keterkaitan materi.

1.5 Metodologi Penyelesaian Masalah

Metodologi yang digunakan dalam menyelesaikan Tugas Akhir ini, yaitu:

1. Studi Literatur

Mempelajari literatur-literatur yang berhubungan dengan teori Data Mining, Text Mining, dan

metode yang akan digunakan yaitu Association Rules Analysis.

2. Pengumpulan Data

Data yang akan dijadikan penelitian dari raw datayaitu dokumen-dokumen yang diajarkan

dari seluruh matakuliah yang terdapat di Fakultas IT Telkom.

3. Analisis dan Perancangan Sistem

Melakukan analisis sistem, menerapkan metode Association Rules Analysis dalam merancang

sistem, dan menentukan kebutuhan dari sistem yang akan dibangun seperti kebutuhan

fungsionalitas sistem, seperti :

a. Raw Data : dokumen-dokumen yang akan diajarkan dari setiap matakuliah

b. Preprocessing : melakukan parsing, stemming, dan stopwords removal untuk

mendapatkan materi dari dokumen yang diajarkan pada setiap matakuliah baik itu materi

utama ataupun sub-sub materi dari materi utama

c. Algoritma Apriori : menyeleksi materi-materi yang didapat dari hasil preprocessing untuk

mendapatkan frequent itemsets yang nantinya digunakan untuk mencari asosiasi dari satu

materi ke materi yang lainnya.

d. Association Rules : generate materi yang terasosiasi setelah melalui proses-proses pada

preprocessing dan penggunaan algoritma apriori.

Tugas Akhir - 2012

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Page 5: PENERAPAN TEXT MINING UNTUK MEMBANTU KEPUTUSAN … · DAFTAR PUSTAKA [1] Kusnawi. (2007). Pengantar Solusi Data Mining .Yogyakarta. [2] Soumen, C. (2003). Mining The Web : Discovering

4

4. Implementasi

Mengimplementasikan hasil analisis dan rancangan ke dalam suatu perangkat lunak yang

merupakan sistem yang dapat membantu keputusan dalam pengambilan matakuliah dengan

melakukan pengujian dari metode aturan Association Rules Analysis.

5. Pengujian

Melakukan pengujian terhadap fungsionalitas sistem yang telah di bangun untuk

meminimalisir adanya bug/error dan untuk menentukan nilai minimum support dan

confidence yang paling optimal

6. Pembuatan Laporan

Mendokumentasikan pengerjaan Tugas Akhir ini ke dalam bentuk laporan.

Powered by TCPDF (www.tcpdf.org)

Tugas Akhir - 2012

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Page 6: PENERAPAN TEXT MINING UNTUK MEMBANTU KEPUTUSAN … · DAFTAR PUSTAKA [1] Kusnawi. (2007). Pengantar Solusi Data Mining .Yogyakarta. [2] Soumen, C. (2003). Mining The Web : Discovering

32

BAB V PENUTUP

Pada bab ini berisi kesimpulan dan saran yang didapat berdasarkan dengan pembuatan sistem text

mining untuk memberikan rekomendasi pengambilan matakuliah berdasarkan keterkaitan materi

nya.

5. 1 Kesimpulan

Selama pembuatan tugas akhir ini berlangsung, dapat ditarik kesimpulan sebagai berikut:

1. Penerapan metode Association Rules Analysis dapat memberikan informasi berdasarkan dari

rules yang didapat setelah melalui proses preprocessing, generate frequent itemsets, dan

generate association rules.

2. Penggunaan stoplist untuk stopwords removal pada tahap preprocessing sangat menentukan

jumlah words yang didapat untuk setiap matakuliah

3. Semakin tinggi batasan minimum support count dan yang ditentukan maka association rules

yang dihasilkan semakin sedikit sehingga menurunkan kuantitas dari rekomendasi

pengambilan matakuliah yang dihasilkan sebagai output, begitu juga sebaliknya.

4. Semakin rendah batasan minimum confidence yang ditentukan maka association rules yang

dihasilkan semakin banyak, tetapi banyaknya hasil association rules tidak menentukan bahwa

itu hasil yang paling optimal dan begitu juga sebaliknya.

5. Dengan menganalisa rules yang dihasilkan ditambah dengan hasil expert judgement, dapat

disimpulkan bahwa informasi yang dihasilkan cukup menarik (interesting) dan berguna untuk

memberikan informasi yang lebih spesifik dalam menunjukkan keterkaitan suatu materi.

5. 2 Saran

Pada tugas akhir ini dari proses pengembangan aplikasi program ini diberikan saran :

1. Target data dapat ditambahkan berupa matakuliah dengan dokumen yang berbahasa Inggris.

2. Rekomendasi untuk pengambilan matakuliah dapat dicari dengan penggunaan metode

pencarian lain seperti klasifikasi jenis matakuliah tanpa melalui proses parsing, stemming,

dan stopwords removal.

3. Text cleaning dapat dilakukan secara langsung oleh sistem dengan suatu metode tanpa harus

dilakukan secara manual.

Powered by TCPDF (www.tcpdf.org)

Tugas Akhir - 2012

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Page 7: PENERAPAN TEXT MINING UNTUK MEMBANTU KEPUTUSAN … · DAFTAR PUSTAKA [1] Kusnawi. (2007). Pengantar Solusi Data Mining .Yogyakarta. [2] Soumen, C. (2003). Mining The Web : Discovering

DAFTAR PUSTAKA

[1] Kusnawi. (2007).Pengantar Solusi Data Mining.Yogyakarta.

[2] Soumen, C. (2003). Mining The Web : Discovering Knowledge From Hypertext Data.

San Fransisco.

[3] Bill, F. (1999). “What is Information Retrieval”, Virginia.

[4] Michael, H., Bettina, G., Kurt, H.(2005). A Computational Environment for Mining

Association Rules and Frequent Item Sets.

[5] Jiawei, H., & Micheline Kamber, “Data Mining Concepts and Techniques Second

Edition”

[6] Christian, B., &Rudolf, K.(2002). “Induction of Association Rules : Apriori

Implementation”. Germany.

[7] Tala, Fadillah Z.(2003). A Study of Stemming Effects on Information Retrieval in

Bahasa Indonesia. Amsterdam.

[8] Johansyah, Rizmi L.(2010). Tentang Parsing, Stoplist, dan Dictionary.Jakarta.

[9] Li, P., Chen, J., & Bian, F. (2004). A Developed Algorithm of Apriori Based

Association Analysis.WuHan University.

[10] Feldman, R., &Sanger, J.(2007). The Text Mining Handbook.New York : Cambridge

University Press

[11] http://fpmipa.upi.edu/staff/yudi/stop_words_list.txt

Powered by TCPDF (www.tcpdf.org)

Tugas Akhir - 2012

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika