klasifikasi formula jamu berdasarkan khasiat … · departemen ilmu komputer fakultas matematika...
TRANSCRIPT
KLASIFIKASI FORMULA JAMU BERDASARKAN KHASIAT
MENGGUNAKAN OBLIQUE DECISION TREE DENGAN
OPTIMASI MENGGUNAKAN ALGORITME GENETIKA
DELLY FAHLEVI MEIDIKA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi Formula
Jamu Berdasarkan Khasiat Menggunakan Oblique Decision Tree Dioptimasi
Algoritme Genetika adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi
mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Juli 2014
Delly Fahlevi Meidika
NIM G64100041
ABSTRAK
DELLY FAHLEVI MEIDIKA. Klasifikasi Formula Jamu Berdasarkan Khasiat
Menggunakan Oblique Decision Tree dengan Optimasi Menggunakan Algoritme
Genetika. Dibimbing oleh WISNU ANANTA KUSUMA dan RUDI HERYANTO.
Indonesia kaya akan keragaman hayati termasuk berbagai macam tanaman
obat yang dapat digunakan sebagai jamu. Penggunaan tanaman sebagai bahan
pengobatan atau jamu masih terbatas. Hal ini disebabkan masih sulitnya akses
terhadap informasi tanaman obat yang umumnya didapat dari buku/dokumen teks
dan pengetahuan yang didapat secara turun temurun. Salah satu informasi penting
yang dibutuhkan adalah khasiat yang dimiliki oleh jamu berdasarkan tanaman obat
yang menyusunnya. Penelitian ini bertujuan melakukan klasifikasi khasiat jamu
berdasarkan komposisi tanaman menggunakan oblique decision tree dengan
optimasi menggunakan Algoritme Genetika. Hasil dari metode ini berupa sebuah
pohon keputusan yang merepresentasikan penciri jenis tanaman terhadap suatu
khasiat. Pendekatan menggunakan data 231 tanaman mampu memberikan akurasi
sebesar 94.47%.
Kata kunci: algoritme genetika, jamu, khasiat, klasifikasi, oblique decision tree
ABSTRACT
DELLY FAHLEVI MEIDIKA. Classification of Jamu Formulas Based on Efficacy
Using Oblique Decision Tree Optimized by Genetic Algorithm. Supervised by
WISNU ANANTA KUSUMA and RUDI HERYANTO.
Indonesia is rich in biodiversity, consisting of a wide variety of medicinal
plants. However, the use of plants as a medicinal or herbal medicine is still limited.
It is difficult to find the information of medicinal plants which are generally
obtained from a rare book/text document or inherited knowledge from generation
to generation. One of the most important information is to determine the efficacy
of an herbal formula based on medicinal plants that composing it. This research
aims to develop a classification system based on the composition of medicinal
efficacy of plants using oblique decision tree optimized by Genetic Algorithm. The
result of decision tree determine plant identifier for each efficacy. The proposed
method with data set of 231 plants is able to obtain 94.47% accuracy.
Keywords: classification, efficacy, genetic algorithm, herbal, oblique decision tree
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer
KLASIFIKASI FORMULA JAMU BERDASARKAN KHASIAT
MENGGUNAKAN OBLIQUE DECISION TREE DENGAN
OPTIMASI MENGGUNAKAN ALGORITME GENETIKA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
Penguji:
Dr Heru Sukoco, MSi MT
Judul Skripsi : Klasifikasi Formula Jamu Berdasarkan Khasiat Menggunakan
Oblique Decision Tree dengan Optimasi Menggunakan Algoritme
Genetika
Nama : Delly Fahlevi Meidika
NIM : G64100041
Disetujui oleh
Dr Wisnu Ananta Kusuma, MT
Pembimbing I
Rudi Heryanto, MSi
Pembimbing II
Diketahui oleh
Dr Ir Agus Buono, MSi MKom
Ketua Departemen
Tanggal Lulus:
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah yang berjudul “Klasifikasi Formula Jamu
Berdasarkan Khasiat Menggunakan Oblique Decision Tree dengan Optimasi
Menggunakan Algoritme Genetika” ini berhasil diselesaikan. Tema yang dipilih
dalam penelitian ini merupakan pengembangan dari proyek Praktik Kerja Lapangan
(PKL) Departemen Ilmu Komputer yang penulis lakukan di Pusat Studi Biofarmaka
LPPM IPB.
Terima kasih penulis ucapkan kepada Bapak Dr Wisnu Ananta Kusuma, MT
dan Bapak Rudi Haryanto, MSi selaku pembimbing, Bapak Dr Heru Sukoco, SSi
MT selaku penguji, serta seluruh dosen dan staf di Departemen Ilmu Komputer. Di
samping itu, penulis menyampaikan terima kasih kepada teman-teman terdekat
penulis, rekan-rekan Ilkomerz khususnya Pixels 47, teman-teman satu bimbingan
(Alfat, Yuda, Gerry, Huda dan Bang Dan) yang telah saling memberi semangat dan
bantuannya untuk menyelesaikan penelitian. Ungkapan terima kasih yang terutama
penulis sampaikan kepada kedua orang tua penulis, Nanang Kusmana dan Sri
Suprihatin, kakak dan adik penulis serta seluruh keluarga, atas segala doa dan kasih
sayangnya.
Semoga karya ilmiah ini bermanfaat.
Bogor, Juli 2014
Delly Fahlevi Meidika
NIM G64100041
DAFTAR ISI
DAFTAR TABEL vi
DAFTAR GAMBAR vi
DAFTAR LAMPIRAN vi
PENDAHULUAN 1
Latar Belakang 1
Perumusan Masalah 1
Tujuan Penelitian 2
Manfaat Penelitian 2
Ruang Lingkup Penelitian 2
METODE 2
Data Penelitian 2
Tahapan Penelitian 3
Akuisisi Data 3
Praproses Data 3
Proses Booleanize 5
Pembagian data 5
Oblique Decision Tree – Genetic Algorithm 5
Evaluasi 7
Lingkungan Pengembangan 7
HASIL DAN PEMBAHASAN 7
Hasil 7
Pembahasan 11
SIMPULAN DAN SARAN 13
Simpulan 13
Saran 13
DAFTAR PUSTAKA 13
LAMPIRAN 15
RIWAYAT HIDUP 22
DAFTAR TABEL
1 Data I khasiat formula jamu 4
2 Data II khasiat formula jamu 4
3 Ilustrasi proses booleanize 5
4 Nilai parameter percobaan 7
5 Nilai akurasi set data 8
6 Confusion matrix Data I 8
7 Confusion matrix Data II 9
DAFTAR GAMBAR
1 Skema tahapan penelitian 3
2 Skema optimasi algoritme genetika 6
3 Ilustrasi proses crossover 6
4 Grafik akurasi tiap khasiat pada Data I dan Data II 9
5 Perbandingan akurasi metode PLS-DA, SVM dan ODT-GA 10
6 Tree keluaran hasil proses ODT-GA 11
7 Contoh potongan tree setelah divisualkan dalam bentuk asli 11
8 Contoh potongan tree hasil pruning 12
DAFTAR LAMPIRAN
1 Screenshot aplikasi 15
2 Pengkodean tanaman 17
3 Contoh sebagian data formula jamu 19
4 Decision tree hasil ODT-GA 20
5 Daftar tanaman yang berpengaruh pada khasiat 21
PENDAHULUAN
Latar Belakang
Pengetahuan tentang obat herbal tradisional yang diolah menjadi jamu
menjadi warisan budaya yang telah turun temurun diwariskan antar generasi. Bahan
alami penyusun jamu dapat berupa akar, daun, kayu dan buah-buahan. Menurut
Mahady (2001), penggunaan jamu sebagai pengobatan alternatif mengalami
peningkatan. Orang-orang mulai mempertimbangkan jamu sebagai obat yang aman
dan manjur yang telah terbukti secara empiris selama ratusan tahun.
Upaya sistematis dengan menggunakan pendekatan statistik untuk
menemukan hubungan antara komposisi dan khasiat jamu telah dilakukan oleh
Afendi et al. (2012). Penelitian ini menunjukan bahwa formula jamu dengan
khasiatnya memiliki aktivitas farmakologi tertentu. Dikembangkan pula hipotesis
dalam penelitian ini bahwa suatu formula jamu terdiri atas tanaman utama dengan
khasiat utamanya dan tanaman pendukung dengan sekurangnya harus memiliki
karakteristik analgesik, antimikroba, dan anti-peradangan. Dalam penelitian
tersebut digunakan metode Partial Least Squares Discriminant Analysis (PLS-DA)
untuk mengembangkan model klasifikasi formula jamu.
Dalam penelitian lain yang dilakukan oleh Fitriawan (2013), dikembangkan
sistem klasifikasi formula jamu dengan khasiatnya menggunakan teknik Support
Vector Machine (SVM). SVM adalah salah satu teknik machine learning yang
mampu mengklasifikasikan masalah di dunia nyata dengan hasil akurasi yang tinggi
(Byun dan Lee 2003). Penelitian ini memberikan hasil yang lebih baik
dibandingkan dengan metode PLS-DA pada data yang melalui data cleaning.
Pada penerapan kedua metode diatas dalam melakukan klasifikasi formula
jamu, masih sering terdapat perbedaan dalam hasil klasifikasinya, sehingga
dibutuhkan satu cara klasifikasi formula jamu dengan metode lain untuk
menghasilkan pendekatan sistem yang lebih akurat. Salah satu metode yang dapat
diterapkan adalah Oblique Decision Tree optimized by Genetic Algorithm (ODT-
GA). Metode ini menghasilkan aturan-aturan atau rules yang terangkum menjadi
sebuah pohon keputusan. Metode ini juga memiliki beberapa kelebihan, seperti
fleksibel dalam skala hingga dimensi besar dan dapat diimplementasikan secara
paralel (Cantú-Paz dan Kamath 2003).
Hasil dari penelitian ini akan dibandingkan dengan penelitian sebelumnya
yang menggunakan PLS-DA (Afendi et al. 2012) dan SVM (Fitriawan 2013). Juga
akan dilakukan perbandingan antara daftar tanaman yang berpengaruh terhadap
suatu khasiat tertentu hasil keluaran dari metode VFI5. Diharapkan dengan adanya
metode ini dapat menjadi dasar untuk mengembangkan sistem klasifikasi khasiat
formula jamu baru yang lebih akurat.
Perumusan Masalah
Adapun masalah yang akan diangkat dalam penelitian ini adalah pencarian
rules tanaman dengan menggunakan ODT-GA untuk klasifikasi khasiat formula jamu tertentu. Dari perbandingan dengan metode PLS-DA dan SVM diharapkan
2
metode ODT-GA dapat menjadi sebuah metode yang baik untuk memprediksi
khasiat formula jamu baru.
Tujuan Penelitian
Tujuan dari penelitian ini adalah membuat model klasifikasi tanaman
berdasarkan khasiat jamu dengan menggunakan metode ODT-GA. Nilai akurasi
model yang diperoleh akan dibandingkan dengan nilai akurasi dari metode PLS-
DA dan SVM. Selanjutnya menganalisis model tersebut dan membandingkan
dengan hasil dari keluaran metode VFI5.
Manfaat Penelitian
Hasil dari dilakukannya penelitian ini diharapkan dapat menjadi sebuah
teknik baru dalam pengembangan sistem untuk menentukan formula jamu
berdasarkan khasiat. Pada akhirnya, hasil dari penelitian ini dapat digunakan
sebagai model penentuan formula jamu beserta khasiatnya.
Ruang Lingkup Penelitian
Ruang lingkup dalam penelitian ini adalah:
1 Menggunakan data yang sama dengan penelitian sebelumnya (Fitriawan 2013)
yaitu data reduksi yang terdiri atas 2748 formula jamu dari 231 jenis tanaman.
2 Implementasi metode menggunakan metode ODT-GA menggunakan perangkat
lunak Keel Tool 2.0.
METODE
Penelitian ini menggunakan metode ODT-GA sebagai pembuat model untuk
klasifikasi. Tahapan pada penelitian ini terdiri atas akuisisi data, booleanize,
praproses data, pembagian data, ODT-GA dan evaluasi.
Data Penelitian
Data yang digunakan pada penelitian ini sama dengan data yang digunakan
pada penelitian oleh Fitriawan (2013) yaitu sejumlah 2748 formula jamu disertai
dengan komposisi dari 231 jenis tanaman. Data ini adalah data yang telah melalui
praproses data oleh Fitriawan (2013) dari jumlah awal 6533 formula jamu. Data
merupakan formula jamu yang terdaftar di Badan Pengawasan Obat dan Makanan
(Badan POM).
3
Tahapan Penelitian
Tahapan-tahapan yang dilakukan pada penelitian ini terdiri atas akuisisi data,
booleanize, praproses data, pembagian data, pembuatan model dengan metode
ODT-GA dan evaluasi. Alur penelitian dapat dilihat pada Gambar 1.
Akuisisi Data
Data terdiri atas 2748 formula jamu yang terdaftar di Badan Pengawasan Obat
dan Makanan (Badan POM) dengan disertai komposisi masing-masing jamu dari
231 jenis tanaman. Keseluruhan data jamu masuk kedalam tepat satu kelas khasiat
dari total 9 kelas khasiat. Keseluruhan kelas khasiat dapat dilihat pada Tabel 1. Data
ini kemudian disebut sebagai Data I atau data asli.
Praproses Data
Pada data penelitian ini ditemukan masalah imbalance data, yaitu tidak
seimbangnya persebaran jumlah data pada masing-masing kelas. Ini dapat
mempengaruhi ketepatan dalam proses klasifikasi (Chawla et al. 2002). Untuk itu
akan dilakukan praproses data untuk over-sampling dengan metode Synthetic
Minority Over-sampling Technique (SMOTE). Digunakannya metode ini untuk
Gambar 1 Skema tahapan penelitian
4
over-sampling karena dengan metode ini dapat menambah akurasi proses klasifikasi untuk kelas yang memiliki jumlah data sedikit (kelas minor).
Penggunaan metode SMOTE dikombinasikan dengan random under-sampling
akan menghasilkan hasil klasifikasi yang lebih baik dibandingkan hanya under-
sampling biasa (Chawla et al. 2002).
Tahapan pertama dari proses ini adalah dengan membangkitkan data buatan
pada kelas minor. Data dibangkitkan dengan memilih beberapa tetangga terdekat
secara acak dari kelas minor, selanjutnya dilakukan proses perhitungan terhadap
beberapa data pilihan tersebut hingga didapatkan data buatan baru. Proses tersebut
dilakukan sampai seluruh kelas minor mencapai jumlah kelas minimal yang
ditentukan. Setelah proses pembangkitan data buatan, dilakukan proses
penghapusan secara acak terhadap kelas yang memiliki data melebihi jumlah yang
telah ditentukan. Proses ini disebut random under-sampling.
Pada penerapan SMOTE dan under-sampling digunakan bantuan perangkat
lunak Weka 3.6. Data yang telah dilakukan praproses ini kemudian disebut Data II
dan ditunjukan seperti pada Tabel 2.
Tabel 2 Data II khasiat formula jamu
Nama Khasiat Kode
Khasiat
Jumlah
formula jamu
Urinary related problems
Disorder of apetite
Disorder of mood and behavior
Gastrointestinal disorders
Female reproductive organ problems
Muskuloskeletal and connective tissue disorders
Pain and inflammation
Espiratory disease
Wounds and skin infections
E1
E2
E3
E4
E5
E6
E7
E8
E9
305
305
305
305
305
305
305
305
305
.
Tabel 1 Data I khasiat formula jamu
Nama Khasiat Kode
Khasiat
Jumlah
formula jamu
Urinary related problems
Disorder of apetite
Disorder of mood and behavior
Gastrointestinal disorders
Female reproductive organ problems
Muskuloskeletal and connective tissue disorders
Pain and inflammation
Espiratory disease
Wounds and skin infections
E1
E2
E3
E4
E5
E6
E7
E8
E9
66
228
19
720
377
798
292
105
143
5
Proses Booleanize
Dalam proses booleanize dikodekan atribut jenis tanaman yang terdiri 231
tanaman dari P001 sampai P465 dengan biner 0 dan 1 pada setiap formula jamu.
Pengkodean ini mengikuti pengkodean penelitian sebelumnya (Fitriawan 2013).
Angka 0 menunjukan di dalam formula jamu tidak terdapat tanaman tersebut
sebaliknya angka 1 menunjukan adanya tanaman tersebut dalam formula jamu
seperti ditunjukan pada Tabel 3.
Pembagian data
Data dibagi menjadi data latih dan data uji pada setiap set data. Pembagian
data menggunakan k-fold cross validation dengan nilai k=5 dan k=10. Untuk nilai
k=5, data dibagi menjadi 5 subset, yaitu fold 1, fold 2, fold 3, fold 4 dan fold 5.
Pelatihan data dilakukan dengan 4 subset fold dan diuji dengan 1 subset fold.
Dilakukan pengulangan sebanyak 5 kali sampai setiap subset telah menjadi fold
pelatih dan fold penguji. Begitu pula dengan nilai k=10 data akan dibagi menjadi
10 subset dan diproses mirip seperti k=5.
Oblique Decision Tree – Genetic Algorithm
Decision tree atau pohon keputusan merupakan salah satu metode machine
learning yang cukup popular untuk melakukan klasifikasi. Kebanyakan algoritme
pohon keputusan dalam proses pemisahan node menggunakan hyperplane yang
paralel dengan salah satu sumbu, sehingga sering disebut axis-parallel. Berbeda
dengan oblique decision tree, hyperplane yang dibentuk tidak selalu paralel dengan
sumbu. Dalam beberapa kasus hal ini membuat tree yang dihasilkan lebih akurat.
Pendekatan algoritme genetika digunakan pada pembuatan pohon keputusan
untuk menemukan pemisah node atau hyperplane yang cocok. Pada kebanyakan
algoritme, proses penentuan pemisah ditentukan melalui proses heuristik Greedy
Search. Pada kasus ini dilakukan optimasi dengan algoritme genetika untuk
mengganti proses greedy search. Tree direpresentasikan dalam bentuk gen yang
memiliki nilai berupa node untuk selanjutnya dilakukan proses sesuai dengan
algoritme genetika. Alur optimasi menggunakan algoritme genetika ditunjukan oleh
Gambar 2.
Tabel 3 Ilustrasi proses booleanize
Formula Jamu P001 P002 … P465 Khasiat
J0001
J0002
…
J2747
J2748
0
0
…
0
0
0
0
…
0
0
…
…
…
…
…
0
0
…
0
0
E5
E5
...
E4
E4
6
Pada penelitian ini digunakan algoritme genetika dengan prinsip pairwise
tournament selection tanpa adanya replacement atau penggantian. Digunakan juga
uniform crossover dengan nilai 1 tanpa adanya proses mutasi. Ilustrasi proses
crossover ditunjukan oleh Gambar 3. Sedangkan nilai parameter yang akan diujikan
adalah nilai k pada fold validation dan nilai jumlah generasi seperti ditunjukan pada
Tabel 4. Nilai yang berbeda untuk mengetahui nilai parameter mana yang paling
optimal dengan diperoleh nilai akurasi yang paling tinggi. Implementasi Oblique
Decision Tree dioptimasi algoritme genetika ini menggunakan perangkat lunak
Keel Tool 2.0 (Alcalá-Fdez et al. 2009).
Gambar 2 Skema optimasi algoritme genetika
Sebelum crossover
Individu 1 P371 P300 E7 E3 P386 E7 E7
Individu 2 P304 P001 E2 E4 P210 E2 E5
Setelah crossover
Individu 1 P371 P300 E7 E3 P210 E2 E5
Individu 2 P304 P001 E2 E4 P386 E7 E7
Gambar 3 Ilustrasi proses crossover
7
Evaluasi
Evaluasi dilakukan untuk menentukan nilai akurasi atau kinerja dari model
klasifikasi yang dihasilkan. Nilai akurasi didapat dari jumlah benar hasil prediksi
dibandingkan dengan jumlah data uji. Proses evaluasi ini menggunakan confusion
matrix.
akurasi =∑ data uji benar
∑ data uji ×100%
Selain dihitung nilai akurasinya, dari model klasifikasi berupa decision tree
yang dihasilkan juga akan diperiksa nilai kedekatannya dengan data tanaman yang
paling berpengaruh terhadap suatu khasiat tertentu dari metode VFI5. Decision tree
yang akan digunakan, sebelumnya telah dilakukan proses pruning, untuk
menghilangkan atau mengurangi noise yang kemungkinan ada saat training data
(Han dan Kamber 2006).
Lingkungan Pengembangan
Proses analisis dilakukan menggunakan perangkat lunak Weka 3.6 dan library
komputasi Keel Tool 2.0 (Alcalá-Fdez et al. 2009). Implementasi Sistem klasifikasi
Formula Jamu Berdasarkan Khasiat Menggunakan Oblique Decision Tree
Dioptimasi Algoritme Genetika pada penelitian ini berbasis web dengan
menggunakan PHP sebagai bahasa pemrograman dan menggunakan MySQL
sebagai database management system.
HASIL DAN PEMBAHASAN
Hasil
Setiap set data yang telah dilakukan percobaan dengan penggantian nilai
parameter memberikan hasil berupa akurasi yang ditunjukan pada Tabel 5. Nilai
akurasi tertinggi untuk Data I (data tanpa praproses data) adalah 94.47% dengan
nilai parameter k=10 dan jumlah generasi=50; nilai akurasi tertinggi untuk Data II
(data dengan praproses data) adalah 95.19% dengan nilai parameter k=10 dan
jumlah generasi=50. Masing-masing parameter dengan nilai akurasi tertinggi pada
Tabel 4 Nilai parameter percobaan
Parameter Nilai parameter
k-fold validation
Jumlah generasi
5, 10
25, 50, 100
8
tiap set data akan digunakan untuk analisis selanjutnya.
Nilai akurasi dari Data I dengan nilai parameter yang telah ditentukan dapat
dihitung dari confusion matrix yang disajikan pada Tabel 6.
akurasi =56+217+8+719+346+763+281+82+124
2748 ×100% = 94.47%
Nilai akurasi yang didapatkan pada Data I adalah sebesar 94.47%, nilai yang
sudah cukup baik untuk membuat model klasifikasi. Confusion matrix untuk Data
II disajikan pada Tabel 7.
Dari perhitungan akurasi pada Tabel 7, didapat nilai akurasi sebesar 95.19%.
Nilai akurasi ini lebih tinggi dari Data I karena pada Data II telah dilakukan telah
dilakukan praproses balancing data dari data asli. Data yang persebarannya belum
merata diseimbangkan dengan metode SMOTE dan under-sampling. Praproses ini
berhasil meningkatkan nilai akurasi dibandingkan dengan Data I.
akurasi =303+289+304+291+273+283+284+295
2748 ×100% = 95.19%
Tabel 6 Confusion matrix Data I
Khasiat
Prediksi
Khasiat aktual
E1 E2 E3 E4 E5 E6 E7 E8 E9
E1
E2
E3
E4
E5
E6
E7
E8
E9
56
0
0
0
0
6
0
0
0
0
217
4
0
22
0
0
0
0
0
0
8
0
0
1
0
0
0
3
3
2
719
5
4
5
1
6
0
6
3
0
346
3
0
5
1
3
0
2
0
0
763
2
6
4
2
0
0
1
3
19
281
8
5
1
0
0
0
0
0
1
82
3
1
2
0
0
1
2
3
3
124
Tabel 5 Nilai akurasi set data
Data Nilai k Jumlah generasi
25 50 100
Data I
Data II
5
10
5
10
93.56%
93.41%
93.34%
94.39%
94.25%
94.47%
94.75%
95.19%
94.21%
94.29%
94.50%
94.83%
9
Pada Gambar 4 terlihat kedua penyebaran akurasi masing-masing khasiat dari
Data I dan Data II. Data I memiliki akurasi lebih baik pada 5 dari 9 khasiat
dibanding Data II. Tapi ketika akurasi khasiat Data II yang lebih baik, selisih
akurasinya cukup jauh. Bisa dilihat seperti pada khasiat Disorder of mood and
behavior Data I hanya memberikan nilai akurasi kurang dari setengah dari nilai
akurasi yang diberikan Data II. Ini dikarenakan pada khasiat Disorder of mood and
behavior termasuk kelas minor, atau kelas yang memiliki jumlah formula jamu
sedikit dengan hanya 19 formula jamu. Pada Data II yang telah dilakukan proses
balancing SMOTE, berhasil menaikan nilai akurasi dari kelas Disorder of mood
and behavior yang merupakan kelas minor.
Tabel 7 Confusion matrix Data II
Khasiat
Prediksi
Khasiat aktual
E1 E2 E3 E4 E5 E6 E7 E8 E9
E1
E2
E3
E4
E5
E6
E7
E8
E9
303
0
0
1
2
6
0
0
0
0
289
0
0
18
0
0
1
0
0
7
304
1
5
2
4
7
2
0
5
0
291
2
0
2
1
0
1
4
1
0
273
0
1
0
3
1
0
0
0
0
283
0
1
2
0
0
0
2
0
8
291
9
3
0
0
0
0
3
4
3
284
0
0
0
0
10
2
2
4
2
295
Gambar 4 Grafik akurasi tiap khasiat pada Data I dan Data II
0
10
20
30
40
50
60
70
80
90
100
E1 E2 E3 E4 E5 E6 E7 E8 E9
Akura
si (
%)
Khasiat
Data I
Data II
10
Ketika dilakukan perbandingan akurasi antar metode seperti pada Gambar 5,
nilai akurasi metode SVM masih yang tertinggi dengan 95.34%, selanjutnya
tertinggi kedua adalah metode ODT-GA dengan akurasi 95.19% dan terakhir
metode PLS-DA dengan akurasi 94.21%. Akurasi dari ketiga metode tidak begitu
terlampau jauh, selisih terbesar hanya 1.13% ini membuat akurasi ketiga metode
tidak berbeda nyata. Meskipun nilai akurasi metode ODT-GA masih kalah ketika
dibandingkan akurasi metode SVM, tapi dalam hal ini metode ODT-GA memiliki
kelebihan yaitu dapat memberikan daftar tanaman yang berpengaruh terhadap suatu
khasiat tertentu yang tidak dapat diberikan oleh SVM. Hal ini dapat membantu
dalam pengambilan pilihan tanaman awal apa saja untuk suatu khasiat tertentu.
Model klasifikasi yang dihasilkan dari metode ODT-GA adalah pohon keputusan dalam bentuk teks. Tree yang dihasilkan berbentuk binary tree sehingga
setiap node selain leaf pasti memiliki tepat 2 node anak. Tree ini dibentuk dari
aturan IF-Else yang bersarang. Contoh potongan tree yang dihasilkan dapat dilihat
pada Gambar 6.
Tree yang berbentuk teks kemudian diolah menjadi bentuk visual tree asli
secara manual sehingga akan didapatkan bentuk tree seperti pada Gambar 6. Tree
yang dihasilkan memiliki kedalaman=38 dan jumlah leaf=141. Pada tree yang
dihasilkan masih perlu dilakukan proses pruning atau pemangkasan, karena masih
didapat node-node yang tidak efektif. Seperti pada Gambar 4, karena anak-kiri dari
node P386 berupa leaf (E7), kedua anak P001 berupa leaf (E7 dan E7), dan kesemua
leaf dalam satu keturunan tertentu memiliki nilai yang sama, maka satu keturunan
tersebut dapat dihilangkan dan diganti dengan nilai pada leaf-nya. Contoh, setelah
dilakukan pruning, maka potongan tree pada Gambar 6 akan menjadi seperti
potongan tree pada Gambar 7. Tree hasil pruning memiliki kedalaman=30 dan
jumlah leaf = 94.
Gambar 5 Perbandingan akurasi metode PLS-DA, SVM dan ODT-GA
91
92
93
94
95
96
97
98
99
100
Akura
si (
%)
PLS-DA SVM ODT-GA
11
Pembahasan
Dari model klasifikasi yang dihasilkan (tree) dapat diperoleh tanaman apa
saja yang berpengaruh dalam suatu khasiat tertentu. Hal itu dapat diketahui dengan
Gambar 6 Tree keluaran hasil proses ODT-GA
Gambar 7 Contoh potongan tree setelah divisualkan dalam bentuk asli
12
melihat tanaman apa yang merupakan induk dari leaf-kiri suatu khasiat. Contoh
sederhana bisa dilihat dari Gambar 5, induk dari leaf-kiri E7 adalah P300, ini berarti
salah satu tanaman yang berpengaruh di khasiat Pain and inflammation (E7) adalah
Panax pseudoginseng (P300).
Daftar tanaman yang berpengaruh pada suatu khasiat tertentu yang dihasilkan
lalu dibandingkan dengan daftar tanaman yang berpengaruh pada suatu khasiat
tertentu yang dihasilkan oleh metode Voting Feature Interval 5 (VFI5) yang telah
ditemukan sebelumnya. Dari hasil perbandingan, kesemua tanaman yang
berpengaruh hasil dari metode ODT-GA terdapat di tanaman yang berpengaruh
hasil dari metode VFI5.
Evaluasi menggunakan data tanaman yang berpengaruh di suatu khasiat hasil
dari metode VFI5 juga dilakukan pada tree hasil pemodelan ODT-GA. Dari 94
leaves yang ada dalam tree terdapat 11 perbedaan dalam penentuan tanaman yang
berpengaruh atau tidak terhadap suatu khasiat, atau dapat dikatakan metode ODT-
GA memiliki kesamaan dalam klasifikasi dengan metode VFI5 sebesar 86.17%.
Selain menghasilkan daftar tanaman yang berpengaruh terhadap suatu khasiat,
model tree ini juga dapat menghasilkan beberapa tanaman yang tidak berpengaruh
signifikan atau tidak direkomendasikan terhadap suatu khasiat. Ini dimungkinkan
karena pada data formula jamu, tanaman tersebut tidak pernah dipakai atau sangat
sedikit sekali dipakai untuk tujuan khasiat tertentu. Terdapat 14 tanaman yang
diindikasikan tersebut. Itu ditunjukan dengan suatu tanaman menjadi induk dari
leaf-kanan suatu khasiat. Ketika dibandingkan dengan hasil dari metode VFI5,
hanya ada 5 tanaman yang beririsan atau diindikasikan sama. Kelima tanaman itu
adalah tanaman Areca catechu dan Ficus deltoidea pada khasiat Disorder of apetite,
Panax pseudoginseng pada khasiat Disorder of mood and behavior, Trigonella
foenum-graecum pada khasiat Muskuloskeletal and connective tissue disorders, dan
Imperata cylindrical pada khasiat Espiratory disease.
Gambar 8 Contoh potongan tree hasil pruning
13
SIMPULAN DAN SARAN
Simpulan
Penelitian ini berhasil membuat model klasifikasi formula jamu berdasarkan
khasiat dengan metode oblique decision tree dengan optimasi menggunakan
algoritme genetika. Akurasi yang didapat dari metode ini sebesar 94.47% dan
dengan data yang telah dilakukan proses penyeimbangan data, nilai akurasi menjadi
bertambah menjadi 95.19 %. Dari hasil model klasifikasi yang berupa tree, didapat
sejumlah tanaman yang berpengaruh dan yang tidak berpengaruh signifikan
terhadap suatu khasiat tertentu. Ini dapat menjadi salah satu rujukan dalam
formulasi jamu berdasarkan komposisi tanaman untuk mencapai suatu khasiat.
Saran
Saran untuk penelitian selanjutnya adalah menambah jumlah data latih untuk
setiap kelas sampai pada batas yang cukup atau memadai untuk membuat suatu
model, sehingga dapat meningkatkan nilai akurasi keseluruhan sistem. Selanjutnya
dengan melakukan perbaikan pada saat melakukan praproses data, seperti
menggunakan metode SMOTEBoost.
Penelitian selanjutnya tentang metode ODT-GA bisa juga dilakukan dengan
memakai set data yang variabel penciri tiap kelasnya merupakan mayoritas atau
dominan dibanding variabel yang bukan penciri. Sehingga ODT-GA dapat lebih
baik dalam membuat model, tree yang dihasilkan pun akan lebih sederhana.
DAFTAR PUSTAKA
Afendi FM, Darusman LK, Morita AH, Altaf-Ul-Amin M, Takahashi H, Nakamura
K, anaka K, Kanaya S. 2012. Efficacy prediction of jamu formulations by
PLS Modeling. Curr Comput Aided Drug Des. 9(1):46-59. PubMed PMID:
23106776.
Alcalá-Fdez J, Sánchez L, García S, del Jesus MJ, Ventura S, Garrell JM, Otero J,
Romero C, Bacardit J, Rivas VM, Fernández JC, Herrera F. KEEL: A
Software Tool to Assess Evolutionary Algorithms to Data Mining Problems.
Soft Computing 13:3 (2009) 307-318
Byun H, Lee SW. 2003. A survey on pattern recognition application of support
vector machines. Int J Patt Recogn Artif Intell. 17(3):459-486.
Cantú-Paz E, Kamath C. 2003. Inducing oblique decision trees with evolutionary
algorithms. IEEE Transactions on Evolutionary Computation 7:1 54-68.
14
Chawla NV, Bowyer KW, Hall LO, Kegelmeyer PW. 2002. SMOTE: Synthetic
Minority Over-sampling Technique. Journal of Artificial Intelligence
Research 16: 321-357.
Fitriawan A. 2013. Sistem Klasifikasi Khasiat Formula Jamu dengan Metode
Support Vector Machine [Skripsi]. Bogor (ID) : Institut Pertanian Bogor.
Han J, Kamber M. 2006. Data Mining Concepts and Techniques 2nd Ed. San
Francisco (US) : Morgan Kaufmann Pub.
Mahady GB. 2001. Global harmonization of herbal health claim. J Nutr. 131:
1120S-1123S.
15
Lampiran 1 Screenshot aplikasi
Tampilan memilih efikasi/khasiat
Tampilan memilih formula
16
Tampilan hasil yang formula yang diharapkan sesuai dengan khasiat
Tampilan hasil yang formula yang diharapkan tidak sesuai dengan khasiat
17
Lampiran 2 Pengkodean tanaman
P001 Foeniculum vulgare P176 Amomum compactum P321 Prunus persica
P002 Clausena anisum-olens P180 Sauropus androgynus P322 Stachytarpheta jamaicensis
P003 Litsea chinensis P181 Usnea misaminensis P323 Hydrocotyle asiatica
P004 Glycyrrhiza uralensis P182 Aquilaria sinensis P324 Illicium verum
P006 Imperata cylindrica P183 Cinnamomum camphora P325 Carica papaya
P007 Phellodendron chinense P185 Cinnamomum cullilawan P328 Areca catechu
P008 Zanthoxylum acanthopodium P187 Cinnamomum cassia P329 Pinus merkusii
P013 Elaeocarpus grandiflora P188 Melaleuca leucadendra P332 Pygeum africanum
P020 Garcinia atroviridis P189 Parameria laevigata P333 Prunus armeniaca
P021 Tamarindus indica P190 Caesalpinia sappan P334 Mentha arvensis
P026 Atractylodis Macrocephala P191 Grewia salutaris P336 Euchresta horsfieldii
P029 Zingiber purpureum P193 Psophocarpus tetragonolobus P339 Lepiniopsis ternatensis
P031 Allium fistulosum P194 Elettaria speciosa P340 Alstonia scholaris
P033 Allium cepae P198 Parkia roxburghii P342 Pimpinella pruatjan
P034 Allium sativum P199 P345 Helicteres isora
P040 Pluchea indica P200 Strobilanthes crispus P347 Notopterygium incisum
P042 Pachyrrhizus erosus P201 Typhonium flagelliforme P349 Ceiba pentandra
P044 Strychnos ligustrina P202 Cocos nucifera P351 Rubia cordifolia
P045 Merremia mammosa P203 Rheum tanguticum P352 Trifolium pratense
P048 Cimicifuga racemosa P206 Carthamus tinctorius P355 Hibiscus sabdariffa
P053 Tinospora tuberculata P207 Aleurites moluccana P360 Laminaria japonica
P055 Pandanus conoideus P209 Phyllanthus emblica P362 Hedyotis corymbosa
P059 Clerodendron squamatum P210 Piper cubeba P363 Abrus precatorius
P061 Piper retrofractum P211 Murraya paniculata P364 Syzygium polyanthum
P066 Santalum album P212 Canangium odoratum P366 Salvia coccinea
P067 Cordyceps sinensis P214 Kaempferia galanga P367 Cistanches salsa
P068 Syzygium aromaticum P215 Tagetes erecta P369 Hemigraphis colorata
P072 Prunus cerasus P218 Terminalia catappa P370 Andrographis paniculata
P073 Phyllanthus acidus P220 Cassia alata P371 Moschosma polystachium
P075 Clematis chinensis P221 Coriandrum sativum P374 Symplocos odoratissima
P080 Cibotium barometz P223 Cinchona succirubra P375 Serenoa repens
P081 Theobroma cacao P224 Trigonella foenum-graecum P377 Brassica nigrae
P082 P226 Cola acuminata P378 Nasturtium indicum
P091 Gynura segetum P231 Portulaca oleracea P379 Schisandra chinensis
P095 Achillea santolina P233 Orthosiphon stamineus P382 Apium graveolens
P096 Graptophyllum pictum P234 Kaempferia angustifolia P386 Blumea balsamifera
P097 Plantago major P236 Curcuma longa P389 Cassia angustifolia
P098 Punica granatum P239 Cucurbita pepo P390 Cymbopogon nardus
P099 Glochidion rubrum P241 Piper nigrum P392 Crataegus pinnatifida
P101 Harpagophytum procumbens P243 Ocimum sanctum P397 Sida rhombifolia
P106 Syzygium cumini P244 Alpinia galanga P400 Silybum marianum
P107 Echinacea purpurea P245 Vetiveria zizanioides P403 Cinnamomum sintok
P110 Forsythia suspensa P247 Lavandula angustifolia P404 Piper betle
Cola nitida
Soya max
18
P111 Dioscorea opposite P250 Vitex trifolia P407 Talinum paniculatum
P112 Smilax zeylanica P252 Zingiber zerumbet P409 Sparganium stoloniferum
P113 Polygonum multiflorum P254 Zingiber aromaticum P410
P115 Gaultheria punctata P255 Languas galanga P411 Nyctanthes arbor-tritis
P116 Justicia gendarussa P256 Leucas lavandulifolia P415 Spatholobus suberectus
P118 Ligusticum acutilobum P258 Polygala glomerata P418 Ficus deltoidea
P119 Garcinia cambogia P259 P421 Elephantopus scaber
P120 Sanguisorba officinalis P263 Eriobotrya japonica P424 Theae sinensis
P122 Borreria hispida P266 Phaleria papuana P426 Melaleuca alternifolia
P123 Commiphora myrrha P269 Galla lusitania P427 Cyperus rotundus
P126 Panax ginseng P270 Quercus lusitanica P428 Thymus vulgaris
P128 Angelica sinensis P276 Massoia aromatica P429 Lantana camara
P129 Eleutherococcus senticosus P277 Pistacia lentiscus P431 Sonchus arvensis
P132 Equisetum debile P278 Rosa chinensis P432 Curcuma heyneana
P136 Asarum sieboldii P279 Jasminum sambac P434 Curcuma aeruginosa
P138 Magnolia officinalis P280 Morinda citrifolia P435 Kaempferia pandurata
P139 Coleus scutellarioides P281 Phyllanthus urinaria P436 Curcuma xanthorrhiza
P140 Ruta angustifolia P282 Mentha piperita P438 Curcuma zedoaria
P142 P283 Cucumis sativus P439 Fritillaria cirrhosa
P144 Zingiber officinale P292 Artemisia cina P440 Solanum verbacifolium
P145 Zingiber officinale P295 Messua ferrea P443 Solanum lycopersicum
P147 Psidium guajava P299 Pogostemon cablin P444 Tetranthera brawas
P149 Anacardium occidentale P300 Panax pseudoginseng P445 Paeonia suffruticosa
P155 Guazuma ulmifolia P303 Eclipta prostrata P446 Cassia fistula
P159 Citrus amblycarpa P307 Costus speciosus P447 Tribulus terrestris
P160 Citrus sinensis P308 Oryza sativa P449 Wolfiporia extensa
P161 Citrus aurantium P309 Sophora japonica P450 Sesbania grandiflora
P162 Citrus hystrix P311 Myristica fragrans P452 Valeriana javanica
P166 Nigella sativa P314 Pandanus amaryllifolius P456 Salix alba
P167 Cassia siamea P315 Vanilla planifolia P459 Daucus carota
P168 Terminalia bellirica P316 Momordica charantia P462 Epimedium brevicornum
P171 Baeckea frutescens P318 Eurycoma longifolia P463 Pausinystalia yohimbe
P173 Phaseolus radiatus P319 Euphorbia thymifolia P464 Olea europaea
P175 Ipomoea reptana P320 Euphorbia hirta P465 Alisma orientalis
Zea mays
Spirulina
Aloe vera
19
Lampiran 3 Contoh sebagian data formula jamu
P444 P445 P446 P447 P449 P450 P452 P456 P459 P462 P463 P464 P465 Efficacy
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 1 0 0 1 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
0 0 0 0 0 0 0 0 0 0 0 0 0 satu
20
Lampiran 4 Decision tree hasil ODT-GA
21
Khasiat Tanaman yang berpengaruh
Urinary related
problems
Disorder of apetite
Disorder of mood
and behavior
Female
reproductive organ
Problems
Muskuloskeletal
and connective
tissue disorders
Pain and
inflammation
Espiratory disease
Wounds and skin
infections
Imperata cylindrica, Plantago major, Smilax zeylanica,
Zea mays, Strobilanthes crispus, Serenoa repens,
Sonchus arvensis, Solanum lycopersicum, Paeonia
suffruticosa
Guazuma ulmifolia, Laminaria japonica, Curcuma
heyneana, Curcuma aeruginosa
Baeckea frutescens, Ipomoea reptana, Leucas
lavandulifolia, Carica papaya, Valeriana javanica
Pluchea indica, Punica granatum, Ligusticum
acutilobum, Baeckea frutescens, Parameria laevigata,
Kaempferia angustifolia, Ocimum sanctum, Quercus
lusitanica, Artemisia cina, Trifolium pratense, Piper
betle, Nyctanthes arbor-tritis, Ficus deltoidea
Justicia gendarussa, Zingiber officinale, Massoia
aromatica, Myristica fragrans, Euchresta horsfieldii,
Cyperus rotundus, Epimedium brevicornum
Foeniculum vulgare, Syzygium aromaticum,
Graptophyllum pictum, Zingiber officinale, Parkia
roxburghii, Typhonium flagelliforme, Cinchona
succirubra, Panax pseudoginseng, Helicteres isora
Clausena anisum-olens, Glycyrrhiza uralensis,
Echinacea purpurea, Amomum compactum, Piper
cubeba, Kaempferia galanga, Eriobotrya japonica,
Euphorbia hirta, Illicium verum, Abrus precatorius,
Nasturtium indicum, Thymus vulgaris, Salix alba
Tinospora tuberculata, Santalum album, Aleurites
moluccana, Trigonella foenum-graecum, Aloe vera,
Mentha piperita, Curcuma heyneana
Lampiran 5 Daftar tanaman yang berpengaruh pada khasiat
22
RIWAYAT HIDUP
Penulis lahir di Kota Bandung pad 30 Mei 1992. Penulis merupakan putra
kedua dari tiga bersaudara pasangan Nanang Kusmana dan Sri Suprihatin. Penulis
menamatkan sekolah menengah di Kabupaten Indramayu yaitu SMAN 1 Sindang
pada tahun 2010 dan kemudian melanjutkan pendidikan di Institut Pertanian Bogor
pada tahun yang sama melalui jalur Undangan Seleksi Masuk IPB (USMI).
Selain melaksanakan kegiatan akademik, penulis juga pernah aktif di
beberapa kegiatan seperti menjadi asisten praktikum mata kuliah Algoritme dan
Pemrograman pada tahun 2012 serta mata kuliah Penerapan Komputer pada tahun
2013. Penulis melaksanakan kegiatan praktik kerja lapangan di Pusat Studi
Biofarmaka pada tahun 2013 dengan mengembangkan Sistem Informasi Jamu
Herbal (Si IJAH). Penulis juga aktif di beberapa organisasi seperti Ikatan Keluarga
dan Mahasiswa Darma Ayu Bogor (IKADA), BEM FMIPA 2012, BEM KM IPB
2013 dan LSM Inovasi untuk Indonesia.