bab i pendahuluan - sinta.unud.ac.id i.pdf · bab i pendahuluan 1.1 latar belakang sistem pakar...
TRANSCRIPT
BAB I
PENDAHULUAN
1.1 Latar Belakang
Sistem pakar adalah suatu cabang kecerdasan buatan yang menggunakan
pengetahuan-pengetahuan khusus yang dimiliki oleh seorang ahli untuk
menyelesaikan suatu masalah tertentu. Salah satu penalaran dalam sistem pakar
adalah penalaran berbasis kasus atau lebih dikenal dengan Case-Based Reasoning
(CBR). CBR telah menjadi teknik yang sukses untuk sistem berbasis pengetahuan
dalam banyak domain. Dimana CBR menggunakan pengalaman sebelumnya
dalam kasus yang mirip untuk memahami dan memecahkan permasalahan
baru. CBR mengumpulkan kasus sebelumnya yang hampir sama dengan masalah
yang baru dan berusaha untuk memodifikasi solusi agar sesuai dengan kasus yang
baru (Aamodt dan Plaza,1994). Untuk menemukan solusi dari sebuah kasus baru
yang diberikan, sistem akan mencari kasus-kasus dalam basis kasus yang
memiliki tingkat kesamaan yang paling tinggi.
Telah banyak dilakukan penelitian tentang sistem pakar berbasis kasus
atau Case Based Reasoning (CBR). Beberapa peneliti telah banyak meneliti
terkait dengan sistem pakar berbasis kasus atau Case Based Reasoning (CBR)
dengan menggunakan metode Probabilitas Bayesian untuk mendiagnosa sesuatu
seperti diagnosa penyakit dll. Penelitian tentang diagnosa penyakit akibat virus
eksantema oleh Agus Sasmito Aribowo dengan akurasi yang didapatkan sebanyak
45,2%, mendiagnosa penyakit gagal ginjal dengan akurasi yang didapatkan
sebanyak 63.922 % oleh Sri Rahayu. Dan terkait dengan sistem pakar berbasis
kasus atau Case Based Reasoning (CBR) dengan menggunakan metode Nearest
Neighbor untuk mendiagnosa sesuatu seperti mendiagnosa penyakit umum oleh
Ardian Nur Romadhan dengan akurasi 77,7%, mendignosa penyakit diagnosis
penyakit anjing oleh Fransica Octaviani S, Joko Purwadi, dan Rosa Delima
dengan akurasi 90%.
Dalam penelitian ini peneliti ingin menerapkan metode-metode diatas
dalam sistem pakar berbasis Case Based Reasoning (CBR) dalam studi kasus
mendiagnosa penyakit pada anak. Untuk mendiagnosa penyakit pada anak ini
peneliti menggunakan data gejala-gejala awal yang dialami oleh anak tersebut.
Proses yang berjalan adalah sistem akan melakukan penelusuran terhadap
kesamaan antara kasus baru yang dialami oleh anak dengan kasus-kasus lama
yang terdapat di database sistem dengan mengunakan metode Probabilitas
Bayesian dan Nearest Neighbor. Setelah itu akan didapatkan hasil kasus yang
hampir sama dengan kasus lama tersebut dan akan dibandingkan hasil yang
didapatkan dari metode Probabilitas Bayesian dengan hasil yang didapatkan dari
metode Nearest Neighbor.
1.2 Rumusan Masalah
Dari latar belakang masalah tersebut dapat dirumuskan suatu permasalahan
yaitu :
a. Bagaimana perbandingan dalam penerapan metode Probabilitas Bayesian
dan Nearest Neighbor pada Case Based Reasoning (CBR) dalam
mendiagnosa penyakit pada anak ?
b. Bagaimana merancang sistem pakar berbasis kasus atau Case Based
Reasoning (CBR) untuk mendiagnosa penyakit pada anak dengan
menerapkan metode Probabilitas Bayesian dan Nearest Neighbor ?
1.3 Tujuan Penelitian
Tujuan dilakukannya penelitian ini adalah untuk mengetahui perbandingan
kinerja Sistem Pakar dalam mendiagnosa penyakit pada anak dengan penggunaan
metode Probabilitas Bayesian dan Nearest Neighbor dalam penalaran berbasis
kasus.
1.4 Batasan Masalah
Adapun batasan masalah dari penelitian ini adalah:
1. Penyakit yang digunakan disini adalah penyakit yang umum terjadi pada
anak.
2. Data penelitian yang digunakan disini adalah data dari RS Wangaya.
3. Nilai pembobotan dari penelitian ini adalah hasil diskusi dengan 1 pakar yaitu
Dr. I G A K Suandi Sp.A sebagai Dokter Spesialis Anak.
1.5 Manfaat Penelitian
Manfaat dari penelitian ini adalah
1. Bagi Masyarakat
Dapat dijadikan gambaran untuk meningkatkan pengetahuan dan wawasan
masyarakat mengenai gejala-gejala umum penyakit pada anak agar tidak
memiliki rasa kecemasan yang tinggi. Dan juga membantu ibu-ibu untuk
mendiagnosa awal penyakit yang diderita oleh anak mereka dan dapat
memberikan penanganan awal.
2. Bagi Penulis
Diharapkan dapat menambah pengetahuan bagi penulis mengenai gejala-
gejala awal untuk mendiagnosa penyakit pada anak.
1.6 Metodologi Penelitian
1.6.1 Desain Penelitian
Penelitian ini mengambil judul “Penerapan Metode Probabilitas Bayesian
dan Nearest Neighbour dalam Sistem Pakar Berbasis Case Based Reasoning
(CBR)”.
Desain penelitian yang digunakan dalam penelitian ini adalah studi kasus.
Menurut (Hasibuan, 2007), studi kasus merupakan penelitian yang memusatkan
perhatian pada suatu kasus tertentu dengan menggunakan individu atau kelompok
sebagai bahan studinya. Penggunaan penelitian studi kasus ini biasanya
difokuskan untuk menggali dan mengumpulkan data yang lebih dalam terhadap
objek yang diteliti untuk dapat menjawab permasalahan yang sedang terjadi.
Dalam masalah yang diambil, akan ada gejala-gejala 4 penyakit umum
pada anak yang akan digunakan untuk menjadi data dalam penelitian ini. Akan
terjadi penelusuran dari gejala-gejala baru yang dialami anak tersebut dengan
mengunakan metode Probabilitas Bayesian dan Nearest Neighbor. Setelah itu
akan dibandingkan hasil yang didapatkan dari metode-metode tersebut dengan
kasus lama yang diperoleh dari RS Wangaya. Dan dari sanalah akan didapatkan
hasil penyakit yang hampir sama dengan data-data penyakit yang diperoleh dari
RS Wangaya.
1.6.2 Pengumpulan Data
Setelah dilakukan identifikasi masalah dan tujuan, selanjutnya yaitu tahap
pengumpulan data. Untuk mengetahui data apa saja yang dibutuhkan untuk
menyelesaikan permasalahan ini, sebelumnya telah dilakukan studi literature dan
studi lapangan.
Jenis data yang digunakan pada penelitian ini dari cara memperolehnya
yaitu data primer. Data primer adalah data yang berasal dari sumber asli atau
pertama. Data ini tidak tersedia dalam bentuk terkompilasi ataupun dalam bentuk
file-file. Data ini harus dicari melalui narasumber/responden, yaitu orang yang kita
jadikan objek penelitian atau orang yang kita jadikan sebagai saran mendapatkan
informasi ataupun data. (Jonathan Sarwono,2006:129). Selain data primer,
didalam penelitian juga menggunakan data sekunder. Data sekunder adalah data
yang sudah tersedia sehingga kita tinggal mencari dan mengumpulkan. (Jonathan
Sarwono,2007:123)
Pada penelitian ini data yang digunakan adalah data gejala-gejala penyakit
pada anak yang diperoleh dari kasus-kasus di RS Wangaya, dan data penyakitnya
diperoleh dari pakar. Pakarnya sendiri adalah seorang Spesialis Anak. Pada tabel
1.1 akan ditampilkan tabel penyakit pada anak dari pakar, pada tabel 1.2 akan
ditampilkan tabel gejala penyakit gejala penyakit pada anak, dan pada tabel 1.3
akan ditampilkan tabel keputusan penyakit berdasarkan gejala.
Tabel 1. 1 Tabel Penyakit Pada Anak
(Sumber : Dr. I G A K Suandi Sp.A)
Kode Penyakit
K1 Demam Berdarah
K2 Demam Thypoid
K3 Diare
K4 TBC
Tabel 1. 2 Tabel Gejala Penyakit Pada Anak
(Sumber : RS. Wangaya)
Kode Gejala
G1 Demam
G2 Mual
G3 Muntah
G4 Menjadi Lemas
G5 Bibir Kering
G6 Nafsu Makan dan Minum Menurun
G7 Batuk
G8 Pilek
G9 Mimisan
G10 Bibir Berdarah
G11 Sakit Saat Menelan
G12 Sakit Kepala
G13 Gatal Seluruh Tubuh
G14 Buang Air Besar Terus Menerus
G15 Keluar Bintik Merah Pada Tubuh
G16 Sakit Perut
G17 Sakit Tenggorokan
G18 Sesak Nafas
G19 Sariawan
G20 Sembelit
G21 Menggigil
G22 Lidah Putih
G23 Nyeri Otot
G24 Perut Sering Berbunyi
G25 Kejang
G26 Batuk Darah
G27 Benjolan Di Leher
G28 Terkadang Berkeringat
Tabel 1. 3 Tabel Keputusan Penyakit Berdasarkan Gejala
(Sumber : RS. Wangaya)
Tabel Keputusan Penyakit Berdasarkan Gejalanya
Gejala Penyakit
K1 K2 K3 K4
Demam √ √ √ √
Mual √ √ √ √
Muntah √ √ √ √
Menjadi Lemas √ √ √ √
Bibir Kering √ √
Nafsu Makan dan Minum Menurun √ √ √ √
Batuk √ √ √ √
Pilek √ √ √ √
Mimisan √ √ √
Bibir Berdarah √
Sakit Saat Menelan √
Sakit Kepala √ √ √ √
Gatal Seluruh Tubuh √
Buang Air Besar Terus Menerus √ √ √ √
Keluar Bintik Merah Pada Tubuh √
Sakit Perut √ √ √
Sakit Tenggorokan √
Sesak Nafas √ √
Sariawan √
Sembelit √
Menggigil √
Lidah Putih √
Nyeri Otot √
Perut Sering Berbunyi √
Kejang √
Batuk Darah √
Benjolan Di Leher √
Terkadang Berkeringat √
1.6.3 Metode Yang Digunakan
Metode yang digunakan dalam penelitian ini adalah Probabilitas Bayesian
dan Nearest Neighbor. Untuk metode Probabilitas Bayesian, perhitungan tingkat
Similarity dari kasus-kasus dengan gejala yang diberikan pada pakar, yang ada
dalam database menggunakan metode Probabilitas Bayesian. Proses dilakukan
setelah proses retrieve informasi dari data kasus yang sudah terindex. Hasil proses
retrieve sangat mungkin berupa beberapa kasus yang mirip dan dekat dengan
gejala-gejala untuk penyakit dari pakar tersebut. Untuk memilih satu dari
beberapa kasus termirip perlu manajemen ketidakpastian. Ketidakpastian ini akan
dihitung menggunakan teorema Probabilitas Bayesian, dengan rumus sebagai
berikut:
𝑃(𝐻|𝐸) = 𝑃(𝐸|𝐻).𝑃(𝐻)
𝑃(𝐸)………………………………………………..(1.1)
Algoritmanya adalah sebagai berikut
1. Melakukan proses pencarian kasus yang mirip dan dekat dengan gejala-
gejala untuk penyakit anak dari kasus yang diperoleh dari RS.Wangaya.
2. Membandingkan antara kasus lama dengan kasus baru. Kasus 1, 2, 3, dan
4 merupakan kasus lama. Sedangkan kasus 5 merupakan kasus baru yang
akan dibandingkan dengan 4 kasus lama tersebut
Tabel 1. 4 Contoh Kasus
Gejala/id_kasus 1 2 3 4 5
Demam 1 0.67 0.67 0.67 0.67
Mual 0.67 0.33 1 0.33 0.67
Muntah 0.67 0 0 0 0
Menjadi Lemas 0.67 0.67 0 1 0.67
Bibir Kering 0 0.67 0.67 0.33 0
Nafsu Makan dan
Minum Menurun 0 0.67 0.67 0.67 0.67
Batuk 0 0 0 0.67 0
Mimisan 0 0 0 0 0.67
Bibir Berdarah 0 0 0 0 0
Sakit Saat Menelan 0 0 0 0 0
Sakit Kepala 0 0 0 0 0
Pilek 0 0 0 0 0
Gatal Seluruh Tubuh 0 0 0 0 0
Buang Air Besar Terus
Menerus 0 0 0 0 0
Keluar Bintik Merah
Pada Tubuh 0 0 0 0 0
Sakit Perut 0 0 0 0 0
Sakit Tenggorokan 0 0 0 0 0
Sesak Nafas 0 0 0 0 0
Sariawan 0 0 0 0 0
Sembelit 0 0 0 0 0
Menggigil 0 0 0 0 0
Lidah Putih 0 0 0 0 0
Nyeri Otot 0 0 0 0 0
Perut Sering Berbunyi 0 0 0 0 0
Kejang 0 0 0 0 0
Batuk Darah 0 0 0 0 0
Benjolan Di Leher 0 0 0 0 0
Terkadang Berkeringat 0 0 0 0 0
Kasus 1 adalah Demam Berdarah yang memiliki 3 gejala yang
sama dengan kasus 5. Kasus 2 adalah Demam Berdarah yang memiliki 4
gejala yang sama dengan kasus 5. Kasus 3 adalah Demam Berdarah yang
memiliki 3 gejala yang sama dengan kasus 5. Kasus 4 adalah Demam
Thypoid yang memiliki 4 gejala yang sama dengan kasus 5.
3. Cari similarity value nya dengan cara
𝑆𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦 𝑉𝑎𝑙𝑢𝑒 = 𝑔𝑒𝑗𝑎𝑙𝑎 𝑦𝑎𝑛𝑔 𝑠𝑎𝑚𝑎
𝑗𝑢𝑚𝑙𝑎ℎ 𝑔𝑒𝑗𝑎𝑙𝑎………………………………(1.2)
Untuk Kasus 1, Similarity Value = 3/28 = 0.1072
Untuk Kasus 2, Similarity Value = 4/28 = 0.1429
Untuk Kasus 3, Similarity Value = 3/28 = 0.1072
Untuk Kasus 4, Similarity Value = 4/28 = 0.1429
4. Setelah didapatkan SV dari masing-masing kasus, maka ditentukan
MSVnya, karena disini maksimal banyaknya gejala pada satu kasus adalah
6 jadi minimal gejala yang sama pada kasus baru adalah 3. Jadi karena
Similarity Value = 3/28 = 0.1072, maka MSVnya adalah 0.1072.
5. Setelah terkumpul kasus-kasus yang memiliki MSV >= 0.1072 maka
dihitunglah kasus tersebut mengunakan metode Probabilitas Bayesian.
Awalnya adalah dicari nilai dari masing-masing kasus tersebut, seperti
berikut
𝑃(𝐾1) = 𝐾𝑎𝑠𝑢𝑠 𝐷𝐵
𝑆𝑒𝑙𝑢𝑟𝑢ℎ 𝐾𝑎𝑠𝑢𝑠 =
3
4= 0.75
𝑃(𝐾2) = 𝐾𝑎𝑠𝑢𝑠 𝐷𝐵
𝑆𝑒𝑙𝑢𝑟𝑢ℎ 𝐾𝑎𝑠𝑢𝑠 =
3
4= 0.75
𝑃(𝐾3) = 𝐾𝑎𝑠𝑢𝑠 𝐷𝐵
𝑆𝑒𝑙𝑢𝑟𝑢ℎ 𝐾𝑎𝑠𝑢𝑠 =
3
4= 0.75
𝑃(𝐾4) = 𝐾𝑎𝑠𝑢𝑠 𝐷𝑇
𝑆𝑒𝑙𝑢𝑟𝑢ℎ 𝐾𝑎𝑠𝑢𝑠 =
1
4= 0.25
6. Setelah diperoleh hasil dari P(K) dari masing-masing kasus, akan dicari
P(S|K) dari masing-masing kasus seperti berikut
P(S|K1) = 0.75 ∗ 3 = 2.25
P(S|K2) = 0.75 ∗ 4 = 3
P(S|K3) = 0.75 ∗ 3 = 2.25
P(S|K4) = 0.25 ∗ 4 = 1
7. Setelah itu dicari totalnya yaitu P(S) dari semua kasus tersebut
𝑃(𝑆) = (0.75 ∗ 2.25) + (0.75 ∗ 3) + (0.75 ∗ 2.25) + (0.25 ∗ 1)
= 1.6875 + 2.25 + 1.6875 + 0.25
= 5.875
8. Setelah itu akan diperoleh hasil probabilitas bayes dari masing-masing
kasus seperti berikut
𝑃(𝐾1|𝑆) = 𝑃(𝑆|𝐾1)∗𝑃(𝐾1)
𝑃(𝑆) =
2.25∗0.75
5.875= 0.2872
𝑃(𝐾2|𝑆) = 𝑃(𝑆|𝐾2)∗𝑃(𝐾2)
𝑃(𝑆) =
3∗0.75
5.875= 0.3829
𝑃(𝐾3|𝑆) = 𝑃(𝑆|𝐾3)∗𝑃(𝐾3)
𝑃(𝑆) =
2.25∗0.75
5.875= 0.2872
𝑃(𝐾4|𝑆) = 𝑃(𝑆|𝐾4)∗𝑃(𝐾4)
𝑃(𝑆) =
1∗0.25
5.875= 0.0425
Jadi kesimpulan dari perhitungan kasus diatas dengan Metode Probabilitas
Bayesian, maka didapatkan kesimpulan penyakit mengarah pada kasus 2 dengan
hasil 0.3829 atau 38.29%
Untuk metode Nearest Neighbor, Pada proses Retrieve ini akan dilakukan
pembobotan dengan menggunakan metode Nearest Neighbour.
1. Akan melakukan proses pembobotan dengan melakukan pencocokan satu
per satu antara gejala yang dmasukan dengan data yang ada di dalam basis
pengetahuan. Proses pembobotan yang dilakukan oleh sistem ditampilkan
dalam perhitungan di bawah ini. Bobot parameter (w) :
Gejala Penting = 5
Gejala Sedang = 3
Gejala Biasa = 1
Dan Bobot Nilai Gejalanya adalah
Sangat Dirasakan = 1
Cukup Dirasakan = 0.67
Sedikit Dirasakan = 0.33
2. Dan untuk nilai pendekatan di setiap gejala nya adalah
Tabel 1. 5 Tabel Nilai Pendekatan
Nilai 1 Nilai 2 Pendekatan
Sangat Dirasakan Sangat Dirasakan 1
Sangat Dirasakan Cukup Dirasakan 0.5
Sangat Dirasakan Sedikit Dirasakan 0.25
Cukup Dirasakan Sangat Dirasakan 0.5
Cukup Dirasakan Cukup Dirasakan 1
Cukup Dirasakan Sedikit Dirasakan 0.5
Sedikit Dirasakan Sangat Dirasakan 0.25
Sedikit Dirasakan Cukup Dirasakan 0.5
Sedikit Dirasakan Sedikit Dirasakan 1
3. Cari Similarity dari dengan membandingkan Kasus Baru dan Semua Kasus
Lama seperti berikut
𝑆𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦 =(0.5∗5) : (1∗5)
5:5:3:3=
2.5:5
16= 0.46
𝑆𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦 =(1∗5): (1∗5):(1∗3) : (0.5∗5)
5:5:3:5:3=
15.5
21= 0.738
Kasus Lama DB
Demam (1) (5)
Mual (0.67) (5)
Muntah (0.67) (3)
Menjadi Lemas (0.67) (3)
Kasus Baru
Demam (0.67)
Mual (0.67)
Bibir Kering (0.67)
Nafsu Makan &Minum
Menurun (0.67)
Kasus Lama DB
Demam (0.67) (5)
Mual (0.67) (5)
Bibir Kering (0.67) (3)
Nafsu Makan &Minum Menurun
(0.33) (5)
Menjadi Lemas (0.67) (3)
Kasus Baru
Demam (0.67)
Mual (0.67)
Bibir Kering (0.67)
Nafsu Makan &Minum
Menurun (0.67)
𝑆𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦 =(1∗5): (1∗5)
5:1:3:5:5=
10
19= 0.526
Jadi kesimpulan dari perhitungan kasus diatas dengan Metode Nearest
Neighbour, maka didapatkan kesimpulan penyakit mengarah pada kasus 2 dengan
hasil 0.738 atau 73.8%
1.6.4 Evaluasi dan Validasi Hasil
Pada tahap ini akan dilakukan evaluasi dan validasi hasil. Evaluasi dan
validasi hasil dilakukan untuk mengetahui apakah yang dihasilkan sudah sesuai
dengan tujuan yang ingin dicapai. Pengujian sistem dilakukan dengan
menginputkan kasus awal yang diderita oleh pasien dan sistem akan
membandingkan kasus baru pasien dengan kasus lama yang terdapat dalam basis
kasus. Dan jika terdapat hasil 2 kasus yang serupa dengan kasus baru maka akan
dilakukan pengecekan terhadap gejala-gejala yang terdapat dalam data
diatas.setelah itu akan didapatkan keakuratan sistem terhadap kasus baru dari
pasien tersebut. Hasil yang ingin didapatkan adalah akurasi dari penerapan metode
Probabilitas Bayesian dan Nearest Neighbor dalam sistem pakar berbasis kasus
atau Case Based Reasoning (CBR) untuk mendiagnosa gejala-gejala penyakit
pada anak.
Untuk mendapatkan persentase nilai akurasi untuk hasil perhitungan dari
metode Probabilitas Bayesian dan Nearest Neighbor adalah
Kasus Lama DT
Demam (0.67) (5)
BAB Terus Menerus (0.67) (1)
Batuk (0.67) (3)
Nafsu Makan &Minum Menurun
(0.67) (5)
Menjadi Lemas (0.67) (5)
Kasus Baru
Demam (0.67)
Mual (0.67)
Bibir Kering (0.67)
Nafsu Makan &Minum
Menurun (0.67)
𝑃𝑒𝑟𝑠𝑒𝑛𝑡𝑎𝑠𝑒 𝐻𝑎𝑠𝑖𝑙 =𝑘𝑎𝑠𝑢𝑠 𝑦𝑎𝑛𝑔 𝑏𝑒𝑛𝑎𝑟
𝑠𝑒𝑚𝑢𝑎 𝑘𝑎𝑠𝑢𝑠 × 100%
Berikut adalah tabel untuk mencatat hasil perhitungan yang didapatkan
dari sistem ini :
Tabel 1. 6 Tabel Hasil Perhitungan
Data Penyakit Probabilitas
Bayesian
Nilai
Bayes
Nearest
Neighbor Similarity