implementasi generalized vector space model...
TRANSCRIPT
IMPLEMENTASI GENERALIZED VECTOR SPACE MODEL PADA PENCARIANPRODUK BERBASIS OPINI PRODUK
Suciadi Ciptono Rahayu¹, Ema Rachmawati², Ade Romadhony³
¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
AbstrakPerkembangan teknologi dan industri membuat jumlah produk barang dan jasa serta opinimasyarakat terhadap produk pun semakin banyak dan beragam. Kebutuhan dan keinginanmanusia terhadap suatu produk juga memiliki kriteria yang berbeda - beda. Berdasarkanfenomena - fenomena tersebut, sistem information retrieval dapat digunakan dalam membantumanusia dalam mencari produk sesuai kriteria - kriteria yang dibutuhkan berdasarkan pada opini- opini yang diberikan terhadap setiap produk tanpa harus bersusah payah membaca dan mencariseluruh opini yang ada pada setiap produk. Data produk yang akan digunakan pada kasus iniadalah data produk mobil. Sehingga untuk hasilnya akan diurutkan daftar mobil dari yang palingrelevan dengan query masukkan pengguna, yaitu daftar mobil yang memiliki bobot paling besarhingga ke kecil. Sebelum dilakukan pemberian bobot pada tiap mobil, opini - opini yang dimilikitiap mobil dan query yang diinput oleh pengguna akan dilakukan data preprocessing sehinggadidapatkan data yang benar - benar dianggap penting dan dibutuhkan dalam sistem. Sisteminformation retrieval dalam proses pemberian bobot yang dibangun dalam kasus inimenggunakan pendekatan vector based, dengan metode yang digunakan adalah generalizedvector space model. Metode ini terbukti dapat menghasilkan daftar produk yang relevan denganmenghitung bobot kemiripan query masukkan pengguna dengan opini - opini yang dimiliki setiapproduk[5]. Hasil yang diberikan sistem dengan query lebih dari satu kata sudah dapatmenunjukkan ranking mobil dan akan lebih spesifik jika menggunakan kata yang berhubungandengan mobil dan atau merk mobil. Sedangkan hasil pengujian MOS menunjukkan hasil yangcukup baik dengan rata – rata relevansi dan akurasi sebesar 3,87.
Kata Kunci : information retrieval, data preprocessing, vector based, generalized vector spacemodel
AbstractThe technology and industry growth make increasement the value of product and service andvarious public opinions to the product. Human needs and desires of the product also has differentcriteria. Based on the phenomenons, information retrieval systems can be used to help people infinding a suitable product by criterias that are needed based on the opinions given on everyproduct without having to bother to read and search all the existing opinion on any product. . Thedata of product that will be used in this case is a car product data. So for the results to be sortedlist of the cars that are most relevant to the query that user type, that is the list of cars from thegreatest weight to the lower weight. Before assigning weights to each car, opinions which eachcar has and query that user type will be processed by data preprocessing to get the correct data -was considered important and needed in the system. Information retrieval system in the processof assigning weights that is constructed in this case uses a vector-based approach, the methodused is the generalized vector space models. This method proved to be able to generate a list ofproducts that are relevant by calculating the similarity of the query that user type and the opinionof every product[5]. The results given by system with more than one word in query can alreadyshow car ranking and it will be more specific when using words related to car and or brands ofcars. While the MOS test results showed good results with average of relevance and accuracy is3.87.
Keywords : information retrieval, data preprocessing, vector based, generalized vector spacemodel
Powered by TCPDF (www.tcpdf.org)
Tugas Akhir - 2013
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
1
1. Pendahuluan
1.1 Latar Belakang
Perkembangan teknologi informasi dan komunikasi semakin berkembang
pesat. Era ini bisa kita sebut sebagai era social computing, dimana setiap orang
dapat dengan mudah saling berkomunikasi dan berinteraksi dimanapun kapanpun
sehingga banyak orang mengemukakan pendapat pada hal - hal seperti barang,
peristiwa, orang lain, dan lain - lain[3][11]. Fenomena yang terjadi ini membuat
banyak pendapat tersebut menjadi bahan pertimbangan pengambilan keputusan.
Sektor industri produk barang atau jasa juga semakin berkembang dengan
lahirnya inovasi - inovasi baru untuk menarik pembeli dan memenuhi kebutuhan
banyak orang.. Keadaan ini berpengaruh ketika masyarakat mengambil keputusan
dalam memilih barang atau jasa yang mereka butuhkan atau inginkan menjadi
semakin sulit dan lama.
Sistem pemberian rating pada suatu hal pada social community menjadi
pendukung yang berpengaruh dalam pemilihan hal tersebut[12]. Ketika
masyarakat ingin mencari mobil, mereka dapat memasukkan kriteria barang yang
mereka inginkan berupa query yang selanjutnya query masukkan tersebut akan
dicocokkan kedekatannya dengan review publik pada tiap mobil yang selanjutnya
mobil - mobil tersebut akan diberikan rating, sehingga pada akhirnya akan
ditampilkan mobil - mobil yang sesuai atau mendekati sesuai dengan keinginan
mereka.
Salah satu metode yang dapat digunakan pada kasus ini yang merupakan
proses information retrieval dimana dicari suatu dokumen mobil yang memiliki
kedekatan tertinggi dengan query adalah metode dengan pendekatan vector based
dimana setiap masukkan pengguna dan dokumen akan dianggap sebagai vector
dengan memiliki bobot tiap termnya[6]. Metode yang digunakan dalam kasus ini
adalah generalized vector space model. Proses awal yang dilakukan dalam
membangun sistem yang dijelaskan sebelumnya melakukan data preprocessing
pada dataset sehingga didapatkan data yang benar - benar dianggap penting dan
dibutuhkan sistem.
Tugas Akhir - 2013
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
2
Implementasi metode generalized vector space model pada kasus ini
adalah untuk mendapatkan nilai similaritas tiap dokumen mobil dengan query
dengan menggunakan pendekatan ruang vektor. Pada metode ini, query dari
pengguna dan data set berupa review pada tiap mobil akan dikenakan operasi
perkalian titik dan hasilnya menjadi acuan dalam menentukan relevansi query dari
pengguna dan data set. Dengan metode ini, dokumen mobil dengan eksistensi tiap
term yang sama akan digabungkan sehingga dimensi matriks pada penghitungan
menjadi lebih kecil. Pada sistem ini akan dilakukan evaluasi untuk mengetahui
query masukkan yang tepat untuk sistem. Implementasi generalized vector space
model pada kasus ini adalah dengan menggunakan bobot tiapa term pada tiap
dokumen yang selanjutnya akan digunakan dalam pembuatan vektor. Vektor –
vektor dokumen dan query selanjutnya akan dilakukan perkalian vektor sehingga
didapatkan nilai similaritas antar vektor tiap dokumen dengan vektor query.
1.2 Perumusan masalah
Permasalahan yang akan dibahas dalam Tugas Akhir ini antara lain :
1. Bagaimana sistem penghitungan kedekatan query masukkan pengguna
dengan review pada tiap dokumen mobil yang ada dengan
menggunakan metode generalized vector space model?
1.3 Batasan Masalah
Adapun batasan masalah dalam pengerjaan Tugas Akhir ini. Diantaranya
adalah sebagai berikut:
1. Pencarian hanya dilakukan dalam satu produk barang, yaitu mobil.
2. Data set berupa daftar jenis - jenis mobil beserta opininya masing -
masing sudah dalam bentuk format file.
3. Semua review dalam dataset adalah opini.
1.4 Tujuan
Tujuan dari Tugas Akhir ini adalah:
Tugas Akhir - 2013
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
3
1. Mengimplementasikan metode generalized vector space model pada
kasus pencarian produk berdasarkan opini dengan studi kasus pencarian
mobil.
1.5 Metodologi Penyelesaian Masalah
Metodologi yang digunakan dalam penyelesaian masalah - masalah yang
ada pada kasus tugas akhir ini adalah sebagai berikut:
1. Identifikasi Masalah dan Solusi
Memilih kasus dan merumuskan masalah yang dimiliki pada kasus
tersebut serta merancang solusi berupa pengembangan suatu sistem.
2. Studi Literature
Mempelajari sistem implementasi information retrieval dan metode
generalized vector space model.
3. Pengumpulan Data
Mengumpulkan data - data yang diperlukan dalam pembuatan sistem
berupa data jenis - jenis mobil beserta opini yang dimiliki.
4. Perancangan Sistem
Menganalisis sistem yang dibutuhkan beserta dengan komponen -
komponen pendukung yang dibutuhkan.
5. Implementasi
Mengimplementasikan sistem dan komponen yang dirancang sebelumnya
ke dalam bentuk aplikasi.
6. Pengujian dan Analisas Hasil
Melakukan pengujian terhadap sistem yang dibangun dan melakukan
analisa terhadap hasil yang diberikan.
Powered by TCPDF (www.tcpdf.org)
Tugas Akhir - 2013
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
33
5. Kesimpulan dan Saran
5.1 Kesimpulan
Berdasarkan pengujian yang dilakukan pada sistem ini, dapat disimpulkan
beberapa hal sebagai berikut:
1. Jumlah kata dalam query selain satu kata memungkinkan terbentuknya
minterm semakin kecil.
2. Pada pengujian MOS menghasilkan nilai rata – rata yang cukup baik, yaitu
3,87 yang terdiri dari sapek akurasi hasil dan relevansi isi dokumen.
5.2 Saran
1. Sistem dapat memberikan suggestion kata terutama kata yang berhubungan
dengan produk pada sistem ketika mengetikkan query.
2. Sistem dapat memberikan rekomendasi perbaikan penulisan kata pada query
yang diduga mengalami kesalahan pada pengetikan.
Powered by TCPDF (www.tcpdf.org)
Tugas Akhir - 2013
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
34
6. Daftar Pustaka
[1]Blanchard,Antonie. 2007. Understanding and customizing stopword lists for
enhanced patent mapping .Switzerland: Syngenta Crop Protection AG
[2]Bunyamin, Hendra. (2008). Aplikasi Information Retrieval (IR) CATA Dengan
Metode Generalized Vector Space Model. Bandung: Universitas Kristen
Maranatha
[3] Ganesan,Kavita and Chengxiang,Zhai. 2011. Opinion-Based Entity Ranking
.Chicago: University of Illinois
[4]Herwansyah, Adhit. (2009). Aplikasi Pengkategorian Dokumen dan
Pengukuran Tingkat Similaritas Dokumen menggunakan Kata Kunci pada
Dokumen Penulisan Ilmiah Universitas Gunadarma. Jakarta: Universitas
Gunadarma.
[5]Jiang,Fan. 2000. Approximate Dimension Equalization in Vector-based
Information Retrieval .Durham: Duke University
[6]Manning, Christopher. 2008. An Introduction to Information Retrieval
.Cambridge: Cambridge University
[7]Paskaleva,Biliana. 2011. A vector space model for information retrieval with
generalized similarity measures .USA: Sandia National Laboratories
[8] Sanderson,Mark. 2011. The History of Information Retrieval Research .
Melbourne: RMIT Universiy
[9]Schutze,Hinrich. 2012. Information Retrieval and Text Mining .Stuttgart:
University 0f Stuttgart
[10]Smirnov,Ilia. 2008. Overview of Stemming Algorithms .Chicago: DePaul
University
[11]Stelzner,Michael. 2009. Social Media Marketing Industry Report .USA:
Social Media Examiner
[12]Wang,Yuan. 2004. Computing Page Rank in a Distributed Internet Search
System .Madison: University of Wiscons
Tugas Akhir - 2013
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
35
[13]Wibowo Adi, Handojo Andreas, Taliwang Minardi. Recommender System di
Perpustakaan Universitas Kristen Petra menggunakan Rocchio Relevance
Feedback dan Cosine Similarity. Surabaya: Universitas Kristen Petra.
[14]Wibowo, Ari. Pengujian Kerelevanan Sistem Temu Kembali Informasi.
Batam: Politeknik Negri Batam.
Powered by TCPDF (www.tcpdf.org)
Tugas Akhir - 2013
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika