implementasi generalized vector space model...

7
IMPLEMENTASI GENERALIZED VECTOR SPACE MODEL PADA PENCARIAN PRODUK BERBASIS OPINI PRODUK Suciadi Ciptono Rahayu¹, Ema Rachmawati², Ade Romadhony³ ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom Abstrak Perkembangan teknologi dan industri membuat jumlah produk barang dan jasa serta opini masyarakat terhadap produk pun semakin banyak dan beragam. Kebutuhan dan keinginan manusia terhadap suatu produk juga memiliki kriteria yang berbeda - beda. Berdasarkan fenomena - fenomena tersebut, sistem information retrieval dapat digunakan dalam membantu manusia dalam mencari produk sesuai kriteria - kriteria yang dibutuhkan berdasarkan pada opini - opini yang diberikan terhadap setiap produk tanpa harus bersusah payah membaca dan mencari seluruh opini yang ada pada setiap produk. Data produk yang akan digunakan pada kasus ini adalah data produk mobil. Sehingga untuk hasilnya akan diurutkan daftar mobil dari yang paling relevan dengan query masukkan pengguna, yaitu daftar mobil yang memiliki bobot paling besar hingga ke kecil. Sebelum dilakukan pemberian bobot pada tiap mobil, opini - opini yang dimiliki tiap mobil dan query yang diinput oleh pengguna akan dilakukan data preprocessing sehingga didapatkan data yang benar - benar dianggap penting dan dibutuhkan dalam sistem. Sistem information retrieval dalam proses pemberian bobot yang dibangun dalam kasus ini menggunakan pendekatan vector based, dengan metode yang digunakan adalah generalized vector space model. Metode ini terbukti dapat menghasilkan daftar produk yang relevan dengan menghitung bobot kemiripan query masukkan pengguna dengan opini - opini yang dimiliki setiap produk[5]. Hasil yang diberikan sistem dengan query lebih dari satu kata sudah dapat menunjukkan ranking mobil dan akan lebih spesifik jika menggunakan kata yang berhubungan dengan mobil dan atau merk mobil. Sedangkan hasil pengujian MOS menunjukkan hasil yang cukup baik dengan rata – rata relevansi dan akurasi sebesar 3,87. Kata Kunci : information retrieval, data preprocessing, vector based, generalized vector space model Abstract The technology and industry growth make increasement the value of product and service and various public opinions to the product. Human needs and desires of the product also has different criteria. Based on the phenomenons, information retrieval systems can be used to help people in finding a suitable product by criterias that are needed based on the opinions given on every product without having to bother to read and search all the existing opinion on any product. . The data of product that will be used in this case is a car product data. So for the results to be sorted list of the cars that are most relevant to the query that user type, that is the list of cars from the greatest weight to the lower weight. Before assigning weights to each car, opinions which each car has and query that user type will be processed by data preprocessing to get the correct data - was considered important and needed in the system. Information retrieval system in the process of assigning weights that is constructed in this case uses a vector-based approach, the method used is the generalized vector space models. This method proved to be able to generate a list of products that are relevant by calculating the similarity of the query that user type and the opinion of every product[5]. The results given by system with more than one word in query can already show car ranking and it will be more specific when using words related to car and or brands of cars. While the MOS test results showed good results with average of relevance and accuracy is 3.87. Keywords : information retrieval, data preprocessing, vector based, generalized vector space model Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2013 Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Upload: nguyennhi

Post on 26-Apr-2019

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: IMPLEMENTASI GENERALIZED VECTOR SPACE MODEL …repository.telkomuniversity.ac.id/pustaka/files/96091/resume/... · vektor dokumen dan query selanjutnya akan dilakukan perkalian vektor

IMPLEMENTASI GENERALIZED VECTOR SPACE MODEL PADA PENCARIANPRODUK BERBASIS OPINI PRODUK

Suciadi Ciptono Rahayu¹, Ema Rachmawati², Ade Romadhony³

¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

AbstrakPerkembangan teknologi dan industri membuat jumlah produk barang dan jasa serta opinimasyarakat terhadap produk pun semakin banyak dan beragam. Kebutuhan dan keinginanmanusia terhadap suatu produk juga memiliki kriteria yang berbeda - beda. Berdasarkanfenomena - fenomena tersebut, sistem information retrieval dapat digunakan dalam membantumanusia dalam mencari produk sesuai kriteria - kriteria yang dibutuhkan berdasarkan pada opini- opini yang diberikan terhadap setiap produk tanpa harus bersusah payah membaca dan mencariseluruh opini yang ada pada setiap produk. Data produk yang akan digunakan pada kasus iniadalah data produk mobil. Sehingga untuk hasilnya akan diurutkan daftar mobil dari yang palingrelevan dengan query masukkan pengguna, yaitu daftar mobil yang memiliki bobot paling besarhingga ke kecil. Sebelum dilakukan pemberian bobot pada tiap mobil, opini - opini yang dimilikitiap mobil dan query yang diinput oleh pengguna akan dilakukan data preprocessing sehinggadidapatkan data yang benar - benar dianggap penting dan dibutuhkan dalam sistem. Sisteminformation retrieval dalam proses pemberian bobot yang dibangun dalam kasus inimenggunakan pendekatan vector based, dengan metode yang digunakan adalah generalizedvector space model. Metode ini terbukti dapat menghasilkan daftar produk yang relevan denganmenghitung bobot kemiripan query masukkan pengguna dengan opini - opini yang dimiliki setiapproduk[5]. Hasil yang diberikan sistem dengan query lebih dari satu kata sudah dapatmenunjukkan ranking mobil dan akan lebih spesifik jika menggunakan kata yang berhubungandengan mobil dan atau merk mobil. Sedangkan hasil pengujian MOS menunjukkan hasil yangcukup baik dengan rata – rata relevansi dan akurasi sebesar 3,87.

Kata Kunci : information retrieval, data preprocessing, vector based, generalized vector spacemodel

AbstractThe technology and industry growth make increasement the value of product and service andvarious public opinions to the product. Human needs and desires of the product also has differentcriteria. Based on the phenomenons, information retrieval systems can be used to help people infinding a suitable product by criterias that are needed based on the opinions given on everyproduct without having to bother to read and search all the existing opinion on any product. . Thedata of product that will be used in this case is a car product data. So for the results to be sortedlist of the cars that are most relevant to the query that user type, that is the list of cars from thegreatest weight to the lower weight. Before assigning weights to each car, opinions which eachcar has and query that user type will be processed by data preprocessing to get the correct data -was considered important and needed in the system. Information retrieval system in the processof assigning weights that is constructed in this case uses a vector-based approach, the methodused is the generalized vector space models. This method proved to be able to generate a list ofproducts that are relevant by calculating the similarity of the query that user type and the opinionof every product[5]. The results given by system with more than one word in query can alreadyshow car ranking and it will be more specific when using words related to car and or brands ofcars. While the MOS test results showed good results with average of relevance and accuracy is3.87.

Keywords : information retrieval, data preprocessing, vector based, generalized vector spacemodel

Powered by TCPDF (www.tcpdf.org)

Tugas Akhir - 2013

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Page 2: IMPLEMENTASI GENERALIZED VECTOR SPACE MODEL …repository.telkomuniversity.ac.id/pustaka/files/96091/resume/... · vektor dokumen dan query selanjutnya akan dilakukan perkalian vektor

1

1. Pendahuluan

1.1 Latar Belakang

Perkembangan teknologi informasi dan komunikasi semakin berkembang

pesat. Era ini bisa kita sebut sebagai era social computing, dimana setiap orang

dapat dengan mudah saling berkomunikasi dan berinteraksi dimanapun kapanpun

sehingga banyak orang mengemukakan pendapat pada hal - hal seperti barang,

peristiwa, orang lain, dan lain - lain[3][11]. Fenomena yang terjadi ini membuat

banyak pendapat tersebut menjadi bahan pertimbangan pengambilan keputusan.

Sektor industri produk barang atau jasa juga semakin berkembang dengan

lahirnya inovasi - inovasi baru untuk menarik pembeli dan memenuhi kebutuhan

banyak orang.. Keadaan ini berpengaruh ketika masyarakat mengambil keputusan

dalam memilih barang atau jasa yang mereka butuhkan atau inginkan menjadi

semakin sulit dan lama.

Sistem pemberian rating pada suatu hal pada social community menjadi

pendukung yang berpengaruh dalam pemilihan hal tersebut[12]. Ketika

masyarakat ingin mencari mobil, mereka dapat memasukkan kriteria barang yang

mereka inginkan berupa query yang selanjutnya query masukkan tersebut akan

dicocokkan kedekatannya dengan review publik pada tiap mobil yang selanjutnya

mobil - mobil tersebut akan diberikan rating, sehingga pada akhirnya akan

ditampilkan mobil - mobil yang sesuai atau mendekati sesuai dengan keinginan

mereka.

Salah satu metode yang dapat digunakan pada kasus ini yang merupakan

proses information retrieval dimana dicari suatu dokumen mobil yang memiliki

kedekatan tertinggi dengan query adalah metode dengan pendekatan vector based

dimana setiap masukkan pengguna dan dokumen akan dianggap sebagai vector

dengan memiliki bobot tiap termnya[6]. Metode yang digunakan dalam kasus ini

adalah generalized vector space model. Proses awal yang dilakukan dalam

membangun sistem yang dijelaskan sebelumnya melakukan data preprocessing

pada dataset sehingga didapatkan data yang benar - benar dianggap penting dan

dibutuhkan sistem.

Tugas Akhir - 2013

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Page 3: IMPLEMENTASI GENERALIZED VECTOR SPACE MODEL …repository.telkomuniversity.ac.id/pustaka/files/96091/resume/... · vektor dokumen dan query selanjutnya akan dilakukan perkalian vektor

2

Implementasi metode generalized vector space model pada kasus ini

adalah untuk mendapatkan nilai similaritas tiap dokumen mobil dengan query

dengan menggunakan pendekatan ruang vektor. Pada metode ini, query dari

pengguna dan data set berupa review pada tiap mobil akan dikenakan operasi

perkalian titik dan hasilnya menjadi acuan dalam menentukan relevansi query dari

pengguna dan data set. Dengan metode ini, dokumen mobil dengan eksistensi tiap

term yang sama akan digabungkan sehingga dimensi matriks pada penghitungan

menjadi lebih kecil. Pada sistem ini akan dilakukan evaluasi untuk mengetahui

query masukkan yang tepat untuk sistem. Implementasi generalized vector space

model pada kasus ini adalah dengan menggunakan bobot tiapa term pada tiap

dokumen yang selanjutnya akan digunakan dalam pembuatan vektor. Vektor –

vektor dokumen dan query selanjutnya akan dilakukan perkalian vektor sehingga

didapatkan nilai similaritas antar vektor tiap dokumen dengan vektor query.

1.2 Perumusan masalah

Permasalahan yang akan dibahas dalam Tugas Akhir ini antara lain :

1. Bagaimana sistem penghitungan kedekatan query masukkan pengguna

dengan review pada tiap dokumen mobil yang ada dengan

menggunakan metode generalized vector space model?

1.3 Batasan Masalah

Adapun batasan masalah dalam pengerjaan Tugas Akhir ini. Diantaranya

adalah sebagai berikut:

1. Pencarian hanya dilakukan dalam satu produk barang, yaitu mobil.

2. Data set berupa daftar jenis - jenis mobil beserta opininya masing -

masing sudah dalam bentuk format file.

3. Semua review dalam dataset adalah opini.

1.4 Tujuan

Tujuan dari Tugas Akhir ini adalah:

Tugas Akhir - 2013

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Page 4: IMPLEMENTASI GENERALIZED VECTOR SPACE MODEL …repository.telkomuniversity.ac.id/pustaka/files/96091/resume/... · vektor dokumen dan query selanjutnya akan dilakukan perkalian vektor

3

1. Mengimplementasikan metode generalized vector space model pada

kasus pencarian produk berdasarkan opini dengan studi kasus pencarian

mobil.

1.5 Metodologi Penyelesaian Masalah

Metodologi yang digunakan dalam penyelesaian masalah - masalah yang

ada pada kasus tugas akhir ini adalah sebagai berikut:

1. Identifikasi Masalah dan Solusi

Memilih kasus dan merumuskan masalah yang dimiliki pada kasus

tersebut serta merancang solusi berupa pengembangan suatu sistem.

2. Studi Literature

Mempelajari sistem implementasi information retrieval dan metode

generalized vector space model.

3. Pengumpulan Data

Mengumpulkan data - data yang diperlukan dalam pembuatan sistem

berupa data jenis - jenis mobil beserta opini yang dimiliki.

4. Perancangan Sistem

Menganalisis sistem yang dibutuhkan beserta dengan komponen -

komponen pendukung yang dibutuhkan.

5. Implementasi

Mengimplementasikan sistem dan komponen yang dirancang sebelumnya

ke dalam bentuk aplikasi.

6. Pengujian dan Analisas Hasil

Melakukan pengujian terhadap sistem yang dibangun dan melakukan

analisa terhadap hasil yang diberikan.

Powered by TCPDF (www.tcpdf.org)

Tugas Akhir - 2013

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Page 5: IMPLEMENTASI GENERALIZED VECTOR SPACE MODEL …repository.telkomuniversity.ac.id/pustaka/files/96091/resume/... · vektor dokumen dan query selanjutnya akan dilakukan perkalian vektor

33

5. Kesimpulan dan Saran

5.1 Kesimpulan

Berdasarkan pengujian yang dilakukan pada sistem ini, dapat disimpulkan

beberapa hal sebagai berikut:

1. Jumlah kata dalam query selain satu kata memungkinkan terbentuknya

minterm semakin kecil.

2. Pada pengujian MOS menghasilkan nilai rata – rata yang cukup baik, yaitu

3,87 yang terdiri dari sapek akurasi hasil dan relevansi isi dokumen.

5.2 Saran

1. Sistem dapat memberikan suggestion kata terutama kata yang berhubungan

dengan produk pada sistem ketika mengetikkan query.

2. Sistem dapat memberikan rekomendasi perbaikan penulisan kata pada query

yang diduga mengalami kesalahan pada pengetikan.

Powered by TCPDF (www.tcpdf.org)

Tugas Akhir - 2013

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Page 6: IMPLEMENTASI GENERALIZED VECTOR SPACE MODEL …repository.telkomuniversity.ac.id/pustaka/files/96091/resume/... · vektor dokumen dan query selanjutnya akan dilakukan perkalian vektor

34

6. Daftar Pustaka

[1]Blanchard,Antonie. 2007. Understanding and customizing stopword lists for

enhanced patent mapping .Switzerland: Syngenta Crop Protection AG

[2]Bunyamin, Hendra. (2008). Aplikasi Information Retrieval (IR) CATA Dengan

Metode Generalized Vector Space Model. Bandung: Universitas Kristen

Maranatha

[3] Ganesan,Kavita and Chengxiang,Zhai. 2011. Opinion-Based Entity Ranking

.Chicago: University of Illinois

[4]Herwansyah, Adhit. (2009). Aplikasi Pengkategorian Dokumen dan

Pengukuran Tingkat Similaritas Dokumen menggunakan Kata Kunci pada

Dokumen Penulisan Ilmiah Universitas Gunadarma. Jakarta: Universitas

Gunadarma.

[5]Jiang,Fan. 2000. Approximate Dimension Equalization in Vector-based

Information Retrieval .Durham: Duke University

[6]Manning, Christopher. 2008. An Introduction to Information Retrieval

.Cambridge: Cambridge University

[7]Paskaleva,Biliana. 2011. A vector space model for information retrieval with

generalized similarity measures .USA: Sandia National Laboratories

[8] Sanderson,Mark. 2011. The History of Information Retrieval Research .

Melbourne: RMIT Universiy

[9]Schutze,Hinrich. 2012. Information Retrieval and Text Mining .Stuttgart:

University 0f Stuttgart

[10]Smirnov,Ilia. 2008. Overview of Stemming Algorithms .Chicago: DePaul

University

[11]Stelzner,Michael. 2009. Social Media Marketing Industry Report .USA:

Social Media Examiner

[12]Wang,Yuan. 2004. Computing Page Rank in a Distributed Internet Search

System .Madison: University of Wiscons

Tugas Akhir - 2013

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Page 7: IMPLEMENTASI GENERALIZED VECTOR SPACE MODEL …repository.telkomuniversity.ac.id/pustaka/files/96091/resume/... · vektor dokumen dan query selanjutnya akan dilakukan perkalian vektor

35

[13]Wibowo Adi, Handojo Andreas, Taliwang Minardi. Recommender System di

Perpustakaan Universitas Kristen Petra menggunakan Rocchio Relevance

Feedback dan Cosine Similarity. Surabaya: Universitas Kristen Petra.

[14]Wibowo, Ari. Pengujian Kerelevanan Sistem Temu Kembali Informasi.

Batam: Politeknik Negri Batam.

Powered by TCPDF (www.tcpdf.org)

Tugas Akhir - 2013

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika