model pengenalan aksara jepang menggunakan augmented … · 2017. 7. 11. · hiragana....

23
Model Pengenalan Aksara Jepang Menggunakan Augmented Reality dan Optical Character Recognition Artikel Ilmiah Peneliti : Meland Tetumanto Neno (672015710) Ramos Somya, S.Kom., M.Cs. Program Studi Teknik Informatika Fakultas Teknologi Informasi Universitas Kristen SatyaWacana Salatiga April 2016

Upload: others

Post on 18-Jan-2021

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

Model Pengenalan Aksara Jepang Menggunakan Augmented Reality dan Optical Character Recognition

Artikel Ilmiah

Peneliti : Meland Tetumanto Neno (672015710)

Ramos Somya, S.Kom., M.Cs.

Program Studi Teknik Informatika Fakultas Teknologi Informasi

Universitas Kristen SatyaWacana Salatiga

April 2016

Page 2: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

i

Model Pengenalan Aksara Jepang Menggunakan Augmented Reality dan Optical Character Recognition

Artikel Ilmiah

Diajukan kepada Fakultas Teknologi Informasi

untuk memperoleh gelar Sarjana Komputer

Peneliti :

Meland Tetumanto Neno (672015710) Ramos Somya, S.Kom., M.Cs.

Program Studi Teknik Informatika Fakultas Teknologi Informasi

Universitas Kristen SatyaWacana Salatiga

April 2016

Page 3: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

ii

Page 4: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

iii

Page 5: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

iv

Page 6: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

v

Page 7: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

vi

Page 8: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

vii

Page 9: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

viii

Page 10: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

1

1. Pendahuluan Jepang merupakan salah satu negara maju yang terletak di kawasan

Asia.Banyak pihak yang menjadi tertarik dengan negara Jepang, mulai dari sekedar berwisata, pendidikan, hingga berinvestasi di Jepang.Ketertarikan terhadap Jepang juga dapat dilihat di Indonesia.Selain karena kemajuan ekonominya, ketertarikan terhadap budaya Jepang juga dipengaruhi oleh usaha propaganda Jepang sendiri melalui komik-komik maupun film-film kartun yang mereka produksi.Salah satu bukti ketertarikan masyarakan Indonesia terhadap kebudayaan Jepang adalah jumlah buku-buku dari Jepang yang diterjemahkan ke dalam bahasa Indonesia.Karena perekonomiannya yang bertumbuh pesat, sejak tahun 1980-an semakin banyak buku bahasa Jepang yang diterjemahkan [1]. Hingga saat ini, tingkat ketertarikan masyarakat terhadap budaya Jepang semakin tinggi, termasuk terhadap bahasa Jepang.

Bahasa Jepang merupakan bahasa ke-9 yang paling banyak digunakan oleh orang-orang di seluruh duniakarena memiliki lebih dari 125 juta pengguna [2].Selain oleh orang Jepang sendiri, bahasa Jepang juga banyak dipelajari oleh orang-orang luar, termasuk Indonesia.Banyak sekolah maupun perguruan tinggi yang membuka kelas-kelas bahasa Jepang bagi siswa dan mahasiswa mereka.Namun bahasa Jepang merupakan salah satu bahasa di dunia yang paling sulit dipelajari [3].Salah satu hal yang menjadi kesulitan bagi pelajar bahasa Jepang adalah sistem penulisannya. Tidak seperti bahasaIndonesia yang mengadopsi aksara latin untuk menjadi standar penulisan secara nasional, bahasa Jepang ditulis dalam campuran tiga jenis simbol, yaitu kanji, katakana, dan hiragana.

Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada tahun 1981 pemerintah Jepang menetapkan daftar karakter kanji untuk penggunaan sehari-hari di Jepang yang disebut Jōyō kanji hyō yang berisi 1.945 karakter [4], dan pada tahun 2010, jumlahnya bertambah menjadi 2.136 karakter [5]. Sedangkan karakter-karakter katanana dan hiragana digunakan hanya untuk melambangkan suatu bunyi dari suku kata tertentu.Pemilihan karakter-karakter katakana maupun hiragana yang digunakan saat ini ditetapkan pada tahun 1900.Hasil dari keputusan tersebut adalah terdapat 46 simbolyang diakui secara resmi dari masing-masing katakana maupun hiragana [4].

Banyaknya karakter kanji, katakana, dan hiragana menyebabkan orang mengalami kesulitan untuk membaca dan mempelajari tulisan-tulisan berbahasa Jepang. Terlebih lagi bagi masyarakat Indonesia karena bahasa Indonesia memiliki sistem penulisan yang berbeda dengan sistem penulisan bahasa Jepang. Penggunaan tabel kanji dan kana untuk membaca dan mempelajari tulisan Jepang memang dapat membantu, namun pengguna akan kesulitan mengingat banyaknya karakter aksara dalam sistem penulisan bahasa Jepang. Karena itu penelitian ini diharapkan menghasilkan suatu model pengenalan aksara Jepanguntuk mempermudah proses pembelajaran.

Aplikasi yang dihasilkan akan membantu pengguna untuk mempelajari sistem penulisan dan pengucapan aksara Jepang. Aplikasi ini dibuat berbasis Android agar proses pembelajaran tersebut dapat dilakukan dengan fleksibel dalam hal waktu dan tempat, mengingat pengguna aplikasi mobile adalah

Page 11: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

2

pengguna yang terus bergerak dan membutuhkan akses sistem di manapun dan kapanpun [6].Untuk memudahkan pengguna mempelajari karakter aksara Jepang pada media fisik, aplikasi ini memanfaatkan teknologi Augmented Reality (AR) dan Optical Character Recognition (OCR).Aplikasi akan melakukan pemindaian obyek secara real-time dengan AR, kemudian dengan OCR, aplikasi akan memeriksa karakter hasil pindaian dan mengubahnya menjadi bentuk yang dikenali komputer. Selanjutnya aplikasi akan memberikan informasi kepada pengguna mengenai karakter, cara penulisan, dan cara membaca karakter hasil pindaian tersebut. Dengan demikian pengguna dapat mempelajari cara penulisan suatu karakter tertentu yang terdapat pada media cetak.

Aplikasi yang dihasilkan mencakup seluruh karakter katakana dan hiragana, namun karena jumlahnya yang banyak, karakter kanji yang dicakupi oleh aplikasi ini adalah sebanyak 18 karakter. Untuk mempercepat proses pemindaian dan pengenalan karakter, jumlah karakter yang dapat dikenali per satu kali pindaian adalah sebanyak 5 karakter. Selain itu, walaupun setiap karakter kanji memiliki lebih dari satu cara pengucapan, aplikasi ini hanya akan memberikan satu cara pelafalan saja kepada pengguna.

2. Tinjauan Pustaka

Penelitian ini disusun berdasarkan penelitian-penelitian sebelumnya.Penelitian pertama berjudul Perancangan Aplikasi Pembelajaran Bahasa Jepang Dalam Mempelajari Tulisan Kanji Dengan Menggunakan Augmented Reality [7].Aplikasi yang dihasilkan dalam penelitian tersebut membantu pengguna dalam mengenali karakter-karakter kanji berdasarkan bentuk dan makna karakter tersebut.Namun hasil penelitian tersebut tidak begitu relevan dengan pengguna perangkat mobile dewasa ini, karena dikembangkan untuk perangkat desktop saja. Selain itu aplikasi yang dihasilkan tidak mencakup cara penulisan karakter aksara Jepang.

Penelitian yang berjudul Pengembangan Aplikasi Android Realtime Translation Untuk Menerjemahkan Bahasa Jepang ke Bahasa Indonesiamenghasilkan aplikasi Android untuk menerjemahkan kata maupun kalimat bahasa Jepang.Aplikasi tersebut memiliki kemampuan untuk menerjemahkan secara real-time tulisan-tulisan Jepang yang terdapat pada dokumen cetak [3]. Namun hasil penelitian tersebut hanya bertujuan untuk menerjemahkan saja dan tidak mencakup pembelajaran carapenulisannya.

Penelitian selanjutnya yang menjadi dasar penelitian ini berjudul Pembuatan Aplikasi Aksara Jepang Menggunakan AndEngine Berbasis Android [8]. Penelitian tersebut menghasilkan aplikasi pembelajaran cara penulisan aksara Jepang.Namun aplikasi tersebut tidak dapat memindai karakter aksara Jepang secara real-time dari media cetak.Selain itu, saran yang diberikan pada akhir penelitian ini adalah menambahkan karakter kanji agar lebih lengkap serta memberikan efek suara sehingga aplikasi menjadi lebih menarik.

Berdasarkan hasil dan saran yang diberikan oleh penelitian-penelitian sebelumnya, maka dilakukan penelitian untuk merancang suatu media pembelajaran untuk membantu memudahkan pembelajaran dan pengenalan aksara Jepang.Aplikasi yang dikembangkan dalam penelitian ini menggunakan beberapa

Page 12: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

3

teknologi.Augmented reality digunakan untuk membaca karakter Jepang yang ada pada dokumen cetak.Optical Character Recognition digunakan untuk melakukan konversi data gambar karakter fisik menjadi karakterdigital yang dikenali oleh komputer.Aplikasi ini dibangun di atas platformAndroid agar pengguna dapat melakukan pembelajaran dengan lebih fleksibel dalam hal tempat maupun waktu, sehingga pengguna dapat lebih cepat mengenali aksara Jepang.

Augmented Reality (AR) adalah suatu variasi dari Virtual Reality (VR).Berbeda dengan VR yang secara utuh memasukkan penggunanya ke dalam suatu lingkungan buatan, AR hanya menambahkan obyek-obyek virtual yang diinginkan ke dalam dunia nyata.Obyek virtual tersebut merupakan informasi yang tidak dapat dideteksi oleh manusia secara langsung menggunakan panca indranya.Beberapa sifat yang dimiliki oleh AR, antara lain (1) menggabungkan dunia nyata dengan dunia virtual, dan (2) bersifat interaktif secara real-timedengan pengguna.Informasi yang ditampilkan oleh AR membantu manusia dalam aktivitasnya di dunia nyata.Selain itu, AR juga menambahkan wawasan serta ketertarikan manusia dalam berinteraksi dengan dunia nyata [9]. Dalam penelitian ini, informasi yang ditambahkan ke dalam dunia nyata adalah cara membaca karakter, cara pengucapan karakter, maupun cara penulisan karakter.

Tool yang digunakan untuk memanfaatkan AR dalam aplikasi ini bernama OpenCV.OpenCV adalah suatu pustaka computer vision yang ditulis menggunakan C dan C++ dan dapat dijalankan pada berbagai sistem operasi.OpenCV dikembangkan oleh Intel dan dirancang untuk efisiensi dalam komputasi dengan berfokus pada aplikasi real-time.Salah satu tujuan dari OpenCV adalah menyediakan sistem computer vision yang mudah digunakan, agar orang-orang dapat membuat aplikasi yang lebih baik dengan lebih cepat. Pada aplikasi yang dihasilkan dalam penelitian ini, pustaka OpenCV digunakan untuk memindai gambar, khususnya karakter, yang tercetak pada media fisik, lalu mengkonversi hasil pemindaian ke dalam bentuk bitmap.

Optical Character Recognition (OCR) adalah salah satu cabang dari bidang Kecerdasan Buatan yang memungkinkan komputer mengidentifikasi karakter-karakter (huruf) yang ada pada dokumen cetak.Walaupun dalam proses identifikasi tersebut OCR dapat menghasilkan kesalahan, OCR yang baik harus memberikan hasil pengenalan karakter dengan akurasi minimal 99% [11].ToolOCR yang digunakan pada aplikasi ini bernama Tesseract, yaitu sebuah engineOCRoffline yang bersifat open-source.Tesseract dikembangkan oleh Hawlett Packard dari tahun 1984 hingga 1994 [12].Tesseractdianggap sebagai salah satu open-source engine yang paling akurat yang tersedia [13]. Aplikasi yang dihasilkan menggunakan pustaka Tesseract, dengan mengambil citra digital berformat bitmap dari proses sebelumnya, untuk dikonversi ke dalam bentuk teks.

3. Metode dan Perancangan Sistem

Penelitian ini dilakukan melalui lima tahapan penelitian. Tahap-tahap tersebut adalah (1) Analisis kebutuhan, (2) perancangan sistem, (3) implementasi, (4) pengujian sistem, dan (5) penulisan laporan dan hasil penelitian.Alur dari tahapan tersebut dapat dilihat pada Gambar 1.

Page 13: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

4

Tahap-tahapdalam penelitian yang terlihat pada Gambar 1 dapat dijelaskan sebagai berikut. Pada tahap pertama, analisis kebutuhan dan pengumpulan data dilakukan analisis kebutuhan apa saja yang dibutuhkan oleh para pengguna dalam mempelajari aksara Jepang, seperti tabel katakana, hiragana, dan kanji, langkah-langkah penggoresan huruf, serta cara pengucapannya. Untuk mengajarkan hal-hal tersebut kepada para pembelajar, pada umumnya buku-buku pembelajaran menyajikan tabel yang berisi elemen-elemen berupa daftar suku kata kanji, katakana, maupun hiragana, bunyi, serta cara penulisan. Untuk cara pengucapan, beberapa buku menyertakan kaset / CD audio sebagai pelengkap bagi pembelajar ketika mempelajari cara pengucapan karakter-karakter bahasa Jepang. Elemen tersebutlah yang menjadi kebutuhan pembelajar dalam mempelajari sistem penulisan bahasa Jepang.

Tahap kedua adalah perancangan sistem yang meliputi perancangan proses, perancangan basis data, dan perancangan antarmuka. Perancangan proses dilakukan dengan menggunakan menggunakan diagram Unified Modelling Language (UML) yang pada penelitian ini terdiri dari use case diagram, activity diagram, sequence diagram dan class diagram. Perancangan basis data dilakukan untuk merancang tabel-tabel yang dibutuhkan untuk penyimpanan data, berupa huruf-huruf aksara Jepang ke dalam device Android.

Perancangan proses dilakukan dengan metodologi berorientasi obyek menggunakan UML yang terdiri dari berbagai diagram. Use case diagram menggambarkan fungsionalitas apa saja yang dapat dijalankan oleh sistem.

Gambar 1 Tahapan Penelitian

Gambar 2 Use Case Diagram Aplikasi Pembelajaran

Page 14: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

5

Secara umum, aplikasi memiliki 4 fungsi utama.Aktor dalam sistem ini adalah pengguna perangkat mobile. Dalam use case pindai karakter, pengguna memberikan input kepada aplikasi dengan cara memindai karakter pada dokumen fisik, untuk selanjutnya aplikasi akan memberikan informasi kepada pengguna mengenai cara penulisan karakter tersebut dan juga cara pengucapannya. Use case jelajah karakter juga memberikan hasil yang sama kepada pengguna, namun input yang diberikan oleh pengguna adalah berupa grid daftar karakter aksara Jepang. Use case latihan menggambarkan fungsi latihan kepada pengguna. Use case terakhir adalah penerjemahan, yang melambangkan fungsi penerjemahan dari bahasa Jepang ke dalam bahasa Indonesia, maupun sebaliknya.

Activity diagram menggambarkan aliran aktifitas yang terjadi dalam sistem. Pada aplikasi dalam penelitian ini, aktifitas utama yang terjadi adalah pada saat pengguna melakukan pemindaian karakter fisik menggunakan perangkatnya. Rincian aktifitas tersebut dapat dilihat pada gambar 3.

Pemindaian dimulai pada saat pengguna mengarahkan perangkat mobile kepada dokumen fisik yang tercetak karakter Jepang tertentu. Aplikasi akan melakukan validasi terhadap obyek yang dipindai tersebut. Proses pemindaian akan terus dilakukan hingga ditemukan marker yang dikenali oleh aplikasi. Setelah itu aplikasi akan mengkonversi gambar hasil pindaian menjadi karakter Jepang yang sesuai dalam bentuk digital. Kemudian karakter ini akan menjadi parameter untuk aplikasi mengambil data berupa cara membaca karakter. Selanjutnya aplikasi akan membangkitkan nama berkas gif untuk mengambil berkas gambar bergerak. Terakhir, gambar bergerak serta informasi cara membaca ditampilkan kepada pengguna.

Gambar 3 Activity Diagram Pindai Dokumen

Page 15: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

6

Selain use case diagram dan activity diagram, perancangan juga dilakukan menggunakan sequence diagram. Diagram ini menggambarkan interaksi antar obyek, baik di dalam maupun di sekitar sistem, secara kronologis. Pada penelitian ini, aliran data pada setiap activity diagram akan diperrinci dalam sequence diagram.

Pada saat pengguna menjalankan aplikasi untuk pertama kali setelah instalasi, aplikasi akan membaca berkas file pada assets yang berisi himpunan huruf Jepang, baik katakana, hiragana, maupun kanji. Setelah menerima data-data tersebut, aplikasi akan menyimpannya ke dalam basis data SQLite pada perangkat mobile, sehingga aplikasi tidak perlu meminta data lagi ketika dijalankan di kemudian hari. Kemudian, aplikasi akan memberikan tampilan kepada pengguna, untuk selanjutnya pengguna dapat memilih fungsi yang ingin dia jalankan.

Pengguna melakukan pemindaian dokumen fisik hingga aplikasi mengenali hasil pindaian yang dilakukan pengguna. Jika hasil pindaian tersebut valid, aplikasi akan mengkonversi gambar tersebut ke dalam bentuk karakter digital menggunakan framework OCRTesseract. Setelah itu, aplikasi akan meminta informasi mengenai karakter tersebut kepada basis data. Informasi yang diberikan oleh basis data adalah berupa id dan cara membaca karakter, serta arti dari karakter yang dipindai. Setelah itu aplikasi membangkitkan nama berkas gif dan mengambil berkas gif yang sesuai dari asset andorid. Setelah semua informasi yang dibutuhkan lengkap, aplikasi akan menampilkan data-data tersebut kepada pengguna.

Diagram terakhir yang dirancang adalah class diagram. Cakupan class diagram pada penelitian ini adalah kelas-kelas utama yang dibuat pada proses

Gambar 4 Sequence Diagram Pindai Karakter

Page 16: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

7

implementasi (coding).Class diagram yang dirancang dalam penelitian ini dapat dilihat pada Gambar 5.

Class diagrampada Gambar 5 memiliki 4 kelas utama. Kelas CameraAR adalah kelas utama pada aplikasi, yang berisi kode untuk melakukan pemindaian karakter pada media fisik. Saat aplikasi melakukan pemindaian karakter, kelas ini memanggil instance dari kelas DoOCR yang mewarisi kelas AsyncTask. Pada kelas DoOCR ini, proses pengenalan karakter fisik menjadi karakter digital dilakukan dengan memanfaatkan pustaka Tesseract. Setelah selesai melakukan pengenalan karakter, hasilnya dikembalikan ke kelas CameraAR. Kelas CameraAR selanjutnya mengambil seluruh informasi dari basis data melalui kelas DBFielder. Kelas DBFielder berfungsi untuk membuka dan menutup basis data, mengambil karakter tertentu, serta mengambil seluruh karakter yang tersimpan dalam basis data beserta informasi pendukung karakter tersebut.

Inti dari aplikasi yang dihasilkan adalah proses pemindaian dan pengenalan karakter. Proses

Tahap ketiga adalah implementasi, di mana hasil perancangan diimplementasikan menjadi aplikasi Android. Implementasi dilakukan dengan bantuan Eclipse IDE untuk melakukan pengkodean serta pembangunan basis data. Aplikasi ini diimplementasikan dengan memanfaatkan beberapa pustaka pendukung, seperti OpenCV untuk penanganan kamera, Ion untuk melakukan tampilan gambar bergerak, dan Tesseract untuk melakukan pengenalan karakter aksara cetak. Tahap ini menghasilkan prototype aplikasi yang kemudian akan diuji dan diperbaiki menjadi aplikasi yang siap digunakan oleh pengguna umum.

Tahap pengujian dilakukan setelah tahap implementasi yang menghasilkan prototype aplikasi. Pengujian dilakukan sekaligus dengan evaluasi, selain untuk menguji efisiensi kode, juga untuk melakukan perbaikan-perbaikan minor yang disesuaikan dengan kebutuhan pengguna. Pada penelitian ini, siklus prototyping terjadi sebanyak dua kali berdasarkan hasil pengujian dan evaluasi yang dilakukan.

Siklus pertama menghasilkan prototype aplikasi yang memuat fungsi-fungsi utama. Prototype awal sudah dapat melakukan fungsi augmented reality yang menggunakan pustaka OpenCV, pengambilan data-data yang dibutuhkan dari

Gambar 5Class Diagram Aplikasi

Page 17: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

8

basis data, dan menampilkan animasi cara penulisan serta suara cara membaca aksara dengan pustaka Ion. Pengujian yang dilakukan terhadap prototype awal ini menemukan bahwa pada performanya, proses OCR masih cenderung lambat sehingga dibutuhkan cara lain untuk mempercepat proses. Evaluasi juga diberikan oleh beberapa pengguna, yakni agar menambahkan fitur penerjemahan dan latihan menulis aksara Jepang pada aplikasi ini.

Pada siklus berikutnya, dilakukan perubahan pada kode program untuk memperbaiki kelemahan dan menambah fitur pada aplikasi. Efisiensi OCR dioptimalkan dengan melakukan penyusutan pada matriks hasil pindaian dari kamera untuk selanjutnya dikonversi ke dalam bentuk bitmap yang diperlukan oleh OCR. Dengan demikian, proses OCR dapat dilakukan dengan lebih cepat. Selain optimasi kode, pada siklus kedua dilakukan penambahan fungsi penerjemahan dan latihan untuk membantu pengguna agar lebih cepat menghafalkan huruf-huruf aksara Jepang.

Tahap kelima adalah penulisan laporan hasil penelitian. Pada tahap ini, proses penelitian didokumentasikan proses penelitian yang sudah dilakukan dari tahap awal hingga akhir ke dalam tulisan, yang nantinya akan menjadi jurnal penelitian.

4. Hasil dan Pembahasan

Aplikasi yang dihasilkan ditujukan untuk para pengguna device Android yang tertarik untuk mempelajari aksara Jepan. Aplikasi ini dikembangkan dengan kebutuhan minimal Android SDKadalah API8, yaitu Android SDK 4.0. Pembatasan versi ini disesuaikan dengan kebutuhan minimum dari pustakaOpenCV yang digunakan untuk membuat aplikasi ini. Selain pustaka OpenCV untuk membantu menjalankan modul AR, aplikasi ini juga dibuat dengan bantuan beberapa pustaka lainnya, seperti pustaka Ion untuk menampilkan gambar berformat gif dan pustaka Tesseract untuk melakukan pengenalan karakter fisik.

Fungsi utama dari aplikasi dihasilkan ini adalah mengetahui cara menulis dan membaca karakter aksara Jepang yang terdapat pada media cetak. Pada awalnya aplikasi melakukan pemindaian karakter aksara Jepang pada media fisik dengan menggukan pustaka OpenCV. Proses pemindaian dengan menggunakan OpenCV akan menghasilkan citra digital dalam format matriks pada setiap frame yang dipindai secara terus-menerus.Dalam pustaka OpenCV, matriks direpresentasikan sebagai suatu array multi-dimensi numerik, yang menampung informasi hasil pemindaian kamera. Matriks hasil pemindaian tersebut dikonversi ke dalam format bitmap oleh fungsi matToBitmap()yang dimiliki OpenCV.

Kode Program 1 Proses Pemindaian Karakter Fisik 1 public Mat onCameraFrame(CvCameraViewFrame inputFrame) { 2 Rect rect = new Rect(bmp_start_x, bmp_start_y, R_WI, R_HI); 3 Mat cropped_mat = new Mat(mat, rect); 4 Utils.matToBitmap(cropped_mat, bmp); 5 doOCR = new DoOCR(); 6 doOCR.execute(); 7 doOCR.delegate = this; 8 return mat; 9 }

Page 18: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

9

Gambar bitmap yang dihasilkan pemindaian karaktermenjadi masukan dari proses yaitu proses pengenalan karakter (OCR). Proses ini dilakukan dengan memanfaatkan pustaka Tesseractselama proses pemindaian berlangsung. Proses ini dilakukan secara real-timetepat setelah proses pemindaian menghasilkan keluaran. Hasil dari proses adalah karakter bahasa Jepang dijital berformat UTF-8. Kode proses pengenalan karakter dapat dilihat para Kode Program 2.

Kode Program 2 Proses Pengenalan Karakter Fisik (OCR) 1 protected String doInBackground(Void... params) { 2 tessBaseAPI.setImage(bmp); 3 resultText = tessBaseAPI.getUTF8Text(); 4 handler.postDelayed(new Runnable() { 5 @Override 6 public void run() { 7 tessBaseAPI.stop(); 8 } 9 }, 2000); 10 isOCRing = false; 11 return resultText; 12 }

Setelah proses pengenalan karakter selesai, aplikasi memilikiteks berupa karakter aksara Jepang yang dikenali oleh komputer bertipe data String. Teks tersebut kemudian dipecah menjadi karakter-karakter tunggal lalu dimasukkan ke dalam sebuah array pada elemen masing-masing. Aplikasi kemudian membuat beberapa textviewsebanyak jumlah karakter yang ada, lalu memasukkan karakter-karakter tersebut ke dalam masing-masing textview. Lalu setiap textview yang ada diberikan onclicklistener untuk menangani masukan klik yang akan dilakukan oleh pengguna. Proses ini dapat dilihat pada Kode Program 3.

Kode Program 3Proses Pemasangan Textview 1 resultArr = resultText.split(""); 2 tvResult = new TextView(getApplicationContext()); 3 tvResult.setText(resultArr[i] != null ? resultArr[i] : "-"); 4 LinearLayout.LayoutParams llp = new LinearLayout.LayoutParams( LayoutParams.WRAP_CONTENT, LayoutParams.WRAP_CONTENT); 5 tvResult.setLayoutParams(llp); 6 tvResults.add(tvResult); 7 tvResult.setOnClickListener(new View.OnClickListener() { 8 @Override 9 public void onClick(View v) { 10 TextView tvSelected = (TextView)v; 11 if(((TextView)v).getText().toString() != "") 12 charaSelected(tvSelected); 13 } 14 });

Proses pemasangan textview dilanjutkan dengan proses pengambilan

informasi dari basis data dan proses pembangkitan nama berkas gif untuk ditampilkan kepada pengguna. Kedua proses ini membutuhkan masukan berupa array hasil pemindaian pada proses sebelumnya yang ditunjukkan pada Kode Program 3 baris pertama. Aplikasi menggunakan nama berkas yang dibangkitkan tersebut untuk mencari berkas yang sesuai dalam direktori resources. Ketika aplikasi mendapatkan berkas yang sesuai, berkas tersebut akan ditampilkan

Page 19: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

10

kepada pengguna dengan memanfaatkan pustaka Ion. Kedua proses ini masng-masing dapat dilihat pada Kode Program 4 dan Kode Program 5.

Kode Program 4Pembangkitan Nama Berkas 1 private String getCharaFileName(int char_id, int type){ 2 String file_name = ""; 3 if(type == 1){ 4 file_name += "katakana"; 5 char_id -= 0; 6 }else if(type == 2){ 7 file_name += "hiragana"); 8 char_id -= 51; 9 }else if(type == 3){ 10 file_name += "kanji"); 11 char_id -= 102; 12 } 13 file_name += "_" + char_id; 14 return file_name; 15 }

Kode Program 5Pemasangan Berkas Gambar Bergerak 1 long image_res_id = this.getResources().getIdentifier( getCharaFileName( japrom.getId(), japrom.getType()), "drawable", this.getPackageName()); 2 if(image_res_id == 0){ 3 ivShowJapChar.setImageResource(R.drawable.no_file); 4 }else{ 5 Ion.with(ivShowJapChar).load( "android.resource://mel.jap.app/" + image_res_id); 6 }

Untuk membantu pengguna mengetahui cara membaca karakter, aplikasi

dapat mengeluarkan suara yang sesuai dengan karakter yang terbaca. Proses ini dilakukan dengan menggunakan fungsi TextToSpeech yang dimiliki oleh Android SDK.Selain itu, aplikasi juga menampilkan animasi cara penulisan karakter berupa gambar gif yang menggunakan pustaka Ion. Tampilan fungsi pemindaian karakter, fungsi penerjemahan, dan fungsi latihan dapat dilihat berturut-turut pada Gambar 6, 7, dan 8.

Gambar 6 Tampilan Proses Pemindaian Karakter Fisik

Page 20: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

11

Pengujian aplikasi yang dilakukan meliputi pengujian alfa maupun pengujian beta. Pengujian alfa dilakukan untuk melakukan validasi fungsi-fungsi yang dimiliki aplikasi apakah sesuai dengan yang dirancang atau tidak. Pengujian alfa pada penelitian ini menggunakan teknik black box, yaitu pengujian fungsional yang berfokus pada mampu tidaknya aplikasi bekerja berdasarkan persyaratan tiap fungsinya [14]. Materi pengujian dapat dilihat pada Tabel 1.

Tabel 1 Tabel Pengujian Alfa

Fungsi Hasil Keputusan

Pemindaian Karakter Aplikasi memindai obyek fisik ke dalam sistem.

Valid

Pengenalan Karakter (OCR) Obyek fisik dikenali dalam format dijital UTF-8.

Valid

Animasi Penulisan Karakter Sistem membangkitkan nama berkas dan menampilkan berkas gambar bergerak (gif) kepada pengguna.

Valid

Suara Pengucapan Karakter Sistem mengeluarkan suara pengucapan karakter sesuai dengan yang dipindai oleh pengguna.

Valid

Berdasarkan keputusan-keputusan yang terdapat pada Tabel 1, dapat disimpulkan bahwa aplikasi ini sudah memenuhi fungsi yang diharapkan dan dapat berjalan dengan efektif.

Untuk memberi hasil yang optimal, jarak perangkat dengan media cetak serta ukuran tulisan yang dipindai harus diperhatikan agar pemindaian menghasilkan citra yang tajam dan terfokus. Selain itu, akurasi pemindaian menjadi sangat kecil ketika dilakukan pada tulisan tangan. Kesalahan yang terjadi pada aplikasi yang ditemukan dalam pengujian alfa ini adalah kesalahan

Gambar 7

Tampilan Proses Penerjemahan

Gambar 8

Tampilan Proses Pelatihan

Page 21: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

12

pengenalan karakter. Kesalahan ini disebababkan oleh beberapa faktor, seperti jumlah cahaya pada lingkungan obyek yang dipindai, kefokusan kamera yang digunakan, serta ukuran karakter yang dipindai oleh aplikasi. Selain itu, dari total 110 karakter yang dicakup oleh aplikasi, terdapat 6 karakter yang secara konsisten salah dibaca oleh aplikasi. Kesalahan ini diantisipasi dengan membuat suatu fungsi korespondensi karakter pada aplikasi.

Tabel 2 Kesalahan Pembacaan Karakter Karakter Asli Keterangan Karakter Hasil Keterangan

エ e (katakana) 工 koo (kanji) カ ka (katakana) 力 ryoku (kanji) ト to (katakana) 卜 boku (kanji) ノ no (katakana) 丿 (tidak terdefinisi) ロ ro (katakana) 口 kuchi (kanji) く ku (katakana) � (tidak terdefinisi)

Pengujian beta pada aplikasi dilakukan kepada sampel pengguna sebanyak

30 orang yang sedang belajar bahasa Jepang di berbagai tempat serta berasal dari berbagai kalangan dan usia. Responden diminta untuk mengisi kuesioner sebagai penilaian tingkat kepuasan mereka terhadap aplikasi. Penilaian kuesioner dilakukan dalam skala Likert dengan lima skala, yaitu sangat setuju (SS), Setuju (S), netral (N), tidak setuju (ST), dan sangat tidak setuju (STS).

Tabel 3Hasil Perhitungan Skala Likert

No Pertanyaan SS S N TS STS Hasil

Kinerja Aplikasi

1 Aplikasi ini sudah berjalan dengan baik 18 10 2 - - 90.7%

2 Kecepatan proses pemindaian karakter sudah baik 15 14 1 - - 89.3%

3 Proses pengenalan karakter sudah akurat 18 3 6 3 - 84%

Antarmuka

1 Tampilan antarmuka aplikasi ini menarik 5 10 12 3 - 71.3%

2 Tata letak tombol, tab, dan elemen lainnya membuat aplikasi mudah digunakan 13 10 7 - - 84%

3 Antarmuka aplikasi ini dapat dimengerti dengan baik 13 7 6 4 - 79.3%

Fungsionalitas dan Materi

1 Animasi penulisan karakter membantu pemahaman belajar 21 9 - - - 94%

2 Fitur pindai pada aplikasi ini membantu pembelajaran 22 8 - - - 94.7%

3 Fitur quiz pada aplikasi ini membantu pembelajaran 16 6 8 - - 85.3%

4 Fitur terjemahan pada aplikasi ini membantu pembelajaran 17 9 4 - - 88.7%

Page 22: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

13

Kolom hasil pada Tabel 3 menunjukkan persentase tingkat kepuasan para responden terhadap aplikasi yang dihitung berdasarkan skala Likert. Para responden sangat puas terhadap kinerja maupun fungsionalitas dari aplikasi. Untuk antarmuka aplikasi, para responden merasa puas terhadap tata letak dari elemen-elemen antarmuka. Tabel 3 juga menunjukkan bahwa antarmuka aplikasi dapat dimengerti sehingga memudahkan mereka untuk menggunakan aplikasi.

5. Simpulan Berdasarkan penelitian yang telah dilakukan, dapat ditarik beberapa

kesimpulan sebagai berikut: 1) Pembuatan aplikasi pengenalan karakter aksara Jepang dapat dibuat lakukan dengan memanfaatkan pustaka OpenCV, Tesseract, dan Ion, 2) pustaka Tesseract tidak 100% akurat dalam melakukan pengenalan karakter fisik, 3) aplikasi pengenalan karakter aksara Jepang ini dapat membantu pengguna untuk mempelajari aksara Jepang, 4) fitur augmented reality pada aplikasi ini dapat membantu pengguna untuk memahami karakter yang tercetak pada media cetak dan lebih menarik minat pengguna mempelajari aksara Jepang, 5) fitur animasi penulisan tiap karakter pada aplikasi ini dapat membantu pengguna untuk belajar cara penulisan setiap karakter dengan benar, 6) aplikasi ini dapat digunakan sebagai media alternatif pembelajaran aksara Jepang, 7) fitur suara dalam aplikasi ini dapat membantu pengguna memahami cara pengucapan karakter huruf aksara Jepang.

Adapun saran untuk penelitian berikutnya adalah: 1) Melengkapi karakter Kanji yang ada, 2) menambah informasi hasil pindaian dengan contoh penggunaan karakter yang bersangkutan ataupun informasi mengenai arti pada kanji, dan 3) menampilkan berbagai macam pelafalan kanji, yakni on, kun, dan okurigana.

6. Pustaka [1] Toshiki, Kasuya, dkk. 2009. Tinjauan Tentang Buku-buku Bahasa Jepang

Ke Dalam Bahasa Melayu. Jakarta:Kepustakaan Populer Gramedia. [2] Encyclopædia Britannica Ultimate Reference Suite. 2012. Japan. Illinois:

Encyclopædia Britannica. [3] Nugroho, Oky, dkk. 2013. Pengembangan Aplikasi Android Realtime

Translation Untuk Menerjemahkan Bahasa Jepang ke Bahasa Indonesia. Jakarta: Universitas Bina Nusantara.

[4] Hadamitzky, Wolfgang, dkk. 1997. Kanji & Kana: A Handbook of The Japanese Writing System. Singapura: Berkeley Books Pte. Ltd.

[5] Hadamitzky, Wolfgang, dkk. 2012. Kanji & Kana: A Complete Guide to The Japanese Writing System. Rutland: Tuttle Publishing.

[6] B’Far, Reza. 2005. Mobile Computing Principles: Designing and Developing Mobile Applications with UML and XML. Cambridge: Cambridge University Press.

[7] Ulfiani, Riezqi. 2013. Perancangan Aplikasi Pembelajaran Bahasa Jepang Dalam Mempelajari Tulisan Kanji Dengan Menggunakan Augmented Reality. Salatiga: Universitas Kristen Satya Wacana.

Page 23: Model Pengenalan Aksara Jepang Menggunakan Augmented … · 2017. 7. 11. · hiragana. Karakter-karakter kanji melambangkan sesuatu dan memiliki suatu ide dan gagasan tertentu. Pada

14

[8] Sebastian, Stephen Edwin. 2013, Pembuatan Aplikasi Aksara Jepang Menggunakan AndEngine Berbasis Android. Salatiga: Universitas Kristen Satya Wacana.

[9] Azuma, Ronald. 1997. A Survey of Augmented Reality. Malibu: Hughes Research Laboratories.

[10] Bradski, Gary, dkk. 2008. Learning OpenCV: Computer Vision with the OpenCV Library. Sebastopol: O'Reilly Media.

[11] Rice, Stephen, dkk. 1999. Optical Character Recognition: An Illustrated Guide to The Frontier. Norwell: Kluwer Academic Publishers.

[12] Rakshit, Sandip, dkk. 2010. Recognition of Handwritten Roman Numerals Using Tesseract Open Source OCR Engine. New Delhi: I. K. International Publishing House.

[13] Willis, Nathan. 2006. Google's Tesseract OCR Engine Is AQuantum Leap Forward. http://www.linux.com/articles/57222 (diakses tanggal 14 Agustus 2015).

[14] Pressman, Roger. 2002. Rekayasa Perangkat Lunak: Pendekatan Praktisi (Buku Satu). Yogyakarta: Andi.