ekstraksi fitur menggunakan metode lda

10

Upload: others

Post on 25-Oct-2021

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: EKSTRAKSI FITUR MENGGUNAKAN METODE LDA
Page 2: EKSTRAKSI FITUR MENGGUNAKAN METODE LDA
Page 3: EKSTRAKSI FITUR MENGGUNAKAN METODE LDA

142

EKSTRAKSI FITUR MENGGUNAKAN METODE LDA

DAN PEMILIHAN EIGEN VALUE PADA CACAT KERTAS

DUPLEK

Aeri Rachmad

Fakultas Teknik – Universitas Trunojoyo Madura

[email protected]

ABSTRAK

Industri kertas masih menggunakan proses yang manual dengan menggunakan peralatan yang manual

untuk mendeteksi cacat yang terdapat pada kertas.Dalam peneletian ini bertujuan untuk mereduksi cacat

pada kertas dengan menggunakan LDA, berbeda dengan penelitian sebelumnya yang menggunakan metode

PCA.

Linear Discriminant Analysis merupakan salah satu metode untuk melakukan reduksi dan ekstraksi cacat

yang ada pada kertas. Metode ini akan mereduksi dimensi yang ada agar lebih kecil serta mencari nilai

eigen yang terbesar untuk mempercepat proses pengujian. Dalam pengujian menggunakan euclidian

distance terdapat error minimal sebesar 4% dan error maksimal sebesar 12%.

Kata kunci: Linear DiscriminantAnalysis, nilai eigen, euclidian distance

ABSTRACT

The paper industry is still using manual processes and manual equipment to detect

defects contained in the paper. In this research aims to reduce defects in the paper by

using LDA, in contrast to previous studies that use PCA method.

Linear Discriminant Analysis is a methods to perform the reduction and extraction of

defects that exist on paper. This method will reduce the existing dimensions that are

smaller and look for the largest eigenvalues to accelerate the testing process. In testing

using the euclidian distance errors are minimum of 4% and maximum error of 12%.

Keywords: Linear Discriminant Analysis, eigenvalues, euclidian distance

Vol 3, No 3 Desember 2013 ISSN 2088-2130

Page 4: EKSTRAKSI FITUR MENGGUNAKAN METODE LDA

143

PENDAHULUAN

Latar Belakang

Pendeteksian kecacatan pada kertas

merupakan salah satu bidang penelitian yang

penting bagi perusahaan kertas yang karena

bias menurunkan tingkat kesalahan kertas

sebelum distribusi ke konsumen atau pada

distributor. Meskipun tidak banyak

mendapatkan perhatian dari para peneliti,

sistem pendeteksian kecacatan pada kertas

dapat dipergunakan untuk aplikasi

pendeteksian dini pada kertas sehingga

komplain yang disebabkan karena kecacatan

kertas bisa menurun atau bahkan tidak ada.

Komputer Vision memegang peranan

penting dalam Human Computer Interaction

Technology (HCI) yang meliputi deteksi

wajah, penjejakan wajah/badan, deteksi aksi

(gesture), estimasi umur, etnik dan deteksi

cacat pada kertas. Sistem deteksi dan

identifikasi kertas dapat dipergunakan dalam

banyak hal, seperti yang berhubungan

dengan kecacatan kertas

Penelitian deteksi kecacatan kertas jarang

sekali dilakukan apalagi warna yang dimiliki

kertas hanya bewarna kertas adalah putih

saja (Homogen). Penenilitian kali ini akan

melihat seberapa jauh kemampuan komputer

dan algoritma yang digunakan untuk

mendeteksi kecacatan kertas serta

mengklasifikasikan hasil cetakan kertas

berdasarkan tingkat kecacatannya.

Sistem deteksi kecacatan pada kertas melalui

beberapa tahapan proses, yaitu deteksi

kecacatan kertas, ekstraksi ciri / fitur dan

tahapan terakhir terakhir adalah pengenalan

cacat kertas[1].

Tujuan

Tujuan dilakukan penelitian ini adalah

mengembangkan dari penelitian sebelumnya

sehingga pengenalan terhadap klasifikasi

kecacatan kertas duplek menjadi lebih baik

dari sebelumnya. untukmengetahui hasil dari

pengenalan cacat dari sebuah kertas

berdasarkan tingkat kecacatan pada kertas

dengan menggunakan metode LDA.

Permasalahan

Bagaimana mambandingkan penggunaan

ekstraksi fitur LDA dan PCA dalam

melakukan pengenalan cacatpada kertas

Duplek.

Tinjauan Pustaka

Data Kertas Duplex

Data citra yang digunakan berasal dari dari

data natural kertas dupleks hasil produksi

pabrik kertas PT. Pakerin Prambon

Mojokerto yang kemudian dipindai dengan

parameter pemindai sbb:

1. Scan Mode: Color/Greyscale.

2. Image Quality: 300 dpi

Pemilihan Scan Mode menggunakan moda

Color/Greyscale adalah karena kedua

modetersebutmemberikankemungkinanwarn

a yang lebihbanyakdaripadacitrabiner.Pada

sistem ini, baik citra color ataupun greyscale

akan dikonversi menjadi greyscale.

Sedangkan pemilihan Image Quality

menggunakan 300 dpi supaya cacat-cacat

yang tidak nampak oleh mata, bisa „terlihat„

oleh program pendeteksi cacat.

DenganImage Quality 300 dpi, output dari

pemindaian kertas berukuran A4 adalah

2430x3483 piksel.

Linear Discriminant Analysis (LDA)

Ide dasar dari LDA adalah menemukan

sebuah transformasi linear sehingga

pengklasteran dapat dipisahkan setelah

transformasi. Ini dapat diperoleh melalui

analisa matriks scatter. LDA lebih

bertujuan untuk mengoptimalkan

diskriminan sedangkan PCA lebih pada

pengoptimalan representasi. Sama dengan

proyeksi pada PCA, pada LDA vektor data

diproyeksikan ke dalam sub ruang.

Demikian pula apabila ada data uji maka

Vol3, No 3Desember 2013

Page 5: EKSTRAKSI FITUR MENGGUNAKAN METODE LDA

144

akan diproyeksikan ke sub ruang yang sama

dengan melakukan perkalian vektor eigen

hasil training dengan vektor data uji.

LDA mengelompokkan vektor data dari

kelas yang sama dan memisahkan kelas

yang berbeda. Vektor data diproyeksi dari

ruang N-dimensi (dimana N ada jumlah

Kertas Duplex yang diproses) ke ruang C-1

dimensi (dimana C adalah jumlah kelas

dalam vektor data).

Metode LDA memilih W dengan cara

memaksimalkan rasio antara between-class

scatter (SB) (1)dan within-class scatter

(SW)(2). Berikut ini definisi dari kedua kelas

scatter :

Tiil

i

iB nS ))(( )()(

1

(1)

l

i

n

j

Tii

j

ii

jw

i

xxS1 1

)()()()( ))(( (2)

dimana adalahvektor rata-rata jumlah

sample, niadalah jumlah sample dalam kelas

ke-i, (i)adalah vektor rata-rata kelas ke-i,

xj(i)

adalah sample ke-j pada kelas ke-i, dan l

adalah jumlah kelas.

Jika SW tidak singular, proyeksi optimal

Wopt dipilih sebagai matriks dengan kolom

yang orthonormal yang memaksimalkan

rasio dari matriks between-class scatter ke

matriks within-class scatter dari sample

yang telah diproyeksikan, yaitu (3):

wSw

wSwW

w

T

B

T

wopt maxarg mwww ,...,, 21 (3)

dimana {wi| i=1, 2, ..., m} adalah

sekumpulan vektor eigen yang digeneralisasi

dari SB dan SW yang bersesuaian dengan m

nilai eigen terbesar {i

| i=1, 2, ..., m },

yaitu (4):

iwiiB wSwS i = 1, 2, ..., m (4)

METODOLOGI

Metodologi penelitian yang

digunakanuntukmendukungpenyelesaianper

ancangandanpembuatansistemdeteksicacatke

rtasadalah :

1. Deteksi dan segmentasi cacat kertas

duplek

2. Normalisasi data cacat kertas duplek

3. Perbandingan metode ekstraksi fitur

PCA dan LDA

4. Pengenalan cacat kertas duplek

menggunakan euclidian distance

HASIL DAN PEMBAHASAN

Deteksi dan Segmentasi Cacat

Dalam penelitian ini kami melakukan

deteksi cacat kertas duplek pada selembar

kertas dengan ukuran A4 dengan multi cacat

yang terdapat pada kertas duplek tersebut.

Proses deteksi cacat kertas duplex terdiri

dari: proses greyscale, threshold, edge

detection, menyambung pixel yang

mempunyai jarak kurang dari sama dengan 6

pixel, mengkrop area cacat dengan ukuran

31 x 31 pixel. Algoritma deteksi cacat dan

cropping pada citra adalah sbb[1]:

Gambar 1. Proyeksi data 2 kelas

menggunakan metode LDA

Aeri Rachmad dkk,Ekstraksi Fitur...

Page 6: EKSTRAKSI FITUR MENGGUNAKAN METODE LDA

145

1. Membaca gambar kertas duplek dengan

ukuran yang ditentukan.

2. Melakukan threshold pada kertas duplek

sesuai dengan intensitas dari kertas.

3. Mengubah image menjadi hitam dan

putih saja.

4. Melakukan edge detection.

5. Menyambung pixel yang mempunyai

jarak kurang dari sama dengan 6 pixel.

6. Mengindex area yang mempunyai

kemungkinan merupakan cacat kertas

Duplek yang berbentuk polygone dan

polyline .

Pada Gambar 2 menunjukkan nilai sebaran

data training dari 80 data masing – masing

cacat yang sudah di pilih yang paling jelas

cacatnya dan pada Gambar 4 menunjukkan

sebaran 20 data testing masing – masing

cacat pada Gambar 3.

Gambar 2.Data Training yang Diplot dalam

2-Dimensi

Gambar 3.Data Testing yang Diplot dalam

2-Dimensi

Normalisasi Data Cacat Kertas

Normalisasi data cacat kertas tersebut

bertujuan agar ukuran dari cacat kertas yang

terdeteksi menjadi lebih standart. Ukuran

yang telah ditentukan yaitu 31x31 pixel

yang didalamnya terdapat hanya satu jenis

cacat saja seperti tampak pada gambar 4.

Algorithma untuk melakukan normalisasi

cacat kertas[1]:

1. Membaca data cacat yang sudah

terdeteksi sebelumnya.

2. Merubah data cacat menjadi hitam dan

putih

3. Mendeteksi ukuran image 31 x 31 pixel

4. Melakukan threshold sesuai dengan

intensitas cacat kertas yang sudah

terdeteksi

5. Mencari keliling dan luasan cacat kertas

6. Mencari cacat poliline dengan membagi

luas dibagi dengan keliling

210 215 220 225 230 235 240 245 250 255215

220

225

230

235

240

245

250

255

Dimensi pertama

Dim

ensi kedua

Polyline

Polygon

246 247 248 249 250 251 252 253 254 255230

235

240

245

250

255

Dimensi pertama

Dim

ensi

ked

ua

Polyline

Polygon

Vol 3, No 3 Desember 2013

Page 7: EKSTRAKSI FITUR MENGGUNAKAN METODE LDA

146

Gambar 4. Normalisasi Cacat Polyline dan

Polygone

Proses Linier Discriminat Analysis (LDA)

Vektor data hasil proses PCA merupakan

data yang representasinya telah optimal

karenapada proses PCA akan diambil data

yang mempunyai varians dominan,

namundemikian proses tersebut tidak

bertujuan untuk diskriminan data. Untuk

mendapatkan sebaran data yang tingkat

diskriminannya optimal, maka dilakukan

proses analisa diskriminan menggunakan

metodeLinier Discriminant Analysis (LDA).

Proses LDA akan meningkatkan rasio antara

between-class scatter (SB) danwithin-class

scatter (SW), jadi semakin besar jarak

sebaran data yang berlainan kelas dan

semakin dekat jarak sebaran data yang

sekelas maka tingkat diskriminan data akan

semakin baik. Untuk meningkatkan

diskriminan data dapat diproses berdasarkan

algoritma LDA berikut:

ALGORITMA: LDA(X,Y)

1. Vektor data masukan:

],...,,,........,...,,,,...,,[ 21,2222111211 mnmmnn xxxxxxxxxX

2. Menghitung rata-rata vektor data ()

berdasarkan rata-rata

keseluruhanobjekdarimasing-masingcacat.

3. Menghitung rata-rata vektor data (1,2,

…n) dari masing-masing objek.

4. Mengurangkan data masing-masing

kelas dengan rata-ratanya.

5. Mengurangkan masing-masing rata-rata

kelas dengan rata-rata keseluruhan.

6. Menghitungbetween-class scatter :

Tiil

i

iB nS ))(( )()(

1

7. Menghitungwithin-class scatter :

l

i

n

j

Tii

j

ii

jw

i

xxS1 1

)()()()( ))((

8. Menghitung proyeksi optimal Wopt :

wSw

wSwmaxargW

wT

BT

wopt

mwww ,...,, 21

Pemilihan W optimal

berdasarkanpadanilaieigenterbesar,

haltersebutdapatdijelaskanberdasarkanpersa

maan:

VSVS wB

dimana V adalah vektor eigen dan adalah

nilai eigen.

Persamaan diatas dapat dituliskan ulang

menjadi:

VVS

S

W

B atau VV

dimana W

B

S

S .

Vektor eigen dan nilai eigen didapatkan dari

matrik kovarian dan pemilihan eigen

vektor optimalnya berdasarkan dengan nilai

eigen terbesar.

Aeri Rachmad dkk,Ekstraksi Fitur...

Page 8: EKSTRAKSI FITUR MENGGUNAKAN METODE LDA

147

LDA.m

Pengujian dan Analisa Menggunakan

Metode LDA

Seperti yang telah dilakukan pada proses

PCA mentraining 80 data cacat polyline dan

80 cacat polygon kemudian baru di olah

dengan PCA dan LDA seperti yang

ditunjukkan pada gambar 5 dan 40 data

testing seperti pada gambar 6. Setelah data

diolah dengan metode PCA maka dilakukan

reduksi dimensidengan LDA menggunakan

metode five-fold cross validation (CV).Yaitu

data dibagi menjadi 5 kelompok, dengan 4/5

data pertama dijadikan data training dan 1/5

data terakhir untuk testing. 5 kelompok ini

kemudian di rotasi tanpa terjadi overlapping

sehingga semua kelompok pernah menjadi

data testing. Dengan 5 kelompok, berarti 1

kelompok terdiri dari 40 data (20 cacat

polyline dan 20 polygone).

Untuk data uji, 1 kelompok terdiri dari 40

data (20 cacat polyline dan 20 polygone).

‘ErrPlgn’adalah errorcacat polygone, yaitu

terdeteksinya cacat polygone pada kelompok

10 data cacat polyline. Sebaliknya,

‘ErrPln’ adalah errorpolyline, yaitu

terdeteksinya cacat polyline pada kelompok

10 data cacat polygone. ‘ErrM’adalah

nilai rata-rata dari ErrPlgn dan ErrPln.

ErrPlgn,

Errpln dan ErrM ditampilkan dalam jumlah

dan persen. Jika dalam persen, maka (misal

ErrP) nilai ErrP adalah

(ErrP/10)*Gambar5.HasilProyeksi

Data Training dengan LDA yang

Diplotdalam 2-dimensi

Vol3, No 3Desember 2013

Page 9: EKSTRAKSI FITUR MENGGUNAKAN METODE LDA

148

-100 0 100 200 300 400 500-60

-40

-20

0

20

40

60

80

100

120

140

Dimensi pertama

Dim

ensi kedua

Polyline

Polygon

Gambar 6.HasilProyeksi Data Testing

dengan LDA yang Diplotdalam 2-dimensi

Pada gambar 7 dan 8 menunjukkan error pada

euclidian distance dan city distance dimana

rata-rata nilai terendah pada nilai 5% yang

terjadi pada group 1 dan

SIMPULAN Berdasarkan hasil pengujian dan analisa dari

sistem yang telah dilakukan didapatkan

beberapa kesimpulan dalam proses pengenalan

cacat kertas menggunakan metode LDA yaitu:

1. Deteksi cacat kertas dapat dilakukan

lebih baik di bandingkan dengan proses

manual.

2. LDA dapat digunakan sebagai ekstraksi

dan reduksi dimensi serta pengenalan

cacat kertas dengan memilih eigen

value yang mempunyai error yang kecil

dibandingkan dengan metode PCA

Aeri Rachmad dkk,Ekstraksi Fitur...

Table 1Hasil error City distance dan error Euclidian distance dengan LDA

Error Euclidian Distance

0

2

4

6

8

10

12

14

1 2 3 4 5

Jumlah Group

Pers

en

tase

ErrorPolyline

ErrorPolygone

ErrorRata-Rata

0

2

4

6

8

10

12

14

1 2 3 4 5

Pe

rse

nta

se

Jumlah group

Error City Distance

ErrorPolyline

ErrorPolygone

Gambar 7. Error Euclidian Distance tiap

Group

Gambar 8.ErrorCity Distance tiap Group

Page 10: EKSTRAKSI FITUR MENGGUNAKAN METODE LDA

149

DAFTAR PUSTAKA

[1] Rachmad A, “Pengenalan kecacatan

kertas Duplek menggunakan Ekstraksi fitur

PCA”

[2] HaryantiRivai, MauridhiHery P, Supeno

Mardi S N, “ PengenalanCiri –

CiriTeksturKain Sutra menggunkanMetode

GMRF denganKlasifikasi SOM-

KOHONEN”,

InstitutTeknologiSepuluhNopermber

Surabaya, 2005.

[3] Hua-Long Bu, Guo-Zheng Li, Xue-

QiangZeng, “Reducing Error of Tumor

Classification by Using Dimension

Reduction with Feature Selection”, School

of Computer Engineering and Science,

ShanghaiUniversityShanghai 200072,

China, 2007

[4]E.Ramaraj and M.Punithavalli,

“Taxonomically Clustering Organisms

Based on the Profiles of Gene Sequences

Using PCA” 1Department of Computer

Science and Engineering, Alagappa

University, TN, India,2006

[5] Viola, Paul; Jones, Michael J., “Fast

Multi-view Face Detection”, Demo at then

IEEE Conference on Computer Vision and

Pattern Recognition (CVPR), 2003

[6] Meiching Fong, “Dimension Reduction

on Hyperspectral Images” , UCLA

Department of Mathematics, 2007.

[7] Zehang Sun, Xiaojing Yuan, and

G.Bebis, Ronald Miller, ”Object detection

using feature subset selection” , Department

of Computer Science, University of Nevada,

Reno 2004

Vol3, No 3Desember 2013