sequential pattern

Upload: ihwanudien-hasanrobbani-ndolo-dgp

Post on 09-Mar-2016

222 views

Category:

Documents


0 download

DESCRIPTION

Data Mining

TRANSCRIPT

Slide 1

Sequential Pattern1Sequential PatternBahasanPendahuluanSequenceSequential Pattern Mining

2Sequential PatternSequenceSebuah sequence adalah urutan dari elemen-elemen (transaksi)s = < e1 e2 e3 >

Setiap elemen terdiri dari kumpulan kejadian-kejadian (item)ei = {i1, i2, , ik}

Setiap elemen merupakan atribut yang dihubungkan dengan suatu lokasi atau waktu tertentu (spesifik)

Panjang Sequence, |s|, adalah banyaknya unsur-unsur sequence yang diberikan.

A k-sequence adalah sebuah sequence yang terdiri dari k kejadian (item)

3Sequential PatternSequence4Sequential PatternDatabaseSequenceSequenceElemen (Transaksi)Kejadian(Item)CustomerTransaksi-transaksi penjualan yang dilakukan oleh konsumen tertentuItem item yang dibeli konsumen dalam waktu t.Buku, diary Produk, CD, dll.Web DataAktifitas browsing pada pengunjung web tertentuSekumpulan File-file yang dilihat pengunjung web setelah melakukan proses single mouse clickHome page, index page, contact info, dllEvent dataKejadian kejadian yang dihasilkan oleh sensor tertentuKejadian-kejadi yang timbul dari sensor saat waktu tJenis-jenis tanda(alarm) yang dihasilkan oleh sensorGenome sequencesDNA sequence dari spesies tertentuElemen dari DNA sequence Bases A,T,G,C

SequenceWeb sequence: < {Homepage} {Electronics} {Digital Cameras} {Canon Digital Camera} {Shopping Cart} {Order Confirmation} {Return to Shopping} >

Sequence kejadian kecelakaan yang disebabkan oleh ledakan nuklir pada 3-mile Island:(http://stellar-one.com/nuclear/staff_reports/summary_SOE_the_initiating_event.htm)< {clogged resin} {outlet valve closure} {loss of feedwater} {condenser polisher outlet valve shut} {booster pumps trip} {main waterpump trips} {main turbine trips} {reactor pressure increases}>

Sequence buku checked out pada perpustakaan:

5Sequential PatternSequenceDefinisi Subsequent

6Sequential PatternSebuah sequence terdapat dalam sequence lain (m n) jika terdapat integer i1 < i2 < < in maka a1 bi1 , a2 bi2, , an bin

Support subsequence w didefinisikan sebagai bagian dari data sequence yang berisi w

Sequential pattern adalah subsequence yang sering muncul (yaitu, support subsequence minsup)Data sequenceSubsequenceContain?< {2,4} {3,5,6} {8} >< {2} {3,5} >Yes< {1,2} {3,4} > < {1} {2} >No< {2,4} {2,4} {2,5} >< {2} {4} >YesSequential Pattern MiningDefinisi7Sequential PatternTerdapat: Database sequenceMinimum menetapkan user yang mendukung(support), minsupTask:Menemukan semua subsequence dengan user yang mendukung minsupSequential Pattern MiningAlgoritma Sequential Pattern Mining8Sequential PatternSort PhaseLarge Itemset PhaseTransformation PhaseSequence PhaseMaximal PhaseSequential Pattern MiningContoh Kasus9Sequential PatterncustomerIDitemBought111110,50203040222210304030,50333310203040444103050554050Sequential Pattern Mining10Sequential PatterncustomerIDitemBought111110,50203040222210304030,50333310203040444103050554050customerIDCustomer Sequence1

2

3

4

5

Sort PhaseMengurutkan berdasarkan customerID sebagai major keySequential Pattern Mining2. Large Itemset Phase

Sequential Pattern11Menentukan Largse ItemsetMemetakan ItemsetcustomerIDCustomer Sequence1

2

3

4

5

ItemsetSupport(10)4(20)2(30)4(40)4(50)4(10,50)1(30,50)1min_sup = 40%40% x 5 = 2 customer sequenceLarge ItemsetDipetakan ke-(10)1(20)2(30)3(40)4(50)5Sequential Pattern Mining3. Transformation PhaseSequential Pattern12Customer IDOriginal SequenceTransformed CustomerSequenceSetelah Pemetaan1

{(10) (50)} {(20)} {(30)} {(40)} {1, 5} {2} {3} {4} 2

{(10)} {(30)} {(40)} {(30) (50)} {1} {3} {4} {3, 5}3

{(10)} {(20)} {(30)} {(40)} {1} {2} {3} {4} 4

{(10)} {(30)} {(50)} {1} {3} {5} 5

{(40)} {(50)} {4} {5} Menghapus non-Large Itemset Memetakan Large Itemset ke suatu integerSequential Pattern Mining4. Sequential PhaseSequential Pattern13Menggunakan set Large Itemset, untuk mencari hasil sequence tertentuDua jenis algoritmaCount-AllAlgoritma AprioriAllCount-SomeAlgoritma AprioriSomeAlgoritma DynamicSomeSequential Pattern MiningSequential Pattern14 {1, 5} {2} {3} {4} {1} {3} {4} {3, 5} {1} {2} {3} {4} {1} {3} {4} {4} {5}

Customer SequenceSequential Pattern MiningSequential Pattern15 {1, 5} {2} {3} {4} {1} {3} {4} {3, 5} {1} {2} {3} {4} {1} {3} {5} {4} {5}

Large 1-SequenceSequenceSupport

4

2

4

4

4Sequential Pattern MiningSequential Pattern16 {1, 5} {2} {3} {4} {1} {3} {4} {3, 5} {1} {2} {3} {4} {1} {3} {5} {4} {5}

Large 2-SequenceSequenceSupport

2

4

3

3

2

2

1

3

2

2Sequential Pattern MiningSequential Pattern17 {1, 5} {2} {3} {4} {1} {3} {4} {3, 5} {1} {2} {3} {4} {1} {3} {5} {4} {5}

Large 3-SequenceSequenceSupport

2

2

3

2

2

1Sequential Pattern MiningSequential Pattern18 {1, 5} {2} {3} {4} {1} {3} {4} {3, 5} {1} {2} {3} {4} {1} {3} {5} {4} {5}

Large 4-SequenceSequenceSupport

2

1

1Sequential Pattern MiningSequential Pattern195. Maximum PhaseS, set seluruh Large Itemsetn, merupakan jarak terpanjang sequence

Sequential Pattern MiningSequential Pattern20SequenceSupport

2SequenceSupport

2

2

3

2

2SequenceSupport

2

4

3

3

2

2

3

2

2SequenceSupport

4

2

4

4

4TERIMA KASIH ATAS PERHATIANNYASequential Pattern