halaman judul estimasi parameter pada model …

i

HALAMAN JUDUL

TUGAS AKHIR SM-141501

ESTIMASI PARAMETER PADA MODEL POISSON

GENERALIZED AUTOREGRESSIVE MOVING AVERAGE

(GARMA) DENGAN ALGORITMA IRLS

(Studi Kasus: Peramalan Jumlah Kecelakaan Di Jalan Tol

Surabaya-Gempol)

AGIL DESTI FAUZIA

NRP 06111440000062

Dosen Pembimbing:

Dra. Laksmi Prita Wardhani, M.Si

Departemen Matematika

Fakultas Matematika, Komputasi, dan Sains Data

Institut Teknologi Sepuluh Nopember

Surabaya

2018

HALAMAN JUDULHALAMAN JUDUL

TUGAS AKHIR SM-141501


iii

iii

HALAMAN JUDUL

FINAL PROJECT SM-141501

PARAMETER ESTIMATION OF POISSON GENERALIZED

AUTOREGRESSIVE MOVING AVERAGE (GARMA)

MODELS WITH IRLS ALGORITHM

(A Case study is forecasting of Accident in Surabaya-Gempol

Toll Road)

AGIL DESTI FAUZIA

NRP 06111440000034

Supervisors:


Department of Mathematics

Faculty of Mathematics, Computation and Data Science

Institut Teknologi Sepuluh Nopember

Surabaya

2018

Gambar 3. 6 Diagram Alir PengerjaanTugas

AkhirHALAMAN JUDUL

FINAL PROJECT SM-141501

v

LEMBAR PENGESAHAN


GENERALIZED AUTOREGRESSIVE MOVING

AVERAGE (GARMA) DENGAN ALGORITMA IRLS

(Studi Kasus: Peramalan Jumlah Kecelakaan Di Jalan Tol

Surabaya-Gempol) ESTIMATION OF POISSON GENERALIZED AUTOREGRESSIVE

MOVING AVERAGE (GARMA) MODELS WITH ALGORITHM

IRLS (A Case study is forecasting of Accident in Surabaya-

Gempol Toll Roads)

Diajukan Untuk memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Sains

Pada Bidang Studi Matematika Terapan

Program S-1 Departemen Matematika

Fakultas Matematika Komputasi dan Sains Data

Oleh:

AGIL DESTI FAUZIA

NRP. 06111440000062

Menyetujui,

Dosen Pembimbing


NIP. 19611208 198803 2 001

Mengetahui,

Kepala Departemen Matematika

FMKSD ITS

Dr. Imam Mukhlash, S.Si M.T

NIP. 19700831 199403 1 003 Surabaya, 2018

vii




(Studi Kasus Jumlah Kecelakaan Di Jalan Tol Surabaya-

Gempol Ruas Waru-Sidoarjo)

Nama Mahasiswa : AGIL DESTI FAUZIA

NRP : 06111440000062

Departemen : Matematika FMKSD – ITS

Dosen Pembimbing : Dra. Laksmi Prita Wardhani, M.Si

ABSTRAK

Peramalan adalah pengolahan data masa lalu untuk mendapatkan estimasi

data masa depan. Data yang digunakan pada penelitian ini adalah data

count. Pada kasus data count metode peramalan pada umumnya seperti

ARIMA kurang tepat digunakan. Benjamin, dkk. mengembangkan

sebuah model peramalan yaitu Generalized Autoregressive Moving

Average (GARMA) dengan menggunakan fungsi penghubung (link

function) dengan data diasumsikan mengikuti Distribusi Poisson sehingga

disebut juga Poisson GARMA (𝑝, 𝑞). Pada model tersebut terdapat

beberapa parameter yang tidak diketahui. Parameter yang dimaksud

diestimasi menggunakan metode Maximum Likelihood Estimation (MLE)

dengan optimasi Algoritma Iteratively Reweighted Least Squares (IRLS).

Model Poisson GARMA ini diterapkan pada data jumlah kejadian

kecelakaan di jalan tol Surabaya-Gempol ruas Waru-Sidoarjo. Hasil yang

didapat yaitu model khusus Poisson GARMA (1,1) dengan 3 parameter

yaitu parameter konstanta , parameter Autoregressive, dan parameter

Moving Average . Kriteria pemilihan model terbaik menggunakan AIC.

Kata Kunci : Data count, Distribusi Poisson, Fungsi Link, Poisson GARMA

(𝒑, 𝒒), Algoritma IRLS.

ix




(Studi Kasus Jumlah Kecelakaan Di Jalan Tol Surabaya-

Gempol Ruas Waru-Sidoarjo)

Nama Mahasiswa : AGIL DESTI FAUZIA

NRP : 06111440000062

Departemen : Matematika FMKSD – ITS

Dosen Pembimbing : Dra. Laksmi Prita Wardhani, M.Si

ABSTRACT

Forecasting is the processing of past data to obtain future data estimates.

Data used in this research is data count. In the case of data count,

forecasting methods in general such as ARIMA is less precise for some

reasons. Benjamin, et al. developed a forecasting model to solve this,

namely Generalized Autoregressive Moving Average (GARMA) by using

the link function. The data used is assumed to follow Poisson's

distribution so it is also called Poisson GARMA (p, q). In the model, there

are some unknown parameters. These parameters are estimated using

Maximum Likelihood Estimation (MLE) method with Iteratively

Reweighted Least Squares (IRLS) algorithm optimization. Poisson

GARMA model is applied to the data of the number of accidents on the

Surabaya-Gempol toll road at Waru-Sidoarjo section. The result obtained

is a special model Poisson GARMA (1,1) with 3 parameters namely

constant parameters, Autoregressive parameter, and Moving Average

parameter. The criteria of best model selection uses AIC.

Keywords: Count Data, Poisson Distribution, Link Function, Poisson

GARMA (p, q), IRLS Algorithm.

xi

KATA PENGANTAR

Puji syukur penulis panjatkan kehadirat Allah SWT karena

berkat Rahmat dan Karunia-Nya penulis dapat menyelesaikan

penulisan Tugas Akhir ini. Adapun judul Tugas Akhir ini yaitu

“Estimasi Parameter Model Poisson Generalized Autoregressive

and Moving Average (GARMA) dengan Algoritma IRLS”.

Penulisan Tugas Akhir ini diajukan untuk memenuhi salah

satu syarat memperoleh gelar Sarjana pada Program Studi

Matematika Fakultas Matematika, Komputasi, dan Sains Data

Institut Teknolni Sepuluh Nopember. Dalam penulisan, tidak lepas

dari hambatan dan kesulitan, namun berkat bimbingan dan

dorongan dari semua pihak Tugas Akhir ini dapat terselesaikan

dengan baik. Oleh karenanya penulis ingin menyampaikan ucapan

terimakasih kepada :

1. Bpk. Dr. Imam Mukhlash, S.Si, M.T selaku Ketua

Departemen Matematika FMKSD ITS.

2. Ibu Dra. Laksmi Prita Wardhani, M.Si selaku dosen

pembimbing Tugas Akhir, atas waktu dan bimbingan yang

diberikan kepada penulis.

3. Ibu Dr. Dra. Mardlijah, M.T selaku dosen wali dan kepada

seluruh dosen serta karyawan Departemen Matematika ITS.

4. Ibu Valeriana Lukitosari, S.Si, MT dan Ibu Dra. Nuri

Wahyuningsih, M.Kes dan Bpk Suhud Wahyudi, M.Si dan

Bpk Dr. Soehardjoepri, M.Si selaku dosen penguji yang telah

memberikan saran dan bimbingannya.

5. Bpk. Dr. Didik Khusnul Arif, S.Si, M.Si selaku Ketua

Program Studi S1 Departemen Matematika ITS dan Bpk. Drs.

Iis Herisman, M.Si selaku Sekretaris Program Studi S1

Departemen Matematika ITS.

xii

6. Kedua orangtua, Bapak Sutrisno dan Ibu Dwi Suhartini, serta

saudara kandung Miftahul Zannaria atas kepercayaan, doa dan

dukungan moril yang selalu diberikan.

7. Maya, Riska, Via yang saling memotivasi satu sama lain serta

teman-temanku angkatan 2014 yang telah bersama berjuang

dari mahasiswa baru hingga dapat bersama menyelesaikan

Tugas Akhir.

8. Aqil, Okky, Dila sebagai partner dalam pembuatan Tugas

Akhir.

9. Ila, Didik, Shodek, dan Mas Ihsan yang dengan sabar

mendengar keluh kesah dan juga teman berdiskusi penulis.

10. Febri, Fransisca, Yujo, dan semua teman-temanku UKM

Futsal Putri ITS yang terus memberikan semangat serta

motivasinya.

11. Semua pihak yang tidak bisa penulis sebutkan satu persatu,

terima kasih telah membantu sampai terselesaikannya Tugas

Akhir ini.

Penulis berharap Tugas Akhir ini dapat bermanfaat bagi

pengembangan ilmu pengetahuan, lingkungan, perusahaan dan

bagi siapapun yang membutuhkan. Penulis menyadari bahwa

Tugas Akhir ini jauh dari sempurna sehingga penulis

membutuhkan kritik dan saran yang bersifat membangun untuk

kemajuan pendidikan dimasa yang akan datang.

Surabaya, Agustus 2018

Penulis

xiii

DAFTAR ISI

Hal

HALAMAN JUDUL ...................................................................... i

HALAMAN JUDUL ....................................................................iii

ABSTRAK .................................................................................. vii

ABSTRACT ................................................................................... ix

KATA PENGANTAR .................................................................. xi

DAFTAR ISI ..............................................................................xiii

DAFTAR GAMBAR .................................................................. xv

DAFTAR TABEL ...................................................................... xvi

DAFTAR LAMPIRAN .................................................................. i

BAB I PENDAHULUAN ............................................................. 1

1.1 Latar Belakang ............................................................. 1

1.2 Rumusan Masalah ........................................................ 4

1.3 Batasan Masalah ........................................................... 4

1.4 Tujuan .......................................................................... 4

1.5 Manfaat ........................................................................ 5

1.6 Sistematika Penulisan ................................................... 5

BAB II TINJAUAN PUSTAKA ................................................... 7

2.1 Penelitian Terdahulu .................................................... 7

2.2 Analisis Runtun Waktu ................................................ 8

2.3 Stasioneritas ................................................................. 8

2.4 Klasifikasi Model ARIMA ......................................... 11

2.5 Generalized Linier Models ......................................... 12

2.6 Distribusi Poisson ...................................................... 13

2.7 Model Poisson untuk data count ............................... 14

2.8 Model Generalized Autoregressive and Moving

Average (GARMA) ................................................... 15

2.9 Model Poisson GARMA (p,q) .................................. 16

2.10 Maximum Likelihood Estimation (MLE).................. 16

2.11 Algoritma IRLS ........................................................ 18

xiv

2.12 Perumusan Model dan Forecasting Poisson

GARMA .................................................................... 19

BAB III METODOLOGI PENELITIAN .................................... 27

3.1 Sumber Data .............................................................. 27

3.2 Variabel Penelitian .................................................... 27

3.3 Metode dan Tahapan Penelitian ................................ 28

BAB IV ANALISA DAN PEMBAHASAN ............................... 33

4.1 KAJIAN TEORI ....................................................... 33

4.1.1 Model Poisson GARMA (𝑝, 𝑞) ................... 33

4.1.2. Estimasi Parameter Model Poisson

GARMA (𝑝, 𝑞) ............................................ 35

4.2 KAJIAN TERAPAN ................................................ 43

BAB V PENUTUP ...................................................................... 59

5.1 KESIMPULAN ........................................................ 61

5.2 SARAN .................................................................... 61

DAFTAR PUSTAKA .................................................................. 63

LAMPIRAN ................................................................................ 65

BIODATA PENULIS .................................................................. 73

xv

DAFTAR GAMBAR

Hal

Gambar 3. 1 Diagram Alir PengerjaanTugas Akhir .................... 30

Gambar 3. 2 Diagram Alir Perumusan Model ARIMA .............. 31

Gambar 3. 3 Diagram ALir ALgoritma IRLS ............................. 32

Gambar 4. 1 Plot Data Time Series ............................................. 44

Gambar 4. 2 Transformasi Box-Cox 1 ........................................ 45

Gambar 4. 3 Transformasi Box-Cox 2 ........................................ 45

Gambar 4. 5 Plot PACF Hasil Data Transformasi Y .................. 46

Gambar 4. 4 Plot ACF Hasil Data Transformasi Y ..................... 47

Gambar 4. 5 Plot Data Actual dan Hasil Peramalan ................... 59

xvi

DAFTAR TABEL

Hal

Tabel 2. 1 Transformasi Box-Cox ................................................. 9

Tabel 2. 1 Transformasi Box-Cox ................................................. 9

Tabel 3. 1 Struktur Data Jumlah Kecelakaan di Tol Surabaya-

Gempol ...................................................................... 27

Tabel 4. 1 Parameter ARMA (1,1)...............................................47

Tabel 4. 2 Hasil Overfitting Model ARMA ................................ 50

Tabel 4. 3 Uji Asumsi Residual ................................................... 51

Tabel 4. 4 Estimasi Parameter ARMA (1,1) dengan Outlier ....... 52

Tabel 4. 5 ANOVA ...................................................................... 53

Tabel 4. 6 Estimasi Parameter Model Poisson GARMA (1,1) .... 57

Tabel 4. 7 Uji Gododness of fit ................................................... 58

Tabel 4. 8 Perbandingan Data Actual dan Hasil Peramalan ........ 58

xvii

DAFTAR LAMPIRAN

Hal

LAMPIRAN 1 Data Jumlah Kejadian Kecelakaan di Jalan

Tol Surabaya-Gempol ryas Waru-Sidoarjo ...... 65

LAMPIRAN 2 Source Code Algoritma IRLS........................... 66

LAMPIRAN 3 Source Code Hasil Peramalan .......................... 70

1

BAB I

PENDAHULUAN

Pada bab ini dibahas hal-hal yang menjadi latar belakang

permasalahan dalam Tugas Akhir ini. Kemudian permasalahan

tersebut disusun kedalam suatu rumusan masalah. Selanjutnya

dijabarkan batasan masalah untuk memperoleh tujuan serta

manfaat.

1.1. Latar Belakang

Time series (runtun waktu) adalah suatu himpunan

pengamatan yang dibangun secara berurutan dalam waktu [1].

Metode time series adalah metode peramalan dengan

menggunakan analisa plot hubungan antara variabel yang akan

diperkirakan dengan variabel waktu. Peramalan adalah pengolahan

data masa lalu untuk mendapatkan estimasi data masa yang akan

datang. Peramalan merupakan bagian penting bagi setiap

perusahaan ataupun organisasi bisnis dalam setiap pengambilan

keputusan manajemen. Peramalan itu sendiri bisa menjadi dasar

bagi perencanaan jangka pendek, menengah, maupun jangka

panjang suatu perusahaan.

Terdapat dua jenis metode yang umum digunakan dalam

peramalan, yaitu metode Analisis Regresi dan ARIMA (Box

Jenkins). Analisis Regresi merupakan teknik analisis yang

memanfaatkan hubungan antara variabel bebas dan variabel terikat

dalam suatu penelitian. Analisis ini bertujuan untuk mencari pola

hubungan antara variabel bebas dan variabel terikat yang

ditunjukkan dalam suatu model. Metode Regresi sesuai untuk data

deret waktu stasioner, namun sangat tidak sesuai untuk rangkaian

waktu non-stasioner [2]. Sedangkan Model ARIMA atau sering

juga disebut metode runtun waktu Box-Jenkins adalah model yang

2

secara penuh mengabaikan variabel bebas (independen) dalam

membuat peramalan. ARIMA menggunakan nilai masa lalu dan

sekarang dari variabel dependen untuk menghasilkan peramalan

jangka pendek yang akurat. ARIMA cocok digunakan untuk

observasi dari runtun waktu (time series) yang secara statistik

berhubungan satu sama lain (dependen). Hal yang perlu

diperhatikan adalah kebanyakan deret waktu bersifat non-stasioner

dan bahwa aspek-aspek AR dan MA dari model ARIMA hanya

berkenaan dengan deret waktu yang stasioner. Dalam Analisis

Regresi maupun ARIMA banyak dilakukan dengan

memperhatikan asumsi data yang menyebar normal, tapi pada

beberapa kasus ditemukan data yang tidak menyebar normal. Hal

tersebut dapat diatasi dengan transformasi data. Namun,

adakalanya transformasi data yang dilakukan tetap menghasilkan

data yang tidak menyebar normal, hal ini dapat menyebabkan

prinsip kenormalan dilanggar[3].

Terdapat beberapa jenis data yang dikenal seperti nominal,

ordinal, interval, dan data hitung atau count. Untuk data count

biasanya ditemukan pada suatu kasus atau pada sampel

percobaan[4]. Data jenis ini paling sering menyebabkan data tidak

menyebar normal. Untuk mengatasi hal tersebut, kajian pemodelan

peramalan runtun waktu dikembangkan dan salah satunya

diterapkan pada data count. Data count merupakan bilangan diskrit

non negatif yaitu 0, 1, 2, . . . , 𝑛. Contoh data count yang sering

ditemui antara lain: jumlah kejadian kecelakaan yang terjadi dalam

selang waktu tertentu, jumlah anak ikan yang menetas pada

perlakuan khusus di laboratorium, jumlah pertandingan sepakbola

yang tertunda karena hujan pada satu musim liga, jumlah serangan

hama pada 1 hektar sawah, dan lain-lain. Generalized linier models (GLM) telah dikembangakan oleh

McCullagh dan Nelder untuk menganalisis hubungan antara

3

variabel respon dengan variabel prediktor dimana variabel respon

tidak harus berdistribusi normal, tetapi termasuk dalam keluarga

eksponensial [5]. Model Regresi Poisson dapat digunakan untuk

memodelkan hubungan anatara variabel respon yang diasumsikan

berdistribusi Poisson terhadap variabel prediktor. Distribusi

Poisson sendiri mengasumsikan bahwa data harus bersifat

equidispersion yaitu rata-rata variabel respon sama dengan varian

[6]. Namun pada kenyataannya kondisi tersebut jarang terjadi.

Dalam penggunaannya masih dimungkinkan terjadinya

pelanggaran asumsi equidispersion. Data dengan varians sampel

lebih besar dari pada rata-ratanya biasa disebut overdispersion.

Sedangkan, data dengan varians sampel lebih kecil dari pada rata-

ratanya disebut dengan underdispersion. Regresi Poisson juga

akan menjadi tidak sesuai jika banyak variabel respon yang bernilai

nol atau biasa disebut excess zero.

Selanjutnya Benjamin, dkk. mengembangkan model

Generalized Autoregressive Moving Average (GARMA) untuk

data-data yang mengikuti distribusi non-Gaussian seperti

Distribusi Poisson dan Binomial Negatif [7]. Model GARMA

merupakan pengembangan dari perluasan Generalize Linier

Models (GLM). Model GARMA menghubungkan komponen

ARMA dengan variabel prediktor ke transformasi parameter rata-

rata dari distribusi data dengan menggunakan fungsi link [8].

Fungsi link ini digunakan untuk memastikan bahwa distribusi data

tetap dalam domain bilangan riil positif, sehingga memiliki

ketepatan prediksi yang lebih akurat. Pada penelitian ini dilakukan

estimasi mengenai model yang mengikuti distribusi Poisson atau

disebut Poisson GARMA (𝑝, 𝑞) dengan studi kasus yaitu data

jumlah kecelakaan di jalan tol Surabaya-Gempol ruas Waru-

Sidoarjo dalam batasan waktu tertentu.

4

1.2. Rumusan Masalah

Rumusan masalah pada Tugas Akhir ini yaitu :

1. Bagaimana estimasi parameter pada model Poisson GARMA

(𝑝, 𝑞) menggunakan metode Maximum Likelihood Estimation

(MLE) dengan iterasi numerik algoritma IRLS ?

2. Bagaimana mengaplikasikan model yang dikembangkan pada

data jumlah kecelakaan di jalan tol Surabaya-Gempol ruas

Waru-Sidoarjo ?

1.3. Batasan Masalah

Batasan permasalahan yang dibahas pada Tugas Akhir ini yaitu :

1. Data yang digunakan adalah data sekunder yaitu data jumlah

kecelakaan di jalan tol Surabaya-Gempol ruas Waru-Sidoarjo

pada mulai bulan Januari 2012 sampai bulan Agustus 2017.

2. Jenis distribusi keluarga eksponensial yang digunakan adalah

Poisson sehingga model yang akan diestimasi adalah Poisson

GARMA (𝑝, 𝑞).

3. Data lajur jalan yang digunakan adalah lajur A ruas Waru-

Sidoarjo yaitu arah dari Surabaya menuju Gempol

4. Software yang digunakan untuk membantu dalam kajian

terapan adalah Minitab dan Matlab.

1.4. Tujuan

Tujuan dalam penulisan Tugas Akhir ini :

1. Mengkaji estimasi parameter model Poisson GARMA (𝑝, 𝑞)

dengan metode Maximum Likelihood Estimation (MLE)

menggunakan algoritma IRLS.

2. Mengaplikasikan model Poisson GARMA (𝑝, 𝑞) pada data

jumlah kejadian kecelakaan dijalan tol Surabaya-Gempol ruas

Waru-Sidoarjo.

5

1.5. Manfaat

Manfaat yang bisa diperoleh dari penelitian Tugas Akhir ini :

1. Mengembangkan wawasan keilmuan dan pengetahuan tentang

model Poisson GARMA (𝑝, 𝑞).

2. Mengembangkan wawasan keilmuan dan pengetahuan tentang

cara menaksir parameter Poisson GARMA (𝑝, 𝑞) dengan

algoritma IRLS.

3. Memberikan informasi tentang peramalan pada instansi

ataupun pihak yang membutuhkan.

1.6. Sistematika Penulisan

Penulisan Tugas Akhir ini disusun dalam lima bab. yaitu :

1. BAB I PENDAHULUAN

Bab I berisi tentang gambaran umum dari penulisan Tugas

Akhir yang meliputi latar belakang, rumusan masalah, tujuan,

manfaat, dan sistematika penulisan.

2. BAB II TINJAUAN PUSTAKA

Bab II berisi tentang defenisi, teori-teori, penelitian

sebelumnya yang terkait permasalahan dalam Tugas Akhir

ini. Teori-teori yang digunakan dalam Tugas Akhir ini antara

lain time series, metode peramalan, distribusi Poisson, dan

GARMA.

3. BAB III METODE PENELITIAN

Bab III berisi langkah-langkah yang dilakukan dalam

pengerjaan Tugas Akhir.

4. BAB IV ANALISIS DAN PEMBAHASAN

BAB IV dibagi menjadi dua bagian yaitu kajian teori dan

kajian terapan (aplikasi). Pada bagian kajian teori akan

dibahas mengenai analisa model-model Poisson GARMA

serta estimasi parameternya. Pada bagian kajian terapan akan

6

dibahas mengenai aplikasi model Poisson GARMA pada

suatu data yang telah ditentukan.

5. BAB V PENUTUP

Bab V berisi kesimpulan dari hasil pembahasan pada BAB IV

dan saran untuk pengembangan penelitian berikutnya.

7

BAB II

TINJAUAN PUSTAKA

Dalam rangka mendukung proses estimasi model Poisson

GARMA (𝑝, 𝑞), maka pada bab ini dijabarkan beberapa teori dan

konsep penunjang dalam menyelesaikan permasalahan dalam

penelitian.

2.1 Penelitian Terdahulu

Dalam penelitian tugas akhir ini dilampirkan beberapa

penelitian terdahulu yang relevan dengan permasalahan yang

diteliti yaitu estimasi model Poisson GARMA (𝑝, 𝑞) untuk data

count dimana pada penelitian ini studi kasus yang diambil adalah

jumlah kecelakaan di jalan Tol Surabaya-Gempol pada ruas Waru-

Sidoarjo.

Penelitian mengenai data count dilakukan oleh Wainkellman

dan Zimmermann[9]. Pada penelitian tersebut dilakukan

pemodelan data usia dan jenis kelamin terhadap jumlah kelahiran.

Kesimpulan yang didapat yaitu model yang dihasilkan mengalami

overdispersi (varian peubah respon lebih besar dari rata-rata)

sehingga berpengaruh pada penarikan kesimpulan parameter yang

kurang tepat. Penelitian mengenai estimasi model GARMA

menggunakan IRLS telah dilakukan oleh Benjamin dkk (2003)[7].

Pada penelitian yang dilakukan Benjamin tidak melibatkan efek

stasioner dan musiman. Selanjutnya di Indonesia penerapan dari

data count dilakukan oleh Riza Inayah(2012)[10]. Pada penelitian

tersebut dilakukan pemodelan jumlah kasus kanker serviks di Jawa

Timur menggunakan analisis generalized poisson regression

(GPR). Penelitian ini bertujuan mendapatkan model hubungan

antara jumlah kasus kanker serviks yang terjadi di Jawa Timur

dengan variabel-variabel bebas yang diduga mempengaruhinya.

Dan penelitian kedua dilakukan oleh Asriawan yakni perbandingan

http://library.its.ac.id/buku/search?f=ta&kata=Generalized+Poisson+



8

peramalan GSARIMA dan SARIMA pada jumlah penderita

Demam Berdarah Dengue (DBD) di Kota Surabaya (2014)[8].

Pada penelitian ini digunakan data count yang memiliki efek

musiman sehingga model yang terbentuk adalah GSARIMA

(𝑝, 𝑑, 𝑞)(𝑃, 𝐷, 𝑄)𝑠.

2.2 Analisis Runtun Waktu

Time series adalah sekumpulan pengamatan terurut yang

diambil berdasarkan interval waktu tertentu misalkan sekumpulan

data yang diambil per menit, per jam, per hari, per minggu, per

bulan, per tahun, dan sebagainya[11]. Chatfield (2001)

mengatakan bahwa secara umum metode Time series dapat

digunakan sebagai peramalan, pemodelan dan kontrol. Pada Time

series, pengukuran yang dilakukan adalah pada interval waktu

sehingga menghasilkan waktu diskrit. Tujuan dari analisis deret

waktu ad alah untuk mendapatkan hubungan dinamis dari 𝑌𝑡, yaitu

pengamatan 𝑌 pada waktu ke-𝑡, dengan waktu-waktu sebelumnya

(𝑡 − 1, 𝑡 − 2, 𝑑𝑠𝑡) [5]. Asumsi yang penting yang harus dipenuhi

dalam memodelkan data time series adalah asumsi kestasioneran

artinya sifat-sifat yang mendasari proses tidak dipengaruhi oleh

waktu atau proses dalam keseimbangan. Apabila asumsi stasioner

belum dipenuhi maka deret belum dapat dimodelkan. Namun, deret

yang nonstasioner dapat ditransformasikan menjadi deret yang

stasioner.

2.3 Stasioneritas

Stasioner merupakan suatu kondisi data time series yang jika

rata-rata, varian dan covarian dari peubah-peubah tersebut

seluruhnya tidak dipengaruhi oleh waktu[1]. Stasioneritas berarti

bahwa tidak terjadinya pertumbuhan dan penurunan data. Konsep

stasioneritas dapat digambarkan secara praktis sebagai berikut :

9

1. Apabila plot deret waktu tidak memperlihatkan adanya

perubahan variansi yang jelas dari waktu ke waktu, maka dapat

dikatakan bahwa data tersebut stasioner terhadap variansinya.

2. Apabila suatu deret waktu diplotkan dan kemudian tidak

terbukti adanya perubahan nilai tengah dari waktu ke waktu,

maka dapat dikatakan bahwa deret data tersebut stasioner

terhadap rata-rata.

Pemodelan deret waktu 𝑌1, 𝑌2, . . . , 𝑌𝑡 didasarkan pada syarat

asumsi bahwa data deret waktu harus stasioner [1]. Secara teoritis

dapat dituliskan sebagai berikut :

1. 𝐸(𝑌𝑡) = 𝐸(𝑌𝑡+𝑘) = 𝜇 ; untuk semua t

2. 𝑉𝑎𝑟(𝑌𝑡) = 𝑉𝑎𝑟(𝑌𝑡+𝑘) = 𝜎2 ; untuk semua t

3. 𝐶𝑜𝑣(𝑌𝑡 , 𝑌𝑡+𝑘) = 𝐸[(𝑌𝑡 − 𝜇)(𝑌𝑡+𝑘 − 𝜇)]

Kestasioneran data dalam varian dapat dilihat dari

Transformasi Box-Cox dimana dikatakan stasioner apabila round

value bernilai 1. Jika suatu deret data tidak stasioner dalam varians

maka sebelum melakukan pembuatan model deret waktu

diperlukan pembedaan (transformasi).

Tabel 2. 1 Transformasi Box-Cox

Nilai 𝝀 Transformasi Box – Cox

-1 1 𝑌𝑡⁄

-0.5 1 √𝑌𝑡⁄

0 ln 𝑌𝑡

0.5 √𝑌𝑡

1 𝑌𝑡

Untuk kestasioneran data dalam rata-rata digunakan fungsi

Autokorelasi yang selanjutnya disebut ACF dan fungsi

10

Autokorelasi Parsial yang selanjutnya disebut PACF. Sebuah data

dikatakan stasioner terhadap rata-rata apabila lag pada fungsi ACF

turun secara cepat menuju nol dan dikatakan tidak stasioner jika

terjadi sebaliknya. selain itu, ACF dan PACF juga digunakan

sebagai alat utama untuk mengidentifikasi model sementara dari

data yang akan diramalkan.

Suatu proses yang stasioner {𝑋𝑡} dari data time series,

autokeralasi (ACF) pada lag 𝑘 didefinisikan :

𝜌𝑘 =𝛾𝑘

𝛾0=

𝐶𝑜𝑣(𝑋𝑡 , 𝑋𝑡−𝑘)

√𝑉𝑎𝑟(𝑋𝑡)√𝑉𝑎𝑟(𝑋𝑡−𝑘)

𝜌𝑘 = 𝐸(𝑋𝑡 − 𝜇)(𝑋𝑡+𝑘 − 𝜇)

√(𝑋𝑡 − 𝜇)2√(𝑋𝑡+𝑘 − 𝜇)2

dengan :

𝜌𝑘 : autokorelasi pada lag 𝑘

𝛾𝑘 : autocovariansi pada lag 𝑘

𝜇 : rata-rata

𝑡 : waktu pengamatan ; 𝑡 = 1,2,3,…

𝑉𝑎𝑟(𝑋𝑡) = 𝑉𝑎𝑟(𝑋𝑡−𝑘) = 𝛾0

ACF dari persamaan (2.1) juga dapat didefinisikan sebagi

berikut:

𝑟𝑘 =∑ (𝑋𝑡 − 𝜇)(𝑋𝑡+𝑘 − 𝜇)𝑛−𝑘

𝑡=1

∑ (𝑋𝑡 − 𝜇)2𝑛𝑡=1

Besaran lain yang diperlukan dalam time series yakni partial

autocorrelation function (PACF) yang didefinisikan sebagai

berikut :

11

𝜙𝑘𝑘 =𝑟𝑘 ∑ 𝜙𝑘−1,𝑗𝑟𝑘−𝑗

𝑘−1𝑗=1

1 − ∑ 𝜙𝑘−1,𝑗𝑟𝑗𝑘−1𝑗=1

Fungsi Autokorelasi Parsial (PACF) digunakan sebagai alat

untuk mengukur tingkat kerataan antara 𝑌𝑡 dan 𝑌𝑡+𝑘 apabila

pengaruh lag 𝑡 + 1, 𝑡 + 2,… , 𝑡 + 𝑘 − 1 dianggap terpisah.

2.4 Klasifikasi Model ARIMA

Model Box-Jenkins (ARIMA) dibagi kedalam 3 kelompok,

yaitu: model autoregressive (AR), moving average (MA), dan

model campuran ARIMA (autoregresive moving average) yang

mempunyai karakteristik dari dua model pertama[1].

1. Autoregressive Model (AR)

Bentuk umum model autoregressive dengan ordo 𝑝 (AR(𝑝))

atau model ARIMA (𝑝, 0,0) dinyatakan sebagai berikut:

𝑌𝑡 = 𝜇′ + 𝜙1𝑋𝑡−1 + 𝜙2𝑋𝑡−2+. . . +𝜙𝑝𝑋𝑡−𝑝 + 𝑒𝑡

dengan:

µ′ : suatu konstanta

𝜙𝑝 : parameter autoregresif ke-p

𝑒𝑡 : nilai kesalahan pada saat t

2. Moving Average Model (MA)

Bentuk umum model moving average ordo 𝑞 (MA(𝑞)) atau

ARIMA (0,0, 𝑞) dinyatakan sebagai berikut:

𝑌𝑡 = 𝜇′ + 𝑒𝑡 − 𝜃1𝑒𝑡−1 − 𝜃2𝑒𝑡−2−. . . −𝜃𝑞𝑒𝑡−𝑞

dengan :

µ′ : suatu konstanta

𝜃𝑞 : parameter-parameter moving average

𝑒𝑡−𝑞 : nilai kesalahan pada saat 𝑡 − 𝑞

12

3. Model Campuran

Terdapat dua bentuk model campuran yang dibentuk dari

model Autoregreesive (AR) dan model Moving Average (MA).

a. Model ARMA

Model ARMA yaitu model campuran dari AR(𝑝) dan MA(𝑞)

untuk data yang bersifat stasioner. Persamaan umum dari ARMA

sebagai berikut :

𝑌𝑡 = 𝜙1𝑋𝑡−1+. . . +𝜙𝑝𝑋𝑡−𝑝 + 𝑒𝑡

− 𝜃1𝑒𝑡−1−. . . −𝜃𝑞𝑒𝑡−𝑞 (2.1)

dengan:

𝜙1 ∶ parameter autoregressive

𝜃1 ∶ parameter moving average

b. Model ARIMA

Apabila nonstasioneritas ditambahkan pada campuran proses

ARMA, maka model umum ARIMA (𝑝, 𝑑, 𝑞) terpenuhi. Misalnya

𝑊𝑡 = 𝑌𝑡 − 𝑌𝑡−1, maka proses ARMA dapat ditulis :

𝑊𝑡 = 𝜙1𝑊𝑡−1+. . . +𝜙𝑝𝑊𝑡−𝑝 + 𝑒𝑡

− 𝜃1𝑒𝑡−1−. . . −𝜃𝑞𝑒𝑡−𝑞

jika 𝑊𝑡 diganti dengan 𝑌𝑡 − 𝑌𝑡−1 makan persamaan (2.7) menjadi:

𝑌𝑡 = 𝑌𝑡−1 − 𝜙1(𝑌𝑡−1 − 𝑌𝑡−2)+. . . +𝜙𝑝(𝑌𝑡−𝑝

− 𝑌𝑡−𝑝−1) + 𝑒𝑡

− 𝜃1𝑒𝑡−1−. . . −𝜃𝑞𝑒𝑡−𝑞

Sehingga model (2.8) merupakan bentuk dari model ARIMA.

2.5 Generalized Linier Models

Analisis regresi yang responnya termasuk salah satu

keluarga eksponensial disebut Generalisasi Model Linier atau lebih

13

dikenal dengan GLM. GLM memperluas model regresi biasa yang

mencakup variabel respon berdistribusi tidak normal dan fungsi

model untuk mean. Menurut Kedem dan Fokianos (2003)

komponen utama dalam analisis GML diuraikan sebagai

berikut[12]:

1. Komponen random

Komponen random dari GLM terdiri dari variabel respon Y

dengan observasi bebas (𝑦1, 𝑦2, . . . , 𝑦𝑛) dari sebuah distribusi

dalam keluarga eksponensial. Bentuk fungsi densitas

probabilitas dari distribusi keluarga eksponensial, yaitu

sebagai berikut:

𝑓(𝑦𝑡 , 𝜃𝑡, 𝐾|𝐹𝑡−1) = 𝑒𝑥𝑝 {

𝑦𝑡𝜃𝑡 − 𝑏(𝜃𝑡)

𝑘𝑡(𝛼)} (2.2)

dimana fungsi parameter 𝐾𝑡(𝛼) berasal dari bentuk 𝛼

𝑊𝑡, 𝛼

merupakan parameter dispersi dan 𝑊𝑡 adalah parameter yang

diketahui berupa bobot. Sedangkan parameter 𝜃𝑡 merupakan

parameter alami dari suatu distribusi.

2. Komponen sistematik

Komponen Sistematis dari GLM adalah hubungan dari sebuah

vektor (𝜂1, 𝜂2, . . . , 𝜂𝑛) untuk menjelaskan variabel-variabel

yang berhubungan dalam sebuah model linier.

𝑔(𝜇𝑡) = 𝜂𝑡 = ∑𝛽𝑗𝒁(𝑡−1)𝑗 = 𝒁𝑡−1′

𝑝

𝑗=1

𝜷 (2.3)

Dimana fungsi 𝑔(. ) disebut fungsi link, sementara 𝜂𝑡 sebagai

model prediktor linier.

2.6 Distribusi Poisson

Distrbusi Poisson adalah distribusi probabilitas diskret yang

menyatakan peluang jumlah peristiwa yang terjadi pada periode

14

waktu tertentu apabila rata-rata kejadian tersebut diketahui dan

dalam waktu yang saling bebas sejak kejadian terakhir.

Misalkan 𝑌1, 𝑌2, . . . , 𝑌𝑛 adalah sampel random yang berasal dari

populasi berdistribusi poisson dengan parameter 𝜇𝑡. Fungsi

kepadatan peluang untuk distribusi poisson dengan parameter 𝜇𝑡

adalah:

𝑓(𝑦𝑡; 𝜇𝑡) =

𝑒−𝜇𝑡𝜇𝑦𝑡

𝑦𝑡! ; 𝑦 = 0,1,2, . . . . , 𝑛 (2.4)

dengan :

𝑒 = 2.71828…

𝑦𝑡 = 0,1,2,…

𝑡 = 1,2,3,… , 𝑛

𝐸(𝑌𝑡) = 𝜇𝑡

𝑉𝑎𝑟[𝑌𝑡] = 𝜇𝑡

2.7 Model Poisson untuk data count

Distribusi bersyarat dari hasil observasi 𝑦𝑡, untuk 𝑡 =

1,2,3,… , 𝑛 diberikan pada himpunan 𝐻𝑡 =

{𝑥𝑡, . . . , 𝑥1, 𝑦𝑡−1, . . . , 𝑦1, 𝜇𝑡−1, . . . , 𝜇1}, yang merupakan keluarga

eksponensial. Model Poisson untuk data count diperoleh dari

bentuk eksponensial dari distribusi Poisson yaitu sebagai

berikut[7]:

𝑓(𝑦𝑡; 𝛽|𝐻𝑡−1) = exp{𝑦𝑡 ln 𝜇𝑡 − 𝜇𝑡 − ln 𝑦𝑡 !}

(2.5)

untuk = 1,2, . . . , 𝑛 ; 𝐸(𝑌𝑡|𝐻𝑡−1) = 𝜇𝑡 ; 𝑏(𝜃𝑡) = 𝜇𝑡 = exp (𝜃𝑡) ;

𝑉𝑎𝑟(𝜇𝑡) = 𝜇𝑡 dan 𝜔𝑡 = 1 dengan bentuk link kanonik :

𝑔(𝜇𝑡) = 𝜃𝑡 = ln𝜇𝑡 = 𝜂𝑡 (2.6)

dan 𝜂𝑡 = 𝒁𝑡−1′ 𝜷, 𝜷 merupakan parameter yang tidak diketahui.

15

Estimasi Likelihood Parsial untuk model Poisson seperti

dijelaskan dalam Kedem & Fokianos (2002) bahwa fungsi

likelihood parsial untuk model Poisson adalah sebagai berikut [13]:

𝑃𝐿(𝜷) = ∏𝑓(𝑦𝑡; 𝜷|𝐻𝑡−1)

𝑛

𝑡=1

𝑃𝐿(𝜷) = ∏

exp (−𝜇𝑡(𝜷))𝜇𝑡(𝜷)𝑦𝑡

𝑦𝑡!

𝑛

𝑡=1

(2.7)

2.8 Model Generalized Autoregressive and Moving Average

(GARMA)

Model GARMA dikenalkan pertama kali oleh Benjamin dkk.

(2003). Berdasarkan persamaan (2.2), model GARMA (𝑝, 𝑞)

mempunyai bentuk sebagai berikut [6] :

𝑔(𝜇𝑡) = 𝒁𝑡−1

′ 𝜷 = 𝑿𝑡−1′ 𝜷 + 𝜏𝑡

(2.8)

dengan

𝜏𝑡 = ∑𝜙𝑗𝒜(𝑦𝑡−𝑗, 𝑥𝑡−𝑗,𝛽) +

𝑝

𝑗=1

∑𝜃𝑗ℳ(𝑦𝑡−𝑗, 𝜇𝑡−𝑗)

𝑞

𝑗=1

𝜏𝑡 : komponen AR dan MA

𝐴 : fungsi yang mempresentasikan bentuk autoregressive

ℳ : fungsi yang mempresentasikan bentuk moving average

𝜙𝑇 : parameter autoregressive ; 𝜙𝑇 = (𝜙1, 𝜙2, . . . , 𝜙𝑝)

𝜃𝑇 : parameter moving average ; 𝜽𝑇 = (𝜃1, 𝜃2, . . . , 𝜃𝑝)

Bentuk sub model parsimoni dari model GARMA (𝑝, 𝑞) yang

didefinikan oleh Benjami dkk.(2003) adalah sebagai berikut :

𝑔(𝜇𝑡) = 𝒁𝑡−1′ 𝜷

16

𝑔(𝜇𝑡) = 𝑿𝑡−1′ 𝜷 + ∑ 𝜙𝑗{𝑔(𝑦𝑡−𝑗) − 𝑋𝑡−𝑗

′ 𝛽}

𝑝

𝑗=1

+∑ 𝜙𝑗 {𝑔(𝑦𝑡−𝑗) − 𝜂𝑡−𝑗𝛽}

𝑞

𝑗=1

(2.9)

2.9 Model Poisson GARMA (p,q)

Model Poisson GARMA (𝑝, 𝑞) dikembangkan berdasarkan

model GARMA (𝑝, 𝑞) dengan pendekatan distribusi Poisson[7].

Diberikan 𝑦𝑇 = (𝑦𝑡 , 𝑦𝑡+1, … , 𝑦𝑡+𝑛) adalah model data deret

waktu. Jika 𝑦𝑡~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜇𝑡 , 𝛼) maka 𝐸(𝑦𝑡) = 𝑉𝑎𝑟(𝑦𝑡) = 𝜇𝑡 dan

𝛼 → 0. Sebuah distribusi bersyarat untuk 𝑦𝑡 pada (14) memberikan

model Poisson GARMA (𝑝, 𝑞). Jika 𝑔 adalah fungsi ln pada

(2.20), maka :

ln(𝜇𝑡) = 𝑿𝑡−1′ 𝜷

+ ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ − 𝑿𝑡−𝑗

′ 𝜷}

𝑝

𝑗=1

+∑𝜃𝑗 {ln 𝑦𝑡−𝑗

∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

(2.10)

dimana 𝑦𝑡−𝑗∗ = max (𝑦𝑡−𝑗, 𝑐) dan 0 < 𝑐 ≤ 1. Jika terdapat nilai 0

pada nilai 𝑦𝑡−𝑗 maka akan diganti dengan 𝑐.

2.10 Maximum Likelihood Estimation (MLE)

Metode Maximum Likelihood Estimation adalah metode

pendugaan yang memaksimumkan fungsi likelihood [14]. Dalam

penelitian ini metode MLE digunakan untuk menduga parameter

Distribusi Poisson. Adapun fungsi Likelihood 𝐿(𝜃) sebagai berikut

17

𝐿(𝜃) = ∏𝑓(𝑥𝑖|𝜃)

𝑛

𝑡=1

(2.11)

Misalkan diketahui Populasi 𝑋~𝑓(𝑥, 𝜃), maka langkah-langkah

metode MLE sebagai berikut :

1. Ambil n sampel random 𝑥1, 𝑥2, . . . , 𝑥𝑛 yang berdistribusi sama

dengan 𝑋

2. Buat fungsi Likelihood yaitu fungsi distribusi peluang

bersama dari 𝑥1, 𝑥2, . . . , 𝑥𝑛

𝐿(𝑥1, 𝑥2, . . . , 𝑥𝑛|𝜃) = ∏𝑓(𝑥𝑖|𝜃)

𝑛

𝑖=1

3. Maksimumkan fungsi Likelihood terhadap 𝜃

𝜕𝐿(𝜃)

𝜕𝜃= 0 → 𝑑𝑖𝑑𝑎𝑝𝑎𝑡 𝜃

𝜕2𝐿(𝜃)

𝜕𝜃2| 𝜃 = 𝜃 < 0 → 𝜃 𝑝𝑒𝑛𝑎𝑘𝑠𝑖𝑟 𝜃

atau dengan ln 𝐿(𝜃)

𝜕 ln 𝐿(𝜃)

𝜕𝜃= 0 → 𝑑𝑖𝑑𝑎𝑝𝑎𝑡 𝜃

𝜕2 ln 𝐿(𝜃)

𝜕𝜃2| 𝜃 = 𝜃 < 0 → 𝜃 𝑝𝑒𝑛𝑎𝑘𝑠𝑖𝑟 𝜃

Untuk mempermudah perhitungan secara matematis,

umumnya digunakan fungsi log-likelihoood.

𝑙(𝜃) = ln 𝐿(𝜃) = ∑ln𝑓(𝑥𝑖|𝜃)

𝑛

𝑖=1

(2.12)

18

Dari syarat cukup dalam penggunaan metode MLE, terdapat

kemungkinan bahwa bentuk yang dihasilkan close form. Jika

terjadi hal tersebut, maka untuk memaksimumkan persamaan

dilakukan dengan iterasi numerik yaitu dengan optimasi Algoritma

Iteratively Reweighted Least Squares (IRLS)

2.11 Algoritma IRLS

Estimasi model GARMA menggunakan IRLS telah

dilakukan oleh Benjamin, dkk [7]. berdasarkan proses yang

dilakukan oleh Greeb (1984). Misalnya parameter yan akan

diestimasi (𝜸𝑻 = 𝜷𝑻, 𝝓𝑻, 𝜽𝑻). Ketiga parameter tersebut

diestimasi dengan menggunakan MLE, namun karena bentuk yang

dihasilkan close form dilanjutkan dengan menggunakan optimasi

algoritma IRLS[13].

Adapun langkah-langkah algoritma IRLS untuk mendapatkan

taksiran parameter menurut Kedem dan Fokianos adalah sebagai

berikut :

1. Inisialisasi, memilih nilai awal untuk �̂�(0) dengan

menggunakan metode Ordinary Least Square (OLS) untuk

𝑡 = 1,2,3,4… , 𝑇.

�̂�(0) = (𝑥′𝑥)−1𝑥′𝑦𝑡∗

𝑥 dan 𝑦 didefinisikan sebagai berikut :

𝑥 = [

1 𝑥11 … 𝑥𝑘1

1 𝑥12 … 𝑥𝑘2

⋮ ⋮ ⋱ ⋮1 𝑥1𝑛 … 𝑥𝑘𝑛

] dan 𝑦 = [

ln 𝑦0∗

ln 𝑦1∗

⋮ln 𝑦𝑇−1

∗

]

2. Menghitung nilai �̂�𝒕(𝟎)

�̂�𝑡 = exp(𝑿𝒕′𝜷)

19

3. Menghitung nilai 𝑊

𝑊(1) =

[

1

�̂�𝟎(𝟎)

1

�̂�𝟏(𝟎)

⋱1

�̂�𝑻−𝟏(𝟎)

]

4. Menghitung nilai 𝑧 yakni sebagai berikut :

𝑧𝑡(1) = 𝜼𝑡

(1)+

𝑦𝑡 + �̂�𝟎

�̂�𝟎

𝜼𝑡(1)

= exp(𝑿�̂�(0))

5. Menghitung estimasi

�̂�(𝑘+1) = (𝑿′𝑾(𝒌+𝟏)𝑿)−1

𝑿′𝑾(𝒌+𝟏)𝑧(𝑘+1) (2.13)

6. Ulangi langkah sampai dengan e menggunakan nilai �̂�(𝟏)

sehingga akan diperoleh nilai baru �̂�(𝟐)

7. Update 𝑘 ke 𝑘 + 1 dan ulangi langkah b sampai diperoleh

toleransi sebagai berikut :

| �̂�(𝑡) − �̂�(𝑡−1)| < 𝜀𝛽

2.12 Perumusan Model dan Forecasting Poisson GARMA

Dalam perumusan model awal Poisson GARMA (𝑝, 𝑞)

diperoleh dari perumusan model awal ARIMA[8]. Adapun langkah

20

dalam perumusan model ARIMA yaitu tahap identifikasi model,

penaksiran dan pengujian parameter, serta untuk mendapatkan

model terbaik dilanjutkan dengan uji diagnostik dan overfitting.

Setelah mendapatkan model terbaik dilakukan forecasting dengan

menggunakan model Poisson GARMA (𝑝, 𝑞).

1. Identifikasi Model

Identifikasi model ARIMA dapat dilakukan dengan melihat

plot deret waktu, plot ACF, dan plot PACF. Fungsi Autokorelasi

atau Autocorrelation Function (ACF) merupakan suatu hubungan

linier antara pengamatan 𝑍𝑡 dengan pengamatan 𝑍𝑡−𝑘. Fungsi

autokorelasi parsial atau partial autocorrelation function (PACF)

digunakan untuk menunjukkan besarnya hubungan antar nilai

variabel yang sama dengan menganggap pengaruh dari semua

kelambatan waktu yang lain adalah konstan.

2. Estimasi dan Pengujian Parameter

Setelah identifikasi model selesai, selanjutnya dilakukan

estimasi parameter pada model. Ada beberapa metode yang dapat

digunakan dalam mengestimasi parameter, antara lain: metode

least squares, metode maximum likelihood estimation, metode

conditional least squares, dan metode non linier estimation.

Setelah diperoleh nilai estimasi dari masing-masing

parameter kemudian dilakukan pengujian signifikansi parameter

untuk mengetahui apakah model sudah layak atau belum untuk

digunakan. Untuk pengujian signifikansi parameter menggunakan

uji-t student. Misalnya 𝜸 adalah suatu parameter pada model

Poisson GARMA (mencakup 𝜷, 𝝓 dan 𝜽) dan 𝛾 adalah estimasi

dari 𝛾 maka pengujian signifikansi parameter dapat dinyatakan

sebagai berikut [7]:

21

Hipotesis :

𝐻0: 𝛽 = 0 (Parameter model tidak signifikan).

𝐻1: 𝛽 ≠ 0 (Parameter model signifikan.

Statistik Uji :

𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = �̂�

𝑆𝐸(�̂�) untuk 𝑆𝐸(�̂�) ≠ 0 (2.14)

dengan :

�̂� : parameter hasil estimasi

𝑆𝐸(�̂�) : standart error estimasi parameter

Kriteria Pengujian :

𝐻0 akan ditolak apabila nilai statistik uji |𝑡ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑡𝛼

2,(𝑛−1),

sehingga yang berarti bahwa parameter model signifikan, dengan

n adalah jumlah data dan 𝛼 adalah taraf signifikan

3. Uji diagnostik

Dalam menentukan model yang terbaik, harus dipilih model

yang seluruh parameternya signifikan, kemudian memenuhi dua

asumsi residual yaitu berdistribusi normal dan white noise, yaitu:

a. Uji Asumsi Residual White Noise

Suatu model bersifat white noise artinya residual dari model

tersebut telah memenuhi asumsi identik (variasi residual homogen)

serta independen (antar residual tidak berkorelasi). Pengujian

asumsi white noise dilakukan dengan menggunakan uji Ljung-Box

yang meliputi :

Hipotesis :

𝐻0 ∶ 𝜌1 = 𝜌2 = ⋯ = 𝜌𝑘 = 0 (residual memenuhi syarat white

noise).

𝐻1 ∶ Minimal ada satu 𝜌𝑘 ≠ 0 dengan 𝑘 = 1,2,… , 𝐾.

(residual tidak memenuhi syarat white noise).

22

Statistik uji :

𝑄 = 𝑛(𝑛 + 2)∑�̂�𝑘

2

(𝑛−𝑘)𝐾𝑘=1 (2.15)

dengan :

𝐾 : lag maksimum

𝑛 : jumlah data

�̂�𝑘 : autokorelasi residual untuk lag ke k

Kriteria penguji :

𝐻0 akan ditolak apabila nilai statistik uji 𝑄 > 𝜒𝛼,𝐾−𝑝−𝑞2 , sehingga

residual memenuhi syarat white-noise, dengan 𝛼 adalah taraf

signifikan, K adalah lag maksimum, p adalah orde dari AR, dan q

adalah orde dari MA.

b. Uji Asumsi Distribusi Normal

Untuk pengujian residual berdistribusi normal dapat

menggunakan uji Komogorov-Smirnov. Pengujian dapat

dilakukan sebagai berikut:

Hipotesa :

𝐻0 ∶ 𝐹(𝑥) = 𝐹0(𝑥) (residual berdistribusi normal)

𝐻1 ∶ 𝐹(𝑥) ≠ 𝐹0(𝑥) (residual tidak berdistribusi normal)

Statistik uji :

𝐷 = 𝑠𝑢𝑝𝑥

|𝑆(𝑥) − 𝐹0(𝑥)| (2.16)

dengan :

𝑆(𝑥) : Fungsi distribusi kumulatif data sampel

𝐹0(𝑥) : Fungsi peluang distribusi normal

Kriteria penguji :

23

𝐻0 akan ditolak apabila nilai statistik uji 𝐷 > 𝐷1−𝛼,𝑛, sehigga

residual memenuhi syarat normalitas dengan 𝛼 adalah taraf

signifikan dan n adalah jumlah data.

c. Overfitting

Salah satu prosedur diagnostik cek yang dikemukakan Box

Jenkins adalah overfitting, yaitu menambah satu atau lebih

parameter dalam model yang dihasilkan pada tahap identifikasi.

Model yang dihasilkan dari overfitting dijadikan sebagai model

alternatif yang kemudian dicari model terbaik diantara model-

model yang signifikan.

4. Deteksi Outlier

Pada data time-series sering dijumpai data residual yang tidak

berdistribusi normal. Hal ini menyebabkan peramalan dengan

menggunakan metode ARIMA memberikan hasil ramalan yang

bias. Hal ini menunjukan perlunya dilakukan deteksi outlier pada

residual ARIMA sehingga model ARIMA memenuhi semua uji

asumsi yang dibutuhkan dengan persamaan yang diberikan sebagai

berikut [5].

𝑥𝑖(𝑡) = {1;0;

𝑡: 𝑡𝑒𝑟𝑗𝑎𝑑𝑖 𝑜𝑢𝑡𝑙𝑖𝑒𝑟𝑡: 𝑦𝑎𝑛𝑔 𝑙𝑎𝑖𝑛

(2.17)

Sehingga persaaan model peramalan menjadi sebagai berikut.

∅𝑝(𝐵)(1 − 𝐵)𝑑𝑍𝑡 = 𝜃𝑞(𝐵)𝑒𝑡 + 𝛽𝑖𝑥𝑖(𝑡) (2.18)

dengan :

𝑍𝑡 : data ke t

𝐵 : operator back shift

∅𝑝 : parameter autoregressive ke p

24

𝜃𝑞 : parameter moving average ke q

𝛽𝑖 : parameter regresi ke i ; 𝑖 = 1,2,3, …

𝑥𝑖 : outlier ke i; 𝑖 = 1,2,3,…

𝑒𝑡 : nilai residual ke t

Dengan penambahan variabel outlier berupa 𝑥𝑖 sampai

mendapatkan residual yang diinginkan yaitu sampai residual

memenuhi asumsi normalitas. Pengujian parameter untuk kodel

ARIMA dengan outlier dibagi menjadi dua yaitu uji serentak dan

uji parsial.

a. Uji Serentak

Pengujian parameter secara serentak (simultan) adalah

sebagai berikut:

Hipotesis :

𝐻0: 𝛽0 = 𝛽1 = ⋯ = 𝛽𝑘 = 0

𝐻1: ada 𝛽𝑗 ≠ 0

Uji statistik :

𝐹ℎ𝑖𝑡𝑢𝑛𝑔 =𝑀𝑆𝑟𝑒𝑔𝑟𝑒𝑠𝑖

𝑀𝑆𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙 (2.19)

Kriteria pengujian :

𝐻0 akan ditolak apabila nilai statistik uji 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 >

𝐹𝛼,𝑘,(𝑛−𝑘−1), sehingga semua variabel prediktor

berpengaruh signifikan terhadap variabel respon, dengan 𝛼

adalah taraf signifikan, n adalah jumlah data, dan k adalah

banyaknya variabel prediktor.

b. Uji Parsial

Prosedur pengujian parameter secara parsial adalah sebagai

berikut.

25

Hipotesis :

𝐻0 ∶ 𝛽𝑗 = 0

𝐻1 ∶ 𝛽𝑗 ≠ 0

Uji statistik :

𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =𝛽𝑗

𝑆𝐸(𝛽𝑗) (2.20)

Dengan :

𝛽𝑗 : parameter ke-j

𝑆𝐸(𝛽𝑗) : standart residual parameter ke-j


𝐻0 akan ditolak apabila nilai statistik uji |𝑡ℎ𝑖𝑡𝑢𝑛𝑔| >

𝑇𝛼\2 ,(𝑛−𝑘−1), sehingga variabel prediktor berpengaruh

signifikan terhadap variabel respon, dengan 𝛼 adalah taraf

signifikan, n adalah jumlah data, dan k adalah banyaknya

parameter variabel prediktor.

5. Kriteria Pemilihan Model Terbaik

Kriteria model terbaik yang digunakan pada peneltian Tugas

Akhir ini adalah Akaike’s Information Criterion (AIC). AIC adalah

suatu kriteria pemilihan model terbaik dengan mempertimbangkan

banyaknya parameter dalam model. Kriteria AIC dapat

dirumuskan sebagai berikut [15]:

𝐴𝐼𝐶(𝑝∗) = −2 ln (𝑃𝐿(�̂�)) + 2𝑝∗ (2.21)

dengan 𝑃𝐿(�̂�) adalah nilai likelihood, dan 𝑘 adalah jumlah

parameter. Untuk memilih model yang terbaik yaitu dengan

memilih model yang mempunyai nilai AIC terkecil.

26

6. Uji Godness of fit

Uji kecocokan atau Goodness of fit digunakan untuk

mengetahui ada tidaknya kesesuaian model sebaran yang

diasumsikan, atau ada tidaknya kecocokan antara frekuensi yang

teramati (terobservasi) dengan frekuensi harapan. Pada tahap ini

digunakan devian untuk mendapatkan kesesuaian model. Misalnya

𝑙(𝜇�̂�; 𝑦) merupakan log-likelihood parsial yang maksimum dari

model reduksi dan 𝑙(𝑦; 𝑦) merupakan log-likelihood parsial dalam

model keluarga eksponensial.

Hipotesis:

𝐻0 ∶ 𝜇𝑡 = 𝜇 (𝑥𝑡; 𝜷), untuk 𝑡 = 1,2,3, . . , 𝑛

𝐻1 ∶ 𝜇𝑡 ≠ 𝜇 (𝑥𝑡; 𝜷)

Statistik uji :

𝐷 = 2{𝑙(𝑦; 𝑦) − 𝑙(𝜇�̂�; 𝑦} (2.22)


𝐻0 akan ditolak jika 𝐷 < 𝜒𝛼,𝑛−𝑝−𝑞2 sehingga model dapat

dikatakan sesuai, dengan 𝑛 adalah jumlah data, 𝑝 dan 𝑞 adalah

orde.

27

BAB III

METODOLOGI PENELITIAN

Pada bab ini akan dijabarkan mengenai langkah-langkah

dalam penelitian, diantaranya sebagai berikut :

3.1 Sumber Data

Pada penelitian ini, data yang digunakan adalah data jumlah

kejadian kecelakaan di jalan Tol Surabaya-Gempol ruas Waru-

Sidoarjo dari bulan Januari tahun 2012 hingga Agustus tahun 2017

dengan jumlah data sebesar 68. Data tersebut diperoleh dari pihak

pengelola jalan tol P.T. Jasa Marga.

3.2 Variabel Penelitian

Variabel Y yang digunakan dalam penelitian ini adalah jumlah

kecelakaan di jalan Tol Surabaya-Gempol ruas Waru-Sidoarjo.

Tabel 3. 1 Struktur Data Jumlah Kecelakaan di Tol Surabaya-

Gempol

Tahun Bulan Jumlah Kecelakaan (Y)

2012

Januari 𝑌1

Februari 𝑌2

⋮

Desember 𝑌12

2013

Januari 𝑌13

Februari 𝑌14

⋮

Desember 𝑌24

⋮ ⋮ ⋮

2017

Januari 𝑌61

Februari 𝑌62

⋮

Agustus 𝑌68

28

3.3. Metode dan Tahapan Penelitian

Metode dan tahapan penelitian yang akan dilakukan adalah

sebagai berikut :

1. Pengumpulan data

Pada tahap ini dilakukan pengumpulan data jumlah

kecelakaan di jalan Tol Surabaya-Gempol ruas Waru-

Sidoarjo dari P.T. Jasa Marga.

2. Studi Literatur

Pada tahap ini dilakukan studi literatur untuk mendukung

penelitian. Bahan-bahan referensi yang digunakan berupa

buku, jurnal, tugas akhir, thesis dan juga media elektronik

(internet) yang sesuai dan berhubungan dengan

permasalahan yang dibahas.

3. Mengkaji cara mendapatkan penaksir parameter model

Poisson GARMA (𝑝, 𝑞) dengan metode MLE menggunakan

algoritma IRLS. Adapun langkah-langkahnya sebagai

berikut:

a. Mengasumsikan bahwa 𝑦𝑡 berdistribusi Poisson.

b. Menentukan fungsi padat peluang untuk Distribusi

Poisson, yaitu :

𝑓(𝑦𝑖 |𝑥𝑖) =𝑒−𝜇𝑖𝜇𝑖

𝑦𝑖

𝑦𝑖!, 𝑦𝑖 = 0,1,2, . . .

c. Membentuk fungsi padat peluang distribusi Poisson

kedalam bentuk fungsi likelihood, yaitu :

𝑃𝐿(𝜸) = ∏𝑓(𝑦𝑡; 𝜷|𝐹𝑡−1)

𝑛

𝑡=1

d. Membentuk fungsi likelihood kedalam bentuk ln-

likelihood, yaitu :

𝑙(𝜸) = ln ( 𝑃𝐿(𝜸)

29

e. Menurunkan fungsi likelihood terhadap parameter yang

mengikutinya.

f. Menentukan estimasi parameter

4. Melakukan peramalan model Poisson GARMA (𝑝, 𝑞) pada

data jumlah kecelakaan di jalan tol Surabaya-Gempol ruas

Waru-Sidoarjo pada dengan langkah sebagai berikut :

a. Tahap Identifikasi

i. Melakukan identifikasi plot jumlah kecelakaan

dengan menggunakan plot time series.

ii. Mengatasi data yang tidak stasioner

iii. Melakukan identifikasi orde (𝑝, 𝑞)

b. Tahap Estimasi

i. Melakukan estimasi model Poisson GARMA (𝑝, 𝑞)

sesuai model yang diperoleh dari langkah sebelumnya

dengan menggunakan pendekatan IRLS

ii. Menguji signifikansi parameter

c. Tahap Cek Diagnosa

d. Tahap Peramalan

Pada tahap ini dilakukan peramalan model Poisson

GARMA (𝑝, 𝑞) untuk beberapa bulan kedepan

5. Penarikan Kesimpulan

Setelah langkah 1 hingga 4 dilakukan, maka dilakukan

penarikan kesimpulan dari pembahasan yang sudah dilakukan

sebelumnya

6. Penulisan Laporan Tugas Akhir

Penulisan laporan tugas akhir dilakukan dari awal dilakukan

penelitian hingga waktu yang telah ditentukan

30

3.3 Diagram Alir

Tahapan penelitian Tugas Akhir disajikan dalam bentuk

diagram alir pada Gambar 3.1. Diagram alir dari metode ARMA

dan Algoritma IRLS juga dapat dilihat pada Gambar 3.2 dan

Gambar 3.3.

Gambar 3. 3 Diagram Alir PengerjaanTugas Akhir

31

Gambar 3. 4. Diagram Alir Perumusan Model ARIMA

32

Gambar 3. 5 Diagram ALir ALgoritma IRLS

33

BAB IV

ANALISA DAN PEMBAHASAN

Pada bab ini dibahas mengenai estimasi parameter model

Poisson GARMA (𝑝, 𝑞) yang dibagi menjadi 2 bagian yaitu kajian

teori dan kajian terapan.

4.1. KAJIAN TEORI

Pada kajian ini dibahas mengenai model Poisson GARMA

(𝑝, 𝑞) dan contoh model khusus Poisson GARMA (𝑝, 𝑞) serta

estimasi parameternya.

4.1.1. Model Poisson GARMA (𝒑, 𝒒)

Model Poisson GARMA (𝑝, 𝑞) diusulkan oleh Benjamin pada

tahun 1998 dengan definisi sebagai berikut :

Definisi 4.1 : Model Poisson GARMA (𝑝, 𝑞) dibangun dari

distribusi bersyarat Poisson untuk 𝑦𝑡 pada persamaan (2.4). Jika

fungsi 𝑔 pada (2.9) diganti dengan fungsi logaritma natural, maka

persamaan menjadi:

ln(𝜇𝑡) = 𝑿𝑡−1′ 𝜷

+ ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ − 𝑿𝑡−𝑗

′ 𝜷}

𝑝

𝑗=1

+∑𝜃𝑗 {ln 𝑦𝑡−𝑗

∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

(4.1)

Pada penelitian ini, variabel prediktor 𝑥 diabaikan sehingga

menurut Marinho dan Ricardo (2015) 𝑋𝑡−1′ 𝛽 dapat diganti dengan

suatu konstanta 𝑏 [16]. Sehingga persamaan (4.1) menjadi:

34

ln(𝜇𝑡) = 𝑏 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ − 𝑏} +

𝑝

𝑗=1

∑𝜃𝑗 {ln 𝑦𝑡−𝑗

∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

ln(𝜇𝑡) = 𝑏 + ∑𝜙𝑗(ln 𝑦𝑡−𝑗∗ ) − ∑𝜙𝑗𝑏

𝑝

𝑗=1

𝑝

𝑗=1

+ ∑𝜃𝑗 {ln 𝑦𝑡−𝑗

∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

(4.2)

jika 𝛽0 = 𝑏 − ∑ 𝜙𝑗𝑏𝑝𝑗=1 maka persamaan (4.2) menjadi:

ln(𝜇𝑡) = 𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ } +

𝑝

𝑗=1


∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

(4.3)

dengan 𝑦𝑡−𝑗∗ = max (𝑦𝑡−𝑗, 𝑐) dan 0 < 𝑐 ≤ 1. Persamaan (4.3)

dibentuk kedalam matriks, maka bentuk matrik sebagai berikut:

[ ln(𝜇2)

ln(𝜇3)

ln(𝜇4)⋮

ln(𝜇𝑇)]

=

[ 1 ln 𝑦1

∗ … ln 𝑦1∗ ln

𝑦1∗

𝜇1

… ln𝑦1

∗

𝜇1

1 ln 𝑦2∗ … ln 𝑦2

∗ ln𝑦2

∗

𝜇2

… ln𝑦2

∗

𝜇2

1 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮

1 ln 𝑦𝑇−1∗ … ln 𝑦𝑇−1

∗ ln𝑦𝑇−1

∗

𝜇𝑇−1

… ln𝑦𝑇−1

∗

𝜇𝑇−1]

[ 𝛽0

𝜙1

⋮𝜙𝑝

𝜃1

⋮𝜃𝑞 ]

𝒗𝒕 = 𝑿 𝜸

dengan 𝑡 = 2,3,4, . . . , 𝑇 sehingga diperoleh persamaan sebagai

berikut :

35

𝜇𝑡= exp [𝛽

0+ ∑𝜙

𝑗{ln 𝑦

𝑡−𝑗∗ }

𝑝

𝑗=1

+∑ 𝜃𝑗 {ln 𝑦

𝑡−𝑗∗

𝜇𝑡−𝑗

}

𝑞

𝑗=1

]

(4.4)

4.1.2. Estimasi Parameter Model Poisson GARMA (𝒑, 𝒒)

Dalam mencari estimasi parameter model Poisson GARMA

(𝑝, 𝑞) langkah awal yang dilakukan yaitu dengan mengasumsikan

bahwa variabel respon 𝑦 pada data jumlahan mengikuti distribusi

Poisson pada persamaan (2.4). Bentuk partial likelihood dari

distribusi Poisson sebagai berikut:

𝑃𝐿(𝛾) = ∏ 𝑓(𝑦𝑡 , 𝛾)𝑛𝑡=1

𝑃𝐿(𝛾) = ∏

exp(−𝜇𝑡(𝛾))𝜇𝑡(𝛾)𝑦𝑡

𝑦𝑡!

𝑛

𝑡=1

Persamaan diatas dibentuk ke dalam partial log-likelihood

sehingga menjadi:

𝑙(𝛾) = ln𝑃𝐿(𝛾)

𝑙(𝛾) = ln [∏

exp(−𝜇𝑡(𝛾))𝜇𝑡(𝛾)𝑦𝑡

𝑦𝑡!

𝑛

𝑡=1

]

𝑙(𝛾) = ∑𝑦𝑡

𝑛

𝑡=1

ln 𝜇𝑡(𝛾) − ∑𝜇𝑡(𝛾) −

𝑛

𝑡=1

∑(𝑦𝑡

𝑛

𝑡=1

!) (4.5)

Jika persamaan (4.4) disubtitusikan kedalam persamaan

(4.5) bentuk partial log-likelihood akan mengikuti bentuk :

36

𝑙(𝛾) = ∑𝑦𝑡

𝑛

𝑡=1

ln {exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }

𝑝

𝑗=1


∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

)}

− ∑{exp(𝛽0 + ∑𝜙𝑗{ln𝑦𝑡−𝑗∗ }

𝑝

𝑗=1

𝑛

𝑡=1


∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

)} −∑(𝑦𝑡

𝑛

𝑡=1

!)

(4.6)

Untuk memaksimumkan fungsi pada persamaan (4.6) maka

dilakukan turunan pertama. Turunan pertama dari partial log-

likelihood terhadap parameter koefisien 𝛽0 adalah :

𝜕𝑙(𝜇𝑡)

𝜕𝛽0=

𝜕𝑙

𝜕𝛽0[∑𝑦𝑡

𝑛

𝑡=1

ln {exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }

𝑝

𝑗=1


∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

)}

− ∑{exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }

𝑝

𝑗=1


∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

)}

𝑛

𝑡=1

− ∑(𝑦𝑡

𝑛

𝑡=1

!)]

𝜕𝑙(𝜇𝑡)

𝜕𝛽0= ∑𝑦𝑡

𝑛

𝑡=1

− ∑{exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }

𝑝

𝑗=1

𝑛

𝑡=1


∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

)}

Dengan cara yang sama diperoleh turunan pertama dari

partial log-likelihood terhadap parameter koefisien 𝝓 sebagai

berikut :

37

𝜕𝑙(𝜇𝑡)

𝜕𝜙1= ∑𝑦𝑡

𝑛

𝑡=1

(ln 𝑦𝑡−1∗ )

− ∑(ln 𝑦𝑡−1∗ )

𝑛

𝑡=1

exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }

𝑝

𝑗=1


∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

)

𝜕𝑙(𝜇𝑡)

𝜕𝜙2= ∑𝑦𝑡

𝑛

𝑡=1

(ln 𝑦𝑡−2∗ )

− ∑(ln 𝑦𝑡−2∗ )

𝑛

𝑡=1


𝑝

𝑗=1


∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

)

⋮

𝜕𝑙(𝜇𝑡)

𝜕𝜙𝑗= ∑𝑦𝑡

𝑛

𝑡=1

(ln 𝑦𝑡−𝑗∗ )

− ∑(ln𝑦𝑡−𝑗∗ )

𝑛

𝑡=1


𝑝

𝑗=1


∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

)

Sedangkan turunan terhadap parameter pertama dari partial

log-likelihood terhadap parameter koefisien 𝜽 sebagai berikut :

38

𝜕𝑙(𝜇𝑡)

𝜕𝜃1

= ∑𝑦𝑡

𝑛

𝑡=1

(ln 𝑦𝑡−1

∗

𝜇𝑡−1

)

− ∑ (ln 𝑦𝑡−1

∗

𝜇𝑡−1

)

𝑛

𝑡=1

exp (𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }

𝑝

𝑗=1


∗

𝜇𝑡−𝑗

}

𝑞

𝑗=1

)

𝜕𝑙(𝜇𝑡)

𝜕𝜃2= ∑𝑦𝑡

𝑛

𝑡=1

(ln 𝑦𝑡−2

∗

𝜇𝑡−2)

− ∑(ln𝑦𝑡−2

∗

𝜇𝑡−2)

𝑛

𝑡=1


𝑝

𝑗=1


∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

)

⋮

𝜕𝑙(𝜇𝑡)

𝜕𝜃𝑗= ∑𝑦𝑡

𝑛

𝑡=1

(ln 𝑦𝑡−𝑗

∗

𝜇𝑡−𝑗)

−∑(ln𝑦𝑡−𝑗

∗

𝜇𝑡−𝑗)

𝑛

𝑡=1


𝑝

𝑗=1

+ ∑𝜃𝑗 {ln𝑦𝑡−𝑗

∗

𝜇𝑡−𝑗}

𝑞

𝑗=1

)

(4.

Syarat cukup agar fungsi dari partial log-likelihood

maksimum adalah :

𝜕𝑙(𝜇𝑡)

𝜕𝛽0= 0 ;

𝜕𝑙(𝜇𝑡)

𝜕𝜙𝑗= 0 ;

𝜕𝑙(𝜇𝑡)

𝜕𝜃𝑗= 0

39

Persamaan diatas tidak close form atau tidak dapat

diselesaikan, untuk mengestimasi 𝜸′ = (𝛽0′ , 𝜙𝑗

′, 𝜃𝑗′) digunakan

optimasi algoritma Iteratively Reweighted Least Square (IRLS)

yang terdapat pada sub bab 2.7. Inisialisasi dalam memilih nilai

awal untuk �̂�(0) adalah menggunakan metode Ordinary Least

Square (OLS) untuk 𝑡 = 1,2,3,4… , 𝑇.

�̂�(0) = (𝑥′𝑥)−1(𝑥′𝑦𝑡∗)

dengan 𝑥 dan 𝑦 didefinisikan sebagai berikut :

𝑥 =

[ 1 ln 𝑦0

∗ … ln𝑦0∗ ln

𝑦0∗

𝜇0… ln

𝑦0∗

𝜇0

1 ln 𝑦0∗ … ln𝑦1

∗ ln𝑦1

∗

𝜇1… ln

𝑦1∗

𝜇1

1 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮

1 ln 𝑦𝑇−1∗ … ln𝑦𝑇−1

∗ ln𝑦𝑇−1

∗

𝜇𝑇−1… ln

𝑦𝑇−1∗

𝜇𝑇−1]

𝑦∗ = [

ln 𝑦1∗

ln 𝑦2∗

⋮ln 𝑦𝑇−1

∗

]

dengan 𝑡 = 1,2,3,4, . . . 𝑇. Selanjutnya dilakukan iterasi sesuai

langkah pada sub bab 2.7 Persamaan algoritma IRLS sebagai

berikut:

�̂�(𝑘+1) = (𝑿′𝑾(𝒌+𝟏)𝑿)−1

𝑿′𝑾(𝒌+𝟏)𝑧(𝑘+1)

Iterasi dilakukan hingga mendapatkan parameter yang konvergen

atau sampai diperoleh | �̂�(𝑡) − �̂�(𝑡−1)| < 𝜀.

Contoh dari model khusus Poisson GARMA (𝑝, 𝑞) sebagai

berikut:

40

1. Model Poisson GARMA (𝟏, 𝟎)

Pada model Poisson GARMA (1,0), persamaan (4.3) akan

menjadi sebagai berikut:


1

𝑗=1


∗

𝜇𝑡−𝑗}

0

𝑗=1

ln(𝜇𝑡) = 𝛽0 + 𝜙1{ln 𝑦𝑡−1∗ }

(4.7)

jika pada persamaan (4.5) dijabarkan untuk 𝑡 = 1, 2, … , 𝑇, maka

menjadi:

ln(𝜇1) = 𝛽0 + 𝜙1{ln𝑦0∗}

ln(𝜇2) = 𝛽0 + 𝜙1{ln𝑦1∗}

ln(𝜇3) = 𝛽0 + 𝜙1{ln𝑦2∗}

⋮

ln(𝜇𝑇) = 𝛽0 + 𝜙1{ln 𝑦𝑇−1∗ }

𝜇𝑡 = exp(𝛽0 + 𝜙1{ln𝑦𝑡−1∗ })

(4.6)

dari persamaan diatas dapat dibentuk dalam bentuk matriks

sebagai berikut:

[ ln(𝜇1)

ln(𝜇2)

ln(𝜇3)⋮

ln(𝜇𝑇)]

=

[ 1 ln 𝑦0

∗

1 ln 𝑦1∗

1 ln 𝑦2∗

⋮ ⋮1 ln 𝑦𝑇−1

∗ ]

[𝛽0

𝜙1]

dari matriks diatas dapat dilihat bahwa parameter 𝛽0 dan 𝜙1 adalah

parameter yang dicari.

2. Model Poisson GARMA (𝟎, 𝟏)

Dengan langkah yang sama seperti sebelumnya, persamaan

(4.3) pada Persamaan model Poisson GARMA (0,1) menjadi

sebagai berikut :

41


0

𝑗=1


∗

𝜇𝑡−𝑗}

1

𝑗=1

ln(𝜇𝑡) = 𝛽0 + ∑𝜃𝑗 {ln 𝑦𝑡−𝑗

∗

𝜇𝑡−𝑗}

0

𝑗=1

Dari persamaan (4.6) dijabarkan untuk 𝑡 = 1, 2, … , 𝑇 yaitu

sebagai berikut :

ln(𝜇1) = 𝛽0 + 𝜃1 {ln 𝑦0

∗

𝜇0}

ln(𝜇2) = 𝛽0 + 𝜃1 {ln𝑦1

∗

𝜇1}

ln(𝜇3) = 𝛽0 + 𝜃1 {ln𝑦2

∗

𝜇2}

⋮

ln(𝜇𝑇) = 𝛽0 + 𝜃1 {ln𝑦𝑇−1

∗

𝜇𝑇−1}

𝜇𝑡 = exp(𝛽0 + 𝜃1{ln 𝑦𝑡−1∗ /𝜇𝑡−1})

Selanjutnya, persamaan diatas dapat dibentuk dalam bentuk

matriks sebagai berikut :

[ ln(𝜇1)

ln(𝜇2)

ln(𝜇3)⋮

ln(𝜇𝑇)]

=

[ 1 ln 𝑦0

∗ /𝜇0

1 ln 𝑦1∗/𝜇1

1 ln 𝑦2∗/𝜇2

⋮ ⋮1 ln 𝑦𝑇−1

∗ /𝜇𝑇−1]

[𝛽0

𝜃1]

sehingga dari matriks diatas dapat dilihat bahwa parameter 𝛽0 dan

𝜃1 adalah parameter yang dicari.

42

3. Poisson GARMA (𝟏, 𝟏)

Selanjutnya untuk model Poisson GARMA(1,0), persamaan

(4.3) akan menjadi sebagai berikut :


1

𝑗=1


∗

𝜇𝑡−𝑗}

1

𝑗=1

ln(𝜇𝑡) = 𝛽0 + 𝜙1{ln 𝑦𝑡−1∗ } + 𝜃1 {

ln 𝑦𝑡−1∗

𝜇𝑡−1} (4.9)

Jika persamaan (4.8) dijabarkan untuk 𝑡 = 1, 2, … , 𝑇, menjadi :

ln(𝜇1) = 𝛽0 + 𝜙1{ln𝑦0∗} + 𝜃1 {

ln 𝑦0∗

𝜇0}

ln(𝜇2) = 𝛽0 + 𝜙1{ln𝑦1∗} + 𝜃1 {ln

𝑦1∗

𝜇1}

ln(𝜇3) = 𝛽0 + 𝜙1{ln𝑦2∗} + 𝜃1 {ln

𝑦2∗

𝜇2}

⋮

ln(𝜇𝑇) = 𝛽0 + 𝜙1{ln 𝑦𝑇−1∗ } + 𝜃1 {ln

𝑦𝑇−1∗

𝜇𝑇−1}

𝜇𝑡 = exp(𝛽0 + 𝜙1{ln𝑦𝑡−1∗ } + 𝜃1 {ln

𝑦𝑡−1∗

𝜇𝑡−1})

dengan cara yang sama seperti sebelumnya, persamaan diatas

dibentuk dalam bentuk matriks sebagai berikut :

[ ln(𝜇1)

ln(𝜇2)

ln(𝜇3)⋮

ln(𝜇𝑇)]

=

[ 1 ln 𝑦0

∗ ln 𝑦0∗ /𝜇0

1 ln 𝑦1∗ ln 𝑦1

∗/𝜇1


∗/𝜇2

⋮ ⋮ ⋮1 ln 𝑦𝑇−1

∗ ln 𝑦𝑇−1∗ /𝜇𝑇−1]

[

𝛽0

𝜙1

𝜃1

]

43

sehingga dapat dilihat bahwa parameter yang dicari untuk model

Poisson GARMA (1,1) adalah 𝛽0, 𝜙1, 𝜃1.

4.2. KAJIAN TERAPAN

Pada kajian ini dibahas mengenai estimasi paramater dan

peramalan model Poisson GARMA (𝑝, 𝑞) dengan

mengaplikasikan pada data jumlah kejadian kecelakaan di jalan tol

Surabaya-Gempol ruas Waru-Sidoarjo. Langkah yang harus

dilakukan yaitu menentukan model terbaik dari data yang

kemudian dilanjutkan dengan mengestimasi parameter dan

mendapatkan hasil peramalan. Dalam memilih model terbaik

Poisson GARMA (𝑝, 𝑞) diperoleh berdasarkan hasil identifikasi

awal dari model ARIMA.

4.2.1. Identifikasi Model

Untuk memperoleh identifikasi model Poisson GARMA

(𝑝, 𝑞), tahap pertama yang dilakukan adalah melihat plot time

series dari data yang bertujuan untuk melihat apakah data tersebut

sudah stasioner dalam varian maupun mean. Jika data belum

stasioner terhadap varian maka harus dilakukan transformasi.

Sedangkan jika data belum stasioner terhadap mean harus

dilakukan differencing. Plot data time series untuk data jumlah

kecelakaan di jalan Tol Surabaya-Gempol ruas Waru-Sidoarjo

yang selanjutnya disebut dengan data observasi Y dapat dilihat

pada Gambar 4.1. Identifikasi model yang dilakukan untuk uji

stasioneritas terhadap varian dan mean ini dilakukan dengan

menggunakan software minitab.

Dari Gambar 4.1 terlihat bahwa data belum stasioner terhadap

varian maupun rata-rata. Selanjutnya langkah pertama yang harus

44

dilakukan adalah melakukan stasioneritas data terhadap varian.

Untuk uji stasioneritas data dalam varian dapat dilihat pada

transformasi Box-Cox.

Data dikatakan stasioner jika rounded value-nya adalah 1.

Plot Transformasi Box-Cox dari data jumlah kejadian kecelakaan

di jalan Tol Surabaya-Gempol ruas Waru-Sidoarjo dapat dilihat

pada Gambar 4.2. Terlihat pada Gambar 4.2 menunjukkan nilai λ

dengan nilai kepercayaan 95% berada diantara 0,26 dan 0,80,

dengan nilai estimate sebesar 0,52 dan rounded value sebesar

0.50. Hal ini menunjukkan bahwa data masih belum stasioner

terhadap varian karena nilai rounded value-nya tidak sama dengan

1 sehingga dilakukan Transformasi kedua yang dapat dilihat pada

Gambar 4.3. transformasi data digunakan sesuai dengan 𝜆 yang

dihasilkan. Karena 𝜆 bernilai 0.50 maka proses transformasi

dilakukan sesuai dengan Tabel. 2.1 yaitu dengan rumus 𝑦∗ = √𝑦𝑡.

Gambar 4. 1 Plot Data Time Series

45

Pada Gambar 4.3. menunjukkan nilai λ berada diantara 0,57

dan 1,60, dengan nilai estimate sebesar 1,04 dan rounded value

sebesar 1,00. Hal ini menunjukkan bahwa data sudah stasioner

terhadap varian karena nilai rounded value-nya sama dengan 1.

Gambar 4. 2 Transformasi Box-Cox 1

Gambar 4. 3 Transformasi Box-Cox 2

46

Selanjutnya dilakukan uji stasioneritas terhadap mean dengan

menggunakan plot ACF. Data yang digunakan untuk plot ACF

adalah data hasil transformasi. Pada Gambar 4.4 Terlihat bahwa

plot ACF memiliki pola tentative karena tidak ada lag yang keluar

dari significant limit sehingga dapat dikatakan bahwa plot ACF

telah memenuhi asumsi stasioneritas terhadap varians dan mean.

Langkah selanjutnya adalah mengidentifikasi plot PACF dapat

dilihat seperti pada Gambar 4.5.

Pada Gambar 4.5. terlihat bahwa tidak ada lag yang keluar

dari significant limit. Dengan melihat pola ACF serta PACF diatas

maka dapat disimpulkan d bernilai 0 karena tidak perlu proses

differencing sehingga didapat model awal ARIMA(1, 0, 1) atau

dapat ditulis dalam bentuk ARMA (1,1). Dari model awal tersebut

tidak menutup kemungkinan terdapat model lain dari ARMA yang

terbentuk. Kemungkinan yang didapat dari model awal tersebut

yaitu ARMA (1, 1), ARMA(1, 0), dan ARMA(0, 1).

Gambar 4. 4 Plot ACF Hasil Data Transformasi 𝑦∗

47

4.2.1. Estimasi dan Pengujian Parameter

Pada langkah ini akan dilakukan estimasi parameter terhadap

kemungkinan model ARMA yang terbentuk dengan menggunakan

software Minitab dilanjutkan dengan uji signifikasi parameter. Uji

signifikasi parameter model ARMA(1,1) menggunakan uji-𝑡 dapat

dilihat pada Tabel 4.1.

Tabel 4. 1 Parameter ARMA (1,1)

Parameter coef SE T P

𝜙1 0,8708 0,1588 5,48 0,000

𝜃1 0,9613 0,1268 7,58 0,000

Uji signifikansi parameter berdasarkan persamaan (2.14):

Uji Parameter 𝝓𝟏

Hipotesis:

𝐻0 ∶ 𝜙1 = 0 (parameter 𝜙1 tidak signifikan)

𝐻1 ∶ 𝜙1 ≠ 0 (parameter 𝜙1 signifikan)

Gambar 4. 5 Plot PACF Hasil Data Transformasi 𝑦∗

48

Statistik uji:

𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 𝜙1̂

𝑆𝐸 (𝜙1)

= 0.8708

0,1588

= 5,4836

Dengan tabel distribusi 𝑡 diperoleh:

𝑡𝑡𝑎𝑏𝑒𝑙 = 𝑡0,025;59 = 2.30004

Kriteria pengujian:

Karena |𝑡ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑡𝑡𝑎𝑏𝑒𝑙, maka 𝐻0 ditolak yang artinya parameter

model 𝝓𝟏 signifikan.

Uji Parameter 𝜽𝟏

Hipotesis:

𝐻0 ∶ 𝜃1 = 0 (parameter 𝜃11 tidak signifikan)

𝐻1 ∶ 𝜃1 ≠ 0 (parameter 𝜃1 signifikan)

Statistik uji:

𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 𝜃1̂

𝑆𝐸 ( 𝜃1)=

0.9613

0,1268

= 7,5812

Dengan tabel distribusi 𝑡 diperoleh:

𝑡𝑡𝑎𝑏𝑒𝑙 = 𝑡0,025;59 = 2.30004

Kriteria pengujian:

Karena |𝑡ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑡𝑡𝑎𝑏𝑒𝑙, maka 𝐻0 ditolak yang artinya parameter

model 𝜃1 signifikan.

Dapat dilihat bahwa 𝜙1 dan 𝜃1 signifikan, sehingga model

ARMA (1,1) merupakan model yang signifikan. Selanjutnya

dilakukan tahap cek diagnostik yang meliputi uji asumsi residual

white noise dan uji asumsi residual berdistribusi normal.

49

a. Uji Asumsi residual white noise

Berdasarkan persamaan (2.15) uji residual white noise yaitu:

Hipotesa:

𝐻0 ∶ 𝜌1 = 𝜌2 = ⋯ = 𝜌𝑘 = 0

𝐻1 : Minimal ada satu 𝜌𝑖 yang tidak sama dengan nol, 𝑖 =

1,2, . . 𝑘. Statistika Uji:

𝑄 = 𝑛(𝑛 + 2) ∑(�̂�𝑘)

2

𝑛 − 𝑘, 𝑛 > 𝑘.

𝐾

𝑘=1

Untuk 𝐾 = 6 maka diperoleh:

𝑄 = 60(60 + 2) ∑(�̂�𝑘)2

60 − 𝑘, 𝑛 > 𝑘.

𝐾

𝑘=1

𝑄 = 60(62) ((0.595087127)2

60 − 1

+(0.633499190)2

60 − 2

+ ⋯+(0.6334991)12

60 − 12)

𝑄 = 19.58424261

𝜒2(𝛼;𝐾 − 𝑝 − 𝑞) = 𝜒2(0.05; 12 − 1 − 0)

= 𝜒2(0.05; 11) = 19.675

Kriteria Uji:

Karena 𝑄 < 𝜒2(𝛼; 𝐾 − 𝑝 − 𝑞), maka 𝐻0 diterima, artinya

residual white noise.

b. Uji Asumsi residual white noise

Berdasarkan persamaan (2.16) uji residual berdistribusi

normal yaitu:

Hipotesa :


50


Statistik uji :

𝐷ℎ𝑖𝑡𝑢𝑛𝑔 = 2,058

𝐷𝑡𝑎𝑏𝑒𝑙 = 𝐷0,95,58 = 0,684

Kriteria uji :

Karena uji 𝐷ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐷𝑡𝑎𝑏𝑒𝑙, Maka 𝐻0 ditolak dan

disimpulkan residual tidak berdisribusi normal.

c. Overfitting

Pada tahap ini akan dilakukan pencarian dan pendeteksian

model ARMA yang memenuhi syarat signifikasi parameter dan

memenuhi uji asusmsi residual sebagai syarat utama model ARMA

yang dapat digunakan. Hasil overfitting dapat dilihat pada Tabel

4.2.

Tabel 4. 2 Hasil Overfitting Model ARMA

Model ARMA Parameter 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 Keputusan

(1,1) 𝜙1 = 0.8708 5,48 Signifikan

𝜃1 = 0.9613 7,58 Signifikan

(1,0) 𝜙1 = −0.119 −0,09 Tidak

Signifikan

(0,1) 𝜃1 = 0.01334 0,10 Tidak

Signifikan

Pada Tabel 4.2 dijelaskan mengenai hasil uji signifikasi

terhadap tiga model ARMA sementara, terlihat bahwa diantara tiga

model yang ada setelah melakukan proses overfitting, hanya satu

model ARMA sementara yang memenuhi signifikasi dalam

parameter, dengan syarat jika |𝑡ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑡𝑡𝑎𝑏𝑒𝑙 maka parameter

51

dalam model signifikan sehingga satu model yang signifikan

tersebut dilanjutkan pada pengujian diagnostik untuk menentukan

model terbaik yang dapat dilihat pada Tabel 4.3.

Tabel 4. 3 Uji Asumsi Residual

Model

ARMA White Noise Normal

(1,1) YA TIDAK

Berdasarkan pada Tabel 4.3 Model ARMA(1,1) memenuhi

uji asumsi residual white noise namun tidak memenuhi uji asumsi

residual berdistribusi normal. Karena model ARMA(1,1) tidak

memenuhi uji asumsi residual berdistribusi normal maka perlu

mendeteksi outlier pada residual ARMA(1,1). Dengan model

ARMA (1,1) sebagai berikut:

𝑌𝑡∗ = ∅1 + ∅1𝑌𝑡−1 + 𝜃1𝑒𝑡−1 + 𝑒𝑡

𝑌𝑡∗ = 0,196955 + 0,8708𝑌𝑡−1 − 0,9613𝑒𝑡−1 (4.11)

Gambar 4. 6 Outlier X1

52

Dengan meregresikan model ARMA(1,1) dengan outlier

didapatkan persaman dengan outlier pada residual ARMA (1,1)

seperti pada Gambar 4.6.

𝑥𝑖(𝑡) = {1;0;

𝑡: 𝑡𝑒𝑟𝑗𝑎𝑑𝑖 𝑜𝑢𝑡𝑙𝑖𝑒𝑟𝑡: 𝑦𝑎𝑛𝑔 𝑙𝑎𝑖𝑛

(4.12)

dengan 𝑡 untuk terjadi outlier adalah 7, 8, 9, 12, 21, 22, 27, 28, 29, 32, 36, 41, 44, 45, 41, 48, 57, 60. Selanjutnya

persamaan (4.11) diregresikan dengan outlier (4.12) yang

terdeteksi dari resiudal ARMA(1,1) sehingga diperoleh persamaan

(4.13) dengan hasil estimasi parameter ditunjukan pada Tabel 4.4.

Tabel 4. 4 Estimasi Parameter ARMA (1,1) dengan Outlier

Predictor Coef SE Coef T

∅0 5,819 1,067 5,45

∅1 -3,7860 0,8690 -4,36

𝜃1 1,6776 0,3849 4,36

𝛽1 -1,0310 0,2444 -4,22

diperoleh persamaan sebagai berikut:

𝑌𝑡∗𝑡= ∅0 + ∅1𝑌𝑡−1 + 𝜃1𝑒𝑡−1 + 𝛽1𝑥1(𝑡) + 𝑒𝑡

𝑌𝑡∗ = 5,82 − 3,79 𝑦𝑡−1 + 1,8 𝑦𝑡−1 − 1,03𝑥1(𝑡) (4.13)

Pengujian signifikansi paameter untuk model ARMA (1,1) dengan

outlier sebagai berikut:

1. Uji serentak

Pengujian serentak digunakan untuk menguji pengaruh

variabel prediktor secara bersama sama terhadap variabel respon.

Hipotesa :

𝐻0: 𝛽1 = 0

𝐻1: 𝛽𝑖 ≠ 0

53

Statistik uji :

𝐹ℎ𝑖𝑡𝑢𝑛𝑔 =1,2255

0,1846= 6,64

𝐹0.05,3,55 = 2,772537

Kriteria uji :

𝐻0 akan ditolak apabila nilai statistik uji 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹0.05,2,100

sehingga disimpulkan variabel prediktor berpengaruh signifikan

terhadap variabel respon. Tabel ANOVA dapat dilihat pada Tabel

4.5.

Tabel 4. 5 ANOVA

Source DF SS MS F

Regresi 3 3,6766 1,2255 6,64

Residual 55 10,1545 0,1846

Total 58 13,8310

2. Pengujian parsial

Pengujian parsial digunakan untuk mengetahui variabel

mana sajakah yang berpengaruh signifikan terhdap variabel

respon.

Uji parameter ∅𝟎

Hipotesa :

𝐻0: ∅0 = 0

𝐻1: ∅0 ≠ 0

Statistik uji :

𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =1,007

5,819= 5,45

𝑡0.25,58 = 1,162629

54

Kriteria uji :

Karena |𝑇ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑇0.25,100, maka 𝐻0 ditolak, sehingga ∅0

signifikan terhadap variabel prediktor.

Uji parameter ∅𝟏

Hipotesa :

𝐻0: ∅1 = 0

𝐻1: ∅1 ≠ 0

Statistik uji :

𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =−3,7860

0,8690= −4,36

𝑡0.25,58 = 1,162629

Kriteria uji :

Karena |𝑇ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑇0.25,100, maka 𝐻0 ditolak, sehingga ∅1


Uji parameter 𝜽𝟏

Hipotesa :

𝐻0: 𝜽𝟏 = 0

𝐻1: 𝜽𝟏 ≠ 0

Statistik uji :

𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =1,6776

0,3849= 4,36

𝑡0.25,58 = 1,162629

Kriteria uji :

Karena |𝑇ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑇0.25,100, maka 𝐻0 ditolak, sehingga 𝜽𝟏


55

Uji parameter 𝜷𝟏

Hipotesa :

𝐻0: 𝜷𝟏 = 0 𝐻1: 𝜷𝟏 ≠ 0

Statistik uji :

𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =−1,0310

0,2444= −4,22

𝑡0.25,58 = 1,162629

Kriteria uji :

Karena |𝑇ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑇0.25,100, maka 𝐻0 ditolak, sehingga 𝜷𝟏


3. Pengujian normalitas residual

Hipotesa :



Statistik uji :

𝐷ℎ𝑖𝑡𝑢𝑛𝑔 = 0,058

𝐷𝑡𝑎𝑏𝑒𝑙 = 𝐷0,95,58 = 0,684

Kriteria uji :

Karena uji 𝐷ℎ𝑖𝑡𝑢𝑛𝑔 < 𝐷𝑡𝑎𝑏𝑒𝑙, Maka 𝐻0 diterima dan

disimpulkan residual berdistribusi normal.

Hasil uji normal dengan minitab dapat dilihat pada Gambar

4.7. Setelah dilakukan deteksi outlier, untuk mendapatkan model

terbaik dengan penanganan outlier, maka pada ARMA

ditambahkan variable dummy hasil deteksi outlier. Selanjutnya

dapat ditentukan pemilihan model terbaik, karena pada model

ARMA (1,1) sudah memenuhi uji signifikansi parameter dan uji

56

asumsi residual maka model terbaik yang dapat dipilih adalah

ARMA (1,1).

Sesuai dengan yang telah dijelaskan sebelumnya bahwa

model Poisson GARMA (𝑝, 𝑞) diperoleh dari identifikasi model

ARMA (𝑝, 𝑞). Hasil overfitting pada model ARMA (𝑝, 𝑞) yaitu

ARMA (1,1), sehingga orde 𝑝 = 1 dan 𝑞 = 1 digunakan pada

model Poisson GARMA (𝑝, 𝑞) yaitu menjadi Poisson

GARMA(1,1).

Pada subbab 4.1 telah diberikan contoh mengenai estimasi

Poisson GARMA (1,1) dengan diperoleh persamaan (4.9) yang

kemudian dibentuk matriks sebagai berikut:

[ ln(𝜇1)

ln(𝜇2)

ln(𝜇3)⋮

ln(𝜇𝑇)]

=

[ 1 ln 𝑦0

∗ ln 𝑦0∗ /𝜇0


∗/𝜇1


∗/𝜇2

⋮ ⋮ ⋮1 ln 𝑦𝑇−1

∗ ln 𝑦𝑇−1∗ /𝜇𝑇−1]

[

𝛽0

𝜙1

𝜃1

]

Gambar 4. 7 Residual dengan Deteksi Outlier

57

dengan 𝑡 = 1,2,3, . . . , 𝑇. sehingga dapat dilihat bahwa parameter

yang dicari untuk model Poisson GARMA(1,1) adalah 𝛽0, 𝜙1, 𝜃1.

Dengan inisialisasi orde 𝑝 = 1 dan 𝑞 = 1 didapatkan hasil

estimasi model Poisson GARMA (1,1) dengan menggunakan

iterasi algoritma IRLS yang dapat dilihat pada Tabel 4.6.

Tabel 4. 6 Estimasi Parameter Model Poisson GARMA (1,1)

Poisson

GARMA

(1,1

Parameter 𝑆𝐸 Keputusan

𝛽0=-5,627 0,000 Signifikan

𝜙1 =0,980 0,000 Signifikan

𝜃1 = -1,359 0,097 Signifikan

Berdasarkan Tabel 4.6 diperoleh persamaan model Poisson

GARMA (1,1) untuk Jumlah Kejadian Kecelakaan di Jalan Tol

Surabaya-Gempol Ruas Waru-Sidoarjo sebagai berikut:

[ ln(𝜇1)

ln(𝜇2)

ln(𝜇3)⋮

ln(𝜇𝑇)]

=

[ 1 ln 𝑦0

∗ ln 𝑦0∗ /𝜇0


∗/𝜇1


∗/𝜇2

⋮ ⋮ ⋮1 ln 𝑦𝑇−1

∗ ln 𝑦𝑇−1∗ /𝜇𝑇−1]

[5,6270,980

−1,359]

dengan persamaan model:

𝜇𝑡 = exp (5,627 + 0,9801{ln 𝑦𝑇−1∗ } − 1,3591 {ln

𝑦𝑇−1∗

𝜇𝑇−1}) (4.10)

Persamaan (4.10) digunakan untuk melakukan peramalan 8

bulan kedepan. Untuk mengetahui ada tidaknya kecocokan

(Goodness of fit) antara frekuensi yang teramati (terobservasi)

dengan frekuensi harapan digunakan uji devian dengan

menggunakan persamaan (2.22) dan dengan bantuan software

Matlab R2013a diperoleh hasil pada Tabel 4.7.

58

Tabel 4. 7 Uji Gododness of fit

Model Poisson

GARMA Devian 𝜒𝛼,𝑛−𝑝−𝑞

2

(1,1) 12,932771 76,7778

Hipotesis:

𝐻0 ∶ 𝜇𝑡 = 𝜇 (𝑥𝑡; 𝜷), untuk 𝑡 = 1,2,3, . . .,

𝐻1 ∶ 𝜇𝑡 ≠ 𝜇 (𝑥𝑡; 𝜷)

Statistik uji :

𝐷 = 2{𝑙(𝑦; 𝑦) − 𝑙(𝜇�̂�; 𝑦}

Kriteria pengujian:

𝐻0 akan ditolak jika 𝐷 > 𝜒𝛼,𝑛−𝑝−𝑞2 . Dengan melihat tabel 4.7

didapatkan bahwa 𝐷 < 𝜒𝛼,𝑛−𝑝−𝑞2 sehingga 𝐻0 diterima dan model

dapat dikatakan memenuhi uji devian atau model memenuhi uji

kesesuaian.

4.2.2. Peramalan Model Poisson GARMA (𝒑, 𝒒)

Peramalan model Poisson GARMA(1,1) dilakukan dengan

menggunakan software Matlab. Pada peramalan model Poisson

GARMA ini digunakan 60 data sebagai in-sample dan 8 data

sebagai out-sample. Hasil peramalan dari data jumlah kecelakaan

dijalan tol Surabaya-Gempol ruas Waru-Sidoarjo dapat dilihat

pada Tabel 4.8.

Terlihat dari Gambar 4.8, peramalan dengan menggunakan

Poisson GARMA(1,1) mendekati data aktual. Hasil peramalan

masih berupa rata-rata kejadian, sehingga perlu dilakukan

transformasi dari hasil peramalan yang berupa nilai rata-rata

menjadi nilai yang berupa data respon (count).

59

Tabel 4. 8 Perbandingan Data Actual dan Hasil Peramalan

Actual Forecasting

Poisson GARMA

2 2,0677

2 2,094

3 2,456

0 0,122

1 0,892

0 0,121

1 0,77

0 0,015

AIC 763,9005747

Grafik data aktual dengan hasil peramalan dapat dilihat pada

Gambar 4.8

Gambar 4. 8 Plot Data Actual dan Hasil Peramalan

61

BAB V

PENUTUP

5.1. KESIMPULAN

Berdasarkan analisis dan pembahasan, dapat disimpulkan

bahwa :

1. Estimasi parameter model Poisson GARMA (𝑝, 𝑞)

dilakukan dengan menggunakan metode MLE karena

diasumsikan mengikuti suatu distribusi eksponensial.

karena metode MLE menghasilkan bentuk yang tidak

close form dilakukan optimasi Algoritma IRLS sampai

parameter tersebut konvergen. Algoritma IRLS untuk

menentukan estimasi 𝜸 sebagai berikut:

�̂�(𝑘+1) = (𝑿′𝑾(𝒌+𝟏)𝑿)−1

𝑿′𝑾(𝒌+𝟏)𝑧(𝑘+1)

2. Hasil aplikasi Model Poisson GARMA yang diterapkan

pada data jumlah kejadian kecelakaan dijalan Tol

Surabaya-Gempol ruas Waru-Sidoarjo dibangun melalui

identifikasi model terbaik ARMA yang kemudian

diperoleh model Poisson GARMA (1,1) dengan

persamaan sebagai berikut:

𝜇𝑡 = exp( 5,627 + 0,9801{ln 𝑦𝑇−1∗ } − 1,3591 {ln

𝑦𝑇−1∗

𝜇𝑇−1

})

dengan hasil estimasi parameter yaitu parameter konstanta

𝛽0 sebesar -5,627, parameter AR sebesar 0,980, dan

parameter MA sebesar -1,359.

5.2. SARAN

Untuk pengembangan penelitian selanjutnya diberikan

saran sebagai berikut :

1. Data yang digunakan dalam penelitian ini merupakan data

suatu kejadian yang jarang terjadi yaitu bersifat jumlahan

62

(count) dimana nilainya adalah diskrit non negatif.

Namun, dari hasil peramalan yang diperoleh masih berupa

data mean (nilainya berbentuk desimal) sehingga perlu

dilakukan suatu pembalikan data agar menghasilkan

kembali data peramalan yang berupa data respon 𝑐𝑜𝑢𝑛𝑡.

2. Pada penelitian ini tidak melibat variabel prediktor

sehingga diharapkan pada penelitian selanjutnya dapat

melibatkan variabel prediktor agar dapat mengahasilkan

akurasi peramalan yang lebih baik.

63

DAFTAR PUSTAKA

[1] S. Halim, Diktat - Time Series Analysis Prakata, no.

January. Surabaya: UK.Petra, 2006.

[2] V. Jowaheer, N. Ali, M. Khan, dan Y. Sunecher,

Poisson Autoregressive and Moving-Average Models

for Forecasting Non-stationary Seasonal Time Series of

Tourist Counts in Mauritius, no. 1988, 2008.

[3] E. R. Walpolle, Pengantar Statistika, Edisi Ketiga,

Cetakan ke. Jakarta: Gramedia Pustaka Utama, 1995.

[4] C. Cameroon dan P. Trivedi, Regression Analysis of

Count Data. New York, 1998.

[5] M. Cullagh dan Nelder, Generalized Linier Models, 2nd

ed. London: Chapman and Hall, 1998.

[6] B. Irawati, Regression ( GPR ) dan Regresi Binomial

Negatif, vol. 2, no. 2, hal. 13–24, 2012.

[7] M. A. Benjamin, R. A. Rigby, D. M. Stasinopoulos, M.

A. Benjamin, R. A. Rigby, dan D. M. Stasinopoulos,

Journal of the American Statistical Association

Generalized Autoregressive Moving Average Models

Average Models,no. October 2014, hal. 37–41, 2011.

[8] Asrirawan, Generalized Seosonal Autoregressive and

Moving Average For Forecasting The Number of

Dengue Hemorrhagic Fever (DHF) Patrient in

Surabaya, no. February 2016, 2014.

[9] wainkelmann, University of Zurich, vol. 4, no. 3, 1994.

[10] R. Inayah, Pemodelan Jumlah Kasus Kanker Serviks di

Jawa Timur Menggunakan Analisis Generalized

Poisson Regression GPR, Surabaya, 2012.

[11] W. William, Time Series Analysis : Univariate and

64

Multivariate Methods, 2nd ed. Greg Tobin, 2006.

[12] K. Fokianos dan B. Kedem, Prediction and

Classification of Non-stationary Categorical Time

Series *,” vol. 296, hal. 277–296, 1998.

[13] B. Kedem dan K. Fokianos, Regression Models for

Time Series Analysis. New Tork, 2002.

[14] F. A. Widjajati, M. D. Saputri, dan N. Asiyah, Sifat-sifat

Generalisasi Distribusi, no. 1, hal. 13–22, 1829.

[15] A. Melliana, Y. Setyorini, H. Eko, dan E. Al, The

Comparison Of Generalized Poisson Regression and

Negative Binomial Reression Methods in Overcoming

Overdispersion, Int. J. Sci. Technol. Res., vol. 2, no. 8,

hal. 255–258, 2013.

[16] B. Silveira, M. Andrade, dan R. Ehlers, Bayesian

GARMA models for count data, Commun. Stat. Case

Stud. Data Anal. Appl., vol. 1, no. 4, hal. 192–205,

2015.

65

LAMPIRAN 1

Data Jumlah Kejadia Kecelakaan di Jalan Tol Surabaya

Gempol ruas Waru Sidoarjo

Bulan TAHUN

2012 2013 2014 2015 2016 2017

JANUARI 2 1 1 2 1 2

FEBRUARI 2 2 1 2 2 2

MARET 1 1 3 1 0 3

APRIL 1 2 0 1 1 0

MEI 2 1 0 0 3 1

JUNI 1 2 2 1 3 0

JULI 0 2 1 1 2 1

AGUSTUS 0 1 4 0 2 0

SEPTEMBER 4 3 2 4 4

OKTOBER 2 0 1 2 2

NOVEMBER 2 1 2 2 2

DESEMBER 0 2 0 0 3

66

LAMPIRAN 2

Source Code Algoritma IRLS

clc

format long

x=xlsread('dataku.xlsx','Sheet1','B:B');

y=xlsread('dataku.xlsx','Sheet1' ,'C:C');

q=xlsread('dataku.xlsx','Sheet1','D:D');

iterasi=1;

for i=1:length(x)

X(i,1)=1;

X(i,2)=log(y(i));

X(i,3)=log(y(i))-log(q(i));

if X(i,2)==0

X(i,2)=0.1;

end

if X(i,3)==0

X(i,3)=0.1;

end

end

for i=1:length(y)

Y(i,1)=1;

Y(i,1)=log(y(i));

if Y(i,1)==0;

Y(i,1)=0.1;

end

end

67

lanjutan lampiran 2

B0=inv(transpose(X)*X)*transpose(X)*Y;

for i=1:length(y)

Beta0(i,1)=B0(1);

end

for i=1:length(y)

S(i,1)=1;

S(i,1)=log(y(i))-log(q(i));

if S(i,1)==0;

S(i,1)=0.1;

end

end

chi0 = B0(2);

teta0 = B0(3);

M = Beta0+chi0*Y+teta0*S;

for i=1:length(M)

Mo(i,1)=exp(M(i));

end

for i=1:length(Mo)

for j=1:length(Mo)

if i==j

W(i,j)=Mo(i);

else

W(i,j)=0;

end

end

68

lanjutan lampiran 2

end

eta=X*B0;

for i=1:length(x)

z(i,1)=eta(i)+((x(i)-Mo(i))/Mo(i));

end

B1=inv(transpose(X)*W*X)*transpose(X)*W*z;

disp(['ITERASI KE-',num2str(iterasi)])

disp(['Beta',num2str(iterasi-1),' = ',num2str(Beta0(1))])

disp(['chi',num2str(iterasi-1),' = ',num2str(chi0)])

disp(['teta',num2str(iterasi-1),' = ',num2str(teta0)])

disp(['Beta',num2str(iterasi),' = ',num2str(B1(1))])

disp(['chi',num2str(iterasi),' = ',num2str(B1(2))])

disp(['teta',num2str(iterasi),' = ',num2str(B1(3))])

epsilon=10^-5;

while epsilon <= abs(B1(1)-Beta0(1))

iterasi = iterasi+1;

for i=1:length(y)

Beta0(i,1)=B1(1);

end

chi0 = B1(2);

teta0 = B1(3);

M = Beta0+chi0*Y+teta0*S;

for i=1:length(M)

69

lanjutan lampiran 2

Mo(i,1)=exp(M(i));

end

for i=1:length(Mo)

for j=1:length(Mo)

if i==j

W(i,j)=Mo(i);

else

W(i,j)=0;

end

end

end

eta=X*B1;

for i=1:length(x)

z(i,1)=eta(i)+((x(i)-Mo(i))/Mo(i));

end

B1=inv(transpose(X)*W*X)*transpose(X)*W*z

disp('============================')

disp(['ITERASI KE-',num2str(iterasi)])

disp(['Beta',num2str(iterasi),' = ',num2str(B1(1))])

disp(['chi',num2str(iterasi),' = ',num2str(B1(2))])

disp(['teta',num2str(iterasi),' = ',num2str(B1(3))])

end

70

LAMPIRAN 3

Source Code Hasil Peramalan

clear;close all

p = 1;

q = 1;

eStep = 0;

h = 1;

labels = {'intercept ';'cos(2pt/12)';'sin(2pt/12)';'cos(2pt/6)

';'sin(2pt/6) '};

x=xlsread('dataku.xlsx','2','B2:F69');

y=xlsread('dataku.xlsx','1','C2:C69');

[b1,Se1] = garmafit(x,y,p,q,dist,h,eStep);

disp('Table 1 GARMA model parameters')

disp( sprintf(' MODEL Est. Std Error.'))

m = size(x,2);

for i=1:m

disp(sprintf('%s: %2.3f %2.3f',[labels{i}],[b1(i)

Se1(i)]) )

end

for j=1:p

disp(sprintf('Autoregressive %i: %2.3f %2.3f',[j

b1(m+j) Se1(m+j)]))

end

71

lanjutan lampiran 3

for k=1:q

disp(sprintf('Moving-average %i: %2.3f %2.3f',[k

b1(i+p+k) Se1(i+p+k)]))

lanjutan lampiran 2

end

[yHat1,times1,dev1,RMSE,SS,res] =

garmaval(b1,x,y,p,q,dist,h,eStep);

nTrain = 60; training data

tTrain = 60:68 ;

xPre = x(tTrain,:);

yPre = y(tTrain);

tTest = 60:68;

xTest = x(tTest,:);

yPost = y(tTest);

[b2,Se2] = garmafit(xPre,yPre,p,q,dist,h,eStep);

[yHatPre,timesPre,devPre,RMSEpre,SSpre] =

garmaval(b2,xPre,yPre,p,q,dist,h,eStep);

[yHatPost,timesPost,devPost,RMSEpost,SSpost] =

garmaval(b2,xTest,yPost,p,q,dist,h,eStep;

figure(20), set(gcf,'name','Polio data and GARMA(2,0) fits

and forecasts')

plot([1:68], y,'ko','markersize',6,'linewidth',1.5) %

Plot actual data

hold on

plot(timesPre,yHatPre,'k-','linewidth',2)

72

lanjutan lampiran 3

plot(timesPost+nTrain-(max(p,q)+h-1),yHatPost,'k--

','linewidth',2)

xlabel('Time (Months)')

ylabel('Counts')

set(gca,'fontsize',14,'fontname','Timesnewroman')

legend('Actual','Fit','Forecast','location','northeast')

lanjutan lampiran 2

ylim([0 15])

yHatPre

devPre

RMSEpre

SSpre

yHatPost

devPost

RMSEpost

SSpos

73

BIODATA PENULIS

Agil Desti Fauzia, lahir di

Banyuwangi, 16 Desember 1996.

Pendidikan formal yang pernah

ditempuh penulis yaitu TK

Muta’alimin, SD Negeri 2 Telemung,

SMP Negeri 3 Banyuwangi, dan SMA

Negeri 1 Giri. Sekarang penulis

menempuh pendidikan S1 di

Departemen Matematika Institut

Teknologi Sepuluh Nopember dengan

bidang minat Matematika Terapan.

Selama kuliah penulis aktif mengikuti Organisasi yaitu UKM

PSHT ITS, UKM BOLA VOLI ITS, dan UKM SEPAKBOLA

ITS. Pada tahun 2015-2016 penulis aktif menjadi staff

HIMATIKA ITS, staff PSHT ITS dan Kepanitiaan OMITS.

Tahun 2016-2017 diamanahi sebagai Head of Departemen

Sport and Art Development HIMATIKA ITS, Kepala Divisi

Event UKM PSHT ITS, dan Sekretaris 2 UKM Bola Voli ITS.

Demikian biodata tentang penulis. Jika ingin memberikan

saran, kritik, dan diskusi mengenai laporan kerja praktik ini,

dapat dikirimkan melalui email [email protected] .

Terimakasih.

mailto:[email protected]

halaman judul estimasi parameter pada model …

Documents