halaman judul estimasi parameter pada model …
TRANSCRIPT
i
HALAMAN JUDUL
TUGAS AKHIR SM-141501
ESTIMASI PARAMETER PADA MODEL POISSON
GENERALIZED AUTOREGRESSIVE MOVING AVERAGE
(GARMA) DENGAN ALGORITMA IRLS
(Studi Kasus: Peramalan Jumlah Kecelakaan Di Jalan Tol
Surabaya-Gempol)
AGIL DESTI FAUZIA
NRP 06111440000062
Dosen Pembimbing:
Dra. Laksmi Prita Wardhani, M.Si
Departemen Matematika
Fakultas Matematika, Komputasi, dan Sains Data
Institut Teknologi Sepuluh Nopember
Surabaya
2018
HALAMAN JUDULHALAMAN JUDUL
TUGAS AKHIR SM-141501
ESTIMASI PARAMETER PADA MODEL POISSON
iii
iii
HALAMAN JUDUL
FINAL PROJECT SM-141501
PARAMETER ESTIMATION OF POISSON GENERALIZED
AUTOREGRESSIVE MOVING AVERAGE (GARMA)
MODELS WITH IRLS ALGORITHM
(A Case study is forecasting of Accident in Surabaya-Gempol
Toll Road)
AGIL DESTI FAUZIA
NRP 06111440000034
Supervisors:
Dra. Laksmi Prita Wardhani, M.Si
Department of Mathematics
Faculty of Mathematics, Computation and Data Science
Institut Teknologi Sepuluh Nopember
Surabaya
2018
Gambar 3. 6 Diagram Alir PengerjaanTugas
AkhirHALAMAN JUDUL
FINAL PROJECT SM-141501
iv
v
LEMBAR PENGESAHAN
ESTIMASI PARAMETER PADA MODEL POISSON
GENERALIZED AUTOREGRESSIVE MOVING
AVERAGE (GARMA) DENGAN ALGORITMA IRLS
(Studi Kasus: Peramalan Jumlah Kecelakaan Di Jalan Tol
Surabaya-Gempol) ESTIMATION OF POISSON GENERALIZED AUTOREGRESSIVE
MOVING AVERAGE (GARMA) MODELS WITH ALGORITHM
IRLS (A Case study is forecasting of Accident in Surabaya-
Gempol Toll Roads)
Diajukan Untuk memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Sains
Pada Bidang Studi Matematika Terapan
Program S-1 Departemen Matematika
Fakultas Matematika Komputasi dan Sains Data
Oleh:
AGIL DESTI FAUZIA
NRP. 06111440000062
Menyetujui,
Dosen Pembimbing
Dra. Laksmi Prita Wardhani, M.Si
NIP. 19611208 198803 2 001
Mengetahui,
Kepala Departemen Matematika
FMKSD ITS
Dr. Imam Mukhlash, S.Si M.T
NIP. 19700831 199403 1 003 Surabaya, 2018
vi
vii
ESTIMASI PARAMETER PADA MODEL POISSON
GENERALIZED AUTOREGRESSIVE MOVING
AVERAGE (GARMA) DENGAN ALGORITMA IRLS
(Studi Kasus Jumlah Kecelakaan Di Jalan Tol Surabaya-
Gempol Ruas Waru-Sidoarjo)
Nama Mahasiswa : AGIL DESTI FAUZIA
NRP : 06111440000062
Departemen : Matematika FMKSD – ITS
Dosen Pembimbing : Dra. Laksmi Prita Wardhani, M.Si
ABSTRAK
Peramalan adalah pengolahan data masa lalu untuk mendapatkan estimasi
data masa depan. Data yang digunakan pada penelitian ini adalah data
count. Pada kasus data count metode peramalan pada umumnya seperti
ARIMA kurang tepat digunakan. Benjamin, dkk. mengembangkan
sebuah model peramalan yaitu Generalized Autoregressive Moving
Average (GARMA) dengan menggunakan fungsi penghubung (link
function) dengan data diasumsikan mengikuti Distribusi Poisson sehingga
disebut juga Poisson GARMA (𝑝, 𝑞). Pada model tersebut terdapat
beberapa parameter yang tidak diketahui. Parameter yang dimaksud
diestimasi menggunakan metode Maximum Likelihood Estimation (MLE)
dengan optimasi Algoritma Iteratively Reweighted Least Squares (IRLS).
Model Poisson GARMA ini diterapkan pada data jumlah kejadian
kecelakaan di jalan tol Surabaya-Gempol ruas Waru-Sidoarjo. Hasil yang
didapat yaitu model khusus Poisson GARMA (1,1) dengan 3 parameter
yaitu parameter konstanta , parameter Autoregressive, dan parameter
Moving Average . Kriteria pemilihan model terbaik menggunakan AIC.
Kata Kunci : Data count, Distribusi Poisson, Fungsi Link, Poisson GARMA
(𝒑, 𝒒), Algoritma IRLS.
viii
ix
ESTIMASI PARAMETER PADA MODEL POISSON
GENERALIZED AUTOREGRESSIVE MOVING
AVERAGE (GARMA) DENGAN ALGORITMA IRLS
(Studi Kasus Jumlah Kecelakaan Di Jalan Tol Surabaya-
Gempol Ruas Waru-Sidoarjo)
Nama Mahasiswa : AGIL DESTI FAUZIA
NRP : 06111440000062
Departemen : Matematika FMKSD – ITS
Dosen Pembimbing : Dra. Laksmi Prita Wardhani, M.Si
ABSTRACT
Forecasting is the processing of past data to obtain future data estimates.
Data used in this research is data count. In the case of data count,
forecasting methods in general such as ARIMA is less precise for some
reasons. Benjamin, et al. developed a forecasting model to solve this,
namely Generalized Autoregressive Moving Average (GARMA) by using
the link function. The data used is assumed to follow Poisson's
distribution so it is also called Poisson GARMA (p, q). In the model, there
are some unknown parameters. These parameters are estimated using
Maximum Likelihood Estimation (MLE) method with Iteratively
Reweighted Least Squares (IRLS) algorithm optimization. Poisson
GARMA model is applied to the data of the number of accidents on the
Surabaya-Gempol toll road at Waru-Sidoarjo section. The result obtained
is a special model Poisson GARMA (1,1) with 3 parameters namely
constant parameters, Autoregressive parameter, and Moving Average
parameter. The criteria of best model selection uses AIC.
Keywords: Count Data, Poisson Distribution, Link Function, Poisson
GARMA (p, q), IRLS Algorithm.
x
xi
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT karena
berkat Rahmat dan Karunia-Nya penulis dapat menyelesaikan
penulisan Tugas Akhir ini. Adapun judul Tugas Akhir ini yaitu
“Estimasi Parameter Model Poisson Generalized Autoregressive
and Moving Average (GARMA) dengan Algoritma IRLS”.
Penulisan Tugas Akhir ini diajukan untuk memenuhi salah
satu syarat memperoleh gelar Sarjana pada Program Studi
Matematika Fakultas Matematika, Komputasi, dan Sains Data
Institut Teknolni Sepuluh Nopember. Dalam penulisan, tidak lepas
dari hambatan dan kesulitan, namun berkat bimbingan dan
dorongan dari semua pihak Tugas Akhir ini dapat terselesaikan
dengan baik. Oleh karenanya penulis ingin menyampaikan ucapan
terimakasih kepada :
1. Bpk. Dr. Imam Mukhlash, S.Si, M.T selaku Ketua
Departemen Matematika FMKSD ITS.
2. Ibu Dra. Laksmi Prita Wardhani, M.Si selaku dosen
pembimbing Tugas Akhir, atas waktu dan bimbingan yang
diberikan kepada penulis.
3. Ibu Dr. Dra. Mardlijah, M.T selaku dosen wali dan kepada
seluruh dosen serta karyawan Departemen Matematika ITS.
4. Ibu Valeriana Lukitosari, S.Si, MT dan Ibu Dra. Nuri
Wahyuningsih, M.Kes dan Bpk Suhud Wahyudi, M.Si dan
Bpk Dr. Soehardjoepri, M.Si selaku dosen penguji yang telah
memberikan saran dan bimbingannya.
5. Bpk. Dr. Didik Khusnul Arif, S.Si, M.Si selaku Ketua
Program Studi S1 Departemen Matematika ITS dan Bpk. Drs.
Iis Herisman, M.Si selaku Sekretaris Program Studi S1
Departemen Matematika ITS.
xii
6. Kedua orangtua, Bapak Sutrisno dan Ibu Dwi Suhartini, serta
saudara kandung Miftahul Zannaria atas kepercayaan, doa dan
dukungan moril yang selalu diberikan.
7. Maya, Riska, Via yang saling memotivasi satu sama lain serta
teman-temanku angkatan 2014 yang telah bersama berjuang
dari mahasiswa baru hingga dapat bersama menyelesaikan
Tugas Akhir.
8. Aqil, Okky, Dila sebagai partner dalam pembuatan Tugas
Akhir.
9. Ila, Didik, Shodek, dan Mas Ihsan yang dengan sabar
mendengar keluh kesah dan juga teman berdiskusi penulis.
10. Febri, Fransisca, Yujo, dan semua teman-temanku UKM
Futsal Putri ITS yang terus memberikan semangat serta
motivasinya.
11. Semua pihak yang tidak bisa penulis sebutkan satu persatu,
terima kasih telah membantu sampai terselesaikannya Tugas
Akhir ini.
Penulis berharap Tugas Akhir ini dapat bermanfaat bagi
pengembangan ilmu pengetahuan, lingkungan, perusahaan dan
bagi siapapun yang membutuhkan. Penulis menyadari bahwa
Tugas Akhir ini jauh dari sempurna sehingga penulis
membutuhkan kritik dan saran yang bersifat membangun untuk
kemajuan pendidikan dimasa yang akan datang.
Surabaya, Agustus 2018
Penulis
xiii
DAFTAR ISI
Hal
HALAMAN JUDUL ...................................................................... i
HALAMAN JUDUL ....................................................................iii
ABSTRAK .................................................................................. vii
ABSTRACT ................................................................................... ix
KATA PENGANTAR .................................................................. xi
DAFTAR ISI ..............................................................................xiii
DAFTAR GAMBAR .................................................................. xv
DAFTAR TABEL ...................................................................... xvi
DAFTAR LAMPIRAN .................................................................. i
BAB I PENDAHULUAN ............................................................. 1
1.1 Latar Belakang ............................................................. 1
1.2 Rumusan Masalah ........................................................ 4
1.3 Batasan Masalah ........................................................... 4
1.4 Tujuan .......................................................................... 4
1.5 Manfaat ........................................................................ 5
1.6 Sistematika Penulisan ................................................... 5
BAB II TINJAUAN PUSTAKA ................................................... 7
2.1 Penelitian Terdahulu .................................................... 7
2.2 Analisis Runtun Waktu ................................................ 8
2.3 Stasioneritas ................................................................. 8
2.4 Klasifikasi Model ARIMA ......................................... 11
2.5 Generalized Linier Models ......................................... 12
2.6 Distribusi Poisson ...................................................... 13
2.7 Model Poisson untuk data count ............................... 14
2.8 Model Generalized Autoregressive and Moving
Average (GARMA) ................................................... 15
2.9 Model Poisson GARMA (p,q) .................................. 16
2.10 Maximum Likelihood Estimation (MLE).................. 16
2.11 Algoritma IRLS ........................................................ 18
xiv
2.12 Perumusan Model dan Forecasting Poisson
GARMA .................................................................... 19
BAB III METODOLOGI PENELITIAN .................................... 27
3.1 Sumber Data .............................................................. 27
3.2 Variabel Penelitian .................................................... 27
3.3 Metode dan Tahapan Penelitian ................................ 28
BAB IV ANALISA DAN PEMBAHASAN ............................... 33
4.1 KAJIAN TEORI ....................................................... 33
4.1.1 Model Poisson GARMA (𝑝, 𝑞) ................... 33
4.1.2. Estimasi Parameter Model Poisson
GARMA (𝑝, 𝑞) ............................................ 35
4.2 KAJIAN TERAPAN ................................................ 43
BAB V PENUTUP ...................................................................... 59
5.1 KESIMPULAN ........................................................ 61
5.2 SARAN .................................................................... 61
DAFTAR PUSTAKA .................................................................. 63
LAMPIRAN ................................................................................ 65
BIODATA PENULIS .................................................................. 73
xv
DAFTAR GAMBAR
Hal
Gambar 3. 1 Diagram Alir PengerjaanTugas Akhir .................... 30
Gambar 3. 2 Diagram Alir Perumusan Model ARIMA .............. 31
Gambar 3. 3 Diagram ALir ALgoritma IRLS ............................. 32
Gambar 4. 1 Plot Data Time Series ............................................. 44
Gambar 4. 2 Transformasi Box-Cox 1 ........................................ 45
Gambar 4. 3 Transformasi Box-Cox 2 ........................................ 45
Gambar 4. 5 Plot PACF Hasil Data Transformasi Y .................. 46
Gambar 4. 4 Plot ACF Hasil Data Transformasi Y ..................... 47
Gambar 4. 5 Plot Data Actual dan Hasil Peramalan ................... 59
xvi
DAFTAR TABEL
Hal
Tabel 2. 1 Transformasi Box-Cox ................................................. 9
Tabel 2. 1 Transformasi Box-Cox ................................................. 9
Tabel 3. 1 Struktur Data Jumlah Kecelakaan di Tol Surabaya-
Gempol ...................................................................... 27
Tabel 4. 1 Parameter ARMA (1,1)...............................................47
Tabel 4. 2 Hasil Overfitting Model ARMA ................................ 50
Tabel 4. 3 Uji Asumsi Residual ................................................... 51
Tabel 4. 4 Estimasi Parameter ARMA (1,1) dengan Outlier ....... 52
Tabel 4. 5 ANOVA ...................................................................... 53
Tabel 4. 6 Estimasi Parameter Model Poisson GARMA (1,1) .... 57
Tabel 4. 7 Uji Gododness of fit ................................................... 58
Tabel 4. 8 Perbandingan Data Actual dan Hasil Peramalan ........ 58
xvii
DAFTAR LAMPIRAN
Hal
LAMPIRAN 1 Data Jumlah Kejadian Kecelakaan di Jalan
Tol Surabaya-Gempol ryas Waru-Sidoarjo ...... 65
LAMPIRAN 2 Source Code Algoritma IRLS........................... 66
LAMPIRAN 3 Source Code Hasil Peramalan .......................... 70
xviii
1
BAB I
PENDAHULUAN
Pada bab ini dibahas hal-hal yang menjadi latar belakang
permasalahan dalam Tugas Akhir ini. Kemudian permasalahan
tersebut disusun kedalam suatu rumusan masalah. Selanjutnya
dijabarkan batasan masalah untuk memperoleh tujuan serta
manfaat.
1.1. Latar Belakang
Time series (runtun waktu) adalah suatu himpunan
pengamatan yang dibangun secara berurutan dalam waktu [1].
Metode time series adalah metode peramalan dengan
menggunakan analisa plot hubungan antara variabel yang akan
diperkirakan dengan variabel waktu. Peramalan adalah pengolahan
data masa lalu untuk mendapatkan estimasi data masa yang akan
datang. Peramalan merupakan bagian penting bagi setiap
perusahaan ataupun organisasi bisnis dalam setiap pengambilan
keputusan manajemen. Peramalan itu sendiri bisa menjadi dasar
bagi perencanaan jangka pendek, menengah, maupun jangka
panjang suatu perusahaan.
Terdapat dua jenis metode yang umum digunakan dalam
peramalan, yaitu metode Analisis Regresi dan ARIMA (Box
Jenkins). Analisis Regresi merupakan teknik analisis yang
memanfaatkan hubungan antara variabel bebas dan variabel terikat
dalam suatu penelitian. Analisis ini bertujuan untuk mencari pola
hubungan antara variabel bebas dan variabel terikat yang
ditunjukkan dalam suatu model. Metode Regresi sesuai untuk data
deret waktu stasioner, namun sangat tidak sesuai untuk rangkaian
waktu non-stasioner [2]. Sedangkan Model ARIMA atau sering
juga disebut metode runtun waktu Box-Jenkins adalah model yang
2
secara penuh mengabaikan variabel bebas (independen) dalam
membuat peramalan. ARIMA menggunakan nilai masa lalu dan
sekarang dari variabel dependen untuk menghasilkan peramalan
jangka pendek yang akurat. ARIMA cocok digunakan untuk
observasi dari runtun waktu (time series) yang secara statistik
berhubungan satu sama lain (dependen). Hal yang perlu
diperhatikan adalah kebanyakan deret waktu bersifat non-stasioner
dan bahwa aspek-aspek AR dan MA dari model ARIMA hanya
berkenaan dengan deret waktu yang stasioner. Dalam Analisis
Regresi maupun ARIMA banyak dilakukan dengan
memperhatikan asumsi data yang menyebar normal, tapi pada
beberapa kasus ditemukan data yang tidak menyebar normal. Hal
tersebut dapat diatasi dengan transformasi data. Namun,
adakalanya transformasi data yang dilakukan tetap menghasilkan
data yang tidak menyebar normal, hal ini dapat menyebabkan
prinsip kenormalan dilanggar[3].
Terdapat beberapa jenis data yang dikenal seperti nominal,
ordinal, interval, dan data hitung atau count. Untuk data count
biasanya ditemukan pada suatu kasus atau pada sampel
percobaan[4]. Data jenis ini paling sering menyebabkan data tidak
menyebar normal. Untuk mengatasi hal tersebut, kajian pemodelan
peramalan runtun waktu dikembangkan dan salah satunya
diterapkan pada data count. Data count merupakan bilangan diskrit
non negatif yaitu 0, 1, 2, . . . , 𝑛. Contoh data count yang sering
ditemui antara lain: jumlah kejadian kecelakaan yang terjadi dalam
selang waktu tertentu, jumlah anak ikan yang menetas pada
perlakuan khusus di laboratorium, jumlah pertandingan sepakbola
yang tertunda karena hujan pada satu musim liga, jumlah serangan
hama pada 1 hektar sawah, dan lain-lain. Generalized linier models (GLM) telah dikembangakan oleh
McCullagh dan Nelder untuk menganalisis hubungan antara
3
variabel respon dengan variabel prediktor dimana variabel respon
tidak harus berdistribusi normal, tetapi termasuk dalam keluarga
eksponensial [5]. Model Regresi Poisson dapat digunakan untuk
memodelkan hubungan anatara variabel respon yang diasumsikan
berdistribusi Poisson terhadap variabel prediktor. Distribusi
Poisson sendiri mengasumsikan bahwa data harus bersifat
equidispersion yaitu rata-rata variabel respon sama dengan varian
[6]. Namun pada kenyataannya kondisi tersebut jarang terjadi.
Dalam penggunaannya masih dimungkinkan terjadinya
pelanggaran asumsi equidispersion. Data dengan varians sampel
lebih besar dari pada rata-ratanya biasa disebut overdispersion.
Sedangkan, data dengan varians sampel lebih kecil dari pada rata-
ratanya disebut dengan underdispersion. Regresi Poisson juga
akan menjadi tidak sesuai jika banyak variabel respon yang bernilai
nol atau biasa disebut excess zero.
Selanjutnya Benjamin, dkk. mengembangkan model
Generalized Autoregressive Moving Average (GARMA) untuk
data-data yang mengikuti distribusi non-Gaussian seperti
Distribusi Poisson dan Binomial Negatif [7]. Model GARMA
merupakan pengembangan dari perluasan Generalize Linier
Models (GLM). Model GARMA menghubungkan komponen
ARMA dengan variabel prediktor ke transformasi parameter rata-
rata dari distribusi data dengan menggunakan fungsi link [8].
Fungsi link ini digunakan untuk memastikan bahwa distribusi data
tetap dalam domain bilangan riil positif, sehingga memiliki
ketepatan prediksi yang lebih akurat. Pada penelitian ini dilakukan
estimasi mengenai model yang mengikuti distribusi Poisson atau
disebut Poisson GARMA (𝑝, 𝑞) dengan studi kasus yaitu data
jumlah kecelakaan di jalan tol Surabaya-Gempol ruas Waru-
Sidoarjo dalam batasan waktu tertentu.
4
1.2. Rumusan Masalah
Rumusan masalah pada Tugas Akhir ini yaitu :
1. Bagaimana estimasi parameter pada model Poisson GARMA
(𝑝, 𝑞) menggunakan metode Maximum Likelihood Estimation
(MLE) dengan iterasi numerik algoritma IRLS ?
2. Bagaimana mengaplikasikan model yang dikembangkan pada
data jumlah kecelakaan di jalan tol Surabaya-Gempol ruas
Waru-Sidoarjo ?
1.3. Batasan Masalah
Batasan permasalahan yang dibahas pada Tugas Akhir ini yaitu :
1. Data yang digunakan adalah data sekunder yaitu data jumlah
kecelakaan di jalan tol Surabaya-Gempol ruas Waru-Sidoarjo
pada mulai bulan Januari 2012 sampai bulan Agustus 2017.
2. Jenis distribusi keluarga eksponensial yang digunakan adalah
Poisson sehingga model yang akan diestimasi adalah Poisson
GARMA (𝑝, 𝑞).
3. Data lajur jalan yang digunakan adalah lajur A ruas Waru-
Sidoarjo yaitu arah dari Surabaya menuju Gempol
4. Software yang digunakan untuk membantu dalam kajian
terapan adalah Minitab dan Matlab.
1.4. Tujuan
Tujuan dalam penulisan Tugas Akhir ini :
1. Mengkaji estimasi parameter model Poisson GARMA (𝑝, 𝑞)
dengan metode Maximum Likelihood Estimation (MLE)
menggunakan algoritma IRLS.
2. Mengaplikasikan model Poisson GARMA (𝑝, 𝑞) pada data
jumlah kejadian kecelakaan dijalan tol Surabaya-Gempol ruas
Waru-Sidoarjo.
5
1.5. Manfaat
Manfaat yang bisa diperoleh dari penelitian Tugas Akhir ini :
1. Mengembangkan wawasan keilmuan dan pengetahuan tentang
model Poisson GARMA (𝑝, 𝑞).
2. Mengembangkan wawasan keilmuan dan pengetahuan tentang
cara menaksir parameter Poisson GARMA (𝑝, 𝑞) dengan
algoritma IRLS.
3. Memberikan informasi tentang peramalan pada instansi
ataupun pihak yang membutuhkan.
1.6. Sistematika Penulisan
Penulisan Tugas Akhir ini disusun dalam lima bab. yaitu :
1. BAB I PENDAHULUAN
Bab I berisi tentang gambaran umum dari penulisan Tugas
Akhir yang meliputi latar belakang, rumusan masalah, tujuan,
manfaat, dan sistematika penulisan.
2. BAB II TINJAUAN PUSTAKA
Bab II berisi tentang defenisi, teori-teori, penelitian
sebelumnya yang terkait permasalahan dalam Tugas Akhir
ini. Teori-teori yang digunakan dalam Tugas Akhir ini antara
lain time series, metode peramalan, distribusi Poisson, dan
GARMA.
3. BAB III METODE PENELITIAN
Bab III berisi langkah-langkah yang dilakukan dalam
pengerjaan Tugas Akhir.
4. BAB IV ANALISIS DAN PEMBAHASAN
BAB IV dibagi menjadi dua bagian yaitu kajian teori dan
kajian terapan (aplikasi). Pada bagian kajian teori akan
dibahas mengenai analisa model-model Poisson GARMA
serta estimasi parameternya. Pada bagian kajian terapan akan
6
dibahas mengenai aplikasi model Poisson GARMA pada
suatu data yang telah ditentukan.
5. BAB V PENUTUP
Bab V berisi kesimpulan dari hasil pembahasan pada BAB IV
dan saran untuk pengembangan penelitian berikutnya.
7
BAB II
TINJAUAN PUSTAKA
Dalam rangka mendukung proses estimasi model Poisson
GARMA (𝑝, 𝑞), maka pada bab ini dijabarkan beberapa teori dan
konsep penunjang dalam menyelesaikan permasalahan dalam
penelitian.
2.1 Penelitian Terdahulu
Dalam penelitian tugas akhir ini dilampirkan beberapa
penelitian terdahulu yang relevan dengan permasalahan yang
diteliti yaitu estimasi model Poisson GARMA (𝑝, 𝑞) untuk data
count dimana pada penelitian ini studi kasus yang diambil adalah
jumlah kecelakaan di jalan Tol Surabaya-Gempol pada ruas Waru-
Sidoarjo.
Penelitian mengenai data count dilakukan oleh Wainkellman
dan Zimmermann[9]. Pada penelitian tersebut dilakukan
pemodelan data usia dan jenis kelamin terhadap jumlah kelahiran.
Kesimpulan yang didapat yaitu model yang dihasilkan mengalami
overdispersi (varian peubah respon lebih besar dari rata-rata)
sehingga berpengaruh pada penarikan kesimpulan parameter yang
kurang tepat. Penelitian mengenai estimasi model GARMA
menggunakan IRLS telah dilakukan oleh Benjamin dkk (2003)[7].
Pada penelitian yang dilakukan Benjamin tidak melibatkan efek
stasioner dan musiman. Selanjutnya di Indonesia penerapan dari
data count dilakukan oleh Riza Inayah(2012)[10]. Pada penelitian
tersebut dilakukan pemodelan jumlah kasus kanker serviks di Jawa
Timur menggunakan analisis generalized poisson regression
(GPR). Penelitian ini bertujuan mendapatkan model hubungan
antara jumlah kasus kanker serviks yang terjadi di Jawa Timur
dengan variabel-variabel bebas yang diduga mempengaruhinya.
Dan penelitian kedua dilakukan oleh Asriawan yakni perbandingan
8
peramalan GSARIMA dan SARIMA pada jumlah penderita
Demam Berdarah Dengue (DBD) di Kota Surabaya (2014)[8].
Pada penelitian ini digunakan data count yang memiliki efek
musiman sehingga model yang terbentuk adalah GSARIMA
(𝑝, 𝑑, 𝑞)(𝑃, 𝐷, 𝑄)𝑠.
2.2 Analisis Runtun Waktu
Time series adalah sekumpulan pengamatan terurut yang
diambil berdasarkan interval waktu tertentu misalkan sekumpulan
data yang diambil per menit, per jam, per hari, per minggu, per
bulan, per tahun, dan sebagainya[11]. Chatfield (2001)
mengatakan bahwa secara umum metode Time series dapat
digunakan sebagai peramalan, pemodelan dan kontrol. Pada Time
series, pengukuran yang dilakukan adalah pada interval waktu
sehingga menghasilkan waktu diskrit. Tujuan dari analisis deret
waktu ad alah untuk mendapatkan hubungan dinamis dari 𝑌𝑡, yaitu
pengamatan 𝑌 pada waktu ke-𝑡, dengan waktu-waktu sebelumnya
(𝑡 − 1, 𝑡 − 2, 𝑑𝑠𝑡) [5]. Asumsi yang penting yang harus dipenuhi
dalam memodelkan data time series adalah asumsi kestasioneran
artinya sifat-sifat yang mendasari proses tidak dipengaruhi oleh
waktu atau proses dalam keseimbangan. Apabila asumsi stasioner
belum dipenuhi maka deret belum dapat dimodelkan. Namun, deret
yang nonstasioner dapat ditransformasikan menjadi deret yang
stasioner.
2.3 Stasioneritas
Stasioner merupakan suatu kondisi data time series yang jika
rata-rata, varian dan covarian dari peubah-peubah tersebut
seluruhnya tidak dipengaruhi oleh waktu[1]. Stasioneritas berarti
bahwa tidak terjadinya pertumbuhan dan penurunan data. Konsep
stasioneritas dapat digambarkan secara praktis sebagai berikut :
9
1. Apabila plot deret waktu tidak memperlihatkan adanya
perubahan variansi yang jelas dari waktu ke waktu, maka dapat
dikatakan bahwa data tersebut stasioner terhadap variansinya.
2. Apabila suatu deret waktu diplotkan dan kemudian tidak
terbukti adanya perubahan nilai tengah dari waktu ke waktu,
maka dapat dikatakan bahwa deret data tersebut stasioner
terhadap rata-rata.
Pemodelan deret waktu 𝑌1, 𝑌2, . . . , 𝑌𝑡 didasarkan pada syarat
asumsi bahwa data deret waktu harus stasioner [1]. Secara teoritis
dapat dituliskan sebagai berikut :
1. 𝐸(𝑌𝑡) = 𝐸(𝑌𝑡+𝑘) = 𝜇 ; untuk semua t
2. 𝑉𝑎𝑟(𝑌𝑡) = 𝑉𝑎𝑟(𝑌𝑡+𝑘) = 𝜎2 ; untuk semua t
3. 𝐶𝑜𝑣(𝑌𝑡 , 𝑌𝑡+𝑘) = 𝐸[(𝑌𝑡 − 𝜇)(𝑌𝑡+𝑘 − 𝜇)]
Kestasioneran data dalam varian dapat dilihat dari
Transformasi Box-Cox dimana dikatakan stasioner apabila round
value bernilai 1. Jika suatu deret data tidak stasioner dalam varians
maka sebelum melakukan pembuatan model deret waktu
diperlukan pembedaan (transformasi).
Tabel 2. 1 Transformasi Box-Cox
Nilai 𝝀 Transformasi Box – Cox
-1 1 𝑌𝑡⁄
-0.5 1 √𝑌𝑡⁄
0 ln 𝑌𝑡
0.5 √𝑌𝑡
1 𝑌𝑡
Untuk kestasioneran data dalam rata-rata digunakan fungsi
Autokorelasi yang selanjutnya disebut ACF dan fungsi
10
Autokorelasi Parsial yang selanjutnya disebut PACF. Sebuah data
dikatakan stasioner terhadap rata-rata apabila lag pada fungsi ACF
turun secara cepat menuju nol dan dikatakan tidak stasioner jika
terjadi sebaliknya. selain itu, ACF dan PACF juga digunakan
sebagai alat utama untuk mengidentifikasi model sementara dari
data yang akan diramalkan.
Suatu proses yang stasioner {𝑋𝑡} dari data time series,
autokeralasi (ACF) pada lag 𝑘 didefinisikan :
𝜌𝑘 =𝛾𝑘
𝛾0=
𝐶𝑜𝑣(𝑋𝑡 , 𝑋𝑡−𝑘)
√𝑉𝑎𝑟(𝑋𝑡)√𝑉𝑎𝑟(𝑋𝑡−𝑘)
𝜌𝑘 = 𝐸(𝑋𝑡 − 𝜇)(𝑋𝑡+𝑘 − 𝜇)
√(𝑋𝑡 − 𝜇)2√(𝑋𝑡+𝑘 − 𝜇)2
dengan :
𝜌𝑘 : autokorelasi pada lag 𝑘
𝛾𝑘 : autocovariansi pada lag 𝑘
𝜇 : rata-rata
𝑡 : waktu pengamatan ; 𝑡 = 1,2,3,…
𝑉𝑎𝑟(𝑋𝑡) = 𝑉𝑎𝑟(𝑋𝑡−𝑘) = 𝛾0
ACF dari persamaan (2.1) juga dapat didefinisikan sebagi
berikut:
𝑟𝑘 =∑ (𝑋𝑡 − 𝜇)(𝑋𝑡+𝑘 − 𝜇)𝑛−𝑘
𝑡=1
∑ (𝑋𝑡 − 𝜇)2𝑛𝑡=1
Besaran lain yang diperlukan dalam time series yakni partial
autocorrelation function (PACF) yang didefinisikan sebagai
berikut :
11
𝜙𝑘𝑘 =𝑟𝑘 ∑ 𝜙𝑘−1,𝑗𝑟𝑘−𝑗
𝑘−1𝑗=1
1 − ∑ 𝜙𝑘−1,𝑗𝑟𝑗𝑘−1𝑗=1
Fungsi Autokorelasi Parsial (PACF) digunakan sebagai alat
untuk mengukur tingkat kerataan antara 𝑌𝑡 dan 𝑌𝑡+𝑘 apabila
pengaruh lag 𝑡 + 1, 𝑡 + 2,… , 𝑡 + 𝑘 − 1 dianggap terpisah.
2.4 Klasifikasi Model ARIMA
Model Box-Jenkins (ARIMA) dibagi kedalam 3 kelompok,
yaitu: model autoregressive (AR), moving average (MA), dan
model campuran ARIMA (autoregresive moving average) yang
mempunyai karakteristik dari dua model pertama[1].
1. Autoregressive Model (AR)
Bentuk umum model autoregressive dengan ordo 𝑝 (AR(𝑝))
atau model ARIMA (𝑝, 0,0) dinyatakan sebagai berikut:
𝑌𝑡 = 𝜇′ + 𝜙1𝑋𝑡−1 + 𝜙2𝑋𝑡−2+. . . +𝜙𝑝𝑋𝑡−𝑝 + 𝑒𝑡
dengan:
µ′ : suatu konstanta
𝜙𝑝 : parameter autoregresif ke-p
𝑒𝑡 : nilai kesalahan pada saat t
2. Moving Average Model (MA)
Bentuk umum model moving average ordo 𝑞 (MA(𝑞)) atau
ARIMA (0,0, 𝑞) dinyatakan sebagai berikut:
𝑌𝑡 = 𝜇′ + 𝑒𝑡 − 𝜃1𝑒𝑡−1 − 𝜃2𝑒𝑡−2−. . . −𝜃𝑞𝑒𝑡−𝑞
dengan :
µ′ : suatu konstanta
𝜃𝑞 : parameter-parameter moving average
𝑒𝑡−𝑞 : nilai kesalahan pada saat 𝑡 − 𝑞
12
3. Model Campuran
Terdapat dua bentuk model campuran yang dibentuk dari
model Autoregreesive (AR) dan model Moving Average (MA).
a. Model ARMA
Model ARMA yaitu model campuran dari AR(𝑝) dan MA(𝑞)
untuk data yang bersifat stasioner. Persamaan umum dari ARMA
sebagai berikut :
𝑌𝑡 = 𝜙1𝑋𝑡−1+. . . +𝜙𝑝𝑋𝑡−𝑝 + 𝑒𝑡
− 𝜃1𝑒𝑡−1−. . . −𝜃𝑞𝑒𝑡−𝑞 (2.1)
dengan:
𝜙1 ∶ parameter autoregressive
𝜃1 ∶ parameter moving average
b. Model ARIMA
Apabila nonstasioneritas ditambahkan pada campuran proses
ARMA, maka model umum ARIMA (𝑝, 𝑑, 𝑞) terpenuhi. Misalnya
𝑊𝑡 = 𝑌𝑡 − 𝑌𝑡−1, maka proses ARMA dapat ditulis :
𝑊𝑡 = 𝜙1𝑊𝑡−1+. . . +𝜙𝑝𝑊𝑡−𝑝 + 𝑒𝑡
− 𝜃1𝑒𝑡−1−. . . −𝜃𝑞𝑒𝑡−𝑞
jika 𝑊𝑡 diganti dengan 𝑌𝑡 − 𝑌𝑡−1 makan persamaan (2.7) menjadi:
𝑌𝑡 = 𝑌𝑡−1 − 𝜙1(𝑌𝑡−1 − 𝑌𝑡−2)+. . . +𝜙𝑝(𝑌𝑡−𝑝
− 𝑌𝑡−𝑝−1) + 𝑒𝑡
− 𝜃1𝑒𝑡−1−. . . −𝜃𝑞𝑒𝑡−𝑞
Sehingga model (2.8) merupakan bentuk dari model ARIMA.
2.5 Generalized Linier Models
Analisis regresi yang responnya termasuk salah satu
keluarga eksponensial disebut Generalisasi Model Linier atau lebih
13
dikenal dengan GLM. GLM memperluas model regresi biasa yang
mencakup variabel respon berdistribusi tidak normal dan fungsi
model untuk mean. Menurut Kedem dan Fokianos (2003)
komponen utama dalam analisis GML diuraikan sebagai
berikut[12]:
1. Komponen random
Komponen random dari GLM terdiri dari variabel respon Y
dengan observasi bebas (𝑦1, 𝑦2, . . . , 𝑦𝑛) dari sebuah distribusi
dalam keluarga eksponensial. Bentuk fungsi densitas
probabilitas dari distribusi keluarga eksponensial, yaitu
sebagai berikut:
𝑓(𝑦𝑡 , 𝜃𝑡, 𝐾|𝐹𝑡−1) = 𝑒𝑥𝑝 {
𝑦𝑡𝜃𝑡 − 𝑏(𝜃𝑡)
𝑘𝑡(𝛼)} (2.2)
dimana fungsi parameter 𝐾𝑡(𝛼) berasal dari bentuk 𝛼
𝑊𝑡, 𝛼
merupakan parameter dispersi dan 𝑊𝑡 adalah parameter yang
diketahui berupa bobot. Sedangkan parameter 𝜃𝑡 merupakan
parameter alami dari suatu distribusi.
2. Komponen sistematik
Komponen Sistematis dari GLM adalah hubungan dari sebuah
vektor (𝜂1, 𝜂2, . . . , 𝜂𝑛) untuk menjelaskan variabel-variabel
yang berhubungan dalam sebuah model linier.
𝑔(𝜇𝑡) = 𝜂𝑡 = ∑𝛽𝑗𝒁(𝑡−1)𝑗 = 𝒁𝑡−1′
𝑝
𝑗=1
𝜷 (2.3)
Dimana fungsi 𝑔(. ) disebut fungsi link, sementara 𝜂𝑡 sebagai
model prediktor linier.
2.6 Distribusi Poisson
Distrbusi Poisson adalah distribusi probabilitas diskret yang
menyatakan peluang jumlah peristiwa yang terjadi pada periode
14
waktu tertentu apabila rata-rata kejadian tersebut diketahui dan
dalam waktu yang saling bebas sejak kejadian terakhir.
Misalkan 𝑌1, 𝑌2, . . . , 𝑌𝑛 adalah sampel random yang berasal dari
populasi berdistribusi poisson dengan parameter 𝜇𝑡. Fungsi
kepadatan peluang untuk distribusi poisson dengan parameter 𝜇𝑡
adalah:
𝑓(𝑦𝑡; 𝜇𝑡) =
𝑒−𝜇𝑡𝜇𝑦𝑡
𝑦𝑡! ; 𝑦 = 0,1,2, . . . . , 𝑛 (2.4)
dengan :
𝑒 = 2.71828…
𝑦𝑡 = 0,1,2,…
𝑡 = 1,2,3,… , 𝑛
𝐸(𝑌𝑡) = 𝜇𝑡
𝑉𝑎𝑟[𝑌𝑡] = 𝜇𝑡
2.7 Model Poisson untuk data count
Distribusi bersyarat dari hasil observasi 𝑦𝑡, untuk 𝑡 =
1,2,3,… , 𝑛 diberikan pada himpunan 𝐻𝑡 =
{𝑥𝑡, . . . , 𝑥1, 𝑦𝑡−1, . . . , 𝑦1, 𝜇𝑡−1, . . . , 𝜇1}, yang merupakan keluarga
eksponensial. Model Poisson untuk data count diperoleh dari
bentuk eksponensial dari distribusi Poisson yaitu sebagai
berikut[7]:
𝑓(𝑦𝑡; 𝛽|𝐻𝑡−1) = exp{𝑦𝑡 ln 𝜇𝑡 − 𝜇𝑡 − ln 𝑦𝑡 !}
(2.5)
untuk = 1,2, . . . , 𝑛 ; 𝐸(𝑌𝑡|𝐻𝑡−1) = 𝜇𝑡 ; 𝑏(𝜃𝑡) = 𝜇𝑡 = exp (𝜃𝑡) ;
𝑉𝑎𝑟(𝜇𝑡) = 𝜇𝑡 dan 𝜔𝑡 = 1 dengan bentuk link kanonik :
𝑔(𝜇𝑡) = 𝜃𝑡 = ln𝜇𝑡 = 𝜂𝑡 (2.6)
dan 𝜂𝑡 = 𝒁𝑡−1′ 𝜷, 𝜷 merupakan parameter yang tidak diketahui.
15
Estimasi Likelihood Parsial untuk model Poisson seperti
dijelaskan dalam Kedem & Fokianos (2002) bahwa fungsi
likelihood parsial untuk model Poisson adalah sebagai berikut [13]:
𝑃𝐿(𝜷) = ∏𝑓(𝑦𝑡; 𝜷|𝐻𝑡−1)
𝑛
𝑡=1
𝑃𝐿(𝜷) = ∏
exp (−𝜇𝑡(𝜷))𝜇𝑡(𝜷)𝑦𝑡
𝑦𝑡!
𝑛
𝑡=1
(2.7)
2.8 Model Generalized Autoregressive and Moving Average
(GARMA)
Model GARMA dikenalkan pertama kali oleh Benjamin dkk.
(2003). Berdasarkan persamaan (2.2), model GARMA (𝑝, 𝑞)
mempunyai bentuk sebagai berikut [6] :
𝑔(𝜇𝑡) = 𝒁𝑡−1
′ 𝜷 = 𝑿𝑡−1′ 𝜷 + 𝜏𝑡
(2.8)
dengan
𝜏𝑡 = ∑𝜙𝑗𝒜(𝑦𝑡−𝑗, 𝑥𝑡−𝑗,𝛽) +
𝑝
𝑗=1
∑𝜃𝑗ℳ(𝑦𝑡−𝑗, 𝜇𝑡−𝑗)
𝑞
𝑗=1
𝜏𝑡 : komponen AR dan MA
𝐴 : fungsi yang mempresentasikan bentuk autoregressive
ℳ : fungsi yang mempresentasikan bentuk moving average
𝜙𝑇 : parameter autoregressive ; 𝜙𝑇 = (𝜙1, 𝜙2, . . . , 𝜙𝑝)
𝜃𝑇 : parameter moving average ; 𝜽𝑇 = (𝜃1, 𝜃2, . . . , 𝜃𝑝)
Bentuk sub model parsimoni dari model GARMA (𝑝, 𝑞) yang
didefinikan oleh Benjami dkk.(2003) adalah sebagai berikut :
𝑔(𝜇𝑡) = 𝒁𝑡−1′ 𝜷
16
𝑔(𝜇𝑡) = 𝑿𝑡−1′ 𝜷 + ∑ 𝜙𝑗{𝑔(𝑦𝑡−𝑗) − 𝑋𝑡−𝑗
′ 𝛽}
𝑝
𝑗=1
+∑ 𝜙𝑗 {𝑔(𝑦𝑡−𝑗) − 𝜂𝑡−𝑗𝛽}
𝑞
𝑗=1
(2.9)
2.9 Model Poisson GARMA (p,q)
Model Poisson GARMA (𝑝, 𝑞) dikembangkan berdasarkan
model GARMA (𝑝, 𝑞) dengan pendekatan distribusi Poisson[7].
Diberikan 𝑦𝑇 = (𝑦𝑡 , 𝑦𝑡+1, … , 𝑦𝑡+𝑛) adalah model data deret
waktu. Jika 𝑦𝑡~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜇𝑡 , 𝛼) maka 𝐸(𝑦𝑡) = 𝑉𝑎𝑟(𝑦𝑡) = 𝜇𝑡 dan
𝛼 → 0. Sebuah distribusi bersyarat untuk 𝑦𝑡 pada (14) memberikan
model Poisson GARMA (𝑝, 𝑞). Jika 𝑔 adalah fungsi ln pada
(2.20), maka :
ln(𝜇𝑡) = 𝑿𝑡−1′ 𝜷
+ ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ − 𝑿𝑡−𝑗
′ 𝜷}
𝑝
𝑗=1
+∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
(2.10)
dimana 𝑦𝑡−𝑗∗ = max (𝑦𝑡−𝑗, 𝑐) dan 0 < 𝑐 ≤ 1. Jika terdapat nilai 0
pada nilai 𝑦𝑡−𝑗 maka akan diganti dengan 𝑐.
2.10 Maximum Likelihood Estimation (MLE)
Metode Maximum Likelihood Estimation adalah metode
pendugaan yang memaksimumkan fungsi likelihood [14]. Dalam
penelitian ini metode MLE digunakan untuk menduga parameter
Distribusi Poisson. Adapun fungsi Likelihood 𝐿(𝜃) sebagai berikut
17
𝐿(𝜃) = ∏𝑓(𝑥𝑖|𝜃)
𝑛
𝑡=1
(2.11)
Misalkan diketahui Populasi 𝑋~𝑓(𝑥, 𝜃), maka langkah-langkah
metode MLE sebagai berikut :
1. Ambil n sampel random 𝑥1, 𝑥2, . . . , 𝑥𝑛 yang berdistribusi sama
dengan 𝑋
2. Buat fungsi Likelihood yaitu fungsi distribusi peluang
bersama dari 𝑥1, 𝑥2, . . . , 𝑥𝑛
𝐿(𝑥1, 𝑥2, . . . , 𝑥𝑛|𝜃) = ∏𝑓(𝑥𝑖|𝜃)
𝑛
𝑖=1
3. Maksimumkan fungsi Likelihood terhadap 𝜃
𝜕𝐿(𝜃)
𝜕𝜃= 0 → 𝑑𝑖𝑑𝑎𝑝𝑎𝑡 𝜃
𝜕2𝐿(𝜃)
𝜕𝜃2| 𝜃 = 𝜃 < 0 → 𝜃 𝑝𝑒𝑛𝑎𝑘𝑠𝑖𝑟 𝜃
atau dengan ln 𝐿(𝜃)
𝜕 ln 𝐿(𝜃)
𝜕𝜃= 0 → 𝑑𝑖𝑑𝑎𝑝𝑎𝑡 𝜃
𝜕2 ln 𝐿(𝜃)
𝜕𝜃2| 𝜃 = 𝜃 < 0 → 𝜃 𝑝𝑒𝑛𝑎𝑘𝑠𝑖𝑟 𝜃
Untuk mempermudah perhitungan secara matematis,
umumnya digunakan fungsi log-likelihoood.
𝑙(𝜃) = ln 𝐿(𝜃) = ∑ln𝑓(𝑥𝑖|𝜃)
𝑛
𝑖=1
(2.12)
18
Dari syarat cukup dalam penggunaan metode MLE, terdapat
kemungkinan bahwa bentuk yang dihasilkan close form. Jika
terjadi hal tersebut, maka untuk memaksimumkan persamaan
dilakukan dengan iterasi numerik yaitu dengan optimasi Algoritma
Iteratively Reweighted Least Squares (IRLS)
2.11 Algoritma IRLS
Estimasi model GARMA menggunakan IRLS telah
dilakukan oleh Benjamin, dkk [7]. berdasarkan proses yang
dilakukan oleh Greeb (1984). Misalnya parameter yan akan
diestimasi (𝜸𝑻 = 𝜷𝑻, 𝝓𝑻, 𝜽𝑻). Ketiga parameter tersebut
diestimasi dengan menggunakan MLE, namun karena bentuk yang
dihasilkan close form dilanjutkan dengan menggunakan optimasi
algoritma IRLS[13].
Adapun langkah-langkah algoritma IRLS untuk mendapatkan
taksiran parameter menurut Kedem dan Fokianos adalah sebagai
berikut :
1. Inisialisasi, memilih nilai awal untuk �̂�(0) dengan
menggunakan metode Ordinary Least Square (OLS) untuk
𝑡 = 1,2,3,4… , 𝑇.
�̂�(0) = (𝑥′𝑥)−1𝑥′𝑦𝑡∗
𝑥 dan 𝑦 didefinisikan sebagai berikut :
𝑥 = [
1 𝑥11 … 𝑥𝑘1
1 𝑥12 … 𝑥𝑘2
⋮ ⋮ ⋱ ⋮1 𝑥1𝑛 … 𝑥𝑘𝑛
] dan 𝑦 = [
ln 𝑦0∗
ln 𝑦1∗
⋮ln 𝑦𝑇−1
∗
]
2. Menghitung nilai �̂�𝒕(𝟎)
�̂�𝑡 = exp(𝑿𝒕′𝜷)
19
3. Menghitung nilai 𝑊
𝑊(1) =
[
1
�̂�𝟎(𝟎)
1
�̂�𝟏(𝟎)
⋱1
�̂�𝑻−𝟏(𝟎)
]
4. Menghitung nilai 𝑧 yakni sebagai berikut :
𝑧𝑡(1) = 𝜼𝑡
(1)+
𝑦𝑡 + �̂�𝟎
�̂�𝟎
𝜼𝑡(1)
= exp(𝑿�̂�(0))
5. Menghitung estimasi
�̂�(𝑘+1) = (𝑿′𝑾(𝒌+𝟏)𝑿)−1
𝑿′𝑾(𝒌+𝟏)𝑧(𝑘+1) (2.13)
6. Ulangi langkah sampai dengan e menggunakan nilai �̂�(𝟏)
sehingga akan diperoleh nilai baru �̂�(𝟐)
7. Update 𝑘 ke 𝑘 + 1 dan ulangi langkah b sampai diperoleh
toleransi sebagai berikut :
| �̂�(𝑡) − �̂�(𝑡−1)| < 𝜀𝛽
2.12 Perumusan Model dan Forecasting Poisson GARMA
Dalam perumusan model awal Poisson GARMA (𝑝, 𝑞)
diperoleh dari perumusan model awal ARIMA[8]. Adapun langkah
20
dalam perumusan model ARIMA yaitu tahap identifikasi model,
penaksiran dan pengujian parameter, serta untuk mendapatkan
model terbaik dilanjutkan dengan uji diagnostik dan overfitting.
Setelah mendapatkan model terbaik dilakukan forecasting dengan
menggunakan model Poisson GARMA (𝑝, 𝑞).
1. Identifikasi Model
Identifikasi model ARIMA dapat dilakukan dengan melihat
plot deret waktu, plot ACF, dan plot PACF. Fungsi Autokorelasi
atau Autocorrelation Function (ACF) merupakan suatu hubungan
linier antara pengamatan 𝑍𝑡 dengan pengamatan 𝑍𝑡−𝑘. Fungsi
autokorelasi parsial atau partial autocorrelation function (PACF)
digunakan untuk menunjukkan besarnya hubungan antar nilai
variabel yang sama dengan menganggap pengaruh dari semua
kelambatan waktu yang lain adalah konstan.
2. Estimasi dan Pengujian Parameter
Setelah identifikasi model selesai, selanjutnya dilakukan
estimasi parameter pada model. Ada beberapa metode yang dapat
digunakan dalam mengestimasi parameter, antara lain: metode
least squares, metode maximum likelihood estimation, metode
conditional least squares, dan metode non linier estimation.
Setelah diperoleh nilai estimasi dari masing-masing
parameter kemudian dilakukan pengujian signifikansi parameter
untuk mengetahui apakah model sudah layak atau belum untuk
digunakan. Untuk pengujian signifikansi parameter menggunakan
uji-t student. Misalnya 𝜸 adalah suatu parameter pada model
Poisson GARMA (mencakup 𝜷, 𝝓 dan 𝜽) dan 𝛾 adalah estimasi
dari 𝛾 maka pengujian signifikansi parameter dapat dinyatakan
sebagai berikut [7]:
21
Hipotesis :
𝐻0: 𝛽 = 0 (Parameter model tidak signifikan).
𝐻1: 𝛽 ≠ 0 (Parameter model signifikan.
Statistik Uji :
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = �̂�
𝑆𝐸(�̂�) untuk 𝑆𝐸(�̂�) ≠ 0 (2.14)
dengan :
�̂� : parameter hasil estimasi
𝑆𝐸(�̂�) : standart error estimasi parameter
Kriteria Pengujian :
𝐻0 akan ditolak apabila nilai statistik uji |𝑡ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑡𝛼
2,(𝑛−1),
sehingga yang berarti bahwa parameter model signifikan, dengan
n adalah jumlah data dan 𝛼 adalah taraf signifikan
3. Uji diagnostik
Dalam menentukan model yang terbaik, harus dipilih model
yang seluruh parameternya signifikan, kemudian memenuhi dua
asumsi residual yaitu berdistribusi normal dan white noise, yaitu:
a. Uji Asumsi Residual White Noise
Suatu model bersifat white noise artinya residual dari model
tersebut telah memenuhi asumsi identik (variasi residual homogen)
serta independen (antar residual tidak berkorelasi). Pengujian
asumsi white noise dilakukan dengan menggunakan uji Ljung-Box
yang meliputi :
Hipotesis :
𝐻0 ∶ 𝜌1 = 𝜌2 = ⋯ = 𝜌𝑘 = 0 (residual memenuhi syarat white
noise).
𝐻1 ∶ Minimal ada satu 𝜌𝑘 ≠ 0 dengan 𝑘 = 1,2,… , 𝐾.
(residual tidak memenuhi syarat white noise).
22
Statistik uji :
𝑄 = 𝑛(𝑛 + 2)∑�̂�𝑘
2
(𝑛−𝑘)𝐾𝑘=1 (2.15)
dengan :
𝐾 : lag maksimum
𝑛 : jumlah data
�̂�𝑘 : autokorelasi residual untuk lag ke k
Kriteria penguji :
𝐻0 akan ditolak apabila nilai statistik uji 𝑄 > 𝜒𝛼,𝐾−𝑝−𝑞2 , sehingga
residual memenuhi syarat white-noise, dengan 𝛼 adalah taraf
signifikan, K adalah lag maksimum, p adalah orde dari AR, dan q
adalah orde dari MA.
b. Uji Asumsi Distribusi Normal
Untuk pengujian residual berdistribusi normal dapat
menggunakan uji Komogorov-Smirnov. Pengujian dapat
dilakukan sebagai berikut:
Hipotesa :
𝐻0 ∶ 𝐹(𝑥) = 𝐹0(𝑥) (residual berdistribusi normal)
𝐻1 ∶ 𝐹(𝑥) ≠ 𝐹0(𝑥) (residual tidak berdistribusi normal)
Statistik uji :
𝐷 = 𝑠𝑢𝑝𝑥
|𝑆(𝑥) − 𝐹0(𝑥)| (2.16)
dengan :
𝑆(𝑥) : Fungsi distribusi kumulatif data sampel
𝐹0(𝑥) : Fungsi peluang distribusi normal
Kriteria penguji :
23
𝐻0 akan ditolak apabila nilai statistik uji 𝐷 > 𝐷1−𝛼,𝑛, sehigga
residual memenuhi syarat normalitas dengan 𝛼 adalah taraf
signifikan dan n adalah jumlah data.
c. Overfitting
Salah satu prosedur diagnostik cek yang dikemukakan Box
Jenkins adalah overfitting, yaitu menambah satu atau lebih
parameter dalam model yang dihasilkan pada tahap identifikasi.
Model yang dihasilkan dari overfitting dijadikan sebagai model
alternatif yang kemudian dicari model terbaik diantara model-
model yang signifikan.
4. Deteksi Outlier
Pada data time-series sering dijumpai data residual yang tidak
berdistribusi normal. Hal ini menyebabkan peramalan dengan
menggunakan metode ARIMA memberikan hasil ramalan yang
bias. Hal ini menunjukan perlunya dilakukan deteksi outlier pada
residual ARIMA sehingga model ARIMA memenuhi semua uji
asumsi yang dibutuhkan dengan persamaan yang diberikan sebagai
berikut [5].
𝑥𝑖(𝑡) = {1;0;
𝑡: 𝑡𝑒𝑟𝑗𝑎𝑑𝑖 𝑜𝑢𝑡𝑙𝑖𝑒𝑟𝑡: 𝑦𝑎𝑛𝑔 𝑙𝑎𝑖𝑛
(2.17)
Sehingga persaaan model peramalan menjadi sebagai berikut.
∅𝑝(𝐵)(1 − 𝐵)𝑑𝑍𝑡 = 𝜃𝑞(𝐵)𝑒𝑡 + 𝛽𝑖𝑥𝑖(𝑡) (2.18)
dengan :
𝑍𝑡 : data ke t
𝐵 : operator back shift
∅𝑝 : parameter autoregressive ke p
24
𝜃𝑞 : parameter moving average ke q
𝛽𝑖 : parameter regresi ke i ; 𝑖 = 1,2,3, …
𝑥𝑖 : outlier ke i; 𝑖 = 1,2,3,…
𝑒𝑡 : nilai residual ke t
Dengan penambahan variabel outlier berupa 𝑥𝑖 sampai
mendapatkan residual yang diinginkan yaitu sampai residual
memenuhi asumsi normalitas. Pengujian parameter untuk kodel
ARIMA dengan outlier dibagi menjadi dua yaitu uji serentak dan
uji parsial.
a. Uji Serentak
Pengujian parameter secara serentak (simultan) adalah
sebagai berikut:
Hipotesis :
𝐻0: 𝛽0 = 𝛽1 = ⋯ = 𝛽𝑘 = 0
𝐻1: ada 𝛽𝑗 ≠ 0
Uji statistik :
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 =𝑀𝑆𝑟𝑒𝑔𝑟𝑒𝑠𝑖
𝑀𝑆𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙 (2.19)
Kriteria pengujian :
𝐻0 akan ditolak apabila nilai statistik uji 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 >
𝐹𝛼,𝑘,(𝑛−𝑘−1), sehingga semua variabel prediktor
berpengaruh signifikan terhadap variabel respon, dengan 𝛼
adalah taraf signifikan, n adalah jumlah data, dan k adalah
banyaknya variabel prediktor.
b. Uji Parsial
Prosedur pengujian parameter secara parsial adalah sebagai
berikut.
25
Hipotesis :
𝐻0 ∶ 𝛽𝑗 = 0
𝐻1 ∶ 𝛽𝑗 ≠ 0
Uji statistik :
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =𝛽𝑗
𝑆𝐸(𝛽𝑗) (2.20)
Dengan :
𝛽𝑗 : parameter ke-j
𝑆𝐸(𝛽𝑗) : standart residual parameter ke-j
Kriteria pengujian :
𝐻0 akan ditolak apabila nilai statistik uji |𝑡ℎ𝑖𝑡𝑢𝑛𝑔| >
𝑇𝛼\2 ,(𝑛−𝑘−1), sehingga variabel prediktor berpengaruh
signifikan terhadap variabel respon, dengan 𝛼 adalah taraf
signifikan, n adalah jumlah data, dan k adalah banyaknya
parameter variabel prediktor.
5. Kriteria Pemilihan Model Terbaik
Kriteria model terbaik yang digunakan pada peneltian Tugas
Akhir ini adalah Akaike’s Information Criterion (AIC). AIC adalah
suatu kriteria pemilihan model terbaik dengan mempertimbangkan
banyaknya parameter dalam model. Kriteria AIC dapat
dirumuskan sebagai berikut [15]:
𝐴𝐼𝐶(𝑝∗) = −2 ln (𝑃𝐿(�̂�)) + 2𝑝∗ (2.21)
dengan 𝑃𝐿(�̂�) adalah nilai likelihood, dan 𝑘 adalah jumlah
parameter. Untuk memilih model yang terbaik yaitu dengan
memilih model yang mempunyai nilai AIC terkecil.
26
6. Uji Godness of fit
Uji kecocokan atau Goodness of fit digunakan untuk
mengetahui ada tidaknya kesesuaian model sebaran yang
diasumsikan, atau ada tidaknya kecocokan antara frekuensi yang
teramati (terobservasi) dengan frekuensi harapan. Pada tahap ini
digunakan devian untuk mendapatkan kesesuaian model. Misalnya
𝑙(𝜇�̂�; 𝑦) merupakan log-likelihood parsial yang maksimum dari
model reduksi dan 𝑙(𝑦; 𝑦) merupakan log-likelihood parsial dalam
model keluarga eksponensial.
Hipotesis:
𝐻0 ∶ 𝜇𝑡 = 𝜇 (𝑥𝑡; 𝜷), untuk 𝑡 = 1,2,3, . . , 𝑛
𝐻1 ∶ 𝜇𝑡 ≠ 𝜇 (𝑥𝑡; 𝜷)
Statistik uji :
𝐷 = 2{𝑙(𝑦; 𝑦) − 𝑙(𝜇�̂�; 𝑦} (2.22)
Kriteria pengujian :
𝐻0 akan ditolak jika 𝐷 < 𝜒𝛼,𝑛−𝑝−𝑞2 sehingga model dapat
dikatakan sesuai, dengan 𝑛 adalah jumlah data, 𝑝 dan 𝑞 adalah
orde.
27
BAB III
METODOLOGI PENELITIAN
Pada bab ini akan dijabarkan mengenai langkah-langkah
dalam penelitian, diantaranya sebagai berikut :
3.1 Sumber Data
Pada penelitian ini, data yang digunakan adalah data jumlah
kejadian kecelakaan di jalan Tol Surabaya-Gempol ruas Waru-
Sidoarjo dari bulan Januari tahun 2012 hingga Agustus tahun 2017
dengan jumlah data sebesar 68. Data tersebut diperoleh dari pihak
pengelola jalan tol P.T. Jasa Marga.
3.2 Variabel Penelitian
Variabel Y yang digunakan dalam penelitian ini adalah jumlah
kecelakaan di jalan Tol Surabaya-Gempol ruas Waru-Sidoarjo.
Tabel 3. 1 Struktur Data Jumlah Kecelakaan di Tol Surabaya-
Gempol
Tahun Bulan Jumlah Kecelakaan (Y)
2012
Januari 𝑌1
Februari 𝑌2
⋮
Desember 𝑌12
2013
Januari 𝑌13
Februari 𝑌14
⋮
Desember 𝑌24
⋮ ⋮ ⋮
2017
Januari 𝑌61
Februari 𝑌62
⋮
Agustus 𝑌68
28
3.3. Metode dan Tahapan Penelitian
Metode dan tahapan penelitian yang akan dilakukan adalah
sebagai berikut :
1. Pengumpulan data
Pada tahap ini dilakukan pengumpulan data jumlah
kecelakaan di jalan Tol Surabaya-Gempol ruas Waru-
Sidoarjo dari P.T. Jasa Marga.
2. Studi Literatur
Pada tahap ini dilakukan studi literatur untuk mendukung
penelitian. Bahan-bahan referensi yang digunakan berupa
buku, jurnal, tugas akhir, thesis dan juga media elektronik
(internet) yang sesuai dan berhubungan dengan
permasalahan yang dibahas.
3. Mengkaji cara mendapatkan penaksir parameter model
Poisson GARMA (𝑝, 𝑞) dengan metode MLE menggunakan
algoritma IRLS. Adapun langkah-langkahnya sebagai
berikut:
a. Mengasumsikan bahwa 𝑦𝑡 berdistribusi Poisson.
b. Menentukan fungsi padat peluang untuk Distribusi
Poisson, yaitu :
𝑓(𝑦𝑖 |𝑥𝑖) =𝑒−𝜇𝑖𝜇𝑖
𝑦𝑖
𝑦𝑖!, 𝑦𝑖 = 0,1,2, . . .
c. Membentuk fungsi padat peluang distribusi Poisson
kedalam bentuk fungsi likelihood, yaitu :
𝑃𝐿(𝜸) = ∏𝑓(𝑦𝑡; 𝜷|𝐹𝑡−1)
𝑛
𝑡=1
d. Membentuk fungsi likelihood kedalam bentuk ln-
likelihood, yaitu :
𝑙(𝜸) = ln ( 𝑃𝐿(𝜸)
29
e. Menurunkan fungsi likelihood terhadap parameter yang
mengikutinya.
f. Menentukan estimasi parameter
4. Melakukan peramalan model Poisson GARMA (𝑝, 𝑞) pada
data jumlah kecelakaan di jalan tol Surabaya-Gempol ruas
Waru-Sidoarjo pada dengan langkah sebagai berikut :
a. Tahap Identifikasi
i. Melakukan identifikasi plot jumlah kecelakaan
dengan menggunakan plot time series.
ii. Mengatasi data yang tidak stasioner
iii. Melakukan identifikasi orde (𝑝, 𝑞)
b. Tahap Estimasi
i. Melakukan estimasi model Poisson GARMA (𝑝, 𝑞)
sesuai model yang diperoleh dari langkah sebelumnya
dengan menggunakan pendekatan IRLS
ii. Menguji signifikansi parameter
c. Tahap Cek Diagnosa
d. Tahap Peramalan
Pada tahap ini dilakukan peramalan model Poisson
GARMA (𝑝, 𝑞) untuk beberapa bulan kedepan
5. Penarikan Kesimpulan
Setelah langkah 1 hingga 4 dilakukan, maka dilakukan
penarikan kesimpulan dari pembahasan yang sudah dilakukan
sebelumnya
6. Penulisan Laporan Tugas Akhir
Penulisan laporan tugas akhir dilakukan dari awal dilakukan
penelitian hingga waktu yang telah ditentukan
30
3.3 Diagram Alir
Tahapan penelitian Tugas Akhir disajikan dalam bentuk
diagram alir pada Gambar 3.1. Diagram alir dari metode ARMA
dan Algoritma IRLS juga dapat dilihat pada Gambar 3.2 dan
Gambar 3.3.
Gambar 3. 3 Diagram Alir PengerjaanTugas Akhir
31
Gambar 3. 4. Diagram Alir Perumusan Model ARIMA
32
Gambar 3. 5 Diagram ALir ALgoritma IRLS
33
BAB IV
ANALISA DAN PEMBAHASAN
Pada bab ini dibahas mengenai estimasi parameter model
Poisson GARMA (𝑝, 𝑞) yang dibagi menjadi 2 bagian yaitu kajian
teori dan kajian terapan.
4.1. KAJIAN TEORI
Pada kajian ini dibahas mengenai model Poisson GARMA
(𝑝, 𝑞) dan contoh model khusus Poisson GARMA (𝑝, 𝑞) serta
estimasi parameternya.
4.1.1. Model Poisson GARMA (𝒑, 𝒒)
Model Poisson GARMA (𝑝, 𝑞) diusulkan oleh Benjamin pada
tahun 1998 dengan definisi sebagai berikut :
Definisi 4.1 : Model Poisson GARMA (𝑝, 𝑞) dibangun dari
distribusi bersyarat Poisson untuk 𝑦𝑡 pada persamaan (2.4). Jika
fungsi 𝑔 pada (2.9) diganti dengan fungsi logaritma natural, maka
persamaan menjadi:
ln(𝜇𝑡) = 𝑿𝑡−1′ 𝜷
+ ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ − 𝑿𝑡−𝑗
′ 𝜷}
𝑝
𝑗=1
+∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
(4.1)
Pada penelitian ini, variabel prediktor 𝑥 diabaikan sehingga
menurut Marinho dan Ricardo (2015) 𝑋𝑡−1′ 𝛽 dapat diganti dengan
suatu konstanta 𝑏 [16]. Sehingga persamaan (4.1) menjadi:
34
ln(𝜇𝑡) = 𝑏 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ − 𝑏} +
𝑝
𝑗=1
∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
ln(𝜇𝑡) = 𝑏 + ∑𝜙𝑗(ln 𝑦𝑡−𝑗∗ ) − ∑𝜙𝑗𝑏
𝑝
𝑗=1
𝑝
𝑗=1
+ ∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
(4.2)
jika 𝛽0 = 𝑏 − ∑ 𝜙𝑗𝑏𝑝𝑗=1 maka persamaan (4.2) menjadi:
ln(𝜇𝑡) = 𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ } +
𝑝
𝑗=1
∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
(4.3)
dengan 𝑦𝑡−𝑗∗ = max (𝑦𝑡−𝑗, 𝑐) dan 0 < 𝑐 ≤ 1. Persamaan (4.3)
dibentuk kedalam matriks, maka bentuk matrik sebagai berikut:
[ ln(𝜇2)
ln(𝜇3)
ln(𝜇4)⋮
ln(𝜇𝑇)]
=
[ 1 ln 𝑦1
∗ … ln 𝑦1∗ ln
𝑦1∗
𝜇1
… ln𝑦1
∗
𝜇1
1 ln 𝑦2∗ … ln 𝑦2
∗ ln𝑦2
∗
𝜇2
… ln𝑦2
∗
𝜇2
1 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
1 ln 𝑦𝑇−1∗ … ln 𝑦𝑇−1
∗ ln𝑦𝑇−1
∗
𝜇𝑇−1
… ln𝑦𝑇−1
∗
𝜇𝑇−1]
[ 𝛽0
𝜙1
⋮𝜙𝑝
𝜃1
⋮𝜃𝑞 ]
𝒗𝒕 = 𝑿 𝜸
dengan 𝑡 = 2,3,4, . . . , 𝑇 sehingga diperoleh persamaan sebagai
berikut :
35
𝜇𝑡= exp [𝛽
0+ ∑𝜙
𝑗{ln 𝑦
𝑡−𝑗∗ }
𝑝
𝑗=1
+∑ 𝜃𝑗 {ln 𝑦
𝑡−𝑗∗
𝜇𝑡−𝑗
}
𝑞
𝑗=1
]
(4.4)
4.1.2. Estimasi Parameter Model Poisson GARMA (𝒑, 𝒒)
Dalam mencari estimasi parameter model Poisson GARMA
(𝑝, 𝑞) langkah awal yang dilakukan yaitu dengan mengasumsikan
bahwa variabel respon 𝑦 pada data jumlahan mengikuti distribusi
Poisson pada persamaan (2.4). Bentuk partial likelihood dari
distribusi Poisson sebagai berikut:
𝑃𝐿(𝛾) = ∏ 𝑓(𝑦𝑡 , 𝛾)𝑛𝑡=1
𝑃𝐿(𝛾) = ∏
exp(−𝜇𝑡(𝛾))𝜇𝑡(𝛾)𝑦𝑡
𝑦𝑡!
𝑛
𝑡=1
Persamaan diatas dibentuk ke dalam partial log-likelihood
sehingga menjadi:
𝑙(𝛾) = ln𝑃𝐿(𝛾)
𝑙(𝛾) = ln [∏
exp(−𝜇𝑡(𝛾))𝜇𝑡(𝛾)𝑦𝑡
𝑦𝑡!
𝑛
𝑡=1
]
𝑙(𝛾) = ∑𝑦𝑡
𝑛
𝑡=1
ln 𝜇𝑡(𝛾) − ∑𝜇𝑡(𝛾) −
𝑛
𝑡=1
∑(𝑦𝑡
𝑛
𝑡=1
!) (4.5)
Jika persamaan (4.4) disubtitusikan kedalam persamaan
(4.5) bentuk partial log-likelihood akan mengikuti bentuk :
36
𝑙(𝛾) = ∑𝑦𝑡
𝑛
𝑡=1
ln {exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }
𝑝
𝑗=1
+ ∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
)}
− ∑{exp(𝛽0 + ∑𝜙𝑗{ln𝑦𝑡−𝑗∗ }
𝑝
𝑗=1
𝑛
𝑡=1
+ ∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
)} −∑(𝑦𝑡
𝑛
𝑡=1
!)
(4.6)
Untuk memaksimumkan fungsi pada persamaan (4.6) maka
dilakukan turunan pertama. Turunan pertama dari partial log-
likelihood terhadap parameter koefisien 𝛽0 adalah :
𝜕𝑙(𝜇𝑡)
𝜕𝛽0=
𝜕𝑙
𝜕𝛽0[∑𝑦𝑡
𝑛
𝑡=1
ln {exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }
𝑝
𝑗=1
+ ∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
)}
− ∑{exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }
𝑝
𝑗=1
+ ∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
)}
𝑛
𝑡=1
− ∑(𝑦𝑡
𝑛
𝑡=1
!)]
𝜕𝑙(𝜇𝑡)
𝜕𝛽0= ∑𝑦𝑡
𝑛
𝑡=1
− ∑{exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }
𝑝
𝑗=1
𝑛
𝑡=1
+ ∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
)}
Dengan cara yang sama diperoleh turunan pertama dari
partial log-likelihood terhadap parameter koefisien 𝝓 sebagai
berikut :
37
𝜕𝑙(𝜇𝑡)
𝜕𝜙1= ∑𝑦𝑡
𝑛
𝑡=1
(ln 𝑦𝑡−1∗ )
− ∑(ln 𝑦𝑡−1∗ )
𝑛
𝑡=1
exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }
𝑝
𝑗=1
+ ∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
)
𝜕𝑙(𝜇𝑡)
𝜕𝜙2= ∑𝑦𝑡
𝑛
𝑡=1
(ln 𝑦𝑡−2∗ )
− ∑(ln 𝑦𝑡−2∗ )
𝑛
𝑡=1
exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }
𝑝
𝑗=1
+ ∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
)
⋮
𝜕𝑙(𝜇𝑡)
𝜕𝜙𝑗= ∑𝑦𝑡
𝑛
𝑡=1
(ln 𝑦𝑡−𝑗∗ )
− ∑(ln𝑦𝑡−𝑗∗ )
𝑛
𝑡=1
exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }
𝑝
𝑗=1
+ ∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
)
Sedangkan turunan terhadap parameter pertama dari partial
log-likelihood terhadap parameter koefisien 𝜽 sebagai berikut :
38
𝜕𝑙(𝜇𝑡)
𝜕𝜃1
= ∑𝑦𝑡
𝑛
𝑡=1
(ln 𝑦𝑡−1
∗
𝜇𝑡−1
)
− ∑ (ln 𝑦𝑡−1
∗
𝜇𝑡−1
)
𝑛
𝑡=1
exp (𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }
𝑝
𝑗=1
+ ∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗
}
𝑞
𝑗=1
)
𝜕𝑙(𝜇𝑡)
𝜕𝜃2= ∑𝑦𝑡
𝑛
𝑡=1
(ln 𝑦𝑡−2
∗
𝜇𝑡−2)
− ∑(ln𝑦𝑡−2
∗
𝜇𝑡−2)
𝑛
𝑡=1
exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }
𝑝
𝑗=1
+ ∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
)
⋮
𝜕𝑙(𝜇𝑡)
𝜕𝜃𝑗= ∑𝑦𝑡
𝑛
𝑡=1
(ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗)
−∑(ln𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗)
𝑛
𝑡=1
exp(𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ }
𝑝
𝑗=1
+ ∑𝜃𝑗 {ln𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
𝑞
𝑗=1
)
(4.
Syarat cukup agar fungsi dari partial log-likelihood
maksimum adalah :
𝜕𝑙(𝜇𝑡)
𝜕𝛽0= 0 ;
𝜕𝑙(𝜇𝑡)
𝜕𝜙𝑗= 0 ;
𝜕𝑙(𝜇𝑡)
𝜕𝜃𝑗= 0
39
Persamaan diatas tidak close form atau tidak dapat
diselesaikan, untuk mengestimasi 𝜸′ = (𝛽0′ , 𝜙𝑗
′, 𝜃𝑗′) digunakan
optimasi algoritma Iteratively Reweighted Least Square (IRLS)
yang terdapat pada sub bab 2.7. Inisialisasi dalam memilih nilai
awal untuk �̂�(0) adalah menggunakan metode Ordinary Least
Square (OLS) untuk 𝑡 = 1,2,3,4… , 𝑇.
�̂�(0) = (𝑥′𝑥)−1(𝑥′𝑦𝑡∗)
dengan 𝑥 dan 𝑦 didefinisikan sebagai berikut :
𝑥 =
[ 1 ln 𝑦0
∗ … ln𝑦0∗ ln
𝑦0∗
𝜇0… ln
𝑦0∗
𝜇0
1 ln 𝑦0∗ … ln𝑦1
∗ ln𝑦1
∗
𝜇1… ln
𝑦1∗
𝜇1
1 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
1 ln 𝑦𝑇−1∗ … ln𝑦𝑇−1
∗ ln𝑦𝑇−1
∗
𝜇𝑇−1… ln
𝑦𝑇−1∗
𝜇𝑇−1]
𝑦∗ = [
ln 𝑦1∗
ln 𝑦2∗
⋮ln 𝑦𝑇−1
∗
]
dengan 𝑡 = 1,2,3,4, . . . 𝑇. Selanjutnya dilakukan iterasi sesuai
langkah pada sub bab 2.7 Persamaan algoritma IRLS sebagai
berikut:
�̂�(𝑘+1) = (𝑿′𝑾(𝒌+𝟏)𝑿)−1
𝑿′𝑾(𝒌+𝟏)𝑧(𝑘+1)
Iterasi dilakukan hingga mendapatkan parameter yang konvergen
atau sampai diperoleh | �̂�(𝑡) − �̂�(𝑡−1)| < 𝜀.
Contoh dari model khusus Poisson GARMA (𝑝, 𝑞) sebagai
berikut:
40
1. Model Poisson GARMA (𝟏, 𝟎)
Pada model Poisson GARMA (1,0), persamaan (4.3) akan
menjadi sebagai berikut:
ln(𝜇𝑡) = 𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ } +
1
𝑗=1
∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
0
𝑗=1
ln(𝜇𝑡) = 𝛽0 + 𝜙1{ln 𝑦𝑡−1∗ }
(4.7)
jika pada persamaan (4.5) dijabarkan untuk 𝑡 = 1, 2, … , 𝑇, maka
menjadi:
ln(𝜇1) = 𝛽0 + 𝜙1{ln𝑦0∗}
ln(𝜇2) = 𝛽0 + 𝜙1{ln𝑦1∗}
ln(𝜇3) = 𝛽0 + 𝜙1{ln𝑦2∗}
⋮
ln(𝜇𝑇) = 𝛽0 + 𝜙1{ln 𝑦𝑇−1∗ }
𝜇𝑡 = exp(𝛽0 + 𝜙1{ln𝑦𝑡−1∗ })
(4.6)
dari persamaan diatas dapat dibentuk dalam bentuk matriks
sebagai berikut:
[ ln(𝜇1)
ln(𝜇2)
ln(𝜇3)⋮
ln(𝜇𝑇)]
=
[ 1 ln 𝑦0
∗
1 ln 𝑦1∗
1 ln 𝑦2∗
⋮ ⋮1 ln 𝑦𝑇−1
∗ ]
[𝛽0
𝜙1]
dari matriks diatas dapat dilihat bahwa parameter 𝛽0 dan 𝜙1 adalah
parameter yang dicari.
2. Model Poisson GARMA (𝟎, 𝟏)
Dengan langkah yang sama seperti sebelumnya, persamaan
(4.3) pada Persamaan model Poisson GARMA (0,1) menjadi
sebagai berikut :
41
ln(𝜇𝑡) = 𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ } +
0
𝑗=1
∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
1
𝑗=1
ln(𝜇𝑡) = 𝛽0 + ∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
0
𝑗=1
Dari persamaan (4.6) dijabarkan untuk 𝑡 = 1, 2, … , 𝑇 yaitu
sebagai berikut :
ln(𝜇1) = 𝛽0 + 𝜃1 {ln 𝑦0
∗
𝜇0}
ln(𝜇2) = 𝛽0 + 𝜃1 {ln𝑦1
∗
𝜇1}
ln(𝜇3) = 𝛽0 + 𝜃1 {ln𝑦2
∗
𝜇2}
⋮
ln(𝜇𝑇) = 𝛽0 + 𝜃1 {ln𝑦𝑇−1
∗
𝜇𝑇−1}
𝜇𝑡 = exp(𝛽0 + 𝜃1{ln 𝑦𝑡−1∗ /𝜇𝑡−1})
Selanjutnya, persamaan diatas dapat dibentuk dalam bentuk
matriks sebagai berikut :
[ ln(𝜇1)
ln(𝜇2)
ln(𝜇3)⋮
ln(𝜇𝑇)]
=
[ 1 ln 𝑦0
∗ /𝜇0
1 ln 𝑦1∗/𝜇1
1 ln 𝑦2∗/𝜇2
⋮ ⋮1 ln 𝑦𝑇−1
∗ /𝜇𝑇−1]
[𝛽0
𝜃1]
sehingga dari matriks diatas dapat dilihat bahwa parameter 𝛽0 dan
𝜃1 adalah parameter yang dicari.
42
3. Poisson GARMA (𝟏, 𝟏)
Selanjutnya untuk model Poisson GARMA(1,0), persamaan
(4.3) akan menjadi sebagai berikut :
ln(𝜇𝑡) = 𝛽0 + ∑𝜙𝑗{ln 𝑦𝑡−𝑗∗ } +
1
𝑗=1
∑𝜃𝑗 {ln 𝑦𝑡−𝑗
∗
𝜇𝑡−𝑗}
1
𝑗=1
ln(𝜇𝑡) = 𝛽0 + 𝜙1{ln 𝑦𝑡−1∗ } + 𝜃1 {
ln 𝑦𝑡−1∗
𝜇𝑡−1} (4.9)
Jika persamaan (4.8) dijabarkan untuk 𝑡 = 1, 2, … , 𝑇, menjadi :
ln(𝜇1) = 𝛽0 + 𝜙1{ln𝑦0∗} + 𝜃1 {
ln 𝑦0∗
𝜇0}
ln(𝜇2) = 𝛽0 + 𝜙1{ln𝑦1∗} + 𝜃1 {ln
𝑦1∗
𝜇1}
ln(𝜇3) = 𝛽0 + 𝜙1{ln𝑦2∗} + 𝜃1 {ln
𝑦2∗
𝜇2}
⋮
ln(𝜇𝑇) = 𝛽0 + 𝜙1{ln 𝑦𝑇−1∗ } + 𝜃1 {ln
𝑦𝑇−1∗
𝜇𝑇−1}
𝜇𝑡 = exp(𝛽0 + 𝜙1{ln𝑦𝑡−1∗ } + 𝜃1 {ln
𝑦𝑡−1∗
𝜇𝑡−1})
dengan cara yang sama seperti sebelumnya, persamaan diatas
dibentuk dalam bentuk matriks sebagai berikut :
[ ln(𝜇1)
ln(𝜇2)
ln(𝜇3)⋮
ln(𝜇𝑇)]
=
[ 1 ln 𝑦0
∗ ln 𝑦0∗ /𝜇0
1 ln 𝑦1∗ ln 𝑦1
∗/𝜇1
1 ln 𝑦2∗ ln 𝑦2
∗/𝜇2
⋮ ⋮ ⋮1 ln 𝑦𝑇−1
∗ ln 𝑦𝑇−1∗ /𝜇𝑇−1]
[
𝛽0
𝜙1
𝜃1
]
43
sehingga dapat dilihat bahwa parameter yang dicari untuk model
Poisson GARMA (1,1) adalah 𝛽0, 𝜙1, 𝜃1.
4.2. KAJIAN TERAPAN
Pada kajian ini dibahas mengenai estimasi paramater dan
peramalan model Poisson GARMA (𝑝, 𝑞) dengan
mengaplikasikan pada data jumlah kejadian kecelakaan di jalan tol
Surabaya-Gempol ruas Waru-Sidoarjo. Langkah yang harus
dilakukan yaitu menentukan model terbaik dari data yang
kemudian dilanjutkan dengan mengestimasi parameter dan
mendapatkan hasil peramalan. Dalam memilih model terbaik
Poisson GARMA (𝑝, 𝑞) diperoleh berdasarkan hasil identifikasi
awal dari model ARIMA.
4.2.1. Identifikasi Model
Untuk memperoleh identifikasi model Poisson GARMA
(𝑝, 𝑞), tahap pertama yang dilakukan adalah melihat plot time
series dari data yang bertujuan untuk melihat apakah data tersebut
sudah stasioner dalam varian maupun mean. Jika data belum
stasioner terhadap varian maka harus dilakukan transformasi.
Sedangkan jika data belum stasioner terhadap mean harus
dilakukan differencing. Plot data time series untuk data jumlah
kecelakaan di jalan Tol Surabaya-Gempol ruas Waru-Sidoarjo
yang selanjutnya disebut dengan data observasi Y dapat dilihat
pada Gambar 4.1. Identifikasi model yang dilakukan untuk uji
stasioneritas terhadap varian dan mean ini dilakukan dengan
menggunakan software minitab.
Dari Gambar 4.1 terlihat bahwa data belum stasioner terhadap
varian maupun rata-rata. Selanjutnya langkah pertama yang harus
44
dilakukan adalah melakukan stasioneritas data terhadap varian.
Untuk uji stasioneritas data dalam varian dapat dilihat pada
transformasi Box-Cox.
Data dikatakan stasioner jika rounded value-nya adalah 1.
Plot Transformasi Box-Cox dari data jumlah kejadian kecelakaan
di jalan Tol Surabaya-Gempol ruas Waru-Sidoarjo dapat dilihat
pada Gambar 4.2. Terlihat pada Gambar 4.2 menunjukkan nilai λ
dengan nilai kepercayaan 95% berada diantara 0,26 dan 0,80,
dengan nilai estimate sebesar 0,52 dan rounded value sebesar
0.50. Hal ini menunjukkan bahwa data masih belum stasioner
terhadap varian karena nilai rounded value-nya tidak sama dengan
1 sehingga dilakukan Transformasi kedua yang dapat dilihat pada
Gambar 4.3. transformasi data digunakan sesuai dengan 𝜆 yang
dihasilkan. Karena 𝜆 bernilai 0.50 maka proses transformasi
dilakukan sesuai dengan Tabel. 2.1 yaitu dengan rumus 𝑦∗ = √𝑦𝑡.
Gambar 4. 1 Plot Data Time Series
45
Pada Gambar 4.3. menunjukkan nilai λ berada diantara 0,57
dan 1,60, dengan nilai estimate sebesar 1,04 dan rounded value
sebesar 1,00. Hal ini menunjukkan bahwa data sudah stasioner
terhadap varian karena nilai rounded value-nya sama dengan 1.
Gambar 4. 2 Transformasi Box-Cox 1
Gambar 4. 3 Transformasi Box-Cox 2
46
Selanjutnya dilakukan uji stasioneritas terhadap mean dengan
menggunakan plot ACF. Data yang digunakan untuk plot ACF
adalah data hasil transformasi. Pada Gambar 4.4 Terlihat bahwa
plot ACF memiliki pola tentative karena tidak ada lag yang keluar
dari significant limit sehingga dapat dikatakan bahwa plot ACF
telah memenuhi asumsi stasioneritas terhadap varians dan mean.
Langkah selanjutnya adalah mengidentifikasi plot PACF dapat
dilihat seperti pada Gambar 4.5.
Pada Gambar 4.5. terlihat bahwa tidak ada lag yang keluar
dari significant limit. Dengan melihat pola ACF serta PACF diatas
maka dapat disimpulkan d bernilai 0 karena tidak perlu proses
differencing sehingga didapat model awal ARIMA(1, 0, 1) atau
dapat ditulis dalam bentuk ARMA (1,1). Dari model awal tersebut
tidak menutup kemungkinan terdapat model lain dari ARMA yang
terbentuk. Kemungkinan yang didapat dari model awal tersebut
yaitu ARMA (1, 1), ARMA(1, 0), dan ARMA(0, 1).
Gambar 4. 4 Plot ACF Hasil Data Transformasi 𝑦∗
47
4.2.1. Estimasi dan Pengujian Parameter
Pada langkah ini akan dilakukan estimasi parameter terhadap
kemungkinan model ARMA yang terbentuk dengan menggunakan
software Minitab dilanjutkan dengan uji signifikasi parameter. Uji
signifikasi parameter model ARMA(1,1) menggunakan uji-𝑡 dapat
dilihat pada Tabel 4.1.
Tabel 4. 1 Parameter ARMA (1,1)
Parameter coef SE T P
𝜙1 0,8708 0,1588 5,48 0,000
𝜃1 0,9613 0,1268 7,58 0,000
Uji signifikansi parameter berdasarkan persamaan (2.14):
Uji Parameter 𝝓𝟏
Hipotesis:
𝐻0 ∶ 𝜙1 = 0 (parameter 𝜙1 tidak signifikan)
𝐻1 ∶ 𝜙1 ≠ 0 (parameter 𝜙1 signifikan)
Gambar 4. 5 Plot PACF Hasil Data Transformasi 𝑦∗
48
Statistik uji:
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 𝜙1̂
𝑆𝐸 (𝜙1)
= 0.8708
0,1588
= 5,4836
Dengan tabel distribusi 𝑡 diperoleh:
𝑡𝑡𝑎𝑏𝑒𝑙 = 𝑡0,025;59 = 2.30004
Kriteria pengujian:
Karena |𝑡ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑡𝑡𝑎𝑏𝑒𝑙, maka 𝐻0 ditolak yang artinya parameter
model 𝝓𝟏 signifikan.
Uji Parameter 𝜽𝟏
Hipotesis:
𝐻0 ∶ 𝜃1 = 0 (parameter 𝜃11 tidak signifikan)
𝐻1 ∶ 𝜃1 ≠ 0 (parameter 𝜃1 signifikan)
Statistik uji:
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 𝜃1̂
𝑆𝐸 ( 𝜃1)=
0.9613
0,1268
= 7,5812
Dengan tabel distribusi 𝑡 diperoleh:
𝑡𝑡𝑎𝑏𝑒𝑙 = 𝑡0,025;59 = 2.30004
Kriteria pengujian:
Karena |𝑡ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑡𝑡𝑎𝑏𝑒𝑙, maka 𝐻0 ditolak yang artinya parameter
model 𝜃1 signifikan.
Dapat dilihat bahwa 𝜙1 dan 𝜃1 signifikan, sehingga model
ARMA (1,1) merupakan model yang signifikan. Selanjutnya
dilakukan tahap cek diagnostik yang meliputi uji asumsi residual
white noise dan uji asumsi residual berdistribusi normal.
49
a. Uji Asumsi residual white noise
Berdasarkan persamaan (2.15) uji residual white noise yaitu:
Hipotesa:
𝐻0 ∶ 𝜌1 = 𝜌2 = ⋯ = 𝜌𝑘 = 0
𝐻1 : Minimal ada satu 𝜌𝑖 yang tidak sama dengan nol, 𝑖 =
1,2, . . 𝑘. Statistika Uji:
𝑄 = 𝑛(𝑛 + 2) ∑(�̂�𝑘)
2
𝑛 − 𝑘, 𝑛 > 𝑘.
𝐾
𝑘=1
Untuk 𝐾 = 6 maka diperoleh:
𝑄 = 60(60 + 2) ∑(�̂�𝑘)2
60 − 𝑘, 𝑛 > 𝑘.
𝐾
𝑘=1
𝑄 = 60(62) ((0.595087127)2
60 − 1
+(0.633499190)2
60 − 2
+ ⋯+(0.6334991)12
60 − 12)
𝑄 = 19.58424261
𝜒2(𝛼;𝐾 − 𝑝 − 𝑞) = 𝜒2(0.05; 12 − 1 − 0)
= 𝜒2(0.05; 11) = 19.675
Kriteria Uji:
Karena 𝑄 < 𝜒2(𝛼; 𝐾 − 𝑝 − 𝑞), maka 𝐻0 diterima, artinya
residual white noise.
b. Uji Asumsi residual white noise
Berdasarkan persamaan (2.16) uji residual berdistribusi
normal yaitu:
Hipotesa :
𝐻0 ∶ 𝐹(𝑥) = 𝐹0(𝑥) (residual berdistribusi normal)
50
𝐻1 ∶ 𝐹(𝑥) ≠ 𝐹0(𝑥) (residual tidak berdistribusi normal)
Statistik uji :
𝐷ℎ𝑖𝑡𝑢𝑛𝑔 = 2,058
𝐷𝑡𝑎𝑏𝑒𝑙 = 𝐷0,95,58 = 0,684
Kriteria uji :
Karena uji 𝐷ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐷𝑡𝑎𝑏𝑒𝑙, Maka 𝐻0 ditolak dan
disimpulkan residual tidak berdisribusi normal.
c. Overfitting
Pada tahap ini akan dilakukan pencarian dan pendeteksian
model ARMA yang memenuhi syarat signifikasi parameter dan
memenuhi uji asusmsi residual sebagai syarat utama model ARMA
yang dapat digunakan. Hasil overfitting dapat dilihat pada Tabel
4.2.
Tabel 4. 2 Hasil Overfitting Model ARMA
Model ARMA Parameter 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 Keputusan
(1,1) 𝜙1 = 0.8708 5,48 Signifikan
𝜃1 = 0.9613 7,58 Signifikan
(1,0) 𝜙1 = −0.119 −0,09 Tidak
Signifikan
(0,1) 𝜃1 = 0.01334 0,10 Tidak
Signifikan
Pada Tabel 4.2 dijelaskan mengenai hasil uji signifikasi
terhadap tiga model ARMA sementara, terlihat bahwa diantara tiga
model yang ada setelah melakukan proses overfitting, hanya satu
model ARMA sementara yang memenuhi signifikasi dalam
parameter, dengan syarat jika |𝑡ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑡𝑡𝑎𝑏𝑒𝑙 maka parameter
51
dalam model signifikan sehingga satu model yang signifikan
tersebut dilanjutkan pada pengujian diagnostik untuk menentukan
model terbaik yang dapat dilihat pada Tabel 4.3.
Tabel 4. 3 Uji Asumsi Residual
Model
ARMA White Noise Normal
(1,1) YA TIDAK
Berdasarkan pada Tabel 4.3 Model ARMA(1,1) memenuhi
uji asumsi residual white noise namun tidak memenuhi uji asumsi
residual berdistribusi normal. Karena model ARMA(1,1) tidak
memenuhi uji asumsi residual berdistribusi normal maka perlu
mendeteksi outlier pada residual ARMA(1,1). Dengan model
ARMA (1,1) sebagai berikut:
𝑌𝑡∗ = ∅1 + ∅1𝑌𝑡−1 + 𝜃1𝑒𝑡−1 + 𝑒𝑡
𝑌𝑡∗ = 0,196955 + 0,8708𝑌𝑡−1 − 0,9613𝑒𝑡−1 (4.11)
Gambar 4. 6 Outlier X1
52
Dengan meregresikan model ARMA(1,1) dengan outlier
didapatkan persaman dengan outlier pada residual ARMA (1,1)
seperti pada Gambar 4.6.
𝑥𝑖(𝑡) = {1;0;
𝑡: 𝑡𝑒𝑟𝑗𝑎𝑑𝑖 𝑜𝑢𝑡𝑙𝑖𝑒𝑟𝑡: 𝑦𝑎𝑛𝑔 𝑙𝑎𝑖𝑛
(4.12)
dengan 𝑡 untuk terjadi outlier adalah 7, 8, 9, 12, 21, 22, 27, 28, 29, 32, 36, 41, 44, 45, 41, 48, 57, 60. Selanjutnya
persamaan (4.11) diregresikan dengan outlier (4.12) yang
terdeteksi dari resiudal ARMA(1,1) sehingga diperoleh persamaan
(4.13) dengan hasil estimasi parameter ditunjukan pada Tabel 4.4.
Tabel 4. 4 Estimasi Parameter ARMA (1,1) dengan Outlier
Predictor Coef SE Coef T
∅0 5,819 1,067 5,45
∅1 -3,7860 0,8690 -4,36
𝜃1 1,6776 0,3849 4,36
𝛽1 -1,0310 0,2444 -4,22
diperoleh persamaan sebagai berikut:
𝑌𝑡∗𝑡= ∅0 + ∅1𝑌𝑡−1 + 𝜃1𝑒𝑡−1 + 𝛽1𝑥1(𝑡) + 𝑒𝑡
𝑌𝑡∗ = 5,82 − 3,79 𝑦𝑡−1 + 1,8 𝑦𝑡−1 − 1,03𝑥1(𝑡) (4.13)
Pengujian signifikansi paameter untuk model ARMA (1,1) dengan
outlier sebagai berikut:
1. Uji serentak
Pengujian serentak digunakan untuk menguji pengaruh
variabel prediktor secara bersama sama terhadap variabel respon.
Hipotesa :
𝐻0: 𝛽1 = 0
𝐻1: 𝛽𝑖 ≠ 0
53
Statistik uji :
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 =1,2255
0,1846= 6,64
𝐹0.05,3,55 = 2,772537
Kriteria uji :
𝐻0 akan ditolak apabila nilai statistik uji 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹0.05,2,100
sehingga disimpulkan variabel prediktor berpengaruh signifikan
terhadap variabel respon. Tabel ANOVA dapat dilihat pada Tabel
4.5.
Tabel 4. 5 ANOVA
Source DF SS MS F
Regresi 3 3,6766 1,2255 6,64
Residual 55 10,1545 0,1846
Total 58 13,8310
2. Pengujian parsial
Pengujian parsial digunakan untuk mengetahui variabel
mana sajakah yang berpengaruh signifikan terhdap variabel
respon.
Uji parameter ∅𝟎
Hipotesa :
𝐻0: ∅0 = 0
𝐻1: ∅0 ≠ 0
Statistik uji :
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =1,007
5,819= 5,45
𝑡0.25,58 = 1,162629
54
Kriteria uji :
Karena |𝑇ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑇0.25,100, maka 𝐻0 ditolak, sehingga ∅0
signifikan terhadap variabel prediktor.
Uji parameter ∅𝟏
Hipotesa :
𝐻0: ∅1 = 0
𝐻1: ∅1 ≠ 0
Statistik uji :
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =−3,7860
0,8690= −4,36
𝑡0.25,58 = 1,162629
Kriteria uji :
Karena |𝑇ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑇0.25,100, maka 𝐻0 ditolak, sehingga ∅1
signifikan terhadap variabel prediktor.
Uji parameter 𝜽𝟏
Hipotesa :
𝐻0: 𝜽𝟏 = 0
𝐻1: 𝜽𝟏 ≠ 0
Statistik uji :
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =1,6776
0,3849= 4,36
𝑡0.25,58 = 1,162629
Kriteria uji :
Karena |𝑇ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑇0.25,100, maka 𝐻0 ditolak, sehingga 𝜽𝟏
signifikan terhadap variabel prediktor.
55
Uji parameter 𝜷𝟏
Hipotesa :
𝐻0: 𝜷𝟏 = 0 𝐻1: 𝜷𝟏 ≠ 0
Statistik uji :
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =−1,0310
0,2444= −4,22
𝑡0.25,58 = 1,162629
Kriteria uji :
Karena |𝑇ℎ𝑖𝑡𝑢𝑛𝑔| > 𝑇0.25,100, maka 𝐻0 ditolak, sehingga 𝜷𝟏
signifikan terhadap variabel prediktor.
3. Pengujian normalitas residual
Hipotesa :
𝐻0 ∶ 𝐹(𝑥) = 𝐹0(𝑥) (residual berdistribusi normal)
𝐻1 ∶ 𝐹(𝑥) ≠ 𝐹0(𝑥) (residual tidak berdistribusi normal)
Statistik uji :
𝐷ℎ𝑖𝑡𝑢𝑛𝑔 = 0,058
𝐷𝑡𝑎𝑏𝑒𝑙 = 𝐷0,95,58 = 0,684
Kriteria uji :
Karena uji 𝐷ℎ𝑖𝑡𝑢𝑛𝑔 < 𝐷𝑡𝑎𝑏𝑒𝑙, Maka 𝐻0 diterima dan
disimpulkan residual berdistribusi normal.
Hasil uji normal dengan minitab dapat dilihat pada Gambar
4.7. Setelah dilakukan deteksi outlier, untuk mendapatkan model
terbaik dengan penanganan outlier, maka pada ARMA
ditambahkan variable dummy hasil deteksi outlier. Selanjutnya
dapat ditentukan pemilihan model terbaik, karena pada model
ARMA (1,1) sudah memenuhi uji signifikansi parameter dan uji
56
asumsi residual maka model terbaik yang dapat dipilih adalah
ARMA (1,1).
Sesuai dengan yang telah dijelaskan sebelumnya bahwa
model Poisson GARMA (𝑝, 𝑞) diperoleh dari identifikasi model
ARMA (𝑝, 𝑞). Hasil overfitting pada model ARMA (𝑝, 𝑞) yaitu
ARMA (1,1), sehingga orde 𝑝 = 1 dan 𝑞 = 1 digunakan pada
model Poisson GARMA (𝑝, 𝑞) yaitu menjadi Poisson
GARMA(1,1).
Pada subbab 4.1 telah diberikan contoh mengenai estimasi
Poisson GARMA (1,1) dengan diperoleh persamaan (4.9) yang
kemudian dibentuk matriks sebagai berikut:
[ ln(𝜇1)
ln(𝜇2)
ln(𝜇3)⋮
ln(𝜇𝑇)]
=
[ 1 ln 𝑦0
∗ ln 𝑦0∗ /𝜇0
1 ln 𝑦1∗ ln 𝑦1
∗/𝜇1
1 ln 𝑦2∗ ln 𝑦2
∗/𝜇2
⋮ ⋮ ⋮1 ln 𝑦𝑇−1
∗ ln 𝑦𝑇−1∗ /𝜇𝑇−1]
[
𝛽0
𝜙1
𝜃1
]
Gambar 4. 7 Residual dengan Deteksi Outlier
57
dengan 𝑡 = 1,2,3, . . . , 𝑇. sehingga dapat dilihat bahwa parameter
yang dicari untuk model Poisson GARMA(1,1) adalah 𝛽0, 𝜙1, 𝜃1.
Dengan inisialisasi orde 𝑝 = 1 dan 𝑞 = 1 didapatkan hasil
estimasi model Poisson GARMA (1,1) dengan menggunakan
iterasi algoritma IRLS yang dapat dilihat pada Tabel 4.6.
Tabel 4. 6 Estimasi Parameter Model Poisson GARMA (1,1)
Poisson
GARMA
(1,1
Parameter 𝑆𝐸 Keputusan
𝛽0=-5,627 0,000 Signifikan
𝜙1 =0,980 0,000 Signifikan
𝜃1 = -1,359 0,097 Signifikan
Berdasarkan Tabel 4.6 diperoleh persamaan model Poisson
GARMA (1,1) untuk Jumlah Kejadian Kecelakaan di Jalan Tol
Surabaya-Gempol Ruas Waru-Sidoarjo sebagai berikut:
[ ln(𝜇1)
ln(𝜇2)
ln(𝜇3)⋮
ln(𝜇𝑇)]
=
[ 1 ln 𝑦0
∗ ln 𝑦0∗ /𝜇0
1 ln 𝑦1∗ ln 𝑦1
∗/𝜇1
1 ln 𝑦2∗ ln 𝑦2
∗/𝜇2
⋮ ⋮ ⋮1 ln 𝑦𝑇−1
∗ ln 𝑦𝑇−1∗ /𝜇𝑇−1]
[5,6270,980
−1,359]
dengan persamaan model:
𝜇𝑡 = exp (5,627 + 0,9801{ln 𝑦𝑇−1∗ } − 1,3591 {ln
𝑦𝑇−1∗
𝜇𝑇−1}) (4.10)
Persamaan (4.10) digunakan untuk melakukan peramalan 8
bulan kedepan. Untuk mengetahui ada tidaknya kecocokan
(Goodness of fit) antara frekuensi yang teramati (terobservasi)
dengan frekuensi harapan digunakan uji devian dengan
menggunakan persamaan (2.22) dan dengan bantuan software
Matlab R2013a diperoleh hasil pada Tabel 4.7.
58
Tabel 4. 7 Uji Gododness of fit
Model Poisson
GARMA Devian 𝜒𝛼,𝑛−𝑝−𝑞
2
(1,1) 12,932771 76,7778
Hipotesis:
𝐻0 ∶ 𝜇𝑡 = 𝜇 (𝑥𝑡; 𝜷), untuk 𝑡 = 1,2,3, . . .,
𝐻1 ∶ 𝜇𝑡 ≠ 𝜇 (𝑥𝑡; 𝜷)
Statistik uji :
𝐷 = 2{𝑙(𝑦; 𝑦) − 𝑙(𝜇�̂�; 𝑦}
Kriteria pengujian:
𝐻0 akan ditolak jika 𝐷 > 𝜒𝛼,𝑛−𝑝−𝑞2 . Dengan melihat tabel 4.7
didapatkan bahwa 𝐷 < 𝜒𝛼,𝑛−𝑝−𝑞2 sehingga 𝐻0 diterima dan model
dapat dikatakan memenuhi uji devian atau model memenuhi uji
kesesuaian.
4.2.2. Peramalan Model Poisson GARMA (𝒑, 𝒒)
Peramalan model Poisson GARMA(1,1) dilakukan dengan
menggunakan software Matlab. Pada peramalan model Poisson
GARMA ini digunakan 60 data sebagai in-sample dan 8 data
sebagai out-sample. Hasil peramalan dari data jumlah kecelakaan
dijalan tol Surabaya-Gempol ruas Waru-Sidoarjo dapat dilihat
pada Tabel 4.8.
Terlihat dari Gambar 4.8, peramalan dengan menggunakan
Poisson GARMA(1,1) mendekati data aktual. Hasil peramalan
masih berupa rata-rata kejadian, sehingga perlu dilakukan
transformasi dari hasil peramalan yang berupa nilai rata-rata
menjadi nilai yang berupa data respon (count).
59
Tabel 4. 8 Perbandingan Data Actual dan Hasil Peramalan
Actual Forecasting
Poisson GARMA
2 2,0677
2 2,094
3 2,456
0 0,122
1 0,892
0 0,121
1 0,77
0 0,015
AIC 763,9005747
Grafik data aktual dengan hasil peramalan dapat dilihat pada
Gambar 4.8
Gambar 4. 8 Plot Data Actual dan Hasil Peramalan
60
61
BAB V
PENUTUP
5.1. KESIMPULAN
Berdasarkan analisis dan pembahasan, dapat disimpulkan
bahwa :
1. Estimasi parameter model Poisson GARMA (𝑝, 𝑞)
dilakukan dengan menggunakan metode MLE karena
diasumsikan mengikuti suatu distribusi eksponensial.
karena metode MLE menghasilkan bentuk yang tidak
close form dilakukan optimasi Algoritma IRLS sampai
parameter tersebut konvergen. Algoritma IRLS untuk
menentukan estimasi 𝜸 sebagai berikut:
�̂�(𝑘+1) = (𝑿′𝑾(𝒌+𝟏)𝑿)−1
𝑿′𝑾(𝒌+𝟏)𝑧(𝑘+1)
2. Hasil aplikasi Model Poisson GARMA yang diterapkan
pada data jumlah kejadian kecelakaan dijalan Tol
Surabaya-Gempol ruas Waru-Sidoarjo dibangun melalui
identifikasi model terbaik ARMA yang kemudian
diperoleh model Poisson GARMA (1,1) dengan
persamaan sebagai berikut:
𝜇𝑡 = exp( 5,627 + 0,9801{ln 𝑦𝑇−1∗ } − 1,3591 {ln
𝑦𝑇−1∗
𝜇𝑇−1
})
dengan hasil estimasi parameter yaitu parameter konstanta
𝛽0 sebesar -5,627, parameter AR sebesar 0,980, dan
parameter MA sebesar -1,359.
5.2. SARAN
Untuk pengembangan penelitian selanjutnya diberikan
saran sebagai berikut :
1. Data yang digunakan dalam penelitian ini merupakan data
suatu kejadian yang jarang terjadi yaitu bersifat jumlahan
62
(count) dimana nilainya adalah diskrit non negatif.
Namun, dari hasil peramalan yang diperoleh masih berupa
data mean (nilainya berbentuk desimal) sehingga perlu
dilakukan suatu pembalikan data agar menghasilkan
kembali data peramalan yang berupa data respon 𝑐𝑜𝑢𝑛𝑡.
2. Pada penelitian ini tidak melibat variabel prediktor
sehingga diharapkan pada penelitian selanjutnya dapat
melibatkan variabel prediktor agar dapat mengahasilkan
akurasi peramalan yang lebih baik.
63
DAFTAR PUSTAKA
[1] S. Halim, Diktat - Time Series Analysis Prakata, no.
January. Surabaya: UK.Petra, 2006.
[2] V. Jowaheer, N. Ali, M. Khan, dan Y. Sunecher,
Poisson Autoregressive and Moving-Average Models
for Forecasting Non-stationary Seasonal Time Series of
Tourist Counts in Mauritius, no. 1988, 2008.
[3] E. R. Walpolle, Pengantar Statistika, Edisi Ketiga,
Cetakan ke. Jakarta: Gramedia Pustaka Utama, 1995.
[4] C. Cameroon dan P. Trivedi, Regression Analysis of
Count Data. New York, 1998.
[5] M. Cullagh dan Nelder, Generalized Linier Models, 2nd
ed. London: Chapman and Hall, 1998.
[6] B. Irawati, Regression ( GPR ) dan Regresi Binomial
Negatif, vol. 2, no. 2, hal. 13–24, 2012.
[7] M. A. Benjamin, R. A. Rigby, D. M. Stasinopoulos, M.
A. Benjamin, R. A. Rigby, dan D. M. Stasinopoulos,
Journal of the American Statistical Association
Generalized Autoregressive Moving Average Models
Average Models,no. October 2014, hal. 37–41, 2011.
[8] Asrirawan, Generalized Seosonal Autoregressive and
Moving Average For Forecasting The Number of
Dengue Hemorrhagic Fever (DHF) Patrient in
Surabaya, no. February 2016, 2014.
[9] wainkelmann, University of Zurich, vol. 4, no. 3, 1994.
[10] R. Inayah, Pemodelan Jumlah Kasus Kanker Serviks di
Jawa Timur Menggunakan Analisis Generalized
Poisson Regression GPR, Surabaya, 2012.
[11] W. William, Time Series Analysis : Univariate and
64
Multivariate Methods, 2nd ed. Greg Tobin, 2006.
[12] K. Fokianos dan B. Kedem, Prediction and
Classification of Non-stationary Categorical Time
Series *,” vol. 296, hal. 277–296, 1998.
[13] B. Kedem dan K. Fokianos, Regression Models for
Time Series Analysis. New Tork, 2002.
[14] F. A. Widjajati, M. D. Saputri, dan N. Asiyah, Sifat-sifat
Generalisasi Distribusi, no. 1, hal. 13–22, 1829.
[15] A. Melliana, Y. Setyorini, H. Eko, dan E. Al, The
Comparison Of Generalized Poisson Regression and
Negative Binomial Reression Methods in Overcoming
Overdispersion, Int. J. Sci. Technol. Res., vol. 2, no. 8,
hal. 255–258, 2013.
[16] B. Silveira, M. Andrade, dan R. Ehlers, Bayesian
GARMA models for count data, Commun. Stat. Case
Stud. Data Anal. Appl., vol. 1, no. 4, hal. 192–205,
2015.
65
LAMPIRAN 1
Data Jumlah Kejadia Kecelakaan di Jalan Tol Surabaya
Gempol ruas Waru Sidoarjo
Bulan TAHUN
2012 2013 2014 2015 2016 2017
JANUARI 2 1 1 2 1 2
FEBRUARI 2 2 1 2 2 2
MARET 1 1 3 1 0 3
APRIL 1 2 0 1 1 0
MEI 2 1 0 0 3 1
JUNI 1 2 2 1 3 0
JULI 0 2 1 1 2 1
AGUSTUS 0 1 4 0 2 0
SEPTEMBER 4 3 2 4 4
OKTOBER 2 0 1 2 2
NOVEMBER 2 1 2 2 2
DESEMBER 0 2 0 0 3
66
LAMPIRAN 2
Source Code Algoritma IRLS
clc
format long
x=xlsread('dataku.xlsx','Sheet1','B:B');
y=xlsread('dataku.xlsx','Sheet1' ,'C:C');
q=xlsread('dataku.xlsx','Sheet1','D:D');
iterasi=1;
for i=1:length(x)
X(i,1)=1;
X(i,2)=log(y(i));
X(i,3)=log(y(i))-log(q(i));
if X(i,2)==0
X(i,2)=0.1;
end
if X(i,3)==0
X(i,3)=0.1;
end
end
for i=1:length(y)
Y(i,1)=1;
Y(i,1)=log(y(i));
if Y(i,1)==0;
Y(i,1)=0.1;
end
end
67
lanjutan lampiran 2
B0=inv(transpose(X)*X)*transpose(X)*Y;
for i=1:length(y)
Beta0(i,1)=B0(1);
end
for i=1:length(y)
S(i,1)=1;
S(i,1)=log(y(i))-log(q(i));
if S(i,1)==0;
S(i,1)=0.1;
end
end
chi0 = B0(2);
teta0 = B0(3);
M = Beta0+chi0*Y+teta0*S;
for i=1:length(M)
Mo(i,1)=exp(M(i));
end
for i=1:length(Mo)
for j=1:length(Mo)
if i==j
W(i,j)=Mo(i);
else
W(i,j)=0;
end
end
68
lanjutan lampiran 2
end
eta=X*B0;
for i=1:length(x)
z(i,1)=eta(i)+((x(i)-Mo(i))/Mo(i));
end
B1=inv(transpose(X)*W*X)*transpose(X)*W*z;
disp(['ITERASI KE-',num2str(iterasi)])
disp(['Beta',num2str(iterasi-1),' = ',num2str(Beta0(1))])
disp(['chi',num2str(iterasi-1),' = ',num2str(chi0)])
disp(['teta',num2str(iterasi-1),' = ',num2str(teta0)])
disp(['Beta',num2str(iterasi),' = ',num2str(B1(1))])
disp(['chi',num2str(iterasi),' = ',num2str(B1(2))])
disp(['teta',num2str(iterasi),' = ',num2str(B1(3))])
epsilon=10^-5;
while epsilon <= abs(B1(1)-Beta0(1))
iterasi = iterasi+1;
for i=1:length(y)
Beta0(i,1)=B1(1);
end
chi0 = B1(2);
teta0 = B1(3);
M = Beta0+chi0*Y+teta0*S;
for i=1:length(M)
69
lanjutan lampiran 2
Mo(i,1)=exp(M(i));
end
for i=1:length(Mo)
for j=1:length(Mo)
if i==j
W(i,j)=Mo(i);
else
W(i,j)=0;
end
end
end
eta=X*B1;
for i=1:length(x)
z(i,1)=eta(i)+((x(i)-Mo(i))/Mo(i));
end
B1=inv(transpose(X)*W*X)*transpose(X)*W*z
disp('============================')
disp(['ITERASI KE-',num2str(iterasi)])
disp(['Beta',num2str(iterasi),' = ',num2str(B1(1))])
disp(['chi',num2str(iterasi),' = ',num2str(B1(2))])
disp(['teta',num2str(iterasi),' = ',num2str(B1(3))])
end
70
LAMPIRAN 3
Source Code Hasil Peramalan
clear;close all
p = 1;
q = 1;
eStep = 0;
h = 1;
labels = {'intercept ';'cos(2pt/12)';'sin(2pt/12)';'cos(2pt/6)
';'sin(2pt/6) '};
x=xlsread('dataku.xlsx','2','B2:F69');
y=xlsread('dataku.xlsx','1','C2:C69');
[b1,Se1] = garmafit(x,y,p,q,dist,h,eStep);
disp('Table 1 GARMA model parameters')
disp( sprintf(' MODEL Est. Std Error.'))
m = size(x,2);
for i=1:m
disp(sprintf('%s: %2.3f %2.3f',[labels{i}],[b1(i)
Se1(i)]) )
end
for j=1:p
disp(sprintf('Autoregressive %i: %2.3f %2.3f',[j
b1(m+j) Se1(m+j)]))
end
71
lanjutan lampiran 3
for k=1:q
disp(sprintf('Moving-average %i: %2.3f %2.3f',[k
b1(i+p+k) Se1(i+p+k)]))
lanjutan lampiran 2
end
[yHat1,times1,dev1,RMSE,SS,res] =
garmaval(b1,x,y,p,q,dist,h,eStep);
nTrain = 60; training data
tTrain = 60:68 ;
xPre = x(tTrain,:);
yPre = y(tTrain);
tTest = 60:68;
xTest = x(tTest,:);
yPost = y(tTest);
[b2,Se2] = garmafit(xPre,yPre,p,q,dist,h,eStep);
[yHatPre,timesPre,devPre,RMSEpre,SSpre] =
garmaval(b2,xPre,yPre,p,q,dist,h,eStep);
[yHatPost,timesPost,devPost,RMSEpost,SSpost] =
garmaval(b2,xTest,yPost,p,q,dist,h,eStep;
figure(20), set(gcf,'name','Polio data and GARMA(2,0) fits
and forecasts')
plot([1:68], y,'ko','markersize',6,'linewidth',1.5) %
Plot actual data
hold on
plot(timesPre,yHatPre,'k-','linewidth',2)
72
lanjutan lampiran 3
plot(timesPost+nTrain-(max(p,q)+h-1),yHatPost,'k--
','linewidth',2)
xlabel('Time (Months)')
ylabel('Counts')
set(gca,'fontsize',14,'fontname','Timesnewroman')
legend('Actual','Fit','Forecast','location','northeast')
lanjutan lampiran 2
ylim([0 15])
yHatPre
devPre
RMSEpre
SSpre
yHatPost
devPost
RMSEpost
SSpos
73
BIODATA PENULIS
Agil Desti Fauzia, lahir di
Banyuwangi, 16 Desember 1996.
Pendidikan formal yang pernah
ditempuh penulis yaitu TK
Muta’alimin, SD Negeri 2 Telemung,
SMP Negeri 3 Banyuwangi, dan SMA
Negeri 1 Giri. Sekarang penulis
menempuh pendidikan S1 di
Departemen Matematika Institut
Teknologi Sepuluh Nopember dengan
bidang minat Matematika Terapan.
Selama kuliah penulis aktif mengikuti Organisasi yaitu UKM
PSHT ITS, UKM BOLA VOLI ITS, dan UKM SEPAKBOLA
ITS. Pada tahun 2015-2016 penulis aktif menjadi staff
HIMATIKA ITS, staff PSHT ITS dan Kepanitiaan OMITS.
Tahun 2016-2017 diamanahi sebagai Head of Departemen
Sport and Art Development HIMATIKA ITS, Kepala Divisi
Event UKM PSHT ITS, dan Sekretaris 2 UKM Bola Voli ITS.
Demikian biodata tentang penulis. Jika ingin memberikan
saran, kritik, dan diskusi mengenai laporan kerja praktik ini,
dapat dikirimkan melalui email [email protected] .
Terimakasih.