pendugaan model regresi binomial …. fungsi probabilitas ... c. momen dan fungsi pembangkit momen...
TRANSCRIPT
i
PENDUGAAN MODEL REGRESI BINOMIAL NEGATIF DENGAN
METODE KEMUNGKINAN MAKSIMUM
Skripsi
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Program Studi Matematika
Oleh:
Maria Ansila Bouk
NIM: 123114019
PROGRAM STUDI MATEMATIKA JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2016
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
THE ESTIMATION OF NEGATIVE BINOMIAL REGRESSION MODEL
USING MAXIMUM LIKELIHOOH METHOD
Thesis
Presented as Partial Fulfillment of the Requirements
to Obtain Sarjana Sains Degree in Mathematics
By:
Maria Ansila Bouk
Student Number: 123114019
MATHEMATICS STUDY PROGRAM, MATHEMATICS DEPARTMENT
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
2016
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SKRIPSI
PEI\IDUGAAF{ MODEL REGRESI BINOMIAL hTEGATIF DENGAN
METODE KEMT]NGKINAII MAKSIMTJM
Disusun
{.f\114019
-Y
l,n(Ir. Ig. Aris Dwiatnoko, M. Sc.) Tanggal: Agustus 2016
lu
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
SKRIPSI
PEI\DUGAAI{ MODEL REGRESI BINOMIAL I{EGATIF DENGAN
METODE KEMUNGKINAI{ MAKSIMUM
Disiapkan dan ditulis oleh:
Maria Ansila Bouk
NIM:123114019
Telah dipertahankan dihadapan Panitia Penguj i
Pada tanggal 24 Agustus 2016
Dan dinyatakan memenuhi syarat
Susunan Panitia Penguj i
Nama lengkap
Ketua
Sekretaris
Anggota
: Dr. rer. nat. Herry Pribawanto Suryawan
: Y. G. Hartono, Ph. D
: Ir. Ig. Aris Dwiatmoko, M. Sc
Yogyakart4 ZJ A3ut{.w 2016
Fakultas Sains dan Teknologi
ilversitas Sanata Dharma
Dekan
atM.Math.Sc.. Ph.D.)
IV
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
HALAMAN PERSEMBAHAN
Di dalam setiap kejadian dalam kehidupan , Tuhan selalu
mempunyai maksud dan tujuan.
Skripsi ini dipersembahkan untuk
Tuhan Yesus Kristus dan Bunda Maria yang selalu menyertai, memberkati, dan memberikan kemudahan
bagi saya lewat orang-orang yang baik hati dalam setiap perjuangan saya.
Kedua orang tua Bapa Agus dan Mama Siska
Adik-adik tercinta Lista, Nandi, Ory dan Ikun
Serta almamater yang kubanggakan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PERITYATAAI{ KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini tidak
memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalam
kutipan dan daftar pustak4 sebagaimana layaknya karya ilmiah.
Yogyakart4 15 Agustus 2016
Penulis
hr1^A/V
Maria Ansila Bouk
vl
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
ABSTRAK
Model regresi Poisson secara umum digunakan untuk menganalisis data count
yang diasumsikan berdistribusi Poisson dengan nilai rata-rata dan variansinya sama
(equidispersion). Namun, seringkali terjadi masalah nilai variansi melebihi nilai rata-
rata atau lebih dikenal dengan overdispersi sehingga model regresi Poisson tidak tepat
digunakan. Salah satu model yang dapat digunakan untuk mengatasi masalah
overdispersi adalah dengan menggunakan model regresi Binomial Negatif.
Pendugaan parameter dapat diperoleh dengan metode pendugaan kemungkinan
maksimum melalui iterasi Newton-Raphson. Data yang digunakan dalam skripsi ini
adalah data banyaknya kematian Ibu hamil di propinsi Jawa Timur tahun 2012. Dari
perhitungan mean dan variansi diketahui bahwa terjadi overdispersi sehingga data
dimodelkan menggunakan Regresi Binomial negatif. Faktor-faktor yang
mempengaruhi banyaknya kematian Ibu adalah jumlah cakupan imunisasi tetanus
Toksoid (TT2+) pada Ibu hamil , jumlah ibu hamil yang mendapatkan tablet FE1
(30 tablet) ,jumlah Ibu hamil yang mendapatkan tablet FE3 (90 tablet)
,jumlah cakupan imunisasi Tetanus Toksoid (TT-5) pada Ibu hamil ,cakupan
K1 , cakupan K4 , cakupan Ibu hamil yang ditolong nakes , dan jumlah
Ibu nifas .
Kata kunci: banyaknya kematian Ibu hamil, Regresi Poisson, Regresi Binomial
Negatif, pendugaan kemungkinan maksimum, Newton-Raphson.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
ABSTRACT
Poisson regression model is generally used to analyze the count data which
is Poisson distributed with equal mean value and variance (equidispersion). However,
the problem occurs when the variance exceeds the mean value which we called as
overdispersion so that the Poisson regression model is inappropriately used. One
model that can be used to solve the overdispersion problem is the negative binomial
regression model. The estimation of the parameters can be obtained by the Maximum
Likelihood Estimation method through Newton-Raphson iteration. The data used in
this thesis is data of the number of maternal mortality of pregnant women in East
Java province in 2012. Based on the calculation of mean and variance, it is known
that there is an overdispersion problem so that the data is modeled using negative
binomial regression. Some factors that affect the number of maternal mortality are the
number of tetanus toxoid immunization coverage (TT2 +) in pregnant women , the number of pregnant women who get FE1 tablets (30 tablets) , the number of
pregnant women who get Fe3 tablets (90 tablets) , the number of Tetanus toxoid
immunization coverage (TT-5) in pregnant women , K1 coverage , K4
coverage , the coverage of pregnant women which is assisted by the health
workers , and the number of mother postpartum . Keywords : the number of maternal mortality of pregnant, Poisson regression ,
negative binomial regression , maximum likelihood estimation , Newton -
Raphson .
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LEMBAR PER}TYATAAFT PERSETUJUAIY PI]BLIKASI KARYA ILMIAHUNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan di bawah ini, saya mahasiswa universitas sanata Dharma:Nama : Maria Ansila BoukNomer Mahasiswa :123114019
Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan
Universitas Sanata Dharma karya ilmiah yang berjudul:
PENDUGAAN MODEL REGRESI BINOMIAL NEGATIF DENGAN
METODE KEMUNGKINAIY MAKSIMUM
Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya mernberikankepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkandalam bentuk media lain, mengelolanya dalam bentuk pangkalan data,mendistribusikannya secara terbatas, dan mempublikasikannya di internet atau medialain untuk kepentingan akademis tanpa meminta ijin dari saya maupun memberikanroyalti kepada saya selama tetap mencantumkan nama saya sebagai penulis-
Demikian pemyataan ini saya buat dengan sebenarnya.
Dibuat di YogyakartaPada tanggal: 15 Agustus 2016Yang menyatakan
(Maria Ansila Bouk)
lx
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
x
KATA PENGANTAR
Puji syukur penulis haturkan ke hadirat Tuhan Yang Maha Kuasa atas segala
berkat dan penyertaanNya sehingga penulis dapat menyelesaikan skripsi dengan baik.
Skripsi yang berjudul “Pendugaan Model Regresi Binomial Negatif dengan Metode
Kemungkinan Maksimum” ini adalah salah satu syarat untuk memperoleh gelar
sarjana Matematika pada Fakultas Sains dan Teknologi. Dalam penulisan skripsi ini,
tentunya penulis telah menerima bantuan baik secara moril maupum materil dari
berbagai pihak. Oleh karena itu penulis ingin menyampaikan ucapan terima kasih
kepada:
1. Bapak Ir. Ig. Aris Dwiatmoko., M. Sc selaku dosen pembimbing yang dengan
penuh kesabaran telah memberikan bimbingan nasihat dan arahan kepada
penulis.
2. Bapak Hartono, Ph. D, selaku Ketua Program Studi yang telah memberikan
banyak bimbingan dalam hal akademik dan perkuliahan.
3. Serta bapak dan ibu dosen yang telah memberikan banyak ilmu pengetahuan
kepada penulis selama menjalani perkuliahan di Universitas Sanata Dharma.
4. Mas Susilo selaku laboran yang telah banyak membantu penulis dalam
perkuliahan terutama dalam penulisan skripsi ini.
5. Perpustakaan Universitas Sanata Dharma dan staf sekretariat Fakultas Sains
dan Teknologi yang telah memberikan fasilitas dan kemudahan pembelajaran,
serta administrasi bagi penulis selama masa perkuliahan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6.
7.
Bapa Agus dan Mama Siska yang penulis cintai dan banggakan, ade List4
Nandi, Ory dan Ikun yang telah banyak memberikan dukungan dan
pengorbanan sehingga penulis dapat menyelesaikan studi dengan baik.
Teman-teman angkatan 2012 Program studi Matematika yaitu putri, Risma,
Happy, Bobi, Tika" Ajeng, Oksi, Juli, Ferni, Arum, llg4 Lia, Noni, Dewi,
Manda , Anggun, Budi, Rian, Eg4 yang telah memberikan dukungan dan
semangat dalam perkuliahan terlebih dalam penyusunan skripsi ini.
Teman-Teman kos Cintia: Archa, Lis4 Nov4 Tia, Mb. Ela Mb. Ria Mb
Ketrin, Mb. Intan, Awang, Her4 Tanti dan juga Asri dan Digna yang selalu
memberikan semangat dalam penyelesaian skripsi ini.
semua pihak yang tidak dapat disebutkan satu persaru yang telah banyak
memberikan bantuan, dorongan dan motivasi sehingga skripsi ini dapat
terselesaikan.
Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan, maka
saran dan kritik yang konstruktii dari semua pihak sangat diharapkan demi
penyempurnaan selanjutnya. Semoga skripsi ini dapat bermanfaat bagi semua
pihak, khususnya bagi penulis dan para pembaca pada umumnya.
Yogyakarta 15 Agustus 2016
Penulis
9.
xl
(Maria Ansila Bouk)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xii
DAFTAR ISI
HALAMAN JUDUL ...................................................................................................... i
HALAMAN JUDUL DALAM BAHASA INGGRIS .................................................. ii
HALAMAN PERSETUJUAN PEMBIMBING .......................................................... iii
HALAMAN PERSEMBAHAN ................................................................................... v
HALAMAN PERNYATAAN KEASLIAN KARYA ................................................. vi
HALAMAN ABSTRAK ............................................................................................. vii
HALAMAN ABSTRACT ......................................................................................... viii
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI....................................... ix
KATA PENGANTAR .................................................................................................. x
DAFTAR ISI ................................................................................................................ xi
DAFTAR TABEL ...........................................................................................................
BAB I PENDAHULUAN ............................................................................................. 1
A. Latar Belakang ..................................................................................................... 1
B. Rumusan Masalah ............................................................................................... 3
C. Batasan Masalah ................................................................................................. 4
D. Tujuan Penulisan ................................................................................................. 4
E. Manfaat Penulisan ............................................................................................... 5
F. Metode Penulisan ................................................................................................ 5
G. Sistematika Penulisan .......................................................................................... 6
BAB II LANDASAN TEORI ....................................................................................... 8
A. Distribusi Probabilitas ......................................................................................... 8
1. Variabel Random .............................................................................................. 8
2. Fungsi Probabilitas ............................................................................................ 8
a. Distribusi Probabilitas Diskrit ....................................................................... 8
b. Distribusi Probabilitas Kontinu ..................................................................... 9
3. Karakteristik Distribusi Probabilitas ................................................................. 9
a. Mean ............................................................................................................ 9
b. Variansi ..................................................................................................... 10
c. Momen dan Fungsi Pembangkit Momen .................................................. 10
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiii
B. Distribusi Poisson .............................................................................................. 13
C. Distribusi Gamma dan Sifat-sifatnya ................................................................ 15
D. Distribusi Binomial Negatif .............................................................................. 18
E. Distribusi Binomial Negatif sebagai Campuran Distribusi Poisson-Gamma .... 22
F. Metode Maksimum Likelihood ......................................................................... 25
G. Metode Numerik Newton-Raphson ................................................................... 28
H. Keluarga Eksponensial ...................................................................................... 32
1. Distribusi Poisson merupakan keluarga eksponensial .................................... 33
2. Distribusi Binomial merupakan keluarga eksponensial .................................. 34
I. Model Regresi Linear Berganda ........................................................................ 36
J. Jenis Data Penelitian .......................................................................................... 37
1. Data berdasarkan sumbernya .......................................................................... 37
2. Data berdasarkan bentuk dan sifatnya............................................................. 38
K. Model Count Respon ......................................................................................... 41
1. Model Regresi logistik dan Regresi Probit ..................................................... 42
2. Model Regresi Poisson dan Regresi Binomial Negatif ................................... 43
L. Uji Kolmogorov-Smirnov ................................................................................. 45
BAB III PENDUGAAN MODEL REGRESI BINOMIAL NEGATIF ...................... 50
A. Model Regresi Poisson Berganda ...................................................................... 50
B. Overdispersi dan Regresi Binomial Negatif ...................................................... 54
C. Binomial Negatif sebagai Keluarga Eksponensial ............................................ 56
D. Model Regresi Binomial Negatif ....................................................................... 61
E. Pendugaan Parameter untuk Model Regresi Binomial Negatif dengan Metode
Maksimum likelihood ........................................................................................ 62
F. Uji Kebaikan Model .......................................................................................... 76
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
BAB IV PEMODELAN REGRESI BINOMIAL NEGATIF PADA DATA
BANYAKNYA KEMATIAN IBU DI PROPINSI JAWA TIMUR ........................... 88
A. Deskripsi Data ................................................................................................... 91
B. Pengolahan Data ................................................................................................ 91
1. Uji Kolmogorov-Smirnov ............................................................................... 92
2. Pendugaan Model regresi Poisson .................................................................. 93
3. Uji Signifikansi Parameter .............................................................................. 94
4. Uji Overdispersi pada Model Regresi Poisson ............................................... 96
5. Pendugaan Model Regresi Binomial Negatif .................................................. 97
6. Uji Signifikansi Model regresi Binomial Negatif ........................................... 97
BAB V KESIMPULAN DAN SARAN .................................................................... 100
A. Kesimpulan ...................................................................................................... 100
B. Saran ............................................................................................................... 101
DAFTAR PUSTAKA ............................................................................................... 102
LAMPIRAN .............................................................................................................. 106
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xv
DAFTAR TABEL
Tabel 2.1 Data suatu sampel acak untuk contoh 2.4 .................................................. 47
Tabel 2.2 Hasil Pengujian Kolmogorov-Smirnov ...................................................... 48
Tabel 3.1 Data banyaknya kasus campak pada kecamatan di kota Semarang ...... 81
Tabel 3.2 Hasil Pengujian Kolmogorov-Smirnov ..................................................... 83
Tabel 3.3 Parameter , , , , untuk Regresi poisson .................................. 84
Tabel 3.4 Parameter , , , , untuk Regresi Binomial Negatif ................... 86
Tabel 4.1 Deskripsi Data ............................................................................................ 91
Tabel 4.2 Hasil Pengujian Kolmogorov-Smirnov .......................................................... 93
Tabel 4.3 Parameter , , , , , , , , untuk Regresi poisson .......... 93
Tabel 4.4 Parameter , , , , , , , , untuk Regresi Binomial Negatif
..................................................................................................................................... 97
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1
BAB I
PENDAHULUAN
A. Latar Belakang
Regresi adalah suatu metode yang digunakan untuk menganalisis
hubungan antara suatu variabel dependen dengan satu atau lebih variabel
independen. Pada umumnya, analisis regresi digunakan untuk menganalisis data
variabel dependen yang berupa data kontinu. Namun dalam beberapa aplikasinya,
data variabel dependen yang akan dianalisis dapat berupa data diskrit. Variabel
dependen diskrit dapat berupa data count yaitu data yang nilainya nonnegatif dan
menyatakan banyaknya kejadian dalam interval waktu, ruang, atau volume
tertentu. Ketika variabel dependen berupa data count, analisis regresi yang biasa
digunakan adalah analisis regresi Poisson. Pada regresi ini variabel dependen
diasumsikan berdistribusi Poisson, dengan fungsi probabilitasnya adalah
𝑝(𝑦) =𝜆𝑦
𝑦!𝑒−𝜆, 𝑦 = 0,1,2, … dengan 𝜆 > 0
Analisis Regresi Poisson adalah suatu model yang digunakan untuk
menganalisis hubungan antara variabel dependen yang berdistribusi Poisson
dengan beberapa variabel independen. Pada model Regresi Poisson terdapat
asumsi yang harus dipenuhi yaitu nilai variansi dari data yang diperoleh harus
sama dengan nilai meannya atau disebut ekuidispersi (equidispersion).
𝐸(𝑌) = 𝑉𝑎𝑟(𝑌) = 𝜇
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2
Pada kenyataannya asumsi ini sangat jarang terjadi karena biasanya data
count memiliki variansi yang lebih besar dari mean atau disebut kondisi
overdispersi (𝑉𝑎𝑟(𝑌) > 𝐸(𝑌)) atau sebaliknya mean lebih besar dari pada
variansi atau disebut underdispersi (𝑉𝑎𝑟(𝑌) < 𝐸(𝑌)). Jika pada data diskrit
terjadi overdispersi namun tetap digunakan model regresi Poisson maka estimasi
parameter koefisien regresinya tetap konsisten tetapi tidak efisien karena
berpengaruh pada nilai standar galat (underestimate). Hal itu dapat
mengakibatkan kesimpulan yang akan dihasilkan menjadi tidak tepat atau tidak
sesuai dengan data. Alternatif model regresi yang lebih sesuai untuk data
overdispersi adalah model regresi Binomial Negatif. Pada regresi ini variabel
dependen diasumsikan berdistribusi Binomial Negatif, dengan fungsi
probabilitasnya dihasilkan dari distribusi campuran Poisson-Gamma yaitu
𝑓(𝑦) = Γ (𝑦 +
1𝑘
)
Γ (1𝑘
) 𝑦!(
𝑘𝜇
1 + 𝑘𝜇)
𝑦
(1
1 + 𝑘𝜇)
1𝑘⁄
dengan y = 0,1,2,…
Model regresi Binomial Negatif memiliki kegunaan yang sama dengan
model regresi Poisson yaitu untuk menganalisis hubungan antara suatu variabel
dependen dengan satu atau lebih variabel independen. Namun model regresi
Binomial Negatif lebih fleksibel dibandingkan dengan model Poisson karena
asumsi mean dan variansi dari model Binomial Negatif tidak harus sama. Model
ini juga memiliki parameter dispersi yang berguna menggambarkan variasi dari
data yang biasa dinotasikan dengan k. Model Binomial Negatif yang akan
digunakan adalah Model Binomial Negatif yang merupakan model campuran
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
antara distribusi Poisson dan Gamma. Distribusi Gamma digunakan untuk
menyesuaikan kehadiran overdispersi dalam model Poisson.
Dari dua buah model regresi yang digunakan untuk data count, yaitu
Poisson dan Binomial Negatif, model Binomial Negatif memiliki bentuk yang
lebih umum karena model Poisson dapat dinyatakan dalam model Binomial
Negatif ketika parameter dispersinya mendekati nol (k 0) atau dapat dikatakan
data dalam keadaan ekuidispersi. Jadi, model Binomial Negatif pada dasarnya
dapat digunakan untuk berbagai kasus data count. Dalam penulisan ini akan lebih
dikhususkan untuk masalah pendugaan model regresi Binomial Negatif pada
kasus overdispersi. Pendugaan parameter dapat diperoleh dengan menggunakan
metode pendugaan kemungkinan maksimum melalui iterasi Newton-Raphson.
Adapun beberapa aplikasi dari model Binomial Negatif diantaranya adalah
memodelkan kasus terjadinya penyakit demam berdarah dengue (DBD) dan untuk
mengetahui besarnya pengaruh variabel-variabel yang mempengaruhi terjadinya
penyakit DBD, pemodelan banyaknya kematian Ibu di suatu daerah, model
prediksi kecelakaan lalulintas jalan tol, penggolongan resiko jumlah klaim
asuransi kendaraan dan lain-lainnya.
B. Rumusan Masalah
Perumusan masalah yang akan dibicarakan dalam skripsi ini adalah:
1. Bagaimana landasan matematis pendugaan model regresi Binomial Negatif
dengan metode kemungkinan maksimum?
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4
2. Bagaimana menduga parameter-parameter pada model regresi Binomial
Negatif dengan menggunakan metode pendugaan kemungkinan maksimum
melalui iterasi Newton-Raphson?
3. Bagaimana menerapkan model regresi Binomial Negatif pada Poisson yang
mengalami Overdispersi dengan metode Newton-Raphson dalam masalah
nyata?
C. Batasan Masalah
Agar dalam pembahasan tidak terlalu luas dan hasilnya mendekati pokok
permasalahan, maka dalam penulisan skripsi ini hanya akan membahas:
1. Model Regresi Binomial Negatif yang merupakan model campuran Distribusi
Poisson-Gamma untuk kasus Poisson yang mengalami Overdispersi.
2. Pendugaan parameter dilakukan dengan menggunakan metode pendugaan
kemungkinan maksimum melalui iterasi Newton-Raphson.
3. Penulis tidak membahas tentang generalisasi dari Distribusi Binomial Negatif
sebagai campuran distribusi Poisson dan Gamma.
4. Penulis hanya membahas tentang distribusi Poisson yang mengalami
overdispersi.
5. Dalam perhitungan penulis menggunakan program R dan SPSS.
6. Penulis tidak membahas tentang Prior Natural Conjugate.
D. Tujuan Penulisan
Tujuan penulisan skripsi ini adalah:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5
1. Untuk memahami landasan matematis pendugaan model regresi Binomial
Negatif dengan metode Newton-Raphson.
2. Untuk dapat menduga parameter-parameter pada model regresi Binomial
Negatif menggunakan metode pendugaan kemungkinan maksimum melalui
iterasi Newton-Raphson.
3. Untuk dapat menerapkan model regresi Binomial Negatif pada Poisson yang
mengalami Overdispersi dengan metode Newton-Raphson dalam masalah
nyata.
4. Untuk memenuhi tugas dalam mencapai gelar sarjana.
E. Manfaat Penulisan
Manfaat Penulisan ini adalah untuk memperoleh pengetahuan tentang
Regresi Binomial Negatif, membahas dasar-dasar teori yang terkait, dapat
menentukan parameter-parameter dari model regresi Binomial Negatif, serta dapat
menduga model banyaknya kematian Ibu di propinsi Jawa Timur menggunakan
model regresi Binomial Negatif.
F. Metode penulisan
. Metode yang digunakan penulis dalam penulisan skripsi ini adalah
metode studi pustaka, yaitu dengan membaca dan mempelajari buku-buku atau
jurnal-jurnal yang berkaitan dengan pendugaan model regresi Binomial Negatif
dengan metode Pendugaan Kemungkinan Maksimum.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6
G. Sistematika Penulisan
Sistematika penulisan pada skripsi ini meliputi lima Bab yaitu:
BAB I PENDAHULUAN
A. Latar Belakang
B. Rumusan Masalah
C. Batasan Masalah
D. Tujuan Penulisan
E. Manfaat Penulisan
F. Metode Penulisan
G. Sistematika Penulisan
BAB II LANDASAN TEORI
A. Distribusi Probabilitas
B. Distribusi Poisson
C. Distribusi Gamma dan Sifat-sifatnya
D. Distribusi Binomial Negatif
E. Distribusi Binomial Negatif sebagai campuran Distribusi Poisson-
Gamma
F. Metode Maksimum Likelihood
G. Metode numerik Newton-Raphson
H. Keluarga Eksponensial
I. Model Regresi Linear Berganda
J. Jenis Data Penelitian
K. Model Count Respon
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
L. Uji Kolmogorov-Smirnov
BAB III PENDUGAAN MODEL REGRESI BINOMIAL NEGATIF
A. Model Regresi Poisson Berganda
B. Overdispersi dan regresi Binomial Negatif
C. Binomial Negatif sebagai keluarga Eksponensial
D. Model Regresi Binomial Negatif
E. Pendugaan Parameter untuk Model Regresi Binomial Negatif dengan
Metode Maksimum Likelihood
F. Uji Kebaikan Model
BAB IV PEMODELAN REGRESI BINOMIAL NEGATIF PADA DATA
BANYAKNYA KEMATIAN IBU DI PROPINSI JAWA TIMUR
A. Deskripsi Data
B. Pengolahan Data
BAB V PENUTUP
A. Kesimpulan
B. Saran
DAFTAR PUSTAKA
LAMPIRAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
BAB II
LANDASAN TEORI
A. Distribusi Probabilitas
1. Variabel Random
Definisi 2.1
Variabel random 𝑋 adalah fungsi bernilai riil yang domainnya adalah ruang
sampel.
Definisi 2.2
Sebuah variabel random dikatakan variabel random diskrit jika himpunan dari
kemungkinan hasilnya adalah terbilang. Jika tidak memenuhi definisi di atas
maka variabel random di atas disebut variabel random kontinu.
2. Fungsi Probabilitas
a. Distribusi Probabilitas Diskrit
Definisi 2.3
Himpunan pasangan terurut (𝑥, 𝑓(𝑥)) adalah fungsi probabilitas, atau
distribusi probabilitas dari suatu variabel random diskrit X jika
1) 𝑃(𝑋 = 𝑥) = 𝑓(𝑥)
2) 𝑓(𝑥) ≥ 0
3) ∑ 𝑓(𝑥) = 1∀𝑥
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
Definisi 2.4
Fungsi distribusi kumulatif 𝐹(𝑥) (cumulative distribution function) dari
sebuah variabel random diskrit 𝑋 dengan distribusi probabilitas 𝑓(𝑥) adalah
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) =∑𝑓(𝑡) 𝑢𝑛𝑡𝑢𝑘 −∞ < 𝑥 < ∞
𝑡≤𝑥
b. Distribusi Probabilitas Kontinu
Definisi 2.5
Fungsi 𝑓(𝑥) adalah fungsi probabilitas (probability function) untuk variabel
random kontinu 𝑋 jika
1) 𝑓(𝑥) ≥ 0, untuk semua 𝑥 ∈ 𝑅
2) ∫ 𝑓(𝑥)𝑑𝑥 = 1∞
−∞
3) 𝑃(𝑎 < 𝑋 < 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥𝑏
𝑎
Definisi 2.6
Fungsi distribusi kumulatif 𝐹(𝑥) (cumulative distribution function) dari sebuah
variabel random kontinu 𝑋 dengan distribusi probabilitas 𝑓(𝑥) adalah
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡, untuk − ∞ < 𝑥 < ∞𝑥
−∞
3. Karakteristik Distribusi Probabilitas
a. Mean
Definisi 2.7
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
Misalkan 𝑋 adalah variabel random dengan fungsi probabilitas 𝑓(𝑥). Mean
atau nilai harapan (expected value) dari 𝑋 adalah
{
𝜇 = 𝐸(𝑋) =∑𝑥𝑓(𝑥)
𝑥
, 𝑋 diskrit
𝜇 = 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥, 𝑋 kontinu∞
−∞
b. Variansi
Definisi 2.8
Jika 𝑋 adalah variabel random, variansi dari variabel random 𝑋, maka
variansi dari 𝑋 ditulis sebagai 𝑣𝑎𝑟(𝑋) atau 𝑉(𝑋) didefinisikan
𝑉(𝑋) = 𝐸(𝑋 − 𝐸(𝑋))2.
Teorema 2.1
𝑉𝑎𝑟(𝑋) = 𝐸(𝑋2) − (𝐸(𝑋))2
Bukti
𝑉(𝑋) = 𝐸[(𝑋 − 𝐸(𝑋))2]
= 𝐸(𝑋2 − 2𝑋𝐸(𝑋) + (𝐸(𝑋))2
= 𝐸(𝑋2) − 𝐸(2)𝐸(𝑋)𝐸(𝑋) + (𝐸(𝑋))2
= 𝐸(𝑋2) − (𝐸(𝑋))2∎
c. Momen dan Fungsi Pembangkit Momen
Definisi 2.9
Momen ke-k dari variabel random 𝑋 yang diambil sekitar titik asal
dinotasikan dengan 𝜇𝑘′ adalah
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
𝜇𝑘′ = 𝐸(𝑋𝑘)
Definisi 2.10
Fungsi pembangkit momen 𝑚(𝑡) dari sebuah variabel random
𝑋 didefinisikan sebagai 𝑚(𝑡) = 𝐸(𝑒𝑡𝑥). Fungsi pembangkit momen dari 𝑋
dikatakan ada jika terdapat konstanta positif 𝑏 sedemikian sehingga 𝑚(𝑡)
adalah berhingga untuk |𝑡| ≤ 𝑏.
Fungsi pembangkit momen dari variabel acak 𝑋 didefinisikan sebagai
𝑚𝑥(𝑡) = 𝐸(𝑒𝑡𝑥) =
{
∑𝑒𝑡𝑥𝑓(𝑥), 𝑋 diskrit
𝑥
∫ 𝑒𝑡𝑥𝑓(𝑥) 𝑑𝑥∞
−∞
, 𝑋 kontinu
Teorema 2.2
Misalkan 𝑋 variabel acak dengan fungsi pembangkit momen (FPM) 𝑚𝑥(𝑡)
maka
𝑑𝑘𝑚(𝑡)
𝑑𝑡𝑘|𝑡=0
= 𝜇𝑘′
Bukti:
Ekspansi Deret maclaurin dari 𝑒𝑡𝑥 adalah
𝑒𝑡𝑥 = 1 + 𝑡𝑥 +(𝑡𝑥)2
2!+(𝑡𝑥)3
3!+(𝑡𝑥)4
4!+ ⋯
Diasumsikan 𝑚(𝑘)(𝑡) berhingga untuk 𝑘 = 1, 2,⋯, maka
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
𝐸(𝑒𝑡𝑥) =∑𝑒𝑡𝑥𝑝(𝑥)
𝑥
=∑[1 + 𝑡𝑥 +(𝑡𝑥)2
2!+(𝑡𝑥)3
3!+(𝑡𝑥)4
4!+ ⋯ ]𝑝(𝑥)
𝑥
=∑𝑝(𝑥)
𝑥
+ 𝑡∑𝑥 𝑝(𝑥) +𝑡2
2!∑𝑥2𝑝(𝑥) +
𝑡3
3!∑𝑥3𝑝(𝑥) + ⋯ = 1 + 𝑡
𝑥𝑥𝑥
𝜇1′
+𝑡2
2!𝜇2′ +
𝑡3
3!𝜇3′ +⋯
𝑑𝑘𝑚(𝑡)
𝑑𝑡𝑘 atau 𝑚(𝑘)(𝑡) adalah turunan ke-𝑘 dari 𝑚(𝑡) terhadap 𝑡, karena
𝑚(𝑡) = 𝐸(𝑒𝑡𝑥) = 1 + 𝑡𝜇1′ +
𝑡2
2!𝜇2′ +
𝑡3
3!𝜇3′ +
𝑡4
4!𝜇4′ +⋯
𝑚(1)(𝑡) = 𝜇1′ +
2𝑡
2!𝜇2′ +
3𝑡2
3!𝜇3′ +
4𝑡3
4!𝜇4′ +⋯
𝑚(2)(𝑡) =2
2!𝜇2′ +
6𝑡
3!𝜇3′ +
12𝑡2
4!𝜇4′ +⋯
=2
2 × 1!𝜇2′ +
6𝑡
3 × 2!𝜇3′ +
12𝑡2
4 × 3!𝜇4′ +⋯
= 𝜇2′ +
2𝑡
2!𝜇3′ +
3𝑡2
3!𝜇4′ +⋯
𝑚(3)(𝑡) = 𝜇3′ +
6𝑡
3!𝜇4′ +⋯
Secara umum, 𝑚(𝑘)(𝑡) = 𝜇𝑘′ +
2𝑡
2!𝜇𝑘+1′ +
3𝑡2
3!𝜇𝑘+2′ +⋯
Ketika 𝑡 = 0 untuk semua turunan diperoleh
𝑚(1)(0) = 𝜇1′
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
𝑚(2)(0) = 𝜇2′
Sehingga secara umum
𝑚(𝑘)(0) = 𝜇𝑘′ ∎
Turunan pertama dari fungsi pembangkit momen yaitu
Untuk variabel kontinu, 𝑑𝑚(𝑡)
𝑑𝑡= 𝑚′(𝑡) = ∫ 𝑥𝑒𝑡𝑥𝑓(𝑥)𝑑𝑥
∞
−∞
Untuk variabel diskrit, 𝑑𝑚(𝑡)
𝑑𝑡= 𝑚′(𝑡) = ∑ 𝑥𝑒𝑡𝑥𝑓(𝑥)𝑥
Berdasarkan turunan pertama dari FPM diatas, untuk 𝑡 = 0, diperoleh
𝑚(0) = 𝐸(𝑋).
Turunan kedua dari fungsi pembangkit momen yaitu:
Untuk variabel kontinu, 𝑑2𝑚(𝑡)
𝑑𝑡2= 𝑚′′(𝑡) = ∫ 𝑥2𝑒𝑡𝑥𝑓(𝑥)𝑑𝑥
∞
−∞
Untuk variabel diskrit, 𝑑2𝑚(𝑡)
𝑑𝑡2= 𝑚′′(𝑡) = ∑ 𝑥2𝑒𝑡𝑥𝑓(𝑥)𝑥
Berdasarkan turunan kedua dari FPM diatas, untuk 𝑡 = 0, diperoleh
𝑚"(0) = 𝐸(𝑋2), sehingga
𝜎2 = 𝐸(𝑋2) − 𝜇2
= 𝑚"(0) − [𝑚′(0)]2
Turunan ke-𝑘 dari FPM untuk 𝑡 = 0 yaitu 𝑚(𝑘)(0) = 𝐸(𝑋𝑘) yang
disebut momen ke-𝑘 dari variabel acak 𝑋.
B. Distribusi Poisson
Definisi 2.11
Suatu variabel random 𝑌 disebut berdistribusi Poisson dengan parameter 𝜆 jika
dan hanya jika fungsi probabilitasnya sebagai berikut
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
𝑝(𝑦) =𝜆𝑦
𝑦!𝑒−𝜆, 𝑦 = 0,1,2, …
dengan 𝜆 > 0
Toerema 2.3
Jika 𝑌 berdistribusi Poisson dengan parameter 𝜆 maka 𝜇 = 𝐸(𝑌) = 𝜆 dan
𝜎2 = 𝑉(𝑌) = 𝜆
Bukti:
Berdasarkan Definisi 2.10, diperoleh
𝑚(𝑡) = ∑𝑒−𝜆𝜆𝑦
𝑦! 𝑒𝑡𝑦
∞
𝑦=0
=∑𝑒𝑡𝑦−𝜆𝜆𝑦
𝑦!= 𝑒−𝜆∑
(𝜆𝑒𝑡)𝑦
𝑦!
∞
𝑦=0
∞
𝑦=0
Berdasarkan formulasi Taylor 𝑒𝑎 = ∑𝑎𝑦
𝑦!∞𝑦=0 maka diperoleh
𝐸(𝑌) = 𝑚′(𝑡)
= 𝑒−𝜆𝑒𝜆𝑒𝑡
= 𝑒𝜆(𝑒𝑡−1)
=𝑑
𝑑𝑡𝑒𝜆(𝑒
𝑡−1)|𝑡=0
= 𝜆𝑒𝑡 𝑒𝜆(𝑒𝑡−1)|
𝑡=0
= 𝜆𝑒0 𝑒𝜆(𝑒0−1) = 𝜆
𝐸(𝑌2) =𝑑2
𝑑𝑡2𝑚(𝑡)|
𝑡=0
=𝑑2
𝑑𝑡2𝑒𝜆(𝑒
𝑡−1). 𝜆𝑒𝑡
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
= 𝑒𝜆(𝑒𝑡−1). 𝜆𝑒𝑡. 𝜆𝑒𝑡 + 𝜆𝑒𝑡 𝑒𝜆(𝑒
𝑡−1)
= 𝑒2𝑡𝜆2𝑒𝜆(𝑒𝑡−1) + 𝜆𝑒𝑡 𝑒𝜆(𝑒
𝑡−1)|𝑡=0
= 𝜆2 + 𝜆
Jadi,
𝑉𝑎𝑟(𝑌) = 𝐸(𝑌2) − [𝐸(𝑌)]2
= 𝜆2 + 𝜆 − 𝜆2
= 𝜆
C. Distribusi Gamma dan Sifat-sifatnya
Definisi 2.12
fungsi Gamma didefinisikan sebagai
Γ(𝛼) = ∫ 𝑦𝛼−1𝑒−𝑦𝑑𝑦
∞
0
Untuk 𝛼 > 0 dan nilai dari integral tersebut adalah bilangan positif.
Fungsi Gamma memiliki sifat sebagai berikut:
a. Jika 𝛼 = 1, maka Γ(1) = ∫ 𝑒−𝑦𝑑𝑦 = 1.∞
0
b. Jika 𝑛 adalah suatu bilangan bulat positif maka diperoleh Γ(𝑛) = ( 𝑛 − 1)!.
c. Jika 𝛼 > 1, maka Γ(𝛼) = ∫ 𝑦𝛼−1𝑒−𝑦𝑑𝑦 =∞
0( 𝛼 − 1)Γ(𝛼 − 1)
Definisi 2.14
Suatu variabel acak kontinu 𝑌 dikatakan berdistribusi Gamma dengan
parameter 𝛼 dan β jika variabel tersebut mempunyai fungsi probabilitas sebagai
berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
𝑓(𝑦) = {
1
Γ(𝛼)𝛽𝛼𝑦𝛼−1𝑒−𝑦 𝛽⁄ , 0 ≤ 𝑦 ≤ ∞
0 𝑦 yang lainnya
Dengan 𝛼, 𝛽 > 0.
Teorema 2.3
Jika 𝑌 adalah berdistribusi Gamma dengan parameter 𝛼 dan 𝛽 maka 𝜇 =
𝐸(𝑌) = 𝛼𝛽 dan 𝜎2 = 𝑉(𝑌) = 𝛼𝛽2
Bukti:
1. Mean
Berdasarkan definisi 2.7
𝐸(𝑌) = ∫ 𝑦 𝑓(𝑦)𝑑𝑦∞
−∞
= ∫ 𝑦 𝑦𝛼−1𝑒
−𝑦𝛽
𝛽𝛼Γ(𝛼) 𝑑𝑦
∞
0
Berasarkan definisi fungsi probabilitas maka
∫𝑦𝛼−1𝑒
−𝑦𝛽
𝛽𝛼Γ(𝛼) 𝑑𝑦
∞
0
= 1
Sehingga diperoleh
∫ 𝑦𝛼−1𝑒−𝑦𝛽 𝑑𝑦 = 𝛽𝛼Γ(𝛼)
∞
0
(2.1)
𝐸(𝑌) = ∫𝑦𝛼𝑒
−𝑦𝛽
𝛽𝛼Γ(𝛼) 𝑑𝑦
∞
0
=1
𝛽𝛼Γ(𝛼)∫ 𝑦𝛼𝑒
−𝑦𝛽 𝑑𝑦
∞
0
Berdasarkan persamaan 2.1 diperoleh
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
𝐸(𝑌) =1
𝛽𝛼Γ(𝛼)𝛽𝛼+1Γ(𝛼 + 1)
Berdasarkan sifat fungsi Gamma maka Γ(𝛼 + 1) = 𝛼Γ(α), maka diperoleh
𝐸(𝑌) =1
𝛽𝛼Γ(𝛼)𝛽𝛼+1𝛼 Γ(𝛼)
=𝛽 𝛼 Γ(𝛼)
Γ(𝛼)
= 𝛼𝛽
2. Variansi
Berdasarkan teorema 2.1
𝑉(𝑌) = 𝐸(𝑌2) − (𝐸(𝑌))2
𝐸(𝑌2) = ∫ 𝑦2𝑦𝛼−1𝑒
−𝑦𝛽
𝛽𝛼Γ(𝛼) 𝑑𝑦
∞
0
= ∫𝑦𝛼+1𝑒
−𝑦𝛽
𝛽𝛼Γ(𝛼)
∞
0
𝑑𝑦
=1
𝛽𝛼Γ(𝛼)∫ 𝑦𝛼+1𝑒
−𝑦𝛽 𝑑𝑦
∞
0
Berdasarkan persamaan 2.1 dan definisi sifat fungsi Gamma, maka diperoleh
𝐸(𝑌) =1
𝛽𝛼Γ(𝛼)𝛽𝛼+2Γ(𝛼 + 2)
=𝛽2(𝛼 + 1)Γ(𝛼 + 1)
Γ(𝛼)
=𝛽2(𝛼 + 1)𝛼Γ(𝛼)
Γ(𝛼)
= 𝛼𝛽2(𝛼 + 1)
Sehingga,
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
𝑉(𝑌) = 𝐸(𝑌2) − (𝐸(𝑌))2
= 𝛼𝛽2(𝛼 + 1) − (𝛼𝛽)2
= 𝛼2𝛽2 + 𝛼𝛽2 − 𝛼2𝛽2
= 𝛼𝛽2
D. Distribusi Binomial Negatif
Distribusi Binomial Negatif merupakan distribusi yang memiliki beberapa
cara dalam hal pendekatannya. Pendekatan klasik yang sering digunakan adalah
Distribusi Binomial Negatif sebagai barisan percobaan Bernoulli yaitu jumlah
percobaan Bernoulli yang dibutuhkan sampai terjadi 𝑟 buah sukses, dengan setiap
ulangan saling bebas, dan probabilitas sukses pada setiap percobaan konstan yaitu
𝑝 sedangkan probabilitas gagal yaitu 1 − 𝑝.
Misalkan 𝑦 adalah banyaknya kegagalan sebelum sukses ke-𝑟, maka 𝑟 − 1
sukses dapat terjadi pada sebarang waktu sebelum 𝑥 − 1 ulangan. Misalkan
variabel acak 𝑋 menyatakan banyaknya ulangan yang dibutuhkan sampai terjadi 𝑟
buah sukses, maka 𝑋 berdistribusi Binomial Negatif dengan fungsi probabilitas
sebagai berikut
𝑓(𝑥) = (𝑥 − 1𝑘 − 1
) 𝑝𝑟(1 − 𝑝)𝑥−𝑟 dengan 𝑥 = 𝑘, 𝑘 + 1, 𝑘 + 2,⋯
Fungsi probabilitas dari variabel acak 𝑋 dapat dinotasikan ke dalam bentuk
lain. Misalkan terdapat 𝑦 banyaknya kegagalan sebelum sukses ke-𝑟 maka 𝑥
merupakan penjumlahan dari 𝑦 kegagalan dengan 𝑟 buah sukses atau 𝑥 = 𝑦 + 𝑟.
Jadi, akan dibentuk variabel acak baru yaitu 𝑌, yang menyatakan banyaknya
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
kegagalan sebelum terjadi 𝑟 buah sukses dengan metode transformasi variabel
dengan fungsi transformasinya 𝑌 = 𝑋 − 𝑟.
Definisi 2.14
Variabel acak 𝑌 disebut berdistribusi Binomial Negatif jika memiliki fungsi
probabilitas 𝑓(𝑦) sebagai berikut
𝑓(𝑦) = (𝑦 + 𝑟 − 1𝑟 − 1
)𝑝𝑟(1 − 𝑝)𝑦 dengan 𝑦 = 0, 1, 2,⋯
Contoh 2.1
Seorang dokter anak merekrut 5 pasangan untuk berpartisipasi dalam penelitiannya.
Masing-masing pasangan berharap untuk melahirkan anak secara normal. Misalkan
𝑝 = 𝑃 (pasangan yang dipilih secara acak setuju untuk berpartisipasi). Jika 𝑝 = 0.2,
berapakah probabilitas bahwa 15 pasangan harus ditanya sebelum ditemukan 5
pasangan yang setuju untuk berpartisipasi?
Penyelesaian:
Diketahui 𝑟 = 5, 𝑝 = 0.2, 𝑋 = 10 sehingga
𝑓(𝑦) = (10 + 5 − 15 − 1
)0.25(1 − 0.2)10 = (144)0.25(0.8)10 = 0.0343
Teorema 2.4
Mean dan variansi dari distribusi Binomial Negatif adalah
𝐸(𝑌) = 𝜇 =𝑟(1 − 𝑝)
𝑝
𝑉𝑎𝑟(𝑌) =𝑟(1 − 𝑝)
𝑝2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
Bukti:
1. Mean
Misalkan 𝑓(𝑥) = (1 − 𝑥)−𝑟, dalam kalkulus 𝑓(𝑥) dapat mengikuti ekspansi deret
Maclaurin yaitu:
(1 − 𝑥)−𝑟 = 𝑓(0) + 𝑓′(0) +𝑓(2)(0)
2!𝑥2 +
𝑓(3)(0)
3!𝑥3 +⋯+
𝑓(𝑛)(0)
𝑛!𝑥𝑛 +⋯
Dengan −1 < 𝑥 < 1 sehingga diperoleh
(1 − 𝑥)−𝑟 = 1 + 𝑟𝑥 +(𝑟 + 1)𝑟
2!𝑥2 +⋯+
(𝑟 + 𝑦 − 1)(𝑟 + 𝑦 − 2)⋯(𝑟 + 1)𝑟
𝑦!𝑥𝑦
+⋯
= 1 + (−1)1(−𝑟)𝑥 +(−1)2(−𝑟)(−𝑟 − 1)
2!𝑥2 +⋯
+(−1)𝑦(−𝑟)(−𝑟 − 1)⋯(−𝑟 − 𝑦 + 2)(−𝑟 − 𝑦 + 1)
𝑦!𝑥𝑦 +⋯
= (−1)0 (−𝑟0) 𝑥0 + (−1)1 (
−𝑟1) 𝑥1 + (−1)2 (
−𝑟2) 𝑥2 +⋯
+ (−1)𝑦 (−𝑟𝑦 ) 𝑥
𝑦 +⋯
=∑(−1)𝑦 (−𝑟𝑦 ) 𝑥
𝑦
∞
𝑦=0
(𝑦 + 𝑟 − 1
𝑟 − 1) =
(𝑦 + 𝑟 − 1)(𝑦 + 𝑟 − 2)⋯(𝑟 + 1)𝑟
(𝑦 + 𝑟 − 1 − 𝑟 + 1)!
=(𝑦 + 𝑟 − 1)(𝑦 + 𝑟 − 2)⋯(𝑟 + 1)𝑟
𝑦!
= (−1)𝑦 (−𝑟𝑦 )
Sehingga Berdasarkan definisi 2.10 diperoleh
𝑚(𝑡) = 𝐸(𝑒𝑡𝑌)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
=∑𝑒𝑡𝑦 (𝑦 + 𝑟 − 1
𝑟 − 1) 𝑝𝑟(1 − 𝑝)𝑦
∞
𝑦=0
=∑(𝑦 + 𝑟 − 1
𝑟 − 1) 𝑝𝑟[(1 − 𝑝)𝑒𝑡]𝑦
∞
𝑦=0
= 𝑝𝑟∑ (−1)𝑦 (−𝑟𝑦 )
∞
𝑦=0
[(1 − 𝑝)𝑒𝑡]𝑦
= 𝑝𝑟[1 − (1 − 𝑝)𝑒𝑡]−𝑟
=𝑝𝑟
[1 − (1 − 𝑝)𝑒𝑡]𝑟
Sehingga diperoleh
𝑚′(0) = 𝐸(𝑌)
=𝑑
𝑑𝑡(
𝑝𝑟
[1 − (1 − 𝑝)𝑒𝑡]𝑟)|𝑡=0
=−𝑟(1 − (1 − 𝑝)𝑒𝑡)𝑟−1 ∙ −(1 − 𝑝). 𝑝𝑟
([1 − (1 − 𝑝)𝑒𝑡]𝑟)2|𝑡=0
=𝑟(1 − 𝑝) 𝑝𝑟𝑝𝑟−1
𝑝2𝑟
=𝑟(1 − 𝑝) 𝑝2𝑟
𝑝2𝑟 𝑝
=𝑟(1 − 𝑝)
𝑝∎
2. Variansi
Berdasarkan teorema 2.1
𝑉𝑎𝑟(𝑌) = 𝐸(𝑌2) − (𝐸(𝑌))2
𝐸(𝑌2) =𝑑2
𝑑𝑡2(
𝑝𝑟
[1 − (1 − 𝑝)𝑒𝑡]𝑟)|𝑡=0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
=𝑑2
𝑑𝑡2(−𝑟(1 − (1 − 𝑝)𝑒𝑡)𝑟−1 ∙ −(1 − 𝑝). 𝑝𝑟
([1 − (1 − 𝑝)𝑒𝑡]𝑟)2)|𝑡=0
=𝑟(1 − 𝑝)[1 + (1 − 𝑝)]
𝑝2
Sehingga,
𝑉𝑎𝑟(𝑌) = 𝐸(𝑌2) − (𝐸(𝑌))2
=𝑟(1 − 𝑝)[1 + (1 − 𝑝)]
𝑝2−(1 − 𝑝)2
𝑝2
=𝑟(1 − 𝑝)[1 + (1 − 𝑝) − 𝑟(1 − 𝑝)]
𝑝2
=𝑟(1 − 𝑝)
𝑝2∎
E. Distribusi Binomial Negatif sebagai Campuran Distribusi Poisson-Gamma
Salah satu cara terbentuknya distribusi Binomial Negatif adalah terjadinya
overdispersi pada saat menggunakan distribusi Poisson. Data count biasanya
memiliki variansi yang lebih besar dari mean, atau yang disebut dengan kondisi
overdispersi. Misalkan 𝑌 adalah variabel acak dari suatu populasi yang berdistribusi
Poisson dengan 𝐸(𝑌) = 𝑉𝑎𝑟(𝑌) = 𝜆. Kondisi data seperti ini disebut dengan
ekuidispersi. Pada kenyataannya, jarang sekali ditemukan data count dalam kondisi
ekuidispersi. Pada distribusi Poisson terdapat asumsi mean (𝜆) konstan untuk setiap
nilai dari 𝑌, namun dalam kondisi overdispersi, 𝜆 tidak lagi konstan atau bervariasi
antar observasi pada populasi. Hal ini menunjukkan bahwa populasi tersebut
bergantung pada 𝜆, sehingga dapat dikatakan bahwa 𝜆 merupakan nilai dari suatu
variabel acak Ω yang memiliki distribusi tertentu.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
Distribusi Gamma dengan parameter 𝛼 dan 𝛽 dipilih sebagai distribusi dari
Ω karena distribusi Gamma merupakan prior natural conjugate dari distribusi
Poisson. Karena Ω berdistribusi Gamma dengan parameter 𝛼 dan 𝛽, maka mean
dari Ω adalah 𝜇 = 𝛼𝛽 atau 𝛽 = 𝜇/𝛼 . Misalkan 𝑘 = 1/ 𝛼 maka dapat dikatakan
bahwa Ω berdistribusi Gamma dengan parameter (1/k) dan 𝑘𝜇 dengan fungsi
probabilitasnya
ℎ(𝜆) =1
Γ (1𝑘) (𝑘𝜇)
1𝑘
𝜆1𝑘−1exp (
−𝜆
𝑘𝜇)
Fungsi probabilitas bersama antara 𝑌|𝜆 dan Ω adalah
𝑓(𝑦|𝜆)ℎ(𝜆) =𝑒−𝜆𝜆𝑦
𝑦!∙
1
Γ (1𝑘) (𝑘𝜇)
1𝑘
𝜆1𝑘−1𝑒𝑥𝑝 (
−𝜆
𝑘𝜇)
=𝜆𝑦+
1𝑘−1exp (−𝜆 +
−𝜆𝑘𝜇)
Γ (1𝑘) (𝑘𝜇)
1𝑘𝑦!
Fungsi probabilitas marginal dari 𝑌 adalah
𝑓(𝑦) = ∫𝑓(𝑦|𝜆)ℎ(𝜆)𝑑𝜆
= ∫𝜆𝑦+
1𝑘−1 exp (−𝜆 +
−𝜆𝑘𝜇)
Γ (1𝑘) (𝑘𝜇)
1𝑘𝑦!
𝑑𝜆∞
0
=1
Γ (1𝑘) (𝑘𝜇)
1𝑘𝑦!
∫ 𝜆𝑦+1𝑘−1 exp (−𝜆 +
−𝜆
𝑘𝜇)𝑑𝜆
∞
0
=1
Γ (1𝑘) (𝑘𝜇)
1𝑘𝑦!
∫ 𝑒𝑥𝑝 (−𝜆(𝑘𝜇 + 1)
𝑘𝜇)
∞
0
𝜆𝑦+1𝑘−1𝑑𝜆
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
=1
Γ (1𝑘) (𝑘𝜇)
1𝑘𝑦!
∫ 𝑒𝑥𝑝 (−𝜆(𝑘𝜇 + 1)
𝑘𝜇)
∞
0
𝜆𝑦+1𝑘−1 (
𝑘𝜇 + 1
𝑘𝜇 + 1)𝑦+
1𝑘−1
(𝑘𝜇
𝑘𝜇)𝑦+
1𝑘−1
𝑑𝜆
=1
Γ (1𝑘) (𝑘𝜇)
1𝑘𝑦!
∫ 𝑒𝑥𝑝 (−𝜆(𝑘𝜇 + 1)
𝑘𝜇)
∞
0
(𝜆(𝑘𝜇 + 1)
𝑘𝜇)
𝑦+1𝑘−1
(𝑘𝜇
𝑘𝜇 + 1)𝑦+
1𝑘−1
𝑑𝜆
=1
Γ (1𝑘) (𝑘𝜇)
1𝑘𝑦!
(𝑘𝜇
𝑘𝜇 + 1)𝑦+
1𝑘−1
∫ 𝑒𝑥𝑝(−𝜆(𝑘𝜇 + 1)
𝑘𝜇)
∞
0
(𝜆(𝑘𝜇 + 1)
𝑘𝜇)
𝑦+1𝑘−1
𝑑𝜆
Misalkan 𝑡 =𝜆(𝑘𝜇+1)
𝑘𝜇, maka
𝑑𝑡
𝑑𝜆=
(𝑘𝜇+1)
𝑘𝜇 sehingga 𝑑𝜆 =
𝑘𝜇
𝑘𝜇+1𝑑𝑡 sehingga
persamaan 𝑓(𝑦) menjadi
𝑓(𝑦) =1
Γ (1𝑘) (𝑘𝜇)
1𝑘𝑦!
(𝑘𝜇
𝑘𝜇 + 1)𝑦+
1𝑘−1
∫ 𝑒𝑥𝑝(−𝑡)∞
0
(𝑡)𝑦+1𝑘−1 𝑘𝜇
𝑘𝜇 + 1𝑑𝑡
=1
Γ (1𝑘) (𝑘𝜇)
1𝑘𝑦!
(𝑘𝜇
𝑘𝜇 + 1)𝑦+
1𝑘−1
(𝑘𝜇
𝑘𝜇 + 1)∫ 𝑒𝑥𝑝(−𝑡)
∞
0
(𝑡)𝑦+1𝑘−1𝑑𝑡
=1
Γ (1𝑘) (𝑘𝜇)
1𝑘𝑦!
(𝑘𝜇
𝑘𝜇 + 1)𝑦+
1𝑘∫ 𝑒𝑥𝑝(−𝑡)∞
0
(𝑡)𝑦+1𝑘−1𝑑𝑡
=1
Γ (1𝑘) (𝑘𝜇)
1𝑘𝑦!
(𝑘𝜇
𝑘𝜇 + 1)𝑦+
1𝑘Γ (𝑦 +
1
𝑘)
=1
Γ (1𝑘) (𝑘𝜇)
1𝑘𝑦!
(𝑘𝜇
𝑘𝜇 + 1)𝑦
(𝑘𝜇
𝑘𝜇 + 1)
1𝑘Γ (𝑦 +
1
𝑘)
=Γ (𝑦 +
1𝑘)
Γ (1𝑘)𝑦!
(𝑘𝜇
𝑘𝜇 + 1)𝑦
(1
𝑘𝜇 + 1)
1𝑘
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
fungsi probabilitas dari Distribusi Binomial Negatif sebagai campuran Poisson-
Gamma adalah
𝑓(𝑦; 𝜇, 𝑘)=Γ (𝑦 +
1𝑘)
𝑦! Γ (1𝑘)(
1
1 + 𝑘𝜇)
1𝑘(𝑘𝜇
1 + 𝑘𝜇)𝑦
(2.2)
Distribusi Binomial Negatif dengan fungsi probabilitas pada persamaan
2.2 disebut sebagai distribusi campuran Poisson-Gamma. Penurunan distribusi
Binomial Negatif di atas tidak berhubungan dengan penurunan klasik sebagai
barisan dari percobaan Bernouli pada subbab sebelumnya.
F. Metode Maksimum Likelihood
Salah satu metode dalam pendugaan parameter adalah metode Pendugaan
Kemungkinan Maksimum (Maksimum Likelihood Estimation/MLE). Metode ini
pertama kali diperkenalkan oleh R.A Fisher pada tahun 1912. Metode pendugaan
ini dapat diterapkan di sebagian besar masalah dan memiliki daya tarik intuitif yang
kuat, dan sering menghasilkan penduga yang baik bagi parameter 𝜃. Selain itu
untuk sampel yang sangat besar, metode ini menghasilkan penduga yang sangat
baik bagi 𝜃.
Definisi 2.16
Penduga Kemungkinan Maksimum (Maximum Likelihood Estimator/MLE) 𝜃𝑀𝐿
dari 𝜃 memaksimumkan fungsi likelihood, L(𝜃|𝑌) atau ekuivalen dengan
memaksimumkan log-likelihood 𝑙(𝜃|𝑌).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
Misalkan 𝑥1, 𝑥2, … , 𝑥𝑛 adalah variabel random kontinu berukuran
𝑛 dengan fungsi probabilitas 𝑓(𝑥, 𝜃) dan 𝜃 adalah parameter yang tidak diketahui.
Fungsi likelihood dari sampel random adalah fungsi densitas bersama dari
𝑛 variabel random yang merupakan fungsi dari parameter yang tidak diketahui,
sehingga fungsi likelihood adalah
𝐿(𝜃) =∏𝑓(𝑥𝑖 ; 𝜃)
𝑛
1
2.3
Selain itu, karena biasanya sulit untuk mencari turunan fungsi likelihood,
maka yang dilakukan adalah menentukan nilai maksimum dari logaritma natural
fungsi likelihood tersebut atau disebut dengan fungsi log-likelihood. Fungsi log-
likelihood dapat ditulis dalam bentuk :
𝑙 = ln 𝐿( 𝜃) 2.4
Nilai parameter 𝜃 dapat diperoleh dengan memaksimumkan fungsi peluang. Hal
tersebut dilakukan dengan mencari turunan parsial pertama dari fungsi likelihood-
nya terhadap setiap parameternya. Sehingga, MLE 𝜃 merupakan penyelesaian dari
persamaan berikut :
𝜕𝑙
𝜕𝜃= 0
Misalkan terdapat 𝑘 parameter yang tidak diketahui, maka pendugaan parameter 𝜃𝑖
dengan Metode Kemungkinan Maksimum
𝜕𝑙
𝜕𝜃𝑖= 0
Dengan 𝑖 = 1,2, … , 𝑘
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
Contoh 2.2
Misalkan 𝑌1, 𝑌2, … , 𝑌𝑛 adalah sampel random berdistribusi eksponensial dengan
mean 𝛽 dan variansi 𝛽2. Temukan �̂� dengan menggunakan Metode maksimum
likelihood.
Penyelesaian:
𝑌1, 𝑌2, … , 𝑌𝑛 adalah variabel random berdistribusi eksponensial dengan mean 𝛽 dan
variansi 𝛽2 maka fungsi probabilitasnya didefinisikan sebagai
𝑓(𝑦) = {
1
𝛽𝑒−𝑦𝛽 0 ≤ 𝑦 < ∞
0 selainnya
Berdasarkan persamaan 2.3 diperoleh fungsi likelihood berikut:
𝐿(𝛽) = 𝑓(𝑦1, 𝑦2, … , 𝑦𝑛|𝛽)
= 𝑓(𝑦1|𝛽) × 𝑓(𝑦2|𝛽) × …× 𝑓(𝑦𝑛|𝛽)
=1
𝛽𝑒−𝑦1𝛽 ×
1
𝛽𝑒−𝑦2𝛽 ×
1
𝛽𝑒−𝑦3𝛽 ×⋯×
1
𝛽𝑒−𝑦𝑛𝛽
= (1
𝛽)𝑛
𝑒𝑥𝑝 [−∑𝑦𝑖𝛽] 2.5
Fungsi log-likelihood dari persamaan diatas adalah
𝑙𝑛[𝐿(𝛽)] = 𝑙𝑛 [(1
𝛽)𝑛
𝑒𝑥𝑝 [−∑𝑦𝑖𝛽]]
= 𝑙𝑛 ((1
𝛽)𝑛
) −∑𝑦𝑖𝛽
= 𝑛 𝑙𝑛(1) − 𝑛 𝑙𝑛(𝛽) −∑𝑦𝑖𝛽
= −𝑛 𝑙𝑛(𝛽) −∑𝑦𝑖𝛽
Penduga kemungkinan maksimum dari 𝛽 adalah nilai yang memaksimumkan
ln[𝐿(𝛽)], dengan mencari nilai turunan parsial terhadap 𝛽, maka diperoleh
𝜕 ln[𝐿(𝛽)]
𝜕𝛽= 0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
−𝑛
𝛽+∑𝑦𝑖𝛽2
= 0
−𝑛𝛽 + ∑𝑦𝑖𝛽2
= 0
−𝑛𝛽 +∑𝑦𝑖 = 0
�̂� =∑𝑦𝑖𝑛
Jadi penduga kemungkinan maksimum untuk 𝛽 adalah
�̂� =∑𝑦𝑖𝑛
G. Metode Numerik Newton-Raphson
Pendugaan parameter model regresi Binomial Negatif dilakukan dengan
metode pendugaan kemungkinan maksimum. Proses untuk menemukan solusi dari
turunan fungsi log-likelihood tidak dapat dilakukan secara langsung karena fungsi
log-likelihood tidak linear dalam parameter yang ingin ditaksir sehingga
membutuhkan metode numerik Newton-Raphson untuk menyelesaikannya.
Metode Newton-Raphson adalah metode yang digunakan untuk mencari akar-akar
persamaan dari suatu fungsi non-linear f(x)=0 dengan metode pendekatan yang
menggunakan satu titik awal dan mendekatinya dengan memperhatikan slope atau
gradien pada titik tersebut. Metode Newton-Rhapson yang diperoleh dari deret
Taylor.
Misalkan 𝑓 mempunyai akar pada suatu interval real dan akan dicari nilai
pendekatan akarnya. Deret Taylor 𝑓 di sekitar 𝑥 = 𝑥𝑛 adalah
𝑓(𝑥) = 𝑓(𝑥𝑛) + 𝑓′(𝑥𝑛)(𝑥 − 𝑥𝑛) +
𝑓"(𝑥𝑛)
2!(𝑥 − 𝑥𝑛)
2 +⋯
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
Untuk 𝑥 yang cukup dekat dengan 𝑥𝑛 maka suku-suku nonlinear dapat
diabaikan, maka akan diperoleh pendekatan
𝑓(𝑥) = 𝑓(𝑥𝑛) + 𝑓′(𝑥𝑛)(𝑥 − 𝑥𝑛)
Jika 𝑥 adalah akar dari 𝑓 maka 𝑓(𝑥) = 0
0 = 𝑓(𝑥𝑛) + 𝑓′(𝑥𝑛)(𝑥 − 𝑥𝑛)
−𝑓(𝑥𝑛) = 𝑓′(𝑥𝑛)(𝑥 − 𝑥𝑛)
𝑥 − 𝑥𝑛 = −𝑓(𝑥𝑛)
𝑓′(𝑥𝑛)
𝑥 = 𝑥𝑛 −𝑓(𝑥𝑛)
𝑓′(𝑥𝑛)
Oleh karena itu diperoleh skema iterasi ke 𝑛 + 1 metode Newton-Raphson adalah
𝑥𝑛+1 = 𝑥𝑛 −𝑓(𝑥𝑛)
𝑓′(𝑥𝑛)
Contoh 2.2
Selesaikan persamaan 𝑥3 − 𝑥 − 1 = 0 dengan menggunakan metode Newton-
Raphson yang diketahui 𝑥0 = 1 dan toleransi adalah 10−7
Penyelesaian:
Diketahui:
𝑓(𝑥) = 𝑥3 − 𝑥 − 1
𝑥0 = 1
Toleransi = 10−7
Oleh karena itu, diperoleh 𝑓′(𝑥) = 3𝑥2 − 1
Skema iterasi ke 𝑛 + 1 metode Newton Raphson adalah
𝑥𝑛+1 = 𝑥𝑛 −𝑓(𝑥𝑛)
𝑓′(𝑥𝑛)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
30
Sehingga, Untuk 𝑛 = 0, diperoleh
𝑥0+1 = 𝑥0 −𝑓(𝑥0)
𝑓′(𝑥0)
𝑥1 = 1 −𝑥03 − 𝑥0 − 1
3𝑥02 − 1
= 1 −13 − 1 − 1
312 − 1=3
2= 1.5
𝑓 (3
2) = 0.875
Untuk 𝑛 = 1, diperoleh
𝑥1+1 = 𝑥1 −𝑓(𝑥1)
𝑓′(𝑥1)
𝑥2 =3
2−𝑥13 − 𝑥1 − 1
3𝑥12 − 1
=3
2−(32)
3
−32 − 1
3 (32)
2
− 1
=31
23
= 1.347826087
𝑓 (31
23) = 0.1006821
Untuk 𝑛 = 2 diperoleh
𝑥2+1 = 𝑥2 −𝑓(𝑥2)
𝑓′(𝑥2)
𝑥3 = 𝑥2 −𝑥23 − 𝑥2 − 1
3𝑥22 − 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
31
=31
23−(3123)
3
−3123 − 1
3 (3123)
2
− 1
= 1.325200399
𝑓(1.325200399) = 2.058362126 × 10−3
Untuk 𝑛 = 3 diperoleh
𝑥3+1 = 𝑥3 −𝑓(𝑥3)
𝑓′(𝑥3)
𝑥4 = 𝑥3 −𝑥33 − 𝑥3 − 1
3𝑥32 − 1
= 1.325200399
−(1.325200399)3 − 1.325200399 − 1
3(1.325200399)2 − 1
= 1.324718174
𝑓(1.324718174) = −1.04376 × 10−7
Untuk 𝑛 = 4 diperoleh
𝑥4+1 = 𝑥4 −𝑓(𝑥4)
𝑓′(𝑥4)
𝑥5 = 𝑥4 −𝑥43 − 𝑥4 − 1
3𝑥42 − 1
= 1.324718174
−(1.324718174)3 − 1.324718174 − 1
3(1.324718174)2 − 1
= 1.324717957
𝑓(1.324717957) = −1.04376 × 10−9
Sehingga akar dari persamaan 𝑥3 − 𝑥 − 1 = 0 adalah 1.324717957 ≈ 1.324718.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
32
H. Keluarga Eksponensial
Suatu fungsi probabilitas yang tergantung pada suatu parameter 𝜃 dari suatu
variable random 𝑌 dikatakan termasuk dalam keluarga eksponensial apabila dapat
dituliskan sebagai
𝑓(𝑦; 𝜃, 𝜙) = exp {𝑦𝑖𝜃𝑖 − 𝑏(𝜃𝑖)
𝛼𝑖(𝜙)+ 𝑐(𝑦𝑖; 𝜙)}
2.6
Dengan:
𝜃𝑖 adalah parameter kanonik atau fungsi penghubung
𝑏(𝜃𝑖) adalah cumulant
𝛼(𝜙) adalah parameter skala, 𝛼(𝜙) = 1 jika merupakan model count dan diskrit
𝑐(𝑦𝑖; 𝜙) adalah suku normalisasi untuk menjamin bahwa total nilai fungsi
probabilitas adalah 1
Bentuk keluarga eksponensial adalah unik karena turunan pertama dan
turunan kedua dari cumulant terhadap 𝜃 akan menghasilkan mean dan variansi. Hal
penting yang harus diingat adalah jika seseorang dapat mengkonversi sebuah fungsi
probabilitas ke dalam bentuk keluarga eksponensial maka dapat dengan mudah
menghitung mean dan variansi. Semua anggota model linear umum dapat
dikonversi ke dalam bentuk eksponensial dengan
𝑏′(𝜃𝑖) = mean
𝑏"(𝜃𝑖) = variansi
Macam-macam keluarga eksponensial antara lain adalah:
1. Distribusi Binomial Negatif
2. Distribusi Poisson
3. Distribusi Gamma
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
33
4. Distribusi Beta, dan
5. Distribusi Normal.
Pada skripsi ini, penulis hanya akan mendeskripsikan bahwa distribusi
Poisson dan distribusi Binomial adalah anggota keluarga eksponensial. Berikut
akan ditunjukan bahwa
1. Distribusi Poisson merupakan keluarga eksponensial
Variabel random 𝑌 disebut berdistribusi Poisson jika dan hanya jika fungsi
probabilitasnya sebagai berikut
𝑓(𝑦) =𝜆𝑦
𝑦!𝑒−𝜆, 𝑦 = 0,1,2, … dan 𝜆 > 0
untuk menunjukkan bahwa distribusi Poisson merupakan keluarga
eksponensial maka persamaan di atas ditulis ke dalam bentuk persamaan 2.6
yaitu
𝑓(𝑦; 𝜃, 𝜙) = exp {𝑦𝑖𝜃𝑖 − 𝑏(𝜃𝑖)
𝛼𝑖(𝜙)+ 𝑐(𝑦𝑖; 𝜙)}
Langkah-langkahnya adalah sebagai berikut:
a. Kedua ruas dari fungsi probabilitas distribusi Poisson di ubah dalam bentuk
log diperoleh
𝑙𝑜𝑔 (𝑓(𝑦)) = log (𝜆𝑦
𝑦!𝑒−𝜆)
log(𝑓(𝑦)) = 𝑦 log 𝜆 − 𝜆 − log (𝑥!) 2.7
b. Persamaan 2.7 diubah dalam bentuk eksponensial diperoleh
𝑓(𝑦) = 𝑒𝑥𝑝{𝑦 log 𝜆 − 𝜆 − log (𝑥!)} 2.8
Sehingga dari persamaan 2.8 diperoleh
𝜃 = log 𝜆 sehingga 𝜆 = 𝑒𝜃; 𝑏(𝜃) = 𝑒𝜃, 𝛼𝑖(𝜙) = 1; 𝑐(𝑦𝑖; 𝜙) = −log (𝑥!)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
34
Sehingga turunan pertama dan turunan kedua dari 𝑏(𝜃) = 𝑒𝜃 terhadap 𝜃
akan menghasilkan mean dan variansi sebagai berikut:
𝐸(𝑌) =𝜕(𝑏(𝜃))
𝜕𝜃
=𝜕(𝑒𝜃)
𝜕𝜃
= 𝑒𝜃
= 𝜆
𝑉𝑎𝑟(𝑌) = 𝛼𝑖(𝜙) 𝜕2(𝑏(𝜃))
𝜕𝜃2
=𝜕2(𝑒𝜃)
𝜕𝜃2
= 𝑒𝜃
= 𝜆
2. Distribusi Binomial merupakan keluarga eksponensial
Variabel random 𝑋 yang menyatakan banyaknya sukses pada 𝑛 kali percobaan
Bernoulli berdistribusi Binomial yang diberikan dengan 𝑓(𝑥) yaitu
𝑓(𝑥) = (𝑛𝑥)𝑝𝑥(1 − 𝑝)𝑛−𝑥
untuk menunjukkan bahwa distribusi Binomial merupakan keluarga
eksponensial maka persamaan di atas ditulis ke dalam bentuk persamaan 2.6
yaitu
𝑓(𝑦; 𝜃, 𝜙) = exp {𝑦𝑖𝜃𝑖 − 𝑏(𝜃𝑖)
𝛼𝑖(𝜙)+ 𝑐(𝑦𝑖; 𝜙)}
Langkah-langkahnya adalah sebagai berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
35
a. Kedua ruas dari fungsi probabilitas distribusi Binomial diubah dalam
bentuk log diperoleh
log(𝑓(𝑥)) = 𝑙𝑜𝑔 (𝑛𝑥) + 𝑥 𝑙 log 𝑝 + (𝑛 − 𝑥) log(1 − 𝑝) 2.9
b. Persamaan 2.9 diubah dalam bentuk eksponensial diperoleh
𝑓(𝑥) = 𝑒𝑥𝑝 {𝑥[log 𝑝 − log(1 − 𝑝)] + 𝑛 log(1 − 𝑝) + 𝑙𝑜𝑔 (𝑛𝑥)}
= 𝑒𝑥𝑝 {𝑥 log (𝑝
1 − 𝑝) + 𝑛 log(1 − 𝑝) + 𝑙𝑜𝑔 (
𝑛𝑥)} 2.10
Dari persamaan 2.10 diperoleh 𝜃 = log (𝑝
1−𝑝) sehingga 𝑒𝜃 =
𝑝
1−𝑝
karena 𝑝 =𝑒𝜃
1+𝑒𝜃 sehingga 1 − 𝑝 = (1 + 𝑒𝜃)
−1, 𝑏(𝜃) = 𝑛 log(1 + 𝑒𝜃)
dan 𝑐(𝑥; 𝜙) = 𝑙𝑜𝑔 (𝑛𝑥).
Sehingga turunan pertama dan turunan kedua dari 𝑏(𝜃) = 𝑛 log(1 +
𝑒𝜃) terhadap 𝜃 akan menghasilkan mean dan variansi sebagai berikut:
𝐸(𝑌) =𝜕(𝑏(𝜃))
𝜕𝜃
=𝜕(𝑛 log(1 + 𝑒𝜃))
𝜕𝜃
= 𝑛𝑒𝜃
1 + 𝑒𝜃
= 𝑛𝑝
𝑉𝑎𝑟(𝑌) = 𝛼𝑖(𝜙) 𝜕2(𝑏(𝜃))
𝜕𝜃2
=𝜕2(𝑛 log(1 + 𝑒𝜃))
𝜕𝜃2
=𝑛𝑒𝜃
(1 + 𝑒𝜃)2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
= 𝑛𝑝(1 − 𝑝)
I. Model Regresi Linear Berganda
Model regresi linear berganda merupakan perluasan dari model regresi
linear sederhana. Regresi berganda seringkali digunakan untuk mengatasi
permasalahan analisis regresi yang melibatkan hubungan dari dua atau lebih
variable independen. Salah satu contoh penggunaan regresi berganda di bidang
pertanian di antaranya ilmuwan pertanian menggunakan analisis regresi untuk
mengetahui antara hasil pertanian (misal: produksi padi per hektar) dengan jenis
pupuk yang digunakan, kualitas pupuk yang diberikan, jumlah hari hujan, suhu,
lama penyinaran matahari, dan infeksi serangga. Sebuah model regresi berganda
dapat menerangkan hubungan tersebut yaitu
𝑌 = 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + 𝛽3𝑥3𝑖 + 𝛽4𝑥4𝑖 + 𝛽5𝑥5𝑖 + 𝛽6𝑥6𝑖 + 𝜀𝑖
Dengan 𝑌 menyatakan hasil pertanian, 𝑥1 menyatakan jenis pupuk yang
digunakan, 𝑥2 menyatakan kuantitas pupuk yang diberikan , 𝑥3 menyatakan jumlah
hari hujan, 𝑥4 menyatakan suhu, 𝑥5 menyatakan lama penyinaran matahari, dan 𝑥6
menyatakan infeksi serangga. Persamaan di atas adalah sebuah model regresi linear
berganda dengan enam variable independen.
Pada umumnya, variable dependen 𝑌 dapat dihubungkan pada 𝑝 variabel-
variabel independen yang dapat ditulis dalam bentuk:
𝑌 = 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + 𝛽3𝑥3𝑖 +⋯+ 𝛽𝑝𝑥𝑝𝑖 + 𝜀𝑖 2.11
Persamaan 2.11 merupakan sebuah model regresi linear berganda dengan:
𝑌 = variabel tak bebas
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
𝛽0 = intersep
𝛽𝑝 = koefisien regresi dari variabel bebas ke − 𝑝
𝜀𝑖 = galat (𝑒𝑟𝑟𝑜𝑟)
𝑖 = 1, 2, 3,⋯ , 𝑝
𝑥𝑝𝑖 = nilai variabel bebas ke − p pada pengamatan ke − i
Persamaan 2.11 dapat dinayatakan dalam bentuk matriks menjadi:
[
𝑌1𝑌2⋮𝑌𝑛
] =
[ 1 𝑥11 𝑥21 ⋯ 𝑥𝑝11 𝑥12 𝑥22 ⋯ 𝑥𝑝2⋮ ⋮ ⋮ ⋱ ⋮1 𝑥1𝑛 𝑥2𝑛 ⋯ 𝑥𝑝𝑛]
[
𝛽0𝛽1⋮𝛽𝑝
] + [
𝜀1𝜀2⋮𝜀𝑛
]
Matriks tersebut dapat dinyatakan sebagai berikut
𝒚 = 𝒙𝜷 + 𝜺
Dengan:
𝒚 = vektor kolom dari variabel tak bebas berordo (𝑛 × 1)
𝒙 = matriks dari variabel bebas berordo (𝑛 × (𝑝 + 1))
𝜷 = vektor kolom dari parameter berordo ((𝑝 + 1) × 1)
𝜺 = vektor kolom dari galat berordo (𝑛 × 1)
J. Jenis Data Penelitian
1. Data berdasarkan sumbernya
Berdasrkan sumbernya, data penelitian dapat dikelompokkan dalam dua
jenis, yaitu data primer dan data sekunder.
a. Data primer adalah data yang diperoleh atau dikumpulkan oleh peneliti secara
langsung dari sumber data utama. Untuk mendapatkan data primer, peneliti
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
harus mengumpulkannya secara langsung. Teknik yang dapat digunakan
peneliti untuk mengumpulkan data primer antara lain observasi, wawancara,
dan penyebaran kuesioner.
b. Data sekunder adalah data yang diperoleh atau dikumpulkan oleh peneliti dari
berbagai sumber yang telah ada. Data sekunder dapat diperoleh dari berbagai
sumber seperti Biro Pusat statistik (BPS), buku, jurnal, dan lain-lain.
2. Data berdasarkan bentuk dan sifatnya
Berdasarkan bentuk dan sifanya, data penelitian dapat dibedakan dalam dua
jenis yaitu data kualitatif dan data kuantitatif. Data kuantitaif dapat
dikelompokkan berdasarkan cara untuk mendapatkannya, yaitu data diskrit dan
data kontinu. Berdasarkan sifatnya, data kuantitatif terdiri atas data nominal,
data ordinal, data interval dan data rasio.
1. Data kualitatif
Data kualitatif adalah data yang berbentuk kata-kata, bukan dalam
bentuk angka. Data kualitatif diperoleh melalui berbagai macam teknik
pengumpulan data misalnya wawancara, analisis dokumen, dan lainnya.
2. Data kuantitatif
Data kuantitatif adalah data yang berbentuk angka atau bilangan. Sesuai
dengan bentuknya, data kuantitatif dapat diolah atau dianalisis
menggunakan teknik perhitungan matematika atau statistika. Berdasarkan
proses atau cara untuk mendapatkannya, data kuantitatif dapat
dikelompokkan dalam dua bentuk yaitu sebagai berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
a. Data diskrit adalah data dalam bentuk angka (bilangan) yang diperoleh
dengan cara membilang. Contohnya jumlah Sekolah Dasar Negeri di
Kecamatan X adalan 20.
b. Data kontinu adalah data dalam bentuk angka/ bilangan yang diperoleh
berdasarkan hasil pengukuran. Data kontinu dapat berbentuk bilangan
bulat atau pecahan tergantung jenis skal pengukuran yang digunakan.
Contohnya tinggi badan Budi adalah 150.5 centimeter.
Berdasarkan tipe skala pengukuran yang digunakan, data kuantitatif
dapat dikelompokkan dalam empat jenis yang memiliki sifat berbeda
yaitu:
1) Data nominal atau sering disebut juga data kategori adalah data yang
diperoleh melalui pengelompokkan obyek berdasrkan kategori
tertentu. Perbedaan kategori obyek hanyalah menunjukkan
perbedaan kualitatif. Walaupun data nominal dapat dinyatakan
dalam bentuk angka, namun angka tersebut tidak memiliki urutan
atau makna matematis sehingga tidak dapat digunakan untuk
menganalisis data nominal. Contohnya jenis kelamin yang terdiri
dari dua kakategori yaitu laki-laki (0) dan perempuan (1), angka 0,
dan 1 hanyalah simbol yang digunakan untuk membedakan dua
kategori jenis kelamin. Angka-angka tersebut tidak memilki makna
kuantitatif artinya angka (1) pada data di atas tidak berarti lebih
besar dari angka (0), karena laki-laki tidak memiliki makna lebih
besar dari perempuan. Contoh lainnya dalah status pernikahan yang
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
terdiri dari empat kategori yatu (1) belum menikah (2) menikah (3)
janda/duda (4) bercerai. Data tersebut memiliki sifat-sifat yang
sama dengan data tentang jenis kelamin.
2) Data ordinal adalah data yang berasal dari suatu objek atau kategori
yang telah disusun secara berjenjang menurut besarnya. Setiap data
ordinal memiliki tingkatan tertentu yang dapat diurutkan mulai dari
yang terendah sampai tertinggi ataupun sebaliknya. Namun
demikian, jarak atau rentang antar jenjang tidak harus sama.
Dibandingkan dengan data nominal, data ordinal memiliki sifat
berbeda dalam hal urutan. Data ordinal berlaku perbandingan
dengan menggunakan simbol " > " dan " < ". Contohnya peringkat
siswa dalam satu kelas yang menunjukkan urutan prestasi belajar
tertinggi sampai terendah. Siswa pada peringkat (1) memiliki
prestasi belajar lebih tingi dari pada siswa peringkat (2).
3) Data interval adalah data hasil pengukuran yang dapat diurutkan atas
dasar kriteria tertentu serta menunjukan semua sifat yang dimiliki
oleh data ordinal. Kelebihan sifat data interval dibandingkan dengan
data ordinal adalah memiliki sifat kesamaan jarak. Data interval
dapat dilakukan operasi matematik penjumlahan dan pengurangan
(+,−). Namun demikian masih terdapat satu sifat yang belum
dimiliki yaitu tidak adanya angka nol mutlak pada data interval.
4) Data rasio adalah data yang berbentuk angka dalam arti
sesungguhnya karena dilengkapi dengan titik nol absolut sehingga
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
41
dapat diterapkan semua bentuk operasi matematik (+,−, ×, ∶).
Contohnya panjang suatu benda yang dinyatakan dalam ukuran
meter adalah data rasio. Benda yang panjangnya 1 meter berbeda
secara nyata dengan benda yang panjangnya 2 meter sehingga dapat
dibuat kategori benda yang berukuran 1 meter dan 2 meter (sifat data
nominal). Ukuran panjang benda dapat diurutkan mulai dari yang
terpanjang sampai yang terpendek (sifat data ordinal). Perbedaan
antar benda yang panjangnya 1 meter dengan 2 meter memiliki jarak
yang sama dengan perbedaan antar benda yang panjangnya 2 meter
dengan 3 (sifat data interval). Kelebihan sifat yang dimiliki data
rasio ditunjukkan oleh dua hal yaitu: (1) Angka 0 meter
menunjukkan nilai mutlak yang artinya tidak ada benda yang diukur;
serta (2) benda yang panjangnya 2 meter, 2 kali lebih panjang
dibandingkan dengan benda yang panjangnya 1 meter yang
menunjukkan berlakunya semua operasi matematik. Kedua hal
tersebut tidak berlaku untuk jenis data nominal, data ordianal,
maupun data interval.
K. Model Count Respon
Model count respon adalah bagian dari model regresi dengan variabel
respon diskrit. Variabel respon diskrit dapat berupa data count yaitu data dengan
nilai bilangan bulat non-negatif. Contoh model diskrit adalah sebagai berikut:
Model regresi logistik biner dan regresi probit
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
Model regresi Poisson dan Regresi Binomial Negatif
1. Model regresi logistik biner dan regresi probit
a. Regresi Logistik Biner
Regresi logistik merupakan teknik statistik yang tepat digunakan ketika
variabel dependen berbentuk diskrit/kategorial (non-metrik) dan variabel
independen dapat berbentuk metrik atau non-metrik. Dengan kata lain, regresi
logistik merupakan model yang dapat digunakan untuk menggambarkan
hubungan antara beberapa variabel independen dengan sebuah variabel
dependen yang bersifat dikotomi. Untuk membedakan antara model regresi
logistik dengan model regresi linear dapat dilihat pada variabel dependennya.
Pada regresi logistik, variabel dependen berbentuk biner atau dikotomi
sedangkan pada regresi linear variabel dependen diasumsikan kontinu. Contoh
apakah seseorang akan membeli barang ilegal (ya atau tidak), dengan variabel
prediktornya adalah tingkat pendidikan, tingkat pendapatan, dan status
perkawinan? Jadi regresi logistik biner digunakan ketika variabel dependen
adalah dikotomi sedangkan variabel independen dapat berbagai tipe.
Definisi 2.17
Model regresi logistik dengan 𝑝 variabel bebas adalah sebagai berikut:
𝜋(𝑿) =𝑒𝑔(𝑿)
1 + 𝑒𝑔(𝑿)
dengan, 𝑔(𝑿) = 𝛽0 + ∑ 𝛽𝑗𝑥𝑗𝑝𝑗=1 𝛽𝑗 koefisien regresi dari variabel bebas ke-j,
𝑥𝑗 adalah nilai variabel bebas ke-j dari sejumlah p variable bebas dan 𝛽0 adalah
konstanta.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
43
b. Regresi Probit
Regresi probit sebenarnya serupa dengan regresi logistik yaitu dapat
digunakan untuk menganalisis variabel dependen yang bersifat kategori,
namun pada regresi probit variabel dependen diasumsikan berdistribusi
normal. Jadi, regresi logitik berdasarkan pada asumsi variabel dependen
bersifat kategori (variabel kualitatif ) serta menggunakan distribusi
Binomial dan regresi probit mengasumsikan variabel dependen yang
bersifat kategori (variabel kuantitatif) dan menggunakan distribusi
kumulatif normal.
Definisi 2.18
Model regresi probit dapat dituliskan sebagai berikut:
𝑌 = 𝛽0 + 𝛽𝑖𝑥𝑖 + 𝜀
Dengan 𝑌 adalah variabel dependen berdistribusi normal, 𝛽0 merupakan
intersep yang tidak diketahui, 𝛽𝑖 = (𝛽1, 𝛽2, ⋯ , 𝛽𝑝) adalah parameter
koefisien, 𝑥𝑖 = (𝑥1, 𝑥2, ⋯ , 𝑥𝑝) adalah variabel independen dan 𝜀 adalah
galat yang diasumsikan berdistribusi normal dengan mean nol dan variansi
𝜎2.
2. Model regresi Poisson dan Regresi Binomial Negatif
Dalam skripsi ini, penulis hanya membahas tentang model count. Semua
model count bertujuan untuk menjelaskan banyaknya kejadian dalam interval
waktu, ruang, atau volume tertentu dari suatu peristiwa. Ketika variabel dependen
berupa data count, maka analisis regresi yang biasa digunakan adalah analisis
regresi Poisson.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
44
Pada umumnya, distribusi Poisson merupakan suatu model yang realistis
untuk berbagai macam fenomena acak selama nilai dari peubah acak Poisson
berupa bilangan bulat non-negatif. Misalkan banyaknya kecelakaan mobil setiap
bulan, banyaknya hujan badai setiap tahun, dan kasus lainnya. Pada model Regresi
Poisson terdapat asumsi yang harus dipenuhi yaitu variansi dari variabel responnya
sama dengan mean atau disebut ekuidispersi. Pada kenyataannya asumsi ini sangat
jarang terjadi karena data count memiliki variansi yang lebih besar dari meannya
atau disebut overdispersi. Dalam kondisi seperti ini model regresi Binomial Negatif
merupakan salah satu alternatif yang tepat untuk mengatasinya.
Model regresi Binomial Negatif memiliki kegunaan yang sama dengan
model regresi Poisson yaitu untuk menganalisis hubungan antara suatu variabel
respon data count dengan satu atau lebih variabel independen, tetapi model regresi
Binomial Negatif lebih fleksibel dibandingkan dengan model Regresi Poisson
karena asumsi mean dan variansi dari model Regresi Binomial Negatif tidak harus
sama.
Menurut Hilbe (2011) ada dua pendekatan dasar untuk mengestimasi model
data count yaitu
1. Pendugaan Kemungkinan Maksimum
2. Iteratively re-weighted least squares (IRLS)
Dalam skripsi ini, penulis mengestimasi model data count dengan menggunakan
pendugaan kemungkinan maksimum.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
45
L. Uji Kolmogorov-Smirnov
Hal yang sangat penting dalam prosedur statistik adalah menentukan
distribusi yang mendasari suatu kumpulan data (atau variabel random). Oleh karena
itu, dalam skripsi ini untuk mengetahui apakah sampel berdistribusi Poisson akan
digunakan uji Kolmogorov-Smirnov. Uji Kolmogorov-Smirnov adalah suatu uji
goodness of fit test (kecocokan), artinya yang diperhatikan adalah tingkat
kesesuaian antara sebaran dari serangkaian nilai sampel yang diobservasi dengan
suatu distribusi teoritis tertentu.
Dalam uji Kolmogorov-Smirnov, pengujian dilakukan pada dua buah fungsi
sebaran kumulatif, yaitu sebaran kumulatif yang hipotesiskan dan sebaan kumulatif
yang diamati. Misalkan diambil sebuah sampel acak dari suau fungsi sebaran 𝐹(𝑋)
yang belum diketahui, akan dipastikan apakah dapat disimpulkan bahwa 𝐹(𝑥) =
𝐹0(𝑋) untuk semua 𝑥, dengan 𝐹0(𝑋) adalah fungsi distribusi kumulatif yang
dihipotesiskan.
Misalkan variabel random 𝑋1, 𝑋2, … , 𝑋𝑛 berasal dari distribusi yang tidak
diketahui 𝐹(𝑥), akan diuji hipotesis bahwa 𝐹(𝑥) adalah sama dengan suatu
distribusi tertentu 𝐹0(𝑥).
Definisi 2.19
Misalkan 𝑋1, 𝑋2, … , 𝑋𝑛 adalah variabel random. Fungsi distribusi empiris 𝐹�̂�(𝑥) di
definisikan sebagai
𝐹�̂�(𝑥) =𝑖
𝑛∑ 𝐼{𝑥𝑖≤𝑥}
𝑛
𝑖=1
𝐼{𝑥𝑖≤𝑥} adalah fungsi indikator
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
46
𝐼 = {1, 𝑗𝑖𝑘𝑎 𝑥𝑖 ≤ 𝑥 0, 𝑗𝑖𝑘𝑎 𝑥𝑖 > 𝑥
Definisi 2.20
Statistik uji Kolmogorov-Smirnov 𝐷𝑛 di definisikan sebagai
𝐷𝑛 = max(𝐷+, 𝐷−)
𝐷+ = max[�̂�𝑛(𝑥) − 𝐹0(𝑥)]
𝐷− = max[𝐹0(𝑥) − �̂�𝑛−1(𝑥)]
Dengan �̂�𝑛(𝑥) adalah fungsi distribusi empiris. Fungsi distribusi empiris berguna
sebagai penduga dari fungsi distribusi yang tidak diketahui 𝐹(𝑥).
Hipotesis uji Kolmogorov-Smirnov adalah
𝐻0: 𝐹(𝑥) = 𝐹0(𝑥)
untuk setiap 𝑥 dengan 𝐹0 adalah fungsi distribusi kumulatif yang diketahui, dan
𝐻1: 𝐹(𝑥) ≠ 𝐹0(𝑥)
Jika 𝐷𝑛 lebih dari 𝐷𝑡𝑎𝑏𝑒𝑙 yang diberikan oleh tabel Kolmogorov-Smirnov maka 𝐻0
ditolak pada tingkat signifikansi 𝛼.
Langkah-langkah uji Kolmogorov-Smirnov untuk distribusi Poisson adalah
sebagai berikut:
1. 𝐻0 = data berdistribusi Poisson
𝐻1 = data tidak berdistribusi Poisson
2. Tentukan tingkat signifikansi 𝛼
3. Statistik uji
𝐷𝑛 = max(𝐷+, 𝐷−)
4. Hitunglah 𝐹0(𝑥) berdasarkan fungsi distribusi kumulatif dari distribusi Poisson
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
47
5. Berdasarkan Definisi 2.19 hitunglah fungsi distribusi empiris 𝐹�̂�(𝑥)
6. Berdasarkan Definisi 2.20 hitunglah nilai 𝐷+ dan 𝐷− , dan tentukan maksimum
dari 𝐷 (𝐷 = maksimum(𝐷+ , 𝐷− )
7. Daerah keputusan :
𝐻0 ditolak jika 𝐷𝑛 ≥ 𝐷 𝛼
8. Kesimpulan
Untuk memudahkan perhitungan, uji Kolmogorov-Smirnov dapat dilakukan
dengan SPSS. Contohnya dapat dilihat dalam contoh 2.4 berikut ini:
Contoh 2.4
Berikut adalah data suatu sampe acak. Akan diuji apakah datanya berdistribusi
Poisson?
Table 2.1 Data suatu sampel acak
Data 0 1 2 3 4 5 6
7 8 1 1 1 0 1
Uji hipotesis:
1. 𝐻0 = data berdistribusi Poisson
𝐻1 = data tidak berdistribusi Poisson
2. Tingkat signifikansi 𝛼 = 0.05
3. Daerah penolakan
Asymp.Sig.(2-tailed)< 𝛼 maka 𝐻0 ditolak
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
48
Table 2.2 Hasil Pengujian Kolmogorov-Smirnov
4. Dari hasil uji Kolmogorov-Smirnov di atas tampak bahwa nilai Asymp.Sig.(2-
tailed) adalah 0.281. jadi, Asymp.Sig.(2-tailed)> 𝛼. Dengan demikian berarti
𝐻0 diterima. Jadi, dapat disimpulkan bahwa data berdistribusi Poisson.
One-Sample Kolmogorov-Smirnov Test
Data
N 16
Poisson Parametera,,b Mean 3.06
Most Extreme
Differences
Absolute .247
Positive .247
Negative -.117
Kolmogorov-Smirnov Z .990
Asymp. Sig. (2-tailed) .281
a. Test distribution is Poisson.
b. Calculated from data.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
50
BAB III
PENDUGAAN MODEL REGRESI BINOMIAL NEGATIF
A. Model Regresi Poisson Berganda
Model regresi Poisson Berganda merupakan perluasan dari model regresi
Poisson sederhana, dengan model regresi Poisson Berganda akan diketahui
hubungan antara sebuah variabel dependen 𝑌 yang bersifat diskrit, bernilai bulat
tak negatif dan berdistribusi Poisson dengan 𝑝 buah variabel independen 𝑋1, 𝑋2,
𝑋3, ⋯, 𝑋𝑝 yang berjenis diskrit, kontinu atau kategorik. Model regresi Poisson
secara umum digunakan untuk menganalisis data diskrit yang variabel dependennya
berdistribusi Poisson, yang memiliki rata-rata dan variansi sama dengan 𝜆 > 0.
Bila diberikan variabel dependen 𝑌 berdistribusi Poisson dengan 𝑝 variabel
independen 𝑋1, 𝑋2, 𝑋3, ⋯, 𝑋𝑝, persamaan regresi 𝑌 dengan 𝑋1, 𝑋2, 𝑋3, ⋯, 𝑋𝑝
dinyatakan seperti persamaan 2.11, maka nilai harapan 𝑌 dengan 𝑋1𝑖 = 𝑥1𝑖, 𝑋2𝑖 =
𝑥2𝑖, 𝑋3𝑖 = 𝑥3𝑖, ⋯, 𝑋𝑝𝑖 = 𝑥𝑝𝑖 sebagai berikut
𝐸(𝑌| 𝑋1𝑖 = 𝑥1𝑖 , 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖 , ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖)
= 𝐸(𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + 𝛽3𝑥3𝑖 + ⋯+ 𝛽𝑝𝑥𝑝𝑖
+ 𝜀𝑖|𝑋1𝑖 = 𝑥1𝑖, 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖, ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
51
= 𝐸(𝛽0|𝑋1𝑖 = 𝑥1𝑖, 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖, ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖)
+ 𝐸(𝛽1𝑋1𝑖|𝑋1𝑖 = 𝑥1𝑖 , 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖 , ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖) + ⋯
+ 𝐸(𝛽𝑝𝑋𝑝𝑖|𝑋1𝑖 = 𝑥1𝑖, 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖, ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖)
+ 𝐸(𝜀𝑖|𝑋1𝑖 = 𝑥1𝑖, 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖 , ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖)
dengan asumsi bahwa 𝐸(𝜀𝑖|𝑋𝑖) = 0, maka
= 𝛽0 + 𝛽1𝐸(𝑋1𝑖|𝑋1𝑖 = 𝑥1𝑖, 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖, ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖) + ⋯
+ 𝛽𝑝𝐸(𝑋𝑝𝑖|𝑋1𝑖 = 𝑥1𝑖 , 𝑋2𝑖 = 𝑥2𝑖, 𝑋3𝑖 = 𝑥3𝑖 , ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖) + 0
= 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯+ 𝛽𝑝𝑥𝑝𝑖 3.1
Dikarenakan 𝑌|𝑋𝑝𝑖 berdistribusi Poisson, maka nilai rata-ratanya 𝐸(𝑌|𝑋𝑝𝑖) = 𝛽0 +
𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯+ 𝛽𝑝𝑥𝑝𝑖 = 𝜆 harus bernilai tak negatif (dalam interval (𝑜,∞)),
padahal telah diketahui bahwa nilai regresi 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯+ 𝛽𝑝𝑥𝑝𝑖 ada
dalam interval (−∞,∞). Oleh karena itu, diperlukan fungsi penghubung (link
function) 𝑔 yang dapat membuat 𝜆 memiliki nilai dalam interval (𝑜,∞), yaitu
dengan fungsi penghubung logaritma (logarithm link), sehingga
𝑔(𝜆) = 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯+ 𝛽𝑝𝑥𝑝𝑖 3.2
𝑔 merupakan fungsi logaritma, sehingga model regresi Poisson menjadi
ln(𝜆) = 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯+ 𝛽𝑝𝑥𝑝𝑖 3.3
Atau persamaan 3.3 dapat juga dinyatakan dengan
𝜆 = exp (𝒙𝒊′𝜷) 3.4
Model regresi Poisson merupakan regresi non-linear yang termasuk keluarga
eksponensial.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
52
Parameter 𝜷 dalam model regresi Poisson dapat diduga dengan salah satu
metode penduga yaitu metode penduga kemungkinan maksimum (Maximum
Likelihood Estimation).
Fungsi peluang dari distribusi Poisson adalah
𝑝(𝑦|𝜆) =𝜆𝑦
𝑦!𝑒−𝜆, 𝑦 = 0,1,2, … dan 𝜆 = exp (𝒙𝒊
′𝜷) sehingga
𝑝(𝑦|𝜆) =(exp(𝒙𝒊
′𝜷))𝑦 exp(−exp(𝒙𝒊′𝜷))
𝑦!
=exp (−exp (𝒙𝒊
′𝜷))(exp (𝑦𝒙𝒊′𝜷)
𝑦!
Berdasarkan persamaan 2.3 diperoleh fungsi likelihood berikut:
𝐿(𝛽) = 𝑝(𝑦1, 𝑦2, … , 𝑦𝑛|𝑥11, ⋯ , 𝑥𝑝𝑖; 𝜷)
= ∏𝑝(𝑦𝑖|𝑥𝑝𝑖
𝑛
𝑖=1
; 𝜷)
= ∏exp (−exp (𝒙𝒌𝒊
′ 𝜷))(exp (𝑦𝑖𝒙𝒌𝒊′ 𝜷)
𝑦!
𝑛
𝑖=1
Untuk mendapatkan penduga kemungkinan maksimum dari 𝛽, digunakan fungsi
log-likelihood sebagai berikut:
ln 𝐿(𝛽) = 𝑙𝑛 ∏exp(−exp(𝒙𝒌𝒊
′ 𝜷))(exp (𝑦𝑖𝒙𝒌𝒊′ 𝜷)
𝑦!
𝑛
𝑖=1
= 𝑙𝑛 ∏exp(−exp(𝒙𝒌𝒊′ 𝜷))
𝑛
𝑖=1
+ 𝑙𝑛 ∏(exp (𝑦𝑖𝒙𝒌𝒊′ 𝜷)
𝑛
𝑖=1
− 𝑙𝑛 ∏𝑦!
𝑛
𝑖=1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
53
= ∑−exp(𝒙𝒌𝒊′ 𝜷)
𝑛
𝑖=1
+ ∑𝑦𝑖𝒙𝒌𝒊′ 𝜷
𝑛
𝑖=1
− ∑𝑙𝑛(𝑦!) = ∑(−exp(𝒙𝒌𝒊′ 𝜷) + 𝑦𝑖𝒙𝒌𝒊
′ 𝜷 − 𝒍𝑛(𝑦!))
𝒏
𝒊=𝟏
𝒏
𝒊=𝟏
Memaksimalkan nilai untuk 𝜷, untuk mendapatkan penduganya yaitu �̂�, dapat
dilakukan dari 𝑝 turunan pertama dari fungsi log-likelihood dan turunannya sama
dengan nol.
Penduga parameter �̂� dari persamaan diatas dapat diperoleh dengan
𝜕𝑙𝑛𝐿(𝛽)
𝜕𝛽=
𝜕
𝜕𝛽[∑(−exp(𝒙𝒌𝒊
′ 𝜷) + 𝑦𝑖𝒙𝒌𝒊′ 𝜷 − 𝒍𝑛(𝑦!))
𝒏
𝒊=𝟏
] = 0
∑(𝑦𝑖 − exp (𝒙𝒌𝒊′ 𝜷))𝒙𝒌𝒊
′ = 0
𝑛
𝑖=1
3.5
Karena persamaan di atas tidak linear, maka persamaan tersebut dapat diselesaikan
dengan pendekatan metode numeris misalnya metode Newton-Raphson.
Secara umum, �̂� dari model regresi Poisson dapat diperoleh dengan metode
Newton-Raphson sebagai berikut:
�̂�𝒏+𝟏 = �̂�𝒏 − [𝐻(�̂�𝒏)]−𝟏
𝒈(�̂�𝒏) 3.6
Dengan 𝑔 menyatakan gradien persamaan 3.5, 𝐻 adalah matriks Hessian, yaitu
matriks turunan kedua dari fungsi log-likelihood, dan �̂�𝟏 menyatakan nilai awal.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
54
Dalam skripsi ini, �̂� dapat diduga dengan menggunakan program SPSS atau
program R.
B. Overdispersi dan regresi Binomial Negatif
Variabel respon yang berupa data count biasanya dianalisis dengan
menggunakan regresi Poisson yang memiliki asumsi mean dan variansi sama. Pada
kenyataannya, kondisi seperti ini sangat jarang terjadi karena biasanya data count
memiliki variansi yang lebih besar dari mean atau disebut dengan kondisi
overdispersi. Overdispersi dalam regresi Poisson dapat mengakibatkan galat
standar dari dugaan parameter regresi yang dihasilkan memiliki kecenderungan
untuk menjadi lebih rendah dari seharusnya sehingga menghasilkan kesimpulan
yang tidak sesuai dengan data.
Overdispersi pada data count dapat diindikasikan dengan nilai devians dan
pearson chi-squares yang dibagi dengan derajat bebasnya. Jika kedua nilai tersebut
lebih dari 1, maka dikatakan terjadi overdispersi pada data.
Terdapat dua cara yang dapat digunakan untuk mendeteksi overdispersi,
yaitu:
1. Devians
Definisi 3.1
Nilai devians dapat ditulis dalam bentuk
𝐷2 = 2∑{𝑦𝑖 𝑙𝑛 (𝑦𝑖
�̂�𝑖) − (𝑦𝑖 − �̂�𝑖)}
𝑛
𝑖=1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
55
𝜙1 =𝐷2
𝑑𝑏;
Dengan 𝑑𝑏 = 𝑛 − 𝑘 dengan 𝑘 merupakan banyaknya parameter termasuk
konstanta, 𝑛 merupakan banyaknya pengamatan dan 𝐷2 adalah nilai Devians.
2. Pearson Chi-squares
Definisi 3.2
Nilai Pearson Chi-squares dapat ditulis dalam bentuk
𝜒2 = 2∑(𝑦𝑖 − 𝜇𝑖)
2
𝑣𝑎𝑟(𝑦𝑖)
𝑛
𝑖=1
𝜙2 =𝜒2
𝑑𝑏;
Dengan 𝑑𝑏 = 𝑛 − 𝑘 dengan 𝑘 merupakan banyaknya parameter termasuk
konstanta, 𝑛 merupakan banyaknya pengamatan dan 𝜒2adalah Pearson Chi-
squares.
Jadi, jika 𝜙1 atau 𝜙2 bernilai lebih dari 1 maka terjadi overdispersi pada data. Oleh
karena itu, Model Binomial negatif merupakan alternatif yang sering digunakan
untuk kasus overdispersi pada regresi Poisson.
Model regresi binomial negatif memiliki kegunaan yang sama dengan
model regresi Poisson yaitu untuk menganalisis hubungan antara suatu variabel
dependen dengan satu atau lebih variabel independen, tetapi model regresi
Binomial Negatif lebih fleksibel dibandingkan dengan model Poisson karena
asumsi mean dan variansi dari model Binomial Negatif tidak harus sama. Model ini
juga memiliki parameter dispersi yang berguna untuk menggambarkan variasi dari
data yang biasa dinotasikan dengan k. Model Binomial Negatif yang akan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
56
digunakan adalah Model Binomial Negatif yang merupakan model campuran antara
distribusi Poisson dan Gamma. Distribusi Gamma digunakan untuk menyesuaikan
kehadiran overdispersi dalam model Poisson.
Definisi 3.3
Fungsi probabilitas dari suatu variabel acak Y yang berdistribusi Binomial Negatif
adalah sebagai berikut:
𝑓(𝑦) = Γ (𝑦 +
1𝑘)
Γ (1𝑘) 𝑦!
(𝑘𝜇
1 + 𝑘𝜇)
𝑦
(1
1 + 𝑘𝜇)
1𝑘⁄
, 𝑦 = 0, 1, 2, …
Jika 𝑘 sama dengan nol, nilai rata-rata dan variansi akan sama, 𝐸(𝑌𝑖) = 𝑉𝑎𝑟(𝑌𝑖),
akan menjadi distribusi Poisson. Jika 𝑘 > 0, variansi akan melebihi nilai rata-rata,
𝑉𝑎𝑟(𝑌𝑖) > 𝐸(𝑌𝑖), dan distribusi memungkinkan overdispersi.
C. Binomial Negatif sebagai keluarga Eksponensial
Salah satu keluarga dari beberapa distribusi probabilitas yang sering
dijumpai adalah keluarga eksponensial. Keuntungan dari suatu distribusi
probabilitas yang termasuk anggota keluarga eksponensial adalah kemudahan
dalam mengidentifikasi beberapa ukuran distribusi, salah satunya adalah mean
sebagai parameter lokasi dan variansi sebagai nuisance parameter. Berikut adalah
definisi dari suatu distribusi yang merupakan anggota keluarga eksponensial.
Misalkan variabel acak 𝑌 memiliki distribusi probabilitas yang
bergantung pada parameter 𝜃 yang dianggap sebagai parameter lokasi dan terdapat
parameter lain yaitu 𝜙 yang disebut nuisance parameter. Berdasarkan Hilbe (2011),
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
57
distribusi dari 𝑌 merupakan anggota dari keluarga eksponensial jika fungsi
probabilitasnya memiliki bentuk seperti persamaan 2.6.
Berikut akan ditunjukkan bahwa distribusi Binomial Negatif merupakan
salah satu anggota dari keluarga eksponensial. Misalkan 𝑌 adalah suatu varibel acak
yang berdistribusi Binomial Negatif dengan parameter 𝑘 dan 𝜇 dengan fungsi
probabilitas
𝑓(𝑦) = Γ (𝑦 +
1𝑘)
Γ (1𝑘)𝑦!
(𝑘𝜇
1 + 𝑘𝜇)
𝑦
(1
1 + 𝑘𝜇)
1𝑘⁄
Dengan menganggap 𝜇 sebagai parameter lokasi dan k sebagai nuisance parameter,
maka akan diperoleh:
𝑓(𝑦) =Γ (𝑦 +
1𝑘)
Γ (1𝑘) 𝑦!
(𝑘𝜇
1 + 𝑘𝜇)
𝑦
(1
1 + 𝑘𝜇)
1𝑘⁄
= exp
(
𝑙𝑛 ((Γ (𝑦 +
1𝑘)
Γ (1𝑘) 𝑦!
) (𝑘𝜇
1 + 𝑘𝜇)
𝑦
(1
1 + 𝑘𝜇)
1𝑘⁄
)
)
= 𝑒𝑥𝑝
(
𝑙𝑛 (Γ (𝑦 +
1𝑘)
Γ (1𝑘) 𝑦!
+ 𝑦 𝑙𝑛 (𝑘𝜇
1 + 𝑘𝜇) +
1
𝑘𝑙𝑛 (
1
1 + 𝑘𝜇))
)
= 𝑒𝑥𝑝(𝑦 ln((𝑘𝜇
1 + 𝑘𝜇) + 𝑙𝑛 (
Γ (𝑦 +1𝑘)
Γ (1𝑘) 𝑦!
) +1
𝑘𝑙𝑛 (
1
1 + 𝑘𝜇))) 3.7
Persamaan 3.7 dapat ditulis kedalam bentuk persamaan 2.6
dengan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
58
𝜃 = 𝑙𝑛 (𝑘𝜇
1 + 𝑘𝜇)
𝛼(𝜙) = 1
𝑐(𝑦; 𝜃) = 𝑙𝑛 (𝜏 (𝑦 +
1𝑘)
𝜏 (1𝑘) 𝑦!
)
𝑏(𝜃) = −1
𝑘𝑙𝑛 (
1
1 + 𝑘𝜇)
Sehingga terbukti bahwa distribusi binomial negatif merupakan anggota dari
keluarga eksponensial.
Telah disebutkan sebelumnya bahwa salah satu keuntungan dari anggota
keluarga eksponensial adalah mean dan variansi dari distribusi tersebut dapat
diidentifikasi dengan mudah, sehingga berdasarkan Hilbe (2011) yaitu
a. 𝑏′(𝜃) akan menghasilkan mean
b. 𝑏"(𝜃)𝛼(𝜙) akan menghasilkan variansi
Jadi, akan dicari mean dan variansi dari variabel random yang berdistribusi
binomial negatif dengan menggunakan salah satu sifat dari keluarga eksponensial
tersebut. Sebelum memperoleh mean dan variansi dari distribusi Binomial Negatif,
dapat didefenisikan bahwa:
𝑔(𝜇) = 𝜃
= 𝑙𝑛 (𝑘𝜇
1 + 𝑘𝜇)
= −𝑙𝑛 (1
𝑘𝜇+ 1)
Sehingga
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
59
−𝑙𝑛 (1
𝑘𝜇+ 1) = 𝜃 ⟺ (
1
𝑘𝜇+ 1) = 𝑒−𝜃 ⟺
1
𝑘𝜇= 𝑒−𝜃 − 1 ⟺ 𝜇 =
1
𝑘(𝑒−𝜃 − 1)
dan diperoleh
𝑔−(𝜃) = 𝜇
=1
𝑘(𝑒−𝜃 − 1)
= [𝑘(𝑒−𝜃 − 1)]−1
Fungsi cumulant yaitu
𝑏(𝜃) = −1
𝑘𝑙𝑛 (
1
1 + 𝑘𝜇)
=1
𝑘ln (1 + 𝑘𝜇)
sehingga akan diperoleh mean dan variansi dari binomial negatif sebagai berikut:
1. Mean
𝑏′(𝜃) =𝜕𝑏
𝜕𝜇
𝜕𝜇
𝜕𝜃
=1
𝑘
𝑘
1 + 𝑘𝜇(−1)(𝑎𝑒−𝜃 − 𝑎)
−2(−𝑎𝑒−𝜃)
=1
1 + 𝑘𝜇 (𝑎𝑒−𝜃 − 𝑎)
−2(𝑎𝑒−𝜃)
Karena 𝜇 = [𝑘𝑒−𝜃 − 𝑘]−1 maka 𝑘𝑒−𝜃 = 𝜇−1 + 𝑘 sehingga diperoleh
𝑏′(𝜃) =1
1 + 𝑘𝜇 𝜇2 (𝜇−1 + 𝑘)
=1
1 + 𝑘𝜇 𝜇(1 + 𝑘𝜇)
= 𝜇
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
60
2. Variansi
Karena 𝛼(𝜙) = 1, maka variansi dari 𝑌 hanya turunan kedua dari cumulant
terhadap 𝜃 yaitu sebagai berikut:
𝑏"(𝜃) =𝜕2𝑏
𝜕𝜇2 (
𝜕𝜇
𝜕𝜃)2
+𝜕𝑏
𝜕𝜇 𝜕2𝜇
𝜕𝜃2
Sebelumnya akan dicari 𝜕2𝑏
𝜕𝜇2 dan
𝜕2𝜇
𝜕𝜃2
𝜕2𝑏
𝜕𝜇2=
𝜕(1 + 𝑘𝜇)−1
𝜕𝜇= −𝑘(1 + 𝑘𝜇)−2 =
−𝑘
(1 + 𝑘𝜇)2
(𝑘𝑒−𝜃 − 𝑘)−2
(𝑘𝑒−𝜃) = 𝜇2(𝜇−1 + 𝑘) = 𝜇 + 𝑘𝜇2
= (𝑘𝑒−𝜃 − 𝑘)−1
+ 𝑘(𝑘𝑒−𝜃 − 𝑘)−2
Sehingga diperoleh
𝜕2𝜇
𝜕𝜃2=
𝜕 [(𝑘𝑒−𝜃 − 𝑘)−1
+ 𝑘(𝑘𝑒−𝜃 − 𝑘)−2
]
𝜕𝜃
= (𝑘𝑒−𝜃 − 𝑘)−2
(𝑘𝑒−𝜃) + (−2𝑘)(𝑘𝑒−𝜃 − 𝑘)−3
(−𝑘𝑒−𝜃)
= (𝑘𝑒−𝜃 − 𝑘)−2
(𝑘𝑒−𝜃) + (2𝑘)(𝑘𝑒−𝜃 − 𝑘)−3
(𝑘𝑒−𝜃)
= (𝑘𝑒−𝜃) [(𝑘𝑒−𝜃 − 𝑘)−2
+ (2𝑘)(𝑘𝑒−𝜃 − 𝑘)−3
]
= (𝜇−1 + 𝑘)(𝜇2 + 2𝑘𝜇3)
= (𝜇−1 + 𝑘)𝜇(𝜇 + 2𝑘𝜇2)
= (1 + 𝑘𝜇)(𝜇 + 2𝑘𝜇2)
Sehingga turunan kedua dari 𝑏(𝜃) terhadap 𝜃 adalah
𝑏"(𝜃) =𝜕2𝑏
𝜕𝜇2 (
𝜕𝜇
𝜕𝜃)2
+𝜕𝑏
𝜕𝜇 𝜕2𝜇
𝜕𝜃2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
61
=−𝑘
(1 + 𝑘𝜇)2 (𝜇(1 + 𝑘𝜇))
2+
1
1 + 𝑘𝜇 (1 + 𝑘𝜇)(𝜇 + 2𝑘𝜇2)
= −𝑘𝜇2 + (𝜇 + 2𝑘𝜇2)
= 𝜇 + 𝑘𝜇2
Jadi, mean dan variansi dari Binomial Negatif secara berturut-turut adalah 𝜇 dan
𝜇 + 𝑘𝜇2.
D. Model Regresi Binomial Negatif
Dalam berbagai eksperimen, seringkali data count yang merupakan objek
penelitian (variabel dependen 𝑌) dipengaruhi oleh sejumlah variabel independen.
Variabel dependen 𝑌 menyatakan banyaknya kejadian yang diamati pada suatu
populasi tertentu. Untuk mengetahui hubungan antara kedua variabel tersebut,
maka dapat digunakan suatu model regresi yang didasarkan pada distribusi
Binomial Negatif.
Salah satu tujuan dari analisis regresi adalah untuk menentukan pola
hubungan antara variabel dependen dengan variable independen 𝑋1, 𝑋2, 𝑋3, ⋯,
𝑋𝑝.Oleh karena itu, dalam regresi Binomial Negatif hubungan tersebut dapat
dituliskan dalam bentuk
𝐸(𝑌𝑖|𝑋𝑖) = 𝜇𝑖 = 𝛽0 + 𝛽1𝑥𝑖1 + 𝛽2𝑥𝑖2 + ⋯+ 𝛽𝑝𝑥𝑖𝑝 3.8
atau dapat dinyatakan dalam notasi matriks
𝐸(𝑌𝑖|𝑋𝑖) = 𝜇𝑖 = 𝒙𝑖′𝜷 3.9
Nilai dari 𝒙𝑖′𝜷 pada persamaan di atas dapat bernilai real, sehingga
memungkinkan munculnya nilai negatif. Sebagaimana diketahui bahwa ekspektasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
62
dari distribusi Binomial Negatif harus bernilai positif sehingga perlu dilakukan
trasformasi sedemikian sehingga bentuk hubungan antara 𝜇𝑖 dan 𝒙𝑖′𝜷 menjadi tepat.
Hilbe (2011) menyatakan bahwa model Binomial Negatif pada umumnya
menggunakan fungsi penghubung logaritma atau log link yaitu
η𝑖 = ln (𝜇𝑖) = 𝒙𝑖′𝜷
Fungsi η𝑖 = ln (𝜇𝑖) disebut sebagai fungsi link, yaitu fungsi yang
menghubungkan 𝜇𝑖 dengan prediktor linear 𝒙𝑖′𝜷. Oleh sebab itu, model regresi
Binomial Negatif untuk memodelkan data count yaitu
𝜇𝑖 = exp (𝒙𝑖′𝜷) 3.10
dengan 𝑖 = 1, 2, 3,⋯ , 𝑛
E. Pendugaan Parameter untuk Model Regresi Binomial Negatif dengan Metode
Maksimum Likelihood
Model umum regresi Binomial Negatif dinyatakan dengan:
𝑦𝑖 = exp(𝛽0 + 𝛽1𝑥𝑖1 + 𝛽2𝑥𝑖2 + ⋯+ 𝛽𝑝𝑥𝑖𝑝) + 𝜀𝑖
Dengan 𝛽0, 𝛽1, 𝛽2, ⋯ menyatakan parameter yang tidak diketahui dan 𝜀𝑖
menyatakan galat untuk pengamatan ke-i.
Model umum regresi Binomial Negatif dapat diduga dengan
�̂�𝑖 = exp(�̂�0 + �̂�1𝑥𝑖1 + �̂�2𝑥𝑖2 + ⋯+ �̂�𝑝𝑥𝑖𝑝)
Untuk mengestimasi parameter 𝛽 dan k dalam regresi Binomial Negatif
dapat digunakan metode pendugaan kemungkinan maksimum (MLE). Fungsi
likelihood untuk model regresi Binomial Negatif adalah sebagai berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
63
𝐿(𝛽, 𝑘) = ∏𝑓(𝛽, 𝑘)
𝑛
𝑖=1
= ∏Γ(𝑦 +
1𝑘)
Γ (1𝑘) 𝑦!
(𝑘𝜇
1 + 𝑘𝜇)
𝑦
(1
1 + 𝑘𝜇)
1𝑘⁄
𝑛
𝑖=1
= ∏Γ(𝑦 +
1𝑘)
Γ (1𝑘) 𝑦!
𝑛
𝑖=1
∏(𝑘𝜇
1 + 𝑘𝜇)
𝑦
∏(1
1 + 𝑘𝜇)
1𝑘⁄
𝑛
𝑖=1
𝑛
𝑖=1
Selanjutnya, dari fungsi likelihood diambil nilai log-nya sehingga diperoleh
fungsi log- likelihood dari persamaan diatas sebagai berikut:
log 𝐿(𝛽, 𝑘) = log (∏𝑓(𝛽, 𝑘)
𝑛
𝑖=1
)
= log(∏Γ(𝑦 +
1𝑘)
Γ (1𝑘) 𝑦!
𝑛
𝑖=1
∏(𝑘𝜇
1 + 𝑘𝜇)
𝑦
∏(1
1 + 𝑘𝜇)
1𝑘⁄
𝑛
𝑖=1
𝑛
𝑖=1
)
= ∑log(Γ (𝑦 +
1𝑘)
Γ (1𝑘)
)
𝑛
𝑖=1
− ∑log(𝑦!) + ∑𝑦log(𝑘𝜇) −
𝑛
𝑖=1
𝑛
𝑖=1
∑𝑦log(1 + 𝑘𝜇)
𝑛
𝑖=1
+ ∑1
𝑘log(1) −
𝑛
𝑖=1
∑1
𝑘log(1 + 𝑘𝜇)
𝑛
𝑖=1
= ∑𝑙𝑜𝑔 (Γ (𝑦 +
1𝑘)
Γ (1𝑘)
)
𝑛
𝑖=1
− ∑log(𝑦!) + ∑𝑦log(𝑘𝜇) −
𝑛
𝑖=1
𝑛
𝑖=1
∑(𝑦 +1
𝑘) log (1 + 𝑘𝜇)
𝑛
𝑖=1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
64
Diketahui bahwa Γ(𝑦+𝑘)
Γ(𝑘)= 𝑘 × (1 + 𝑘) × ⋯× (𝑦 − 1 + 𝑘) untuk 𝑦 bilangan
bulat. Sehingga
Γ (𝑦 +1𝑘)
Γ (1𝑘)
= 𝑘−1 × (1 + 𝑘−1) × ⋯× (𝑦 − 1 + 𝑘−1)
Oleh karena itu, log𝐿(𝛽, 𝑘) bisa ditulis tanpa fungsi Gamma dengan
log(Γ (𝑦 +
1𝑘)
Γ (1𝑘)
) = log(𝑘−1) + log(1 + 𝑘−1) + ⋯+ log(𝑦 − 1 + 𝑘−1)
= ∑ log (1 + 𝑘𝑟
𝑘)
𝑦−1
𝑟=0
Likelihood untuk model regresi Binomial Negatif dapat ditulis sebagai,
log𝐿((𝛽, 𝑘) = ∑[(∑ log (1 + 𝑘𝑟
𝑘)
𝑦−1
𝑟=0
)
𝑛
𝑖=1
− ∑log(𝑦!) + ∑𝑦log(𝑘𝜇) −
𝑛
𝑖=1
𝑛
𝑖=1
∑(𝑦 +1
𝑘) log(1 + 𝑘𝜇)
𝑛
𝑖=1
]
= ∑[(log ∑(1 + 𝑘𝑟)
𝑦−1
𝑟=0
) − 𝑦log(𝑘)
𝑛
𝑖=1
− ∑log(𝑦!) + ∑𝑦log(𝑘𝜇) −
𝑛
𝑖=1
𝑛
𝑖=1
∑(𝑦 +1
𝑘) log (1 + 𝑘𝜇)
𝑛
𝑖=1
]
Oleh karena itu, pendugaan kemungkinan maksimum (�̂�, �̂�) dapat diperoleh
dengan memaksimalkan 𝑙(𝛽, 𝑘) terhadap 𝛽 dan 𝑘. Persamaan terkait adalah
sebagai berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
65
𝜕𝑙(𝛽, 𝑘)
𝜕𝛽0= ∑𝑦 − (
1
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑘 exp(𝒙𝒊′𝜷) (𝑦 +
1
𝑘))
𝑛
𝑖=1
= ∑𝑦 − (𝑘 exp(𝒙𝒊
′𝜷) (𝑦 +1𝑘)
1 + 𝑘 exp(𝒙𝒊′𝜷)
)
𝑛
𝑖=1
= ∑𝑦 − (𝑦 𝑘 exp(𝒙𝒊
′𝜷) + exp(𝒙𝒊′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
)
𝑛
𝑖=1
= ∑𝑦(1 + 𝑘 exp(𝒙𝒊
′𝜷)) − (𝑦 𝑘 exp(𝒙𝒊′𝜷) + exp(𝒙𝒊
′𝜷))
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
= ∑𝑦 + 𝑦 𝑘 exp(𝒙𝒊
′𝜷) − 𝑦 𝑘 exp(𝒙𝒊′𝜷) − exp(𝒙𝒊
′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
= ∑𝑦 − exp (𝒙𝒊
′𝜷)
1 + 𝑘 exp (𝒙𝒊′𝜷)
𝑛
𝑖=1
𝜕𝑙(𝛽, 𝑘)
𝜕𝛽1= ∑𝑦𝑥1𝑖
𝑛
𝑖=1
− (1
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑘 𝑥1𝑖 exp(𝒙𝒊′𝜷) (𝑦 +
1
𝑘))
= ∑𝑦𝑥1𝑖 − (𝑘 𝑥1𝑖 exp(𝒙𝒊
′𝜷) (𝑦 +1𝑘)
1 + 𝑘 exp(𝒙𝒊′𝜷)
)
𝑛
𝑖=1
= ∑𝑦𝑥1𝑖 − (𝑦 𝑘 𝑥1𝑖 exp(𝒙𝒊
′𝜷) + 𝑥1𝑖 exp(𝒙𝒊′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
)
𝑛
𝑖=1
= ∑𝑦𝑥1𝑖(1 + 𝑘 exp(𝒙𝒊
′𝜷)) − (𝑦 𝑘 𝑥1𝑖 exp(𝒙𝒊′𝜷) + 𝑥1𝑖 exp(𝒙𝒊
′𝜷))
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
= ∑𝑦𝑥1𝑖 + 𝑦𝑥1𝑖𝑘 exp(𝒙𝒊
′𝜷) − 𝑦 𝑘 𝑥1𝑖 exp(𝒙𝒊′𝜷) − 𝑥1𝑖 exp(𝒙𝒊
′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
66
= ∑𝑦𝑥1𝑖 − 𝑥1𝑖 exp(𝒙𝒊
′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
= ∑𝑥1𝑖(𝑦 − exp(𝒙𝒊
′𝜷))
1 + 𝑘 exp (𝒙𝒊′𝜷)
𝑛
𝑖=1
𝜕𝑙(𝛽, 𝑘)
𝜕𝛽2= ∑𝑦𝑥2𝑖 − (
1
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑘 𝑥2𝑖 exp(𝒙𝒊′𝜷) (𝑦 +
1
𝑘))
𝑛
𝑖=1
= ∑𝑦𝑥2𝑖 − (𝑘 𝑥2𝑖 exp(𝒙𝒊
′𝜷) (𝑦 +1𝑘)
1 + 𝑘 exp(𝒙𝒊′𝜷)
)
𝑛
𝑖=1
= ∑𝑦𝑥2𝑖 − (𝑦 𝑘 𝑥2𝑖 exp(𝒙𝒊
′𝜷) + 𝑥2𝑖 exp(𝒙𝒊′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
)
𝑛
𝑖=1
= ∑𝑦𝑥2𝑖 + 𝑦𝑥2𝑖𝑘 exp(𝒙𝒊
′𝜷) − 𝑦 𝑘 𝑥2𝑖 exp(𝒙𝒊′𝜷) − 𝑥2𝑖 exp(𝒙𝒊
′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
= ∑𝑦𝑥2𝑖 − 𝑥2𝑖 exp(𝒙𝒊
′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
= ∑𝑥2𝑖(𝑦 − exp(𝒙𝒊
′𝜷))
1 + 𝑘 exp (𝒙𝒊′𝜷)
𝑛
𝑖=1
𝜕𝑙(𝛽, 𝑘)
𝜕𝛽3= ∑𝑦𝑥3𝑖 − (
1
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑘 𝑥3𝑖 exp(𝒙𝒊′𝜷) (𝑦 +
1
𝑘))
𝑛
𝑖=1
= ∑𝑦𝑥3𝑖 − (𝑘 𝑥3𝑖 exp(𝒙𝒊
′𝜷)(𝑦 +1𝑘)
1 + 𝑘 exp(𝒙𝒊′𝜷)
)
𝑛
𝑖=1
= ∑𝑦𝑥3𝑖 − (𝑦 𝑘 𝑥3𝑖 exp(𝒙𝒊
′𝜷) + 𝑥3𝑖 exp(𝒙𝒊′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
)
𝑛
𝑖=1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
67
= ∑𝑦𝑥3𝑖(1 + 𝑘 exp(𝒙𝒊
′𝜷)) − (𝑦 𝑘 𝑥3𝑖 exp(𝒙𝒊′𝜷) + 𝑥3𝑖 exp(𝒙𝒊
′𝜷))
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
= ∑𝑦𝑥3𝑖 + 𝑦𝑥3𝑖𝑘 exp(𝒙𝒊
′𝜷) − 𝑦 𝑘 𝑥3𝑖 exp(𝒙𝒊′𝜷) − 𝑥3𝑖 exp(𝒙𝒊
′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
= ∑𝑦𝑥3𝑖 − 𝑥3𝑖 exp(𝒙𝒊
′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
= ∑𝑥3𝑖(𝑦 − exp(𝒙𝒊
′𝜷))
1 + 𝑘 exp (𝒙𝒊′𝜷)
𝑛
𝑖=1
Jadi, secara umum
𝜕𝑙(𝛽, 𝑘)
𝜕𝛽𝑝= ∑
𝑥𝑝𝑖(𝑦 − exp(𝒙𝒊′𝜷))
1 + 𝑘 exp (𝒙𝒊′𝜷)
𝑛
𝑖=1
= 0
dan
𝜕𝑙(𝛽, 𝑘)
𝜕𝑘= ∑[(∑
𝑟
1 + 𝑘𝑟
𝑦−1
𝑟=0
) −𝑦
𝑘+
𝑦 exp(𝒙𝒊′𝜷)
𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
− (−𝑘−2 log(1 + 𝑘 exp(𝒙𝒊′𝜷)) +
exp(𝒙𝒊′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑦 +1
𝑘)]
= ∑[(∑𝑟
1 + 𝑘𝑟
𝑦−1
𝑟=0
) + 𝑘−2 log(1 + 𝑘 exp(𝒙𝒊′𝜷))
𝑛
𝑖=1
−exp(𝒙𝒊
′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑦 +1
𝑘]
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
68
= ∑[(∑𝑟
1 + 𝑘𝑟
𝑦−1
𝑟=0
) + 𝑘−2 log(1 + 𝑘 exp(𝒙𝒊′𝜷))
𝑛
𝑖=1
−(𝑦 +
1𝑘) exp(𝒙𝒊
′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
]
= 0
Fungsi log-likelihood di atas didiferensialkan terhadap masing-masing parameter
yaitu 𝛽0, 𝛽1, 𝛽2, ⋯ ,𝛽𝑝 dan turunan terhadap 𝑘 dapat ditulis dalam bentuk matriks
yaitu
𝑈(𝜷∗) = 𝑈 (𝜷𝒌) =
(
𝜕𝑙(𝛽, 𝑘)
𝜕𝛽0
𝜕𝑙(𝛽, 𝑘)
𝜕𝛽1
𝜕𝑙(𝛽, 𝑘)
𝜕𝛽2
⋮⋮
𝜕𝑙(𝛽, 𝑘)
𝜕𝛽𝑝
𝜕𝑙(𝛽, 𝑘)
𝜕𝑘 )
= 𝟎
𝑈(𝜷∗) = 𝑈 (𝜷𝒌)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
69
=
(
∑𝑦 − exp(𝒙𝒊
′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
∑𝑥1𝑖(𝑦 − exp(𝒙𝒊
′𝜷))
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
∑𝑥2𝑖(𝑦 − exp(𝒙𝒊
′𝜷))
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
∑𝑥3𝑖(𝑦 − exp(𝒙𝒊
′𝜷))
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
⋮
∑𝑥𝑝𝑖(𝑦 − exp(𝒙𝒊
′𝜷))
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
∑[(∑𝑟
1 + 𝑘𝑟
𝑦−1
𝑟=0
) + 𝑘−2 log(1 + 𝑘 exp(𝒙𝒊′𝜷)) −
(𝑦 +1𝑘) exp(𝒙𝒊
′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
]
𝑛
𝑖=1 )
= 0
Turunan kedua dari fungsi log-likelihood disebut matriks Hessian.
Karena persamaan-persamaan dalam matriks 𝑈(𝜷∗) tidak linear dalam masing-
masing parameternya, maka untuk mencari nilai dari 𝛽0, 𝛽1, ⋯, 𝛽𝑝 dan 𝑘 digunakan
metode numerik Newton-Raphson sebagai berikut:
�̂�𝑛 = �̂�𝑛−1 − [𝑯(�̂�𝑛−1)]−1
𝑼(�̂�𝑛−1)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
70
𝐻 =
(
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽02
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽0𝜕𝛽1
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽0𝜕𝛽2
⋯𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽0𝜕𝛽𝑝
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽0𝜕𝛽𝑘
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽0𝜕𝛽1
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽12
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽1𝜕𝛽2
⋯𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽1𝜕𝛽𝑝
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽1𝜕𝛽𝑘
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽0𝜕𝛽2
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽1𝜕𝛽2
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽22
⋯𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽2𝜕𝛽𝑝
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽2𝜕𝛽𝑘
⋮ ⋮ ⋮ ⋱ ⋮ ⋮
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽0𝜕𝛽𝑝
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽1𝜕𝛽𝑝
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽2𝜕𝛽𝑝
⋯𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽𝑝2
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽𝑝𝜕𝛽𝑘
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽0𝜕𝛽𝑘
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽1𝜕𝛽𝑘
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽2𝜕𝛽𝑘
⋯𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽𝑝𝜕𝛽𝑘
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽𝑘2
)
dengan
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽02 = ∑
[−exp(𝒙𝒊′𝜷) (1 + 𝑘 exp(𝒙𝒊
′𝜷))] − [𝑘 exp(𝒙𝒊′𝜷) (𝑦 − exp(𝒙𝒊
′𝜷))]
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−exp(𝒙𝒊
′𝜷) − 𝑘 exp(𝒙𝒊′𝜷) exp(𝒙𝒊
′𝜷) − 𝑘 𝑦 exp(𝒙𝒊′𝜷) + 𝑘 exp(𝒙𝒊
′𝜷) exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
71
= ∑−exp(𝒙𝒊
′𝜷) − 𝑘 𝑦 exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−(1 + 𝑘 𝑦) exp(𝒙𝒊
′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽0𝜕𝛽1
= ∑[−𝑥1𝑖 exp(𝒙𝒊
′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷))] − [𝑥1𝑖 𝑘 exp(𝒙𝒊
′𝜷) (𝑦 − exp(𝒙𝒊′𝜷))]
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−𝑥1𝑖 exp(𝒙𝒊
′𝜷) − 𝑘 𝑥1𝑖 exp(𝒙𝒊′𝜷) exp(𝒙𝒊
′𝜷) − 𝑘 𝑦 𝑥1𝑖 exp(𝒙𝒊′𝜷) + 𝑘 𝑥1𝑖 exp(𝒙𝒊
′𝜷) exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−𝑥1𝑖 exp(𝒙𝒊
′𝜷) − 𝑘 𝑦 𝑥1𝑖 exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
= ∑−𝑥1𝑖 exp(𝒙𝒊
′𝜷) (1 + 𝑘 𝑦)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
𝑛
𝑖=1
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽0𝜕𝛽2
= ∑[−𝑥2𝑖 exp(𝒙𝒊
′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷))] − [𝑥2𝑖 𝑘 exp(𝒙𝒊
′𝜷) (𝑦 − exp(𝒙𝒊′𝜷))]
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−𝑥2𝑖 exp(𝒙𝒊
′𝜷) − 𝑘 𝑥2𝑖 exp(𝒙𝒊′𝜷) exp(𝒙𝒊
′𝜷) − 𝑘 𝑦𝑥2𝑖 exp(𝒙𝒊′𝜷) + 𝑘 𝑥2𝑖 exp(𝒙𝒊
′𝜷) exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−𝑥2𝑖 exp(𝒙𝒊
′𝜷) − 𝑘 𝑦 𝑥2𝑖 exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
= ∑−𝑥2𝑖 exp(𝒙𝒊
′𝜷) (1 + 𝑘 𝑦)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
𝑛
𝑖=1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
72
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽0𝜕𝛽𝑝
= ∑[−𝑥𝑝𝑖 exp(𝒙𝒊
′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷))] − [𝑥𝑝𝑖 𝑘 exp(𝒙𝒊
′𝜷) (𝑦 − exp(𝒙𝒊′𝜷))]
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−𝑥𝑝𝑖 exp(𝒙𝒊
′𝜷) − 𝑘 𝑥𝑝𝑖 exp(𝒙𝒊′𝜷)exp(𝒙𝒊
′𝜷) − 𝑘 𝑦𝑥𝑝𝑖 exp(𝒙𝒊′𝜷) + 𝑘 𝑥𝑝𝑖 exp(𝒙𝒊
′𝜷) exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−𝑥𝑝𝑖 exp(𝒙𝒊
′𝜷) − 𝑘 𝑦 𝑥𝑝𝑖 exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
= ∑−𝑥𝑝𝑖 exp(𝒙𝒊
′𝜷) (1 + 𝑘 𝑦)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
𝑛
𝑖=1
𝜕2𝑙(𝛽, 𝑘)
𝜕𝑘2= ∑[(∑
−𝑟2
(1 + 𝑘 𝑟)2
𝑦−1
𝑟=0
) −2
𝑘3𝑙𝑜𝑔(1 + 𝑘 exp(𝒙𝒊
′𝜷)) +exp(𝒙𝒊
′𝜷)
𝑘2(1 + 𝑘 exp(𝒙𝒊′𝜷))
+2 exp(𝒙𝒊
′𝜷) exp(𝒙𝒊′𝜷)
𝑘(1 + 𝑘 exp(𝒙𝒊′𝜷))2
𝑛
𝑖=1
+𝑦 1 + 𝑘 exp(𝒙𝒊
′𝜷) 1 + 𝑘 exp(𝒙𝒊′𝜷)
(1 + 𝑘 exp(𝒙𝒊′𝜷))2
]
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
73
= ∑[(∑−𝑟2
(1 + 𝑘 𝑟)2
𝑦−1
𝑟=0
) −2
𝑘3𝑙𝑜𝑔(1 + 𝑘 exp(𝒙𝒊
′𝜷)) +exp(𝒙𝒊
′𝜷)
𝑘2(1 + 𝑘 exp(𝒙𝒊′𝜷))
+exp(𝒙𝒊
′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷))
𝑘2(1 + 𝑘 exp(𝒙𝒊′𝜷))2
𝑛
𝑖−1
+(𝑦 +
1𝑘) (exp(𝒙𝒊
′𝜷) exp(𝒙𝒊′𝜷))
(1 + 𝑘 exp(𝒙𝒊′𝜷))2
]
= ∑[(∑−𝑟2
(1 + 𝑘 𝑟)2
𝑦−1
𝑟=0
) −2
𝑘3𝑙𝑜𝑔(1 + 𝑘 exp(𝒙𝒊
′𝜷)) +exp(𝒙𝒊
′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷))
𝑘2(1 + 𝑘 exp(𝒙𝒊′𝜷))2
+exp(𝒙𝒊
′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷))
𝑘2(1 + 𝑘 exp(𝒙𝒊′𝜷))2
𝑛
𝑖=1
+(𝑦 +
1𝑘) (exp(𝒙𝒊
′𝜷) exp(𝒙𝒊′𝜷))
(1 + 𝑘 exp(𝒙𝒊′𝜷))2
]
= ∑[(∑−𝑟2
(1 + 𝑘 𝑟)2
𝑦−1
𝑟=0
) −2
𝑘3𝑙𝑜𝑔(1 + 𝑘 exp(𝒙𝒊
′𝜷)) +exp(𝒙𝒊
′𝜷)
𝑘2(1 + 𝑘 exp(𝒙𝒊′𝜷))
+exp(𝒙𝒊
′𝜷)
𝑘2(1 + 𝑘 exp(𝒙𝒊′𝜷))
𝑛
𝑖=1
+(𝑦 +
1𝑘) (exp(𝒙𝒊
′𝜷) exp(𝒙𝒊′𝜷))
(1 + 𝑘 exp(𝒙𝒊′𝜷))2
]
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
74
= ∑[(∑−𝑟2
(1 + 𝑘 𝑟)2
𝑦−1
𝑟=0
) −2
𝑘3𝑙𝑜𝑔(1 + 𝑘 exp(𝒙𝒊
′𝜷)) +2exp(𝒙𝒊
′𝜷)
𝑘2(1 + 𝑘 exp(𝒙𝒊′𝜷))
+(𝑦 +
1𝑘) (exp(𝒙𝒊
′𝜷) exp(𝒙𝒊′𝜷))
(1 + 𝑘 exp(𝒙𝒊′𝜷))2
]
𝑛
𝑖=1
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽12 = ∑
−𝑥1𝑖2 exp(𝒙𝒊
′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷)) − [𝑥1𝑖 𝑘 exp(𝒙𝒊
′𝜷) (𝑥1𝑖 𝑦 − 𝑥1𝑖 exp(𝒙𝒊′𝜷))]
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−𝑥1𝑖
2 exp(𝒙𝒊′𝜷) − 𝑥1𝑖
2 𝑘 exp(𝒙𝒊′𝜷) exp(𝒙𝒊
′𝜷) − 𝑥1𝑖2 𝑘 𝑦 exp(𝒙𝒊
′𝜷) + 𝑥1𝑖2 𝑘 exp(𝒙𝒊
′𝜷) exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−𝑥1𝑖
2 exp(𝒙𝒊′𝜷) − 𝑥1𝑖
2 𝑘 𝑦 exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
= ∑−(1 + 𝑘 𝑦)𝑥1𝑖
2 exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
𝑛
𝑖=1
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽22 = ∑
−𝑥2𝑖2 exp(𝒙𝒊
′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷)) − [𝑥2𝑖 𝑘 exp(𝒙𝒊
′𝜷) (𝑥2𝑖 𝑦 − 𝑥2𝑖 exp(𝒙𝒊′𝜷))]
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−𝑥2𝑖
2 exp(𝒙𝒊′𝜷) − 𝑥2𝑖
2 𝑘 exp(𝒙𝒊′𝜷) exp(𝒙𝒊
′𝜷) − 𝑥2𝑖2 𝑘 𝑦 exp(𝒙𝒊
′𝜷) + 𝑥2𝑖2 𝑘 exp(𝒙𝒊
′𝜷) exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−𝑥2𝑖
2 exp(𝒙𝒊′𝜷) − 𝑥2𝑖
2 𝑘 𝑦 exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
= ∑−(1 + 𝑘 𝑦)𝑥2𝑖
2 exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
𝑛
𝑖=1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
75
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽32 = ∑
−𝑥3𝑖2 exp(𝒙𝒊
′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷)) − [𝑥3𝑖 𝑘 exp(𝒙𝒊
′𝜷) (𝑥3𝑖 𝑦 − 𝑥3𝑖 exp(𝒙𝒊′𝜷))]
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−𝑥3𝑖
2 exp(𝒙𝒊′𝜷) − 𝑥3𝑖
2 𝑘 exp(𝒙𝒊′𝜷) exp(𝒙𝒊
′𝜷) − 𝑥3𝑖2 𝑘 𝑦 exp(𝒙𝒊
′𝜷) + 𝑥3𝑖2 𝑘 exp(𝒙𝒊
′𝜷) exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
= ∑−𝑥3𝑖
2 exp(𝒙𝒊′𝜷) − 𝑥3𝑖
2 𝑘 𝑦 exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
= ∑−(1 + 𝑘 𝑦)𝑥3𝑖
2 exp(𝒙𝒊′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
𝑛
𝑖=1
Jadi secara umum,
𝜕2𝑙(𝛽, 𝑘)
𝜕𝛽𝑝2 = ∑
−(1 + 𝑘 𝑦)𝑥𝑝𝑖2 exp(𝒙𝒊
′𝜷)
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
76
F. Uji Kebaikan Model
Uji kebaikan model yang berkaitan dengan model linear umum (GLM)
antara lain adalah sebagai berikut:
1. 𝑅2 dan 𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2,
2. Statistik deviansi
3. Uji likelihood ratio
4. Uji Wald dan
5. Kriteria informasi Akaike (AIC) dan kriteria informasi Bayessian (BIC).
Di dalam skripsi ini, uji kebaikan model regresi yang digunakan adalah
𝑅2 dan 𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2, uji likelihood-ratio, dan uji Wald.
a. 𝑅2 dan 𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2
Statistik 𝑅2 biasanya dikenal sebagai koefisien determinasi di dalam
model Regresi linear biasa. Statistik 𝑅2 ini biasanya diinterpretasikan sebagai
besarnya persentase dari variasi di dalam data yang dijelaskan oleh model. Nilai
dari statistik ini berkisar dari 0-1 dengan nilai yang semakin mendekati 1
merepresentasikan model yang terbentuk semakin baik. Namun, statistik ini kurang
tepat digunakan untuk model non-linear seperti Regresi Poisson, Regresi Binomial
Negatif dan Regresi Logistik.
Statistik 𝑅2 yang biasanya digunakan untuk model Regresi data count
adalah statistik 𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2. Berdasarkan Hilbe (2011), statistik 𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2
memiliki formula sebagai berikut:
𝑅𝑃2 = 1 − 𝐿𝐹/𝐿𝑖
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
77
Dengan: 𝐿𝐹 = nilai fungsi log-likelihood dari model yang lengkap
𝐿𝑖 = nilai fungsi log-likelihood dari model yang hanya mengandung
intercept
Interpretasi koefisien determinasi 𝑅2 pada Regresi linear tidak dapat
diterapkan kepada 𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2. Interpretasi yang dapat dibuat adalah nilai yang
sangat kecil yang mengindikasikan lack of fit atau model yang diperoleh kurang
baik sedangkan nilai yang cukup besar mengindikasikan model yang baik.
b. Uji likelihood -ratio
Uji likelihood-ratio adalah uji yang biasa digunakan untuk uji
perbandingan model. Uji ini biasanya digunakan untuk model yang bersarang
(nested models), tetapi uji ini juga dapat digunakan untuk uji dua model yang
berbeda (misalnya apakah sebuah data lebih baik dimodelkan dengan menggunakan
model Binomial Negatif atau Poisson). Formula untuk uji likelihood-ratio adalah
sebagai berikut:
𝐿𝑅 = −2{𝐿𝑟𝑒𝑑𝑢𝑐𝑒𝑑 − 𝐿𝑓𝑢𝑙𝑙}
Uji likelihood-ratio merupakan uji yang berguna ketika harus diputuskan
apakah penambaan satu atau sejumlah variabel penjelas ke dalam model harus
dilakukan atau tidak. Selain itu, uji ini digunakan untuk menguji signifikansi dari
taksiran model yang telah diperoleh. Berikut ini adalah uji signifikansi model
regresi Binomial Negatif, hipotesisnya adalah:
𝐻0: 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑃 = 0
𝐻1: ∃𝛽1 ≠ 0 ; j = 1,2,⋯p
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
78
Statistik uji yang digunakan adalah
𝐿𝑅 = −2{𝑙𝑜𝑔�̂�0 − 𝑙𝑜𝑔�̂�1}
Aturan keputusannya 𝐻0 ditolak pada tingkat signifikansi 𝛼 jika 𝐿𝑅 > 𝑋(𝛼,𝐾)2
c. Uji Wald
Uji ini digunakan untuk menguji signifikansi dari masing-masing variabel
penjelas terhadap model. Hipotesis untuk menguji signifikansi dari sembarang
koefisien regresi, misalkan 𝛽𝑗 adalah
𝐻0: 𝛽𝑗 = 0
𝐻1: 𝛽𝑗 ≠ 0
Statistik uji yang digunakan yaitu
𝑊𝑗 = [�̂�𝑗
𝑠𝑒(�̂�𝑗)]
2
Dengan �̂�𝑗 adalah taksiran parameter 𝛽𝑗 dan 𝑠𝑒(�̂�𝑗) adalah taksiran galat
standar dari 𝛽𝑗 yang diperoleh dari matriks taksiran variansi-kovariansi dari �̂�.
Aturan keputusannya adalah 𝐻0 ditolak pada tingkat signifikansi 𝛼 jika 𝑊𝑗 > 𝑋𝛼,12 .
Penolakan 𝐻0 pada tingkat signifikansi 𝛼 berarti bahwa bariabel penjelas
ke-j, untuk suatu 𝑗 tertentu (𝑗 = 1,2,3, … , 𝑘) memiliki kontribusi yang signifikan
terhadap variabel respon 𝑌.
Dalam statistik Uji Wald terdapat 𝑠𝑒(�̂�𝑗) yang merupakan standar error
dari parameter �̂�𝑗 yang diperoleh dari elemen-elemen diagonal minus invers dari
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
79
matriks Hessian yang disebut matriks variansi-kovariansi dan dinotasikan dengan
�̂�(�̂�) yaitu:
�̂�(�̂�) ≈ −[𝑯(�̂�)]−𝟏
≈ −
[ 𝜕2𝑙(𝛽,𝑘)
𝜕𝛽02
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽0𝜕𝛽1
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽0𝜕𝛽2⋯
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽0𝜕𝛽𝑝
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽0𝜕𝛽𝑘
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽0𝜕𝛽1
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽12
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽1𝜕𝛽2⋯
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽1𝜕𝛽𝑝
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽1𝜕𝛽𝑘
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽0𝜕𝛽2
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽1𝜕𝛽2
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽22 ⋯
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽2𝜕𝛽𝑝
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽2𝜕𝛽𝑘
⋮ ⋮ ⋮ ⋱ ⋮ ⋮𝜕2𝑙(𝛽,𝑘)
𝜕𝛽0𝜕𝛽𝑝
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽1𝜕𝛽𝑝
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽2𝜕𝛽𝑝⋯
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽𝑝2
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽𝑝𝜕𝛽𝑘
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽0𝜕𝛽𝑘
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽1𝜕𝛽𝑘
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽2𝜕𝛽𝑘⋯
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽𝑝𝜕𝛽𝑘
𝜕2𝑙(𝛽,𝑘)
𝜕𝛽𝑘2 ]
−𝟏
Elemen diagonal utama ke-𝑝 (𝑝 = 1,2, … , 𝑘 + 1) dari matriks �̂�(�̂�) merupakan
variansi dari �̂�𝑝−1, yang dinyatakan dengan �̂�(�̂�𝒑−𝟏) dan diperoleh melalui tahapan
sebagai berikut:
1. Turunan parsial kedua dari fungsi log-likelihood terhadap �̂�𝑗 yaitu
𝜕 [∑𝑥𝑝𝑖(𝑦 − exp(𝒙𝒊
′𝜷))
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛𝑖=1 ]
𝜕𝛽𝑝2
= ∑−𝑥𝑝𝑖𝑥𝑝𝑖 exp(𝒙𝒊
′𝜷) [1 + 𝑘 exp(𝒙𝒊′𝜷)] − 𝑘 𝑥𝑝𝑖 [exp(𝒙𝒊
′𝜷)][𝑥𝑝𝑖(𝑦 − exp(𝒙𝒊′𝜷))]
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
2. Ekspektasi dari minus matriks Hessian akan menghasilkan matriks Fisher
Information, sehingga elemen diagonal dari matriks Fisher Information untuk
𝛽𝑝 adalah
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
80
𝐼(𝛽𝑗)
= 𝐸 [−∑−𝑥𝑝𝑖𝑥𝑝𝑖 exp(𝒙𝒊
′𝜷) [1 + 𝑘 exp(𝒙𝒊′𝜷)] − 𝑘 𝑥𝑝𝑖 [exp(𝒙𝒊
′𝜷)][𝑥𝑝𝑖(𝑦 − exp(𝒙𝒊′𝜷))]
[1 + 𝑘 exp(𝒙𝒊′𝜷)]2
𝑛
𝑖=1
]
= 𝐼(𝛽𝑝)
Dalam hal ini, matriks Fisher Information digunakan untuk mengukur
seberapa besar informasi dari variabel independen 𝑋𝑝 yang dapat dijelaskan oleh
parameter 𝛽𝑝. Variansi dari 𝛽𝑝 dapat diperoleh dari elemen diagonal matriks 𝑽(𝜷)
maka variansi dari 𝛽𝑝 adalah:
𝑣𝑎𝑟(𝛽𝑝) = [𝐼(𝛽𝑗)]−1
= [∑𝑥𝑝𝑖
2 exp(𝒙𝒊′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
]
−1
3. Taksiran galat standar untuk �̂�𝑝 dalam model regresi Binomial Negatif adalah
𝑠𝑒(�̂�𝑝) = √𝑣(�̂�𝑝) = [∑𝑥𝑝𝑖
2 exp(𝒙𝒊′𝜷)
1 + 𝑘 exp(𝒙𝒊′𝜷)
𝑛
𝑖=1
]
−1/2
Berdasarkan formula taksiran galat standar untuk �̂�𝑝 pada persamaan diatas, dapat
dikatakan bahwa galat standar tersebut dipengaruhi oleh parameter 𝑘. Hal tersebut
memberikan pengertian bahwa pada saat terjadi overdispersi, model Binomial
negatif akan menjadi lebih sensitif terhadap signifikansi dari variabel-variabel
penjelasnya karena memperhatikan pengaruh dari overdispersi melalui parameter
𝑘.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
81
Contoh 3.1
Simulasi Regresi Binomial Negatif untuk data Poisson yang mengalami
Overdispersi
Untuk memberikan contoh simulasi Regresi Binomial Negatif untuk data
Poisson yang mengalami overdispersi, akan digunakan data dari Buku Profil
Kesehatan Kota Semarang Tahun 2013 yang juga digunakan oleh Ruliana (2015).
Pada simulasi berikut, penulis akan mengatasi Poisson yang mengalami
overdispersi pada variabel respon dengan menggunakan Regresi Binomial Neagtif.
Berikut adalah data banyaknya kasus penyakit campak pada 16 kecamatan di Kota
Semarang dengan Variable dependen 𝑌 adalah banyaknya kasus penyakit campak
pada 16 kecamatan di kota Semarang dan terdapat empat variable independen yaitu
𝑋1 = imunisasi
𝑋2 = Puskesmas
𝑋3 = Keluarga Miskin
𝑋4 = Kepadatan Penduduk
Tabel 3.1 data banyaknya kasus campak pada 16 kecamatan di kota Semarang
Kecamatan 𝑌 𝑋1 𝑋2 𝑋3 𝑋4
Mijen 2 955 2 725 1006
Gunungpati 12 1094 2 1776 1402
Banyumanik 8 2692 4 236 5080
Gajah Mungkur 2 855 1 1343 7012
Semarang Selatan 22 2129 2 1313 13882
Candisari 11 1447 2 1550 12187
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
82
Tembalang 20 2574 3 3008 3339
Pedurungan 11 2873 2 1705 8549
Genuk 5 2028 2 201 3411
Gayamsari 1 1928 1 88 11939
Semarang Timur 7 1857 3 4603 10211
Semarang Utara 6 1882 2 3183 11671
Semarang Tengah 2 1481 2 778 11596
Semarang Barat 1 2340 5 2660 7298
Tugu 4 539 2 1236 984
Ngaliyan 23 2511 3 2113 3226
Langkah-langkah analisis data mengikuti tahap-tahap berikut:
1. Uji Kolmogorov-Smirnov
2. Pendugaan Model Regresi Poisson
3. Uji signifikansi parameter
4. Uji overdispersi pada Model Regresi Poisson
5. Pendugaan Model Regresi Binomial Negatif
6. Uji signifikansi Model Regresi Binomial Negatif
Berikut adalah langkah-langkah pendugaan pendugaan parameter-parameter dari
model regresi Binomial Negatif:
1. Uji Kolmogorov-smirnov
Tujuan dari Uji Kolmogorov-Smirnov adalah untuk menentukan apakah data
banyaknya kasus penyakit campak pada 16 kecamatan di kota Semarang mengikuti
distribusi Poisson atau tidak.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
83
Langkah-langkah uji Kolmogorov-Simirnov untuk distribusi Poisson adalah
sebagai berikut:
1) 𝐻0 = data berdistribusi Poisson
𝐻1 = data tidak berdistribusi Poisson
2) Tingkat signifikansi 𝛼 = 0.05
3) Daerah penolakan
Asymp.Sig.(2-tailed)< 𝛼 maka 𝐻0 ditolak
Table 3.2 hasil SPSS
One-Sample Kolmogorov-Smirnov Test
Data Campak
N 16
Poisson Parametera,,b Mean 8.56
Most Extreme
Differences
Absolute .304
Positive .304
Negative -.187
Kolmogorov-Smirnov Z 1.215
Asymp. Sig. (2-tailed) .105
a. Test distribution is Poisson.
b. Calculated from data.
4) Dari hasil uji Kolmogorov-Smirnov di atas tampak bahwa nilai
Asymp.Sig.(2-tailed) adalah 0.105. jadi, Asymp.Sig.(2-tailed)> 𝛼.
Dengan demikian berarti 𝐻0 diterima. Jadi, dapat disimpulkan bahwa data
berdistribusi Poisson.
2. Pemodelan Regresi Poisson
Setelah melakukan pengolahan data menggunakan program R diperoleh nilai
untuk parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4 pada tabel 3.3 berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
84
Table 3.3 Parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4 untuk Regresi Poisson
parameter estimasi standar error
𝛽0 1.248 0.371
𝛽1 0.001 0.000
𝛽2 -0.269 0.119
𝛽3 0.000 0.000
𝛽4 -0.000 0.000
Jadi, model regresi Poisson yang dihasilkan adalah
�̂�𝑖 = exp(1.248 + 0.001𝑥1𝑖 − 0.269𝑥2𝑖 + 0.000𝑥3𝑖 − 0.000𝑥4𝑖)
3. Uji signifikansi parameter
Selanjutnya dilakukan pengujian signifikansi masing-masing parameter dari
model regresi Poisson.
Hipotesis:
𝐻0: 𝛽𝑗 = 0
𝐻1: 𝛽𝑗 ≠ 0
Statistik uji:
𝑊𝑗 = [�̂�𝑗
𝑠𝑒(�̂�𝑗)]
2
Sehingga berdasarkan persamaan diatas diperoleh
1. 𝑊1 = [�̂�1
𝑠𝑒(�̂�1)]2
= [0.0007625
0.0001527]2
= 24.934555
2. 𝑊2 = [�̂�2
𝑠𝑒(�̂�21)]2
= [−0.26989957
0.119]2
= 5.144112586
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
85
3. 𝑊3 = [�̂�2
𝑠𝑒(�̂�21)]2
= [0.0002018
0.00007624]2
= 7.006103496
4. 𝑊4 = [�̂�2
𝑠𝑒(�̂�21)]2
= [−0.00004211
0.00002318]2
= 3.30022553
Berdasarkan tabel chi-squares dengan tingkat signifikansi 0.05 dan
derajat bebas 3 diperoleh nilai 𝜒0.05,32 = 7.81473 sehingga
1. 𝑊1 = 24.934555 > 𝜒0.05,32 = 7.81473 maka 𝐻0 ditolak
2. 𝑊2 = 5.144112586 < 𝜒0.05,32 = 7.81473 maka 𝐻0 diterima
3. 𝑊3 = 7.006103496 < 𝜒0.05,32 = 7.81473 maka 𝐻0 diterima
4. 𝑊4 = 3.30022553 < 𝜒0.05,32 = 7.81473 maka 𝐻0 diterima
Artinya pada tingkat signifikansi 0.05 𝑥1 memiliki kontribusi terhadap
𝑌 sedangkan 𝑥1, 𝑥2 dan 𝑥3 tidak memiliki kontribusi terhadap 𝑌
5. Uji overdispersi pada model Regresi Poisson
Uji overdispersi dapat dilihat berdasarkan nilai Devians. Berikut ad
Lah langkah-langkah pengujian overdispersi
a. Perumusan Hipotesis
𝐻0: tidak terdapat overdispersi pada model regresi Poisson
𝐻1: terdapat overdispersi pada model Regresi Poisson
b. Statistik uji
𝜙1 =2∑ {𝑦𝑖𝑙𝑛 (
𝑦𝑖
�̂�𝑖) − (𝑦𝑖 − �̂�𝑖)}
𝑛𝑖=1
𝑑𝑏
Dengan n adalah banyaknya pengamatan dan k adalah banyaknya parameter
termasuk konstanta.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
86
c. Kriteria pengujian
𝐻0 ditolak bila 𝜙1 > 1
d. Perhitungan
Perhitungan nilai 𝜙1 pada skripsi ini menggunakan program R dan diperoleh
𝜙1 = 5.721
e. Kesimpulan
𝜙1 =2∑ {𝑦𝑖𝑙𝑛(
𝑦𝑖�̂�𝑖
)−(𝑦𝑖−�̂�𝑖)}𝑛𝑖=1
𝑑𝑏=
62.932
11= 5.721 > 1 maka 𝐻0 ditolak artinya
model regresi Poisson mengalami overdispersi sehingga hasil analisa regresi
Poisson pada langkah 4 tidak dapat digunakan. Oleh karena itu, analisis regresi
yang tepat untuk memodelkan data banyaknya kasus campak pada 16
Kecamatan di Kota Semarang adalah menggunakan analisis Regresi Binomial
Negatif.
6. Regresi Binomial Negatif
Setelah melakukan pengolahan data menggunakan program R diperoleh
nilai untuk parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4 pada tabel 3.4 berikut:
Tabel 3.4 Parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4 untuk Regresi Binomial Negatif
Parameter estimasi standar error
𝛽0 1.224 0.674
𝛽1 0.001 0.000
𝛽2 -0.346 0.251
𝛽3 0.000 0.000
𝛽4 -0.000 0.000
Jadi, model regresi Binomial Negatif yang dihasilkan adalah
�̂�𝑖 = exp(1.224 + 0.001𝑥1𝑖 − 0.346𝑥2𝑖 + 0.000𝑥3𝑖 − 0.000𝑥4𝑖)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
87
7. Uji signifikan model Regresi Binomial Negatif
hipotesisnya adalah:
𝐻0: 𝛽1 = 𝛽𝑗
𝐻1: ∃𝛽𝑗 ≠ 0 ; j = 1,2
Statistik uji yang digunakan adalah
𝐿𝑅 = −2{𝑙𝑜𝑔�̂�0 − 𝑙𝑜𝑔�̂�1} = −2(−101.289 + 95.305 ) = 11.968
Berdasarkan tabel chi-squares dengan tingkat signifikansi 0.05 dan
derajat bebas 4 diperoleh nilai 𝑋(0.05,4)2 = 9.48773. nilai 𝐿𝑅 = 11.968 > 𝑋(0.05,2)
2 =
9.48773, maka 𝐻0 ditolak pada tingkat signifikansi 0.05 sehingga model Binomial
negatif dapat digunakan untuk menggambarkan hubungan antara banyaknya kasus
penyakit campak pada 16 Kecamatan di Kota Semarang dengan imunisasi,
banyaknya puskesmas, keluarga miskin dan kepadatan penduduk.
Jadi, model regresi Binomial Negatif yang terbentuk adalah
�̂�𝑖 = exp(1.224 + 0.001𝑥1𝑖 − 0.346𝑥2𝑖 + 0.000𝑥3𝑖 − 0.000𝑥4𝑖)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
88
BAB IV
PEMODELAN REGRESI BINOMIAL NEGATIF PADA DATA BANYAKNYA
KEMATIAN IBU DI PROPINSI JAWA TIMUR TAHUN 2012
Pada Bab ini akan dibahas suatu masalah nyata tentang banyaknya kematian
ibu di Propinsi Jawa Timur pada tahun 2012 di setiap Kabupaten. Undang-undang
nomor 36 tahun 2009 tentang kesehatan mengamanatkan bahwa upaya kesehatan ibu
ditujukan untuk menjaga kesehatan ibu sehingga mampu melahirkan generasi yang
sehat dan berkualitas, serta dapat mengurangi angka kematian ibu sebagai salah satu
indicator Renstra dan MDGs.
Kegiatan kesehatan ibu dan anak (KIA) merupakan kegiatan prioritas
mengingat terdapat indikator dampak yaitu angka kematian Ibu (AKI) dan angka
kematian Bayi (AKB) yang merupakan indikator keberhasilan pembangunan daerah,
khususnya pembangunan kesehatan. Untuk melihat kinerja kesehatan ibu dan anak,
maka perlu untuk melihat secara keseluruhan indikator kesehatan ibu dan anak, yaitu:
1. Cakupan pelayanan ibu hamil K1
2. Cakupan pelayan ibu hamil K4
3. Cakupan pertolongan persalinan oleh tenaga kesehatan
4. Cakupan komplikasi kebidanan ditangani
5. Cakupan pelayanan nifas
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
89
6. Pelayan imunisasi dan lainnya
Angka kematian ibu merupakan jumlah kematian ibu yang terjadi karena proses
kehamilan, persalinan dan nifas. Angka kematian ibu dalam Profil Dinas Kesehatan
Propinsi Jawa Timur Tahun 2012 merupakan data yang berbentuk count. Distribusi
Poisson merupakan distribusi variabel random diskrit namun untuk suatu peristiwa
yang jarang terjadi. Kematian ibu merupakan suatu kejadian yang jarang terjadi. Angka
kematian Ibu di propinsi Jawa Timur tahun 2012 mempunyai indikasi overdispersi
sehingga data angka kematian Ibu di Propinsi Jawa Timur dapat dimodelkan dengan
menggunakan model Regresi Binomial Negatif.
Berikut adalah variabel yang digunakan dalam penelitian yaitu:
1. Variabel dependen
Variabel dependen dalam penelitian ini adalah banyaknya kematian Ibu di Propinsi
Jawa Timur tahun 2012 pada 38 Kabupaten/kota.
2. Variabel independen
Adapun beberapa variabel independen dalam penelitian ini adalah:
1) Jumlah cakupan imunisasi Tetanus Toksoid (TT2+) pada ibu hamil (𝑋1)
𝑋1 adalah proses membangun kekebalan sebagai upaya pencegahan terhadap
infeksi tetanus yang diberikan setelah 4 minggu kehamilan.
2) Jumlah ibu hamil yang mendapatkan tablet FE1 (30 tablet) (𝑋2)
𝑋2 pemberian tablet besi pada Ibu hamil sebanyak 30 tablet
3) Jumlah ibu hamil yang mendapatkan tablet FE3 (90 tablet) (𝑋3)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
90
𝑋3 pemberian tablet besi pada Ibu hamil sebanyak 90 tablet
4) Jumlah cakupan imunisasi Tetanus Toksoid (TT-5) pada ibu hamil (𝑋4)
𝑋1 adalah proses membangun kekebalan sebagai upaya pencegahan terhadap
infeksi tetanus yang diberikan 1 tahun setelah TT-4.
5) Cakupan K1 (𝑋5)
𝑋5 adalah cakupan pelayanan antenatal yang dipantau melalui pelayanan
kunjungan baru Ibu hamil.
6) Cakupan K4 (𝑋6)
𝑋6 adalah cakupan pelayanan antenatal yang dipantau melalui pelayanan
kunjungan baru Ibu hamil sebanyak 4 × yaitu sekali pada triwulan pertama,
sekali pada triwulan dua, dan 2 × pada triwulan ketiga.
7) Cakupan ibu bersalin yang ditolong nakes (𝑋7)
𝑋7 merupakan proses pelayanan persalinan oleh dokter spesialis kebidanan
dan kandungan, dokter umum, dan bidan yang dimulai pada kala I sampai
dengan kala IV persalinan.
8) Jumlah Ibu nifas (𝑋8)
𝑋8 merupakan masa sesudah persalinan, masa perubahan, pemulihan, dan
penyembuhan. Lamanya masa nifas adalah berkisar antara 6 minggu atau 40
hari.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
91
A. Deskripsi Data
Untuk melihat karakteristik dari masing-masing variabel maka ditampilkan
statistika deskriptif yang dapat dilihat pada tabel 4.1 berikut ini:
Tabel 4.1 Deskripsi Data
variabel N minimum maksimum Mean Std.deviasi variansi
𝑌 38 0.00 14.00 3.8900 3.56200 12.691
𝑋1 38 0.00 986.54 79.8771 234.41978 54952.634
𝑋2 38 67.68 107.42 86.7918 8.53393 72.828
𝑋3 38 65.37 106.44 80.4603 8.57757 73.575
𝑋4 38 0.00 235.13 11.4742 41.12683 1691.416
𝑋5 38 75.18 108.57 91.5611 8.06932 65.114
𝑋6 38 70.67 101.55 84.0605 7.41634 55.002
𝑋7 38 75.02 101.41 88.9408 6.78990 46.103
𝑋8 38 74.42 100.80 87.5224 7.03324 49.466
B. Pengolah Data
Data pada lampiran 7 merupakan data banyaknya kematian Ibu di Propinsi
Jawa Timur yang diambil dari Profil Dinas Kesehatan Propinsi Jawa Timur Tahun
2012.
Langkah-langkah analisis data mengikuti tahap-tahap berikut:
1. Uji Kolmogorov-Smirnov
2. Pendugaan Model Regresi Poisson
3. Uji signifikansi parameter
4. Uji overdispersi pada Model Regresi Poisson
5. Pendugaan Model Regresi Binomial Negatif
6. Uji signifikansi Model Regresi Binomial Negatif
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
92
Berikut adalah langkah-langkah pendugaan parameter-parameter dari model regresi
Binomial Negatif:
1. Uji Kolmogorov-smirnov
Tujuan dari Uji Kolmogorov-Smirnov adalah untuk menentukan apakah data
banyaknya kematian Ibu di Propinsi Jawa Timur tahun 2012 pada 38 Kabupaten/kota
mengikuti distribusi Poisson atau tidak.
Langkah-langkah uji Kolmogorov-Smirnov untuk distribusi Poisson adalah
sebagai berikut
1) 𝐻0 = data berdistribusi Poisson
𝐻1 = data tidak berdistribusi Poisson
2) Tingkat signifikansi 𝛼 = 0.05
3) Daerah penolakan
Asymp.Sig.(2-tailed)< 𝛼 maka 𝐻0 ditolak
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
93
Table 4.2 hasil pengujian Kolmogorov-Smirnov
One-Sample Kolmogorov-Smirnov Test
Y
N 38
Poisson Parametera,,b Mean 3.89
Most Extreme
Differences
Absolute .216
Positive .216
Negative -.111
Kolmogorov-Smirnov Z 1.333
Asymp. Sig. (2-tailed) .057
a. Test distribution is Poisson.
b. Calculated from data.
4) Dari hasil uji Kolmogorov-Smirnov di atas tampak bahwa nilai Asymp.Sig.(2-
tailed) adalah 0.057. jadi, Asymp.Sig.(2-tailed)> 𝛼. Dengan demikian berarti
𝐻0 diterima. Jadi, dapat disimpulkan bahwa data berdistribusi Poisson.
2. Pemodelan Regresi Poisson
Setelah melakukan pengolahan data menggunakan program R diperoleh nilai untuk
parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4, 𝛽5, 𝛽6, 𝛽7, 𝛽8 pada tabel 4.3 berikut:
Table 4.3 parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4, 𝛽5, 𝛽6, 𝛽7, 𝛽8 untuk Regresi Poisson
parameter estimasi standar error
𝛽0 −0.016 1.2678
𝛽1 0.001 0.0003
𝛽2 −0.028 0.0308
𝛽3 0.050 0.0309
𝛽4 −0.009 0.0039
𝛽5 0.170 0.0379
𝛽6 −0.045 0.0243
𝛽7 −0.103 0.0501
𝛽8 −0.034 0.0441
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
94
Jadi, model regresi Poisson yang dihasilkan adalah
�̂�𝑖 = exp(−0.016 + 0.001𝑥1𝑖 − 0.028𝑥2𝑖 + 0.050𝑥3𝑖 − 0.009𝑥4𝑖 + 0.170𝑥5𝑖
− 0.045𝑥6𝑖 − 0.103𝑥7𝑖 − 0.034𝑥8𝑖)
3. Uji Signifikansi Parameter
Selanjutnya dilakukan pengujian signifikansi masing-masing parameter dari
model regresi Poisson.
Hipotesis:
𝐻0: 𝛽𝑗 = 0
𝐻1: 𝛽𝑗 ≠ 0
Statistik uji:
𝑊𝑗 = [�̂�𝑗
𝑠𝑒(�̂�𝑗)]
2
Sehingga berdasarkan persamaan diatas diperoleh
1. 𝑊1 = [�̂�1
𝑠𝑒(�̂�1)]
2
= [0.001
0.0003]
2
= 11.1111
2. 𝑊2 = [�̂�2
𝑠𝑒(�̂�21)]
2
= [−0.028
0.0308]
2
= 0.8264
3. 𝑊3 = [�̂�2
𝑠𝑒(�̂�21)]
2
= [0.050
0.0309]
2
= 2.6183
4. 𝑊4 = [�̂�2
𝑠𝑒(�̂�21)]
2
= [−0.009
0.0039]
2
= 5.3254
5. 𝑊5 = [�̂�2
𝑠𝑒(�̂�21)]
2
= [0.170
0.0379]
2
= 20.1196
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
95
6. 𝑊6 = [�̂�2
𝑠𝑒(�̂�21)]
2
= [−0.045
0.0243]
2
= 3.4293
7. 𝑊7 = [�̂�2
𝑠𝑒(�̂�21)]
2
= [−0.103
0.0501]
2
= 4.2267
8. 𝑊8 = [�̂�2
𝑠𝑒(�̂�21)]
2
= [−0.034
0.0441]
2
= 0.5944
Berdasarkan tabel Chi-squares dengan tingkat signifikansi 0.05 dan derajat
bebas 7 diperoleh nilai 𝜒0.05,72 = 14.0671 sehingga
1. 𝑊1 = 11.111 < 𝜒0.05,72 = 14.0671 maka 𝐻0 diterima
2. 𝑊2 = 0.8264 < 𝜒0.05,72 = 14.0671 maka 𝐻0 diterima
3. 𝑊3 = 2.6183 < 𝜒0.05,72 = 14.0671 maka 𝐻0 diterima
4. 𝑊4 = 5.3254 < 𝜒0.05,72 = 14.0671 maka 𝐻0 diterima
5. 𝑊5 = 20.1196 > 𝜒0.05,72 = 14.0671 maka 𝐻0 dtolak
6. 𝑊6 = 3.4293 < 𝜒0.05,72 = 14.0671 maka 𝐻0 diterima
7. 𝑊7 = 4.2267 < 𝜒0.05,72 = 14.0671 maka 𝐻0 diterima
8. 𝑊8 = 0.5944 < 𝜒0.05,72 = 14.0671 maka 𝐻0 diterima
Artinya pada tingkat signifikansi 0.05 𝑥1, 𝑥2, 𝑥3, 𝑥4, 𝑥6, 𝑥7, 𝑥8 tidak
memiliki kontribusi terhadap 𝑌 sedangkan 𝑥5 memiliki kontribusi terhadap
𝑌. Namun analisis pada Regresi Poisson belum bisa digunakan karena
belum diuji asumsi equidispersi. Oleh karena itu, maka pada langkah
selanjutnya akan diuji asumsi equidispersi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
96
9. Uji overdispersi pada model Regresi Poisson
Uji overdispersi dapat dilihat berdasarkan nilai Devians. Berikut adalah
langkah-langkah pengujian overdispersi
a. Perumusan Hipotesis
𝐻0: tidak terdapat overdispersi pada model regresi Poisson
𝐻1: terdapat overdispersi pada model Regresi Poisson
b. Statistik uji
𝜙1 =2 ∑ {𝑦𝑖𝑙𝑛 (
𝑦𝑖
�̂�𝑖) − (𝑦𝑖 − �̂�𝑖)}𝑛
𝑖=1
𝑑𝑏
Dengan n adalah banyaknya pengamatan dan k adalah banyaknya parameter
termasuk konstanta.
c. Kriteria pengujian
𝐻0 ditolak bila 𝜙1 > 1
d. Perhitungan
Perhitungan nilai 𝜙1 pada skripsi ini menggunakan program R dan diperoleh 𝜙1 =
1.766758621
e. Kesimpulan
𝜙1 =2 ∑ {𝑦𝑖𝑙𝑛(
𝑦𝑖�̂�𝑖
)−(𝑦𝑖−�̂�𝑖)}𝑛𝑖=1
𝑑𝑏=
81.985
29= 2.827 > 1 maka 𝐻0 ditolak artinya model
regresi Poisson mengalami overdispersi sehingga hasil analisa regresi Poisson pada
langkah 4 tidak dapat digunakan. Oleh karena itu, analisis regresi yang tepat untuk
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
97
memodelkan jumlah kematian ibu di Propinsi Jawa Timur pada 38 kabupaten/kota
adalah menggunakan analisis Regresi Binomial Negatif.
10. Pendugaan Model Regresi Binomial Negatif
Setelah melakukan pengolahan data menggunakan program R diperoleh nilai
untuk parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4, 𝛽5, 𝛽6, 𝛽7, 𝛽8 pada tabel 4.4 berikut:
tabel 4.4 parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4, 𝛽5, 𝛽6, 𝛽7, 𝛽8 untuk Regresi
Binomial Negatif
parameter estimasi standar error
𝛽0 −0.851 1.886
𝛽1 0.001 0.001
𝛽2 −0.026 0.046
𝛽3 −0.009 0.046
𝛽4 0.192 0.005
𝛽5 −0.045 0.058
𝛽6 −0.105 0.037
𝛽7 −0.105 0.073
𝛽8 −0.049 0.063 Jadi, model regresi Binomial Negatif yang dihasilkan adalah
�̂�𝑖 = exp(−0.851 + 0.001𝑥1 − 0.026𝑥2 − 0.009𝑥3 + 0.192𝑥4 − 0.045𝑥5
− 0.105𝑥6 − 0.105𝑥7 − 0.049𝑥8)
11. Uji signifikan model Regresi Binomial Negatif
Hipotesisnya adalah:
𝐻0: 𝛽1 = 𝛽2 = 0
𝐻1: ∃𝛽𝑗 ≠ 0 ; j = 1,2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
98
Statistik uji yang digunakan adalah
𝐿𝑅 = −2{𝑙𝑜𝑔�̂�0 − 𝑙𝑜𝑔�̂�1} = −2(−187.326 + 171.118) = 32.416
Berdasarkan tabel Chi-squares dengan tingkat signifikansi 0.05 dan derajat bebas 8
diperoleh nilai 𝑋(0.05,8)2 = 15.5073. nilai 𝐿𝑅 = 32.416 > 𝑋(0.05,2)
2 = 15.5073, maka 𝐻0
ditolak pada tingkat signifikansi 0.05 sehingga model Binomial negatif dapat
digunakan untuk menggambarkan hubungan antara jumlah kematian ibu di Propinsi
Jawa Timur pada 38 Kabupaten/kota dengan Jumlah cakupan imunisasi Tetanus
Toksoid (TT2+) pada ibu hamil (𝑋1), Jumlah ibu hamil yang mendapatkan tablet
FE1 (30 tablet) (𝑋2), Jumlah ibu hamil yang mendapatkan tablet FE3 (90 tablet)
(𝑋3), Jumlah cakupan imunisasi Tetanus Toksoid (TT-5) pada ibu hamil (𝑋4),
Cakupan K1 (𝑋5), Cakupan K4 (𝑋6), Cakupan ibu bersalin yang ditolong nakes
(𝑋7), dan Jumlah Ibu nifas (𝑋8)
Jadi, model regresi Binomial Negatif yang terbentuk adalah
�̂�𝑖 = exp(−0.851 + 0.001𝑥1𝑖 − 0.026𝑥2𝑖 − 0.009𝑥3𝑖 + 0.192𝑥4𝑖 − 0.045𝑥5𝑖
− 0.105𝑥6𝑖 − 0.105𝑥7𝑖 − 0.049𝑥8𝑖)
Berikut adalah contoh interpretasi parameter 𝛽1, 𝛽2, 𝛽3, dan 𝛽4 dari model Regresi
Binomial Negatif:
1) Interpretasi 𝛽1 = 0.001
Untuk setiap kenaikan 1 persen 𝑋1, dengan asumsi nilai variabel lainnya tetap,
maka rata-rata 𝑌 (jiwa) akan berlipat 𝑒0.001 ≈ 1.001 kali artinya tidak ada
perubahan yang berarti.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
99
2) Interpretasi 𝛽2 = −0.026
Untuk setiap kenaikan 1 persen 𝑋2, dengan asumsi nilai variabel lainnya tetap,
maka 𝑌 (jiwa) cenderung berkurang sebesar exp (−0.026) kali.
3) Interpretasi 𝛽3 = −0.009
Untuk setiap kenaikan 1 persen 𝑋3, dengan asumsi nilai variabel lainnya tetap,
maka rata-rata 𝑌 cenderung berkurang sebesar exp (−0.009) kali.
4) Interpretasi 𝛽4 = 0.192
Untuk setiap kenaikan 1 persen 𝑋4, dengan asumsi nilai variabel lainnya tetap,
maka rata-rata 𝑌 akan berlipat e0.192 kali.
5) Interpretasi 𝛽5 = −0.045
Untuk setiap kenaikan 1 persen 𝑋5, dengan asumsi nilai variabel lainnya tetap,
maka rata-rata 𝑌 cenderung berkurang sebesar exp (−0.045) kali.
6) Interpretasi 𝛽6 = −0.105
Untuk setiap kenaikan 1 persen 𝑋6, dengan asumsi nilai variabel lainnya tetap,
maka rata-rata 𝑌 cenderung berkurang sebesar exp (−0.105) kali.
7) Interpretasi 𝛽7 = −0.105
Untuk setiap kenaikan 1 persen 𝑋7, dengan asumsi nilai variabel lainnya tetap,
maka rata-rata 𝑌 cenderung berkurang sebesar exp (−0.105) kali.
8) Interpretasi 𝛽8 = −0.049
Untuk setiap kenaikan 1 persen 𝑋8, dengan asumsi nilai variabel lainnya tetap,
maka rata-rata 𝑌 cenderung berkurang sebesar exp (−0.049) kali.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
100
BAB V
KESIMPULAN DAN SARAN
A. Kesimpulan
Data count adalah data hasil percobaan acak yang nilai-nilainya merupakan
bilangan bulat non-negatif. Distribusi yang biasa digunakan untuk memodelkan data
count adalah distribusi Poisson yang memiliki asumsi mean dan variansi yang sama.
Saat terjadi overdispersi, yaitu keadaan dimana variansi lebih besar dari nilai mean,
maka asumsi mean dan variansi pada distribusi Poisson tidak lagi terpenuhi. Oleh
karena itu, diperlukan distribusi lain untuk menganalisis data count tersebut yaitu
model regresi Binomial Negatif.
Pada model regresi Binomial negatif, variabel dependen diasumsikan
berdistribusi Binomial Negatif. Binomial Negatif yang digunakan merupakan
distribusi campuran antara distribusi Poisson dan Gamma.
Pendugaan parameter-parameter dalam model regresi Binomial Negatif
dilakukan dengan metode Pendugaan Kemungkinan Maksimum. Solusi dari
persamaan log-likelihood diperoleh dengan menggunakan metode Newon-Raphson
karena persamaan log-likelihood yang diperoleh tidak linear dalam parameternya.
Model untuk Regresi Binomial Negatif pada data banyaknya kematian Ibu di
Provinsi Jawa Timur pada tahun 2012 adalah sebagai berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
101
�̂�𝑖 = exp(−0.851 + 0.001𝑥1𝑖 − 0.026𝑥2𝑖 − 0.009𝑥3𝑖 + 0.192𝑥4𝑖 − 0.045𝑥5𝑖
− 0.105𝑥6𝑖 − 0.105𝑥7𝑖 − 0.049𝑥8𝑖)
B. Saran
Saran untuk pengembangan skripsi ini adalah membahas metode lain untuk
menangani overdispersi pada data Poisson, seperti metode Quasi-Poisson, metode
Binomial Negatif umum (NB-P), generalized Poisson Regression.
Selain metode pendugaan kemungkinan maksimum, pendugaan parameter
dari distribusi Binomial Negatif dapat dilakukan dengan metode lain diantaranya
adalah metode Quasi likelihood dan metode pendugaan kemungkinan maksimum
Bootstrapped dan metode pendugaan parameter moment.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
102
DAFTAR PUSTAKA
Agresti, A. (2007). An Introduction to Categorical Data Analysis. New York: John
Wiley & Sons.
Agresti, A. (2002). Categorical Data Analysis. Second Edition. New York: John Wiley
& Sons.
Barnon, N. D. (1992). The Analysis of Count Data: Overdispersion and
Autocorrelation. American Sociological Association. 22: 179-220.
Berk, R., MacDonald, J. M. (2008). Overdispersion and Poisson Regression.
Philadelphia: Springer.
Brown, D. L., Zhau, H. Linda. (2002). A Test for the Poison Distribution. The Indian
Journal of statistics. 64: 611-625.
Cahyandari, R. (2014). Pengujian Overdispersi pada Model Regresi Poisson. Statistika.
14 (2): 69-76.
Cameron, A. C., Trivedi, P. K. (1998). Regression Analysis of Count Data. New York:
Cambridge University Press.
Clark, R. D., et all. (2004). A Primer on the Exponential Family of Distributions.
Lecture note.
Cook, J. D. (2009). Notes on the Negative Binomial Distribution. Lecture note.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
103
Diaconis, P., Yivisaker, D. (1979). Conjugate Priors for Exponential Families. The
annals of statistics. 7 (2): 269-281.
Dinas Kesehatan Provinsi Jawa Timur. Profil Kesehatan Provinsi Jawa Timur 2012.
Surabaya: Dinas Kesehatan Propinsi Jawa Timur, 2013.
Gelhan, Andrew, et all (2007). Data Analysis Using Regression and
Multilevel/Hierarchical Models. Cambridge: Cambridge University
Press.
Hilbe, J. M. (2011). Negative Binomial Regression. Second Edition. Cambridge:
Cambridge University Press.
Hilbe, J. M. (2014). Modeling Count Data. New York: Cambridge University Press.
Ismail, N., Jemain, A. A. (2007). Handling Overdispersion with Negative Binomial and
Generalzed Poisson Regression Models. Virgina: Casualty Actuarial
Society Forum.
Johnson, N. L., et all. (1992). Univariate Discrete Distribution. New York: The Willey
Interscience Publication.
Kothari, R. C. (2004). Research Methodology Methods & Techniques. New Delhi: New
Age International.
Lawal, B. (2003). Categorical Data Analysis with SAS and SPSS Application. London:
Lawrence Erlbaum Associates.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
104
Lawless, F. J. (1987). Negative Binomial and Mixed Poisson Regression. The
Canadian Journal of statistics. 15 (3): 209-225.
Lord, D., Park, J. B. Negative Binomial Regression Models and Estimation Methods.
Lecture note.
McCullagh, P., Nelder, J. A. (1989). Generalized Linear Models. London: Chapman
and Hall.
Muntafiah, Rena, et all. (2014). Pemodelan Regresi Binomial Negatif untuk Mengatasi
Overdispersion pada Regresi Poisson. Statistika. 2 (1).
Ruliana. 2015. Pemodelan Generalized Poisson Regression (GPR) untuk mengatasi
pelanggaran Equidispersion pada Regresi Poisson kasus Campak di kota
Semarang. Skirpsi.
Utami, W. T. (2013). Analisis Regresi Binomial Negatif untuk Mengatasi
Overdispersion Regresi Poisson pada kasus demam berdarah dengue.
Statistika. 1 (2).
Winkelmann, R. (2008). Econometric Analysis of Count Data. New York: Springer.
Zeileis, Achim., et all. (2008). Regression Models for Count Data in R. Journal of
statistical Software. 27 (8).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
105
LAMPIRAN
Lampiran 1
Penyelesaian contoh 2.2 dengan menggunakan program R
> ##Metode Newton-Raphson
> Newton=function(f,tol=1e-12,x0=1, N=100){
+ h=1e-12
+ i=1;x1=x0
+ p=numeric(N)
+ while(i<=N){
+ df.dx=(f(x0+h)-f(x0))/h
+ x1=(x0-(f(x0)/df.dx))
+ p[i]=x1
+ i=i+1
+ if(abs(x1-x0)<tol)break
+ x0=x1
+ }
+ return(p[1:(i-1)])
+ }
> ##contoh soal menggunakan Newton-Raphson
> f=function(x){x^3-x-1}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
106
> h=1e-12
> df.dx=function(x){(f(x+h)-f(x))/h}
> df.dx(1);df.dx(2)
[1] 2.000178
[1] 11.00098
> app=Newton(f,tol=1e-12,x0=1)
> app
[1] 1.499956 1.347828 1.325204 1.324718 1.324718 1.324718 1.324718
##hasil dari app di atas menunjukan bahwa x1=1.499956, x2=1.347828,
x3=1.325204, x4=1.324718, x5=1.324718, x6=1.324718, x7=1.324718 dan akar dari
persamaan x^3-x-1=0 adalah 1.324718
Lampiran 2
Uji Kolmogorov-Smirnov untuk contoh 2.2
One-Sample Kolmogorov-Smirnov Test
Data
N 16
Poisson Parametera,,b Mean 3.06
Most Extreme
Differences
Absolute .247
Positive .247
Negative -.117
Kolmogorov-Smirnov Z .990
Asymp. Sig. (2-tailed) .281
a. Test distribution is Poisson.
b. Calculated from data.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
107
Lampiran 3
Data banyaknya kasus campak pada 16 kecamatan di kota Semarang
Kecamatan 𝑌 𝑋1 𝑋2 𝑋3 𝑋4
Mijen 2 955 2 725 1006
Gunungpati 12 1094 2 1776 1402
Banyumanik 8 2692 4 236 5080
Gajah Mungkur 2 855 1 1343 7012
SemarangSelatan 22 2129 2 1313 13882
Candisari 11 1447 2 1550 12187
Tembalang 20 2574 3 3008 3339
Pedurungan 11 2873 2 1705 8549
Genuk 5 2028 2 201 3411
Gayamsari 1 1928 1 88 11939
Semarang Timur 7 1857 3 4603 10211
Semarang Utara 6 1882 2 3183 11671
SemarangTengah 2 1481 2 778 11596
Semarang Barat 1 2340 5 2660 7298
Tugu 4 539 2 1236 984
Ngaliyan 23 2511 3 2113 3226
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
108
Lampiran 4
Uji Kolmogorov-Smirnov untuk variabel dependent contoh 3.1
One-Sample Kolmogorov-Smirnov Test
Data Campak
N 16
Poisson Parametera,,b Mean 8.56
Most Extreme
Differences
Absolute .304
Positive .304
Negative -.187
Kolmogorov-Smirnov Z 1.215
Asymp. Sig. (2-tailed) .105
a. Test distribution is Poisson.
b. Calculated from data.
Lampiran 5
Pemodelan Regresi Poisson pada data banyaknya kasus campak pada 16 kecamatan di
kota Semarang
> data_campak=read.csv(file.choose())
> data_campak
> Y=data_campak[,1]
> X1=data_campak[,2]
> X2=data_campak[,3]
> X3=data_campak[,4]
> X4=data_campak[,5]
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
109
> Regresi_Poisson=glm(Y~X1+X2+X3+X4, family=poisson)
> summary(Regresi_Poisson)
Call:
glm(formula = Y ~ X1 + X2 + X3 + X4, family = poisson)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.8844 -1.4262 -1.2431 0.9236 4.2930
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.248e+00 3.706e-01 3.368 0.000757 ***
X1 7.625e-04 1.527e-04 4.994 5.9e-07 ***
X2 -2.699e-01 1.190e-01 -2.269 0.023268 *
X3 2.018e-04 7.624e-05 2.647 0.008115 **
X4 -4.211e-05 2.318e-05 -1.817 0.069268 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 94.345 on 15 degrees of freedom
Residual deviance: 62.932 on 11 degrees of freedom
AIC: 130.52
Number of Fisher Scoring iterations: 5
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
110
Lampiran 6
Pemodelan Regresi Binomial Negatif pada data banyaknya kasus campak pada 16
kecamatan di kota Semarang
> library(MASS)
> Regresi_Binomial_Negatif=glm.nb(Y~X1+X2+X3+X4)
> summary(Regresi_Binomial_Negatif)
Call:
glm.nb(formula = Y ~ X1 + X2 + X3 + X4, init.theta = 2.49970112,
link = log)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.8691 -0.8137 -0.6142 0.3736 1.6968
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.224e+00 6.741e-01 1.815 0.0695 .
X1 8.193e-04 3.383e-04 2.422 0.0154 *
X2 -3.458e-01 2.509e-01 -1.378 0.1682
X3 2.255e-04 1.661e-04 1.357 0.1747
X4 -3.428e-05 4.785e-05 -0.717 0.4737
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
111
(Dispersion parameter for Negative Binomial(2.4997) family taken to be 1)
Null deviance: 23.852 on 15 degrees of freedom
Residual deviance: 16.601 on 11 degrees of freedom
AIC: 107.31
Number of Fisher Scoring iterations: 1
Theta: 2.50
Std. Err.: 1.19
2 x log-likelihood: -95.305
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
112
Lampiran 7
Pemodelan Regresi Binomial Negatif tanpa variabel independent pada data banyaknya
kasus campak pada 16 kecamatan di kota Semarang
> regresi_Binomial_Negatif=glm.nb(Y~1)
> summary(regresi_Binomial_Negatif)
Call:
glm.nb(formula = Y ~ 1, init.theta = 1.577483673, link = log)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.6631 -1.2795 -0.3037 0.3317 1.3905
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.1474 0.2166 9.914 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(1.5775) family taken to be 1)
Null deviance: 16.907 on 15 degrees of freedom
Residual deviance: 16.907 on 15 degrees of freedom
AIC: 105.29
Number of Fisher Scoring iterations: 1
Theta: 1.577
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
113
Std. Err.: 0.645
2 x log-likelihood: -101.289
Lampiran 8
Data banyaknya kematian Ibu di Propinsi Jawa Timur tahun 2012
𝑌 𝑋1 𝑋2 𝑋3 𝑋4 𝑋5 𝑋6 𝑋7 𝑋8
4 0.00 74.61 70.87 0.00 96.78 90.01 92.59 92.26
1 11.19 76.06 76.42 1.53 83.6 77.51 80.76 80.84
2 0.00 102.42 84.6 0.00 103.37 83.64 98.88 97.33
0 0.00 88.53 83.94 0.00 91.66 85.04 89.57 86.38
4 0.00 86.57 79.75 0.00 91.15 84.42 89.26 89.39
7 6.23 89.41 84.56 0.00 95.38 90.79 92.42 88.78
8 23.05 92.39 88.96 12.78 98.16 94.62 93.07 90.69
1 0.00 103.44 95.63 0.00 102.45 91.41 100.83 96.04
13 0.00 87.82 81.58 0.00 89.3 70.67 85.15 85.63
2 0.00 88.07 81.32 0.00 88.43 79.89 87.04 88.06
6 1.03 96.03 86.24 0.20 96.07 91.61 90.8 95.68
8 0.00 79.7 72.41 0.00 87.05 75.21 82.08 81.11
7 0.00 91.69 79.95 0.00 91.69 79.41 87.23 86.97
10 0.00 90.65 80.43 0.00 89.32 82.8 86.02 82.38
2 0.00 81.54 75.83 0.00 83.83 80.87 84.94 77.53
5 0.00 80.22 73.87 0.00 89.23 78.89 86.56 84.18
6 26.3 91.97 86.85 12.19 92.18 86.56 90.33 90.58
5 0.00 86 81.04 0.00 90.5 84.46 93.32 86.37
2 0.15 74.52 71.74 0.06 78.45 73.31 75.06 74.42
0 52.91 77.36 74.28 13.17 85.87 82.04 85.52 83.79
5 12.68 95.03 92.26 4.37 95.03 92.26 93.92 92.32
3 40.55 99.07 88.98 13.14 103.6 92.45 98.4 95.37
7 986.54 90.32 87.93 9.68 89.98 87.47 93.76 91.22
5 0.00 86.85 84.88 0.00 108.57 101.55 101.41 100.8
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
114
5 0.00 88.73 83.12 0.00 91.03 82.52 88.96 87.33
3 53.32 80.32 72.85 11.37 103.78 93.98 98.98 99.57
5 0.00 79.87 65.37 0.00 106.7 83.72 96.65 100.43
3 1.81 87.59 81.9 0.68 95.4 90.3 90.74 88.5
1 596.78 80.1 70.78 235.13 88.95 76.05 86.95 87.7
1 5.73 67.68 66.51 1.38 75.18 75.15 75.02 74.75
0 0.00 78.43 73.07 0.00 79.99 73.53 82.45 79.54
1 0.00 107.42 106.44 0.00 78.44 73.25 79.99 80.22
2 250.27 87.06 76.89 105.81 96.04 89.11 88.88 85.57
0 0.00 83.16 68.5 0.00 95.22 90.47 93.51 93.48
0 28.17 85.57 76.74 14.09 83.01 77.58 80.62 78.9
0 3.28 95.39 92.21 0.07 95.39 92.21 95.57 92.52
14 934.87 85.36 83.55 0.04 87.4 84.69 81.24 78.88
0 0.47 81.14 75.24 0.33 81.14 74.85 81.27 80.34
Lampiran 9
Uji Kolmogorov-Smirnov untuk banyaknya kematian Ibu di propinsi Jawa timur tahun 2012
One-Sample Kolmogorov-Smirnov Test
Y
N 38
Poisson Parametera,,b Mean 3.89
Most Extreme
Differences
Absolute .216
Positive .216
Negative -.111
Kolmogorov-Smirnov Z 1.333
Asymp. Sig. (2-tailed) .057
a. Test distribution is Poisson.
b. Calculated from data.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
115
Lampiran 10
Pemodelan Regresi Poisson pada data banyaknya kematian Ibu di Propinsi Jawa Timur
tahun 2012
> data=read.csv(file.choose())
> data
> Y=data[,1]
> X1=data[,2]
> X2=data[,3]
> X3=data[,4]
> X4=data[,5]
> X5=data[,6]
> X6=data[,7]
> X7=data[,8]
> X8=data[,9]
> Regresi_Poisson=glm(Y~X1+X2+X3+X4+X5+X6+X7+X8, family=poisson)
> summary(Regresi_Poisson)
Call:
glm(formula = Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8, family = poisson)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.7128 -1.6982 -0.4699 1.0928 2.7845
Coefficients:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
116
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.0157082 1.2678450 -0.012 0.990115
X1 0.0011083 0.0003005 3.688 0.000226 ***
X2 -0.0280953 0.0308357 -0.911 0.362227
X3 0.0504269 0.0308850 1.633 0.102526
X4 -0.0086866 0.0039030 -2.226 0.026042 *
X5 0.1700451 0.0378694 4.490 7.11e-06 ***
X6 -0.0453599 0.0243296 -1.864 0.062266 .
X7 -0.1025708 0.0501153 -2.047 0.040688 *
X8 -0.0343675 0.0440876 -0.780 0.435669
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 127.842 on 37 degrees of freedom
Residual deviance: 81.985 on 29 degrees of freedom
AIC: 199.12
Number of Fisher Scoring iterations: 5
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
117
Lampiran 11
Pemodelan Regresi Binomial Negatif pada data banyaknya kematian Ibu di Propinsi Jawa
Timur tahun 2012
> library(MASS)
> Regresi_Binomial_Negatif=glm.nb(Y~X1+X2+X3+X4+X5+X6+X7+X8)
> summary(Regresi_Binomial_Negatif)
Call:
glm.nb(formula = Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8, init.theta =
3.306785892, link = log)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.2197 -1.2097 -0.2982 0.6762 1.7235
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.8507402 1.8859419 -0.451 0.651921
X1 0.0013135 0.0005345 2.458 0.013990 *
X2 -0.0257783 0.0458529 -0.562 0.573982
X3 0.0516181 0.0457189 1.129 0.258885
X4 -0.0089608 0.0048721 -1.839 0.065882 .
X5 0.1919947 0.0581520 3.302 0.000961 ***
X6 -0.0452282 0.0371100 -1.219 0.222935
X7 -0.1054134 0.0730148 -1.444 0.148816
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
118
X8 -0.0487728 0.0633830 -0.769 0.441601
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(3.3068) family taken to be 1)
Null deviance: 67.117 on 37 degrees of freedom
Residual deviance: 45.850 on 29 degrees of freedom
AIC: 191.12
Number of Fisher Scoring iterations: 1
Theta: 3.31
Std. Err.: 1.69
2 x log-likelihood: -171.118
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
119
Lampiran 12
Pemodelan Regresi Binomial Negatif tanpa variabel independent pada data banyaknya
kematian Ibu di Propinsi Jawa Timur tahun 2012
> Regresi_Binomial_Negatif=glm.nb(Y~1)
> summary(Regresi_Binomial_Negatif)
Call:
glm.nb(formula = Y ~ 1, init.theta = 1.414255469, link = log)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.9343 -1.0419 -0.2517 0.4290 1.7217
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.3596 0.1593 8.537 <2e-16 ***
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(1.4143) family taken to be 1)
Null deviance: 44.181 on 37 degrees of freedom
Residual deviance: 44.181 on 37 degrees of freedom
AIC: 191.33
Number of Fisher Scoring iterations: 1
Theta: 1.414
Std. Err.: 0.495
2 x log-likelihood: -187.326
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI