pendugaan model regresi binomial …. fungsi probabilitas ... c. momen dan fungsi pembangkit momen...

i

PENDUGAAN MODEL REGRESI BINOMIAL NEGATIF DENGAN

METODE KEMUNGKINAN MAKSIMUM

Skripsi

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Program Studi Matematika

Oleh:

Maria Ansila Bouk

NIM: 123114019

PROGRAM STUDI MATEMATIKA JURUSAN MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2016

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

ii

THE ESTIMATION OF NEGATIVE BINOMIAL REGRESSION MODEL

USING MAXIMUM LIKELIHOOH METHOD

Thesis

Presented as Partial Fulfillment of the Requirements

to Obtain Sarjana Sains Degree in Mathematics

By:

Maria Ansila Bouk

Student Number: 123114019

MATHEMATICS STUDY PROGRAM, MATHEMATICS DEPARTMENT

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

2016


SKRIPSI

PEI\IDUGAAF{ MODEL REGRESI BINOMIAL hTEGATIF DENGAN

METODE KEMT]NGKINAII MAKSIMTJM

Disusun

{.f\114019

-Y

l,n(Ir. Ig. Aris Dwiatnoko, M. Sc.) Tanggal: Agustus 2016

lu


SKRIPSI

PEI\DUGAAI{ MODEL REGRESI BINOMIAL I{EGATIF DENGAN

METODE KEMUNGKINAI{ MAKSIMUM

Disiapkan dan ditulis oleh:

Maria Ansila Bouk

NIM:123114019

Telah dipertahankan dihadapan Panitia Penguj i

Pada tanggal 24 Agustus 2016

Dan dinyatakan memenuhi syarat

Susunan Panitia Penguj i

Nama lengkap

Ketua

Sekretaris

Anggota

: Dr. rer. nat. Herry Pribawanto Suryawan

: Y. G. Hartono, Ph. D

: Ir. Ig. Aris Dwiatmoko, M. Sc

Yogyakart4 ZJ A3ut{.w 2016

Fakultas Sains dan Teknologi

ilversitas Sanata Dharma

Dekan

atM.Math.Sc.. Ph.D.)

IV


v

HALAMAN PERSEMBAHAN

Di dalam setiap kejadian dalam kehidupan , Tuhan selalu

mempunyai maksud dan tujuan.

Skripsi ini dipersembahkan untuk

Tuhan Yesus Kristus dan Bunda Maria yang selalu menyertai, memberkati, dan memberikan kemudahan

bagi saya lewat orang-orang yang baik hati dalam setiap perjuangan saya.

Kedua orang tua Bapa Agus dan Mama Siska

Adik-adik tercinta Lista, Nandi, Ory dan Ikun

Serta almamater yang kubanggakan


PERITYATAAI{ KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini tidak

memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalam

kutipan dan daftar pustak4 sebagaimana layaknya karya ilmiah.

Yogyakart4 15 Agustus 2016

Penulis

hr1^A/V

Maria Ansila Bouk

vl


vii

ABSTRAK

Model regresi Poisson secara umum digunakan untuk menganalisis data count

yang diasumsikan berdistribusi Poisson dengan nilai rata-rata dan variansinya sama

(equidispersion). Namun, seringkali terjadi masalah nilai variansi melebihi nilai rata-

rata atau lebih dikenal dengan overdispersi sehingga model regresi Poisson tidak tepat

digunakan. Salah satu model yang dapat digunakan untuk mengatasi masalah

overdispersi adalah dengan menggunakan model regresi Binomial Negatif.

Pendugaan parameter dapat diperoleh dengan metode pendugaan kemungkinan

maksimum melalui iterasi Newton-Raphson. Data yang digunakan dalam skripsi ini

adalah data banyaknya kematian Ibu hamil di propinsi Jawa Timur tahun 2012. Dari

perhitungan mean dan variansi diketahui bahwa terjadi overdispersi sehingga data

dimodelkan menggunakan Regresi Binomial negatif. Faktor-faktor yang

mempengaruhi banyaknya kematian Ibu adalah jumlah cakupan imunisasi tetanus

Toksoid (TT2+) pada Ibu hamil , jumlah ibu hamil yang mendapatkan tablet FE1

(30 tablet) ,jumlah Ibu hamil yang mendapatkan tablet FE3 (90 tablet)

,jumlah cakupan imunisasi Tetanus Toksoid (TT-5) pada Ibu hamil ,cakupan

K1 , cakupan K4 , cakupan Ibu hamil yang ditolong nakes , dan jumlah

Ibu nifas .

Kata kunci: banyaknya kematian Ibu hamil, Regresi Poisson, Regresi Binomial

Negatif, pendugaan kemungkinan maksimum, Newton-Raphson.


viii

ABSTRACT

Poisson regression model is generally used to analyze the count data which

is Poisson distributed with equal mean value and variance (equidispersion). However,

the problem occurs when the variance exceeds the mean value which we called as

overdispersion so that the Poisson regression model is inappropriately used. One

model that can be used to solve the overdispersion problem is the negative binomial

regression model. The estimation of the parameters can be obtained by the Maximum

Likelihood Estimation method through Newton-Raphson iteration. The data used in

this thesis is data of the number of maternal mortality of pregnant women in East

Java province in 2012. Based on the calculation of mean and variance, it is known

that there is an overdispersion problem so that the data is modeled using negative

binomial regression. Some factors that affect the number of maternal mortality are the

number of tetanus toxoid immunization coverage (TT2 +) in pregnant women , the number of pregnant women who get FE1 tablets (30 tablets) , the number of

pregnant women who get Fe3 tablets (90 tablets) , the number of Tetanus toxoid

immunization coverage (TT-5) in pregnant women , K1 coverage , K4

coverage , the coverage of pregnant women which is assisted by the health

workers , and the number of mother postpartum . Keywords : the number of maternal mortality of pregnant, Poisson regression ,

negative binomial regression , maximum likelihood estimation , Newton -

Raphson .


LEMBAR PER}TYATAAFT PERSETUJUAIY PI]BLIKASI KARYA ILMIAHUNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini, saya mahasiswa universitas sanata Dharma:Nama : Maria Ansila BoukNomer Mahasiswa :123114019

Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan

Universitas Sanata Dharma karya ilmiah yang berjudul:

PENDUGAAN MODEL REGRESI BINOMIAL NEGATIF DENGAN

METODE KEMUNGKINAIY MAKSIMUM

Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya mernberikankepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkandalam bentuk media lain, mengelolanya dalam bentuk pangkalan data,mendistribusikannya secara terbatas, dan mempublikasikannya di internet atau medialain untuk kepentingan akademis tanpa meminta ijin dari saya maupun memberikanroyalti kepada saya selama tetap mencantumkan nama saya sebagai penulis-

Demikian pemyataan ini saya buat dengan sebenarnya.

Dibuat di YogyakartaPada tanggal: 15 Agustus 2016Yang menyatakan

(Maria Ansila Bouk)

lx


x

KATA PENGANTAR

Puji syukur penulis haturkan ke hadirat Tuhan Yang Maha Kuasa atas segala

berkat dan penyertaanNya sehingga penulis dapat menyelesaikan skripsi dengan baik.

Skripsi yang berjudul “Pendugaan Model Regresi Binomial Negatif dengan Metode

Kemungkinan Maksimum” ini adalah salah satu syarat untuk memperoleh gelar

sarjana Matematika pada Fakultas Sains dan Teknologi. Dalam penulisan skripsi ini,

tentunya penulis telah menerima bantuan baik secara moril maupum materil dari

berbagai pihak. Oleh karena itu penulis ingin menyampaikan ucapan terima kasih

kepada:

1. Bapak Ir. Ig. Aris Dwiatmoko., M. Sc selaku dosen pembimbing yang dengan

penuh kesabaran telah memberikan bimbingan nasihat dan arahan kepada

penulis.

2. Bapak Hartono, Ph. D, selaku Ketua Program Studi yang telah memberikan

banyak bimbingan dalam hal akademik dan perkuliahan.

3. Serta bapak dan ibu dosen yang telah memberikan banyak ilmu pengetahuan

kepada penulis selama menjalani perkuliahan di Universitas Sanata Dharma.

4. Mas Susilo selaku laboran yang telah banyak membantu penulis dalam

perkuliahan terutama dalam penulisan skripsi ini.

5. Perpustakaan Universitas Sanata Dharma dan staf sekretariat Fakultas Sains

dan Teknologi yang telah memberikan fasilitas dan kemudahan pembelajaran,

serta administrasi bagi penulis selama masa perkuliahan.


6.

7.

Bapa Agus dan Mama Siska yang penulis cintai dan banggakan, ade List4

Nandi, Ory dan Ikun yang telah banyak memberikan dukungan dan

pengorbanan sehingga penulis dapat menyelesaikan studi dengan baik.

Teman-teman angkatan 2012 Program studi Matematika yaitu putri, Risma,

Happy, Bobi, Tika" Ajeng, Oksi, Juli, Ferni, Arum, llg4 Lia, Noni, Dewi,

Manda , Anggun, Budi, Rian, Eg4 yang telah memberikan dukungan dan

semangat dalam perkuliahan terlebih dalam penyusunan skripsi ini.

Teman-Teman kos Cintia: Archa, Lis4 Nov4 Tia, Mb. Ela Mb. Ria Mb

Ketrin, Mb. Intan, Awang, Her4 Tanti dan juga Asri dan Digna yang selalu

memberikan semangat dalam penyelesaian skripsi ini.

semua pihak yang tidak dapat disebutkan satu persaru yang telah banyak

memberikan bantuan, dorongan dan motivasi sehingga skripsi ini dapat

terselesaikan.

Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan, maka

saran dan kritik yang konstruktii dari semua pihak sangat diharapkan demi

penyempurnaan selanjutnya. Semoga skripsi ini dapat bermanfaat bagi semua

pihak, khususnya bagi penulis dan para pembaca pada umumnya.

Yogyakarta 15 Agustus 2016

Penulis

9.

xl

(Maria Ansila Bouk)


xii

DAFTAR ISI

HALAMAN JUDUL ...................................................................................................... i

HALAMAN JUDUL DALAM BAHASA INGGRIS .................................................. ii

HALAMAN PERSETUJUAN PEMBIMBING .......................................................... iii

HALAMAN PERSEMBAHAN ................................................................................... v

HALAMAN PERNYATAAN KEASLIAN KARYA ................................................. vi

HALAMAN ABSTRAK ............................................................................................. vii

HALAMAN ABSTRACT ......................................................................................... viii

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI....................................... ix

KATA PENGANTAR .................................................................................................. x

DAFTAR ISI ................................................................................................................ xi

DAFTAR TABEL ...........................................................................................................

BAB I PENDAHULUAN ............................................................................................. 1

A. Latar Belakang ..................................................................................................... 1

B. Rumusan Masalah ............................................................................................... 3

C. Batasan Masalah ................................................................................................. 4

D. Tujuan Penulisan ................................................................................................. 4

E. Manfaat Penulisan ............................................................................................... 5

F. Metode Penulisan ................................................................................................ 5

G. Sistematika Penulisan .......................................................................................... 6

BAB II LANDASAN TEORI ....................................................................................... 8

A. Distribusi Probabilitas ......................................................................................... 8

1. Variabel Random .............................................................................................. 8

2. Fungsi Probabilitas ............................................................................................ 8

a. Distribusi Probabilitas Diskrit ....................................................................... 8

b. Distribusi Probabilitas Kontinu ..................................................................... 9

3. Karakteristik Distribusi Probabilitas ................................................................. 9

a. Mean ............................................................................................................ 9

b. Variansi ..................................................................................................... 10

c. Momen dan Fungsi Pembangkit Momen .................................................. 10


xiii

B. Distribusi Poisson .............................................................................................. 13

C. Distribusi Gamma dan Sifat-sifatnya ................................................................ 15

D. Distribusi Binomial Negatif .............................................................................. 18

E. Distribusi Binomial Negatif sebagai Campuran Distribusi Poisson-Gamma .... 22

F. Metode Maksimum Likelihood ......................................................................... 25

G. Metode Numerik Newton-Raphson ................................................................... 28

H. Keluarga Eksponensial ...................................................................................... 32

1. Distribusi Poisson merupakan keluarga eksponensial .................................... 33

2. Distribusi Binomial merupakan keluarga eksponensial .................................. 34

I. Model Regresi Linear Berganda ........................................................................ 36

J. Jenis Data Penelitian .......................................................................................... 37

1. Data berdasarkan sumbernya .......................................................................... 37

2. Data berdasarkan bentuk dan sifatnya............................................................. 38

K. Model Count Respon ......................................................................................... 41

1. Model Regresi logistik dan Regresi Probit ..................................................... 42

2. Model Regresi Poisson dan Regresi Binomial Negatif ................................... 43

L. Uji Kolmogorov-Smirnov ................................................................................. 45

BAB III PENDUGAAN MODEL REGRESI BINOMIAL NEGATIF ...................... 50

A. Model Regresi Poisson Berganda ...................................................................... 50

B. Overdispersi dan Regresi Binomial Negatif ...................................................... 54

C. Binomial Negatif sebagai Keluarga Eksponensial ............................................ 56

D. Model Regresi Binomial Negatif ....................................................................... 61

E. Pendugaan Parameter untuk Model Regresi Binomial Negatif dengan Metode

Maksimum likelihood ........................................................................................ 62

F. Uji Kebaikan Model .......................................................................................... 76


xiv

BAB IV PEMODELAN REGRESI BINOMIAL NEGATIF PADA DATA

BANYAKNYA KEMATIAN IBU DI PROPINSI JAWA TIMUR ........................... 88

A. Deskripsi Data ................................................................................................... 91

B. Pengolahan Data ................................................................................................ 91

1. Uji Kolmogorov-Smirnov ............................................................................... 92

2. Pendugaan Model regresi Poisson .................................................................. 93

3. Uji Signifikansi Parameter .............................................................................. 94

4. Uji Overdispersi pada Model Regresi Poisson ............................................... 96

5. Pendugaan Model Regresi Binomial Negatif .................................................. 97

6. Uji Signifikansi Model regresi Binomial Negatif ........................................... 97

BAB V KESIMPULAN DAN SARAN .................................................................... 100

A. Kesimpulan ...................................................................................................... 100

B. Saran ............................................................................................................... 101

DAFTAR PUSTAKA ............................................................................................... 102

LAMPIRAN .............................................................................................................. 106


xv

DAFTAR TABEL

Tabel 2.1 Data suatu sampel acak untuk contoh 2.4 .................................................. 47

Tabel 2.2 Hasil Pengujian Kolmogorov-Smirnov ...................................................... 48

Tabel 3.1 Data banyaknya kasus campak pada kecamatan di kota Semarang ...... 81

Tabel 3.2 Hasil Pengujian Kolmogorov-Smirnov ..................................................... 83

Tabel 3.3 Parameter , , , , untuk Regresi poisson .................................. 84

Tabel 3.4 Parameter , , , , untuk Regresi Binomial Negatif ................... 86

Tabel 4.1 Deskripsi Data ............................................................................................ 91

Tabel 4.2 Hasil Pengujian Kolmogorov-Smirnov .......................................................... 93

Tabel 4.3 Parameter , , , , , , , , untuk Regresi poisson .......... 93

Tabel 4.4 Parameter , , , , , , , , untuk Regresi Binomial Negatif

..................................................................................................................................... 97


1

BAB I

PENDAHULUAN

A. Latar Belakang

Regresi adalah suatu metode yang digunakan untuk menganalisis

hubungan antara suatu variabel dependen dengan satu atau lebih variabel

independen. Pada umumnya, analisis regresi digunakan untuk menganalisis data

variabel dependen yang berupa data kontinu. Namun dalam beberapa aplikasinya,

data variabel dependen yang akan dianalisis dapat berupa data diskrit. Variabel

dependen diskrit dapat berupa data count yaitu data yang nilainya nonnegatif dan

menyatakan banyaknya kejadian dalam interval waktu, ruang, atau volume

tertentu. Ketika variabel dependen berupa data count, analisis regresi yang biasa

digunakan adalah analisis regresi Poisson. Pada regresi ini variabel dependen

diasumsikan berdistribusi Poisson, dengan fungsi probabilitasnya adalah

𝑝(𝑦) =𝜆𝑦

𝑦!𝑒−𝜆, 𝑦 = 0,1,2, … dengan 𝜆 > 0

Analisis Regresi Poisson adalah suatu model yang digunakan untuk

menganalisis hubungan antara variabel dependen yang berdistribusi Poisson

dengan beberapa variabel independen. Pada model Regresi Poisson terdapat

asumsi yang harus dipenuhi yaitu nilai variansi dari data yang diperoleh harus

sama dengan nilai meannya atau disebut ekuidispersi (equidispersion).

𝐸(𝑌) = 𝑉𝑎𝑟(𝑌) = 𝜇


2

Pada kenyataannya asumsi ini sangat jarang terjadi karena biasanya data

count memiliki variansi yang lebih besar dari mean atau disebut kondisi

overdispersi (𝑉𝑎𝑟(𝑌) > 𝐸(𝑌)) atau sebaliknya mean lebih besar dari pada

variansi atau disebut underdispersi (𝑉𝑎𝑟(𝑌) < 𝐸(𝑌)). Jika pada data diskrit

terjadi overdispersi namun tetap digunakan model regresi Poisson maka estimasi

parameter koefisien regresinya tetap konsisten tetapi tidak efisien karena

berpengaruh pada nilai standar galat (underestimate). Hal itu dapat

mengakibatkan kesimpulan yang akan dihasilkan menjadi tidak tepat atau tidak

sesuai dengan data. Alternatif model regresi yang lebih sesuai untuk data

overdispersi adalah model regresi Binomial Negatif. Pada regresi ini variabel

dependen diasumsikan berdistribusi Binomial Negatif, dengan fungsi

probabilitasnya dihasilkan dari distribusi campuran Poisson-Gamma yaitu

𝑓(𝑦) = Γ (𝑦 +

1𝑘

)

Γ (1𝑘

) 𝑦!(

𝑘𝜇

1 + 𝑘𝜇)

𝑦

(1

1 + 𝑘𝜇)

1𝑘⁄

dengan y = 0,1,2,…

Model regresi Binomial Negatif memiliki kegunaan yang sama dengan

model regresi Poisson yaitu untuk menganalisis hubungan antara suatu variabel

dependen dengan satu atau lebih variabel independen. Namun model regresi

Binomial Negatif lebih fleksibel dibandingkan dengan model Poisson karena

asumsi mean dan variansi dari model Binomial Negatif tidak harus sama. Model

ini juga memiliki parameter dispersi yang berguna menggambarkan variasi dari

data yang biasa dinotasikan dengan k. Model Binomial Negatif yang akan

digunakan adalah Model Binomial Negatif yang merupakan model campuran


3

antara distribusi Poisson dan Gamma. Distribusi Gamma digunakan untuk

menyesuaikan kehadiran overdispersi dalam model Poisson.

Dari dua buah model regresi yang digunakan untuk data count, yaitu

Poisson dan Binomial Negatif, model Binomial Negatif memiliki bentuk yang

lebih umum karena model Poisson dapat dinyatakan dalam model Binomial

Negatif ketika parameter dispersinya mendekati nol (k 0) atau dapat dikatakan

data dalam keadaan ekuidispersi. Jadi, model Binomial Negatif pada dasarnya

dapat digunakan untuk berbagai kasus data count. Dalam penulisan ini akan lebih

dikhususkan untuk masalah pendugaan model regresi Binomial Negatif pada

kasus overdispersi. Pendugaan parameter dapat diperoleh dengan menggunakan

metode pendugaan kemungkinan maksimum melalui iterasi Newton-Raphson.

Adapun beberapa aplikasi dari model Binomial Negatif diantaranya adalah

memodelkan kasus terjadinya penyakit demam berdarah dengue (DBD) dan untuk

mengetahui besarnya pengaruh variabel-variabel yang mempengaruhi terjadinya

penyakit DBD, pemodelan banyaknya kematian Ibu di suatu daerah, model

prediksi kecelakaan lalulintas jalan tol, penggolongan resiko jumlah klaim

asuransi kendaraan dan lain-lainnya.

B. Rumusan Masalah

Perumusan masalah yang akan dibicarakan dalam skripsi ini adalah:

1. Bagaimana landasan matematis pendugaan model regresi Binomial Negatif

dengan metode kemungkinan maksimum?


4

2. Bagaimana menduga parameter-parameter pada model regresi Binomial

Negatif dengan menggunakan metode pendugaan kemungkinan maksimum

melalui iterasi Newton-Raphson?

3. Bagaimana menerapkan model regresi Binomial Negatif pada Poisson yang

mengalami Overdispersi dengan metode Newton-Raphson dalam masalah

nyata?

C. Batasan Masalah

Agar dalam pembahasan tidak terlalu luas dan hasilnya mendekati pokok

permasalahan, maka dalam penulisan skripsi ini hanya akan membahas:

1. Model Regresi Binomial Negatif yang merupakan model campuran Distribusi

Poisson-Gamma untuk kasus Poisson yang mengalami Overdispersi.

2. Pendugaan parameter dilakukan dengan menggunakan metode pendugaan

kemungkinan maksimum melalui iterasi Newton-Raphson.

3. Penulis tidak membahas tentang generalisasi dari Distribusi Binomial Negatif

sebagai campuran distribusi Poisson dan Gamma.

4. Penulis hanya membahas tentang distribusi Poisson yang mengalami

overdispersi.

5. Dalam perhitungan penulis menggunakan program R dan SPSS.

6. Penulis tidak membahas tentang Prior Natural Conjugate.

D. Tujuan Penulisan

Tujuan penulisan skripsi ini adalah:


5

1. Untuk memahami landasan matematis pendugaan model regresi Binomial

Negatif dengan metode Newton-Raphson.

2. Untuk dapat menduga parameter-parameter pada model regresi Binomial

Negatif menggunakan metode pendugaan kemungkinan maksimum melalui

iterasi Newton-Raphson.

3. Untuk dapat menerapkan model regresi Binomial Negatif pada Poisson yang

mengalami Overdispersi dengan metode Newton-Raphson dalam masalah

nyata.

4. Untuk memenuhi tugas dalam mencapai gelar sarjana.

E. Manfaat Penulisan

Manfaat Penulisan ini adalah untuk memperoleh pengetahuan tentang

Regresi Binomial Negatif, membahas dasar-dasar teori yang terkait, dapat

menentukan parameter-parameter dari model regresi Binomial Negatif, serta dapat

menduga model banyaknya kematian Ibu di propinsi Jawa Timur menggunakan

model regresi Binomial Negatif.

F. Metode penulisan

. Metode yang digunakan penulis dalam penulisan skripsi ini adalah

metode studi pustaka, yaitu dengan membaca dan mempelajari buku-buku atau

jurnal-jurnal yang berkaitan dengan pendugaan model regresi Binomial Negatif

dengan metode Pendugaan Kemungkinan Maksimum.


6

G. Sistematika Penulisan

Sistematika penulisan pada skripsi ini meliputi lima Bab yaitu:

BAB I PENDAHULUAN

A. Latar Belakang

B. Rumusan Masalah

C. Batasan Masalah

D. Tujuan Penulisan

E. Manfaat Penulisan

F. Metode Penulisan

G. Sistematika Penulisan

BAB II LANDASAN TEORI

A. Distribusi Probabilitas

B. Distribusi Poisson

C. Distribusi Gamma dan Sifat-sifatnya

D. Distribusi Binomial Negatif

E. Distribusi Binomial Negatif sebagai campuran Distribusi Poisson-

Gamma

F. Metode Maksimum Likelihood

G. Metode numerik Newton-Raphson

H. Keluarga Eksponensial

I. Model Regresi Linear Berganda

J. Jenis Data Penelitian

K. Model Count Respon


7

L. Uji Kolmogorov-Smirnov

BAB III PENDUGAAN MODEL REGRESI BINOMIAL NEGATIF

A. Model Regresi Poisson Berganda

B. Overdispersi dan regresi Binomial Negatif

C. Binomial Negatif sebagai keluarga Eksponensial

D. Model Regresi Binomial Negatif

E. Pendugaan Parameter untuk Model Regresi Binomial Negatif dengan

Metode Maksimum Likelihood

F. Uji Kebaikan Model

BAB IV PEMODELAN REGRESI BINOMIAL NEGATIF PADA DATA

BANYAKNYA KEMATIAN IBU DI PROPINSI JAWA TIMUR

A. Deskripsi Data

B. Pengolahan Data

BAB V PENUTUP

A. Kesimpulan

B. Saran

DAFTAR PUSTAKA

LAMPIRAN


8

BAB II

LANDASAN TEORI

A. Distribusi Probabilitas

1. Variabel Random

Definisi 2.1

Variabel random 𝑋 adalah fungsi bernilai riil yang domainnya adalah ruang

sampel.

Definisi 2.2

Sebuah variabel random dikatakan variabel random diskrit jika himpunan dari

kemungkinan hasilnya adalah terbilang. Jika tidak memenuhi definisi di atas

maka variabel random di atas disebut variabel random kontinu.

2. Fungsi Probabilitas

a. Distribusi Probabilitas Diskrit

Definisi 2.3

Himpunan pasangan terurut (𝑥, 𝑓(𝑥)) adalah fungsi probabilitas, atau

distribusi probabilitas dari suatu variabel random diskrit X jika

1) 𝑃(𝑋 = 𝑥) = 𝑓(𝑥)

2) 𝑓(𝑥) ≥ 0

3) ∑ 𝑓(𝑥) = 1∀𝑥


9

Definisi 2.4

Fungsi distribusi kumulatif 𝐹(𝑥) (cumulative distribution function) dari

sebuah variabel random diskrit 𝑋 dengan distribusi probabilitas 𝑓(𝑥) adalah

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) =∑𝑓(𝑡) 𝑢𝑛𝑡𝑢𝑘 −∞ < 𝑥 < ∞

𝑡≤𝑥

b. Distribusi Probabilitas Kontinu

Definisi 2.5

Fungsi 𝑓(𝑥) adalah fungsi probabilitas (probability function) untuk variabel

random kontinu 𝑋 jika

1) 𝑓(𝑥) ≥ 0, untuk semua 𝑥 ∈ 𝑅

2) ∫ 𝑓(𝑥)𝑑𝑥 = 1∞

−∞

3) 𝑃(𝑎 < 𝑋 < 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥𝑏

𝑎

Definisi 2.6

Fungsi distribusi kumulatif 𝐹(𝑥) (cumulative distribution function) dari sebuah

variabel random kontinu 𝑋 dengan distribusi probabilitas 𝑓(𝑥) adalah

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡, untuk − ∞ < 𝑥 < ∞𝑥

−∞

3. Karakteristik Distribusi Probabilitas

a. Mean

Definisi 2.7


10

Misalkan 𝑋 adalah variabel random dengan fungsi probabilitas 𝑓(𝑥). Mean

atau nilai harapan (expected value) dari 𝑋 adalah

{

𝜇 = 𝐸(𝑋) =∑𝑥𝑓(𝑥)

𝑥

, 𝑋 diskrit

𝜇 = 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥, 𝑋 kontinu∞

−∞

b. Variansi

Definisi 2.8

Jika 𝑋 adalah variabel random, variansi dari variabel random 𝑋, maka

variansi dari 𝑋 ditulis sebagai 𝑣𝑎𝑟(𝑋) atau 𝑉(𝑋) didefinisikan

𝑉(𝑋) = 𝐸(𝑋 − 𝐸(𝑋))2.

Teorema 2.1

𝑉𝑎𝑟(𝑋) = 𝐸(𝑋2) − (𝐸(𝑋))2

Bukti

𝑉(𝑋) = 𝐸[(𝑋 − 𝐸(𝑋))2]

= 𝐸(𝑋2 − 2𝑋𝐸(𝑋) + (𝐸(𝑋))2

= 𝐸(𝑋2) − 𝐸(2)𝐸(𝑋)𝐸(𝑋) + (𝐸(𝑋))2

= 𝐸(𝑋2) − (𝐸(𝑋))2∎

c. Momen dan Fungsi Pembangkit Momen

Definisi 2.9

Momen ke-k dari variabel random 𝑋 yang diambil sekitar titik asal

dinotasikan dengan 𝜇𝑘′ adalah


11

𝜇𝑘′ = 𝐸(𝑋𝑘)

Definisi 2.10

Fungsi pembangkit momen 𝑚(𝑡) dari sebuah variabel random

𝑋 didefinisikan sebagai 𝑚(𝑡) = 𝐸(𝑒𝑡𝑥). Fungsi pembangkit momen dari 𝑋

dikatakan ada jika terdapat konstanta positif 𝑏 sedemikian sehingga 𝑚(𝑡)

adalah berhingga untuk |𝑡| ≤ 𝑏.

Fungsi pembangkit momen dari variabel acak 𝑋 didefinisikan sebagai

𝑚𝑥(𝑡) = 𝐸(𝑒𝑡𝑥) =

{

∑𝑒𝑡𝑥𝑓(𝑥), 𝑋 diskrit

𝑥

∫ 𝑒𝑡𝑥𝑓(𝑥) 𝑑𝑥∞

−∞

, 𝑋 kontinu

Teorema 2.2

Misalkan 𝑋 variabel acak dengan fungsi pembangkit momen (FPM) 𝑚𝑥(𝑡)

maka

𝑑𝑘𝑚(𝑡)

𝑑𝑡𝑘|𝑡=0

= 𝜇𝑘′

Bukti:

Ekspansi Deret maclaurin dari 𝑒𝑡𝑥 adalah

𝑒𝑡𝑥 = 1 + 𝑡𝑥 +(𝑡𝑥)2

2!+(𝑡𝑥)3

3!+(𝑡𝑥)4

4!+ ⋯

Diasumsikan 𝑚(𝑘)(𝑡) berhingga untuk 𝑘 = 1, 2,⋯, maka


12

𝐸(𝑒𝑡𝑥) =∑𝑒𝑡𝑥𝑝(𝑥)

𝑥

=∑[1 + 𝑡𝑥 +(𝑡𝑥)2

2!+(𝑡𝑥)3

3!+(𝑡𝑥)4

4!+ ⋯ ]𝑝(𝑥)

𝑥

=∑𝑝(𝑥)

𝑥

+ 𝑡∑𝑥 𝑝(𝑥) +𝑡2

2!∑𝑥2𝑝(𝑥) +

𝑡3

3!∑𝑥3𝑝(𝑥) + ⋯ = 1 + 𝑡

𝑥𝑥𝑥

𝜇1′

+𝑡2

2!𝜇2′ +

𝑡3

3!𝜇3′ +⋯

𝑑𝑘𝑚(𝑡)

𝑑𝑡𝑘 atau 𝑚(𝑘)(𝑡) adalah turunan ke-𝑘 dari 𝑚(𝑡) terhadap 𝑡, karena

𝑚(𝑡) = 𝐸(𝑒𝑡𝑥) = 1 + 𝑡𝜇1′ +

𝑡2

2!𝜇2′ +

𝑡3

3!𝜇3′ +

𝑡4

4!𝜇4′ +⋯

𝑚(1)(𝑡) = 𝜇1′ +

2𝑡

2!𝜇2′ +

3𝑡2

3!𝜇3′ +

4𝑡3

4!𝜇4′ +⋯

𝑚(2)(𝑡) =2

2!𝜇2′ +

6𝑡

3!𝜇3′ +

12𝑡2

4!𝜇4′ +⋯

=2

2 × 1!𝜇2′ +

6𝑡

3 × 2!𝜇3′ +

12𝑡2

4 × 3!𝜇4′ +⋯

= 𝜇2′ +

2𝑡

2!𝜇3′ +

3𝑡2

3!𝜇4′ +⋯

𝑚(3)(𝑡) = 𝜇3′ +

6𝑡

3!𝜇4′ +⋯

Secara umum, 𝑚(𝑘)(𝑡) = 𝜇𝑘′ +

2𝑡

2!𝜇𝑘+1′ +

3𝑡2

3!𝜇𝑘+2′ +⋯

Ketika 𝑡 = 0 untuk semua turunan diperoleh

𝑚(1)(0) = 𝜇1′


13

𝑚(2)(0) = 𝜇2′

Sehingga secara umum

𝑚(𝑘)(0) = 𝜇𝑘′ ∎

Turunan pertama dari fungsi pembangkit momen yaitu

Untuk variabel kontinu, 𝑑𝑚(𝑡)

𝑑𝑡= 𝑚′(𝑡) = ∫ 𝑥𝑒𝑡𝑥𝑓(𝑥)𝑑𝑥

∞

−∞

Untuk variabel diskrit, 𝑑𝑚(𝑡)

𝑑𝑡= 𝑚′(𝑡) = ∑ 𝑥𝑒𝑡𝑥𝑓(𝑥)𝑥

Berdasarkan turunan pertama dari FPM diatas, untuk 𝑡 = 0, diperoleh

𝑚(0) = 𝐸(𝑋).

Turunan kedua dari fungsi pembangkit momen yaitu:

Untuk variabel kontinu, 𝑑2𝑚(𝑡)

𝑑𝑡2= 𝑚′′(𝑡) = ∫ 𝑥2𝑒𝑡𝑥𝑓(𝑥)𝑑𝑥

∞

−∞

Untuk variabel diskrit, 𝑑2𝑚(𝑡)

𝑑𝑡2= 𝑚′′(𝑡) = ∑ 𝑥2𝑒𝑡𝑥𝑓(𝑥)𝑥

Berdasarkan turunan kedua dari FPM diatas, untuk 𝑡 = 0, diperoleh

𝑚"(0) = 𝐸(𝑋2), sehingga

𝜎2 = 𝐸(𝑋2) − 𝜇2

= 𝑚"(0) − [𝑚′(0)]2

Turunan ke-𝑘 dari FPM untuk 𝑡 = 0 yaitu 𝑚(𝑘)(0) = 𝐸(𝑋𝑘) yang

disebut momen ke-𝑘 dari variabel acak 𝑋.

B. Distribusi Poisson

Definisi 2.11

Suatu variabel random 𝑌 disebut berdistribusi Poisson dengan parameter 𝜆 jika

dan hanya jika fungsi probabilitasnya sebagai berikut


14

𝑝(𝑦) =𝜆𝑦

𝑦!𝑒−𝜆, 𝑦 = 0,1,2, …

dengan 𝜆 > 0

Toerema 2.3

Jika 𝑌 berdistribusi Poisson dengan parameter 𝜆 maka 𝜇 = 𝐸(𝑌) = 𝜆 dan

𝜎2 = 𝑉(𝑌) = 𝜆

Bukti:

Berdasarkan Definisi 2.10, diperoleh

𝑚(𝑡) = ∑𝑒−𝜆𝜆𝑦

𝑦! 𝑒𝑡𝑦

∞

𝑦=0

=∑𝑒𝑡𝑦−𝜆𝜆𝑦

𝑦!= 𝑒−𝜆∑

(𝜆𝑒𝑡)𝑦

𝑦!

∞

𝑦=0

∞

𝑦=0

Berdasarkan formulasi Taylor 𝑒𝑎 = ∑𝑎𝑦

𝑦!∞𝑦=0 maka diperoleh

𝐸(𝑌) = 𝑚′(𝑡)

= 𝑒−𝜆𝑒𝜆𝑒𝑡

= 𝑒𝜆(𝑒𝑡−1)

=𝑑

𝑑𝑡𝑒𝜆(𝑒

𝑡−1)|𝑡=0

= 𝜆𝑒𝑡 𝑒𝜆(𝑒𝑡−1)|

𝑡=0

= 𝜆𝑒0 𝑒𝜆(𝑒0−1) = 𝜆

𝐸(𝑌2) =𝑑2

𝑑𝑡2𝑚(𝑡)|

𝑡=0

=𝑑2

𝑑𝑡2𝑒𝜆(𝑒

𝑡−1). 𝜆𝑒𝑡


15

= 𝑒𝜆(𝑒𝑡−1). 𝜆𝑒𝑡. 𝜆𝑒𝑡 + 𝜆𝑒𝑡 𝑒𝜆(𝑒

𝑡−1)

= 𝑒2𝑡𝜆2𝑒𝜆(𝑒𝑡−1) + 𝜆𝑒𝑡 𝑒𝜆(𝑒

𝑡−1)|𝑡=0

= 𝜆2 + 𝜆

Jadi,

𝑉𝑎𝑟(𝑌) = 𝐸(𝑌2) − [𝐸(𝑌)]2

= 𝜆2 + 𝜆 − 𝜆2

= 𝜆

C. Distribusi Gamma dan Sifat-sifatnya

Definisi 2.12

fungsi Gamma didefinisikan sebagai

Γ(𝛼) = ∫ 𝑦𝛼−1𝑒−𝑦𝑑𝑦

∞

0

Untuk 𝛼 > 0 dan nilai dari integral tersebut adalah bilangan positif.

Fungsi Gamma memiliki sifat sebagai berikut:

a. Jika 𝛼 = 1, maka Γ(1) = ∫ 𝑒−𝑦𝑑𝑦 = 1.∞

0

b. Jika 𝑛 adalah suatu bilangan bulat positif maka diperoleh Γ(𝑛) = ( 𝑛 − 1)!.

c. Jika 𝛼 > 1, maka Γ(𝛼) = ∫ 𝑦𝛼−1𝑒−𝑦𝑑𝑦 =∞

0( 𝛼 − 1)Γ(𝛼 − 1)

Definisi 2.14

Suatu variabel acak kontinu 𝑌 dikatakan berdistribusi Gamma dengan

parameter 𝛼 dan β jika variabel tersebut mempunyai fungsi probabilitas sebagai

berikut:


16

𝑓(𝑦) = {

1

Γ(𝛼)𝛽𝛼𝑦𝛼−1𝑒−𝑦 𝛽⁄ , 0 ≤ 𝑦 ≤ ∞

0 𝑦 yang lainnya

Dengan 𝛼, 𝛽 > 0.

Teorema 2.3

Jika 𝑌 adalah berdistribusi Gamma dengan parameter 𝛼 dan 𝛽 maka 𝜇 =

𝐸(𝑌) = 𝛼𝛽 dan 𝜎2 = 𝑉(𝑌) = 𝛼𝛽2

Bukti:

1. Mean

Berdasarkan definisi 2.7

𝐸(𝑌) = ∫ 𝑦 𝑓(𝑦)𝑑𝑦∞

−∞

= ∫ 𝑦 𝑦𝛼−1𝑒

−𝑦𝛽

𝛽𝛼Γ(𝛼) 𝑑𝑦

∞

0

Berasarkan definisi fungsi probabilitas maka

∫𝑦𝛼−1𝑒

−𝑦𝛽


∞

0

= 1

Sehingga diperoleh

∫ 𝑦𝛼−1𝑒−𝑦𝛽 𝑑𝑦 = 𝛽𝛼Γ(𝛼)

∞

0

(2.1)

𝐸(𝑌) = ∫𝑦𝛼𝑒

−𝑦𝛽


∞

0

=1

𝛽𝛼Γ(𝛼)∫ 𝑦𝛼𝑒

−𝑦𝛽 𝑑𝑦

∞

0

Berdasarkan persamaan 2.1 diperoleh


17

𝐸(𝑌) =1

𝛽𝛼Γ(𝛼)𝛽𝛼+1Γ(𝛼 + 1)

Berdasarkan sifat fungsi Gamma maka Γ(𝛼 + 1) = 𝛼Γ(α), maka diperoleh

𝐸(𝑌) =1

𝛽𝛼Γ(𝛼)𝛽𝛼+1𝛼 Γ(𝛼)

=𝛽 𝛼 Γ(𝛼)

Γ(𝛼)

= 𝛼𝛽

2. Variansi

Berdasarkan teorema 2.1

𝑉(𝑌) = 𝐸(𝑌2) − (𝐸(𝑌))2

𝐸(𝑌2) = ∫ 𝑦2𝑦𝛼−1𝑒

−𝑦𝛽


∞

0

= ∫𝑦𝛼+1𝑒

−𝑦𝛽

𝛽𝛼Γ(𝛼)

∞

0

𝑑𝑦

=1

𝛽𝛼Γ(𝛼)∫ 𝑦𝛼+1𝑒

−𝑦𝛽 𝑑𝑦

∞

0

Berdasarkan persamaan 2.1 dan definisi sifat fungsi Gamma, maka diperoleh

𝐸(𝑌) =1

𝛽𝛼Γ(𝛼)𝛽𝛼+2Γ(𝛼 + 2)

=𝛽2(𝛼 + 1)Γ(𝛼 + 1)

Γ(𝛼)

=𝛽2(𝛼 + 1)𝛼Γ(𝛼)

Γ(𝛼)

= 𝛼𝛽2(𝛼 + 1)

Sehingga,


18

𝑉(𝑌) = 𝐸(𝑌2) − (𝐸(𝑌))2

= 𝛼𝛽2(𝛼 + 1) − (𝛼𝛽)2

= 𝛼2𝛽2 + 𝛼𝛽2 − 𝛼2𝛽2

= 𝛼𝛽2

D. Distribusi Binomial Negatif

Distribusi Binomial Negatif merupakan distribusi yang memiliki beberapa

cara dalam hal pendekatannya. Pendekatan klasik yang sering digunakan adalah

Distribusi Binomial Negatif sebagai barisan percobaan Bernoulli yaitu jumlah

percobaan Bernoulli yang dibutuhkan sampai terjadi 𝑟 buah sukses, dengan setiap

ulangan saling bebas, dan probabilitas sukses pada setiap percobaan konstan yaitu

𝑝 sedangkan probabilitas gagal yaitu 1 − 𝑝.

Misalkan 𝑦 adalah banyaknya kegagalan sebelum sukses ke-𝑟, maka 𝑟 − 1

sukses dapat terjadi pada sebarang waktu sebelum 𝑥 − 1 ulangan. Misalkan

variabel acak 𝑋 menyatakan banyaknya ulangan yang dibutuhkan sampai terjadi 𝑟

buah sukses, maka 𝑋 berdistribusi Binomial Negatif dengan fungsi probabilitas

sebagai berikut

𝑓(𝑥) = (𝑥 − 1𝑘 − 1

) 𝑝𝑟(1 − 𝑝)𝑥−𝑟 dengan 𝑥 = 𝑘, 𝑘 + 1, 𝑘 + 2,⋯

Fungsi probabilitas dari variabel acak 𝑋 dapat dinotasikan ke dalam bentuk

lain. Misalkan terdapat 𝑦 banyaknya kegagalan sebelum sukses ke-𝑟 maka 𝑥

merupakan penjumlahan dari 𝑦 kegagalan dengan 𝑟 buah sukses atau 𝑥 = 𝑦 + 𝑟.

Jadi, akan dibentuk variabel acak baru yaitu 𝑌, yang menyatakan banyaknya


19

kegagalan sebelum terjadi 𝑟 buah sukses dengan metode transformasi variabel

dengan fungsi transformasinya 𝑌 = 𝑋 − 𝑟.

Definisi 2.14

Variabel acak 𝑌 disebut berdistribusi Binomial Negatif jika memiliki fungsi

probabilitas 𝑓(𝑦) sebagai berikut

𝑓(𝑦) = (𝑦 + 𝑟 − 1𝑟 − 1

)𝑝𝑟(1 − 𝑝)𝑦 dengan 𝑦 = 0, 1, 2,⋯

Contoh 2.1

Seorang dokter anak merekrut 5 pasangan untuk berpartisipasi dalam penelitiannya.

Masing-masing pasangan berharap untuk melahirkan anak secara normal. Misalkan

𝑝 = 𝑃 (pasangan yang dipilih secara acak setuju untuk berpartisipasi). Jika 𝑝 = 0.2,

berapakah probabilitas bahwa 15 pasangan harus ditanya sebelum ditemukan 5

pasangan yang setuju untuk berpartisipasi?

Penyelesaian:

Diketahui 𝑟 = 5, 𝑝 = 0.2, 𝑋 = 10 sehingga

𝑓(𝑦) = (10 + 5 − 15 − 1

)0.25(1 − 0.2)10 = (144)0.25(0.8)10 = 0.0343

Teorema 2.4

Mean dan variansi dari distribusi Binomial Negatif adalah

𝐸(𝑌) = 𝜇 =𝑟(1 − 𝑝)

𝑝

𝑉𝑎𝑟(𝑌) =𝑟(1 − 𝑝)

𝑝2


20

Bukti:

1. Mean

Misalkan 𝑓(𝑥) = (1 − 𝑥)−𝑟, dalam kalkulus 𝑓(𝑥) dapat mengikuti ekspansi deret

Maclaurin yaitu:

(1 − 𝑥)−𝑟 = 𝑓(0) + 𝑓′(0) +𝑓(2)(0)

2!𝑥2 +

𝑓(3)(0)

3!𝑥3 +⋯+

𝑓(𝑛)(0)

𝑛!𝑥𝑛 +⋯

Dengan −1 < 𝑥 < 1 sehingga diperoleh

(1 − 𝑥)−𝑟 = 1 + 𝑟𝑥 +(𝑟 + 1)𝑟

2!𝑥2 +⋯+

(𝑟 + 𝑦 − 1)(𝑟 + 𝑦 − 2)⋯(𝑟 + 1)𝑟

𝑦!𝑥𝑦

+⋯

= 1 + (−1)1(−𝑟)𝑥 +(−1)2(−𝑟)(−𝑟 − 1)

2!𝑥2 +⋯

+(−1)𝑦(−𝑟)(−𝑟 − 1)⋯(−𝑟 − 𝑦 + 2)(−𝑟 − 𝑦 + 1)

𝑦!𝑥𝑦 +⋯

= (−1)0 (−𝑟0) 𝑥0 + (−1)1 (

−𝑟1) 𝑥1 + (−1)2 (

−𝑟2) 𝑥2 +⋯

+ (−1)𝑦 (−𝑟𝑦 ) 𝑥

𝑦 +⋯

=∑(−1)𝑦 (−𝑟𝑦 ) 𝑥

𝑦

∞

𝑦=0

(𝑦 + 𝑟 − 1

𝑟 − 1) =

(𝑦 + 𝑟 − 1)(𝑦 + 𝑟 − 2)⋯(𝑟 + 1)𝑟

(𝑦 + 𝑟 − 1 − 𝑟 + 1)!

=(𝑦 + 𝑟 − 1)(𝑦 + 𝑟 − 2)⋯(𝑟 + 1)𝑟

𝑦!

= (−1)𝑦 (−𝑟𝑦 )

Sehingga Berdasarkan definisi 2.10 diperoleh

𝑚(𝑡) = 𝐸(𝑒𝑡𝑌)


21

=∑𝑒𝑡𝑦 (𝑦 + 𝑟 − 1

𝑟 − 1) 𝑝𝑟(1 − 𝑝)𝑦

∞

𝑦=0

=∑(𝑦 + 𝑟 − 1

𝑟 − 1) 𝑝𝑟[(1 − 𝑝)𝑒𝑡]𝑦

∞

𝑦=0

= 𝑝𝑟∑ (−1)𝑦 (−𝑟𝑦 )

∞

𝑦=0

[(1 − 𝑝)𝑒𝑡]𝑦

= 𝑝𝑟[1 − (1 − 𝑝)𝑒𝑡]−𝑟

=𝑝𝑟

[1 − (1 − 𝑝)𝑒𝑡]𝑟

Sehingga diperoleh

𝑚′(0) = 𝐸(𝑌)

=𝑑

𝑑𝑡(

𝑝𝑟

[1 − (1 − 𝑝)𝑒𝑡]𝑟)|𝑡=0

=−𝑟(1 − (1 − 𝑝)𝑒𝑡)𝑟−1 ∙ −(1 − 𝑝). 𝑝𝑟

([1 − (1 − 𝑝)𝑒𝑡]𝑟)2|𝑡=0

=𝑟(1 − 𝑝) 𝑝𝑟𝑝𝑟−1

𝑝2𝑟

=𝑟(1 − 𝑝) 𝑝2𝑟

𝑝2𝑟 𝑝

=𝑟(1 − 𝑝)

𝑝∎

2. Variansi

Berdasarkan teorema 2.1

𝑉𝑎𝑟(𝑌) = 𝐸(𝑌2) − (𝐸(𝑌))2

𝐸(𝑌2) =𝑑2

𝑑𝑡2(

𝑝𝑟

[1 − (1 − 𝑝)𝑒𝑡]𝑟)|𝑡=0


22

=𝑑2

𝑑𝑡2(−𝑟(1 − (1 − 𝑝)𝑒𝑡)𝑟−1 ∙ −(1 − 𝑝). 𝑝𝑟

([1 − (1 − 𝑝)𝑒𝑡]𝑟)2)|𝑡=0

=𝑟(1 − 𝑝)[1 + (1 − 𝑝)]

𝑝2

Sehingga,

𝑉𝑎𝑟(𝑌) = 𝐸(𝑌2) − (𝐸(𝑌))2

=𝑟(1 − 𝑝)[1 + (1 − 𝑝)]

𝑝2−(1 − 𝑝)2

𝑝2

=𝑟(1 − 𝑝)[1 + (1 − 𝑝) − 𝑟(1 − 𝑝)]

𝑝2

=𝑟(1 − 𝑝)

𝑝2∎

E. Distribusi Binomial Negatif sebagai Campuran Distribusi Poisson-Gamma

Salah satu cara terbentuknya distribusi Binomial Negatif adalah terjadinya

overdispersi pada saat menggunakan distribusi Poisson. Data count biasanya

memiliki variansi yang lebih besar dari mean, atau yang disebut dengan kondisi

overdispersi. Misalkan 𝑌 adalah variabel acak dari suatu populasi yang berdistribusi

Poisson dengan 𝐸(𝑌) = 𝑉𝑎𝑟(𝑌) = 𝜆. Kondisi data seperti ini disebut dengan

ekuidispersi. Pada kenyataannya, jarang sekali ditemukan data count dalam kondisi

ekuidispersi. Pada distribusi Poisson terdapat asumsi mean (𝜆) konstan untuk setiap

nilai dari 𝑌, namun dalam kondisi overdispersi, 𝜆 tidak lagi konstan atau bervariasi

antar observasi pada populasi. Hal ini menunjukkan bahwa populasi tersebut

bergantung pada 𝜆, sehingga dapat dikatakan bahwa 𝜆 merupakan nilai dari suatu

variabel acak Ω yang memiliki distribusi tertentu.


23

Distribusi Gamma dengan parameter 𝛼 dan 𝛽 dipilih sebagai distribusi dari

Ω karena distribusi Gamma merupakan prior natural conjugate dari distribusi

Poisson. Karena Ω berdistribusi Gamma dengan parameter 𝛼 dan 𝛽, maka mean

dari Ω adalah 𝜇 = 𝛼𝛽 atau 𝛽 = 𝜇/𝛼 . Misalkan 𝑘 = 1/ 𝛼 maka dapat dikatakan

bahwa Ω berdistribusi Gamma dengan parameter (1/k) dan 𝑘𝜇 dengan fungsi

probabilitasnya

ℎ(𝜆) =1

Γ (1𝑘) (𝑘𝜇)

1𝑘

𝜆1𝑘−1exp (

−𝜆

𝑘𝜇)

Fungsi probabilitas bersama antara 𝑌|𝜆 dan Ω adalah

𝑓(𝑦|𝜆)ℎ(𝜆) =𝑒−𝜆𝜆𝑦

𝑦!∙

1

Γ (1𝑘) (𝑘𝜇)

1𝑘

𝜆1𝑘−1𝑒𝑥𝑝 (

−𝜆

𝑘𝜇)

=𝜆𝑦+

1𝑘−1exp (−𝜆 +

−𝜆𝑘𝜇)

Γ (1𝑘) (𝑘𝜇)

1𝑘𝑦!

Fungsi probabilitas marginal dari 𝑌 adalah

𝑓(𝑦) = ∫𝑓(𝑦|𝜆)ℎ(𝜆)𝑑𝜆

= ∫𝜆𝑦+

1𝑘−1 exp (−𝜆 +

−𝜆𝑘𝜇)

Γ (1𝑘) (𝑘𝜇)

1𝑘𝑦!

𝑑𝜆∞

0

=1

Γ (1𝑘) (𝑘𝜇)

1𝑘𝑦!

∫ 𝜆𝑦+1𝑘−1 exp (−𝜆 +

−𝜆

𝑘𝜇)𝑑𝜆

∞

0

=1

Γ (1𝑘) (𝑘𝜇)

1𝑘𝑦!

∫ 𝑒𝑥𝑝 (−𝜆(𝑘𝜇 + 1)

𝑘𝜇)

∞

0

𝜆𝑦+1𝑘−1𝑑𝜆


24

=1

Γ (1𝑘) (𝑘𝜇)

1𝑘𝑦!

∫ 𝑒𝑥𝑝 (−𝜆(𝑘𝜇 + 1)

𝑘𝜇)

∞

0

𝜆𝑦+1𝑘−1 (

𝑘𝜇 + 1

𝑘𝜇 + 1)𝑦+

1𝑘−1

(𝑘𝜇

𝑘𝜇)𝑦+

1𝑘−1

𝑑𝜆

=1

Γ (1𝑘) (𝑘𝜇)

1𝑘𝑦!

∫ 𝑒𝑥𝑝 (−𝜆(𝑘𝜇 + 1)

𝑘𝜇)

∞

0

(𝜆(𝑘𝜇 + 1)

𝑘𝜇)

𝑦+1𝑘−1

(𝑘𝜇

𝑘𝜇 + 1)𝑦+

1𝑘−1

𝑑𝜆

=1

Γ (1𝑘) (𝑘𝜇)

1𝑘𝑦!

(𝑘𝜇

𝑘𝜇 + 1)𝑦+

1𝑘−1

∫ 𝑒𝑥𝑝(−𝜆(𝑘𝜇 + 1)

𝑘𝜇)

∞

0

(𝜆(𝑘𝜇 + 1)

𝑘𝜇)

𝑦+1𝑘−1

𝑑𝜆

Misalkan 𝑡 =𝜆(𝑘𝜇+1)

𝑘𝜇, maka

𝑑𝑡

𝑑𝜆=

(𝑘𝜇+1)

𝑘𝜇 sehingga 𝑑𝜆 =

𝑘𝜇

𝑘𝜇+1𝑑𝑡 sehingga

persamaan 𝑓(𝑦) menjadi

𝑓(𝑦) =1

Γ (1𝑘) (𝑘𝜇)

1𝑘𝑦!

(𝑘𝜇

𝑘𝜇 + 1)𝑦+

1𝑘−1

∫ 𝑒𝑥𝑝(−𝑡)∞

0

(𝑡)𝑦+1𝑘−1 𝑘𝜇

𝑘𝜇 + 1𝑑𝑡

=1

Γ (1𝑘) (𝑘𝜇)

1𝑘𝑦!

(𝑘𝜇

𝑘𝜇 + 1)𝑦+

1𝑘−1

(𝑘𝜇

𝑘𝜇 + 1)∫ 𝑒𝑥𝑝(−𝑡)

∞

0

(𝑡)𝑦+1𝑘−1𝑑𝑡

=1

Γ (1𝑘) (𝑘𝜇)

1𝑘𝑦!

(𝑘𝜇

𝑘𝜇 + 1)𝑦+

1𝑘∫ 𝑒𝑥𝑝(−𝑡)∞

0

(𝑡)𝑦+1𝑘−1𝑑𝑡

=1

Γ (1𝑘) (𝑘𝜇)

1𝑘𝑦!

(𝑘𝜇

𝑘𝜇 + 1)𝑦+

1𝑘Γ (𝑦 +

1

𝑘)

=1

Γ (1𝑘) (𝑘𝜇)

1𝑘𝑦!

(𝑘𝜇

𝑘𝜇 + 1)𝑦

(𝑘𝜇

𝑘𝜇 + 1)

1𝑘Γ (𝑦 +

1

𝑘)

=Γ (𝑦 +

1𝑘)

Γ (1𝑘)𝑦!

(𝑘𝜇

𝑘𝜇 + 1)𝑦

(1

𝑘𝜇 + 1)

1𝑘


25

fungsi probabilitas dari Distribusi Binomial Negatif sebagai campuran Poisson-

Gamma adalah

𝑓(𝑦; 𝜇, 𝑘)=Γ (𝑦 +

1𝑘)

𝑦! Γ (1𝑘)(

1

1 + 𝑘𝜇)

1𝑘(𝑘𝜇

1 + 𝑘𝜇)𝑦

(2.2)

Distribusi Binomial Negatif dengan fungsi probabilitas pada persamaan

2.2 disebut sebagai distribusi campuran Poisson-Gamma. Penurunan distribusi

Binomial Negatif di atas tidak berhubungan dengan penurunan klasik sebagai

barisan dari percobaan Bernouli pada subbab sebelumnya.

F. Metode Maksimum Likelihood

Salah satu metode dalam pendugaan parameter adalah metode Pendugaan

Kemungkinan Maksimum (Maksimum Likelihood Estimation/MLE). Metode ini

pertama kali diperkenalkan oleh R.A Fisher pada tahun 1912. Metode pendugaan

ini dapat diterapkan di sebagian besar masalah dan memiliki daya tarik intuitif yang

kuat, dan sering menghasilkan penduga yang baik bagi parameter 𝜃. Selain itu

untuk sampel yang sangat besar, metode ini menghasilkan penduga yang sangat

baik bagi 𝜃.

Definisi 2.16

Penduga Kemungkinan Maksimum (Maximum Likelihood Estimator/MLE) 𝜃𝑀𝐿

dari 𝜃 memaksimumkan fungsi likelihood, L(𝜃|𝑌) atau ekuivalen dengan

memaksimumkan log-likelihood 𝑙(𝜃|𝑌).


26

Misalkan 𝑥1, 𝑥2, … , 𝑥𝑛 adalah variabel random kontinu berukuran

𝑛 dengan fungsi probabilitas 𝑓(𝑥, 𝜃) dan 𝜃 adalah parameter yang tidak diketahui.

Fungsi likelihood dari sampel random adalah fungsi densitas bersama dari

𝑛 variabel random yang merupakan fungsi dari parameter yang tidak diketahui,

sehingga fungsi likelihood adalah

𝐿(𝜃) =∏𝑓(𝑥𝑖 ; 𝜃)

𝑛

1

2.3

Selain itu, karena biasanya sulit untuk mencari turunan fungsi likelihood,

maka yang dilakukan adalah menentukan nilai maksimum dari logaritma natural

fungsi likelihood tersebut atau disebut dengan fungsi log-likelihood. Fungsi log-

likelihood dapat ditulis dalam bentuk :

𝑙 = ln 𝐿( 𝜃) 2.4

Nilai parameter 𝜃 dapat diperoleh dengan memaksimumkan fungsi peluang. Hal

tersebut dilakukan dengan mencari turunan parsial pertama dari fungsi likelihood-

nya terhadap setiap parameternya. Sehingga, MLE 𝜃 merupakan penyelesaian dari

persamaan berikut :

𝜕𝑙

𝜕𝜃= 0

Misalkan terdapat 𝑘 parameter yang tidak diketahui, maka pendugaan parameter 𝜃𝑖

dengan Metode Kemungkinan Maksimum

𝜕𝑙

𝜕𝜃𝑖= 0

Dengan 𝑖 = 1,2, … , 𝑘


27

Contoh 2.2

Misalkan 𝑌1, 𝑌2, … , 𝑌𝑛 adalah sampel random berdistribusi eksponensial dengan

mean 𝛽 dan variansi 𝛽2. Temukan �̂� dengan menggunakan Metode maksimum

likelihood.

Penyelesaian:

𝑌1, 𝑌2, … , 𝑌𝑛 adalah variabel random berdistribusi eksponensial dengan mean 𝛽 dan

variansi 𝛽2 maka fungsi probabilitasnya didefinisikan sebagai

𝑓(𝑦) = {

1

𝛽𝑒−𝑦𝛽 0 ≤ 𝑦 < ∞

0 selainnya

Berdasarkan persamaan 2.3 diperoleh fungsi likelihood berikut:

𝐿(𝛽) = 𝑓(𝑦1, 𝑦2, … , 𝑦𝑛|𝛽)

= 𝑓(𝑦1|𝛽) × 𝑓(𝑦2|𝛽) × …× 𝑓(𝑦𝑛|𝛽)

=1

𝛽𝑒−𝑦1𝛽 ×

1

𝛽𝑒−𝑦2𝛽 ×

1

𝛽𝑒−𝑦3𝛽 ×⋯×

1

𝛽𝑒−𝑦𝑛𝛽

= (1

𝛽)𝑛

𝑒𝑥𝑝 [−∑𝑦𝑖𝛽] 2.5

Fungsi log-likelihood dari persamaan diatas adalah

𝑙𝑛[𝐿(𝛽)] = 𝑙𝑛 [(1

𝛽)𝑛

𝑒𝑥𝑝 [−∑𝑦𝑖𝛽]]

= 𝑙𝑛 ((1

𝛽)𝑛

) −∑𝑦𝑖𝛽

= 𝑛 𝑙𝑛(1) − 𝑛 𝑙𝑛(𝛽) −∑𝑦𝑖𝛽

= −𝑛 𝑙𝑛(𝛽) −∑𝑦𝑖𝛽

Penduga kemungkinan maksimum dari 𝛽 adalah nilai yang memaksimumkan

ln[𝐿(𝛽)], dengan mencari nilai turunan parsial terhadap 𝛽, maka diperoleh

𝜕 ln[𝐿(𝛽)]

𝜕𝛽= 0


28

−𝑛

𝛽+∑𝑦𝑖𝛽2

= 0

−𝑛𝛽 + ∑𝑦𝑖𝛽2

= 0

−𝑛𝛽 +∑𝑦𝑖 = 0

�̂� =∑𝑦𝑖𝑛

Jadi penduga kemungkinan maksimum untuk 𝛽 adalah

�̂� =∑𝑦𝑖𝑛

G. Metode Numerik Newton-Raphson

Pendugaan parameter model regresi Binomial Negatif dilakukan dengan

metode pendugaan kemungkinan maksimum. Proses untuk menemukan solusi dari

turunan fungsi log-likelihood tidak dapat dilakukan secara langsung karena fungsi

log-likelihood tidak linear dalam parameter yang ingin ditaksir sehingga

membutuhkan metode numerik Newton-Raphson untuk menyelesaikannya.

Metode Newton-Raphson adalah metode yang digunakan untuk mencari akar-akar

persamaan dari suatu fungsi non-linear f(x)=0 dengan metode pendekatan yang

menggunakan satu titik awal dan mendekatinya dengan memperhatikan slope atau

gradien pada titik tersebut. Metode Newton-Rhapson yang diperoleh dari deret

Taylor.

Misalkan 𝑓 mempunyai akar pada suatu interval real dan akan dicari nilai

pendekatan akarnya. Deret Taylor 𝑓 di sekitar 𝑥 = 𝑥𝑛 adalah

𝑓(𝑥) = 𝑓(𝑥𝑛) + 𝑓′(𝑥𝑛)(𝑥 − 𝑥𝑛) +

𝑓"(𝑥𝑛)

2!(𝑥 − 𝑥𝑛)

2 +⋯


29

Untuk 𝑥 yang cukup dekat dengan 𝑥𝑛 maka suku-suku nonlinear dapat

diabaikan, maka akan diperoleh pendekatan

𝑓(𝑥) = 𝑓(𝑥𝑛) + 𝑓′(𝑥𝑛)(𝑥 − 𝑥𝑛)

Jika 𝑥 adalah akar dari 𝑓 maka 𝑓(𝑥) = 0

0 = 𝑓(𝑥𝑛) + 𝑓′(𝑥𝑛)(𝑥 − 𝑥𝑛)

−𝑓(𝑥𝑛) = 𝑓′(𝑥𝑛)(𝑥 − 𝑥𝑛)

𝑥 − 𝑥𝑛 = −𝑓(𝑥𝑛)

𝑓′(𝑥𝑛)

𝑥 = 𝑥𝑛 −𝑓(𝑥𝑛)

𝑓′(𝑥𝑛)

Oleh karena itu diperoleh skema iterasi ke 𝑛 + 1 metode Newton-Raphson adalah

𝑥𝑛+1 = 𝑥𝑛 −𝑓(𝑥𝑛)

𝑓′(𝑥𝑛)

Contoh 2.2

Selesaikan persamaan 𝑥3 − 𝑥 − 1 = 0 dengan menggunakan metode Newton-

Raphson yang diketahui 𝑥0 = 1 dan toleransi adalah 10−7

Penyelesaian:

Diketahui:

𝑓(𝑥) = 𝑥3 − 𝑥 − 1

𝑥0 = 1

Toleransi = 10−7

Oleh karena itu, diperoleh 𝑓′(𝑥) = 3𝑥2 − 1

Skema iterasi ke 𝑛 + 1 metode Newton Raphson adalah

𝑥𝑛+1 = 𝑥𝑛 −𝑓(𝑥𝑛)

𝑓′(𝑥𝑛)


30

Sehingga, Untuk 𝑛 = 0, diperoleh

𝑥0+1 = 𝑥0 −𝑓(𝑥0)

𝑓′(𝑥0)

𝑥1 = 1 −𝑥03 − 𝑥0 − 1

3𝑥02 − 1

= 1 −13 − 1 − 1

312 − 1=3

2= 1.5

𝑓 (3

2) = 0.875

Untuk 𝑛 = 1, diperoleh

𝑥1+1 = 𝑥1 −𝑓(𝑥1)

𝑓′(𝑥1)

𝑥2 =3

2−𝑥13 − 𝑥1 − 1

3𝑥12 − 1

=3

2−(32)

3

−32 − 1

3 (32)

2

− 1

=31

23

= 1.347826087

𝑓 (31

23) = 0.1006821

Untuk 𝑛 = 2 diperoleh

𝑥2+1 = 𝑥2 −𝑓(𝑥2)

𝑓′(𝑥2)

𝑥3 = 𝑥2 −𝑥23 − 𝑥2 − 1

3𝑥22 − 1


31

=31

23−(3123)

3

−3123 − 1

3 (3123)

2

− 1

= 1.325200399

𝑓(1.325200399) = 2.058362126 × 10−3


𝑥3+1 = 𝑥3 −𝑓(𝑥3)

𝑓′(𝑥3)

𝑥4 = 𝑥3 −𝑥33 − 𝑥3 − 1

3𝑥32 − 1

= 1.325200399

−(1.325200399)3 − 1.325200399 − 1

3(1.325200399)2 − 1

= 1.324718174

𝑓(1.324718174) = −1.04376 × 10−7


𝑥4+1 = 𝑥4 −𝑓(𝑥4)

𝑓′(𝑥4)

𝑥5 = 𝑥4 −𝑥43 − 𝑥4 − 1

3𝑥42 − 1

= 1.324718174

−(1.324718174)3 − 1.324718174 − 1

3(1.324718174)2 − 1

= 1.324717957

𝑓(1.324717957) = −1.04376 × 10−9

Sehingga akar dari persamaan 𝑥3 − 𝑥 − 1 = 0 adalah 1.324717957 ≈ 1.324718.


32

H. Keluarga Eksponensial

Suatu fungsi probabilitas yang tergantung pada suatu parameter 𝜃 dari suatu

variable random 𝑌 dikatakan termasuk dalam keluarga eksponensial apabila dapat

dituliskan sebagai

𝑓(𝑦; 𝜃, 𝜙) = exp {𝑦𝑖𝜃𝑖 − 𝑏(𝜃𝑖)

𝛼𝑖(𝜙)+ 𝑐(𝑦𝑖; 𝜙)}

2.6

Dengan:

𝜃𝑖 adalah parameter kanonik atau fungsi penghubung

𝑏(𝜃𝑖) adalah cumulant

𝛼(𝜙) adalah parameter skala, 𝛼(𝜙) = 1 jika merupakan model count dan diskrit

𝑐(𝑦𝑖; 𝜙) adalah suku normalisasi untuk menjamin bahwa total nilai fungsi

probabilitas adalah 1

Bentuk keluarga eksponensial adalah unik karena turunan pertama dan

turunan kedua dari cumulant terhadap 𝜃 akan menghasilkan mean dan variansi. Hal

penting yang harus diingat adalah jika seseorang dapat mengkonversi sebuah fungsi

probabilitas ke dalam bentuk keluarga eksponensial maka dapat dengan mudah

menghitung mean dan variansi. Semua anggota model linear umum dapat

dikonversi ke dalam bentuk eksponensial dengan

𝑏′(𝜃𝑖) = mean

𝑏"(𝜃𝑖) = variansi

Macam-macam keluarga eksponensial antara lain adalah:

1. Distribusi Binomial Negatif

2. Distribusi Poisson

3. Distribusi Gamma


33

4. Distribusi Beta, dan

5. Distribusi Normal.

Pada skripsi ini, penulis hanya akan mendeskripsikan bahwa distribusi

Poisson dan distribusi Binomial adalah anggota keluarga eksponensial. Berikut

akan ditunjukan bahwa

1. Distribusi Poisson merupakan keluarga eksponensial

Variabel random 𝑌 disebut berdistribusi Poisson jika dan hanya jika fungsi

probabilitasnya sebagai berikut

𝑓(𝑦) =𝜆𝑦

𝑦!𝑒−𝜆, 𝑦 = 0,1,2, … dan 𝜆 > 0

untuk menunjukkan bahwa distribusi Poisson merupakan keluarga

eksponensial maka persamaan di atas ditulis ke dalam bentuk persamaan 2.6

yaitu



Langkah-langkahnya adalah sebagai berikut:

a. Kedua ruas dari fungsi probabilitas distribusi Poisson di ubah dalam bentuk

log diperoleh

𝑙𝑜𝑔 (𝑓(𝑦)) = log (𝜆𝑦

𝑦!𝑒−𝜆)

log(𝑓(𝑦)) = 𝑦 log 𝜆 − 𝜆 − log (𝑥!) 2.7

b. Persamaan 2.7 diubah dalam bentuk eksponensial diperoleh

𝑓(𝑦) = 𝑒𝑥𝑝{𝑦 log 𝜆 − 𝜆 − log (𝑥!)} 2.8

Sehingga dari persamaan 2.8 diperoleh

𝜃 = log 𝜆 sehingga 𝜆 = 𝑒𝜃; 𝑏(𝜃) = 𝑒𝜃, 𝛼𝑖(𝜙) = 1; 𝑐(𝑦𝑖; 𝜙) = −log (𝑥!)


34

Sehingga turunan pertama dan turunan kedua dari 𝑏(𝜃) = 𝑒𝜃 terhadap 𝜃

akan menghasilkan mean dan variansi sebagai berikut:

𝐸(𝑌) =𝜕(𝑏(𝜃))

𝜕𝜃

=𝜕(𝑒𝜃)

𝜕𝜃

= 𝑒𝜃

= 𝜆

𝑉𝑎𝑟(𝑌) = 𝛼𝑖(𝜙) 𝜕2(𝑏(𝜃))

𝜕𝜃2

=𝜕2(𝑒𝜃)

𝜕𝜃2

= 𝑒𝜃

= 𝜆

2. Distribusi Binomial merupakan keluarga eksponensial

Variabel random 𝑋 yang menyatakan banyaknya sukses pada 𝑛 kali percobaan

Bernoulli berdistribusi Binomial yang diberikan dengan 𝑓(𝑥) yaitu

𝑓(𝑥) = (𝑛𝑥)𝑝𝑥(1 − 𝑝)𝑛−𝑥

untuk menunjukkan bahwa distribusi Binomial merupakan keluarga

eksponensial maka persamaan di atas ditulis ke dalam bentuk persamaan 2.6

yaitu



Langkah-langkahnya adalah sebagai berikut:


35

a. Kedua ruas dari fungsi probabilitas distribusi Binomial diubah dalam

bentuk log diperoleh

log(𝑓(𝑥)) = 𝑙𝑜𝑔 (𝑛𝑥) + 𝑥 𝑙 log 𝑝 + (𝑛 − 𝑥) log(1 − 𝑝) 2.9

b. Persamaan 2.9 diubah dalam bentuk eksponensial diperoleh

𝑓(𝑥) = 𝑒𝑥𝑝 {𝑥[log 𝑝 − log(1 − 𝑝)] + 𝑛 log(1 − 𝑝) + 𝑙𝑜𝑔 (𝑛𝑥)}

= 𝑒𝑥𝑝 {𝑥 log (𝑝

1 − 𝑝) + 𝑛 log(1 − 𝑝) + 𝑙𝑜𝑔 (

𝑛𝑥)} 2.10

Dari persamaan 2.10 diperoleh 𝜃 = log (𝑝

1−𝑝) sehingga 𝑒𝜃 =

𝑝

1−𝑝

karena 𝑝 =𝑒𝜃

1+𝑒𝜃 sehingga 1 − 𝑝 = (1 + 𝑒𝜃)

−1, 𝑏(𝜃) = 𝑛 log(1 + 𝑒𝜃)

dan 𝑐(𝑥; 𝜙) = 𝑙𝑜𝑔 (𝑛𝑥).

Sehingga turunan pertama dan turunan kedua dari 𝑏(𝜃) = 𝑛 log(1 +

𝑒𝜃) terhadap 𝜃 akan menghasilkan mean dan variansi sebagai berikut:

𝐸(𝑌) =𝜕(𝑏(𝜃))

𝜕𝜃

=𝜕(𝑛 log(1 + 𝑒𝜃))

𝜕𝜃

= 𝑛𝑒𝜃

1 + 𝑒𝜃

= 𝑛𝑝

𝑉𝑎𝑟(𝑌) = 𝛼𝑖(𝜙) 𝜕2(𝑏(𝜃))

𝜕𝜃2

=𝜕2(𝑛 log(1 + 𝑒𝜃))

𝜕𝜃2

=𝑛𝑒𝜃

(1 + 𝑒𝜃)2


36

= 𝑛𝑝(1 − 𝑝)

I. Model Regresi Linear Berganda

Model regresi linear berganda merupakan perluasan dari model regresi

linear sederhana. Regresi berganda seringkali digunakan untuk mengatasi

permasalahan analisis regresi yang melibatkan hubungan dari dua atau lebih

variable independen. Salah satu contoh penggunaan regresi berganda di bidang

pertanian di antaranya ilmuwan pertanian menggunakan analisis regresi untuk

mengetahui antara hasil pertanian (misal: produksi padi per hektar) dengan jenis

pupuk yang digunakan, kualitas pupuk yang diberikan, jumlah hari hujan, suhu,

lama penyinaran matahari, dan infeksi serangga. Sebuah model regresi berganda

dapat menerangkan hubungan tersebut yaitu

𝑌 = 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + 𝛽3𝑥3𝑖 + 𝛽4𝑥4𝑖 + 𝛽5𝑥5𝑖 + 𝛽6𝑥6𝑖 + 𝜀𝑖

Dengan 𝑌 menyatakan hasil pertanian, 𝑥1 menyatakan jenis pupuk yang

digunakan, 𝑥2 menyatakan kuantitas pupuk yang diberikan , 𝑥3 menyatakan jumlah

hari hujan, 𝑥4 menyatakan suhu, 𝑥5 menyatakan lama penyinaran matahari, dan 𝑥6

menyatakan infeksi serangga. Persamaan di atas adalah sebuah model regresi linear

berganda dengan enam variable independen.

Pada umumnya, variable dependen 𝑌 dapat dihubungkan pada 𝑝 variabel-

variabel independen yang dapat ditulis dalam bentuk:

𝑌 = 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + 𝛽3𝑥3𝑖 +⋯+ 𝛽𝑝𝑥𝑝𝑖 + 𝜀𝑖 2.11

Persamaan 2.11 merupakan sebuah model regresi linear berganda dengan:

𝑌 = variabel tak bebas


37

𝛽0 = intersep

𝛽𝑝 = koefisien regresi dari variabel bebas ke − 𝑝

𝜀𝑖 = galat (𝑒𝑟𝑟𝑜𝑟)

𝑖 = 1, 2, 3,⋯ , 𝑝

𝑥𝑝𝑖 = nilai variabel bebas ke − p pada pengamatan ke − i

Persamaan 2.11 dapat dinayatakan dalam bentuk matriks menjadi:

[

𝑌1𝑌2⋮𝑌𝑛

] =

[ 1 𝑥11 𝑥21 ⋯ 𝑥𝑝11 𝑥12 𝑥22 ⋯ 𝑥𝑝2⋮ ⋮ ⋮ ⋱ ⋮1 𝑥1𝑛 𝑥2𝑛 ⋯ 𝑥𝑝𝑛]

[

𝛽0𝛽1⋮𝛽𝑝

] + [

𝜀1𝜀2⋮𝜀𝑛

]

Matriks tersebut dapat dinyatakan sebagai berikut

𝒚 = 𝒙𝜷 + 𝜺

Dengan:

𝒚 = vektor kolom dari variabel tak bebas berordo (𝑛 × 1)

𝒙 = matriks dari variabel bebas berordo (𝑛 × (𝑝 + 1))

𝜷 = vektor kolom dari parameter berordo ((𝑝 + 1) × 1)

𝜺 = vektor kolom dari galat berordo (𝑛 × 1)

J. Jenis Data Penelitian

1. Data berdasarkan sumbernya

Berdasrkan sumbernya, data penelitian dapat dikelompokkan dalam dua

jenis, yaitu data primer dan data sekunder.

a. Data primer adalah data yang diperoleh atau dikumpulkan oleh peneliti secara

langsung dari sumber data utama. Untuk mendapatkan data primer, peneliti


38

harus mengumpulkannya secara langsung. Teknik yang dapat digunakan

peneliti untuk mengumpulkan data primer antara lain observasi, wawancara,

dan penyebaran kuesioner.

b. Data sekunder adalah data yang diperoleh atau dikumpulkan oleh peneliti dari

berbagai sumber yang telah ada. Data sekunder dapat diperoleh dari berbagai

sumber seperti Biro Pusat statistik (BPS), buku, jurnal, dan lain-lain.

2. Data berdasarkan bentuk dan sifatnya

Berdasarkan bentuk dan sifanya, data penelitian dapat dibedakan dalam dua

jenis yaitu data kualitatif dan data kuantitatif. Data kuantitaif dapat

dikelompokkan berdasarkan cara untuk mendapatkannya, yaitu data diskrit dan

data kontinu. Berdasarkan sifatnya, data kuantitatif terdiri atas data nominal,

data ordinal, data interval dan data rasio.

1. Data kualitatif

Data kualitatif adalah data yang berbentuk kata-kata, bukan dalam

bentuk angka. Data kualitatif diperoleh melalui berbagai macam teknik

pengumpulan data misalnya wawancara, analisis dokumen, dan lainnya.

2. Data kuantitatif

Data kuantitatif adalah data yang berbentuk angka atau bilangan. Sesuai

dengan bentuknya, data kuantitatif dapat diolah atau dianalisis

menggunakan teknik perhitungan matematika atau statistika. Berdasarkan

proses atau cara untuk mendapatkannya, data kuantitatif dapat

dikelompokkan dalam dua bentuk yaitu sebagai berikut:


39

a. Data diskrit adalah data dalam bentuk angka (bilangan) yang diperoleh

dengan cara membilang. Contohnya jumlah Sekolah Dasar Negeri di

Kecamatan X adalan 20.

b. Data kontinu adalah data dalam bentuk angka/ bilangan yang diperoleh

berdasarkan hasil pengukuran. Data kontinu dapat berbentuk bilangan

bulat atau pecahan tergantung jenis skal pengukuran yang digunakan.

Contohnya tinggi badan Budi adalah 150.5 centimeter.

Berdasarkan tipe skala pengukuran yang digunakan, data kuantitatif

dapat dikelompokkan dalam empat jenis yang memiliki sifat berbeda

yaitu:

1) Data nominal atau sering disebut juga data kategori adalah data yang

diperoleh melalui pengelompokkan obyek berdasrkan kategori

tertentu. Perbedaan kategori obyek hanyalah menunjukkan

perbedaan kualitatif. Walaupun data nominal dapat dinyatakan

dalam bentuk angka, namun angka tersebut tidak memiliki urutan

atau makna matematis sehingga tidak dapat digunakan untuk

menganalisis data nominal. Contohnya jenis kelamin yang terdiri

dari dua kakategori yaitu laki-laki (0) dan perempuan (1), angka 0,

dan 1 hanyalah simbol yang digunakan untuk membedakan dua

kategori jenis kelamin. Angka-angka tersebut tidak memilki makna

kuantitatif artinya angka (1) pada data di atas tidak berarti lebih

besar dari angka (0), karena laki-laki tidak memiliki makna lebih

besar dari perempuan. Contoh lainnya dalah status pernikahan yang


40

terdiri dari empat kategori yatu (1) belum menikah (2) menikah (3)

janda/duda (4) bercerai. Data tersebut memiliki sifat-sifat yang

sama dengan data tentang jenis kelamin.

2) Data ordinal adalah data yang berasal dari suatu objek atau kategori

yang telah disusun secara berjenjang menurut besarnya. Setiap data

ordinal memiliki tingkatan tertentu yang dapat diurutkan mulai dari

yang terendah sampai tertinggi ataupun sebaliknya. Namun

demikian, jarak atau rentang antar jenjang tidak harus sama.

Dibandingkan dengan data nominal, data ordinal memiliki sifat

berbeda dalam hal urutan. Data ordinal berlaku perbandingan

dengan menggunakan simbol " > " dan " < ". Contohnya peringkat

siswa dalam satu kelas yang menunjukkan urutan prestasi belajar

tertinggi sampai terendah. Siswa pada peringkat (1) memiliki

prestasi belajar lebih tingi dari pada siswa peringkat (2).

3) Data interval adalah data hasil pengukuran yang dapat diurutkan atas

dasar kriteria tertentu serta menunjukan semua sifat yang dimiliki

oleh data ordinal. Kelebihan sifat data interval dibandingkan dengan

data ordinal adalah memiliki sifat kesamaan jarak. Data interval

dapat dilakukan operasi matematik penjumlahan dan pengurangan

(+,−). Namun demikian masih terdapat satu sifat yang belum

dimiliki yaitu tidak adanya angka nol mutlak pada data interval.

4) Data rasio adalah data yang berbentuk angka dalam arti

sesungguhnya karena dilengkapi dengan titik nol absolut sehingga


41

dapat diterapkan semua bentuk operasi matematik (+,−, ×, ∶).

Contohnya panjang suatu benda yang dinyatakan dalam ukuran

meter adalah data rasio. Benda yang panjangnya 1 meter berbeda

secara nyata dengan benda yang panjangnya 2 meter sehingga dapat

dibuat kategori benda yang berukuran 1 meter dan 2 meter (sifat data

nominal). Ukuran panjang benda dapat diurutkan mulai dari yang

terpanjang sampai yang terpendek (sifat data ordinal). Perbedaan

antar benda yang panjangnya 1 meter dengan 2 meter memiliki jarak

yang sama dengan perbedaan antar benda yang panjangnya 2 meter

dengan 3 (sifat data interval). Kelebihan sifat yang dimiliki data

rasio ditunjukkan oleh dua hal yaitu: (1) Angka 0 meter

menunjukkan nilai mutlak yang artinya tidak ada benda yang diukur;

serta (2) benda yang panjangnya 2 meter, 2 kali lebih panjang

dibandingkan dengan benda yang panjangnya 1 meter yang

menunjukkan berlakunya semua operasi matematik. Kedua hal

tersebut tidak berlaku untuk jenis data nominal, data ordianal,

maupun data interval.

K. Model Count Respon

Model count respon adalah bagian dari model regresi dengan variabel

respon diskrit. Variabel respon diskrit dapat berupa data count yaitu data dengan

nilai bilangan bulat non-negatif. Contoh model diskrit adalah sebagai berikut:

Model regresi logistik biner dan regresi probit


42

Model regresi Poisson dan Regresi Binomial Negatif

1. Model regresi logistik biner dan regresi probit

a. Regresi Logistik Biner

Regresi logistik merupakan teknik statistik yang tepat digunakan ketika

variabel dependen berbentuk diskrit/kategorial (non-metrik) dan variabel

independen dapat berbentuk metrik atau non-metrik. Dengan kata lain, regresi

logistik merupakan model yang dapat digunakan untuk menggambarkan

hubungan antara beberapa variabel independen dengan sebuah variabel

dependen yang bersifat dikotomi. Untuk membedakan antara model regresi

logistik dengan model regresi linear dapat dilihat pada variabel dependennya.

Pada regresi logistik, variabel dependen berbentuk biner atau dikotomi

sedangkan pada regresi linear variabel dependen diasumsikan kontinu. Contoh

apakah seseorang akan membeli barang ilegal (ya atau tidak), dengan variabel

prediktornya adalah tingkat pendidikan, tingkat pendapatan, dan status

perkawinan? Jadi regresi logistik biner digunakan ketika variabel dependen

adalah dikotomi sedangkan variabel independen dapat berbagai tipe.

Definisi 2.17

Model regresi logistik dengan 𝑝 variabel bebas adalah sebagai berikut:

𝜋(𝑿) =𝑒𝑔(𝑿)

1 + 𝑒𝑔(𝑿)

dengan, 𝑔(𝑿) = 𝛽0 + ∑ 𝛽𝑗𝑥𝑗𝑝𝑗=1 𝛽𝑗 koefisien regresi dari variabel bebas ke-j,

𝑥𝑗 adalah nilai variabel bebas ke-j dari sejumlah p variable bebas dan 𝛽0 adalah

konstanta.


43

b. Regresi Probit

Regresi probit sebenarnya serupa dengan regresi logistik yaitu dapat

digunakan untuk menganalisis variabel dependen yang bersifat kategori,

namun pada regresi probit variabel dependen diasumsikan berdistribusi

normal. Jadi, regresi logitik berdasarkan pada asumsi variabel dependen

bersifat kategori (variabel kualitatif ) serta menggunakan distribusi

Binomial dan regresi probit mengasumsikan variabel dependen yang

bersifat kategori (variabel kuantitatif) dan menggunakan distribusi

kumulatif normal.

Definisi 2.18

Model regresi probit dapat dituliskan sebagai berikut:

𝑌 = 𝛽0 + 𝛽𝑖𝑥𝑖 + 𝜀

Dengan 𝑌 adalah variabel dependen berdistribusi normal, 𝛽0 merupakan

intersep yang tidak diketahui, 𝛽𝑖 = (𝛽1, 𝛽2, ⋯ , 𝛽𝑝) adalah parameter

koefisien, 𝑥𝑖 = (𝑥1, 𝑥2, ⋯ , 𝑥𝑝) adalah variabel independen dan 𝜀 adalah

galat yang diasumsikan berdistribusi normal dengan mean nol dan variansi

𝜎2.

2. Model regresi Poisson dan Regresi Binomial Negatif

Dalam skripsi ini, penulis hanya membahas tentang model count. Semua

model count bertujuan untuk menjelaskan banyaknya kejadian dalam interval

waktu, ruang, atau volume tertentu dari suatu peristiwa. Ketika variabel dependen

berupa data count, maka analisis regresi yang biasa digunakan adalah analisis

regresi Poisson.


44

Pada umumnya, distribusi Poisson merupakan suatu model yang realistis

untuk berbagai macam fenomena acak selama nilai dari peubah acak Poisson

berupa bilangan bulat non-negatif. Misalkan banyaknya kecelakaan mobil setiap

bulan, banyaknya hujan badai setiap tahun, dan kasus lainnya. Pada model Regresi

Poisson terdapat asumsi yang harus dipenuhi yaitu variansi dari variabel responnya

sama dengan mean atau disebut ekuidispersi. Pada kenyataannya asumsi ini sangat

jarang terjadi karena data count memiliki variansi yang lebih besar dari meannya

atau disebut overdispersi. Dalam kondisi seperti ini model regresi Binomial Negatif

merupakan salah satu alternatif yang tepat untuk mengatasinya.

Model regresi Binomial Negatif memiliki kegunaan yang sama dengan


respon data count dengan satu atau lebih variabel independen, tetapi model regresi

Binomial Negatif lebih fleksibel dibandingkan dengan model Regresi Poisson

karena asumsi mean dan variansi dari model Regresi Binomial Negatif tidak harus

sama.

Menurut Hilbe (2011) ada dua pendekatan dasar untuk mengestimasi model

data count yaitu

1. Pendugaan Kemungkinan Maksimum

2. Iteratively re-weighted least squares (IRLS)

Dalam skripsi ini, penulis mengestimasi model data count dengan menggunakan

pendugaan kemungkinan maksimum.


45

L. Uji Kolmogorov-Smirnov

Hal yang sangat penting dalam prosedur statistik adalah menentukan

distribusi yang mendasari suatu kumpulan data (atau variabel random). Oleh karena

itu, dalam skripsi ini untuk mengetahui apakah sampel berdistribusi Poisson akan

digunakan uji Kolmogorov-Smirnov. Uji Kolmogorov-Smirnov adalah suatu uji

goodness of fit test (kecocokan), artinya yang diperhatikan adalah tingkat

kesesuaian antara sebaran dari serangkaian nilai sampel yang diobservasi dengan

suatu distribusi teoritis tertentu.

Dalam uji Kolmogorov-Smirnov, pengujian dilakukan pada dua buah fungsi

sebaran kumulatif, yaitu sebaran kumulatif yang hipotesiskan dan sebaan kumulatif

yang diamati. Misalkan diambil sebuah sampel acak dari suau fungsi sebaran 𝐹(𝑋)

yang belum diketahui, akan dipastikan apakah dapat disimpulkan bahwa 𝐹(𝑥) =

𝐹0(𝑋) untuk semua 𝑥, dengan 𝐹0(𝑋) adalah fungsi distribusi kumulatif yang

dihipotesiskan.

Misalkan variabel random 𝑋1, 𝑋2, … , 𝑋𝑛 berasal dari distribusi yang tidak

diketahui 𝐹(𝑥), akan diuji hipotesis bahwa 𝐹(𝑥) adalah sama dengan suatu

distribusi tertentu 𝐹0(𝑥).

Definisi 2.19

Misalkan 𝑋1, 𝑋2, … , 𝑋𝑛 adalah variabel random. Fungsi distribusi empiris 𝐹�̂�(𝑥) di

definisikan sebagai

𝐹�̂�(𝑥) =𝑖

𝑛∑ 𝐼{𝑥𝑖≤𝑥}

𝑛

𝑖=1

𝐼{𝑥𝑖≤𝑥} adalah fungsi indikator


46

𝐼 = {1, 𝑗𝑖𝑘𝑎 𝑥𝑖 ≤ 𝑥 0, 𝑗𝑖𝑘𝑎 𝑥𝑖 > 𝑥

Definisi 2.20

Statistik uji Kolmogorov-Smirnov 𝐷𝑛 di definisikan sebagai

𝐷𝑛 = max(𝐷+, 𝐷−)

𝐷+ = max[�̂�𝑛(𝑥) − 𝐹0(𝑥)]

𝐷− = max[𝐹0(𝑥) − �̂�𝑛−1(𝑥)]

Dengan �̂�𝑛(𝑥) adalah fungsi distribusi empiris. Fungsi distribusi empiris berguna

sebagai penduga dari fungsi distribusi yang tidak diketahui 𝐹(𝑥).

Hipotesis uji Kolmogorov-Smirnov adalah

𝐻0: 𝐹(𝑥) = 𝐹0(𝑥)

untuk setiap 𝑥 dengan 𝐹0 adalah fungsi distribusi kumulatif yang diketahui, dan

𝐻1: 𝐹(𝑥) ≠ 𝐹0(𝑥)

Jika 𝐷𝑛 lebih dari 𝐷𝑡𝑎𝑏𝑒𝑙 yang diberikan oleh tabel Kolmogorov-Smirnov maka 𝐻0

ditolak pada tingkat signifikansi 𝛼.

Langkah-langkah uji Kolmogorov-Smirnov untuk distribusi Poisson adalah

sebagai berikut:

1. 𝐻0 = data berdistribusi Poisson

𝐻1 = data tidak berdistribusi Poisson

2. Tentukan tingkat signifikansi 𝛼

3. Statistik uji

𝐷𝑛 = max(𝐷+, 𝐷−)

4. Hitunglah 𝐹0(𝑥) berdasarkan fungsi distribusi kumulatif dari distribusi Poisson


47

5. Berdasarkan Definisi 2.19 hitunglah fungsi distribusi empiris 𝐹�̂�(𝑥)

6. Berdasarkan Definisi 2.20 hitunglah nilai 𝐷+ dan 𝐷− , dan tentukan maksimum

dari 𝐷 (𝐷 = maksimum(𝐷+ , 𝐷− )

7. Daerah keputusan :

𝐻0 ditolak jika 𝐷𝑛 ≥ 𝐷 𝛼

8. Kesimpulan

Untuk memudahkan perhitungan, uji Kolmogorov-Smirnov dapat dilakukan

dengan SPSS. Contohnya dapat dilihat dalam contoh 2.4 berikut ini:

Contoh 2.4

Berikut adalah data suatu sampe acak. Akan diuji apakah datanya berdistribusi

Poisson?

Table 2.1 Data suatu sampel acak

Data 0 1 2 3 4 5 6

7 8 1 1 1 0 1

Uji hipotesis:

1. 𝐻0 = data berdistribusi Poisson


2. Tingkat signifikansi 𝛼 = 0.05

3. Daerah penolakan

Asymp.Sig.(2-tailed)< 𝛼 maka 𝐻0 ditolak


48

Table 2.2 Hasil Pengujian Kolmogorov-Smirnov

4. Dari hasil uji Kolmogorov-Smirnov di atas tampak bahwa nilai Asymp.Sig.(2-

tailed) adalah 0.281. jadi, Asymp.Sig.(2-tailed)> 𝛼. Dengan demikian berarti

𝐻0 diterima. Jadi, dapat disimpulkan bahwa data berdistribusi Poisson.

One-Sample Kolmogorov-Smirnov Test

Data

N 16

Poisson Parametera,,b Mean 3.06

Most Extreme

Differences

Absolute .247

Positive .247

Negative -.117

Kolmogorov-Smirnov Z .990

Asymp. Sig. (2-tailed) .281

a. Test distribution is Poisson.

b. Calculated from data.


50

BAB III

PENDUGAAN MODEL REGRESI BINOMIAL NEGATIF

A. Model Regresi Poisson Berganda

Model regresi Poisson Berganda merupakan perluasan dari model regresi

Poisson sederhana, dengan model regresi Poisson Berganda akan diketahui

hubungan antara sebuah variabel dependen 𝑌 yang bersifat diskrit, bernilai bulat

tak negatif dan berdistribusi Poisson dengan 𝑝 buah variabel independen 𝑋1, 𝑋2,

𝑋3, ⋯, 𝑋𝑝 yang berjenis diskrit, kontinu atau kategorik. Model regresi Poisson

secara umum digunakan untuk menganalisis data diskrit yang variabel dependennya

berdistribusi Poisson, yang memiliki rata-rata dan variansi sama dengan 𝜆 > 0.

Bila diberikan variabel dependen 𝑌 berdistribusi Poisson dengan 𝑝 variabel

independen 𝑋1, 𝑋2, 𝑋3, ⋯, 𝑋𝑝, persamaan regresi 𝑌 dengan 𝑋1, 𝑋2, 𝑋3, ⋯, 𝑋𝑝

dinyatakan seperti persamaan 2.11, maka nilai harapan 𝑌 dengan 𝑋1𝑖 = 𝑥1𝑖, 𝑋2𝑖 =

𝑥2𝑖, 𝑋3𝑖 = 𝑥3𝑖, ⋯, 𝑋𝑝𝑖 = 𝑥𝑝𝑖 sebagai berikut

𝐸(𝑌| 𝑋1𝑖 = 𝑥1𝑖 , 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖 , ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖)

= 𝐸(𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + 𝛽3𝑥3𝑖 + ⋯+ 𝛽𝑝𝑥𝑝𝑖

+ 𝜀𝑖|𝑋1𝑖 = 𝑥1𝑖, 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖, ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖)


51

= 𝐸(𝛽0|𝑋1𝑖 = 𝑥1𝑖, 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖, ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖)

+ 𝐸(𝛽1𝑋1𝑖|𝑋1𝑖 = 𝑥1𝑖 , 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖 , ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖) + ⋯

+ 𝐸(𝛽𝑝𝑋𝑝𝑖|𝑋1𝑖 = 𝑥1𝑖, 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖, ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖)

+ 𝐸(𝜀𝑖|𝑋1𝑖 = 𝑥1𝑖, 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖 , ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖)

dengan asumsi bahwa 𝐸(𝜀𝑖|𝑋𝑖) = 0, maka

= 𝛽0 + 𝛽1𝐸(𝑋1𝑖|𝑋1𝑖 = 𝑥1𝑖, 𝑋2𝑖 = 𝑥2𝑖 , 𝑋3𝑖 = 𝑥3𝑖, ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖) + ⋯

+ 𝛽𝑝𝐸(𝑋𝑝𝑖|𝑋1𝑖 = 𝑥1𝑖 , 𝑋2𝑖 = 𝑥2𝑖, 𝑋3𝑖 = 𝑥3𝑖 , ⋯ , 𝑋𝑝𝑖 = 𝑥𝑝𝑖) + 0

= 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯+ 𝛽𝑝𝑥𝑝𝑖 3.1

Dikarenakan 𝑌|𝑋𝑝𝑖 berdistribusi Poisson, maka nilai rata-ratanya 𝐸(𝑌|𝑋𝑝𝑖) = 𝛽0 +

𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯+ 𝛽𝑝𝑥𝑝𝑖 = 𝜆 harus bernilai tak negatif (dalam interval (𝑜,∞)),

padahal telah diketahui bahwa nilai regresi 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯+ 𝛽𝑝𝑥𝑝𝑖 ada

dalam interval (−∞,∞). Oleh karena itu, diperlukan fungsi penghubung (link

function) 𝑔 yang dapat membuat 𝜆 memiliki nilai dalam interval (𝑜,∞), yaitu

dengan fungsi penghubung logaritma (logarithm link), sehingga

𝑔(𝜆) = 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯+ 𝛽𝑝𝑥𝑝𝑖 3.2

𝑔 merupakan fungsi logaritma, sehingga model regresi Poisson menjadi

ln(𝜆) = 𝛽0 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯+ 𝛽𝑝𝑥𝑝𝑖 3.3

Atau persamaan 3.3 dapat juga dinyatakan dengan

𝜆 = exp (𝒙𝒊′𝜷) 3.4

Model regresi Poisson merupakan regresi non-linear yang termasuk keluarga

eksponensial.


52

Parameter 𝜷 dalam model regresi Poisson dapat diduga dengan salah satu

metode penduga yaitu metode penduga kemungkinan maksimum (Maximum

Likelihood Estimation).

Fungsi peluang dari distribusi Poisson adalah

𝑝(𝑦|𝜆) =𝜆𝑦

𝑦!𝑒−𝜆, 𝑦 = 0,1,2, … dan 𝜆 = exp (𝒙𝒊

′𝜷) sehingga

𝑝(𝑦|𝜆) =(exp(𝒙𝒊

′𝜷))𝑦 exp(−exp(𝒙𝒊′𝜷))

𝑦!

=exp (−exp (𝒙𝒊

′𝜷))(exp (𝑦𝒙𝒊′𝜷)

𝑦!

Berdasarkan persamaan 2.3 diperoleh fungsi likelihood berikut:

𝐿(𝛽) = 𝑝(𝑦1, 𝑦2, … , 𝑦𝑛|𝑥11, ⋯ , 𝑥𝑝𝑖; 𝜷)

= ∏𝑝(𝑦𝑖|𝑥𝑝𝑖

𝑛

𝑖=1

; 𝜷)

= ∏exp (−exp (𝒙𝒌𝒊

′ 𝜷))(exp (𝑦𝑖𝒙𝒌𝒊′ 𝜷)

𝑦!

𝑛

𝑖=1

Untuk mendapatkan penduga kemungkinan maksimum dari 𝛽, digunakan fungsi

log-likelihood sebagai berikut:

ln 𝐿(𝛽) = 𝑙𝑛 ∏exp(−exp(𝒙𝒌𝒊

′ 𝜷))(exp (𝑦𝑖𝒙𝒌𝒊′ 𝜷)

𝑦!

𝑛

𝑖=1

= 𝑙𝑛 ∏exp(−exp(𝒙𝒌𝒊′ 𝜷))

𝑛

𝑖=1

+ 𝑙𝑛 ∏(exp (𝑦𝑖𝒙𝒌𝒊′ 𝜷)

𝑛

𝑖=1

− 𝑙𝑛 ∏𝑦!

𝑛

𝑖=1


53

= ∑−exp(𝒙𝒌𝒊′ 𝜷)

𝑛

𝑖=1

+ ∑𝑦𝑖𝒙𝒌𝒊′ 𝜷

𝑛

𝑖=1

− ∑𝑙𝑛(𝑦!) = ∑(−exp(𝒙𝒌𝒊′ 𝜷) + 𝑦𝑖𝒙𝒌𝒊

′ 𝜷 − 𝒍𝑛(𝑦!))

𝒏

𝒊=𝟏

𝒏

𝒊=𝟏

Memaksimalkan nilai untuk 𝜷, untuk mendapatkan penduganya yaitu �̂�, dapat

dilakukan dari 𝑝 turunan pertama dari fungsi log-likelihood dan turunannya sama

dengan nol.

Penduga parameter �̂� dari persamaan diatas dapat diperoleh dengan

𝜕𝑙𝑛𝐿(𝛽)

𝜕𝛽=

𝜕

𝜕𝛽[∑(−exp(𝒙𝒌𝒊

′ 𝜷) + 𝑦𝑖𝒙𝒌𝒊′ 𝜷 − 𝒍𝑛(𝑦!))

𝒏

𝒊=𝟏

] = 0

∑(𝑦𝑖 − exp (𝒙𝒌𝒊′ 𝜷))𝒙𝒌𝒊

′ = 0

𝑛

𝑖=1

3.5

Karena persamaan di atas tidak linear, maka persamaan tersebut dapat diselesaikan

dengan pendekatan metode numeris misalnya metode Newton-Raphson.

Secara umum, �̂� dari model regresi Poisson dapat diperoleh dengan metode

Newton-Raphson sebagai berikut:

�̂�𝒏+𝟏 = �̂�𝒏 − [𝐻(�̂�𝒏)]−𝟏

𝒈(�̂�𝒏) 3.6

Dengan 𝑔 menyatakan gradien persamaan 3.5, 𝐻 adalah matriks Hessian, yaitu

matriks turunan kedua dari fungsi log-likelihood, dan �̂�𝟏 menyatakan nilai awal.


54

Dalam skripsi ini, �̂� dapat diduga dengan menggunakan program SPSS atau

program R.

B. Overdispersi dan regresi Binomial Negatif

Variabel respon yang berupa data count biasanya dianalisis dengan

menggunakan regresi Poisson yang memiliki asumsi mean dan variansi sama. Pada

kenyataannya, kondisi seperti ini sangat jarang terjadi karena biasanya data count

memiliki variansi yang lebih besar dari mean atau disebut dengan kondisi

overdispersi. Overdispersi dalam regresi Poisson dapat mengakibatkan galat

standar dari dugaan parameter regresi yang dihasilkan memiliki kecenderungan

untuk menjadi lebih rendah dari seharusnya sehingga menghasilkan kesimpulan

yang tidak sesuai dengan data.

Overdispersi pada data count dapat diindikasikan dengan nilai devians dan

pearson chi-squares yang dibagi dengan derajat bebasnya. Jika kedua nilai tersebut

lebih dari 1, maka dikatakan terjadi overdispersi pada data.

Terdapat dua cara yang dapat digunakan untuk mendeteksi overdispersi,

yaitu:

1. Devians

Definisi 3.1

Nilai devians dapat ditulis dalam bentuk

𝐷2 = 2∑{𝑦𝑖 𝑙𝑛 (𝑦𝑖

�̂�𝑖) − (𝑦𝑖 − �̂�𝑖)}

𝑛

𝑖=1


55

𝜙1 =𝐷2

𝑑𝑏;

Dengan 𝑑𝑏 = 𝑛 − 𝑘 dengan 𝑘 merupakan banyaknya parameter termasuk

konstanta, 𝑛 merupakan banyaknya pengamatan dan 𝐷2 adalah nilai Devians.

2. Pearson Chi-squares

Definisi 3.2

Nilai Pearson Chi-squares dapat ditulis dalam bentuk

𝜒2 = 2∑(𝑦𝑖 − 𝜇𝑖)

2

𝑣𝑎𝑟(𝑦𝑖)

𝑛

𝑖=1

𝜙2 =𝜒2

𝑑𝑏;

Dengan 𝑑𝑏 = 𝑛 − 𝑘 dengan 𝑘 merupakan banyaknya parameter termasuk

konstanta, 𝑛 merupakan banyaknya pengamatan dan 𝜒2adalah Pearson Chi-

squares.

Jadi, jika 𝜙1 atau 𝜙2 bernilai lebih dari 1 maka terjadi overdispersi pada data. Oleh

karena itu, Model Binomial negatif merupakan alternatif yang sering digunakan

untuk kasus overdispersi pada regresi Poisson.

Model regresi binomial negatif memiliki kegunaan yang sama dengan


dependen dengan satu atau lebih variabel independen, tetapi model regresi

Binomial Negatif lebih fleksibel dibandingkan dengan model Poisson karena

asumsi mean dan variansi dari model Binomial Negatif tidak harus sama. Model ini

juga memiliki parameter dispersi yang berguna untuk menggambarkan variasi dari

data yang biasa dinotasikan dengan k. Model Binomial Negatif yang akan


56

digunakan adalah Model Binomial Negatif yang merupakan model campuran antara

distribusi Poisson dan Gamma. Distribusi Gamma digunakan untuk menyesuaikan

kehadiran overdispersi dalam model Poisson.

Definisi 3.3

Fungsi probabilitas dari suatu variabel acak Y yang berdistribusi Binomial Negatif

adalah sebagai berikut:

𝑓(𝑦) = Γ (𝑦 +

1𝑘)

Γ (1𝑘) 𝑦!

(𝑘𝜇

1 + 𝑘𝜇)

𝑦

(1

1 + 𝑘𝜇)

1𝑘⁄

, 𝑦 = 0, 1, 2, …

Jika 𝑘 sama dengan nol, nilai rata-rata dan variansi akan sama, 𝐸(𝑌𝑖) = 𝑉𝑎𝑟(𝑌𝑖),

akan menjadi distribusi Poisson. Jika 𝑘 > 0, variansi akan melebihi nilai rata-rata,

𝑉𝑎𝑟(𝑌𝑖) > 𝐸(𝑌𝑖), dan distribusi memungkinkan overdispersi.

C. Binomial Negatif sebagai keluarga Eksponensial

Salah satu keluarga dari beberapa distribusi probabilitas yang sering

dijumpai adalah keluarga eksponensial. Keuntungan dari suatu distribusi

probabilitas yang termasuk anggota keluarga eksponensial adalah kemudahan

dalam mengidentifikasi beberapa ukuran distribusi, salah satunya adalah mean

sebagai parameter lokasi dan variansi sebagai nuisance parameter. Berikut adalah

definisi dari suatu distribusi yang merupakan anggota keluarga eksponensial.

Misalkan variabel acak 𝑌 memiliki distribusi probabilitas yang

bergantung pada parameter 𝜃 yang dianggap sebagai parameter lokasi dan terdapat

parameter lain yaitu 𝜙 yang disebut nuisance parameter. Berdasarkan Hilbe (2011),


57

distribusi dari 𝑌 merupakan anggota dari keluarga eksponensial jika fungsi

probabilitasnya memiliki bentuk seperti persamaan 2.6.

Berikut akan ditunjukkan bahwa distribusi Binomial Negatif merupakan

salah satu anggota dari keluarga eksponensial. Misalkan 𝑌 adalah suatu varibel acak

yang berdistribusi Binomial Negatif dengan parameter 𝑘 dan 𝜇 dengan fungsi

probabilitas

𝑓(𝑦) = Γ (𝑦 +

1𝑘)

Γ (1𝑘)𝑦!

(𝑘𝜇

1 + 𝑘𝜇)

𝑦

(1

1 + 𝑘𝜇)

1𝑘⁄

Dengan menganggap 𝜇 sebagai parameter lokasi dan k sebagai nuisance parameter,

maka akan diperoleh:

𝑓(𝑦) =Γ (𝑦 +

1𝑘)

Γ (1𝑘) 𝑦!

(𝑘𝜇

1 + 𝑘𝜇)

𝑦

(1

1 + 𝑘𝜇)

1𝑘⁄

= exp

(

𝑙𝑛 ((Γ (𝑦 +

1𝑘)

Γ (1𝑘) 𝑦!

) (𝑘𝜇

1 + 𝑘𝜇)

𝑦

(1

1 + 𝑘𝜇)

1𝑘⁄

)

)

= 𝑒𝑥𝑝

(

𝑙𝑛 (Γ (𝑦 +

1𝑘)

Γ (1𝑘) 𝑦!

+ 𝑦 𝑙𝑛 (𝑘𝜇

1 + 𝑘𝜇) +

1

𝑘𝑙𝑛 (

1

1 + 𝑘𝜇))

)

= 𝑒𝑥𝑝(𝑦 ln((𝑘𝜇

1 + 𝑘𝜇) + 𝑙𝑛 (

Γ (𝑦 +1𝑘)

Γ (1𝑘) 𝑦!

) +1

𝑘𝑙𝑛 (

1

1 + 𝑘𝜇))) 3.7

Persamaan 3.7 dapat ditulis kedalam bentuk persamaan 2.6

dengan


58

𝜃 = 𝑙𝑛 (𝑘𝜇

1 + 𝑘𝜇)

𝛼(𝜙) = 1

𝑐(𝑦; 𝜃) = 𝑙𝑛 (𝜏 (𝑦 +

1𝑘)

𝜏 (1𝑘) 𝑦!

)

𝑏(𝜃) = −1

𝑘𝑙𝑛 (

1

1 + 𝑘𝜇)

Sehingga terbukti bahwa distribusi binomial negatif merupakan anggota dari

keluarga eksponensial.

Telah disebutkan sebelumnya bahwa salah satu keuntungan dari anggota

keluarga eksponensial adalah mean dan variansi dari distribusi tersebut dapat

diidentifikasi dengan mudah, sehingga berdasarkan Hilbe (2011) yaitu

a. 𝑏′(𝜃) akan menghasilkan mean

b. 𝑏"(𝜃)𝛼(𝜙) akan menghasilkan variansi

Jadi, akan dicari mean dan variansi dari variabel random yang berdistribusi

binomial negatif dengan menggunakan salah satu sifat dari keluarga eksponensial

tersebut. Sebelum memperoleh mean dan variansi dari distribusi Binomial Negatif,

dapat didefenisikan bahwa:

𝑔(𝜇) = 𝜃

= 𝑙𝑛 (𝑘𝜇

1 + 𝑘𝜇)

= −𝑙𝑛 (1

𝑘𝜇+ 1)

Sehingga


59

−𝑙𝑛 (1

𝑘𝜇+ 1) = 𝜃 ⟺ (

1

𝑘𝜇+ 1) = 𝑒−𝜃 ⟺

1

𝑘𝜇= 𝑒−𝜃 − 1 ⟺ 𝜇 =

1

𝑘(𝑒−𝜃 − 1)

dan diperoleh

𝑔−(𝜃) = 𝜇

=1

𝑘(𝑒−𝜃 − 1)

= [𝑘(𝑒−𝜃 − 1)]−1

Fungsi cumulant yaitu

𝑏(𝜃) = −1

𝑘𝑙𝑛 (

1

1 + 𝑘𝜇)

=1

𝑘ln (1 + 𝑘𝜇)

sehingga akan diperoleh mean dan variansi dari binomial negatif sebagai berikut:

1. Mean

𝑏′(𝜃) =𝜕𝑏

𝜕𝜇

𝜕𝜇

𝜕𝜃

=1

𝑘

𝑘

1 + 𝑘𝜇(−1)(𝑎𝑒−𝜃 − 𝑎)

−2(−𝑎𝑒−𝜃)

=1

1 + 𝑘𝜇 (𝑎𝑒−𝜃 − 𝑎)

−2(𝑎𝑒−𝜃)

Karena 𝜇 = [𝑘𝑒−𝜃 − 𝑘]−1 maka 𝑘𝑒−𝜃 = 𝜇−1 + 𝑘 sehingga diperoleh

𝑏′(𝜃) =1

1 + 𝑘𝜇 𝜇2 (𝜇−1 + 𝑘)

=1

1 + 𝑘𝜇 𝜇(1 + 𝑘𝜇)

= 𝜇


60

2. Variansi

Karena 𝛼(𝜙) = 1, maka variansi dari 𝑌 hanya turunan kedua dari cumulant

terhadap 𝜃 yaitu sebagai berikut:

𝑏"(𝜃) =𝜕2𝑏

𝜕𝜇2 (

𝜕𝜇

𝜕𝜃)2

+𝜕𝑏

𝜕𝜇 𝜕2𝜇

𝜕𝜃2

Sebelumnya akan dicari 𝜕2𝑏

𝜕𝜇2 dan

𝜕2𝜇

𝜕𝜃2

𝜕2𝑏

𝜕𝜇2=

𝜕(1 + 𝑘𝜇)−1

𝜕𝜇= −𝑘(1 + 𝑘𝜇)−2 =

−𝑘

(1 + 𝑘𝜇)2

(𝑘𝑒−𝜃 − 𝑘)−2

(𝑘𝑒−𝜃) = 𝜇2(𝜇−1 + 𝑘) = 𝜇 + 𝑘𝜇2

= (𝑘𝑒−𝜃 − 𝑘)−1

+ 𝑘(𝑘𝑒−𝜃 − 𝑘)−2

Sehingga diperoleh

𝜕2𝜇

𝜕𝜃2=

𝜕 [(𝑘𝑒−𝜃 − 𝑘)−1

+ 𝑘(𝑘𝑒−𝜃 − 𝑘)−2

]

𝜕𝜃

= (𝑘𝑒−𝜃 − 𝑘)−2

(𝑘𝑒−𝜃) + (−2𝑘)(𝑘𝑒−𝜃 − 𝑘)−3

(−𝑘𝑒−𝜃)

= (𝑘𝑒−𝜃 − 𝑘)−2

(𝑘𝑒−𝜃) + (2𝑘)(𝑘𝑒−𝜃 − 𝑘)−3

(𝑘𝑒−𝜃)

= (𝑘𝑒−𝜃) [(𝑘𝑒−𝜃 − 𝑘)−2

+ (2𝑘)(𝑘𝑒−𝜃 − 𝑘)−3

]

= (𝜇−1 + 𝑘)(𝜇2 + 2𝑘𝜇3)

= (𝜇−1 + 𝑘)𝜇(𝜇 + 2𝑘𝜇2)

= (1 + 𝑘𝜇)(𝜇 + 2𝑘𝜇2)

Sehingga turunan kedua dari 𝑏(𝜃) terhadap 𝜃 adalah

𝑏"(𝜃) =𝜕2𝑏

𝜕𝜇2 (

𝜕𝜇

𝜕𝜃)2

+𝜕𝑏

𝜕𝜇 𝜕2𝜇

𝜕𝜃2


61

=−𝑘

(1 + 𝑘𝜇)2 (𝜇(1 + 𝑘𝜇))

2+

1

1 + 𝑘𝜇 (1 + 𝑘𝜇)(𝜇 + 2𝑘𝜇2)

= −𝑘𝜇2 + (𝜇 + 2𝑘𝜇2)

= 𝜇 + 𝑘𝜇2

Jadi, mean dan variansi dari Binomial Negatif secara berturut-turut adalah 𝜇 dan

𝜇 + 𝑘𝜇2.

D. Model Regresi Binomial Negatif

Dalam berbagai eksperimen, seringkali data count yang merupakan objek

penelitian (variabel dependen 𝑌) dipengaruhi oleh sejumlah variabel independen.

Variabel dependen 𝑌 menyatakan banyaknya kejadian yang diamati pada suatu

populasi tertentu. Untuk mengetahui hubungan antara kedua variabel tersebut,

maka dapat digunakan suatu model regresi yang didasarkan pada distribusi

Binomial Negatif.

Salah satu tujuan dari analisis regresi adalah untuk menentukan pola

hubungan antara variabel dependen dengan variable independen 𝑋1, 𝑋2, 𝑋3, ⋯,

𝑋𝑝.Oleh karena itu, dalam regresi Binomial Negatif hubungan tersebut dapat

dituliskan dalam bentuk

𝐸(𝑌𝑖|𝑋𝑖) = 𝜇𝑖 = 𝛽0 + 𝛽1𝑥𝑖1 + 𝛽2𝑥𝑖2 + ⋯+ 𝛽𝑝𝑥𝑖𝑝 3.8

atau dapat dinyatakan dalam notasi matriks

𝐸(𝑌𝑖|𝑋𝑖) = 𝜇𝑖 = 𝒙𝑖′𝜷 3.9

Nilai dari 𝒙𝑖′𝜷 pada persamaan di atas dapat bernilai real, sehingga

memungkinkan munculnya nilai negatif. Sebagaimana diketahui bahwa ekspektasi


62

dari distribusi Binomial Negatif harus bernilai positif sehingga perlu dilakukan

trasformasi sedemikian sehingga bentuk hubungan antara 𝜇𝑖 dan 𝒙𝑖′𝜷 menjadi tepat.

Hilbe (2011) menyatakan bahwa model Binomial Negatif pada umumnya

menggunakan fungsi penghubung logaritma atau log link yaitu

η𝑖 = ln (𝜇𝑖) = 𝒙𝑖′𝜷

Fungsi η𝑖 = ln (𝜇𝑖) disebut sebagai fungsi link, yaitu fungsi yang

menghubungkan 𝜇𝑖 dengan prediktor linear 𝒙𝑖′𝜷. Oleh sebab itu, model regresi

Binomial Negatif untuk memodelkan data count yaitu

𝜇𝑖 = exp (𝒙𝑖′𝜷) 3.10

dengan 𝑖 = 1, 2, 3,⋯ , 𝑛

E. Pendugaan Parameter untuk Model Regresi Binomial Negatif dengan Metode

Maksimum Likelihood

Model umum regresi Binomial Negatif dinyatakan dengan:

𝑦𝑖 = exp(𝛽0 + 𝛽1𝑥𝑖1 + 𝛽2𝑥𝑖2 + ⋯+ 𝛽𝑝𝑥𝑖𝑝) + 𝜀𝑖

Dengan 𝛽0, 𝛽1, 𝛽2, ⋯ menyatakan parameter yang tidak diketahui dan 𝜀𝑖

menyatakan galat untuk pengamatan ke-i.

Model umum regresi Binomial Negatif dapat diduga dengan

�̂�𝑖 = exp(�̂�0 + �̂�1𝑥𝑖1 + �̂�2𝑥𝑖2 + ⋯+ �̂�𝑝𝑥𝑖𝑝)

Untuk mengestimasi parameter 𝛽 dan k dalam regresi Binomial Negatif

dapat digunakan metode pendugaan kemungkinan maksimum (MLE). Fungsi

likelihood untuk model regresi Binomial Negatif adalah sebagai berikut:


63

𝐿(𝛽, 𝑘) = ∏𝑓(𝛽, 𝑘)

𝑛

𝑖=1

= ∏Γ(𝑦 +

1𝑘)

Γ (1𝑘) 𝑦!

(𝑘𝜇

1 + 𝑘𝜇)

𝑦

(1

1 + 𝑘𝜇)

1𝑘⁄

𝑛

𝑖=1

= ∏Γ(𝑦 +

1𝑘)

Γ (1𝑘) 𝑦!

𝑛

𝑖=1

∏(𝑘𝜇

1 + 𝑘𝜇)

𝑦

∏(1

1 + 𝑘𝜇)

1𝑘⁄

𝑛

𝑖=1

𝑛

𝑖=1

Selanjutnya, dari fungsi likelihood diambil nilai log-nya sehingga diperoleh

fungsi log- likelihood dari persamaan diatas sebagai berikut:

log 𝐿(𝛽, 𝑘) = log (∏𝑓(𝛽, 𝑘)

𝑛

𝑖=1

)

= log(∏Γ(𝑦 +

1𝑘)

Γ (1𝑘) 𝑦!

𝑛

𝑖=1

∏(𝑘𝜇

1 + 𝑘𝜇)

𝑦

∏(1

1 + 𝑘𝜇)

1𝑘⁄

𝑛

𝑖=1

𝑛

𝑖=1

)

= ∑log(Γ (𝑦 +

1𝑘)

Γ (1𝑘)

)

𝑛

𝑖=1

− ∑log(𝑦!) + ∑𝑦log(𝑘𝜇) −

𝑛

𝑖=1

𝑛

𝑖=1

∑𝑦log(1 + 𝑘𝜇)

𝑛

𝑖=1

+ ∑1

𝑘log(1) −

𝑛

𝑖=1

∑1

𝑘log(1 + 𝑘𝜇)

𝑛

𝑖=1

= ∑𝑙𝑜𝑔 (Γ (𝑦 +

1𝑘)

Γ (1𝑘)

)

𝑛

𝑖=1


𝑛

𝑖=1

𝑛

𝑖=1

∑(𝑦 +1

𝑘) log (1 + 𝑘𝜇)

𝑛

𝑖=1


64

Diketahui bahwa Γ(𝑦+𝑘)

Γ(𝑘)= 𝑘 × (1 + 𝑘) × ⋯× (𝑦 − 1 + 𝑘) untuk 𝑦 bilangan

bulat. Sehingga

Γ (𝑦 +1𝑘)

Γ (1𝑘)

= 𝑘−1 × (1 + 𝑘−1) × ⋯× (𝑦 − 1 + 𝑘−1)

Oleh karena itu, log𝐿(𝛽, 𝑘) bisa ditulis tanpa fungsi Gamma dengan

log(Γ (𝑦 +

1𝑘)

Γ (1𝑘)

) = log(𝑘−1) + log(1 + 𝑘−1) + ⋯+ log(𝑦 − 1 + 𝑘−1)

= ∑ log (1 + 𝑘𝑟

𝑘)

𝑦−1

𝑟=0

Likelihood untuk model regresi Binomial Negatif dapat ditulis sebagai,

log𝐿((𝛽, 𝑘) = ∑[(∑ log (1 + 𝑘𝑟

𝑘)

𝑦−1

𝑟=0

)

𝑛

𝑖=1


𝑛

𝑖=1

𝑛

𝑖=1

∑(𝑦 +1

𝑘) log(1 + 𝑘𝜇)

𝑛

𝑖=1

]

= ∑[(log ∑(1 + 𝑘𝑟)

𝑦−1

𝑟=0

) − 𝑦log(𝑘)

𝑛

𝑖=1


𝑛

𝑖=1

𝑛

𝑖=1

∑(𝑦 +1

𝑘) log (1 + 𝑘𝜇)

𝑛

𝑖=1

]

Oleh karena itu, pendugaan kemungkinan maksimum (�̂�, �̂�) dapat diperoleh

dengan memaksimalkan 𝑙(𝛽, 𝑘) terhadap 𝛽 dan 𝑘. Persamaan terkait adalah

sebagai berikut:


65

𝜕𝑙(𝛽, 𝑘)

𝜕𝛽0= ∑𝑦 − (

1

1 + 𝑘 exp(𝒙𝒊′𝜷)

𝑘 exp(𝒙𝒊′𝜷) (𝑦 +

1

𝑘))

𝑛

𝑖=1

= ∑𝑦 − (𝑘 exp(𝒙𝒊

′𝜷) (𝑦 +1𝑘)


)

𝑛

𝑖=1

= ∑𝑦 − (𝑦 𝑘 exp(𝒙𝒊

′𝜷) + exp(𝒙𝒊′𝜷)


)

𝑛

𝑖=1

= ∑𝑦(1 + 𝑘 exp(𝒙𝒊

′𝜷)) − (𝑦 𝑘 exp(𝒙𝒊′𝜷) + exp(𝒙𝒊

′𝜷))


𝑛

𝑖=1

= ∑𝑦 + 𝑦 𝑘 exp(𝒙𝒊

′𝜷) − 𝑦 𝑘 exp(𝒙𝒊′𝜷) − exp(𝒙𝒊

′𝜷)


𝑛

𝑖=1

= ∑𝑦 − exp (𝒙𝒊

′𝜷)

1 + 𝑘 exp (𝒙𝒊′𝜷)

𝑛

𝑖=1

𝜕𝑙(𝛽, 𝑘)

𝜕𝛽1= ∑𝑦𝑥1𝑖

𝑛

𝑖=1

− (1


𝑘 𝑥1𝑖 exp(𝒙𝒊′𝜷) (𝑦 +

1

𝑘))

= ∑𝑦𝑥1𝑖 − (𝑘 𝑥1𝑖 exp(𝒙𝒊

′𝜷) (𝑦 +1𝑘)


)

𝑛

𝑖=1

= ∑𝑦𝑥1𝑖 − (𝑦 𝑘 𝑥1𝑖 exp(𝒙𝒊

′𝜷) + 𝑥1𝑖 exp(𝒙𝒊′𝜷)


)

𝑛

𝑖=1

= ∑𝑦𝑥1𝑖(1 + 𝑘 exp(𝒙𝒊

′𝜷)) − (𝑦 𝑘 𝑥1𝑖 exp(𝒙𝒊′𝜷) + 𝑥1𝑖 exp(𝒙𝒊

′𝜷))


𝑛

𝑖=1

= ∑𝑦𝑥1𝑖 + 𝑦𝑥1𝑖𝑘 exp(𝒙𝒊

′𝜷) − 𝑦 𝑘 𝑥1𝑖 exp(𝒙𝒊′𝜷) − 𝑥1𝑖 exp(𝒙𝒊

′𝜷)


𝑛

𝑖=1


66

= ∑𝑦𝑥1𝑖 − 𝑥1𝑖 exp(𝒙𝒊

′𝜷)


𝑛

𝑖=1

= ∑𝑥1𝑖(𝑦 − exp(𝒙𝒊

′𝜷))


𝑛

𝑖=1

𝜕𝑙(𝛽, 𝑘)

𝜕𝛽2= ∑𝑦𝑥2𝑖 − (

1



1

𝑘))

𝑛

𝑖=1


′𝜷) (𝑦 +1𝑘)


)

𝑛

𝑖=1




)

𝑛

𝑖=1



′𝜷)


𝑛

𝑖=1


′𝜷)


𝑛

𝑖=1


′𝜷))


𝑛

𝑖=1

𝜕𝑙(𝛽, 𝑘)

𝜕𝛽3= ∑𝑦𝑥3𝑖 − (

1



1

𝑘))

𝑛

𝑖=1


′𝜷)(𝑦 +1𝑘)


)

𝑛

𝑖=1




)

𝑛

𝑖=1


67

= ∑𝑦𝑥3𝑖(1 + 𝑘 exp(𝒙𝒊

′𝜷)) − (𝑦 𝑘 𝑥3𝑖 exp(𝒙𝒊′𝜷) + 𝑥3𝑖 exp(𝒙𝒊

′𝜷))


𝑛

𝑖=1



′𝜷)


𝑛

𝑖=1


′𝜷)


𝑛

𝑖=1


′𝜷))


𝑛

𝑖=1

Jadi, secara umum

𝜕𝑙(𝛽, 𝑘)

𝜕𝛽𝑝= ∑

𝑥𝑝𝑖(𝑦 − exp(𝒙𝒊′𝜷))


𝑛

𝑖=1

= 0

dan

𝜕𝑙(𝛽, 𝑘)

𝜕𝑘= ∑[(∑

𝑟

1 + 𝑘𝑟

𝑦−1

𝑟=0

) −𝑦

𝑘+

𝑦 exp(𝒙𝒊′𝜷)

𝑘 exp(𝒙𝒊′𝜷)

𝑛

𝑖=1

− (−𝑘−2 log(1 + 𝑘 exp(𝒙𝒊′𝜷)) +

exp(𝒙𝒊′𝜷)


𝑦 +1

𝑘)]

= ∑[(∑𝑟

1 + 𝑘𝑟

𝑦−1

𝑟=0

) + 𝑘−2 log(1 + 𝑘 exp(𝒙𝒊′𝜷))

𝑛

𝑖=1

−exp(𝒙𝒊

′𝜷)


𝑦 +1

𝑘]


68

= ∑[(∑𝑟

1 + 𝑘𝑟

𝑦−1

𝑟=0

) + 𝑘−2 log(1 + 𝑘 exp(𝒙𝒊′𝜷))

𝑛

𝑖=1

−(𝑦 +

1𝑘) exp(𝒙𝒊

′𝜷)


]

= 0

Fungsi log-likelihood di atas didiferensialkan terhadap masing-masing parameter

yaitu 𝛽0, 𝛽1, 𝛽2, ⋯ ,𝛽𝑝 dan turunan terhadap 𝑘 dapat ditulis dalam bentuk matriks

yaitu

𝑈(𝜷∗) = 𝑈 (𝜷𝒌) =

(

𝜕𝑙(𝛽, 𝑘)

𝜕𝛽0

𝜕𝑙(𝛽, 𝑘)

𝜕𝛽1

𝜕𝑙(𝛽, 𝑘)

𝜕𝛽2

⋮⋮

𝜕𝑙(𝛽, 𝑘)

𝜕𝛽𝑝

𝜕𝑙(𝛽, 𝑘)

𝜕𝑘 )

= 𝟎

𝑈(𝜷∗) = 𝑈 (𝜷𝒌)


69

=

(

∑𝑦 − exp(𝒙𝒊

′𝜷)


𝑛

𝑖=1

∑𝑥1𝑖(𝑦 − exp(𝒙𝒊

′𝜷))


𝑛

𝑖=1


′𝜷))


𝑛

𝑖=1


′𝜷))


𝑛

𝑖=1

⋮

∑𝑥𝑝𝑖(𝑦 − exp(𝒙𝒊

′𝜷))


𝑛

𝑖=1

∑[(∑𝑟

1 + 𝑘𝑟

𝑦−1

𝑟=0

) + 𝑘−2 log(1 + 𝑘 exp(𝒙𝒊′𝜷)) −

(𝑦 +1𝑘) exp(𝒙𝒊

′𝜷)


]

𝑛

𝑖=1 )

= 0

Turunan kedua dari fungsi log-likelihood disebut matriks Hessian.

Karena persamaan-persamaan dalam matriks 𝑈(𝜷∗) tidak linear dalam masing-

masing parameternya, maka untuk mencari nilai dari 𝛽0, 𝛽1, ⋯, 𝛽𝑝 dan 𝑘 digunakan

metode numerik Newton-Raphson sebagai berikut:

�̂�𝑛 = �̂�𝑛−1 − [𝑯(�̂�𝑛−1)]−1

𝑼(�̂�𝑛−1)


70

𝐻 =

(

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽02

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽0𝜕𝛽1

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽0𝜕𝛽2

⋯𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽0𝜕𝛽𝑝

𝜕2𝑙(𝛽,𝑘)

𝜕𝛽0𝜕𝛽𝑘

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽0𝜕𝛽1

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽12

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽1𝜕𝛽2

⋯𝜕2𝑙(𝛽, 𝑘)


𝜕2𝑙(𝛽,𝑘)


𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽0𝜕𝛽2

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽1𝜕𝛽2

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽22

⋯𝜕2𝑙(𝛽, 𝑘)


𝜕2𝑙(𝛽,𝑘)


⋮ ⋮ ⋮ ⋱ ⋮ ⋮

𝜕2𝑙(𝛽, 𝑘)


𝜕2𝑙(𝛽, 𝑘)


𝜕2𝑙(𝛽, 𝑘)


⋯𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽𝑝2

𝜕2𝑙(𝛽,𝑘)

𝜕𝛽𝑝𝜕𝛽𝑘

𝜕2𝑙(𝛽, 𝑘)


𝜕2𝑙(𝛽, 𝑘)


𝜕2𝑙(𝛽, 𝑘)


⋯𝜕2𝑙(𝛽, 𝑘)


𝜕2𝑙(𝛽,𝑘)

𝜕𝛽𝑘2

)

dengan

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽02 = ∑

[−exp(𝒙𝒊′𝜷) (1 + 𝑘 exp(𝒙𝒊

′𝜷))] − [𝑘 exp(𝒙𝒊′𝜷) (𝑦 − exp(𝒙𝒊

′𝜷))]

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

= ∑−exp(𝒙𝒊

′𝜷) − 𝑘 exp(𝒙𝒊′𝜷) exp(𝒙𝒊

′𝜷) − 𝑘 𝑦 exp(𝒙𝒊′𝜷) + 𝑘 exp(𝒙𝒊

′𝜷) exp(𝒙𝒊′𝜷)

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1


71

= ∑−exp(𝒙𝒊

′𝜷) − 𝑘 𝑦 exp(𝒙𝒊′𝜷)

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

= ∑−(1 + 𝑘 𝑦) exp(𝒙𝒊

′𝜷)

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽0𝜕𝛽1

= ∑[−𝑥1𝑖 exp(𝒙𝒊

′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷))] − [𝑥1𝑖 𝑘 exp(𝒙𝒊

′𝜷) (𝑦 − exp(𝒙𝒊′𝜷))]

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

= ∑−𝑥1𝑖 exp(𝒙𝒊

′𝜷) − 𝑘 𝑥1𝑖 exp(𝒙𝒊′𝜷) exp(𝒙𝒊

′𝜷) − 𝑘 𝑦 𝑥1𝑖 exp(𝒙𝒊′𝜷) + 𝑘 𝑥1𝑖 exp(𝒙𝒊


[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1


′𝜷) − 𝑘 𝑦 𝑥1𝑖 exp(𝒙𝒊′𝜷)

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2


′𝜷) (1 + 𝑘 𝑦)

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

𝑛

𝑖=1

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽0𝜕𝛽2

= ∑[−𝑥2𝑖 exp(𝒙𝒊

′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷))] − [𝑥2𝑖 𝑘 exp(𝒙𝒊


[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1


′𝜷) − 𝑘 𝑥2𝑖 exp(𝒙𝒊′𝜷) exp(𝒙𝒊

′𝜷) − 𝑘 𝑦𝑥2𝑖 exp(𝒙𝒊′𝜷) + 𝑘 𝑥2𝑖 exp(𝒙𝒊


[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1


′𝜷) − 𝑘 𝑦 𝑥2𝑖 exp(𝒙𝒊′𝜷)

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2


′𝜷) (1 + 𝑘 𝑦)

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

𝑛

𝑖=1


72

𝜕2𝑙(𝛽, 𝑘)


= ∑[−𝑥𝑝𝑖 exp(𝒙𝒊

′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷))] − [𝑥𝑝𝑖 𝑘 exp(𝒙𝒊


[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

= ∑−𝑥𝑝𝑖 exp(𝒙𝒊

′𝜷) − 𝑘 𝑥𝑝𝑖 exp(𝒙𝒊′𝜷)exp(𝒙𝒊

′𝜷) − 𝑘 𝑦𝑥𝑝𝑖 exp(𝒙𝒊′𝜷) + 𝑘 𝑥𝑝𝑖 exp(𝒙𝒊


[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1


′𝜷) − 𝑘 𝑦 𝑥𝑝𝑖 exp(𝒙𝒊′𝜷)

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2


′𝜷) (1 + 𝑘 𝑦)

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

𝑛

𝑖=1

𝜕2𝑙(𝛽, 𝑘)

𝜕𝑘2= ∑[(∑

−𝑟2

(1 + 𝑘 𝑟)2

𝑦−1

𝑟=0

) −2

𝑘3𝑙𝑜𝑔(1 + 𝑘 exp(𝒙𝒊

′𝜷)) +exp(𝒙𝒊

′𝜷)

𝑘2(1 + 𝑘 exp(𝒙𝒊′𝜷))

+2 exp(𝒙𝒊


𝑘(1 + 𝑘 exp(𝒙𝒊′𝜷))2

𝑛

𝑖=1

+𝑦 1 + 𝑘 exp(𝒙𝒊

′𝜷) 1 + 𝑘 exp(𝒙𝒊′𝜷)

(1 + 𝑘 exp(𝒙𝒊′𝜷))2

]


73

= ∑[(∑−𝑟2

(1 + 𝑘 𝑟)2

𝑦−1

𝑟=0

) −2



′𝜷)


+exp(𝒙𝒊

′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷))

𝑘2(1 + 𝑘 exp(𝒙𝒊′𝜷))2

𝑛

𝑖−1

+(𝑦 +

1𝑘) (exp(𝒙𝒊

′𝜷) exp(𝒙𝒊′𝜷))

(1 + 𝑘 exp(𝒙𝒊′𝜷))2

]

= ∑[(∑−𝑟2

(1 + 𝑘 𝑟)2

𝑦−1

𝑟=0

) −2



′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷))


+exp(𝒙𝒊

′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷))


𝑛

𝑖=1

+(𝑦 +



(1 + 𝑘 exp(𝒙𝒊′𝜷))2

]

= ∑[(∑−𝑟2

(1 + 𝑘 𝑟)2

𝑦−1

𝑟=0

) −2



′𝜷)


+exp(𝒙𝒊

′𝜷)


𝑛

𝑖=1

+(𝑦 +



(1 + 𝑘 exp(𝒙𝒊′𝜷))2

]


74

= ∑[(∑−𝑟2

(1 + 𝑘 𝑟)2

𝑦−1

𝑟=0

) −2


′𝜷)) +2exp(𝒙𝒊

′𝜷)


+(𝑦 +



(1 + 𝑘 exp(𝒙𝒊′𝜷))2

]

𝑛

𝑖=1

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽12 = ∑

−𝑥1𝑖2 exp(𝒙𝒊

′𝜷) (1 + 𝑘 exp(𝒙𝒊′𝜷)) − [𝑥1𝑖 𝑘 exp(𝒙𝒊

′𝜷) (𝑥1𝑖 𝑦 − 𝑥1𝑖 exp(𝒙𝒊′𝜷))]

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

= ∑−𝑥1𝑖

2 exp(𝒙𝒊′𝜷) − 𝑥1𝑖

2 𝑘 exp(𝒙𝒊′𝜷) exp(𝒙𝒊

′𝜷) − 𝑥1𝑖2 𝑘 𝑦 exp(𝒙𝒊

′𝜷) + 𝑥1𝑖2 𝑘 exp(𝒙𝒊


[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

= ∑−𝑥1𝑖


2 𝑘 𝑦 exp(𝒙𝒊′𝜷)

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

= ∑−(1 + 𝑘 𝑦)𝑥1𝑖

2 exp(𝒙𝒊′𝜷)

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

𝑛

𝑖=1

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽22 = ∑




[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

= ∑−𝑥2𝑖






[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

= ∑−𝑥2𝑖



[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

= ∑−(1 + 𝑘 𝑦)𝑥2𝑖


[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

𝑛

𝑖=1


75

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽32 = ∑




[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

= ∑−𝑥3𝑖






[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

= ∑−𝑥3𝑖



[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

= ∑−(1 + 𝑘 𝑦)𝑥3𝑖


[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

𝑛

𝑖=1

Jadi secara umum,

𝜕2𝑙(𝛽, 𝑘)

𝜕𝛽𝑝2 = ∑

−(1 + 𝑘 𝑦)𝑥𝑝𝑖2 exp(𝒙𝒊

′𝜷)

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1


76

F. Uji Kebaikan Model

Uji kebaikan model yang berkaitan dengan model linear umum (GLM)

antara lain adalah sebagai berikut:

1. 𝑅2 dan 𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2,

2. Statistik deviansi

3. Uji likelihood ratio

4. Uji Wald dan

5. Kriteria informasi Akaike (AIC) dan kriteria informasi Bayessian (BIC).

Di dalam skripsi ini, uji kebaikan model regresi yang digunakan adalah

𝑅2 dan 𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2, uji likelihood-ratio, dan uji Wald.

a. 𝑅2 dan 𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2

Statistik 𝑅2 biasanya dikenal sebagai koefisien determinasi di dalam

model Regresi linear biasa. Statistik 𝑅2 ini biasanya diinterpretasikan sebagai

besarnya persentase dari variasi di dalam data yang dijelaskan oleh model. Nilai

dari statistik ini berkisar dari 0-1 dengan nilai yang semakin mendekati 1

merepresentasikan model yang terbentuk semakin baik. Namun, statistik ini kurang

tepat digunakan untuk model non-linear seperti Regresi Poisson, Regresi Binomial

Negatif dan Regresi Logistik.

Statistik 𝑅2 yang biasanya digunakan untuk model Regresi data count

adalah statistik 𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2. Berdasarkan Hilbe (2011), statistik 𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2

memiliki formula sebagai berikut:

𝑅𝑃2 = 1 − 𝐿𝐹/𝐿𝑖


77

Dengan: 𝐿𝐹 = nilai fungsi log-likelihood dari model yang lengkap

𝐿𝑖 = nilai fungsi log-likelihood dari model yang hanya mengandung

intercept

Interpretasi koefisien determinasi 𝑅2 pada Regresi linear tidak dapat

diterapkan kepada 𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2. Interpretasi yang dapat dibuat adalah nilai yang

sangat kecil yang mengindikasikan lack of fit atau model yang diperoleh kurang

baik sedangkan nilai yang cukup besar mengindikasikan model yang baik.

b. Uji likelihood -ratio

Uji likelihood-ratio adalah uji yang biasa digunakan untuk uji

perbandingan model. Uji ini biasanya digunakan untuk model yang bersarang

(nested models), tetapi uji ini juga dapat digunakan untuk uji dua model yang

berbeda (misalnya apakah sebuah data lebih baik dimodelkan dengan menggunakan

model Binomial Negatif atau Poisson). Formula untuk uji likelihood-ratio adalah

sebagai berikut:

𝐿𝑅 = −2{𝐿𝑟𝑒𝑑𝑢𝑐𝑒𝑑 − 𝐿𝑓𝑢𝑙𝑙}

Uji likelihood-ratio merupakan uji yang berguna ketika harus diputuskan

apakah penambaan satu atau sejumlah variabel penjelas ke dalam model harus

dilakukan atau tidak. Selain itu, uji ini digunakan untuk menguji signifikansi dari

taksiran model yang telah diperoleh. Berikut ini adalah uji signifikansi model

regresi Binomial Negatif, hipotesisnya adalah:

𝐻0: 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑃 = 0

𝐻1: ∃𝛽1 ≠ 0 ; j = 1,2,⋯p


78

Statistik uji yang digunakan adalah

𝐿𝑅 = −2{𝑙𝑜𝑔�̂�0 − 𝑙𝑜𝑔�̂�1}

Aturan keputusannya 𝐻0 ditolak pada tingkat signifikansi 𝛼 jika 𝐿𝑅 > 𝑋(𝛼,𝐾)2

c. Uji Wald

Uji ini digunakan untuk menguji signifikansi dari masing-masing variabel

penjelas terhadap model. Hipotesis untuk menguji signifikansi dari sembarang

koefisien regresi, misalkan 𝛽𝑗 adalah

𝐻0: 𝛽𝑗 = 0

𝐻1: 𝛽𝑗 ≠ 0

Statistik uji yang digunakan yaitu

𝑊𝑗 = [�̂�𝑗

𝑠𝑒(�̂�𝑗)]

2

Dengan �̂�𝑗 adalah taksiran parameter 𝛽𝑗 dan 𝑠𝑒(�̂�𝑗) adalah taksiran galat

standar dari 𝛽𝑗 yang diperoleh dari matriks taksiran variansi-kovariansi dari �̂�.

Aturan keputusannya adalah 𝐻0 ditolak pada tingkat signifikansi 𝛼 jika 𝑊𝑗 > 𝑋𝛼,12 .

Penolakan 𝐻0 pada tingkat signifikansi 𝛼 berarti bahwa bariabel penjelas

ke-j, untuk suatu 𝑗 tertentu (𝑗 = 1,2,3, … , 𝑘) memiliki kontribusi yang signifikan

terhadap variabel respon 𝑌.

Dalam statistik Uji Wald terdapat 𝑠𝑒(�̂�𝑗) yang merupakan standar error

dari parameter �̂�𝑗 yang diperoleh dari elemen-elemen diagonal minus invers dari


79

matriks Hessian yang disebut matriks variansi-kovariansi dan dinotasikan dengan

�̂�(�̂�) yaitu:

�̂�(�̂�) ≈ −[𝑯(�̂�)]−𝟏

≈ −

[ 𝜕2𝑙(𝛽,𝑘)

𝜕𝛽02

𝜕2𝑙(𝛽,𝑘)

𝜕𝛽0𝜕𝛽1

𝜕2𝑙(𝛽,𝑘)

𝜕𝛽0𝜕𝛽2⋯

𝜕2𝑙(𝛽,𝑘)


𝜕2𝑙(𝛽,𝑘)


𝜕2𝑙(𝛽,𝑘)

𝜕𝛽0𝜕𝛽1

𝜕2𝑙(𝛽,𝑘)

𝜕𝛽12

𝜕2𝑙(𝛽,𝑘)

𝜕𝛽1𝜕𝛽2⋯

𝜕2𝑙(𝛽,𝑘)


𝜕2𝑙(𝛽,𝑘)


𝜕2𝑙(𝛽,𝑘)

𝜕𝛽0𝜕𝛽2

𝜕2𝑙(𝛽,𝑘)

𝜕𝛽1𝜕𝛽2

𝜕2𝑙(𝛽,𝑘)

𝜕𝛽22 ⋯

𝜕2𝑙(𝛽,𝑘)


𝜕2𝑙(𝛽,𝑘)


⋮ ⋮ ⋮ ⋱ ⋮ ⋮𝜕2𝑙(𝛽,𝑘)


𝜕2𝑙(𝛽,𝑘)


𝜕2𝑙(𝛽,𝑘)

𝜕𝛽2𝜕𝛽𝑝⋯

𝜕2𝑙(𝛽,𝑘)

𝜕𝛽𝑝2

𝜕2𝑙(𝛽,𝑘)


𝜕2𝑙(𝛽,𝑘)


𝜕2𝑙(𝛽,𝑘)


𝜕2𝑙(𝛽,𝑘)

𝜕𝛽2𝜕𝛽𝑘⋯

𝜕2𝑙(𝛽,𝑘)


𝜕2𝑙(𝛽,𝑘)

𝜕𝛽𝑘2 ]

−𝟏

Elemen diagonal utama ke-𝑝 (𝑝 = 1,2, … , 𝑘 + 1) dari matriks �̂�(�̂�) merupakan

variansi dari �̂�𝑝−1, yang dinyatakan dengan �̂�(�̂�𝒑−𝟏) dan diperoleh melalui tahapan

sebagai berikut:

1. Turunan parsial kedua dari fungsi log-likelihood terhadap �̂�𝑗 yaitu

𝜕 [∑𝑥𝑝𝑖(𝑦 − exp(𝒙𝒊

′𝜷))


𝑛𝑖=1 ]

𝜕𝛽𝑝2

= ∑−𝑥𝑝𝑖𝑥𝑝𝑖 exp(𝒙𝒊

′𝜷) [1 + 𝑘 exp(𝒙𝒊′𝜷)] − 𝑘 𝑥𝑝𝑖 [exp(𝒙𝒊

′𝜷)][𝑥𝑝𝑖(𝑦 − exp(𝒙𝒊′𝜷))]

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

2. Ekspektasi dari minus matriks Hessian akan menghasilkan matriks Fisher

Information, sehingga elemen diagonal dari matriks Fisher Information untuk

𝛽𝑝 adalah


80

𝐼(𝛽𝑗)

= 𝐸 [−∑−𝑥𝑝𝑖𝑥𝑝𝑖 exp(𝒙𝒊

′𝜷) [1 + 𝑘 exp(𝒙𝒊′𝜷)] − 𝑘 𝑥𝑝𝑖 [exp(𝒙𝒊

′𝜷)][𝑥𝑝𝑖(𝑦 − exp(𝒙𝒊′𝜷))]

[1 + 𝑘 exp(𝒙𝒊′𝜷)]2

𝑛

𝑖=1

]

= 𝐼(𝛽𝑝)

Dalam hal ini, matriks Fisher Information digunakan untuk mengukur

seberapa besar informasi dari variabel independen 𝑋𝑝 yang dapat dijelaskan oleh

parameter 𝛽𝑝. Variansi dari 𝛽𝑝 dapat diperoleh dari elemen diagonal matriks 𝑽(𝜷)

maka variansi dari 𝛽𝑝 adalah:

𝑣𝑎𝑟(𝛽𝑝) = [𝐼(𝛽𝑗)]−1

= [∑𝑥𝑝𝑖



𝑛

𝑖=1

]

−1

3. Taksiran galat standar untuk �̂�𝑝 dalam model regresi Binomial Negatif adalah

𝑠𝑒(�̂�𝑝) = √𝑣(�̂�𝑝) = [∑𝑥𝑝𝑖



𝑛

𝑖=1

]

−1/2

Berdasarkan formula taksiran galat standar untuk �̂�𝑝 pada persamaan diatas, dapat

dikatakan bahwa galat standar tersebut dipengaruhi oleh parameter 𝑘. Hal tersebut

memberikan pengertian bahwa pada saat terjadi overdispersi, model Binomial

negatif akan menjadi lebih sensitif terhadap signifikansi dari variabel-variabel

penjelasnya karena memperhatikan pengaruh dari overdispersi melalui parameter

𝑘.


81

Contoh 3.1

Simulasi Regresi Binomial Negatif untuk data Poisson yang mengalami

Overdispersi

Untuk memberikan contoh simulasi Regresi Binomial Negatif untuk data

Poisson yang mengalami overdispersi, akan digunakan data dari Buku Profil

Kesehatan Kota Semarang Tahun 2013 yang juga digunakan oleh Ruliana (2015).

Pada simulasi berikut, penulis akan mengatasi Poisson yang mengalami

overdispersi pada variabel respon dengan menggunakan Regresi Binomial Neagtif.

Berikut adalah data banyaknya kasus penyakit campak pada 16 kecamatan di Kota

Semarang dengan Variable dependen 𝑌 adalah banyaknya kasus penyakit campak

pada 16 kecamatan di kota Semarang dan terdapat empat variable independen yaitu

𝑋1 = imunisasi

𝑋2 = Puskesmas

𝑋3 = Keluarga Miskin

𝑋4 = Kepadatan Penduduk

Tabel 3.1 data banyaknya kasus campak pada 16 kecamatan di kota Semarang

Kecamatan 𝑌 𝑋1 𝑋2 𝑋3 𝑋4

Mijen 2 955 2 725 1006

Gunungpati 12 1094 2 1776 1402

Banyumanik 8 2692 4 236 5080

Gajah Mungkur 2 855 1 1343 7012

Semarang Selatan 22 2129 2 1313 13882

Candisari 11 1447 2 1550 12187


82

Tembalang 20 2574 3 3008 3339

Pedurungan 11 2873 2 1705 8549

Genuk 5 2028 2 201 3411

Gayamsari 1 1928 1 88 11939

Semarang Timur 7 1857 3 4603 10211

Semarang Utara 6 1882 2 3183 11671

Semarang Tengah 2 1481 2 778 11596

Semarang Barat 1 2340 5 2660 7298

Tugu 4 539 2 1236 984

Ngaliyan 23 2511 3 2113 3226

Langkah-langkah analisis data mengikuti tahap-tahap berikut:

1. Uji Kolmogorov-Smirnov

2. Pendugaan Model Regresi Poisson

3. Uji signifikansi parameter

4. Uji overdispersi pada Model Regresi Poisson

5. Pendugaan Model Regresi Binomial Negatif

6. Uji signifikansi Model Regresi Binomial Negatif

Berikut adalah langkah-langkah pendugaan pendugaan parameter-parameter dari

model regresi Binomial Negatif:

1. Uji Kolmogorov-smirnov

Tujuan dari Uji Kolmogorov-Smirnov adalah untuk menentukan apakah data

banyaknya kasus penyakit campak pada 16 kecamatan di kota Semarang mengikuti

distribusi Poisson atau tidak.


83

Langkah-langkah uji Kolmogorov-Simirnov untuk distribusi Poisson adalah

sebagai berikut:

1) 𝐻0 = data berdistribusi Poisson


2) Tingkat signifikansi 𝛼 = 0.05

3) Daerah penolakan


Table 3.2 hasil SPSS


Data Campak

N 16


Most Extreme

Differences

Absolute .304

Positive .304

Negative -.187

Kolmogorov-Smirnov Z 1.215




4) Dari hasil uji Kolmogorov-Smirnov di atas tampak bahwa nilai

Asymp.Sig.(2-tailed) adalah 0.105. jadi, Asymp.Sig.(2-tailed)> 𝛼.

Dengan demikian berarti 𝐻0 diterima. Jadi, dapat disimpulkan bahwa data

berdistribusi Poisson.

2. Pemodelan Regresi Poisson

Setelah melakukan pengolahan data menggunakan program R diperoleh nilai

untuk parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4 pada tabel 3.3 berikut:


84

Table 3.3 Parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4 untuk Regresi Poisson

parameter estimasi standar error

𝛽0 1.248 0.371

𝛽1 0.001 0.000

𝛽2 -0.269 0.119

𝛽3 0.000 0.000

𝛽4 -0.000 0.000

Jadi, model regresi Poisson yang dihasilkan adalah

�̂�𝑖 = exp(1.248 + 0.001𝑥1𝑖 − 0.269𝑥2𝑖 + 0.000𝑥3𝑖 − 0.000𝑥4𝑖)


Selanjutnya dilakukan pengujian signifikansi masing-masing parameter dari

model regresi Poisson.

Hipotesis:

𝐻0: 𝛽𝑗 = 0

𝐻1: 𝛽𝑗 ≠ 0

Statistik uji:

𝑊𝑗 = [�̂�𝑗

𝑠𝑒(�̂�𝑗)]

2

Sehingga berdasarkan persamaan diatas diperoleh

1. 𝑊1 = [�̂�1

𝑠𝑒(�̂�1)]2

= [0.0007625

0.0001527]2

= 24.934555

2. 𝑊2 = [�̂�2

𝑠𝑒(�̂�21)]2

= [−0.26989957

0.119]2

= 5.144112586


85

3. 𝑊3 = [�̂�2

𝑠𝑒(�̂�21)]2

= [0.0002018

0.00007624]2

= 7.006103496

4. 𝑊4 = [�̂�2

𝑠𝑒(�̂�21)]2

= [−0.00004211

0.00002318]2

= 3.30022553

Berdasarkan tabel chi-squares dengan tingkat signifikansi 0.05 dan

derajat bebas 3 diperoleh nilai 𝜒0.05,32 = 7.81473 sehingga

1. 𝑊1 = 24.934555 > 𝜒0.05,32 = 7.81473 maka 𝐻0 ditolak

2. 𝑊2 = 5.144112586 < 𝜒0.05,32 = 7.81473 maka 𝐻0 diterima



Artinya pada tingkat signifikansi 0.05 𝑥1 memiliki kontribusi terhadap

𝑌 sedangkan 𝑥1, 𝑥2 dan 𝑥3 tidak memiliki kontribusi terhadap 𝑌

5. Uji overdispersi pada model Regresi Poisson

Uji overdispersi dapat dilihat berdasarkan nilai Devians. Berikut ad

Lah langkah-langkah pengujian overdispersi

a. Perumusan Hipotesis

𝐻0: tidak terdapat overdispersi pada model regresi Poisson

𝐻1: terdapat overdispersi pada model Regresi Poisson

b. Statistik uji

𝜙1 =2∑ {𝑦𝑖𝑙𝑛 (

𝑦𝑖

�̂�𝑖) − (𝑦𝑖 − �̂�𝑖)}

𝑛𝑖=1

𝑑𝑏

Dengan n adalah banyaknya pengamatan dan k adalah banyaknya parameter

termasuk konstanta.


86

c. Kriteria pengujian

𝐻0 ditolak bila 𝜙1 > 1

d. Perhitungan

Perhitungan nilai 𝜙1 pada skripsi ini menggunakan program R dan diperoleh

𝜙1 = 5.721

e. Kesimpulan

𝜙1 =2∑ {𝑦𝑖𝑙𝑛(

𝑦𝑖�̂�𝑖

)−(𝑦𝑖−�̂�𝑖)}𝑛𝑖=1

𝑑𝑏=

62.932

11= 5.721 > 1 maka 𝐻0 ditolak artinya

model regresi Poisson mengalami overdispersi sehingga hasil analisa regresi

Poisson pada langkah 4 tidak dapat digunakan. Oleh karena itu, analisis regresi

yang tepat untuk memodelkan data banyaknya kasus campak pada 16

Kecamatan di Kota Semarang adalah menggunakan analisis Regresi Binomial

Negatif.

6. Regresi Binomial Negatif

Setelah melakukan pengolahan data menggunakan program R diperoleh

nilai untuk parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4 pada tabel 3.4 berikut:

Tabel 3.4 Parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4 untuk Regresi Binomial Negatif

Parameter estimasi standar error

𝛽0 1.224 0.674

𝛽1 0.001 0.000

𝛽2 -0.346 0.251

𝛽3 0.000 0.000

𝛽4 -0.000 0.000

Jadi, model regresi Binomial Negatif yang dihasilkan adalah

�̂�𝑖 = exp(1.224 + 0.001𝑥1𝑖 − 0.346𝑥2𝑖 + 0.000𝑥3𝑖 − 0.000𝑥4𝑖)


87

7. Uji signifikan model Regresi Binomial Negatif

hipotesisnya adalah:

𝐻0: 𝛽1 = 𝛽𝑗

𝐻1: ∃𝛽𝑗 ≠ 0 ; j = 1,2


𝐿𝑅 = −2{𝑙𝑜𝑔�̂�0 − 𝑙𝑜𝑔�̂�1} = −2(−101.289 + 95.305 ) = 11.968

Berdasarkan tabel chi-squares dengan tingkat signifikansi 0.05 dan

derajat bebas 4 diperoleh nilai 𝑋(0.05,4)2 = 9.48773. nilai 𝐿𝑅 = 11.968 > 𝑋(0.05,2)

2 =

9.48773, maka 𝐻0 ditolak pada tingkat signifikansi 0.05 sehingga model Binomial

negatif dapat digunakan untuk menggambarkan hubungan antara banyaknya kasus

penyakit campak pada 16 Kecamatan di Kota Semarang dengan imunisasi,

banyaknya puskesmas, keluarga miskin dan kepadatan penduduk.

Jadi, model regresi Binomial Negatif yang terbentuk adalah

�̂�𝑖 = exp(1.224 + 0.001𝑥1𝑖 − 0.346𝑥2𝑖 + 0.000𝑥3𝑖 − 0.000𝑥4𝑖)


88

BAB IV

PEMODELAN REGRESI BINOMIAL NEGATIF PADA DATA BANYAKNYA

KEMATIAN IBU DI PROPINSI JAWA TIMUR TAHUN 2012

Pada Bab ini akan dibahas suatu masalah nyata tentang banyaknya kematian

ibu di Propinsi Jawa Timur pada tahun 2012 di setiap Kabupaten. Undang-undang

nomor 36 tahun 2009 tentang kesehatan mengamanatkan bahwa upaya kesehatan ibu

ditujukan untuk menjaga kesehatan ibu sehingga mampu melahirkan generasi yang

sehat dan berkualitas, serta dapat mengurangi angka kematian ibu sebagai salah satu

indicator Renstra dan MDGs.

Kegiatan kesehatan ibu dan anak (KIA) merupakan kegiatan prioritas

mengingat terdapat indikator dampak yaitu angka kematian Ibu (AKI) dan angka

kematian Bayi (AKB) yang merupakan indikator keberhasilan pembangunan daerah,

khususnya pembangunan kesehatan. Untuk melihat kinerja kesehatan ibu dan anak,

maka perlu untuk melihat secara keseluruhan indikator kesehatan ibu dan anak, yaitu:

1. Cakupan pelayanan ibu hamil K1

2. Cakupan pelayan ibu hamil K4

3. Cakupan pertolongan persalinan oleh tenaga kesehatan

4. Cakupan komplikasi kebidanan ditangani

5. Cakupan pelayanan nifas


89

6. Pelayan imunisasi dan lainnya

Angka kematian ibu merupakan jumlah kematian ibu yang terjadi karena proses

kehamilan, persalinan dan nifas. Angka kematian ibu dalam Profil Dinas Kesehatan

Propinsi Jawa Timur Tahun 2012 merupakan data yang berbentuk count. Distribusi

Poisson merupakan distribusi variabel random diskrit namun untuk suatu peristiwa

yang jarang terjadi. Kematian ibu merupakan suatu kejadian yang jarang terjadi. Angka

kematian Ibu di propinsi Jawa Timur tahun 2012 mempunyai indikasi overdispersi

sehingga data angka kematian Ibu di Propinsi Jawa Timur dapat dimodelkan dengan

menggunakan model Regresi Binomial Negatif.

Berikut adalah variabel yang digunakan dalam penelitian yaitu:

1. Variabel dependen

Variabel dependen dalam penelitian ini adalah banyaknya kematian Ibu di Propinsi

Jawa Timur tahun 2012 pada 38 Kabupaten/kota.

2. Variabel independen

Adapun beberapa variabel independen dalam penelitian ini adalah:

1) Jumlah cakupan imunisasi Tetanus Toksoid (TT2+) pada ibu hamil (𝑋1)

𝑋1 adalah proses membangun kekebalan sebagai upaya pencegahan terhadap

infeksi tetanus yang diberikan setelah 4 minggu kehamilan.

2) Jumlah ibu hamil yang mendapatkan tablet FE1 (30 tablet) (𝑋2)

𝑋2 pemberian tablet besi pada Ibu hamil sebanyak 30 tablet

3) Jumlah ibu hamil yang mendapatkan tablet FE3 (90 tablet) (𝑋3)


90

𝑋3 pemberian tablet besi pada Ibu hamil sebanyak 90 tablet

4) Jumlah cakupan imunisasi Tetanus Toksoid (TT-5) pada ibu hamil (𝑋4)

𝑋1 adalah proses membangun kekebalan sebagai upaya pencegahan terhadap

infeksi tetanus yang diberikan 1 tahun setelah TT-4.

5) Cakupan K1 (𝑋5)

𝑋5 adalah cakupan pelayanan antenatal yang dipantau melalui pelayanan

kunjungan baru Ibu hamil.

6) Cakupan K4 (𝑋6)

𝑋6 adalah cakupan pelayanan antenatal yang dipantau melalui pelayanan

kunjungan baru Ibu hamil sebanyak 4 × yaitu sekali pada triwulan pertama,

sekali pada triwulan dua, dan 2 × pada triwulan ketiga.

7) Cakupan ibu bersalin yang ditolong nakes (𝑋7)

𝑋7 merupakan proses pelayanan persalinan oleh dokter spesialis kebidanan

dan kandungan, dokter umum, dan bidan yang dimulai pada kala I sampai

dengan kala IV persalinan.

8) Jumlah Ibu nifas (𝑋8)

𝑋8 merupakan masa sesudah persalinan, masa perubahan, pemulihan, dan

penyembuhan. Lamanya masa nifas adalah berkisar antara 6 minggu atau 40

hari.


91

A. Deskripsi Data

Untuk melihat karakteristik dari masing-masing variabel maka ditampilkan

statistika deskriptif yang dapat dilihat pada tabel 4.1 berikut ini:

Tabel 4.1 Deskripsi Data

variabel N minimum maksimum Mean Std.deviasi variansi

𝑌 38 0.00 14.00 3.8900 3.56200 12.691

𝑋1 38 0.00 986.54 79.8771 234.41978 54952.634

𝑋2 38 67.68 107.42 86.7918 8.53393 72.828

𝑋3 38 65.37 106.44 80.4603 8.57757 73.575

𝑋4 38 0.00 235.13 11.4742 41.12683 1691.416

𝑋5 38 75.18 108.57 91.5611 8.06932 65.114

𝑋6 38 70.67 101.55 84.0605 7.41634 55.002

𝑋7 38 75.02 101.41 88.9408 6.78990 46.103

𝑋8 38 74.42 100.80 87.5224 7.03324 49.466

B. Pengolah Data

Data pada lampiran 7 merupakan data banyaknya kematian Ibu di Propinsi

Jawa Timur yang diambil dari Profil Dinas Kesehatan Propinsi Jawa Timur Tahun

2012.

Langkah-langkah analisis data mengikuti tahap-tahap berikut:

1. Uji Kolmogorov-Smirnov

2. Pendugaan Model Regresi Poisson


4. Uji overdispersi pada Model Regresi Poisson


6. Uji signifikansi Model Regresi Binomial Negatif


92

Berikut adalah langkah-langkah pendugaan parameter-parameter dari model regresi

Binomial Negatif:

1. Uji Kolmogorov-smirnov

Tujuan dari Uji Kolmogorov-Smirnov adalah untuk menentukan apakah data

banyaknya kematian Ibu di Propinsi Jawa Timur tahun 2012 pada 38 Kabupaten/kota

mengikuti distribusi Poisson atau tidak.

Langkah-langkah uji Kolmogorov-Smirnov untuk distribusi Poisson adalah

sebagai berikut

1) 𝐻0 = data berdistribusi Poisson


2) Tingkat signifikansi 𝛼 = 0.05

3) Daerah penolakan



93

Table 4.2 hasil pengujian Kolmogorov-Smirnov


Y

N 38


Most Extreme

Differences

Absolute .216

Positive .216

Negative -.111





4) Dari hasil uji Kolmogorov-Smirnov di atas tampak bahwa nilai Asymp.Sig.(2-

tailed) adalah 0.057. jadi, Asymp.Sig.(2-tailed)> 𝛼. Dengan demikian berarti

𝐻0 diterima. Jadi, dapat disimpulkan bahwa data berdistribusi Poisson.

2. Pemodelan Regresi Poisson

Setelah melakukan pengolahan data menggunakan program R diperoleh nilai untuk

parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4, 𝛽5, 𝛽6, 𝛽7, 𝛽8 pada tabel 4.3 berikut:

Table 4.3 parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4, 𝛽5, 𝛽6, 𝛽7, 𝛽8 untuk Regresi Poisson


𝛽0 −0.016 1.2678

𝛽1 0.001 0.0003

𝛽2 −0.028 0.0308

𝛽3 0.050 0.0309

𝛽4 −0.009 0.0039

𝛽5 0.170 0.0379

𝛽6 −0.045 0.0243

𝛽7 −0.103 0.0501

𝛽8 −0.034 0.0441


94

Jadi, model regresi Poisson yang dihasilkan adalah

�̂�𝑖 = exp(−0.016 + 0.001𝑥1𝑖 − 0.028𝑥2𝑖 + 0.050𝑥3𝑖 − 0.009𝑥4𝑖 + 0.170𝑥5𝑖

− 0.045𝑥6𝑖 − 0.103𝑥7𝑖 − 0.034𝑥8𝑖)

3. Uji Signifikansi Parameter

Selanjutnya dilakukan pengujian signifikansi masing-masing parameter dari

model regresi Poisson.

Hipotesis:

𝐻0: 𝛽𝑗 = 0

𝐻1: 𝛽𝑗 ≠ 0

Statistik uji:

𝑊𝑗 = [�̂�𝑗

𝑠𝑒(�̂�𝑗)]

2

Sehingga berdasarkan persamaan diatas diperoleh

1. 𝑊1 = [�̂�1

𝑠𝑒(�̂�1)]

2

= [0.001

0.0003]

2

= 11.1111

2. 𝑊2 = [�̂�2

𝑠𝑒(�̂�21)]

2

= [−0.028

0.0308]

2

= 0.8264

3. 𝑊3 = [�̂�2

𝑠𝑒(�̂�21)]

2

= [0.050

0.0309]

2

= 2.6183

4. 𝑊4 = [�̂�2

𝑠𝑒(�̂�21)]

2

= [−0.009

0.0039]

2

= 5.3254

5. 𝑊5 = [�̂�2

𝑠𝑒(�̂�21)]

2

= [0.170

0.0379]

2

= 20.1196


95

6. 𝑊6 = [�̂�2

𝑠𝑒(�̂�21)]

2

= [−0.045

0.0243]

2

= 3.4293

7. 𝑊7 = [�̂�2

𝑠𝑒(�̂�21)]

2

= [−0.103

0.0501]

2

= 4.2267

8. 𝑊8 = [�̂�2

𝑠𝑒(�̂�21)]

2

= [−0.034

0.0441]

2

= 0.5944

Berdasarkan tabel Chi-squares dengan tingkat signifikansi 0.05 dan derajat

bebas 7 diperoleh nilai 𝜒0.05,72 = 14.0671 sehingga





5. 𝑊5 = 20.1196 > 𝜒0.05,72 = 14.0671 maka 𝐻0 dtolak




Artinya pada tingkat signifikansi 0.05 𝑥1, 𝑥2, 𝑥3, 𝑥4, 𝑥6, 𝑥7, 𝑥8 tidak

memiliki kontribusi terhadap 𝑌 sedangkan 𝑥5 memiliki kontribusi terhadap

𝑌. Namun analisis pada Regresi Poisson belum bisa digunakan karena

belum diuji asumsi equidispersi. Oleh karena itu, maka pada langkah

selanjutnya akan diuji asumsi equidispersi.


96

9. Uji overdispersi pada model Regresi Poisson

Uji overdispersi dapat dilihat berdasarkan nilai Devians. Berikut adalah

langkah-langkah pengujian overdispersi

a. Perumusan Hipotesis

𝐻0: tidak terdapat overdispersi pada model regresi Poisson

𝐻1: terdapat overdispersi pada model Regresi Poisson

b. Statistik uji

𝜙1 =2 ∑ {𝑦𝑖𝑙𝑛 (

𝑦𝑖

�̂�𝑖) − (𝑦𝑖 − �̂�𝑖)}𝑛

𝑖=1

𝑑𝑏

Dengan n adalah banyaknya pengamatan dan k adalah banyaknya parameter

termasuk konstanta.

c. Kriteria pengujian

𝐻0 ditolak bila 𝜙1 > 1

d. Perhitungan

Perhitungan nilai 𝜙1 pada skripsi ini menggunakan program R dan diperoleh 𝜙1 =

1.766758621

e. Kesimpulan

𝜙1 =2 ∑ {𝑦𝑖𝑙𝑛(

𝑦𝑖�̂�𝑖

)−(𝑦𝑖−�̂�𝑖)}𝑛𝑖=1

𝑑𝑏=

81.985

29= 2.827 > 1 maka 𝐻0 ditolak artinya model

regresi Poisson mengalami overdispersi sehingga hasil analisa regresi Poisson pada

langkah 4 tidak dapat digunakan. Oleh karena itu, analisis regresi yang tepat untuk


97

memodelkan jumlah kematian ibu di Propinsi Jawa Timur pada 38 kabupaten/kota

adalah menggunakan analisis Regresi Binomial Negatif.


Setelah melakukan pengolahan data menggunakan program R diperoleh nilai

untuk parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4, 𝛽5, 𝛽6, 𝛽7, 𝛽8 pada tabel 4.4 berikut:

tabel 4.4 parameter 𝛽0, 𝛽1, 𝛽2, 𝛽3, 𝛽4, 𝛽5, 𝛽6, 𝛽7, 𝛽8 untuk Regresi

Binomial Negatif


𝛽0 −0.851 1.886

𝛽1 0.001 0.001

𝛽2 −0.026 0.046

𝛽3 −0.009 0.046

𝛽4 0.192 0.005

𝛽5 −0.045 0.058

𝛽6 −0.105 0.037

𝛽7 −0.105 0.073

𝛽8 −0.049 0.063 Jadi, model regresi Binomial Negatif yang dihasilkan adalah

�̂�𝑖 = exp(−0.851 + 0.001𝑥1 − 0.026𝑥2 − 0.009𝑥3 + 0.192𝑥4 − 0.045𝑥5

− 0.105𝑥6 − 0.105𝑥7 − 0.049𝑥8)

11. Uji signifikan model Regresi Binomial Negatif

Hipotesisnya adalah:

𝐻0: 𝛽1 = 𝛽2 = 0

𝐻1: ∃𝛽𝑗 ≠ 0 ; j = 1,2


98


𝐿𝑅 = −2{𝑙𝑜𝑔�̂�0 − 𝑙𝑜𝑔�̂�1} = −2(−187.326 + 171.118) = 32.416

Berdasarkan tabel Chi-squares dengan tingkat signifikansi 0.05 dan derajat bebas 8

diperoleh nilai 𝑋(0.05,8)2 = 15.5073. nilai 𝐿𝑅 = 32.416 > 𝑋(0.05,2)

2 = 15.5073, maka 𝐻0

ditolak pada tingkat signifikansi 0.05 sehingga model Binomial negatif dapat

digunakan untuk menggambarkan hubungan antara jumlah kematian ibu di Propinsi

Jawa Timur pada 38 Kabupaten/kota dengan Jumlah cakupan imunisasi Tetanus

Toksoid (TT2+) pada ibu hamil (𝑋1), Jumlah ibu hamil yang mendapatkan tablet

FE1 (30 tablet) (𝑋2), Jumlah ibu hamil yang mendapatkan tablet FE3 (90 tablet)

(𝑋3), Jumlah cakupan imunisasi Tetanus Toksoid (TT-5) pada ibu hamil (𝑋4),

Cakupan K1 (𝑋5), Cakupan K4 (𝑋6), Cakupan ibu bersalin yang ditolong nakes

(𝑋7), dan Jumlah Ibu nifas (𝑋8)

Jadi, model regresi Binomial Negatif yang terbentuk adalah

�̂�𝑖 = exp(−0.851 + 0.001𝑥1𝑖 − 0.026𝑥2𝑖 − 0.009𝑥3𝑖 + 0.192𝑥4𝑖 − 0.045𝑥5𝑖

− 0.105𝑥6𝑖 − 0.105𝑥7𝑖 − 0.049𝑥8𝑖)

Berikut adalah contoh interpretasi parameter 𝛽1, 𝛽2, 𝛽3, dan 𝛽4 dari model Regresi

Binomial Negatif:

1) Interpretasi 𝛽1 = 0.001

Untuk setiap kenaikan 1 persen 𝑋1, dengan asumsi nilai variabel lainnya tetap,

maka rata-rata 𝑌 (jiwa) akan berlipat 𝑒0.001 ≈ 1.001 kali artinya tidak ada

perubahan yang berarti.


99

2) Interpretasi 𝛽2 = −0.026


maka 𝑌 (jiwa) cenderung berkurang sebesar exp (−0.026) kali.



maka rata-rata 𝑌 cenderung berkurang sebesar exp (−0.009) kali.

4) Interpretasi 𝛽4 = 0.192


maka rata-rata 𝑌 akan berlipat e0.192 kali.














100

BAB V

KESIMPULAN DAN SARAN

A. Kesimpulan

Data count adalah data hasil percobaan acak yang nilai-nilainya merupakan

bilangan bulat non-negatif. Distribusi yang biasa digunakan untuk memodelkan data

count adalah distribusi Poisson yang memiliki asumsi mean dan variansi yang sama.

Saat terjadi overdispersi, yaitu keadaan dimana variansi lebih besar dari nilai mean,

maka asumsi mean dan variansi pada distribusi Poisson tidak lagi terpenuhi. Oleh

karena itu, diperlukan distribusi lain untuk menganalisis data count tersebut yaitu

model regresi Binomial Negatif.

Pada model regresi Binomial negatif, variabel dependen diasumsikan

berdistribusi Binomial Negatif. Binomial Negatif yang digunakan merupakan

distribusi campuran antara distribusi Poisson dan Gamma.

Pendugaan parameter-parameter dalam model regresi Binomial Negatif

dilakukan dengan metode Pendugaan Kemungkinan Maksimum. Solusi dari

persamaan log-likelihood diperoleh dengan menggunakan metode Newon-Raphson

karena persamaan log-likelihood yang diperoleh tidak linear dalam parameternya.

Model untuk Regresi Binomial Negatif pada data banyaknya kematian Ibu di

Provinsi Jawa Timur pada tahun 2012 adalah sebagai berikut:


101

�̂�𝑖 = exp(−0.851 + 0.001𝑥1𝑖 − 0.026𝑥2𝑖 − 0.009𝑥3𝑖 + 0.192𝑥4𝑖 − 0.045𝑥5𝑖

− 0.105𝑥6𝑖 − 0.105𝑥7𝑖 − 0.049𝑥8𝑖)

B. Saran

Saran untuk pengembangan skripsi ini adalah membahas metode lain untuk

menangani overdispersi pada data Poisson, seperti metode Quasi-Poisson, metode

Binomial Negatif umum (NB-P), generalized Poisson Regression.

Selain metode pendugaan kemungkinan maksimum, pendugaan parameter

dari distribusi Binomial Negatif dapat dilakukan dengan metode lain diantaranya

adalah metode Quasi likelihood dan metode pendugaan kemungkinan maksimum

Bootstrapped dan metode pendugaan parameter moment.


102

DAFTAR PUSTAKA

Agresti, A. (2007). An Introduction to Categorical Data Analysis. New York: John

Wiley & Sons.

Agresti, A. (2002). Categorical Data Analysis. Second Edition. New York: John Wiley

& Sons.

Barnon, N. D. (1992). The Analysis of Count Data: Overdispersion and

Autocorrelation. American Sociological Association. 22: 179-220.

Berk, R., MacDonald, J. M. (2008). Overdispersion and Poisson Regression.

Philadelphia: Springer.

Brown, D. L., Zhau, H. Linda. (2002). A Test for the Poison Distribution. The Indian

Journal of statistics. 64: 611-625.

Cahyandari, R. (2014). Pengujian Overdispersi pada Model Regresi Poisson. Statistika.

14 (2): 69-76.

Cameron, A. C., Trivedi, P. K. (1998). Regression Analysis of Count Data. New York:

Cambridge University Press.

Clark, R. D., et all. (2004). A Primer on the Exponential Family of Distributions.

Lecture note.

Cook, J. D. (2009). Notes on the Negative Binomial Distribution. Lecture note.


103

Diaconis, P., Yivisaker, D. (1979). Conjugate Priors for Exponential Families. The

annals of statistics. 7 (2): 269-281.

Dinas Kesehatan Provinsi Jawa Timur. Profil Kesehatan Provinsi Jawa Timur 2012.

Surabaya: Dinas Kesehatan Propinsi Jawa Timur, 2013.

Gelhan, Andrew, et all (2007). Data Analysis Using Regression and

Multilevel/Hierarchical Models. Cambridge: Cambridge University

Press.

Hilbe, J. M. (2011). Negative Binomial Regression. Second Edition. Cambridge:

Cambridge University Press.

Hilbe, J. M. (2014). Modeling Count Data. New York: Cambridge University Press.

Ismail, N., Jemain, A. A. (2007). Handling Overdispersion with Negative Binomial and

Generalzed Poisson Regression Models. Virgina: Casualty Actuarial

Society Forum.

Johnson, N. L., et all. (1992). Univariate Discrete Distribution. New York: The Willey

Interscience Publication.

Kothari, R. C. (2004). Research Methodology Methods & Techniques. New Delhi: New

Age International.

Lawal, B. (2003). Categorical Data Analysis with SAS and SPSS Application. London:

Lawrence Erlbaum Associates.


104

Lawless, F. J. (1987). Negative Binomial and Mixed Poisson Regression. The

Canadian Journal of statistics. 15 (3): 209-225.

Lord, D., Park, J. B. Negative Binomial Regression Models and Estimation Methods.

Lecture note.

McCullagh, P., Nelder, J. A. (1989). Generalized Linear Models. London: Chapman

and Hall.

Muntafiah, Rena, et all. (2014). Pemodelan Regresi Binomial Negatif untuk Mengatasi

Overdispersion pada Regresi Poisson. Statistika. 2 (1).

Ruliana. 2015. Pemodelan Generalized Poisson Regression (GPR) untuk mengatasi

pelanggaran Equidispersion pada Regresi Poisson kasus Campak di kota

Semarang. Skirpsi.

Utami, W. T. (2013). Analisis Regresi Binomial Negatif untuk Mengatasi

Overdispersion Regresi Poisson pada kasus demam berdarah dengue.

Statistika. 1 (2).

Winkelmann, R. (2008). Econometric Analysis of Count Data. New York: Springer.

Zeileis, Achim., et all. (2008). Regression Models for Count Data in R. Journal of

statistical Software. 27 (8).


105

LAMPIRAN

Lampiran 1

Penyelesaian contoh 2.2 dengan menggunakan program R

> ##Metode Newton-Raphson

> Newton=function(f,tol=1e-12,x0=1, N=100){

+ h=1e-12

+ i=1;x1=x0

+ p=numeric(N)

+ while(i<=N){

+ df.dx=(f(x0+h)-f(x0))/h

+ x1=(x0-(f(x0)/df.dx))

+ p[i]=x1

+ i=i+1

+ if(abs(x1-x0)<tol)break

+ x0=x1

+ }

+ return(p[1:(i-1)])

+ }

> ##contoh soal menggunakan Newton-Raphson

> f=function(x){x^3-x-1}


106

> h=1e-12

> df.dx=function(x){(f(x+h)-f(x))/h}

> df.dx(1);df.dx(2)

[1] 2.000178

[1] 11.00098

> app=Newton(f,tol=1e-12,x0=1)

> app

[1] 1.499956 1.347828 1.325204 1.324718 1.324718 1.324718 1.324718

##hasil dari app di atas menunjukan bahwa x1=1.499956, x2=1.347828,

x3=1.325204, x4=1.324718, x5=1.324718, x6=1.324718, x7=1.324718 dan akar dari

persamaan x^3-x-1=0 adalah 1.324718

Lampiran 2

Uji Kolmogorov-Smirnov untuk contoh 2.2


Data

N 16


Most Extreme

Differences

Absolute .247

Positive .247

Negative -.117

Kolmogorov-Smirnov Z .990





107

Lampiran 3

Data banyaknya kasus campak pada 16 kecamatan di kota Semarang

Kecamatan 𝑌 𝑋1 𝑋2 𝑋3 𝑋4

Mijen 2 955 2 725 1006

Gunungpati 12 1094 2 1776 1402

Banyumanik 8 2692 4 236 5080

Gajah Mungkur 2 855 1 1343 7012

SemarangSelatan 22 2129 2 1313 13882

Candisari 11 1447 2 1550 12187

Tembalang 20 2574 3 3008 3339

Pedurungan 11 2873 2 1705 8549

Genuk 5 2028 2 201 3411

Gayamsari 1 1928 1 88 11939

Semarang Timur 7 1857 3 4603 10211

Semarang Utara 6 1882 2 3183 11671

SemarangTengah 2 1481 2 778 11596

Semarang Barat 1 2340 5 2660 7298

Tugu 4 539 2 1236 984

Ngaliyan 23 2511 3 2113 3226


108

Lampiran 4

Uji Kolmogorov-Smirnov untuk variabel dependent contoh 3.1


Data Campak

N 16


Most Extreme

Differences

Absolute .304

Positive .304

Negative -.187





Lampiran 5

Pemodelan Regresi Poisson pada data banyaknya kasus campak pada 16 kecamatan di

kota Semarang

> data_campak=read.csv(file.choose())

> data_campak

> Y=data_campak[,1]

> X1=data_campak[,2]





109

> Regresi_Poisson=glm(Y~X1+X2+X3+X4, family=poisson)

> summary(Regresi_Poisson)

Call:

glm(formula = Y ~ X1 + X2 + X3 + X4, family = poisson)

Deviance Residuals:

Min 1Q Median 3Q Max

-2.8844 -1.4262 -1.2431 0.9236 4.2930

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) 1.248e+00 3.706e-01 3.368 0.000757 ***

X1 7.625e-04 1.527e-04 4.994 5.9e-07 ***

X2 -2.699e-01 1.190e-01 -2.269 0.023268 *

X3 2.018e-04 7.624e-05 2.647 0.008115 **

X4 -4.211e-05 2.318e-05 -1.817 0.069268 .

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for poisson family taken to be 1)

Null deviance: 94.345 on 15 degrees of freedom

Residual deviance: 62.932 on 11 degrees of freedom

AIC: 130.52

Number of Fisher Scoring iterations: 5


110

Lampiran 6

Pemodelan Regresi Binomial Negatif pada data banyaknya kasus campak pada 16

kecamatan di kota Semarang

> library(MASS)

> Regresi_Binomial_Negatif=glm.nb(Y~X1+X2+X3+X4)

> summary(Regresi_Binomial_Negatif)

Call:

glm.nb(formula = Y ~ X1 + X2 + X3 + X4, init.theta = 2.49970112,

link = log)

Deviance Residuals:


-1.8691 -0.8137 -0.6142 0.3736 1.6968

Coefficients:


(Intercept) 1.224e+00 6.741e-01 1.815 0.0695 .

X1 8.193e-04 3.383e-04 2.422 0.0154 *

X2 -3.458e-01 2.509e-01 -1.378 0.1682

X3 2.255e-04 1.661e-04 1.357 0.1747

X4 -3.428e-05 4.785e-05 -0.717 0.4737

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


111

(Dispersion parameter for Negative Binomial(2.4997) family taken to be 1)



AIC: 107.31


Theta: 2.50

Std. Err.: 1.19

2 x log-likelihood: -95.305


112

Lampiran 7

Pemodelan Regresi Binomial Negatif tanpa variabel independent pada data banyaknya

kasus campak pada 16 kecamatan di kota Semarang

> regresi_Binomial_Negatif=glm.nb(Y~1)

> summary(regresi_Binomial_Negatif)

Call:

glm.nb(formula = Y ~ 1, init.theta = 1.577483673, link = log)

Deviance Residuals:


-1.6631 -1.2795 -0.3037 0.3317 1.3905

Coefficients:


(Intercept) 2.1474 0.2166 9.914 <2e-16 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1




AIC: 105.29


Theta: 1.577


113

Std. Err.: 0.645


Lampiran 8

Data banyaknya kematian Ibu di Propinsi Jawa Timur tahun 2012

𝑌 𝑋1 𝑋2 𝑋3 𝑋4 𝑋5 𝑋6 𝑋7 𝑋8

4 0.00 74.61 70.87 0.00 96.78 90.01 92.59 92.26

1 11.19 76.06 76.42 1.53 83.6 77.51 80.76 80.84

2 0.00 102.42 84.6 0.00 103.37 83.64 98.88 97.33

0 0.00 88.53 83.94 0.00 91.66 85.04 89.57 86.38

4 0.00 86.57 79.75 0.00 91.15 84.42 89.26 89.39

7 6.23 89.41 84.56 0.00 95.38 90.79 92.42 88.78

8 23.05 92.39 88.96 12.78 98.16 94.62 93.07 90.69

1 0.00 103.44 95.63 0.00 102.45 91.41 100.83 96.04

13 0.00 87.82 81.58 0.00 89.3 70.67 85.15 85.63

2 0.00 88.07 81.32 0.00 88.43 79.89 87.04 88.06

6 1.03 96.03 86.24 0.20 96.07 91.61 90.8 95.68

8 0.00 79.7 72.41 0.00 87.05 75.21 82.08 81.11

7 0.00 91.69 79.95 0.00 91.69 79.41 87.23 86.97

10 0.00 90.65 80.43 0.00 89.32 82.8 86.02 82.38

2 0.00 81.54 75.83 0.00 83.83 80.87 84.94 77.53

5 0.00 80.22 73.87 0.00 89.23 78.89 86.56 84.18

6 26.3 91.97 86.85 12.19 92.18 86.56 90.33 90.58

5 0.00 86 81.04 0.00 90.5 84.46 93.32 86.37

2 0.15 74.52 71.74 0.06 78.45 73.31 75.06 74.42

0 52.91 77.36 74.28 13.17 85.87 82.04 85.52 83.79

5 12.68 95.03 92.26 4.37 95.03 92.26 93.92 92.32

3 40.55 99.07 88.98 13.14 103.6 92.45 98.4 95.37

7 986.54 90.32 87.93 9.68 89.98 87.47 93.76 91.22

5 0.00 86.85 84.88 0.00 108.57 101.55 101.41 100.8


114

5 0.00 88.73 83.12 0.00 91.03 82.52 88.96 87.33

3 53.32 80.32 72.85 11.37 103.78 93.98 98.98 99.57

5 0.00 79.87 65.37 0.00 106.7 83.72 96.65 100.43

3 1.81 87.59 81.9 0.68 95.4 90.3 90.74 88.5

1 596.78 80.1 70.78 235.13 88.95 76.05 86.95 87.7

1 5.73 67.68 66.51 1.38 75.18 75.15 75.02 74.75

0 0.00 78.43 73.07 0.00 79.99 73.53 82.45 79.54

1 0.00 107.42 106.44 0.00 78.44 73.25 79.99 80.22

2 250.27 87.06 76.89 105.81 96.04 89.11 88.88 85.57

0 0.00 83.16 68.5 0.00 95.22 90.47 93.51 93.48

0 28.17 85.57 76.74 14.09 83.01 77.58 80.62 78.9

0 3.28 95.39 92.21 0.07 95.39 92.21 95.57 92.52

14 934.87 85.36 83.55 0.04 87.4 84.69 81.24 78.88

0 0.47 81.14 75.24 0.33 81.14 74.85 81.27 80.34

Lampiran 9

Uji Kolmogorov-Smirnov untuk banyaknya kematian Ibu di propinsi Jawa timur tahun 2012


Y

N 38


Most Extreme

Differences

Absolute .216

Positive .216

Negative -.111






115

Lampiran 10

Pemodelan Regresi Poisson pada data banyaknya kematian Ibu di Propinsi Jawa Timur

tahun 2012

> data=read.csv(file.choose())

> data

> Y=data[,1]

> X1=data[,2]

> X2=data[,3]

> X3=data[,4]

> X4=data[,5]

> X5=data[,6]

> X6=data[,7]

> X7=data[,8]

> X8=data[,9]

> Regresi_Poisson=glm(Y~X1+X2+X3+X4+X5+X6+X7+X8, family=poisson)

> summary(Regresi_Poisson)

Call:

glm(formula = Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8, family = poisson)

Deviance Residuals:


-2.7128 -1.6982 -0.4699 1.0928 2.7845

Coefficients:


116


(Intercept) -0.0157082 1.2678450 -0.012 0.990115

X1 0.0011083 0.0003005 3.688 0.000226 ***

X2 -0.0280953 0.0308357 -0.911 0.362227

X3 0.0504269 0.0308850 1.633 0.102526

X4 -0.0086866 0.0039030 -2.226 0.026042 *

X5 0.1700451 0.0378694 4.490 7.11e-06 ***

X6 -0.0453599 0.0243296 -1.864 0.062266 .

X7 -0.1025708 0.0501153 -2.047 0.040688 *

X8 -0.0343675 0.0440876 -0.780 0.435669

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for poisson family taken to be 1)



AIC: 199.12



117

Lampiran 11

Pemodelan Regresi Binomial Negatif pada data banyaknya kematian Ibu di Propinsi Jawa

Timur tahun 2012

> library(MASS)

> Regresi_Binomial_Negatif=glm.nb(Y~X1+X2+X3+X4+X5+X6+X7+X8)


Call:

glm.nb(formula = Y ~ X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8, init.theta =

3.306785892, link = log)

Deviance Residuals:


-2.2197 -1.2097 -0.2982 0.6762 1.7235

Coefficients:


(Intercept) -0.8507402 1.8859419 -0.451 0.651921

X1 0.0013135 0.0005345 2.458 0.013990 *

X2 -0.0257783 0.0458529 -0.562 0.573982

X3 0.0516181 0.0457189 1.129 0.258885

X4 -0.0089608 0.0048721 -1.839 0.065882 .

X5 0.1919947 0.0581520 3.302 0.000961 ***

X6 -0.0452282 0.0371100 -1.219 0.222935

X7 -0.1054134 0.0730148 -1.444 0.148816


118

X8 -0.0487728 0.0633830 -0.769 0.441601

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1




AIC: 191.12


Theta: 3.31

Std. Err.: 1.69



119

Lampiran 12

Pemodelan Regresi Binomial Negatif tanpa variabel independent pada data banyaknya

kematian Ibu di Propinsi Jawa Timur tahun 2012

> Regresi_Binomial_Negatif=glm.nb(Y~1)


Call:

glm.nb(formula = Y ~ 1, init.theta = 1.414255469, link = log)

Deviance Residuals:


-1.9343 -1.0419 -0.2517 0.4290 1.7217

Coefficients:


(Intercept) 1.3596 0.1593 8.537 <2e-16 ***

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1




AIC: 191.33


Theta: 1.414

Std. Err.: 0.495



pendugaan model regresi binomial …. fungsi probabilitas ... c. momen dan fungsi pembangkit momen...

Documents