PEMODELAN KEMATIAN YANG DIAKIBATKAN OLEH
PEMBUNUHAN DAN BUNUH DIRI DI LITHUANIA
PADA TAHUN 2003-2004
RIDWAN FIRDAUS
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Pemodelan Kematian
yang Diakibatkan oleh Pembunuhan dan Bunuh Diri di Lithuania pada Tahun
2003-2004 adalah benar karya saya dengan arahan dari komisi pembimbing dan
belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, April 2014
Ridwan Firdaus
NIM G5408002
ABSTRAK
RIDWAN FIRDAUS. Pemodelan Kematian yang Diakibatkan oleh Pembunuhan
dan Bunuh Diri di Lithuania pada Tahun 2003-2004. Dibimbing oleh I WAYAN
MANGKU dan RUHIYAT.
Banyak permasalahan dalam kehidupan sehari-hari yang dapat dimodelkan
dengan suatu proses stokastik. Proses stokastik memegang peranan cukup penting,
salah satunya untuk memodelkan variasi geografis dari risiko kematian. Makalah
ini mempertimbangkan masalah numerik dari model pendekatan Bayes empiris
diterapkan pada estimasi tingkat kecil. Kondisi untuk nonsingularitas pendugaan
Bayes diberikan dan juga dikembangkan. Model Gauss-Poisson bisa digunakan
untuk kemungkinan peristiwa dalam populasi yang sama, jika penggerombolan
terdapat kemungkinan yang kecil. Jika ukuran populasi tidak diperhitungkan,
maka pendugaan risiko relatif (RR) yang hanya berdasarkan pada beberapa kasus
dapat menghasilkan peta yang tidak baik. Penduga Bayes empiris terbukti
memiliki kesalahan kuadrat lebih kecil daripada penduga RR. Pengintegralan dan
pemaksimuman fungsi likelihood dilakukan dengan menggunakan perangkat
lunak matematika. Pada karya ilmiah ini penulis mempelajari tulisan dari
Sakalauskas (2010) yang berjudul On the Empirical Bayesian Approach for the
Poisson-Gaussian Model.
Kata kunci: Bayes empiris, model Gauss-Poisson, pemodelan kematian
ABSTRACT
RIDWAN FIRDAUS. Modeling Homicide and Suicide Mortalities in Lithuania in
2003-2004. Supervised by I WAYAN MANGKU and RUHIYAT.
Many daily problems can be assumed as stochastic processes. Therefore
stochastic processes are very important subjects. One of them is modeling the
geographical variation of mortality risk. This paper considers numerical issues of
the empirical Bayesian approach model applied to the low rate estimation. The
condition for nonsingularity of Bayesian estimation is given and the convenient
iterative algorithm for the estimation is described. The clustering algorithm is also
developed. It uses the property of Poisson-Gaussian model to treat probabilities of
events in populations being the same, if the variance of probabilities is small. If
the population size is not taken into account, then the estimation of relative risk
(RR), which is only based on a few cases to produce a map, is not good. Empirical
Bayes estimation has been proven to have smaller squared error than that of RR
estimator. Integrating and maximizing likelihood functions is done by using a
mathematical software. This paper refers mainly to the paper of Sakalauskas
(2010) entitled On the Empirical Bayesian Approach for the Poisson-Gaussian
model.
Key words: Empirical Bayesian, mortality modeling, Poisson-Gaussian model
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Sains
pada
Departemen Matematika
PEMODELAN KEMATIAN YANG DIAKIBATKAN OLEH
PEMBUNUHAN DAN BUNUH DIRI DI LITHUANIA
PADA TAHUN 2003-2004
RIDWAN FIRDAUS
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
Judul Skripsi : Pemodelan Kematian yang Diakibatkan oleh Pembunuhan dan
Bunuh Diri di Lithuania pada Tahun 2003-2004
Nama : Ridwan Firdaus
NIM : G54080023
Disetujui oleh
Prof Dr Ir I Wayan Mangku, MSc
Pembimbing I
Ruhiyat, MSi
Pembimbing II
Diketahui oleh
Dr Toni Bakhtiar, MSc
Ketua Departemen
Tanggal Lulus:
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah Subhanahu Wa Ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Judul yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Maret 2012 ini ialah
Pemodelan Kematian yang Diakibatkan oleh Pembunuhan dan Bunuh Diri di
Lithuania pada Tahun 2003-2004
Terima kasih penulis ucapkan kepada Prof Dr Ir I Wayan Mangku, MSc dan
Ruhiyat, MSi selaku pembimbing, serta Dr Ir Hadi Sumarno MS yang telah
banyak memberi saran. Ungkapan terima kasih juga disampaikan kepada ayah,
ibu, serta seluruh keluarga, atas segala doa dan kasih sayangnya.
Semoga karya ilmiah ini bermanfaat.
Bogor, April 2014
Ridwan Firdaus
DAFTAR ISI
DAFTAR TABEL vi
DAFTAR LAMPIRAN vi
PENDAHULUAN 1
Latar Belakang 1
Tujuan 1
TINJAUAN PUSTAKA 2
Ruang Contoh, Kejadian dan Peluang 2
Peubah Acak dan Fungsi Sebaran 3
Nilai Harapan dan Ragam 4
Kekonvergenan Peubah Acak 5
Statistik, Penduga dan Sifat-sifatnya 5
Sebaran Prior dan Sebaran Posterior 6
Proses Stokastik 7
Proses Poisson 7
Metode Maximum Likelihood (ML) 8
HASIL DAN PEMBAHASAN 9
Model Gauss-Poisson 9
Turunan dari Fungsi Likelihood dan Persamaan Titik Tetap 10
Pendugaan Parameter Gauss dengan Metode “Iterasi Sederhana” 13
Aplikasi untuk Penggerombolan 13
Implementasi untuk Analisis Data 14
SIMPULAN 16
DAFTAR PUSTAKA 16
LAMPIRAN 18
RIWAYAT HIDUP 22
DAFTAR TABEL
1 Pendugaan Bayes empiris dari kematian akibat bunuh diri/pembunuhan
di Lithuania, 2003 15 2 Pendugaan Bayes empiris dari kematian akibat bunuh diri/pembunuhan
di Lithuania, 2004 15 3 Hasil Analisis Berdasarkan Data Pria Bunuh Diri di Lithuania Tahun
2003 untuk wilayah Shilutes d, Shirvintu d, Kaunas, dan Kauno d 16
DAFTAR LAMPIRAN
1 Bukti Teorema 1 18 2 Hasil Analisis Berdasarkan Data Pria Bunuh Diri di Lithuania Tahun
2003 20
1
PENDAHULUAN
Latar Belakang
Banyak permasalahan dalam kehidupan sehari-hari yang dapat dimodelkan
dengan suatu proses stokastik. Proses stokastik merupakan model yang berkaitan
dengan aturan-aturan peluang. Proses stokastik memegang peranan cukup penting
dalam berbagai bidang, salah satunya untuk memodelkan variasi geografis dari
risiko kematian dalam upaya untuk menunjukkan bahwa suatu kejadian tertentu
dapat disebabkan oleh faktor risiko yang memiliki struktur spasial.
Proses stokastik dibedakan menjadi dua berdasarkan jenis waktu, yaitu
proses stokastik dengan waktu diskret dan proses stokastik dengan waktu kontinu.
Pada tulisan ini, pembahasan hanya dibatasi pada proses stokastik dengan waktu
kontinu. Salah satu bentuk khusus dari proses stokastik dengan waktu kontinu
adalah model Gauss-Poisson.
Pada tulisan ini masalah yang dimodelkan adalah kematian yang diakibatkan
oleh pembunuhan dan bunuh diri. Model ini diharapkan dapat membantu pihak
yang berkepentingan, seperti petugas kepolisian. Tingkat kriminalitas ini biasanya
berbeda-beda untuk setiap wilayah, sehingga dibutuhkan kebijakan yang tepat
dalam menanganinya.
Jika keragaman ukuran populasi tidak diperhitungkan, maka pendugaan
risiko relatif (RR) yang hanya berdasarkan pada beberapa kasus dapat
menghasilkan peta yang tidak baik. Penduga Bayes empiris terbukti memiliki
kesalahan kuadrat yang lebih kecil daripada penduga RR. Dalam hal ini,
banyaknya kejadian memenuhi sebaran Poisson, bergantung pada laju kejadian
dan waktu pengamatan untuk setiap populasi.
Dalam tulisan ini dibahas aspek numerik dari pendugaan Bayes empiris
untuk model Gauss-Poisson, ketika sebaran prior logit adalah normal dengan
parameter diduga dengan metode maximum likelihood (ML) (Tsutakava et al.
1985; Sakalauskas 1995). Di sini ditentukan kondisi nonsingularitas dalam
pendugaan parameter dari sebaran prior dan digunakan algoritme iteratif
sederhana untuk menduga prior sebelumnya. Karena pendekatan Bayes empiris
untuk model Gauss-Poisson membedakan dengan sifat untuk membuat peluang
kejadian dalam populasi menjadi sama, ketika banyaknya kejadian tidak bervariasi
banyak, digunakan algoritme gerombol yang mengeksploitasi sifat ini. Data
kematian Lithuania pada tahun 2003-2004 digunakan untuk menduga risiko yang
sebenarnya dan menunjukkan penggunaan pendekatan tersebut.
Pada karya ilmiah ini penulis mempelajari tulisan dari Sakalauskas (2010)
yang berjudul On the Empirical Bayesian Approach for the Poisson-Gaussian
Model.
Tujuan
1. Mempelajari dan menganalisis model kematian yang diakibatkan oleh
pembunuhan dan bunuh diri di Lithuania pada tahun 2003-2004.
2. Mempelajari variasi geografis dari risiko kematian dalam upaya untuk
menunjukkan bahwa suatu kejadian tertentu dapat disebabkan oleh faktor
risiko yang memiliki struktur spasial.
2
TINJAUAN PUSTAKA
Ruang Contoh, Kejadian dan Peluang
Dalam suatu percobaan sering kali diperlukan pengulangan yang dilakukan
dalam kondisi yang sama. Semua kemungkinan hasil yang akan muncul akan
diketahui tetapi hasil pada percobaan selanjutnya tidak dapat diduga dengan tepat.
Percobaan semacam ini disebut percobaan acak.
Definisi 1 (Ruang contoh)
Ruang contoh adalah himpunan semua hasil yang mungkin dari suatu percobaan
acak dan dinotasikan dengan Ω (Grimmett & Stirzaker 1992).
Definisi 2 (Kejadian)
Kejadian adalah suatu himpunan bagian dari ruang contoh Ω (Grimmett &
Stirzaker 1992).
Definisi 3 (Medan- )
Medan- adalah suatu himpunan yang anggotanya terdiri atas himpunan bagian
ruang contoh Ω, yang memenuhi syarat berikut:
1.
2. Jika , maka 1
i
i
A
3. Jika , maka Jika , maka medan- disebut medan Borel. Anggota medan Borel disebut
himpunan Borel (Hogg et al. 2005).
Definisi 4 (Kejadian saling lepas)
Kejadian dan disebut saling lepas jika irisan dari keduanya adalah himpunan
kosong (Grimmett & Stirzaker 1992).
Definisi 5 (Ukuran peluang)
Misalkan Ω adalah ruang contoh suatu percobaan dan adalah medan- pada Ω.
Suatu fungsi yang memetakan unsur-unsur ke himpunan bilangan nyata ,
atau disebut ukuran peluang jika
1. taknegatif, yaitu untuk setiap 2. bersifat aditif takhingga, yaitu jika dengan
maka ⋃ ∑
3. bernorma satu, yaitu .
Pasangan disebut ruang ukuran peluang atau ruang peluang (Hogg et al.
2005).
Definisi 6 (Kejadian saling bebas)
Kejadian dan dikatakan saling bebas jika:
Secara umum, himpunan kejadian dikatakan saling bebas jika:
3
(⋂
) ∏
untuk setiap himpunan bagian J dari I (Grimmett & Stirzaker 1992).
Peubah Acak dan Fungsi Sebaran
Definisi 7 (Peubah acak)
Misalkan adalah medan- dari ruang contoh Suatu peubah acak adalah
suatu fungsi dengan sifat bahwa untuk setiap
(Grimmett & Stirzaker 1992).
Peubah acak dinotasikan dengan huruf kapital, misalnya , sedangkan nilai
peubah acak dinotasikan dengan huruf kecil seperti . Setiap peubah acak
memiliki fungsi sebaran.
Definisi 8 (Fungsi sebaran)
Misalkan adalah suatu peubah acak dengan ruang contoh . Misalkan kejadian
, maka peluang dari kejadian adalah:
Fungsi disebut fungsi sebaran dari peubah acak (Hogg et al. 2005).
Definisi 9 (Peubah acak diskret)
Peubah acak dikatakan diskret jika semua himpunan nilai dari peubah
acak tersebut merupakan himpunan tercacah (Grimmett & Stirzaker 1992).
Definisi 10 (Fungsi massa peluang)
Fungsi massa peluang dari peubah acak diskret adalah fungsi yang diberikan oleh
(Hogg et al. 2005).
Definisi 11 (Peubah acak kontinu)
Peubah acak dikatakan kontinu jika fungsi sebarannya dapat ditulis sebagai
∫
untuk suatu fungsi yang dapat diintegralkan. Selanjutnya fungsi
disebut fungsi kepekatan peluang bagi (Hogg et al. 2005).
Definisi 12 (Peubah acak Poisson)
Suatu peubah acak disebut peubah acak Poisson dengan parameter , jika
fungsi massa peluangnya diberikan oleh
untuk (Ross 2007).
4
Definisi 13 (Sebaran gamma)
Peubah acak dengan fungsi kepekatan peluang
jika
lainnya
dikatakan memiliki sebaran gamma dengan parameter
(Gahramani 2005).
Definisi 14 (Sebaran normal)
Suatu peubah acak disebut memiliki sebaran normal dengan nilai harapan dan
ragam , ditulis menyebar , jika fungsi kepekatan peluangnya adalah
√
(
)
, untuk
(Hogg et al. 2005).
Lema 1 (Jumlah peubah acak Poisson)
Misalkan dan adalah peubah acak yang saling bebas dan memiliki sebaran
Poisson dengan parameter berturut-turut dan , maka memiliki sebaran
Poisson dengan parameter . Bukti dapat dilihat pada Taylor & Karlin
(1984).
Nilai Harapan dan Ragam
Definisi 15 (Nilai harapan)
1. Jika adalah peubah acak diskret dengan fungsi massa peluang , maka
nilai harapan dari , dinotasikan dengan , adalah
∑
asalkan jumlah di atas konvergen mutlak.
2. Jika adalah peubah acak kontinu dengan fungsi kepekatan peluang ,
maka nilai harapan dari adalah
∫
asalkan integral di atas konvergen mutlak (Hogg et al. 2005).
Definisi 16 (Ragam)
Misalkan adalah peubah acak diskret dengan fungsi massa peluang dan
nilai harapan . Ragam dari , dinotasikan dengan atau , adalah
∑( )
(Hogg et al. 2005).
Definisi 17 (Fungsi indikator)
Misalkan adalah suatu kejadian. Fungsi indikator dari adalah suatu fungsi
yang diberikan oleh
5
jika jika
(Grimmett & Stirzaker 1992).
Kekonvergenan Peubah Acak
Terdapat beberapa cara untuk menginterpretasikan pernyataan kekonvergenan
barisan peubah acak.
Definisi 18 (Konvergen dalam peluang)
Misalkan adalah barisan peubah acak pada suatu ruang peluang
. Barisan peubah acak dikatakan konvergen dalam peluang ke ,
dinotasikan
, jika untuk setiap berlaku | | , untuk
(Grimmett & Stirzaker 1992).
Definisi 19 (Konvergen dalam sebaran)
Misalkan adalah peubah acak pada suatu ruang peluang . Suatu
barisan peubah acak dikatakan konvergen dalam sebaran ke peubah acak ,
ditulis
, untuk jika
untuk , untuk semua titik x di mana fungsi sebaran adalah kontinu
(Grimmett & Stirzaker 1992).
Statistik, Penduga dan Sifat-sifatnya
Definisi 20 (Statistik)
Statistik adalah suatu fungsi dari satu atau lebih peubah acak yang tidak
bergantung pada satu atau beberapa parameter yang nilainya tidak diketahui
(Hogg et al. 2005).
Definisi 21 (Penduga)
Misalkan adalah contoh acak. Suatu statistik yang
digunakan untuk menduga fungsi parameter , disebut penduga bagi ,
dilambangkan dengan Bilamana nilai maka nilai disebut sebagai dugaan bagi (Hogg et al. 2005).
Definisi 22 (Penduga takbias)
1. Suatu penduga yang nilai harapannya sama dengan parameter yaitu
disebut penduga takbias bagi
2. Jika maka disebut
penduga takbias asimtotik bagi (Hogg et al. 2005).
Definisi 23 (Penduga konsisten)
Suatu penduga yang konvergen dalam peluang ke parameter , disebut
penduga konsisten bagi (Hogg et al. 2005).
6
Sebaran Prior dan Sebaran Posteriror
Definisi 24 (Sebaran Prior)
Suatu peubah acak dengan parameter memiliki fungsi kepekatan peluang
bersyarat yang dinotasikan dengan | dan adalah fungsi
kepekatan marjinal dari , dinamakan sebaran prior (Arnold 1990).
Definisi 25 (Sebaran Posterior)
Suatu peubah acak merupakan sebaran prior dengan fungsi kepekatan peluang
bersyarat | dan memiliki fungsi kepekatan peluang , maka
fungsi kepekatan peluang bersama dari dinotasikan dengan
| , dinamakan sebaran posterior, dinyatakan dengan
| |
∫ |
(Arnold 1990).
Proses Stokastik
Definisi 26 (Proses stokastik)
Proses stokastik adalah suatu himpunan dari peubah acak yang
memetakan suatu ruang contoh ke suatu ruang state (Ross 2007).
Jadi untuk setiap pada himpunan indeks adalah suatu peubah acak.
Indeks sering diinterpretasikan sebagai waktu dan sebagai state (keadaan)
dari proses pada waktu
Definisi 27 (Proses stokastik waktu kontinu)
Suatu proses stokastik disebut proses stokastik dengan waktu kontinu jika berupa suatu interval (Ross 2007).
Definisi 28 (Inkremen bebas)
Suatu proses stokastik dengan waktu kontinu disebut memiliki
inkremen bebas jika untuk semua peubah acak adalah bebas (Ross 2007).
Dengan kata lain, suatu proses stokastik dengan waktu kontinu disebut memiliki
inkremen bebas jika proses berubahnya nilai pada interval waktu yang tidak
tumpang tindih (tidak overlap) adalah bebas.
Definisi 29 (Inkremen stasioner)
Suatu proses stokastik dengan waktu kontinu disebut memiliki
inkremen stasioner jika memiliki sebaran yang sama untuk
semua nilai (Ross 2007).
Dengan kata lain, suatu proses stokastik dengan waktu kontinu disebut memiliki
inkremen stasioner jika sebaran dari perubahan nilai antara sembarang dua titik
hanya tergantung pada jarak antara kedua titik tersebut dan tidak bergantung pada
lokasi titik-titik tersebut.
7
Proses Poisson
Salah satu bentuk khusus dari proses stokastik dengan waktu kontinu adalah
proses Poisson. Pada tulisan ini dianggap bahwa himpunan indeks adalah
interval bilangan real taknegatif yaitu
Definisi 30 (Proses pencacahan)
Suatu proses stokastik disebut proses pencacahan jika
menyatakan banyaknya kejadian yang telah terjadi sampai waktu Dari definisi tersebut, maka suatu proses pencacahan harus memenuhi
syarat-syarat berikut:
1. untuk semua 2. Nilai
adalah bilangan bulat.
3. Jika maka untuk 4. Untuk maka sama dengan banyaknya kejadian yang terjadi
pada interval (Ross 2007)
Definisi 31 (Proses Poisson)
Suatu proses pencacahan disebut proses Poisson dengan laju ,
jika dipenuhi tiga syarat berikut:
1. .
2. Proses tersebut memiliki inkremen bebas.
3. Banyaknya kejadian pada sembarang interval waktu dengan panjang
memiliki sebaran Poisson dengan nilai harapan Jadi untuk setiap ,
dengan (Ross 2007).
Dari syarat (3) dapat dilihat bahwa proses Poisson memiliki inkremen stasioner.
Dari syarat (3) juga dapat diperoleh
( )
Proses Poisson dengan laju yang merupakan konstanta untuk semua waktu
disebut proses Poisson homogen. Jika laju bukan konstanta, tetapi merupakan
fungsi dari waktu , maka proses tersebut disebut proses Poisson takhomogen.
Untuk kasus ini, disebut fungsi intensitas dari proses Poisson tersebut.
Fungsi intensitas harus memenuhi syarat untuk semua
Misalkan adalah proses Poisson dan adalah suatu interval bilangan nyata. Jika
adalah proses Poisson homogen, maka
| | dengan | | adalah panjang interval , sedangkan menyatakan banyaknya
kejadian dari proses Poisson pada interval
Jika adalah proses Poisson takhomogen dengan fungsi intensitas , maka
∫
8
Dengan kata lain, jika adalah proses Poisson takhomogen, maka memiliki
sifat:
1.
untuk setiap interval dengan 2. Untuk setiap bilangan bulat positif dan adalah interval
yang saling lepas dengan ( )
merupakan peubah acak yang saling bebas.
Metode Maximum Likelihood (ML)
Defenisi 32 (Fungsi likelihood)
Misalkan adalah barisan peubah acak independent and identically
distributied (i.i.d) dengan fungsi kepekatan peluang , dengan
diasumsikan skalar dan tidak diketahui, maka fungsi likelihood dapat dituliskan
sebagai berikut:
∏
dengan (Hogg et al. 2005).
Definisi 33 (Pendugaan maximum likelihood)
Misalkan ∏ adalah fungsi likelihood, maka fungsi log dari
, dapat dinotasikan dengan:
∑
Pendugaan parameter dengan metode maximum likelihood dapat diperoleh dengan
menentukan nilai yang memaksimumkan fungsi atau (Hogg
et al. 2005).
9
HASIL DAN PEMBAHASAN
Model Gauss-Poisson
Misalkan suatu himpunan ( ) dari populasi, di mana
setiap populasi terdiri atas individu. Asumsikan beberapa kejadian
(misalnya kematian yang diakibatkan oleh beberapa kasus bunuh diri) dapat
terjadi pada populasi amatan. Tujuan dari tulisan ini adalah untuk menduga
peluang kejadian yang tidak diketahui, ketika banyaknya kejadian dalam
populasi yang diamati, . Karena risiko relatif tidak dapat
digunakan dalam banyak kasus akibat perbedaan yang besar dalam ukuran
populasi , maka pendekatan Bayes empiris diterapkan.
Banyaknya kejadian diasumsikan mengikuti sebaran Poisson dengan
parameter , yaitu:
( ) ( )
( )
Asumsi ini sering dibenarkan (Bradley et al. 2000; Tsutakava et al. 1985; Clayton
dan Kaldor 1987).
Metode Bayes empiris adalah prosedur dua tahap, bergantung pada sebaran
prior yang diperkenalkan pada tahap kedua (Bradley et al. 2000). Hal yang
menarik pada model adalah logit
menyebar normal dengan parameter . Dengan demikian, fungsi kepekatan
peluang dari logit pada persamaan (2) adalah:
( )
( ( )
)
√
Kemudian tingkat dievaluasi sebagai suatu nilai harapan posterior untuk
yang diberikan
∫
(
) ( )
( )
di mana
( ) ∫ (
)
( )
adalah peluang posterior dari banyaknya kejadian pada populasi ke- ,
.
Analisis Bayes dalam statistik sering berhubungan dengan peminimuman
fungsi tertentu, dinyatakan sebagai integral dari fungsi kepekatan posterior.
Dengan demikian, dalam pendekatan Bayes empris dengan parameter yang
tidak diketahui diduga dengan metode maximum likelihood. Fungsi logaritma
likelihood, setelah beberapa manipulasi didapatkan sebagai berikut
10
( ) ∑ ( ( ))
∑ ( ∫ (
)
( ) )
yang harus diminimumkan untuk mendapatkan dugaan bagi parameter .
Turunan dari Fungsi Likelihood dan Persamaan Titik Tetap
Fungsi likelihood pada persamaan (6) dapat diturunkan terhadap parameter
dan turunan pertama masing-masing fungsi ini adalah sebagai berikut:
( )
[ ∑ ( ( ))
]
∑*
( )
( ( ))+
∑[
( )∫ (
)
( ) ]
∑
( )
∫ (
)
( ( )
)
√
( )
( )
∑∫
(
) ( )
( )
( )
[ ∑ ( ( ))
]
∑*
( )
( ( ))+
∑[
( )∫ (
)
( ) ]
11
∑[
( )∫ (
)
(
√ (
( )
)
√ (
( )
)( )
) ]
∑
∫ ( ( )
) (
)
( )
( )
Dengan menyamakan persamaan (7) dan (8) dengan nol, yaitu ( )
( )
maka diperoleh persamaan titik tetap untuk penduga ML dari dan sebagai
berikut: ( )
∑∫
(
) ( )
( )
[∑
∫ (
) ( )
( )
∑∫ (
) ( )
( )
]
∑∫ (
)
( )
( )
∑∫ (
)
( )
( )
∑∫ (
)
( )
( )
∑ ( )
( )
∑∫ (
)
( )
( )
∑
∑∫ (
)
( )
( )
∑∫ (
)
( )
( )
12
( )
∑
∫ ( ( )
) (
)
( )
( )
∑∫ (
) ( )
( )
∑∫ ( ) (
) ( )
( )
∑ ( )
( )
∑∫ ( ) (
)
( )
( )
∑∫ ( ) (
)
( )
( )
∑
∫ ( ) (
) ( )
( )
Namun, solusi dari persamaan ini hanya ada di bawah asumsi
nonsingularitas dari penduga ML untuk (yaitu, ). Setelah beberapa
analisis tentang persamaan (6), (7), (8), sampailah pada teorema berikut.
Teorema 1 Solusi dari persamaan (11) dan (12) ada jika
∑( ) ∑
Bukti dapat dilihat pada Lampiran 1.
Jika persamaan (13) tidak terpenuhi, penduga ML adalah:
di mana
∑
∑
Ini mengikuti dari kondisi persamaan (13) bahwa singularitas terjadi paling
sering pada populasi kecil. Oleh karena itu, kondisi ini dapat digunakan untuk
membuat populasi diatur dengan kejadian langka.
Sangat mudah untuk memastikan bahwa dalam kasus singularitas ( )
banyak kejadian tetap untuk semua populasi,
Nilai yang bersesuaian fungsi likelihood adalah:
( ) ∑( ( ))
∑ ( ( ))
13
Pendugaan Parameter Gauss dengan Metode “Iterasi Sederhana”
Studi empiris dari fungsi likelihood dengan berbagai koleksi ukuran populasi
dan banyaknya kasus dalam populasi memungkinkan untuk disimpulkan bahwa
fungsi ini unimodal dan memiliki satu titik minimum.
Dengan demikian, kondisi nonsingularitas pada persamaan (13) adalah
benar. Kemudian solusi persamaan (9), (10) atau (11), (12) dapat ditentukan
dengan metode numerik. Misalnya, metode “iterasi sederhana” (Kantorovich dan
Akilov 1982) berguna untuk menyelesaikan persamaan-persamaan tersebut
sehingga diperoleh penduga ML dari dan ,
∑
∫ (
) ( )
( )
∑
∫ ( ) (
)
( )
( )
Titik awal ( ) dari persamaan (18) dan (19) dapat dipilih
∑
∑(
)
dengan
Pendugaan ML untuk dapat juga ditentukan dengan Metode Matriks
Variabel (Dennis dan Schnabel 1996), dengan menggunakan titik awal pada
persamaan (20) dan (21) serta menggunakan persamaan (7) dan (8) untuk
memperkirakan gradien fungsi likelihood.
Perhatikan bahwa integral dalam persamaan (5), (6), (7), (8), (11), (12), (18),
dan (19) dapat dihitung dengan menggunakan, misalnya, formula kuadratur
Hermite-Gauss (Abramovich dan Stegun 1968).
Selain itu, pengintegralan dan peminimuman fungsi ML dapat dilakukan
dengan menggunakan alat yang tepat dalam perangkat lunak matematika.
Aplikasi untuk Penggerombolan
Pendekatan Bayes empiris telah diterapkan untuk memetakan
penggeromboralan (Knorr-Held dan Rasser (1999), Bradley et al. (2000)). Sifat
model Gauss-Poisson untuk menangani populasi dengan rasio relatif tertutup satu
sama lain dan memiliki peluang kejadian yang sama dapat diterapkan untuk
14
memetakan penggerombolan. Perhatikan sebuah himpunan gerombol yang
terdiri atas himpunan populasi ( ). Perhatikan bahwa
diperlukan sebagai gerombol himpunan bagian dari populasi yang bersebelahan
(yaitu, setiap populasi di gerombol memiliki perbatasan bersama dengan beberapa
penduduk lainnya dari gerombol ini), di mana kondisi ragam nol yang berasal dari
persamaan (13) adalah benar:
∑ ( )
Misalkan ( ) adalah himpunan gerombol yang mencakup
semua himpunan populasi , ,
Himpunan penggerombolan dipilih sehingga fungsi likelihood persamaan (6)
menjadi minimum. Jadi, dengan menggunakan persamaan (17) setelah beberapa
manipulasi sederhana dapat dipastikan bahwa himpunan penggerombolan terbaik
harus menghasilkan fungsi minimum
( ) ∑ ∑ (∑
∑
)
Peluang kejadian yang bersesuaian dengan populasi pada suatu gerombol
adalah
∑
∑
Perhatikan bahwa banyaknya gerombol yang mungkin agak besar dan harus
dilihat melalui banyaknya gerombol yang besar, ketika himpunan
penggerombolan dibentuk sehubungan dengan persamaan (23). Penyederhanaan
heuristik dapat diterapkan dengan menggunakan proposisi berikut.
Proposisi 1 Misalkan dan adalah dua populasi dengan banyaknya kejadian
, dan ukuran , , maka
(
) (
) ( ) ( )
Bukti dari proposisi ini diperoleh dengan manipulasi dasar.
Dengan demikian dari persamaan (25), penggabungan dua gerombol
menyebabkan fungsi likelihood menurun. Sifat ini dapat digunakan untuk
penentuan himpunan penggerombolan terbaik. Dengan memulai dari himpunan
penggerombolan awal, yang terdiri atas gerombol yang masing-masing hanya
memiliki satu populasi, dua gerombol digabung jika kondisi pada persamaan (22)
tetap berlaku dalam gerombol yang digabung dan penurunan fungsi likelihood
minimum di antara semua kombinasi penggabungan yang mungkin, dan prosedur
ini diulang sampai berakhir.
Implementasi untuk Analisis Data
Metode yang dikembangkan diterapkan untuk analisis data kematian yang
diakibatkan oleh pembunuhan dan bunuh diri di Lithuania pada tahun 2003-2004
(semua kejadian dalam populasi, untuk pria dan wanita). Pengintegralan dan
peminimuman fungsi likelihood dilakukan dengan menggunakan perangkat lunak
matematika.
15
Hasil analisis kondisi nonsingularitas persamaan (13) dan pendugaan Bayes
empiris dari peluang kejadian diberikan pada Tabel 1 dan Tabel 2.
Tabel 1 Pendugaan Bayes empiris dari kematian akibat bunuh diri/pembunuhan di
Lithuania, 2003
∑ ( )
∑
⁄
Semua bunuh diri 41.656 14255.1/1434=9.941 -7.652 0.281
Semua pembunuhan 9.44 453.3/325=1.395 -9.260 0.136
Pria bunuh diri 74.582 9484.2/1199=7.910 -7.7074 0.288
Pembunuhan Pria 14.431 356.0/232=1.543 -8.840 0.159
Wanita bunuh diri 13.952 692.9/256=2.705 -8.826 0.371
Pembunuhan wanita 5.45 76.8/100=0.768 -9.817 0
Tabel 2 Pendugaan Bayes empiris dari kematian akibat bunuh diri/pembunuhan di
Lithuania, 2004
∑ ( )
∑
⁄
Semua bunuh diri 40.334 15421/1381=11.166 -7.652 0.281
Semua pembunuhan 8.587 287/294=0.976 -9.260 0
Pria bunuh diri 70.337 11889/1124=10.577 -7.7074 0.305
Pembunuhan Pria 12.515 313/2001=1.565 -8.840 0.234
Wanita bunuh diri 14.075 1573.2/257=6.121 -8.826 0.257
Pembunuhan wanita 5.093 84.1/93=0.904 -9.817 0
Pada Tabel 1 dan 2 jika Teorema 1 terpenuhi maka dilanjutkan dengan
iterasi sederhana untuk mendapatkan dan setelah itu disubstitusi ke persamaan
(4). Apabila Teorema 1 tidak terpenuhi maka digunakan pesamaan (14) dan (15).
Dengan demikian, singularitas dalam sebaran prior, yaitu ragam prior nol
diamati untuk beberapa kejadian langka (pembunuhan wanita pada tahun 2003-
2004, dan semua pembunuhan pada tahun 2004).
RR untuk kasus bunuh diri dan peluang kejadian diduga dengan metode
Bayes empiris maupun dengan pendekatan penggerombolan disajikan pada
Lampiran 2. Dengan demikian, dapat dilihat penurunan ragam penduga Bayes
empiris dibandingkan dengan RR.
16
Tabel 3 Hasil Analisis Berdasarkan Data Pria Bunuh Diri di Lithuania Tahun 2003
untuk wilayah Shilutes d, Shirvintu d, Kaunas, dan Kauno d
Wilayah Penduduk
Pria ( ) Banyaknya
Bunuh diri
( )
RR
Bunuh
diri
( )
Bayes
empiris
Bunuh
diri ( )
Penggerombolan
Bayes empiris
Bunuh diri
Shilutes d 26257 22 83.79 84.506 84.406
Shirvintu d 9392 10 106.47 94.815 84.406
Kaunas 167308 85 50.80 54.077 56.682
Kauno d 39525 18 45.54 57.698 56.682
Perbandingan peluang kejadian dengan menggunakan RR antara Shilutes d
dan Shirvintu d cukup besar, sedangkan dengan menggunakan Bayes empiris
perbandingannya lebih kecil. Begitu juga dengan wilayah Kaunas dan kauno d
perbandingan peluang kejadian dengan menggunakan bayes empiris lebih kecil
dibandingkan dengan menggunakan RR, sehingga pada tulisan ini digunakan
penduga Bayes empiris untuk menentukan peluang kejadian. Peluang kejadian
dengan menggunakan RR pada wilayah Kaunas lebih besar dibandingkan Kauno
d, sedangkan dengan menggunakan Bayes empiris wilayah Kaunas lebih kecil
dibandingkan dengan Kauno d.
SIMPULAN
Masalah yang dimodelkan adalah kematian yang diakibatkan oleh
pembunuhan dan bunuh diri. Model ini diharapkan dapat membantu pihak yang
berkepentingan, seperti petugas kepolisian. Tingkat kriminalitas ini biasanya
berbeda-beda untuk setiap wilayah, sehingga dibutuhkan kebijakan yang tepat
dalam menanganinya.
Jika keragaman ukuran populasi tidak diperhitungkan, maka pendugaan
risiko relatif dapat digunakan. Namun, karena risiko relatif tidak dapat digunakan
dalam banyak kasus akibat perbedaan yang besar dalam ukuran populasi, maka
pendekatan Bayes empiris diterapkan.
Studi empiris dari fungsi likelihood dengan berbagai koleksi ukuran populasi
dan banyaknya kasus dalam populasi memungkinkan untuk fungsi ini memiliki
satu titik tetap.
Perbandingan peluang kejadian dua wilayah dengan menggunakan RR lebih
besar dibandingkan dengan menggunakan Bayes empiris.
DAFTAR PUSTAKA
Abramovich M, Stegun IA. 1968. Handbook of Mathematical Functions. New
York (US): Dover.
Arnold SF. 1990. Mathematical Statistics. New Jersey (US): Prentice Hall, Inc.
17
Bradley PC, Thomas AL, Bradley C. 2000. Bayes and empirical Bayes methods
for data analysis. Springer. 7(2):153-154. doi: 10.1023/A:1018577817064.
Clayton D, Kaldor J. 1987. Empirical Bayes estimates of age-standardized relative
risks for use in disease mapping. Biometrics. 43(3):671-681.
Dennis JE, Schnabel RB. 1996. Numerical Methods for Unconstrained
Optimization and Nonlinear Equations (Classics in for Applied Mathematics).
Philadelphia (US): SIAM.
Gahramani S. 2005. Fundamentals of Probability with Stochastic Processes. Ed
ke-3. New Jersey (US): Pearson Prentice Hall.
Grimmett GR, Stirzaker DR. 1992. Probability and Random Processes. Ed ke-2.
Oxford (UK): Clarendon Press.
Hogg RV, Craig AT, McKean JW. 2005. Introduction to Mathematical Statistics.
Ed ke-6. New Jersey (US): Prentice Hall.
Kantorovich LV, Akilov GP. 1982. Functional Analysis. Oxford (UK): Pergamon
Press.
Knorr-Held L, Rasser G. 1999. Bayesian Detection of Clusters and
Discontinuities in Disease Maping. Munich (DE): Departement of Munich.
University of Munich.
Ross SM. 2007. Introduction to Probability Models. Ed ke-9. Orlando, Florida
(US): Academic Press.
Sakalauskas L. 1995. On Bayes analysis of small rates in medicine. Proc. of the
Intern. Conf. “Computer Data Analysis and Modeling”. 1:127-130. Minsk
(BLR): Belarusia State University.
Sakalauskas L. 2010. On the empirical Bayesian approach for the Poisson-
Gaussian model. Springer Science. 12:247-259. doi: 10.1007/s11009-009-
9146-2.
Taylor HM, Karlin. 1984. An Introduction to Stochastics Modelling. Orlando,
Florida (US): Academic Press Inc.
Tsutakava RK, Shoop GL, Marienfield CJ. 1985. Empirical Bayes estimation of
cancer mortality rates. Stat. Med. 4:201-212. doi:10.1002/sim.4780040210.
18
Lampiran 1 Bukti Teorema 1
Misalkan:
( )
(
) (1A)
( ) ( ( ))
( ) ( )
(2A)
Untuk memastikan bahwa
(
*
( ) (
) (3A)
(
*
(
*
( )
(
*
( )
(
*
( )
(
*
( )
( )
((
* (
*+
⏟ ( ) (
(
*
( )
)
⏟
(
*
( )
( ) (
) (4A)
( )
(
( ) (
*
(
*
( ) ) (
*
( ) ( ) (
*
((
* (
* (
*
( )
( ( ))
+ (
*
(( ( ))
( ) ( )
) (
*
maka diperoleh persamaan (4A)
19
Perhatikan bahwa
( ) (
) (5A)
Sekarang, dengan menggunakan ekspansi Taylor dari fungsi (1) dan
mempertimbangkan (5A), kita memperoleh limit derivatif (7) dari fungsi
likelihood sehubungan dengan saat mendekati nol:
( )
∑∫
(
( )
* ( )
( )
∑∫
(
( ) ( )) (
* ( )
( )
∑ ( )
∑(
*
(6A)
Jadi berdasarkan (6A) dan persamaan (8), kita mendapatkan penduga maximum
likelihood:
∑
∑
(7A)
Analog, mari kita menghitung limit derivatif (8) dari fungsi likelihood sehubungan
dengan , saat mendekati nol:
( )
(
∑
∫ ( ) (
( )* ( )
( )
,
(
∑
∫ ( )( ( )
( ) (
)* (
* ( )
( ) +
∑ ( ) ∑ [( ( ))
( ) ( )
]
( ) ∑ [(
)
] (8A)
Solusi taknol dari persamaan (9) ada hanya jika ( )
.
Dengan menyubtitusi (7A) ke (8A) diperoleh pertaksamaan
∑ [(
)
] ∑ *( ) +
(9A)
yang menyebabkan kondisi (13).
20
Lampiran 2 Hasil Analisis Berdasarkan Data Pria Bunuh Diri di Lithuania Tahun 2003
Wilayah (j) Penduduk
pria ( ) Banyaknya
Bunuh diri
( )
RR
Bunuh
diri
( )
Bayes
empiris
Bunuh
diri ( )
Penggerombolan
Bayes empiris
Bunuh diri
Akmenes d (1) 13920 10 71.84 79.315 99.883
Alytaus d (2) 15741 12 76.23 81.059 89.358
Alytus (3) 34085 17 49.88 61.649 89.358
Anykshchiu d (4) 16099 19 118.02 103.871 99.883
Birshtono m (5) 2467 4 162.14 99.451 89.358
Birzu d (6) 16462 12 72.90 79.199 84.406
Shakiu d (7) 18271 17 93.04 90.054 56.682
Shalchininku d (8) 18534 15 80.93 83.200 89.358
Shiauliai (9) 60221 43 71.40 74.207 84.406
Shiauliu d (10) 24563 20 81.42 83.074 84.406
Shilales d (11) 15183 15 98.79 92.867 84.406
Shilutes d (12) 26257 22 83.79 84.506 84.406
Shirvintu d (13) 9392 10 106.47 94.815 84.406
Druskininku m (14) 11543 8 69.31 78.976 89.358
Shvenchioniu d (15) 15174 7 46.13 66.782 45.896
Elektrenu d (16) 13644 17 124.60 106.126 89.358
Ignalinos d (17) 10578 14 132.35 107.419 74.285
Jonavos d (18) 24587 16 65.08 73.091 56.682
Jonishkio d (19) 14815 15 101.25 94.103 84.406
Jurbarko d (20) 17627 20 113.46 101.846 84.406
Kaishiadoriu d (21) 18366 13 70.78 77.664 89.358
Kalvariju d (22) 6556 9 137.28 103.989 89.358
Kaunas (23) 167308 85 50.80 54.077 56.682
Kauno d (24) 39525 18 45.54 57.698 56.682
Kazlu Ruda d (25) 7037 2 28.42 68.865 56.682
Kedainiu d (26) 30590 31 101.34 96.571 84.406
Kelmes d (27) 19334 20 103.44 96.325 84.406
Klaipeda (28) 88308 45 50.96 56.582 84.406
Klaipedos d (29) 22598 17 75.23 79.467 84.406
Kretingos d (30) 21776 26 119.40 107.071 113.549
Kupishkio d (31) 11366 11 96.78 91.168 99.883
Lazdiju d (32) 12788 14 109.48 97.725 89.358
Marijampoles m (33) 33536 30 89.46 88.329 89.358
Mazeikiu d (34) 31594 37 117.11 108.116 84.406
Moletu d (35) 11899 15 126.06 105.566 84.406
Neringa (36) 1212 1 82.51 87.421 84.406
Pagegiu d (37) 5770 10 173.31 114.788 84.406
Pakruojo d (38) 13855 11 79.39 82.951 84.406
Palanga (39) 8062 8 99.23 91.415 84.406
Panevezio r (40) 20587 24 116.58 104.829 84.406
Panevezys (41) 53913 26 48.23 57.253 84.406
21
Pasvalio d (42) 16365 13 79.44 82.622 84.406
Plunges d (43) 20967 18 85.85 85.912 113.549
Prienu d (44) 16714 15 89.75 88.126 89.358
Radvilishkio d (45) 24469 25 102.17 96.396 84.406
Raseiniu d (46) 20562 21 102.13 95.754 84.406
Rietavo d (47) 5044 13 257.73 141.063 113.549
Rokishkio d (48) 19442 21 108.01 99.126 84.406
Skuodo d (49) 12099 11 90.92 88.538 113.549
Taurages d (50) 24604 19 77.22 80.459 84.406
Telshiu d (51) 26855 22 81.92 83.280 84.406
Traku d (52) 17400 14 80.46 83.048 89.358
Ukmerges d (53) 22335 23 102.98 96.589 84.406
Utenos d (54) 23205 29 124.97 111.323 99.883
Varenos d (55) 14611 25 171.10 134.156 89.358
Vilkavishkio d (56) 23786 21 88.29 87.398 56.682
Vilniaus d (57) 43452 23 52.93 61.963 45.896
Vilnius (58) 246412 110 44.64 47.495 45.896
Visagino m (59) 13653 4 29.30 60.778 74.285
Zarasu d (60) 10498 6 57.15 74.574 99.883
22
RIWAYAT HIDUP
Penulis dilahirkan di Bunga Tanjung Kabupaten Tanah Datar pada tanggal 31
Desember 1989. Anak dari pasangan Mawardi dan Warnida merupakan anak ketujuh
dari tujuh bersaudara. Penulis menyelesaikan pendidikan Sekolah Dasar di SDN 15
Bunga Tanjung Kabupaten Tanah Datar pada tahun 2002, Sekolah Menengah Pertama
di MTsN Pitalah Kabupaten Tanah Datar pada tahun 2005, Sekolah Menengah Atas di
MAN Sumpur Kabupaten Tanah Datar pada tahun 2008, dan pada tahun yang sama
penulis lulus seleksi masuk Institut Pertanian Bogor melalui jalur Undangan Seleksi
Masuk IPB dan diterima di Departemen Matematika, Fakultas Matematika dan Ilmu
Pengetahuan Alam.
Selama perkuliahan, penulis juga aktif di beberapa organisasi kampus, yaitu
Gugus Mahasiswa Matematika (GUMATIKA) pada tahun 2009-2010, penulis aktif
sebagai anggota Badan Pengawas Gumatika (BPG).