bayesian methods
TRANSCRIPT
Makalah Topik Khusus Sabtu, 20 Oktober 2012
METODE BAYESIAN
Rizky NurkhaeraniG14090074
DosenKusman Sadik
AbstrakBayesian adalah sebuah metode pendugaan parameter yang tidak hanya menggunakan informasi yang
dibawa oleh contoh tetapi juga informasi awal (prior information) yang turut diperhitungkan dalam melakukan pendugaan terhadap parameter populasi.
PENDAHULUAN
Dalam alam realitas, parameter yang sebenarnya ingin diketahui jarang diperoleh. Parameter pada umumnya tidak diketahui karena populasinya tidak berhingga besarnya, atau kalau berhingga jumaksimum likelihoodahnya terlalu besar untuk diteliti seluruhnya dibanding biaya, waktu, dan tenaga yang tersedia (Tiro, 2000: 75). Di samping itu besarnya populasi seringkali tidak dapat diketahui, seperti banyaknya ikan di Laut Jawa, banyaknya kayu meranti di Hutan Kalimantan, jumlah total produksi lampu yang ada, dan sebagainya.
Untuk mengestimasi parameter suatu populasi maka diambil sebuah sampel yang representatif, sebelum estimasi dilakukan, perlu diketahui lebih dulu keadaan populasi variabel random tersebut secara apriori, seperti bentuk distribusinya, dan karakteristik parameter-parameter lain. Walaupun kerapkali informasi tentang populasinya sangat minimal, informasi yang diperoleh secara apriori itu kemudian dapat ditambahkan pula dengan informasi yang diperoleh dari sampel itu sendiri. Dalam statistika inferensial, ada dua bagian penting yang menjadi pusat perhatian yaitu estimasi parameter dan pengujian hipotesis. Jika parameter populasi tidak diketahui maka dilakukan estimasi tapi jika parameter diketahui maka dilakukan pengujian hipotesis untuk menguji kebenaran dari asumsi tentang parameter. Dalam mengestimasi parameter, maka perlu memilih metode yang tepat sesuai dengan keadaan dari populasi yang diteliti. Dalam statistika inferensi, biasanya diasumsikan bahwa distribusi populasi diketahui. Teknik yang digunakan untuk menaksir nilai parameter bila
distribusi populasi diketahui adalah metode maximum likelihood. Metode ini hanya mendasarkan inferensinya pada sampel. Tetapi jika distribusi populasi tidak diketahui maka metode maksimum likelihood tidak dapat digunakan. Bayes memperkenalkan suatu metode dimana kita perlu mengetahui bentuk distribusi awal (prior) dari populasi yang dikenal dengan metode Bayes. Sebelum menarik sampel dari suatu populasi terkadang kita peroleh informasi mengenai parameter yang akan diestimasi. Informasi ini kemudian digabungkan dengan informasi dari sampel untuk digunakan dalam mengestimasi parameter populasi.
Pada banyak literatur/penelitian, metode Bayes dapat memberikan dugaan yang memiliki ketepatan (presisi) lebih tinggi dibandingkan dengan metode-metode klasik seperti metode kuadrat terkecil atau metode kemungkinan maksimum.
METODE BAYESIAN
Seiring dengan perkembangan ilmu pengetahuan, metode pendugaan parameter pun bermunculan dengan kelebihan-kelebihan yang mampu mengatasi keterbatasan pada metode sebelumnya. metode yang pertama muncul adalah metode momen. Kemudian muncul least square sebagai metode baru. Beberapa lama kemudian maksimum likelihood dikembangkan dan menguasai segala aspek pendugaan. Dan pada saat ini, para peneliti mulai mempelajari dan mengembangkan metode baru yang dianggap lebih masuk akal, yaitu metode bayesian.
Metode bayesian ditemukan oleh Dennis Lindley. Perbedaan bayesian dengan metode
1
Makalah Topik Khusus Sabtu, 20 Oktober 2012
sebelumnya, yaitu maksimum likelihood, sangat mendasar mulai dari pendefinisian statistik dan parameter, peluang, data X serta selang kepercayaan. Adapun perbedaan pendefinisian antara kedua metode tersebut adalah sebagai berikut :
Definisi Maks. Likelihood
Bayesian
Statistik Keputusan dengan menghubungkan permasalahan ke ketentuan karakteristik dari tingkah laku yang berdasarkan pada percobaan acak.
Pembelajaran mengenai ketidakpastian yang sering disebut eksplorasi parameter dengan keterangan yang didapat dari data X
Peluang Frekuensi, berdasarkan percobaan-percobaan sebelumnya
Kuantifikasi dari ketidakpastian, kepercayaan tanpa adanya frekuensi sebelumnya
Data X Peubah acak Nilai fiks
Parameter Nilai fiks Peubah acak
Selang Kepercayaan
Selang yang akan memuat parameter setelah sekian kali dilakukan percobaan acak
Selang yang diawali dengan persepsi (subjektifitas) dan dilanjutkan dengan proses updating (pembaharuan) data sebagai pembuktian
Berdasarkan perbedaan-perbedaan tersebut, dapat terlihat metode Bayesian lebih masuk akal dan logis jika dibandingkan dengan Maksimum likelihood. Sebagai contoh dalam hal parameter, Bayesian berpendapat bahwa parameter merupakan suatu peubah acak yang nilainya dapat berubah-ubah dan memiliki suatu sebaran sedangkan menurut Maksimum Likelihood parameter merupakan suatu bilangan yang tetap (fiks). Pada kenyataannya, misalkan jumlah
penduduk suatu negara, nilai parameter tidak akan pernah tetap karena penduduk selalu bertambah setiap detiknya. Selalu ada yang lahir dan ada yang meninggal setiap detiknya. Waktu merupakan suatu hal yang kontinu sehingga tidak akan didapat satu bilangan yang tetap. Melakukan penelitian di saat ini, beberapa detik kemudian populasi pun sudah berubah lagi. Fiks / tetap dalam Maksimum Likelihood itu hanya asumsi.
Tidak semua keputusan diambil berdasarkan percobaan. Dalam Bayesian, terdapat prior, yaitu pengetahuan yang tidak berdasarkan percobaan-percobaan sebelumnya dan tidak dapat dijelaskan. Contohnya, ahli musik dapat membedakan mana musik Mozart dan mana musik Haydn. Keahlian itu tidak dapat dijelaskan dan bukan merupakan hasil keputusan dari percobaan-percobaan sebelumnya.
Namun demikian, Bayesian pun terdapat beberapa kritik. Prior yang digunakan sebagai penduga awal bersifat subjektif, tidak objektif, karena berbeda orang yang mengambil keputusan dapat berbeda pula priornya. Ketidakobjektifan ini tidak sesuai dengan kaidah penelitian yang ilmiah. Oleh karena itu, saat ini Bayesian terus dikembangkan untuk mengobjektifkan prior tersebut.
Alur kerja metode Bayesian adalah sebagai berikut :
Jika dibandingkan dengan Maksimum Likelihood :
MLE max L(x) = ∏ f ( x i|θ ) Fungsi x setelah θ, karena θ tetap
Bayesian P (θ|x ) = P ( x|θ ) . P(θ)
P(x ) ,
P ( x|θ ) Maksimum Likelihood
Dari kedua persamaan di atas terlihat bahwa nilai Bayesian dan Maksimum Likelihood
bisa sama jika P(θ) = 1. Namun nilai tersebut
tidak akan tercapai karena peluang titik dari suatu yang kontinu tidak akan pernah 1 tapi nol.
2
Makalah Topik Khusus Sabtu, 20 Oktober 2012
Contoh dikehidupan nyata. Suatu penelitian ingin menduga peluang kejadian bayi lahir dengan kelainan plasenta. Pada suatu kondisi, bayi yang lahir ada 2 orang dan keduanya menderita kelainan plasenta. Maka jika dengan Maksimum Likelihood peluangnya akan bernilai 1 sedangkan Bayesian menggunakan nilai prior misalkan setengah (0,5). Kelahiran ketiga ternyata bayi tersebut pun mengalami kelainan plasenta. Maksimum Likelihood masih benar sedangkan Bayesian terus mengupdate peluangnya setiap kelahiran bayi. Jika kelahiran keempat ternyata bayi yang lahir tidak menderita kelainan plasenta maka Maksimum Likelihood menjadi terbantahkan sedangkan Bayesian tetap rasional dengan terus meng-update nilai peluangnya. Hal ini menunjukkan kejanggalan pada metode Maksimum Likelihood. Maksimum Likelihood akan kacau nilainya jika ukuran datanya kecil / sedikit.
Hipotesis Bayes dan Maksimum Likelihood juga sangat berkebalikan. Likelihood menggunakan sistem salah jenis 1 dan salah jenis 2. Pada awal hipotesis, Likelihood mengasumsikan
bahwa H 0 benar kemudian menghitung peluang
darikejadian Y. Bayesian justru menghitung berapa
peluang H 0 benar jika Y sudah diketahui.
H 0
Maksimum Likelihood
Bayesian
Jika H0 benar, maka peluang kejadian Y sebesar sekian.
Jika Y bernilai sekian maka peluang H0 benar sebesar sekian.
P (Y|H 0 ) P ( H 0|Y )Menolak atau
menerima H 0.
(Berapa peluang
untuk menolak H 0)
Misal :
H 0 = θH 0 ≠ θ
P ( H 0|Y )P ( H 1|Y )
< 1, maka tolak
H 0
Berkaitan dengan salah jenis 1 dan salah jenis 2.
Hanya membandingkan mana peluang yang lebih
besar, H 0 atau H 1 .
HIRARCHICAL BAYES
Seperti yang telah dijelaskan sebelumnya, prinsip dasar dari metode Bayes adalah ingin
mengetahui penyebab setelah akibatnya terjadi. Berkebalikan dengan prinsip kausalitas, model Bayes Berhirarki adalah metode di mana penyebab dari suatu kejadian disebabkan oleh kejadian lain dan seterusnya.
. .
. .
. .
GLM (Kausalitas) Hirarchical Bayes
Likelihood disebut frequentis karena peluangnya dihitung secara frekuensi.
Selain karena prior yang bersifat subjektif, kelemahan Bayesian pun terletak pada kesulitan pengerjaannya karena meggunakan integral sedangkan Maksimum Likelihood menggunakan turunan. Software yang memuat prinsip Bayes pun saat ini hanya R.
Para statistisi dunia pun terus mengembangkan metode integral untuk dapat mengatasi kesulitan pengintegralan dalam menggunakan metode Bayes. Metode penyelesaian integral antara lain :
1. MCMC (Markov Chain Monte Carlo)2. Gibbs Sampling3. Metropolis - Hastings
3
θ2
θ1
y
θn θn
θ2
θ1
y