Download - Model Regresi Logistik Ordinal
MODEL REGRESI
LOGISTIK ORDINAL Ordinal Logistic Regression Model
Bahan Kuliah
Sekolah Tinggi Ilmu Statistik
(STIS)
Oleh: Agung Priyo Utomo
Contoh-contoh (1)
• Sebuah perusahaan riset pemasaran meneliti faktor yang mempengaruhi ukuran/kandungan soda (kecil, menengah, besar atau ekstra besar) yang orang pesan pada sebuah rumah makan cepat saji. Faktor-faktor yang diteliti termasuk jenis sandwich yang dipesan (burger atau ayam), apakah juga memesan kentang goreng, dan usia konsumen.
• Penelitian tentang faktor-faktor yang mempengaruhi perolehan medali (emas, perak, perunggu) dalam suatu olimpiade renang. Variabel yang diduga berpengaruh adalah lamanya waktu berlatih, diet yang dilakukan, usia, dan popularitas olahraga renang di daerahnya.
• Penelitian tentang variabel yang mempengaruhi ketahanan pangan suatu wilayah (sangat tahan pangan, tahan pangan, cukup tahan pangan, tidak tahan pangan). Variabel yang digunakan adalah luas lahan pertanian tanaman pangan, kondisi tanah, PDRB, dan sebagainya.
• Penelitian tentang variabel yang mempengaruhi kemiskinan rumahtangga di suatu wilayah (sangat miskin, miskin, tidak miskin). Variabel yang digunakan adalah pengeluaran untuk konsumsi, jumlah ART yg bekerja, dan sebagainya.
Contoh-contoh (2)
1. Cumulative Logits
Menggunakan peluang kumulatif:
Shg Cumulative Logits didefinisikan sbg:
• Sebuah model logit [P(Y ≤ j)] dpt dipandang seperti model logit dg respon biner dimana kategori 1 s.d j sbg kategori pertama dan kategori j+1 s.d J sbg kategori kedua.
Model RLO (1)
2. Proportional Odds Model
Merupakan model yg secara simultan menggunakan semua cumulative logit:
• Setiap cumulative logit memiliki intersep masing-masing
• Nilai αj meningkat seiring dg j, selama P(Y≤ j|x) meningkat seiring dg j utk nilai x yg tetap.
• Model tsb memiliki efek β yang sama utk masing-masing logit
• Untuk sebuah variabel prediktor x kontinyu dan J = 4, dpt digambarkan model sbb:
Model RLO (2)
• Untuk j tertentu, kurva variabel respon mpk kurva regresi logistik dg variabel respon biner dengan kategori hasil Y ≤ j dan Y > j.
• Kurva yg terbentuk memiliki kemiringan yg sama, namun berbeda posisi secara horisontal lihat gb. 7.3 Agresti (2nd) p.276
• Cumulative logit model
memenuhi:
Model RLO (3)
• Odds ratio dari peluang kumulatif ini disebut rasio kecenderungan kumulatif (cumulative odds ratio)
• Nilai odd utk respon ≤ j pada x = x1 adalah exp[β'(x1 – x2)] kali nilai odds pd x = x2.
• Nilai logaritma dari odds ratio kumulatif proportional thd jarak antara x1 dan x2 berlaku utk setiap logit
• Karena sifat tersebut McCullagh (1980) menyebutnya dg proportional odds model.
• Utk variabel prediktor tunggal, odds ratio kumulatif sama dg exp(β) jika x1 – x2 = 1.
Model RLO (4)
Contoh: Mental Impairment (Agresti (2nd) p. 279)
• Mental impairment
mpk variabel respon
berskala ordinal (well,
mild symptom
formation, moderate
symptom formation,
impaired).
• The life events index
(x1) is a composite
measure of the number
and severity of
important life events
such as birth of child,
new job, divorce, or
death in family that
occurred to the subject
within the past 3 years.
• Socioeconomic status
(x2). SES is measured
here as binary (1 =
high, 0 = low).
Output: Mental Impairment
• Ilustrasi model:
Misal seseorang yg memiliki kategori SES low (x2 = 0) dan rata-rata skor life events (x1) = 4,275, maka prob mental impairment berkategori 1 (well) adalah
Analisis RLO menggunakan SPSS (1)
• Sebuah studi bertujuan untuk melihat faktor-faktor yang mempengaruhi keputusan melanjutkan pendidikan ke jenjang yg lebih tinggi. Penelitian dilakukan terhadap siswa SMA apakah mereka tidak ingin melanjutkan, memiliki keinginan kuat, atau sangat kuat (“apply”, masing-masing diberi kode 0, 1, 2). Variabel yg diteliti meliputi data tentang status pendidikan orang tua (“pared”, kode 0 = maks SMA & 1 = diatas SMA), apakah SMA Swasta (0) atau Negeri (1) (“public”), dan IPK (“gpa”).
• Data yg digunakan bersumber dari http://www.ats.ucla.edu/stat/spss/dae/ologit.htm
RLO mengasumsikan
bhw persamaan yg terbentuk
adalah paralel shg dalam
interpretasi menjadi mudah
Variabel bebas numerik atau yg sudah di”numerik”-kan
Analisis RLO menggunakan SPSS (3)
Output RLO menggunakan SPSS (1)
Karena IPK (gpa)
kuantitatif/kontinu
Semua data valid
digunakan • Digunakan untuk
mengetahui apakah
model dg beberapa
variabel bebas
lebih baik drpd
model tanpa
variabel bebas
(hanya intersep).
• Nilai sig. sebesar
0.000 < (misal
5%) menunjukkan
bahwa model dg
variabel bebas
lebih baik dari
model tanpa
variabel bebas. [email protected]
Output RLO menggunakan SPSS (2)
• Merupakan perkiraan/pendekatan untuk R2 seperti
pada regresi OLS pada model non linier. (pada model
non linier tidak bisa dihitung R2 scr langsung spt pada
model regresi OLS).
• Terdapat banyak jenis pseudo R2, dan masing-masing
akan memberikan nilai perkiraan yg berbeda
• Untuk menguji hipotesis:
H0: Model cocok vs H1: model tidak cocok
• Hasil menunjukkan bahwa nilai sig. (p-value)
> α (misal 5%), yg berarti model regresi cocok
Pendidikan ortu (pared) dan IPK (gpa) signifikan
(pd α = 5%) mempengaruhi keinginan untuk
melanjutkan studi
Test of Parallel Lines
• Tujuan: menguji apakah koefisien slope sama untuk setiap kategori variabel respon
• Hipotesis yg diuji:
H0: H1: