model regresi logistik ordinal

Upload: dyonisius-h-s-jewaru

Post on 01-Mar-2016

42 views

Category:

Documents


5 download

DESCRIPTION

Ordinal Logistic Regression

TRANSCRIPT

  • MODEL REGRESI

    LOGISTIK ORDINAL Ordinal Logistic Regression Model

    Bahan Kuliah

    Sekolah Tinggi Ilmu Statistik

    (STIS)

    Oleh: Agung Priyo Utomo

    [email protected]

  • Contoh-contoh (1)

    Sebuah perusahaan riset pemasaran meneliti faktor yang mempengaruhi ukuran/kandungan soda (kecil, menengah, besar atau ekstra besar) yang orang pesan pada sebuah rumah makan cepat saji. Faktor-faktor yang diteliti termasuk jenis sandwich yang dipesan (burger atau ayam), apakah juga memesan kentang goreng, dan usia konsumen.

    Penelitian tentang faktor-faktor yang mempengaruhi perolehan medali (emas, perak, perunggu) dalam suatu olimpiade renang. Variabel yang diduga berpengaruh adalah lamanya waktu berlatih, diet yang dilakukan, usia, dan popularitas olahraga renang di daerahnya.

    [email protected]

  • Penelitian tentang variabel yang mempengaruhi ketahanan pangan suatu wilayah (sangat tahan pangan, tahan pangan, cukup tahan pangan, tidak tahan pangan). Variabel yang digunakan adalah luas lahan pertanian tanaman pangan, kondisi tanah, PDRB, dan sebagainya.

    Penelitian tentang variabel yang mempengaruhi kemiskinan rumahtangga di suatu wilayah (sangat miskin, miskin, tidak miskin). Variabel yang digunakan adalah pengeluaran untuk konsumsi, jumlah ART yg bekerja, dan sebagainya.

    Contoh-contoh (2)

    [email protected]

  • 1. Cumulative Logits

    Menggunakan peluang kumulatif:

    Shg Cumulative Logits didefinisikan sbg:

    Sebuah model logit [P(Y j)] dpt dipandang seperti model logit dg respon biner dimana kategori 1 s.d j sbg kategori pertama dan kategori j+1 s.d J sbg kategori kedua.

    [email protected]

    Model RLO (1)

  • 2. Proportional Odds Model

    Merupakan model yg secara simultan menggunakan semua cumulative logit:

    Setiap cumulative logit memiliki intersep masing-masing

    Nilai j meningkat seiring dg j, selama P(Y j|x) meningkat seiring dg j utk nilai x yg tetap.

    Model tsb memiliki efek yang sama utk masing-masing logit

    Untuk sebuah variabel prediktor x kontinyu dan J = 4, dpt digambarkan model sbb:

    [email protected]

    Model RLO (2)

  • Untuk j tertentu, kurva variabel respon mpk kurva regresi logistik dg variabel respon biner dengan kategori hasil Y j dan Y > j.

    Kurva yg terbentuk memiliki kemiringan yg sama, namun berbeda posisi secara horisontal lihat gb. 7.3 Agresti (2nd) p.276

    Cumulative logit model

    memenuhi:

    [email protected]

    Model RLO (3)

  • Odds ratio dari peluang kumulatif ini disebut rasio kecenderungan kumulatif (cumulative odds ratio)

    Nilai odds utk respon j pada x = x1 adalah exp['(x1 x2)] kali nilai odds pd x = x2.

    Nilai logaritma dari odds ratio kumulatif proportional thd jarak antara x1 dan x2 berlaku utk setiap logit

    Karena sifat tersebut McCullagh (1980) menyebutnya dg proportional odds model.

    Utk variabel prediktor tunggal, odds ratio kumulatif sama dg exp() jika x1 x2 = 1.

    Penghitungan peluang untuk kategori ke-j sbb:

    [email protected]

    Model RLO (4)

  • Penulisan persamaan regresi logistik ordinal:

    Jika menggunakan SAS:

    Jika menggunakan SPSS:

    [email protected]

    Model RLO (5)

  • [email protected]

    Contoh: Mental Impairment (Agresti (2nd) p. 279)

    Mental impairment mpk variabel respon

    berskala ordinal (well,

    mild symptom

    formation, moderate

    symptom formation,

    impaired).

    The life events index (x1) is a composite

    measure of the number

    and severity of

    important life events

    such as birth of child,

    new job, divorce, or

    death in family that

    occurred to the subject

    within the past 3 years.

    Socioeconomic status (x2). SES is measured

    here as binary (1 =

    high, 0 = low).

  • [email protected]

    Output: Mental Impairment

    Model untuk kasus di atas:

  • [email protected]

    Output: Mental Impairment

    Ilustrasi model:

    Misal seseorang yg memiliki kategori SES low (x2 = 0) dan rata-rata skor life events (x1) = 4,275, maka prob mental impairment berkategori 1 (well) adalah

    Koef. SES = 1,1112; pd index life events yg konstan,

    Kecenderungan seseorang dg SES berkategori 1 untuk memiliki mental well (dibandingkan minimal mild) sebesar exp(1,1112) kali dibandingkan org dg SES berkategori 0.

    Kecenderungan seseorang dg SES berkategori 1 untuk memiliki mental maks mild (dibandingkan minimal moderate) sebesar exp(1,1112) kali dibandingkan org dg SES berkategori 0.

    Kecenderungan seseorang dg SES berkategori 1 untuk memiliki mental maks moderate (dibandingkan dg impaired) sebesar exp(1,1112) kali dibandingkan org dg SES berkategori 0.

  • Analisis RLO menggunakan SPSS (1)

    Sebuah studi bertujuan untuk melihat faktor-faktor yang mempengaruhi keputusan melanjutkan pendidikan ke jenjang yg lebih tinggi. Penelitian dilakukan terhadap siswa SMA apakah mereka tidak ingin melanjutkan, memiliki keinginan kuat, atau sangat kuat (apply, masing-masing diberi kode 0, 1, 2). Variabel yg diteliti meliputi data tentang status pendidikan orang tua (pared, kode 0 = maks SMA & 1 = diatas SMA), apakah SMA Swasta (0) atau Negeri (1) (public), dan IPK (gpa).

    Data yg digunakan bersumber dari http://www.ats.ucla.edu/stat/spss/dae/ologit.htm

    [email protected]

  • Menu yg dipilih:

    [email protected]

    Analisis RLO menggunakan SPSS (2)

  • RLO mengasumsikan

    bhw persamaan yg terbentuk

    adalah paralel shg dalam

    interpretasi menjadi mudah

    Variabel bebas numerik atau yg sudah dinumerik-kan

    [email protected]

    Analisis RLO menggunakan SPSS (3)

  • Output RLO menggunakan SPSS (1)

    Karena IPK (gpa)

    kuantitatif/kontinu

    Semua data valid

    digunakan Digunakan untuk

    mengetahui apakah

    model dg beberapa

    variabel bebas

    lebih baik drpd

    model tanpa

    variabel bebas

    (hanya intersep).

    Nilai sig. sebesar 0.000 < (misal

    5%) menunjukkan

    bahwa model dg

    variabel bebas

    lebih baik dari

    model tanpa

    variabel bebas. [email protected]

  • Output RLO menggunakan SPSS (2)

    Merupakan perkiraan/pendekatan untuk R2 seperti pada regresi OLS pada model non linier. (pada model

    non linier tidak bisa dihitung R2 scr langsung spt pada

    model regresi OLS).

    Terdapat banyak jenis pseudo R2, dan masing-masing akan memberikan nilai perkiraan yg berbeda

    Untuk menguji hipotesis: H0: Model cocok vs H1: model tidak cocok

    Hasil menunjukkan bahwa nilai sig. (p-value) > (misal 5%), yg berarti model regresi cocok

    Pendidikan ortu (pared) dan IPK (gpa) signifikan

    (pd = 5%) mempengaruhi keinginan untuk melanjutkan studi

    [email protected]

  • Test of Parallel Lines

    Tujuan: menguji apakah koefisien slope sama untuk setiap kategori variabel respon

    Hipotesis yg diuji:

    H0: H1:

    [email protected]

  • Penulisan Persamaan & Interpretasi

    Persamaan regresi logistik ordinal:

    ( 0

    ( > 0)= 2,203 1,048 + 0,059 0,616

    ( 1

    ( > 1)= 4,299 1,048 + 0,059 0,616

    Interpretasi: Tanda (-) pd variabel pared berarti siswa dg org tua berpendidikan diatas SMA

    memiliki kecenderungan yg lebih kecil (dibandingkan siswa dg ortu berpendidikan maks SMA) utk tidak ingin melanjutkan (dibandingkan minimal memiliki keinginan kuat utk melanjutkan studi)

    Koef variabel pared = -1,048, berarti siswa dg org tua berpendidikan diatas SMA memiliki kecenderungan sebesar 0,3506 kali (dibandingkan siswa dg ortu berpendidikan maks SMA) utk tidak ingin melanjutkan (dibandingkan minimal memiliki keinginan kuat utk melanjutkan studi)

    Koef variabel pared = -1,048, berarti siswa dg org tua berpendidikan diatas SMA memiliki kecenderungan sebesar 0,3506 kali (dibandingkan siswa dg ortu berpendidikan maks SMA) utk maks memiliki keinginan kuat untuk melanjutkan (dibandingkan memiliki keinginan sangat kuat utk melanjutkan studi)

    [email protected]

  • LATIHAN

    [email protected]

    Table 7.19 refers to a clinical trial for the treatment of small-cell lung cancer. Patients were randomly assigned to two treatment groups. The sequential therapy administered the same combination of chemotherapeutic agents in each treatment cycle; the alternating Therapy had three different combinations, alternating from cycle to cycle.

    a) Fit a cumulative logit model with main effects for treatment and gender. Interpret.

    b) Fit the model that also contains an interaction term. Interpret. Does it fit better? Explain why it is equivalent to using the four gender treatment combinations as levels of a single factor.