logistic วช ใหม่rlc.nrct.go.th/download/research_zone/phase14_4.pdf · uthaithip...

14
การวิเคราะหการถดถอยพหุโลจิสติกส (Multiple logistic regression) ผศ.ดร.อุทัยทิพย เจี่ยวิวรรธนกุล ภาควิชาศึกษาศาสตร คณะสังคมศาสตรและมนุษยศาสตร มหาวิทยาลัยมหิดล เอกสารประกอบการบรรยาย Research Zone Phrase 14 วันที7 เมษายน 2553 ศูนยการเรียนรูทางการวิจัย สํานักงานคณะกรรมการวิจัยแหงชาติ (วช.) กรุงเทพมหานคร Uthaithip Jiawiwatkul / 2 Logistic Regression ใชศึกษาความสัมพันธระหวางตัวแปรอิสระกับตัวแปรตาม (และ interaction ระหวางตัวแปรอิสระที่มีตอตัวแปรตาม) พยากรณโอกาสที่จะเกิดเหตุการณที่สนใจ จากชุดของตัวแปรอิสระทีเหมาะสม Uthaithip Jiawiwatkul / 3 Type of Logistic Regression แบงตามจํานวนตัวแปร - Simple logistic regression - Multiple logistic regression แบงตามระดับการวัดของตัวแปรตาม - Binary logistic regression - Multinomial (Polytomous) logistic regression - Ordinal logistic regression Uthaithip Jiawiwatkul / 4 Binary Logistic Regression ลักษณะของตัวแปรที่ใชใน Binary Logistic Regression - ตัวแปรตาม (Y) dichotomous (binary) (เชน ปวย / ไมปวย) - ตัวแปรอิสระ (X) continuous categorical (การนําเขาสมการตองแปลงใหเปนตัวแปรหุ)

Upload: others

Post on 10-Jun-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

การวเคราะหการถดถอยพหโลจสตกส (Multiple logistic regression)

ผศ.ดร.อทยทพย เจยววรรธนกลภาควชาศกษาศาสตร คณะสงคมศาสตรและมนษยศาสตร

มหาวทยาลยมหดลเอกสารประกอบการบรรยาย Research Zone Phrase 14

วนท 7 เมษายน 2553 ณ ศนยการเรยนรทางการวจย สานกงานคณะกรรมการวจยแหงชาต (วช.) กรงเทพมหานคร

Uthaithip Jiawiwatkul / 2

Logistic Regression

• ใชศกษาความสมพนธระหวางตวแปรอสระกบตวแปรตาม(และ interaction ระหวางตวแปรอสระทมตอตวแปรตาม)

• พยากรณโอกาสทจะเกดเหตการณทสนใจ จากชดของตวแปรอสระทเหมาะสม

Uthaithip Jiawiwatkul / 3

Type of Logistic Regression• แบงตามจานวนตวแปร- Simple logistic regression

- Multiple logistic regression

• แบงตามระดบการวดของตวแปรตาม

- Binary logistic regression- Multinomial (Polytomous) logistic regression - Ordinal logistic regression

Uthaithip Jiawiwatkul / 4

Binary Logistic Regression

• ลกษณะของตวแปรทใชใน Binary Logistic Regression

- ตวแปรตาม (Y)dichotomous (binary) (เชน ปวย / ไมปวย)

- ตวแปรอสระ (X)continuous categorical (การนาเขาสมการตองแปลงใหเปนตวแปรหน)

Page 2: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 5

Assumptions

• คาคลาดเคลอน (error) เปนอสระตอกน(independent sampling)

• ไมมปญหา multicolinearity ระหวางตวแปรอสระ

Uthaithip Jiawiwatkul / 6

ตวอยางการศกษาทใช Logistic Regression

นกวจยตองการศกษาวาเวลาทใชในการทาขอสอบมความสมพนธกบผลการสอบของนกศกษาหรอไม

ตวแปรอสระ คอ เวลาทใชในการทาขอสอบ (นาท)

ตวแปรตาม คอ ผลของการสอบ (ผาน / ตก)(ผาน =1 ตก = 0 )

Uthaithip Jiawiwatkul / 750.949.749.147.746.844.944.039.938.032.922.718.29.3

เวลา(นาท)

169.2157.4142.0127.0118.8113.2111.3109.9108.6104.8

เวลา(นาท)

ผานผาน90.9ผาน72.3ตกผานตก90.0ตก71.2ตกผานผาน89.4ตก68.9ตกผานผาน86.0ผาน64.1ตกผานตก85.0ตก62.2ตกผานผาน80.6ตก61.7ตกผานตก79.1ผาน60.1ตก

ตก101.6ผาน75.3ตกผาน97.2ตก74.6ตกตก96.6ผาน73.2ผาน

ผานตก91.5ผาน73.0ตก

ผานผาน77.7ตก53.7ตกผานตก76.3ตก50.9ตก

ผลการสอบ ผลการสอบเวลา(นาท)ผลการสอบเวลา(นาท)ผลการสอบผลการสอบและเวลาทใชในทาขอสอบของนกศกษา (ขอมลดบ - hypothetical data)

ตวอยางการศกษาทใช Logistic Regression

Uthaithip Jiawiwatkul / 8

ตวอยางการศกษาทใช Logistic Regression

เวลาทใชในการ จานวน จานวน สดสวนของ ทาขอสอบ นศ. นศ.ทสอบผาน นศ.ทสอบผาน

(นาท)

ผลการสอบและเวลาทใชในทาขอสอบของนกศกษา (ขอมลทจดกลมแลว)

Page 3: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 9

เวลาทใชในการทาขอสอบ(นาท)

สดสวนของผทสอบผาน

ผาน

ตก

ความสมพนธระหวางเวลาทใชในการทาขอสอบกบผลการสอบของนกศกษา Uthaithip Jiawiwatkul / 10

OLS regression model ของความสมพนธระหวางเวลาทใชในการทาขอสอบกบผลการสอบ ซงโมเดลไมเหมาะสมกบลกษณะขอมล

เวลาทใชในการทาขอสอบ(นาท)

สดสวนของผทสอบผาน

Uthaithip Jiawiwatkul / 11

Logistic Curve for Predicted Probability (P)

x

x

βα

βα

+

+

+=

e1e P

เวลาทใชในการทาขอสอบ(นาท)

สดสวนของผทสอบผาน

Logistic regression model ของความสมพนธระหวางเวลาทใชในการทาขอสอบกบผลการสอบ ซงเปนโมเดลทเหมาะสมกบลกษณะขอมล

คา e = 2.71828

Uthaithip Jiawiwatkul / 12

Exponential function

เวลาทใชในการทาขอสอบ(นาท)

Odds ของ ผทสอบผาน

ความสมพนธระหวางเวลาทใชในการทาขอสอบกบ Odds ของการสอบผาน

e1

)( βxα+=−

=P

PPOdds

Odds คออตราสวนความนาจะเปนของการเกดเหตการณทศกษา (P) กบความนาจะเปนทจะไมเกดเหตการณทศกษา (1-P)

Page 4: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 13

Logit Transformation

βxα (P) odds log +=

เวลาทใชในการทาขอสอบ(นาท)

Log odds ของ ผทสอบผาน

ความสมพนธระหวางเวลาทใชในการทาขอสอบกบ Log odds ของการสอบผาน

Uthaithip Jiawiwatkul / 14

เวลาทใชในการทาขอสอบ

เวลาทใชในการทาขอสอบ

เวลาทใชในการทาขอสอบ

สดสวนของ ผทสอบผาน

Odds ของ ผทสอบผาน

Log odds ของ ผทสอบผาน

Uthaithip Jiawiwatkul / 15

Logistic Regression Equation 1) ความนาจะเปนของการเกดเหตการณ (P)

2) Odds ของการเกดเหตการณ : Odds of P e

P-1P βxα+=

log(odds of P ) = logit (P) =

βxαP1-

P log +=⎟⎠⎞

⎜⎝⎛

ε++ βxα

3) การแปลงใหเปนเสนตรง

βxα

βxα

e1eP +

+

+=

Uthaithip Jiawiwatkul / 16

Log odds (P) หรอ logit (P) = α + β 1 X1 + β 2 X2 +…..+ βk Xk + ε

Multiple Logistic Regression Model

เมอ P คอความนาจะเปนหรอโอกาสทจะเกดเหตการณทสนใจศกษาα คอสวนตดแกน Y (intercept) หรอ คาของ Y เมอ X เทากบ 0β k คอคาคงท หรอ ความชน (slope) ของเสนตรง แสดงถงอตราการ

เปลยนแปลงของ Y เมอ Xk เปลยนไป 1 หนวย โดยทตวแปรอสระX อนๆ คงท

ε คอความคลาดเคลอนของการพยากรณ

Page 5: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 17

การประมาณคาพารามเตอร

)]ˆ1ln()1()ˆln([1

iiiiN

iYYYY −−+∑=

=Log likelihood

การประมาณคาพารามเตอร ใชวธ Maximum likelihood

Uthaithip Jiawiwatkul / 18

การแปลผลคาสมประสทธถดถอย

การแปลผลจากคา coefficient (β) จะบอกทศทางและขนาด ความสมพนธ เหมอนใน linear regression

เครองหมายของ β แสดงทศทางของความสมพนธเครองหมาย + แสดงความสมพนธเชงบวก เครองหมาย - แสดงความสมพนธเชงลบ (ผกผน / ตรงขาม)ขนาดของ β บอกความมากนอยของความสมพนธ

Uthaithip Jiawiwatkul / 19

การประมาณคาพารามเตอรและการแปลผลจากตวอยาง ผลการวเคราะห คอ

Coefficient SE eβ time 0.059 0.018 1.061 Constant -4.641 1.383 111 X 0.059 4.641- Xβα odds(P) log +=+=

จากคา β แสดงถงความสมพนธเชงบวกระหวางเวลาในการทาขอสอบกบ ผลการสอบ

ซงการแปลผล logit model จะคอนขางยากตอการเขาใจ ตวอยางเชน

: เมอ x1 เทากบศนย log(odds) หรอ logit(P) = -4.641

: เมอ x1 เปลยนไป 1 หนวย log(odds) of P หรอ logit(P) เปลยนไป 0.059Uthaithip Jiawiwatkul / 20

การประมาณคาพารามเตอรและการแปลผล• การแปลผลจากคา Odd ratio (OR) จะงายตอการเขาใจมากกวา • Odd ratio (OR) คออตราการเปลยนแปลงของความนาจะเปนหรอโอกาส

ทจะเกดเหตการณทสนใจ เมอตวแปรอสระเปลยนไปหนงหนวยβα += eOdds xy /

αeOdds xy=

−/

คา Odds ของ y เมอ x มคา 1 หนวย :

คา Odds ของ y เมอ x มคาเทากบ 0 หนวย :

β log(OR)

e e eOR

=

==+

βα

βα

ดงนน คา Odd ratio (OR) จะเทากบ

β (OR)ln =หรอดงนน

Page 6: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 21

การแปลผลดวยคา Odds ratio

กรณคา OR < 1 นยมอานผลเปน รอยละการเปลยนแปลงของคา Odds คานวณจาก (Odds ratio -1) *100

• Odds ratio >1 แสดงวาเมอ X เพมขน ทาใหโอกาสของการเกดเหตการณเพมขนเมอ x เปลยนไป 1 หนวย โอกาสทจะเกดเหตการณทสนใจ จะเพมขน ........ เทา เมอ เทยบกบคาเดมของ x หรอ เพมขน ……% (คาสมประสทธถดถอย จะมคาเปนบวก)

• Odds ratio <1 แสดงวาเมอ X เพมขน ทาใหโอกาสของการเกดเหตการณลดลง เมอ X เปลยนไป 1 หนวย โอกาสทจะเกดเหตการณทสนใจ จะลดลง ......... เทา เมอเทยบกบคาเดมของ x หรอ ลดลง .......% (คาสมประสทธถดถอย จะมคาเปนลบ)

จงนยมใชคา Odds ratio (OR)หรอ Exp(B) หรอ eB ในการแปลผลถาคา Odds ratio = 1 แสดงวาการเปลยนแปลงของ X ไมมผลตอ y (และการทดสอบทางสถตจะพบวา คา 95% CI ครอม 1)

Uthaithip Jiawiwatkul / 22

ตวอยางการแปลผลดวยคา Odds ratio• จากตวอยาง Odds ratio = eβ = e0.059 = 1.061

: ถาคา OR มากกวา 1 เมอ x เปลยนไป 1 หนวย คา odds หรอโอกาสทจะเกดเหตการณ จะเพมขน 1.06 เทาเมอเทยบกบคาเดมของ x หรอเพมขน 6 %

หรอกลาวไดวา “เมอเวลาทใชในการทาขอสอบเพมขน 1 นาท โอกาสทนกศกษาจะสอบผานเพมขน 1.06 เทา หรอเพมขน 6%” [มาจาก (1.06-1)*100]

- ถาคานอย OR กวา 1 สมมตวามการเพมตวแปร x2 : จานวนครงทขาดเรยน เขาไปในสมการและพบวาคา Odds ratio ของตวแปรน = 0.15 แสดงวาเมอ X2 เปลยนไป 1 หนวย โอกาสทจะเกดเหตการณ จะลดลง 0.15 เทาเมอเทยบกบคาเดมของ x2 หรอ ลดลง 85 % หรอกลาวไดวา “เมอจานวนครงทขาดเรยนเพมขน 1 ครง โอกาสทนกศกษาจะสอบผานลดลง 0.15 เทา หรอลดลง 85%” [มาจาก(0.15-1)*100]

Uthaithip Jiawiwatkul / 23

การประมาณคาชวงความเชอมน

)SEZ(2e αβ±

=)SE 1.96(e ±= β

95 % CI for odds ratio

ประมาณคาชวงความเชอมนของคา coefficients ไดจาก

95 % CI for β SEZ2

αβ ±=

SE96.1±= β

ประมาณคาชวงความเชอมน (Confidence Interval) ของ Odds ratio : OR ไดจาก

Uthaithip Jiawiwatkul / 24

การทดสอบ Goodness of Fit ของ Model

Hosmer Lemeshow Statistic TestHo : Model fit

คา Likelihood Estimation (MLE)- การเปรยบเทยบคา -2 log likelihood (-2LL หรอเรยก Deviance: D ) ของโมเดลท

มคานตากวา แสดงถงความเหมาะสมของโมเดลทดกวา คา Model chi-square หรอ model likelihood ratio (LR) หรอ G2

ใชในการทดสอบ overall model วาม นยสาคญทาง สถตหรอไม Ho : β1 = β2 = ...... = βk = 0

คานวณจาก -2 log likelihood ของ null หรอ initial model (โมเดลทไมมตวแปร อสระอยเลย) ลบดวย - 2 log likelihood ของ full model (โมเดลทมตวแปรอสระอย) คาทคานวณไดมการแจกแจงแบบ chi-square ทม degree of freedom (df) เทากบจานวนตวแปรอสระ

Page 7: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 25

การทดสอบ Goodness of Fit ของ Model

Pseudo R2 คลายคา R2 ใน Multiple regression คอคาของความ แปรปรวนของตวแปรตามทสามารถอธบายไดโดยตวแปรอสระ

ใน logistic regression มคาทจดวาเปน Pseudo R2 หลายคา - Cox & Snell- R2 - Nagelkerke- R2 - McFadden's-R2

Classification table แสดงการคานวณคาความนาจะเปนของการพยากรณ ของโมเดล (predictive efficiency) ถาคาความนาจะเปนมากกวาหรอเทากบ 0.5 คาดวาจะเกดเหตการณนน คาของ Percent correct prediction ทสง แสดงวาโมเดลนนมความแมนยาในการพยากรณด

Uthaithip Jiawiwatkul / 26

การทดสอบคาพารามเตอรในโมเดล

1) Wald statisticWald statistic = (b/SE)2

H0 : βk = 0

H1 : βk ≠ 0

Uthaithip Jiawiwatkul / 27

การทดสอบคาพารามเตอรในโมเดล2) Likelihood Ratio Test (LR) คานวณจาก

LR = -2 log likelihood ของ constrained model ลบดวย -2 log likelihood ของunconstrained model constrained model (restricted model) คอ โมเดลทมจานวนตวแปรอสระนอยกวา unconstrained model (non-restricted model) คอ โมเดลทมจานวนตวแปรอสระมากกวา

• คาทคานวณไดมการแจกแจงแบบ chi-square ทม degree of freedom (df) เทากบจานวนตวแปรอสระของทงสองโมเดลลบกน

• ถา P VALUE ของ chi-square ทไดจากการคานวณน < .05 (ระดบนยสาคญทตงไว) แสดงวา reject Ho คอโมเดลทมตวแปรอสระใหมทเพมเขาไปนน ดกวา model เดมทไมมตวแปรอสระตวนน

Uthaithip Jiawiwatkul / 28

สรปขนตอนการวเคราะหและแปลผล 1. การเลอกสมการทเหมาะสม โดยพจารณาจาก Goodness of Fit ของ model2. การทดสอบคาพารามเตอร โดยพจารณาจาก

- Walds Statistic- Likelihood Ratio Test

3. การแปลผลจากสมการทได : ตวแปรอสระใดบางทสมพนธกบตวแปรตาม: ระบทศทาง และขนาดของความสมพนธของตวแปรอสระทสมพนธกบตวแปร

ตามนน: สามารถหาคาความนาจะเปนหรอโอกาสของการเกดเหตการณทสนใจได เมอ

ทราบคณลกษณะตางๆ ของผนน (เมอทราบคา X สามารถพยากรณความนาจะเปนของ คา Y ได)

Page 8: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 29

ตวอยางท 1: การวเคราะห binary logistic regression

• นกวจยตองการทราบปจจยใดบางทมอทธพลตอการถกละเมดทางเพศของสตร จงทบทวนวรรณกรรม สรางแบบสอบถามและเกบขอมลจากกลมตวอยางทเปนผหญงจานวน 120 คน โดยถามถงประสบการณการถกละเมดทางเพศในรอบ 1 ปทผานมา, อาย, ลกษณะการทางาน, รสนยมในการแตงกาย และระดบการศกษา

Uthaithip Jiawiwatkul / 30

Categorical Variables Coding

ในกรณทตวแปรอสระเปนตวแปรเชงกลม (categorical data) การนาเขาสมการตองทาเปนตวแปรหน (dummy variables) และกาหนดชนทใชเปรยบเทยบ(reference category)

Categorical Variables Codings

47 1.000 .000

45 .000 1.000

28 .000 .000

primary andsecondary schobachelor degremaster anddoctoral degree

education ofrespondent

Frequency (1) (2)Parameter coding

Reference category

Uthaithip Jiawiwatkul / 31

Omnibus Tests of Model Coefficients

43.142 5 .00043.142 5 .00043.142 5 .000

StepBlockModel

Step 1Chi-square df Sig.

Model Summary

122.680 .302 .403Step1

-2 Loglikelihood

Cox & SnellR Square

Nagelkerke RSquare

Classification Table a

40 16 71.414 50 78.1

75.0

ObservedNoYes

experience ofsexual abuse

Overall Percentage

Step 1No Yes

experience of sexualabuse Percentage

Correct

Predicted

The cut value is .500a.

ผลการทดสอบ goodness of fit ของโมเดล

Hosmer and Lemeshow Test

18.435 8 .018Step1

Chi-square df Sig.

Uthaithip Jiawiwatkul / 32

Variables in the Equation

-.041 .020 4.319 1 .038 .9601.787 .459 15.150 1 .000 5.9721.195 .479 6.229 1 .013 3.305

4.194 2 .1231.178 .641 3.375 1 .066 3.2481.178 .624 3.567 1 .059 3.248

-1.219 .826 2.175 1 .140 .296

AGEWORKDRESSINGEDUEDU(1)EDU(2)Constant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, WORK, DRESSING, EDU.a.

- อาย ลกษณะการทางานและรสนยมในการแตงกายของผหญงมผลตอการถกละเมดทางเพศอยางมนยสาคญทางสถต ทระดบ 0.05 โดย - เมออายเพมขน 1 ป โอกาสถกละเมดทางเพศจะลดลง 4% (มาจาก 0.96-1*100)- ผหญงททางานในเวลากลางคน จะมความเสยงตอการถกละเมดทางเพศประมาณ 6 เทาเมอเปรยบเทยบกบผหญงททางานในเวลากลางวน - ผหญงทมชอบแตงตวเซกซ จะมโอกาสถกละเมดทางเพศสงกวาผหญงทแตงตวเรยบรอย 3 เทา

Page 9: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 33

การแปลผลเมอตวแปรอสระเปนตวแปรเชงกลม• ในกรณทตวแปรอสระเปน categorical data การนาเขาสมการตองทาเปนตว

แปรหน (dummy variable) และกาหนดชนทใชเปรยบเทยบ (reference หรอ baseline category )

• จานวนตวแปร dummy จะเทากบ จานวนชนของตวแปรนน – 1

• เชน หากตวแปรอสระ คอ ระดบระดบการศกษา (edu) ซงม 3 ระดบ ไดแก ปรญญาเอก,ปรญญาโท และปรญญาตร จะตองสรางตวแปร dummy ขนใหม เทากบ 3-1

• สามารถเลอกกาหนดชนสงสด หรอตาสดเปนชนเปรยบเทยบ Uthaithip Jiawiwatkul / 34

ตวอยางท 2: การแปลผลเมอตวแปรอสระเปนตวแปรเชงกลม

นกวจยตองการศกษาวาระดบการศกษา และอาย มความสมพนธกบการแตงงานของสตรหรอไมตวแปรตาม: การแตงงาน (แตงงาน/ไมแตงงาน)คอ แตงงาน (รหส 1) ไมแตงงาน (รหส 0)

ตวแปรอสระ: อาย วดเปนอายจรง (ป)ระดบการศกษา แบงเปน 3 ระดบ คอ ปรญญาตร ปรญญาโท ปรญญาเอก

Uthaithip Jiawiwatkul / 35

Model Summary

153.070 .281 .374Step1

-2 Loglikelihood

Cox & SnellR Square

Nagelkerke RSquare

Classification Table a

46 24 65.719 56 74.7

70.3

Observednot marrymarry

marital status

Overall Percentage

Step 1not marry marry

marital status PercentageCorrect

Predicted

The cut value is .500a.

Omnibus Tests of Model Coefficients

47.770 3 .00047.770 3 .00047.770 3 .000

StepBlockModel

Step 1Chi-square df Sig.

Hosmer and Lemeshow Test

6.700 7 .461Step1

Chi-square df Sig.

ผลการทดสอบ goodness of fit ของโมเดล

Uthaithip Jiawiwatkul / 36

Variables in the Equation

12.771 2 .0021.985 .556 12.769 1 .000 7.2811.151 .510 5.094 1 .024 3.162-.163 .032 26.317 1 .000 .8503.727 .971 14.748 1 .000 41.554

EDUEDU(1)EDU(2)AGEConstant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: EDU, AGE.a.

Categorical Variables Codings

49 1.000 .00064 .000 1.00032 .000 .000

bechelor degreemaster degreedoctoral degree

educationFrequency (1) (2)

Parameter coding

- โอกาสทจะแตงงานของสตรทจบปรญญาตร เทากบ 7.28 เทาเมอเปรยบเทยบกบสตรทจบปรญญาเอก ในขณะทโอกาสทจะแตงงานของสตรทจบปรญญาโท เทากบ 3.16 เทาเมอเปรยบเทยบกบสตรทจบปรญญาเอก

- เมออายเพมขน 1 ป โอกาสทจะแตงงานของสตรจะลดลง 0.85 เทา หรอลดลง 15 % ( มาจาก 0.85 -1 *100)

กลมอางอง

Page 10: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 37

Variables in the Equation

12.771 2 .002-.834 .465 3.221 1 .073 .434

-1.985 .556 12.769 1 .000 .137-.163 .032 26.317 1 .000 .8505.712 1.047 29.742 1 .000 302.535

EDUEDU(1)EDU(2)AGEConstant

Step1a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: EDU, AGE.a.

Categorical Variables Codings

49 .000 .00064 1.000 .00032 .000 1.000

bechelor degreemaster degreedoctoral degree

educationFrequency (1) (2)

Parameter coding

สตรทจบปรญญาโท มโอกาสทจะแตงงานนอยกวาสตรทจบปรญญาตร 57% [(0.43-1)*100] และสตรทจบปรญญาเอก มโอกาสทจะแตงงานนอยกวาสตรทจบปรญญาตร 86 % [(0.14-1)*100]

หากเปลยนกลมอางองใหม

Uthaithip Jiawiwatkul / 38

การพยากรณคาความนาจะเปนหรอโอกาสของ การเกดเหตการณทสนใจ

• เมอไดสมการณพยากรณ กสามารถทจะคานวณหาคาความนาจะเปนโอกาสของการเกดเหตการณทสนใจ (P)ไดจาก

n11

n11

xβxβα

xβxβα

n

n

.....

.....

e1e

++

++

+=P

Uthaithip Jiawiwatkul / 39

ตวอยางท 3: การพยากรณโอกาสของการเกดเหตการณทสนใจ

นกวจยตองการศกษาอทธพลของเพศและอายตอการใชสารเสพตด

x1 คอ ตวแปรเพศ (ชาย / หญง ) และ x2 คอ ตวแปรอาย (ป) และ Y คอการใชสารเสพตด (เสพ = 1 และไมเสพ = 0)

ผลจากการวเคราะหขอมลไดคา α = 0.5 และ βx1 =1.5 และ βx2 = -0.2ดงนน ถาตองการหาวานายสมศกด (X1=1) ทมอาย 15 ป (X2=15) จะมโอกาสเสยงตอการใชสารเสพตดเทาใด จะคานวณไดจาก

86.0e1

e0.2(15)1.5(1)0.5

0.2(15)1.5(1)0.5

=+

= −+

−+

Pแปลผล : นายสมศกด จะมโอกาสเสยงตอการใชสารเสพตด 86 %

Uthaithip Jiawiwatkul / 40

ตวอยางท 4 : การวเคราะหเปรยบเทยบระหวางโมเดล

• นกวจยตองการศกษาปจจยทมอทธพลตอการออมของวยผใหญตอนปลายและวยสงอายตอนตน

• จากการทบทวนวรรณกรรม พบวามปจจยทเกยวของ 2 กลม คอ ปจจยสวนบคคล คอ อาย เพศ และความพงพอใจในชวต และปจจยดานครวเรอน คอ รายไดของครวเรอน และจานวนบตรทอยอาศยในครวเรอนเดยวกน

Page 11: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 41

• ตวแปรตาม จานวนเงนออม (ออม รหส 1 / ไมไดออม รหส 0 )

• ตวแปรอสระModel ท 1 ประกอบดวยปจจยสวนบคคล

อาย (ป)เพศ (ชาย/หญง)ความพงพอใจชวต (สง / ตา)

Model ท 2 ประกอบดวยปจจยสวนบคคล และปจจยดานครวเรอนอาย (ป)เพศ (ชาย/หญง)

ความพงพอใจชวต (สง / ตา)รายไดครวเรอน (บาทตอเดอน)จานวนบตรทอยอาศยในครวเรอนเดยวกน (คน) Uthaithip Jiawiwatkul / 42

Model ท 1Omnibus Tests of Model Coefficients

100.804 3 .000100.804 3 .000100.804 3 .000

StepBlockModel

Step 1Chi-square df Sig.

Iteration History a,b,c

160.926 .624160.913 .645160.913 .646

Iteration123

Step0

-2 Loglikelihood Constant

Coefficients

Constant is included in the model.a.

Initial -2 Log Likelihood: 160.913b.

Estimation terminated at iteration number 3 becauseparameter estimates changed by less than .001.

c.

Model Summary

60.110 .554 .765Step1

-2 Loglikelihood

Cox & SnellR Square

Nagelkerke RSquare

การทดสอบ goodness of fit ดวย model chi-square (model likelihood ratio) คอ (-2LL null model) –(-2LL model ท 1) =160.913 - 60.110 = 100.804, df 3 ซงมนยสาคญทางสถต

Uthaithip Jiawiwatkul / 43

Hosmer and Lemeshow Test

5.006 7 .659Step1

Chi-square df Sig.

Model ท 1

Model ท 2

Hosmer and Lemeshow Test

10.050 8 .262Step1

Chi-square df Sig.

Uthaithip Jiawiwatkul / 44

Classification Table a

36 7 83.77 75 91.5

88.8

Observednot savesave

saving money

Overall Percentage

Step 1not save save

saving money PercentageCorrect

Predicted

The cut value is .500a.

Model ท 1

Model ท 2Classification Table a

38 5 88.44 78 95.1

92.8

Observednot savesave

saving money

Overall Percentage

Step 1not save save

saving money PercentageCorrect

Predicted

The cut value is .500a.

Page 12: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 45

Omnibus Tests of Model Coefficients

115.428 5 .000115.428 5 .000115.428 5 .000

StepBlockModel

Step 1Chi-square df Sig.

Model Summary

45.485 .603 .833Step1

-2 Loglikelihood

Cox & SnellR Square

Nagelkerke RSquare

Model ท 2

Likelihood ratio test = (-2LL constrained model คอ model ท 1) – (-2LL unconstrained model คอ model ท 2) = 60.110 - 45.485 = 14.625, df 2 มคา p-value = 0.0006 แสดงวาการเพมปจจยดานครวเรอนเขาไป ในโมเดลท 2 มนยสาคญสาคญทางสถต

model likelihood ratio คอ (-2LL null model) – (-2LL model ท 1) = 160.913 -45.485 = 115.428, df 5 ซงมนยสาคญทางสถต

Uthaithip Jiawiwatkul / 46

Variables in the Equation

.348 .076 20.896 1 .000 1.416

.191 .534 .128 1 .720 1.2112.001 .733 7.451 1 .006 7.396

-18.391 3.960 21.572 1 .000 .000

AGESEXLIFE_SATConstant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, SEX, LIFE_SAT.a.

Model ท 1

โมเดลท 1 ประกอบดวยปจจยสวนบคคล ซงมตวแปรทมนยสาคญสองตว คอ อาย (B = 0.348, OR = 1.416) และความพงพอใจในชวต ((B = 2.001, OR = 7.396) ซงมความสมพนธในทางบวกตอการออมของผสงอาย

Uthaithip Jiawiwatkul / 47

Variables in the Equation

.352 .092 14.574 1 .000 1.422

.084 .649 .017 1 .897 1.0881.999 .861 5.385 1 .020 7.382.000 .000 .223 1 .637 1.000

-1.139 .386 8.714 1 .003 .320-16.075 4.731 11.544 1 .001 .000

AGESEXLIFE_SATH_INCOMECHILDRENConstant

Step1

a

B S.E. Wald df Sig. Exp(B)

Variable(s) entered on step 1: AGE, SEX, LIFE_SAT, H_INCOME, CHILDREN.a.

Model ท 2

โมเดลท 2 ซงประกอบดวยปจจยสวนบคคลและปจจยครวเรอน มตวแปรทมอทธพลตอตอการออมของผสงอายอยางมนยสาคญทางสถต คอ อาย ความพงพอใจในชวตและจานวนบตรทอาศยอยในครวเรอนเดยวกน โดยทเมออายเพมขน 1 ป ผสงอายจะมการออมเพมขน 1.42 เทา และผสงอายทมความพงพอใจในชวตสง จะมการออมสงกวาผสงอายทมความพงพอใจในชวตตาถง 7.39 เทา และเมอจานวนบตรทอาศยอยในครวเรอนเพมขน 1 คน ผสงอายจะมการออมลดลง 68 % (0.32-1 * 100%)

Uthaithip Jiawiwatkul / 48

Multinomial Logistic Regression

• ลกษณะของตวแปรทใชใน Multinomial Logistic Regression

- ตวแปรตาม (Y) เปน categorical variables ทมคามากกวา 2 คา เชน การใชบรการคมกาเนด แบงเปน 3 วธ คอ แบบถาวร , แบบชวคราว และ แบบดงเดม

- ตวแปรอสระ (x)continuous categorical (การนาเขาสมการตองแปลงใหเปนตวแปรหน)

Page 13: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 49

Multinomial Logistic Regression

• การวเคราะหจะตองกาหนดคาของตวแปรตามคาหนงใหเปน baseline or reference category แลววเคราะหเปรยบเทยบระหวางคาทเหลอกบ base line category นน

• จานวนสมการ เทากบ (จานวนคาของตวแปรตาม -1 )

• Log [P(category i) / P(category j) ] = ai + bi1 x1 + …….+ bikx1k

Uthaithip Jiawiwatkul / 50

ตวอยางท 5: Multinomial Logistic Regression• นกวจยตองการศกษาความสมพนธระหวางการเรยนหนงสอของ

สตรกบการใชเลอกใชวธคมกาเนดของสตร -ซงมการนาตวแปรควบคมอนๆ เขามาวเคราะหรวมดวย แตในทน ขอยก ตวอยางเฉพาะตวแปรเดยว คอ การเรยนหนงสอของสตร (เรยน/ไมไดเรยน)

- ถากาหนดใหการคมกาเนดแบบดงเดม เปน baseline category จะไดสมการ logistic สองสมการ คอ

สมการท 1 log[ P(ถาวร) / P(ดงเดม)] = a1 + b11 (เรยนหนงสอ)

สมการท 2 log[ P(ชวคราว) / P(ดงเดม)] = a2 + b21 x (เรยนหนงสอ)

Uthaithip Jiawiwatkul / 51

Model Fitting Information

32.92716.166 16.761 2 .000

ModelIntercept OnlyFinal

-2 LogLikelihood Chi-Square df Sig.

คา chi-square ของการทดสอบมนยสาคญ สรปไดวาสมการพยากรณนมความเหมาะสม เพราะตวแปรอสระในสมการมความสมพนธกบการเลอกใชวธการคมกาเนด

Uthaithip Jiawiwatkul / 52

การแปลผลการวเคราะห Multinomial Logistic RegressionParameter Estimates

.758 .313 5.863 1 .015-1.505 .512 8.655 1 .003 .222 .081 .605

0b . . 0 . . . ..875 .307 8.115 1 .004

-2.028 .560 13.111 1 .000 .132 .044 .3940b . . 0 . . . .

Intercept[EDU=.00][EDU=1.00Intercept[EDU=.00][EDU=1.00

contraceptive meta

permanent

transient

B Std. Error Wald df Sig. Exp(B) Lower BoundUpper Bound

% Confidence Interval foExp(B)

The reference category is: traditional.a.

This parameter is set to zero because it is redundant.b.

odds ratio หรอ Exp(B) = 0.222 แปลผลไดวา สตรทเรยนหนงสอ จะเลอกใชวธคมกาเนดแบบถาวรนอยกวาแบบดงเดม 77.8 % ((0.222-1)*100)ของสตรทไมไดเรยนหนงสอ อยางมนยสาคญทางสถต

odds ratio หรอ Exp(B) = 0.132 แปลผลไดวา สตรทเรยนหนงสอ จะเลอกใชวธคมกาเนดแบบชวคราวนอยกวาแบบดงเดม 86.8 % ((0.132-1)*100) ของสตรทไมไดเรยนหนงสอ อยางมนยสาคญทางสถต

Page 14: logistic วช ใหม่rlc.nrct.go.th/download/Research_Zone/phase14_4.pdf · Uthaithip Jiawiwatkul / 5 Assumptions • ค าคลาดเคล ื่อน (error) เป

Uthaithip Jiawiwatkul / 53

ความแตกตางของการวเคราะห Multiple Linear Regression กบ Multiple Logistic Regression

Multiple linear regression- Y เปน continuous data- ประมาณคาดวย least squares

- ใช Global F-test - Incremental F-test- t-test- R 2

Multiple logistic regression- Y เปน categorical data- ประมาณคาดวย Maximum

likelihood- ใช Model chi-square- Likelihood Ratio Test - Wald statistic- Pseudo R 2