การวิเคราะห ถดถอยพห ุ (multiple regression analysis) ·...

38
1 การวิเคราะหถดถอยพหุ (Multiple Regression Analysis) ผศ. นิคม ถนอมเสียง ภาควิชาชีวสถิติและประชากรศาสตร คณะสาธารณสุขศาสตร .ขอนแกน Email: [email protected] Web: http://home.kku.ac.th/nikom การวิเคราะหการถดถอย เกี่ยวของกับตัวแปร 2 ตัวแปร ขึ้นไป ตัวแปรอิสระ (independent variables) หรือตัวแปรอรรถาธิบาย (explanatory variables) -ตัวแปรตาม (dependent variable) หรือตัวแปรตอบสนอง (response variables) i p x p x x y ,..., 2 2 1 1 0 ˆ การวิเคราะหการถดถอยพหุ (Multiple Regression) การวิเคราะหการถดถอยอยางงาย (Simple Regression) bx a y ˆ

Upload: others

Post on 12-Mar-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

1

การวเคราะหถดถอยพห

(Multiple Regression Analysis)

ผศ. นคม ถนอมเสยง

ภาควชาชวสถตและประชากรศาสตร

คณะสาธารณสขศาสตร ม.ขอนแกน

Email: [email protected]

Web: http://home.kku.ac.th/nikom

การวเคราะหการถดถอย

เกยวของกบตวแปร 2 ตวแปร ขนไป

ตวแปรอสระ (independent variables) หรอตวแปรอรรถาธบาย

(explanatory variables)

-ตวแปรตาม (dependent variable) หรอตวแปรตอบสนอง

(response variables)

ipxp

xxy ,...,22110

ˆ

การวเคราะหการถดถอยพห (Multiple Regression)

การวเคราะหการถดถอยอยางงาย (Simple Regression)

bxay ˆ

Page 2: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

2

วตถประสงคการวเคราะหการถดถอยพห

-วดความสมพนธเชงเสนระหวางตวแปรอสระ

(independent variables) หรอตวแปรอรรถาธบาย

(explanatory variables) กบตวแปรตาม (dependent variable)

หรอตวแปรเชงทานาย (predictor variables)

-ทานาย (prediction)

Systolic BPCHOL

TRI

AGE

idno sysbp chol age tri idno sysbp chol age tri

1 155 375 66 230 11 132 304 40 140

2 136 290 49 161 12 164 428 51 175

3 133 267 47 187 13 136 282 56 159

4 166 340 55 178 14 73 165 36 44

5 111 282 42 112 15 153 395 51 181

6 150 352 71 125 16 135 324 54 164

7 131 285 39 149 17 149 426 51 205

8 167 383 59 208 18 149 337 57 189

9 166 363 60 208 19 142 347 45 152

10 126 283 48 138 20 148 349 55 194

ตวอยาง การศกษาความสมพนธระหวางอาย ระดบ cholesterol ระดบ triglyceride กบ systolic blood pressure

Page 3: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

3

ขอมลตวแปร sysbp และเมตรกซตวแปรอสระ (chol, age,tri)

148

...

133

136

155

y

194553491

...

187472671

161492901

230663751

x

การคานวณสมประสทธการวเคราะหการถดถอยพห

-ใชวธ least square method โดยใช matrix approach

ipxp

xxiy ,...,

22110ˆ

วธคานวณ least square โดยใชเมตรกซ

1xp

YX1

)

pXp

XX(

1xp

b

Page 4: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

4

วธคานวณสมประสทธโดยใชเมตรกซ

Source | SS df MS Number of obs = 20---------+------------------------------ F( 3, 16) = 35.56

Model | 7942.70165 3 2647.56722 Prob > F = 0.0000Residual | 1191.09835 16 74.4436471 R-squared = 0.8696---------+------------------------------ Adj R-squared = 0.8451

Total | 9133.80 19 480.726316 Root MSE = 8.6281

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

---------+--------------------------------------------------------------------chol | .1654515 .0496455 3.333 0.004 .0602077 .2706953age | .5122311 .2802612 1.828 0.086 -.0818961 1.106358tri | .2006968 .0745745 2.691 0.016 .042606 .3587876

_cons | 27.15522 12.80998 2.120 0.050 -.0007308 54.31117------------------------------------------------------------------------------

วธคานวณสมประสทธโดยใช STATA

Page 5: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

5

ความสมพนธเชงเสนระหวางตวแปรตามและ

กลมของตวแปรอสระ

เพอสรปวาตวแปรอสระ k ตวแปรสามารถอธบายความผนแปร

ของตวแปร Y ไดหรอไม

การทดสอบสมมตฐาน

การสรปภาพรวม ใชตารางการวเคราะหความแปรปรวน (ANOVA)

สาหรบการวเคราะหการถดถอย เพอคานวณคา Overall F Test

0k

...21

:0

H βββ

MSR

ตาราง ANOVA สาหรบการวเคราะหการถดถอย

triagecholiY 20.51.17.16.27ˆ

Source | SS df MS Number of obs = 20---------+------------------------------ F( 3, 16) = 35.56

Model | 7942.70165 3 2647.56722 Prob > F = 0.0000Residual | 1191.09835 16 74.4436471 R-squared = 0.8696---------+------------------------------ Adj R-squared = 0.8451

Total | 9133.80 19 480.726316 Root MSE = 8.6281

หรอOverall F Test

Page 6: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

6

สมมตฐานสาหรบการทดสอบนยสาคญของสมการถดถอยทงหมด

H0: ตวแปรอสระ k ตวแปรไมสามารถอธบายความผนแปร

ของตวแปร Y ได

หรอ

HA

: ตวแปรอสระ k ตวแปรสามารถอธบายความผนแปร

ของตวแปร Y ได

หรอ HA

: อยางนอย 1 ตวแปร

การทดสอบใชสถต F-test

0k

...21

:0

H βββ

0ikβ

MSE

MSR

error)(or residualsquaremean

model)(or regressionsquaremeanF

k

1kn

2R1

2R

F

SSY

SSR

SSY

SSESSY2R

หรอคานวณคา F จาก

การคานวณคา

n=ขนาดตวอยาง

k=จานวนตวแปร

R2 = coefficient of determination

เมอ

Page 7: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

7

Source | SS df MS Number of obs = 20---------+------------------------------ F( 3, 16) = 35.56

Model | 7942.70165 3 2647.56722 Prob > F = 0.0000Residual | 1191.09835 16 74.4436471 R-squared = 0.8696---------+------------------------------ Adj R-squared = 0.8451

Total | 9133.80 19 480.726316 Root MSE = 8.6281

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

---------+--------------------------------------------------------------------chol | .1654515 .0496455 3.333 0.004 .0602077 .2706953age | .5122311 .2802612 1.828 0.086 -.0818961 1.106358tri | .2006968 .0745745 2.691 0.016 .042606 .3587876

_cons | 27.15522 12.80998 2.120 0.050 -.0007308 54.31117------------------------------------------------------------------------------

การวเคราะห ตวแปรอสระไดแก อาย ระดบ cholesterol

ระดบ triglyceride สามารถอธบายการเปลยนแปลง

ระดบความดนชนด systolic blood pressure ได

อยางนยสาคญทางสถต (F= 35.56, p<.0001)

การทดสอบตวแปรอสระแตละตวแปรมความสามารถ

ในการอธบายตวแปรตาม(มความสมพนธกบตวแปรตาม)

-คาสถต Partial F Test

-หรอ Partial t-test

-ในทนจะใช การทดสอบ Partial t-test

กรณ สถต Partial F Test อานไดจากเอกสารเชน

-Kleinbaum, Muller, Nizam

-Neter, Wasserman, Kutner

-etc.

Page 8: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

8

การทดสอบ Partial t test แทนจากการใช Partial F Test

การทดสอบสมมตฐาน H0:

เมอ และ เปนคาสมประสทธและ standard error ของ

0

βS

βt

ˆ

ˆ

ββ

S β

. regress sysbp chol age tri

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 3, 16) = 35.56

Model | 7942.70165 3 2647.56722 Prob > F = 0.0000Residual | 1191.09835 16 74.4436471 R-squared = 0.8696

-------------+------------------------------ Adj R-squared = 0.8451Total | 9133.80 19 480.726316 Root MSE = 8.6281

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .1654515 .0496455 3.33 0.004 .0602076 .2706953age | .5122311 .2802612 1.83 0.086 -.0818961 1.106358tri | .2006968 .0745745 2.69 0.016 .042606 .3587876

_cons | 27.15522 12.80998 2.12 0.050 -.0007309 54.31117------------------------------------------------------------------------------

เมอนาคา Partial T ทคานวณไดมายกกาลงสองจะมคาเทากบ Partial F

เชน คาของ chol (X1)

Partial F(X1/ X

2, X

3) =T2 = 3.332 = 11.0889

Page 9: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

9

. regress sysbp chol age tri

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 3, 16) = 35.56

Model | 7942.70165 3 2647.56722 Prob > F = 0.0000Residual | 1191.09835 16 74.4436471 R-squared = 0.8696

-------------+------------------------------ Adj R-squared = 0.8451Total | 9133.80 19 480.726316 Root MSE = 8.6281

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .1654515 .0496455 3.33 0.004 .0602076 .2706953age | .5122311 .2802612 1.83 0.086 -.0818961 1.106358tri | .2006968 .0745745 2.69 0.016 .042606 .3587876

_cons | 27.15522 12.80998 2.12 0.050 -.0007309 54.31117------------------------------------------------------------------------------

การแปลความหมาย

-แปลผลโดยพจารณาเครองหมาย

-พจารณา ความสมพนธระหวางตวแปรอสระกบตวแปรตาม

ตวแปร chol, tri มความสมพนธทางบวกกบ sysbp และมนยสาคญทางสถต

ตวแปร age ไมมความสมพนธกบ sysbp

การพจารณาตวแปรอสระแตละตวแปรมความสมพนธ

กบตวแปรตามมากนอย

-พจารณาจากสมการทมการปรบตวแปรมหนวยเดยวกน

-ทาใหเปนคะแนนมาตรฐาน Z-score

sd

xxz i

. regress sysbp chol age tri,beta

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 3, 16) = 35.56

Model | 7942.70165 3 2647.56722 Prob > F = 0.0000Residual | 1191.09835 16 74.4436471 R-squared = 0.8696

-------------+------------------------------ Adj R-squared = 0.8451Total | 9133.80 19 480.726316 Root MSE = 8.6281

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| Beta

-------------+----------------------------------------------------------------chol | .1654515 .0496455 3.33 0.004 .4663705age | .5122311 .2802612 1.83 0.086 .2076355tri | .2006968 .0745745 2.69 0.016 .3805016

_cons | 27.15522 12.80998 2.12 0.050 .------------------------------------------------------------------------------

Page 10: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

10

.zscore sysbp chol age tri

.regress z_sysbp z_chol z_age z_tri

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 3, 16) = 35.56

Model | 16.5222943 3 5.50743142 Prob > F = 0.0000Residual | 2.47770574 16 .154856609 R-squared = 0.8696

-------------+------------------------------ Adj R-squared = 0.8451Total | 19.00 19 1.00 Root MSE = .39352

------------------------------------------------------------------------------z_sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------z_chol | .4663705 .1399396 3.33 0.004 .1697118 .7630292z_age | .2076355 .1136053 1.83 0.086 -.033197 .448468z_tri | .3805016 .1413859 2.69 0.016 .0807768 .6802263_cons | 3.62e-16 .0879934 0.00 1.000 -.1865376 .1865376

------------------------------------------------------------------------------

กรณทาใหเปนคะแนนมาตรฐาน Z-score

sd

xxz i

Constant มคานอยมาก ~ 0

การประเมนสมการถดถอยพห

-การประเมนสมการถดถอยพห พจารณาจากคา coefficient of

determination

2

ˆ

n

1i)Y(Y

n

1i)Y

iY(

SSYSSR2

k...x

2x,

1x|y

R

i

2

. regress sysbp chol age tri

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 3, 16) = 35.56

Model | 7942.70165 3 2647.56722 Prob > F = 0.0000Residual | 1191.09835 16 74.4436471 R-squared = 0.8696

-------------+------------------------------ Adj R-squared = 0.8451Total | 9133.80 19 480.726316 Root MSE = 8.6281

0.869594 9133.80

7942.70165

Page 11: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

11

ตวอยาง จากขอมลตวอยางคานวณคาของ coefficient of determination

-ตวแปร chol ,age และ trigyceride สามารถอธบายการเปลยนแปลง

ระดบ systolic blood pressure ไดถงรอยละ 86.96

0.869594

9133.80

7942.70165

ในการ fit สมการพบวาเมอจานวนตวแปรอสระมากขน

ทาใหคา R2 สงขน ควรมการปรบคา R2 เรยกวา

adjusted coefficient of determination

SSY

SSR

pn

1n2

aR

. regress sysbp chol age tri

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 3, 16) = 35.56

Model | 7942.70165 3 2647.56722 Prob > F = 0.0000Residual | 1191.09835 16 74.4436471 R-squared = 0.8696

-------------+------------------------------ Adj R-squared = 0.8451Total | 9133.80 19 480.726316 Root MSE = 8.6281

Page 12: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

12

Report Regression Table (Publication Manual of the American Psychological

Association sixth Edition,2010; pp 144)

0.050

0.016

0.086

0.004

P-value

Adjusted R2 = .85 , F = 35.56, p-value <.0001, n = 20

.00-54.312.1212.8127.16Constant

.06.87.04-3.36.382.69.07.20Trigyceride

.07.81-.08-1.11.211.83.28.51Age

.75.75.06-.07.473.33.05.17Cholesterol

R2 changeR295%CIts.e.bVariable

. regress sysbp chol age triSource | SS df MS Number of obs = 20

-------------+------------------------------ F( 3, 16) = 35.56Model | 7942.70165 3 2647.56722 Prob > F = 0.0000

Residual | 1191.09835 16 74.4436471 R-squared = 0.8696-------------+------------------------------ Adj R-squared = 0.8451

Total | 9133.80 19 480.726316 Root MSE = 8.6281------------------------------------------------------------------------------

sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------

chol | .1654515 .0496455 3.33 0.004 .0602076 .2706953age | .5122311 .2802612 1.83 0.086 -.0818961 1.106358tri | .2006968 .0745745 2.69 0.016 .042606 .3587876

_cons | 27.15522 12.80998 2.12 0.050 -.0007309 54.31117------------------------------------------------------------------------------

Page 13: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

13

. do "M:\516701_2555\report_mreg.do"

. use "M:\516701_2555\multiple_reg_data.dta", clear

. regress sysbp chol

...Residual | 2267.92107 17 133.407122 R-squared = 0.7516

...

. regress sysbp chol ageResidual | 1729.02942 16 108.064339 R-squared = 0.8106

...

. regress sysbp chol age triResidual | 1191.02416 15 79.4016106 R-squared = 0.8696

...

. regress sysbp chol age tri, betaSource | SS df MS Number of obs = 20

-------------+------------------------------ F( 3, 16) = 35.56Model | 7942.70165 3 2647.56722 Prob > F = 0.0000

Residual | 1191.09835 16 74.4436471 R-squared = 0.8696-------------+------------------------------ Adj R-squared = 0.8451

Total | 9133.8 19 480.726316 Root MSE = 8.6281------------------------------------------------------------------------------

sysbp | Coef. Std. Err. t P>|t| Beta-------------+----------------------------------------------------------------

chol | .1654515 .0496455 3.33 0.004 .4663705age | .5122311 .2802612 1.83 0.086 .2076355tri | .2006968 .0745745 2.69 0.016 .3805016

_cons | 27.15522 12.80998 2.12 0.050 .------------------------------------------------------------------------------

การวเคราะห multiple regression เมอมตวแปรกลม เชน เพศ อาชพ

ทาใหเปนตวแปรหน (dummy variables) ดงน

pp

k

ljljl xDxy

j

1

10 1

ˆ

กรณมตวแปรม k ระดบ สรางตวแปรหนไดเทากบ k-1 ตวแปร

(k=ระดบ, กลม)

0

1

0

D1

ตวแปรหน (dummy variable)

1Code = 3

0code = 2

0code = 1

D2ตวแปร

Page 14: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

14

)(1

ˆ 654320 gender)(occβ)(occβ(tri)β(age)β(chol)ββy officecomm

ตวอยาง ตวแปรอาชพ (เกษตรกรรม, คาขาย, ขาราชการ) เปนตวแปรกลม

ใหทาเปน ตวแปรหน k-1=3-1 = 2 ตวแปร ดงน

STATA ระบ xi: regresst sysbp age tri i.occ i.gender

0

1

0

D1

ตวแปรหน (dummy variable)

1รบราชการ = 3

0คาชาย = 2

0เกษตรกรรม = 1

D2อาชพ

*** กรณม 2 กลม เพศ รหสเปน 0, 1 วเคราะหในโปรแกรม STATA ไดเลย

ถามรหส 1, 2 กาหนดเปน ตวแปรหน

. xi: regress sysbp chol age tri i.occ i.gender

. xi: regress sysbp chol age tri i.occ i.genderi.occ _Iocc_1-3 (naturally coded; _Iocc_1 omitted)i.gender _Igender_1-2 (naturally coded; _Igender_1 omitted)

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 6, 13) = 16.99

Model | 8101.00425 6 1350.16737 Prob > F = 0.0000Residual | 1032.79575 13 79.4458272 R-squared = 0.8869

-------------+------------------------------ Adj R-squared = 0.8347Total | 9133.8 19 480.726316 Root MSE = 8.9132

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .1745477 .0564986 3.09 0.009 .0524899 .2966054age | .504353 .3139673 1.61 0.132 -.173932 1.182638tri | .2081322 .0796249 2.61 0.021 .036113 .3801514

_Iocc_2 | 5.242509 5.77858 0.91 0.381 -7.241355 17.72637_Iocc_3 | -1.13821 5.298263 -0.21 0.833 -12.58441 10.30799

_Igender_2 | -4.495496 4.72941 -0.95 0.359 -14.71276 5.721772_cons | 24.02471 13.96057 1.72 0.109 -6.135272 54.18469

------------------------------------------------------------------------------

Page 15: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

15

list+-------------------------------------------------------------------------------+| idno sysbp chol age tri occ gender _Iocc_2 _Iocc_3 _Igend~2 ||-------------------------------------------------------------------------------|

1. | 1 155 375 66 230 3 2 0 1 1 |2. | 2 136 290 49 161 1 1 0 0 0 |3. | 3 133 267 47 187 1 1 0 0 0 |4. | 4 166 340 55 178 2 1 1 0 0 |5. | 5 111 282 42 112 2 2 1 0 1 |

|-------------------------------------------------------------------------------|6. | 6 150 352 71 125 3 1 0 1 0 |7. | 7 131 285 39 149 2 2 1 0 1 |8. | 8 167 383 59 208 3 1 0 1 0 |9. | 9 166 363 60 208 1 1 0 0 0 |10. | 10 126 283 48 138 2 2 1 0 1 |

|-------------------------------------------------------------------------------|11. | 11 132 304 40 140 3 1 0 1 0 |12. | 12 164 428 51 175 2 2 1 0 1 |13. | 13 136 282 56 159 3 1 0 1 0 |14. | 14 73 165 36 44 1 1 0 0 0 |15. | 15 153 395 51 181 1 2 0 0 1 |

|-------------------------------------------------------------------------------|16. | 16 135 324 54 164 2 1 1 0 0 |17. | 17 149 426 51 205 3 1 0 1 0 |18. | 18 149 337 57 189 1 1 0 0 0 |19. | 19 142 347 45 152 3 2 0 1 1 |20. | 20 148 349 55 194 3 2 0 1 1 |

+-------------------------------------------------------------------------------+

การวเคราะหการถดถอยพห (Multiple Regression)

การคดเลอกตวแปรเขาในสมการ

1. Backward Elimination Procedure2. Forward selection procedure3. The Stepwise regression procedure

ในการวเคราะหใชสถตในการพจารณาหลายรปแบบเชนPartial F (p-value), Partial t (p-value)

ในทนจะใชคา Partial t โดยดคา p-value

Page 16: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

16

วธการขจดออก (Backward elimination procedure)

ขนท 1 สรางสมการถดถอยประกอบดวย ตวแปรอสระทกตวแปร

SYSBP = 27.16 + 0.165CHOL + 0.512AGE + 0.201TRI

ขนท 2 คานวณคาสถต Partial t และ p-value ตวแปรอสระทกตวแปรในโมเดล

ขนท 3 พจารณาตวแปรทมคา p-value มากทสด

. regress sysbp chol age tri

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 3, 16) = 35.56

Model | 7942.70165 3 2647.56722 Prob > F = 0.0000Residual | 1191.09835 16 74.4436471 R-squared = 0.8696

-------------+------------------------------ Adj R-squared = 0.8451Total | 9133.80 19 480.726316 Root MSE = 8.6281

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .1654515 .0496455 3.33 0.004 .0602076 .2706953age | .5122311 .2802612 1.83 0.086 -.0818961 1.106358tri | .2006968 .0745745 2.69 0.016 .042606 .3587876

_cons | 27.15522 12.80998 2.12 0.050 -.0007309 54.31117------------------------------------------------------------------------------

ขนท 4 เปรยบเทยบคา p-value กบ ระดบนยสาคญ

ทกาหนด ( เชนทระดบ 0.05)

ถา p-value > ระดบนยสาคญทกาหนด จะตดตวแปร

นนออกจากสมการ

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .1654515 .0496455 3.33 0.004 .0602076 .2706953age | .5122311 .2802612 1.83 0.086 -.0818961 1.106358tri | .2006968 .0745745 2.69 0.016 .042606 .3587876

_cons | 27.15522 12.80998 2.12 0.050 -.0007309 54.31117------------------------------------------------------------------------------

ขจดตวแปร age ออก (p-value = .086 > 0.05)

Page 17: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

17

ทาการทดสอบตามขนตอนท 1 ถง ขนตอนท 4 ใหมกบ

ตวแปรทเหลอจนกวาไมมตวแปรใดมากกวาระดบนยสาคญ

. regress sysbp chol tri

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 2, 17) = 45.42

Model | 7694.02578 2 3847.01289 Prob > F = 0.0000Residual | 1439.77422 17 84.6926011 R-squared = 0.8424

-------------+------------------------------ Adj R-squared = 0.8238Total | 9133.80 19 480.726316 Root MSE = 9.2029

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .1875776 .0513543 3.65 0.002 .0792295 .2959258tri | .238911 .0763522 3.13 0.006 .0778219 .4

_cons | 40.00673 11.42093 3.50 0.003 15.91068 64.10278------------------------------------------------------------------------------

วธการขจดออก (Backward elimination procedure)

. sw regress sysbp chol age tri, pr(.05)begin with full model

p = 0.0863 >= 0.0500 removing age

Source | SS df MS Number of obs = 20---------+------------------------------ F( 2, 17) = 45.42

Model | 7694.02578 2 3847.01289 Prob > F = 0.0000Residual | 1439.77422 17 84.6926011 R-squared = 0.8424---------+------------------------------ Adj R-squared = 0.8238

Total | 9133.80 19 480.726316 Root MSE = 9.2029

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

---------+--------------------------------------------------------------------chol | .1875776 .0513543 3.653 0.002 .0792295 .2959258tri | .238911 .0763522 3.129 0.006 .0778219 .4

_cons | 40.00673 11.42093 3.503 0.003 15.91068 64.10278------------------------------------------------------------------------------

Page 18: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

18

วธนาเขา (Forward selection procedure)

ขนท 1 เลอกตวแปรอสระตวแรกเขามาในสมการ

โดยมคาสหสมพนธกบตวแปรตามมากทสด

-จากตวอยางพบวาสหสมพนธเปนดงน

rSYSBP-CHOL

= .8669

rSYSBP-AGE

= .6873

rSYSBP-TRI

= .8477

-ดงนนตวแปร CHOL เปนตวแปรอสระตวแปรแรกทนาเขาในสมการ

*หรอ fit สมการการถดถอยอยางงายทละตวแปร

. corr sysbp chol age(obs=20)

| sysbp chol age-------------+---------------------------

sysbp | 1.0000chol | 0.8669 1.0000age | 0.6873 0.5609 1.0000

. regress sysbp cholSource | SS df MS Number of obs = 20

-------------+------------------------------ F( 1, 18) = 54.46Model | 6864.79657 1 6864.79657 Prob > F = 0.0000

Residual | 2269.00343 18 126.055746 R-squared = 0.7516-------------+------------------------------ Adj R-squared = 0.7378

Total | 9133.8 19 480.726316 Root MSE = 11.227

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .3075584 .0416769 7.38 0.000 .2199986 .3951183_cons | 39.95941 13.93348 2.87 0.010 10.68625 69.23256

------------------------------------------------------------------------------

. regress sysbp tri

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 1, 18) = 45.98

Model | 6564.09077 1 6564.09077 Prob > F = 0.0000Residual | 2569.70923 18 142.761624 R-squared = 0.7187

-------------+------------------------------ Adj R-squared = 0.7030Total | 9133.8 19 480.726316 Root MSE = 11.948

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------tri | .4471421 .0659423 6.78 0.000 .3086025 .5856817

_cons | 67.34391 11.2005 6.01 0.000 43.81254 90.87528------------------------------------------------------------------------------

Page 19: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

19

. regress sysbp age

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 1, 18) = 16.12

Model | 4315.03667 1 4315.03667 Prob > F = 0.0008Residual | 4818.76333 18 267.709074 R-squared = 0.4724

-------------+------------------------------ Adj R-squared = 0.4431Total | 9133.8 19 480.726316 Root MSE = 16.362

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------age | 1.695629 .4223477 4.01 0.001 .8083094 2.582949

_cons | 53.60554 22.09811 2.43 0.026 7.179137 100.032------------------------------------------------------------------------------

-และสรางสมการถดถอยระหวางตวแปรตามกบตวแปรอสระทนาเขา

สรางสมการ SYSBP กบ CHOL และคานวณคา Overall F

จากตาราง ANOVA

SYSBP = 39.96 + .308CHOL และมคา Overall F เทากบ 54.45

-ถาคา Overall F จากตาราง ANOVA ไมมนยสาคญทางสถต

แสดงวาไมมตวแปรใดอยในสมการถดถอย จะหยดการนาเขา

กรณทคา Overall F จากตาราง ANOVA มนยสาคญทางสถต

จะนาตวแปรเขาไปในสมการ และดาเนนขนตอนท 2 ตอ

Page 20: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

20

. regress sysbp chol

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 1, 18) = 54.46

Model | 6864.79657 1 6864.79657 Prob > F = 0.0000Residual | 2269.00343 18 126.055746 R-squared = 0.7516

-------------+------------------------------ Adj R-squared = 0.7378Total | 9133.80 19 480.726316 Root MSE = 11.227

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .3075584 .0416769 7.38 0.000 .2199986 .3951183_cons | 39.95941 13.93348 2.87 0.010 10.68625 69.23256

------------------------------------------------------------------------------

-คา Overall F จากตาราง ANOVA มนยสาคญทางสถต

จะนาตวแปรเขาไปในสมการ และดาเนนขนตอนท 2 ตอ

ขนท 2 พจารณาตวแปรท 2 เขาโมเดล

คานวณสถต Partial t (p-value) ของตวแปรอสระทเหลออย

โดยพจารณาสราง (fit) โมเดลตวแปรทเหลอกบตวแปรตามเชน

-Partial t =2.16 (p-value=.046) จาก age|sysbp

-Partial t =4.86, (p-value<.001) จาก tri|sysbp

*ใชวธ partial correlation ไดใหผลเชนเดยวกน

. regress sysbp age tri

...------------------------------------------------------------------------------

sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------

age | .7399905 .3432132 2.16 0.046 .015874 1.464107tri | .3564525 .073381 4.86 0.000 .2016321 .5112729

_cons | 44.11965 14.84368 2.97 0.009 12.80222 75.43708------------------------------------------------------------------------------

. pcorr sysbp age tri(obs=20)Partial correlation of sysbp with

Variable | Corr. Sig.-------------+------------------

age | 0.4634 0.046tri | 0.7624 0.000

)1)(1( 22XZYZ

XZYZYXYX|Z

rr

rrrr

Page 21: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

21

. regress sysbp age tri

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 2, 17) = 29.97

Model | 7115.88616 2 3557.94308 Prob > F = 0.0000Residual | 2017.91384 17 118.700814 R-squared = 0.7791

-------------+------------------------------ Adj R-squared = 0.7531Total | 9133.80 19 480.726316 Root MSE = 10.895

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------age | .7399905 .3432132 2.16 0.046 .015874 1.464107tri | .3564525 .073381 4.86 0.000 .2016321 .5112729

_cons | 44.11965 14.84368 2.97 0.009 12.80222 75.43708------------------------------------------------------------------------------

จากขอมลตวอยางตวแปร TRI มคา Partial t มากทสดและ

p-value นอยกวา ใหนาตวแปร TRI เพอไปลอง fit ในโมเดล

สมการถดถอย

ขนท 3 พจารณาตวแปรอสระทนาเขาหาคา Partial t และ p-value

รวมกบตวแปรอสระทนาเขากอน

ถา

(ก.) P-value < ระดบนยสาคญทางสถต ใหนาเขาตวแปรดงกลาว

ในโมเดลสมการถดถอย

(ข.) P-value > ระดบนยสาคญทางสถต คงใชโมเดลในขอท 1

Page 22: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

22

SYSBP = 40.01 + .188CHOL + .239TRI

. regress sysbp chol tri

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 2, 17) = 45.42

Model | 7694.02578 2 3847.01289 Prob > F = 0.0000Residual | 1439.77422 17 84.6926011 R-squared = 0.8424

-------------+------------------------------ Adj R-squared = 0.8238Total | 9133.80 19 480.726316 Root MSE = 9.2029

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .1875776 .0513543 3.65 0.002 .0792295 .2959258tri | .238911 .0763522 3.13 0.006 .0778219 .4

_cons | 40.00673 11.42093 3.50 0.003 15.91068 64.10278------------------------------------------------------------------------------

จากขอมลตวแปร TRI มคา p-value=.006 นอยกวา <.05

ใหนาตวแปร TRI เพอไปในโมเดลสมการถดถอย

ขนท 4 ทาตามขนตอนท 2-3 ซากบตวแปรทเหลอ

ทาเชนนจนครบทกตวแปรอสระ จนไมมตวแปรใดท

มนยสาคญทางสถตใหยตการนาเขา

. regress sysbp age

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 1, 18) = 16.12

Model | 4315.03667 1 4315.03667 Prob > F = 0.0008Residual | 4818.76333 18 267.709074 R-squared = 0.4724

-------------+------------------------------ Adj R-squared = 0.4431Total | 9133.8 19 480.726316 Root MSE = 16.362

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------age | 1.695629 .4223477 4.01 0.001 .8083094 2.582949

_cons | 53.60554 22.09811 2.43 0.026 7.179137 100.032------------------------------------------------------------------------------

Page 23: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

23

. regress sysbp chol tri age

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 3, 16) = 35.56

Model | 7942.70165 3 2647.56722 Prob > F = 0.0000Residual | 1191.09835 16 74.4436471 R-squared = 0.8696

-------------+------------------------------ Adj R-squared = 0.8451Total | 9133.80 19 480.726316 Root MSE = 8.6281

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .1654515 .0496455 3.33 0.004 .0602076 .2706953tri | .2006968 .0745745 2.69 0.016 .042606 .3587876age | .5122311 .2802612 1.83 0.086 -.0818961 1.106358

_cons | 27.15522 12.80998 2.12 0.050 -.0007309 54.31117------------------------------------------------------------------------------

ดท Partial t โดย p-value >.05 ไมมนยสาคญทางสถต

คงใชโมเดลเดม

. regress sysbp chol tri

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 2, 17) = 45.42

Model | 7694.02578 2 3847.01289 Prob > F = 0.0000Residual | 1439.77422 17 84.6926011 R-squared = 0.8424

-------------+------------------------------ Adj R-squared = 0.8238Total | 9133.80 19 480.726316 Root MSE = 9.2029

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .1875776 .0513543 3.65 0.002 .0792295 .2959258tri | .238911 .0763522 3.13 0.006 .0778219 .4

_cons | 40.00673 11.42093 3.50 0.003 15.91068 64.10278------------------------------------------------------------------------------

Partial t (P-value<.05) ไมมนยสาคญทางสถตคงใชโมเดลเดม

Page 24: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

24

วธนาเขา (Forward selection procedure)

. sw regress sysbp chol age tri, pe(.05)begin with empty model

p = 0.0000 < 0.0500 adding cholp = 0.0061 < 0.0500 adding tri

Source | SS df MS Number of obs = 20---------+------------------------------ F( 2, 17) = 45.42

Model | 7694.02578 2 3847.01289 Prob > F = 0.0000Residual | 1439.77422 17 84.6926011 R-squared = 0.8424---------+------------------------------ Adj R-squared = 0.8238

Total | 9133.80 19 480.726316 Root MSE = 9.2029

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

---------+--------------------------------------------------------------------chol | .1875776 .0513543 3.653 0.002 .0792295 .2959258tri | .238911 .0763522 3.129 0.006 .0778219 .4

_cons | 40.00673 11.42093 3.503 0.003 15.91068 64.10278------------------------------------------------------------------------------

วธสมการถดถอยแบบขนตอน

(Stepwise regression procedure)

-เปนวธทคดเลอกตวแปรอสระรวมกน ระหวางวธตดออกและนาเขา

ขนท 1 เลอกตวแปรอสระตวแรกเขามาในสมการโดยตวแปรอสระ

ทนาเขา เปนตวแปรทมคาสหสมพนธกบตวแปรตามมากทสด

และมนยสาคญทางสถต

จากตวอยางพบวาสหสมพนธเปนดงน

rSYSBP-CHOL

= .8669

rSYSBP-AGE

= .6873

rSYSBP-TRI

= .8477

ดงนนตวแปร CHOL เปนตวแปรอสระตวแปรแรกทนาเขาในสมการ

Page 25: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

25

regress sysbp cholSource | SS df MS Number of obs = 20

-------------+------------------------------ F( 1, 18) = 54.46Model | 6864.79657 1 6864.79657 Prob > F = 0.0000

Residual | 2269.00343 18 126.055746 R-squared = 0.7516-------------+------------------------------ Adj R-squared = 0.7378

Total | 9133.8 19 480.726316 Root MSE = 11.227

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .3075584 .0416769 7.38 0.000 .2199986 .3951183_cons | 39.95941 13.93348 2.87 0.010 10.68625 69.23256

------------------------------------------------------------------------------

*หรอ fit สมการการถดถอยอยางงายทละตวแปร

*ทาเชนเดยวกบตวแปรอนๆ ทเหลอ

ขนท 2 พจารณาคา Partial correlation ตวแปรทเหลอ

และมนยสาคญทางสถตกวาตวแปรอนๆ เขามาในสมการ

(หรอใชสมการถดถอย fit ตวแปรทเหลอเหมอนวธ forward)

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------age | .7399905 .3432132 2.16 0.046 .015874 1.464107tri | .3564525 .073381 4.86 0.000 .2016321 .5112729

_cons | 44.11965 14.84368 2.97 0.009 12.80222 75.43708------------------------------------------------------------------------------

นาตวแปร tri เขาในสมการ

. pcorr sysbp age tri(obs=20)Partial correlation of sysbp with

Variable | Corr. Sig.-------------+------------------

age | 0.4634 0.046tri | 0.7624 0.000

)1)(1( 22XZYZ

XZYZYXYX|Z

rr

rrrr

Page 26: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

26

ขนท 3 พจารณา fit โมเดลสมการถดถอยแลวพจารณาคา Partial t

(P-value) ตวแปรอสระทอยในสมการถดถอย

พจารณา

-คา Partial t และ p-value

p-value >ระดบนยสาคญทกาหนด จะตดตวแปรนนออกจากสมการ

p-value <ระดบนยสาคญทกาหนด คงตวแปรอยในสมการ

. regress sysbp chol triSource | SS df MS Number of obs = 20

-------------+------------------------------ F( 2, 17) = 45.42Model | 7694.02578 2 3847.01289 Prob > F = 0.0000

Residual | 1439.77422 17 84.6926011 R-squared = 0.8424-------------+------------------------------ Adj R-squared = 0.8238

Total | 9133.8 19 480.726316 Root MSE = 9.2029

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .1875776 .0513543 3.65 0.002 .0792295 .2959258tri | .238911 .0763522 3.13 0.006 .0778219 .4

_cons | 40.00673 11.42093 3.50 0.003 15.91068 64.10279------------------------------------------------------------------------------

ขนท 4 ทาซาในขนตอน 2-3. regress sysbp chol tri age

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 3, 16) = 35.56

Model | 7942.70165 3 2647.56722 Prob > F = 0.0000Residual | 1191.09835 16 74.4436471 R-squared = 0.8696

-------------+------------------------------ Adj R-squared = 0.8451Total | 9133.80 19 480.726316 Root MSE = 8.6281

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .1654515 .0496455 3.33 0.004 .0602076 .2706953tri | .2006968 .0745745 2.69 0.016 .042606 .3587876age | .5122311 .2802612 1.83 0.086 -.0818961 1.106358

_cons | 27.15522 12.80998 2.12 0.050 -.0007309 54.31117------------------------------------------------------------------------------

ดท Partial t โดย p-value >.05 ไมมนยสาคญทางสถต

ตดตวแปร age ออก

Page 27: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

27

. regress sysbp chol tri

Source | SS df MS Number of obs = 20-------------+------------------------------ F( 2, 17) = 45.42

Model | 7694.02578 2 3847.01289 Prob > F = 0.0000Residual | 1439.77422 17 84.6926011 R-squared = 0.8424

-------------+------------------------------ Adj R-squared = 0.8238Total | 9133.80 19 480.726316 Root MSE = 9.2029

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------chol | .1875776 .0513543 3.65 0.002 .0792295 .2959258tri | .238911 .0763522 3.13 0.006 .0778219 .4

_cons | 40.00673 11.42093 3.50 0.003 15.91068 64.10278------------------------------------------------------------------------------

ใชโมเดลเดม SYSBP = 40.01 + .188CHOL + .239TRI

สรปการนาเขาแบบขนตอน

1. หาความสมพนธตวแปรอสระทกตวแปร กบตวแปรตาม

นาเขาตวแปรทสมพนธมากกอน

2. พจารณาตวแปรทเหลอตวแปรไหนมความสมพนธมากและ

มนยสาคญนาเขาในโมเดล

3. พจารณาตดออกจาก P-value ถาตวแปรไหนไมเปนตาม

criteria ตดออก (p-value > pr)

4. ทาซาในขนตอน 2-3 ใหม

Page 28: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

28

วธสมการถดถอยแบบขนตอน (Stepwise regression procedure)

. sw regress sysbp chol age tri, pr(0.1) pe(.05) forwardbegin with empty model

p = 0.0000 < 0.0500 adding cholp = 0.0061 < 0.0500 adding tri

Source | SS df MS Number of obs = 20---------+------------------------------ F( 2, 17) = 45.42

Model | 7694.02578 2 3847.01289 Prob > F = 0.0000Residual | 1439.77422 17 84.6926011 R-squared = 0.8424---------+------------------------------ Adj R-squared = 0.8238

Total | 9133.80 19 480.726316 Root MSE = 9.2029

------------------------------------------------------------------------------sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

---------+--------------------------------------------------------------------chol | .1875776 .0513543 3.653 0.002 .0792295 .2959258tri | .238911 .0763522 3.129 0.006 .0778219 .4

_cons | 40.00673 11.42093 3.503 0.003 15.91068 64.10278---------+--------------------------------------------------------------------

Report Regression Table (Publication Manual of the American Psychological

Association sixth Edition,2010;pp 145.)

Page 29: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

29

Stepwise logistic regression พจารณาคา p-value

Hosmer & Lemeshow (2000) ควรกาหนด

p-value for entry (Pe).15-.25 , p-value for remove (Pr) > Pe

การกาหนด p-value for entry สงหรอตาเกนไป

-use more tradition level (.05)fails to identify variables known

to be important ?

-higher level has disadvantage of including variables that are of

questionable importance at the model building stage

(Original: Mickey & Greenland,1977:p125-137;

Cite in : Hosmer & Lemeshow (2000):p95 )

ขอกาหนดในการวเคราะหสมการถดถอยพห (Assumption)

สวนแรกพจารณาจาก residual.- คา residual (e

i) มการแจกแจงแบบปกต

- คา residual (ei) มคา variance คงท (homoscedasticity)

-คา residual (ei) ไมมความสมพนธกบคาอนๆ

(no auto-correlation)

Page 30: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

30

สวนท 2

- Existence: Each specific combination of value of independence

variable (x1, x2,…xp),y is a random variable with contain

probability distribution having finite mean and variance.

- Independent

- ไมม Multicollinearity

คา residual (ei) มการแจกแจงแบบปกต

-Normal probability plot เชน p-plot หรอ quantile-normal plot

-Shapiro-Wilk Test หรอ Leilifor Test

. quietly regress sysbp chol age tri

. predict e,residual

. swilk eShapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z-------------+-------------------------------------------------

e | 20 0.95467 1.073 0.142 0.44361

Page 31: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

31

. quietly regress sysbp chol age tri

. predict e,residual

. swilk eShapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z-------------+-------------------------------------------------

e | 20 0.95467 1.073 0.142 0.44361. pnorm e

คา residual (ei) มคา variance คงท (homoscedasticity)

-การฟลอตกราฟ ระหวางคา residual (ei) กบ

-ทดสอบ Cook-Weisberg test for heteroscedasticity

. hettest

Cook-Weisberg test for heteroskedasticity using fitted values of sysbpHo: Constant variance

chi2(1) = 1.32Prob > chi2 = 0.2500

. rvfplot, yline(0)

iY

Page 32: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

32

. hettest

Cook-Weisberg test for heteroskedasticity using fitted values of sysbpHo: Constant variance

chi2(1) = 1.32Prob > chi2 = 0.2500

. rvfplot, yline(0)

. szroeter , rhs mtest(holm)

Szroeter's test for homoskedasticity

Ho: variance constantHa: variance monotonic in variable

---------------------------------------Variable | chi2 df p

-------------+-------------------------chol | 1.45 1 0.4557 #age | 0.46 1 0.4984 #tri | 1.88 1 0.5107 #

---------------------------------------# Holm adjusted p-values

. hettest , rhs mtest(bonf)

Breusch-Pagan / Cook-Weisberg test for heteroskedasticityHo: Constant variance

---------------------------------------Variable | chi2 df p

-------------+-------------------------chol | 1.23 1 0.7995 #age | 0.37 1 1.0000 #tri | 1.26 1 0.7842 #

-------------+-------------------------simultaneous | 1.45 3 0.6939---------------------------------------

# Bonferroni adjusted p-values

Page 33: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

33

. hettestCook-Weisberg test for heteroskedasticity using fitted values of y

Ho: Constant variancechi2(1) = 7.44Prob > chi2 = 0.0064

. rvfplot, border yline(0)

. hettestCook-Weisberg test for heteroskedasticity using fitted values of y

Ho: Constant variancechi2(1) = 0.00Prob > chi2 = 1.0000

. rvfplot, border yline(0)

Page 34: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

34

คา residual (ei) ไมมความสมพนธกบคาอนๆ

(no auto-correlation) **ใชเฉพาะขอมลแบบ Time-Series

- ความสมพนธระหวางคาระหวางรายขอมลของตวแปรเดยวกน

คา error รายท i จะมความสมพนธกบ error รายท i-1

- การคานวณ สถต Durbin-Watson test (d)

- d < 2 พบวาเกด pisitive autocorrelation

- d>2 เกด negative autocorrelation

1i

2

ie

n

2i

2)

1ie(e

d

. regdw y x,t(t)

Source | SS df MS Number of obs = 25-------------+------------------------------ F( 1, 23) = 8.36

Model | 200.00 1 200.00 Prob > F = 0.0082Residual | 550.00 23 23.9130435 R-squared = 0.2667

-------------+------------------------------ Adj R-squared = 0.2348Total | 750.00 24 31.25 Root MSE = 4.8901

------------------------------------------------------------------------------y | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------x | -2 .6915641 -2.89 0.008 -3.430609 -.5693907

_cons | 15 1.693979 8.85 0.000 11.49574 18.50426------------------------------------------------------------------------------

Durbin-Watson Statistic = 1.592727

Page 35: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

35

Multicollinearity

-Multicollinearity ความสมพนธกนสง ระหวางตวแปรอสระดวยกน

-การลบหรอเพมตวแปรในโมเดล ทาใหเปลยนแปลงคาสมประสทธ

สมการถดถอยทงขนาดหรอเครองหมาย

-แมคา R2 มคาสงแตการทดสอบทางสถตกบสมประสทธ

สมการถดถอย พบวาไมมนยสาคญ

-ทาใหคา Standard error สง ซงสงผลใหคา t ตา

วธ Informal methods

1. พจารณาโดยการสงเกตจาก คาสมประสทธสมการถดถอย

ทมการเปลยนแปลงมาก เมอเพมหรอลดตวแปรในโมเดล

2. การทดสอบสมประสทธสมการถดถอยแตละคา พบวาไมมระดบนยสาคญทางสถต

3. คาเครองหมายของสมประสทธสมการถดถอย

เปลยนเปนตรงกนขามกบทฤษฎหรอการศกษาใดๆ ททามากอน

Page 36: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

36

วธ Informal methods

4. สมประสทธสหสมพนธระหวางตวแปรอสระมคาสง

(r> .90 Hamilton; 1992:135)

(r2>.90; r>.95 Kleinbaum, Muller, Nizam; 1998:241)

5. คาชวงเชอมนของสมประสทธสมการถดถอยของตวแปรอสระ

มคากวาง

วธ Formal methods

1. วธ Variance inflation factors*

2. วธ Ridge regression

วธ Variance inflation factors-วธคานวณคาเฉลยของ variance inflation factors

- เพอวดวาความแปรปรวนทประมาณจากคาสมประสทธสมการถดถอย inflated ไปเพยงใดเมอเปรยบเทยบกบ การมตวแปรอสระทไมมความสมพนธเชงเสน

2

iR1

11)

2

iR(1

iVIF

1-p

1-p

1i

KVIF

VIF

Page 37: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

37

iVIF

2)

ix

ij(x

22

ib

σ

σ

-เมอคา มคา 0 คา VIFiจะมคาเทากบ 1

แตถา มมากกวา 0 คา VIFi จะมคามากกวา 1

ซงทาใหคา สง (inflated) ขน

เมอเปรยบเทยบกบคา ท มคา 0

2

iR

2

iR

2

iR

2

ib

σ

2

ib

σ

Indication of Multicollinearity ดวยวธ Variance inflation factors*

- VIF > 10 indication that Multicollinearity

- Mean VIF provides information about the severity of the

multicollinearity

- if Mean VIF > 1 are indicative of serious multicollinearity

problems

*Neter, Wasserman, Kutner (1987; p.392)

Marquart’s (1970); Belsley, Kuh, Welsch’s (1980)

Page 38: การวิเคราะห ถดถอยพห ุ (Multiple Regression Analysis) · การวิเคราะห การถดถอยพห ุ (Multiple Regression)

38

. quietly regress sysbp chol age tri

. vifVariable | VIF 1/VIF -------------+----------------------

tri | 2.45 0.407722chol | 2.40 0.416193age | 1.58 0.631508

-------------+----------------------Mean VIF | 2.15

หรอ

. estat vifVariable | VIF 1/VIF

-------------+----------------------tri | 2.45 0.407722chol | 2.40 0.416193age | 1.58 0.631508

-------------+----------------------Mean VIF | 2.15

. di (2.45+2.40+1.58)/32.1433333