สมการถดถอยอย่างง่าย simple linear regression

29
สสสสสสสสสสสสสสสสสสส สสสสสสสสสสสสสสสสสสส Simple Linear Simple Linear Regression Regression สสสสสสสสสสสสสสสสสสสสสส สสสสสสสสส สสสสสสสสสสสสสสสสสสสสสสสสสสสสสสส สสสสสสสสสสสสสสสสสส ส.สสสสสสส

Upload: santa

Post on 20-Jan-2016

65 views

Category:

Documents


17 download

DESCRIPTION

สมการถดถอยอย่างง่าย Simple Linear Regression. ผู้ช่วยศาสตราจารย์นิคม ถนอมเสียง ภาควิชาชีวสถิติและประชากรศาสตร์ คณะสาธารณสุขศาสตร์ ม.ขอนแก่น. สมการถดถอยอย่างง่าย : Simple Linear Regression ใช้วิธีการทางสถิตินี้เมื่อไร ? ให้พิจารณาดูจากคำถามต่อไปนี้ - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: สมการถดถอยอย่างง่าย  Simple Linear Regression

สมการถดถอยอยางงาย สมการถดถอยอยางงายSimple Linear Simple Linear

RegressionRegression

ผ �ชวยศาสตราจารย�น�คม ถนอมเส�ยง ภาคว�ชาช�วสถ�ต�และประชากรศาสตร�

คณะสาธารณส!ขศาสตร� ม.ขอนแกน

Page 2: สมการถดถอยอย่างง่าย  Simple Linear Regression

สมการถดถอยอยางงายสมการถดถอยอยางงาย : : Simple Linear RegressionSimple Linear Regressionใช�ว�ธ�การทางสถ�ต�น�&เม'(อไร ? ให�พ�จารณาด จากค,าถามตอไปน�&•ระด-บไขม-นในเล'อดม�ความส-มพ-นธ�ก-บความด-นโลห�ต หร'อไม และสามารถท,านายความด-นโลห�ต ได�หร'อไม ?•จ,านวนคร-&งของการล�างหน�าม�ความส-มพ-นธ�ก-บ การเก�ดเม0ดส�วบนใบหน�าหร'อไม และสามารถท,านาย การเก�ดเม0ดส�วบนใบหน�าได�หร'อไม ?

Page 3: สมการถดถอยอย่างง่าย  Simple Linear Regression

สมการถดถอยอยางงายสมการถดถอยอยางงาย : : ว-ตถ!ประสงค�ว-ตถ!ประสงค�• เพ'(ออธ�บายความส-มพ-นธ�ระหวาง 2 ต-วแปร

•เพ'(อใช�ในการท,านายSystolic BPSystolic BPCHOL

Systolic BPSystolic BPCHOL

Page 4: สมการถดถอยอย่างง่าย  Simple Linear Regression

ระด-บ CHOLESTEROL (CHOL) จะท,านาย

Systolic BP ได� อยางไร ?Systolic BPSystolic BPCHOL

Systolic BPSystolic BPCHOL

Systolic BPSystolic BPCHOL

Page 5: สมการถดถอยอย่างง่าย  Simple Linear Regression

น-กว�จ-ยกล!มหน1(งศ1กษาข�อม ลผ �มาตรวจท�(โรงพยาบาล

จ,านวน 7 ราย ข�อม ลปรากฏตามตาราง

idno=คนท�(, chol=ระด-บไขม-นในเล'อด , sysbp = ความด-นโลห�ตแบบ systolic

Page 6: สมการถดถอยอย่างง่าย  Simple Linear Regression

ว�ธ�ท�(ตรวจสอบงายๆ ค'อการฟล0อตก ราฟแสดงความส-มพ-นธ�ระหวาง ระด-บ

ไขม-นในเล'อดและความด-นโลห�ตชน�ดSystolic เร�ยกกราฟน�&วา“Scatter PlotScatter Plot”

Page 7: สมการถดถอยอย่างง่าย  Simple Linear Regression

จากการฟล0อตกราฟ ถ�าหาร ปแบบ แสดงความส-มพ-นธ�ระหวาง 2

ต-วแปร ก0สามารถท,านายได� ท,า อยางไร ?

แนวค�ดท�( แนวค�ดท�(11 ใช�คาเฉล�(ยได�หร'อไม เม'(อ

143.4286X

xy

Page 8: สมการถดถอยอย่างง่าย  Simple Linear Regression

ต-วอยางต-วอยาง ระด-บไขม-นในเล'อดเป7นเทาไร ก0ตาม ท,านายวา

คาความด-นโลห�ตโลห�ตSystolic เทาก-บคาเฉล�(ย ด-งน-&น: สมการค'อ y= 143.4286

การใช�คาเฉล�(ยท,าให�ข�อม ลเบ�(ยงเบนจากคาท,านายส ง

143.4286X

Page 9: สมการถดถอยอย่างง่าย  Simple Linear Regression

แนวค�ดท�( แนวค�ดท�(22 ถ�าสร�างสมการแสดงความ ส-มพ-นธ�เช�งเส�น

ระหวาง 2 ต-วแปร จากสมการเส�นตรงด-งน�&

= คาต-วแปรตามa = คาคงท�(หร'อจ!ดต-ดบนแกน y (intercept) b = คาความช-น (slope) หร'อส-มประส�ทธ�8 (coefficient)x = คาต-วแปรอ�สระ

ii bxay

y

Page 10: สมการถดถอยอย่างง่าย  Simple Linear Regression

สมการ เร�ยกวาสมการ สมการ เร�ยกวาสมการถดถอยถดถอยค,านวณคาค,านวณคา a = คาคงท�(หร'อจ!ดต-ดบน

แกน y หร'อ b = คาความช-นหร'อ

ส-มประส�ทธ�8 อยางไร ?

หล-กการค,านวณหล-กการค,านวณ ค'อท,าให�ระยะหาง ระหวางจ!ดก-บเส�นตรงน�อยท�(ส!ด ว�ธ�

การน�&เร�ยกวา “ ” ก,าล-งสองน�อยท�(ส!ด(Least Square)

ii bxay

Page 11: สมการถดถอยอย่างง่าย  Simple Linear Regression

ว�ธ�ก,าล-งสองน�อยท�(ส!ดว�ธ�ก,าล-งสองน�อยท�(ส!ด: ค'อการท,าให�ผลรวมก,าล-งสอง ของความคลาดเคล'(อนของแตละคาส-งเกต y ก-บคาท�(

อย บนสมการเส�นตรง y

} ie

Page 12: สมการถดถอยอย่างง่าย  Simple Linear Regression

ว�ธ�ค,านวณว�ธ�ค,านวณ: a, b ท,าได�ด-งน�& xb-ya

n

)x(x

n

)y)(x(yx

b2

i2i

iiii

xx

xy

S

Sb

xงของเบนกำ�ล�งสอส วนเบ��ยง xyงของเบนกำ�ล�งสอส วนเบ��ยง

b

Page 13: สมการถดถอยอย่างง่าย  Simple Linear Regression

ต-วอยางต-วอยาง: จากข�อม ล ระด-บไขม-นใน เล'อดและระด-บความด-นโลห�ต

Systolic

2x xy 2y x y

Page 14: สมการถดถอยอย่างง่าย  Simple Linear Regression

7143.2476

1923y 4286.143

61004

x

3115713.7/)1923(569829

7/)1004)(1923(2887602

b

83548.54

ii x54.83548y 3115713.ˆ

สมการถดถอยค'อสมการถดถอยค'อ

(143.4256)(.3115713)-247.7143a

Page 15: สมการถดถอยอย่างง่าย  Simple Linear Regression

การแปรความหมายจากสมการการแปรความหมายจากสมการถดถอยถดถอย

เม'(อคาไขม-นในเล'อดเปล�(ยนไป เม'(อคาไขม-นในเล'อดเปล�(ยนไป 1 1หนวยท,าให�หนวยท,าให�

คาความด-นโลห�ตส งข1&นเทาก-บ คาความด-นโลห�ตส งข1&นเทาก-บ 3115713. 3115713. หนวยหนวย

ii x54.83548y 3115713.ˆ

Page 16: สมการถดถอยอย่างง่าย  Simple Linear Regression

การประเม�นสมการถดถอยการประเม�นสมการถดถอย พ�จารณาจากคา coefficient of

determination คาของ coeffic ient of determination

ค,านวณจาก

n

1i)Yi(Y

n

1i

2)YiY(2r

ˆ

yy

xx22

SS

br หร'อหร'อ

r2 ม�คา -0 1 r2 ใกล� 1 สมการถดถอยสามารถอธ�บาย การเปล�(ยนแปลงต-วแปรตามได�มาก

Page 17: สมการถดถอยอย่างง่าย  Simple Linear Regression

}}

{ด�เบนอธ�บยไส วนเบ��ยง

)YiY( ˆ

ด�อธ�บยไม ไเบนส วนเบ��ยง

)Yi(Y ˆ

)Yi(Y เบนท��งหมดส วนเบ��ยง

สวนเบ�(ยงเบน สวนเบ�(ยงเบน (( ท-&งหมด ท�(อธ�บายได� ท-&งหมด ท�(อธ�บายได�//อธ�บายไมได�อธ�บายไมได�))

Page 18: สมการถดถอยอย่างง่าย  Simple Linear Regression

ต-วอยางต-วอยาง:: ค,านวณค า coefficient of

determination ด-งน�&

7

1004148994

7

1929569829

3115713.S

Sbr

2

2

2

yy

xx22

8081 r 2

แสดงวาแสดงวา: : สมการถดถอยอธ�บาย ความส-มพ-นธ�ของความด-นโลห�ต

Systolic ก-บระด-บไขม-นในเล'อดได�8081. %

Page 19: สมการถดถอยอย่างง่าย  Simple Linear Regression

bS

Bbt

xx

2y/x

b S

SS

2n

)(SbSS xx

2yy2

y/x

การทดสอบความส-มพ-นธ�เช�งเส�นการทดสอบความส-มพ-นธ�เช�งเส�น ระหวาง ระหวาง 2 2 ต-วแปรต-วแปร

สถ�ต�ใช�ทดสอบได�แก, d.f.=n-2

เม'(อ

n

2)ix(2ixxxS

n

2)iy(2iyyyS

Page 20: สมการถดถอยอย่างง่าย  Simple Linear Regression

การทดสอบสมม!ต�ฐานการทดสอบสมม!ต�ฐาน:: จากต-วอยางการทดสอบ ม�ข-&นตอนด-งน�&

1. 1. ต-&งสมม!ต�ฐานต-&งสมม!ต�ฐานH0: ระด-บไขม-นในเล'อดและระด-บความด-นโลห�ต ไมม�ความส-มพ-นธ�เช�งเส�นตอก-น(B=0)HA: ระด-บไขม-นในเล'อดและระด-บความด-นโลห�ต ม�ความส-มพ-นธ�เช�งเส�นตอก-น(B 0)2. 2. ก,าหนดระด-บน-ยส,าค-ญ ก,าหนดระด-บน-ยส,าค-ญ 0.050.05

Page 21: สมการถดถอยอย่างง่าย  Simple Linear Regression

3. 3. ค,านวณคาทางสถ�ต�ค,านวณคาทางสถ�ต�

bS

Bbt

7

1004148994S

2

yy

7

1929569829S

2

xx

741553.42852-7

57)(41553.428.3115713-64991.71428

S

2

b

589.4.0678983

0-.3115713t

Page 22: สมการถดถอยอย่างง่าย  Simple Linear Regression

4. 4. ต-ดส�นใจต-ดส�นใจ//สร!ปผลสร!ปผล น,าคา t=4.589 และ d.f. = n-2

= 5 เป<ดตาราง t ได� p-value = 0.005

สร!ปได�วาสร!ปได�วา: : ระด-บไขม-นในเล'อดและระด-บความด-น โลห�ตม�ความ

ส-มพ-นธ�เช�งเส�นตอก-น อยางม�น-ยส,าค-ญทางสถ�ต�อยางม�น-ยส,าค-ญทางสถ�ต� (p-value <0.0005)(p-value <0.0005)

Page 23: สมการถดถอยอย่างง่าย  Simple Linear Regression

การค,านวณชวงเช'(อม-(นของ การค,านวณชวงเช'(อม-(นของ B :B :ค,านวณจาก

จากต-วอยางค,านวณ95% ชวงเช'(อม-(นของ B เม'(อ b=.3115713

= = . 1370331 4861096, .

bS2)-n,

2(

tb

).0678983(571.2.3115713

Page 24: สมการถดถอยอย่างง่าย  Simple Linear Regression

การใช�สมการถดถอยในการประมาณการใช�สมการถดถอยในการประมาณคาคาก . ประมาณคาต-วแปรตาม น,าคาX0 ไปแทน

ในสมการ

ต-วอยางต-วอยาง: ถ�า X0 = 200

= 12014975

y

ii bxay

)200(3115713.83548.57y i

Page 25: สมการถดถอยอย่างง่าย  Simple Linear Regression

ชวงเช'(อม-(นของ ท�( ชวงเช'(อม-(นของ ท�( X = X = X0 ค,านวณจากส ตรค,านวณจากส ตร

ต-วอยางต-วอยาง: : ค,านวณ ค,านวณ9595% CI % CI ของ ของ

y

xxS

2)X0(X)

n

1(1y/xS

2)-n,2

α(

ty

200x ท�� y 0 ˆ

741553.4285

2)4286.143(200

7

1(1)191.5689(571.2120.14975

Page 26: สมการถดถอยอย่างง่าย  Simple Linear Regression

การประมาณคาเฉล�(ยของต-วแปรการประมาณคาเฉล�(ยของต-วแปร ตาม ตาม

ท�(คาของต-วแปรท�(คาของต-วแปร X0 ค,านวณโดยค,านวณโดยแทนคาแทนคา X0 ในสมการ

และ ชวงเช'(อม-(นของ และ ชวงเช'(อม-(นของค,านวณจากค,านวณจาก

y/xμ

ii bxay

y/xμ

xxS

2)X0(X

n

1(y/xS

2)-n,2

α(

ty

Page 27: สมการถดถอยอย่างง่าย  Simple Linear Regression

ข�อก,าหนด ข�อก,าหนด (Assumption)(Assumption)1. ท�(แตละคาของ X ต-วแปร Y ม�การแจกแจง แบบปกต�

2. ท�(แตละคาของ Y ต-วแปร X ม�การแจกแจง แบบปกต�

3. ความแปรปรวนของต-วแปรตามY ม�คาเทาก-นท�( แตละคาของ X4. คาเฉล�( ยของต-วแปรตาม Y ท�(

แตละคาของต-วแปร X อย บนเส�นตรงเด�ยวก-น

BXAy/xμ

Page 28: สมการถดถอยอย่างง่าย  Simple Linear Regression

ข�อก,าหนด ข�อก,าหนด (Assumption)(Assumption)-Normality พ�จารณาจาก

residual iiiii bxay;yye ˆˆ

Page 29: สมการถดถอยอย่างง่าย  Simple Linear Regression

. regress sysbp chol

Source | SS df MS Number of obs = 7---------+------------------------------ F( 1, 5) = 21.06 Model | 4033.86954 1 4033.86954 Prob > F = 0.0059Residual | 957.844744 5 191.568949 R-squared = 0.8081---------+------------------------------ Adj R-squared = 0.7697 Total | 4991.71429 6 831.952381 Root MSE = 13.841

------------------------------------------------------------------------------ sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- chol | .3115713 .0678983 4.589 0.006 .1370331 .4861096 _cons | 57.83548 19.37235 2.985 0.031 8.037256 107.6337------------------------------------------------------------------------------