chapter 11 316 204

10
บบบบบ 11 บบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบ (Regression and Correlation Analysis) 11.1 บบบบบ บ บ บ บ บบ บ บ บ บ บ บบ บ บ บ บ บ บ บ (Regression Analysis) บบบบบบบบบบบบบบบ บ บ บ บบ บ บบ บ บ (Correlation Analysis) บบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบ บบบบบบ บบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบ บบบบบบบบบบบ บบบบบบบบบบบบบบบบบบบบบบ บบบบบบบบบบบบบบ บบบบบบบบบบบบ บบบบบบบบบ (Dependent Variable) บบบบบบบบบบบบบบบบ Y บบบบบบบบบบบบบบบบบบบบบบบบบบบบ บบบบ บ บ บบ บ บ บบ บ บบ บ บ บ บ บบ บ บ (Independent Variable) บบบบบบบบบบบบบบบบ X บบบบบบบบบ บบบบบบบบบบบบบบบบ บบบบบบบบบบบบบ บบบบ บบบบบบบบบบบ X บบบบบบบบบบบบบบบบบบบบ Y บบบบบบบบบบบบ X บบบบบบบบบบบบบบบบบบบบบ บบบบบบ Y บบบบบบบบบบบบบบบบบบ Y บบบ X บบบบบบบบบบบบบบบ บบบบบบบบบบบ บบบบบบบบ บ บ บบ บ บ บบ บ บ บบ บ บ บบ บ (Simple Linear Regression) บบบบบบบบบบบบบบบบบบบบบบบบบบบบบ บบบบบบบบบบบบบบบบบ บบบบบบบบบบบบบบบ บบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบบ บบบบบบบบบบบบบบบบบบบบบบบบบ บบบบบบบบบบ บ บบบ บ บบ บบ บ บ บบ บ บ บบ บ บบ บ บ บ บ บบ บ บบบ บ

Upload: ping-tanyamard-kammata

Post on 25-Dec-2015

6 views

Category:

Documents


1 download

DESCRIPTION

ถดถอย น่าสนใจ

TRANSCRIPT

Page 1: chapter 11 316 204

บทท�� 11

การวิเคราะห์�การถดถอยและสห์ส�มพั�นธ์�(Regression and Correlation Analysis)

11.1 บทนำ�� การวิเคราะห์�การถดถอย (Regression Analysis)

และการวิเคราะห์�สห์ส�มพั�นธ์� (Correlation Analysis) เ ป็� น ก า ร ศึ� ก ษ า เ ก�� ย วิ ก� บ ค วิ า ม ส� ม พั� น ธ์� ข อ ง ตั� วิ แ ป็ ร วิ�ตัถ$ป็ระสงค�ห์ล�กของการวิเคราะห์�การถดถอยค%อ เราตั&องการป็ระมาณค(าของตั�วิแป็รตั�วิห์น��ง ซึ่��งเร�ยกวิ(า ตั�วิแป็รตัาม (Dependent Variable) นยมเข�ยนแทนด&วิย Y

โดยอาศึ�ยควิามร+ &จากตั�วิแป็รอ%� น ซึ่��งเร�ยกวิ(า ตั�วิแป็รอสระ (Independent Variable) นยมเข�ยนแทนด&วิย X ห์ร%อกล(าวิอ�กอย(างห์น��งวิ(า เราใช้&ควิามร+ & ห์ร%อสารสนเทศึจาก X

เป็�นเกณฑ์�ในการป็ระมาณ Y ถ&าใช้&ตั�วิแป็ร X เพั�ยงตั�วิแป็รเด�ยวิในการป็ระมาณ Y และควิามส�มพั�นธ์�ของ Y และ X เป็�นเช้งเส&นตัรง เราเร�ยกวิ(า การถดถอยเช้งเส&นอย(างง(าย (Simple Linear Regression) ส0าห์ร�บการวิเคราะห์�สห์ส�มพั�นธ์� เป็�นการศึ�กษาระด�บ ห์ร%อขนาดของควิามส�มพั�นธ์�เช้งเส&นตัรงระห์วิ(างตั�วิแป็รสองตั�วิแป็รวิ(าม�มากน&อยเพั�ยงใด เคร%�องม%อท�� ใช้&วิ�ดเร�ยกวิ(า ส�มป็ระสทธ์1สห์ส�มพั�นธ์� (Correlation Coefficient) นยมเข�ยนแทนด&วิย r โดยวิ�ดออกมาเป็�นตั�วิเลขท��ม�ค(าอย+(ระห์วิ(าง -1 ก�บ 1 ถ&า r ม�ค(าใกล& 1 แสดงวิ(า ตั�วิแป็รสองตั�วิน�2นม�ควิามส�มพั�นธ์�ก�นมากและม�ทศึทางเด�ยวิก�น กล(าวิค%อ ถ&า X ม�ค(ามาก Y จะม�ค(ามากด&วิย ถ&า r ม�ค(าใกล& -1 แสดงวิ(า ตั�วิแป็รสองตั�วิน�2นม�ควิามส�มพั�นธ์�ก�นมากเช้(นก�นแตั(ม�ทศึทางตัรง

Page 2: chapter 11 316 204

ข&ามก�น กล(าวิค%อ ถ&า X ม�ค(ามาก Y จะม�ค(าน&อย ห์ร%อ X ม�ค(าน&อย Y จะม�ค(ามาก ถ&า X และ Y ม�ควิามส�มพั�นธ์�ก�นน&อย ค(าส�มป็ระสทธ์1สห์ส�มพั�นธ์� r จะเข&าใกล& 0

11. 2 ตั�วแบบก�รถดถอยเชิ�งเส้�นำอย��งง��ย (Simple Linear Regression Model) เราจะสมมตัวิ(า Y และ X ม�ควิามส�มพั�นธ์�ก�นในร+ป็ Y = + X + . . . (1) โดยท�� และ เร�ยกวิ(า ส�มป็ระสทธ์1การถดถอยของป็ระช้ากร (Population Regression Coefficient) จะถ%อวิ(าเป็�นค(าคงท��และไม(ทราบค(า น��นค%อ และ เป็�นพัารามเตัอร�ท��ไม(ทราบค(า เราเร�ยก (1) วิ(า ตั�วิแบบการถดถอยเช้งเส&นอย(างง(าย

- 2 - ในเบ%2องตั&น เราสามารถตัรวิจสอบควิามส�มพั�นธ์�ระห์วิ(าง Y ก�บ X วิ(าม�ควิามส�มพั�นธ์�เช้งเส&นตัรงห์ร%อไม(โดยการน0าค(าของ Y ก�บ X พัลอตัเป็�นจ$ด แผนภาพัท�� ได& เราเร�ยกวิ(า แผนภาพัการกระจาย (Scatter Diagram) ด�งแสดงข&างล(าง

Page 3: chapter 11 316 204

เม%�อเราทราบวิ(า Y ก�บ X วิ(าม�ควิามส�มพั�นธ์�เช้งเส&นตัรง เราป็ระมาณตั� วิแบบใน (1) ด&วิยสมการการถดถอย (Regression Equation) Y = a + bX . . . (2)โดยท�� a และ b เป็�นตั�วิป็ระมาณแบบก0า ล�งสองตั0�า ส$ด (Least Square Methods) ของ และ ตัามล0า ด�บ กล(าวิค%อ เราจะห์า a และ b ท��ท0าให์& SSE = = ม�ค(าน&อยท��ส$ด ซึ่��งค(าของ a และ b จะเป็�นค(าป็ระมาณของ และ ตัามล0าด�บ เราเร�ยก a และ b วิ(า ส�มป็ระสทธ์1การถดถอยของตั�วิอย(าง (Sample Regression Coefficient) โดยท�� a = Y - bX

และ b = XY - ( X)( Y) / n

X - ( X)

n2

2

เม%�อก0าห์นดส�ญญล�กษณ� SXX = ( )X X 2 = X2

- ( X)

n

2

SXY = ( )( )X X Y Y = XY - ( )( )X Y

n

SYY = ( )Y Y 2 = Y2 - ( )Y

n

2

เราสามารถเข�ยน b = SXYSXX

- 3 - ตั�วอย��งท�� 11.1 ข&อม+ลข&างล(างเป็�นค(าใช้&จ(ายเก��ยวิก�บอาห์าร

ของคร�วิเร%อน (Y) ก�บรายได&ของคร�วิเร%อน (X)

คร�วิเร%อนท�� Y (ร&อยบาท)

X (พั�นบาท)

Page 4: chapter 11 316 204

1 22 8 2 23 10 3 18 7 4 9 2 5 14 4 6 20 6 7 21 7 8 18 6 9 16 4 10 19 6

สมมตัวิ(า Y ก�บ X วิ(าม�ควิามส�มพั�นธ์�เช้งเส&นตัรงและม�ตั�วิแบบ Y = + X +

จงห์าสมการการถดถอย Y = a + bX Descriptive Statistics

Mean Std. Deviation N

Y 18.0000 4.16333 10

X 6.0000 2.26078 10

Page 5: chapter 11 316 204

Model Summary

Model R R Square

Adjusted R

Square

Std. Error of the

Estimate

1 .933a .870 .853 1.59398

a. Predictors: (Constant), X

- 4 -ANOVAb

Model Sum of Squares df Mean Square F Sig.

1 Regression 135.674 1 135.674 53.399 .000a

Residual 20.326 8 2.541

Total 156.000 9

Coefficientsa

Model

Unstandardized Coefficients

Standardized

Coefficients

t Sig.

95% Confidence Interval for B

B Std. Error Beta Lower Bound Upper Bound

1 (Constant) 7.696 1.497 5.139 .001 4.242

X 1.717 .235 .933 7.307 .000 1.175

Page 6: chapter 11 316 204

ในท��น�2 จะได&สมการการถดถอย Y = 7.696 + 1.717Xค(า b ในสมการการถดถอยในท��น�2ค%อ 1.717 จะบอกการเป็ล��ยนแป็ลงของ Y เม%� อ X เป็ล��ยนไป็ 1 ห์น(วิย ในท��น�2ห์มายควิามวิ(า ถ&าคร�วิเร%อนม�รายได&แตักตั(างก�น 1000 บาท จะม�ค(าใช้&จ(ายเก��ยวิก�บอาห์ารแตักตั(างก�นป็ระมาณ 171.7

บาท

- 5 -11.3 ก�รทดส้อบส้มมตั�ฐ�นำเก��ยวก�บ และ ในการทดสอบสมมตัฐานเก��ยวิก�บ และ เราจะตั&องม�ข&อสมมตัเก��ยวิก�บ ด�งน�2 NID(0, 2)

11.3.1 การป็ระมาณค(า 2

การป็ระมาณค(า 2 เป็�นข�2นตัอนแรกในการทดสอบสมมตัฐาน(และสร&างช้(วิงควิามเช้%�อม��น) ท��จะกล(าวิในตัอนตั(อไป็ เราได&วิ(า ตั�วิป็ระมาณท��ไม(เอนเอ�ยงของ 2 ค%อ S2 = SSE

n 2

รากท�� สองของ S2 ค%อ S บางคร�2ง เรา เร�ยกวิ( า ควิามคลาดเค ล%� อนมา ตั รฐานของ ค( า ป็ ร ะมาณ ห์ร%อ ควิามคลาดเคล%�อนมาตัรฐานของการถดถอย (Standard

Error of Estimate ห์ ร% อ Standard Error of Regression)เราสามารถเข�ยน S2 =

SYY bSXYn

2

11.3.2 การทดสอบสมมตัฐาน และสร&างช้(วิงควิามเช้%�อม��นเก��ยวิก�บ

Page 7: chapter 11 316 204

ในการทดสอบสมมตัฐาน H0: = 0 และ H1: 0

สถตัท��ใช้&ทดสอบค%อ ใช้& t test

t = ม�การแจกแจงแบบ t ท��ม�องศึาแห์(ง

ควิามอสระ = n – 2 ในตั�วิอย(างท�� 11.1 จะได&

t = 5.139 และค(า P-value = 0.001

ช้(วิงควิามเช้%�อม��น 95 % ของ ค%อ 4.242 < < 11.149 11.3.3 การทดสอบสมมตัฐาน และสร&างช้(วิงควิามเช้%�อม��นเก��ยวิก�บ ในการทดสอบสมมตัฐาน H0: = 0 และ H1: 0

ก. ใช้& t test

t = ม�การแจกแจงแบบ t ท��ม�องศึาแห์(งควิามอสระ = n – 2

ในตั�วิอย(างท�� 11.1 จะได& t = 7.307 และค(า P-value < 0.001

ช้(วิงควิามเช้%�อม��น 95 % ของ ค%อ 4.242 < < 11.149 ข. ใช้&การวิเคราะห์�ควิามแป็รป็รวิน (Analysis

of Variance) เข�ยนย(อวิ(า ANOVA

ตัารางวิเคราะห์�ควิามแป็รป็รวินส0าห์ร�บการถดถอยเช้งเส&นอย(างง(าย

ANOVA

Page 8: chapter 11 316 204

Source of Variation df SS MS FRegression 1 SSR MSR F = MSR/MSEError n - 2 SSE MSETotal n - 1 SST โดยท�� SST = SYY เร�ยกวิ(า Total Sum of Squares

SSR = bSXY เร�ยกวิ(า Regression Sum of Squares และ SSE = SST - SSR เร�ยกวิ(า Error Sum of Squares F = MSR

MSE ม�การแจกแจงแบบเอฟ ท��ม�องศึาแห์(งควิามอสระ

(1, 2) โดยท�� 1 = 1 และ 2 = n - 2

จะป็ฏิเสธ์ H0 ถ&า F F( 1, 2 )

11.3.4 Coefficient of Determination เรา เร�ยก R2 = (นยมบอกเป็�น เป็อร�เซึ่นตั� ) วิ( า Coefficient of Determination เราใช้& R2 เป็�นเคร%�องช้�2ควิามส0าค�ญของ X ท��ม�ตั(อ Y

ในตั�วิอย(างท�� 11.1 จะได& R2 = 87% ห์มายควิามวิ(า 87% ของควิามแป็รผ�นท�2งห์มด (total

variation) ในค(าใช้&จ(ายเก��ยวิก�บอาห์ารของคร�วิเร%อน (Y)

สามารถอธ์บายได&ด&วิยรายได&ของคร�วิเร%อน (X)

Page 9: chapter 11 316 204

- 7 -

11.4 ก�รว�เคร�ะห์ ส้ห์ส้�มพั�นำธ์ เราทราบควิามห์มายของการวิเคราะห์�สห์ส�มพั�นธ์�แล&งในตัอนท�� 11.1 ส+ตัรส0าห์ร�บค0านวิณ ส�มป็ระสทธ์1สห์ส�มพั�นธ์� r ค%อ

r =

ซึ่��งเราสามารถแสดงได&วิ(า r = ในตั�วิอย(างท�� 11.1 จะได& r = 0.933