chapter 11 316 204
DESCRIPTION
ถดถอย น่าสนใจTRANSCRIPT
บทท�� 11
การวิเคราะห์�การถดถอยและสห์ส�มพั�นธ์�(Regression and Correlation Analysis)
11.1 บทนำ�� การวิเคราะห์�การถดถอย (Regression Analysis)
และการวิเคราะห์�สห์ส�มพั�นธ์� (Correlation Analysis) เ ป็� น ก า ร ศึ� ก ษ า เ ก�� ย วิ ก� บ ค วิ า ม ส� ม พั� น ธ์� ข อ ง ตั� วิ แ ป็ ร วิ�ตัถ$ป็ระสงค�ห์ล�กของการวิเคราะห์�การถดถอยค%อ เราตั&องการป็ระมาณค(าของตั�วิแป็รตั�วิห์น��ง ซึ่��งเร�ยกวิ(า ตั�วิแป็รตัาม (Dependent Variable) นยมเข�ยนแทนด&วิย Y
โดยอาศึ�ยควิามร+ &จากตั�วิแป็รอ%� น ซึ่��งเร�ยกวิ(า ตั�วิแป็รอสระ (Independent Variable) นยมเข�ยนแทนด&วิย X ห์ร%อกล(าวิอ�กอย(างห์น��งวิ(า เราใช้&ควิามร+ & ห์ร%อสารสนเทศึจาก X
เป็�นเกณฑ์�ในการป็ระมาณ Y ถ&าใช้&ตั�วิแป็ร X เพั�ยงตั�วิแป็รเด�ยวิในการป็ระมาณ Y และควิามส�มพั�นธ์�ของ Y และ X เป็�นเช้งเส&นตัรง เราเร�ยกวิ(า การถดถอยเช้งเส&นอย(างง(าย (Simple Linear Regression) ส0าห์ร�บการวิเคราะห์�สห์ส�มพั�นธ์� เป็�นการศึ�กษาระด�บ ห์ร%อขนาดของควิามส�มพั�นธ์�เช้งเส&นตัรงระห์วิ(างตั�วิแป็รสองตั�วิแป็รวิ(าม�มากน&อยเพั�ยงใด เคร%�องม%อท�� ใช้&วิ�ดเร�ยกวิ(า ส�มป็ระสทธ์1สห์ส�มพั�นธ์� (Correlation Coefficient) นยมเข�ยนแทนด&วิย r โดยวิ�ดออกมาเป็�นตั�วิเลขท��ม�ค(าอย+(ระห์วิ(าง -1 ก�บ 1 ถ&า r ม�ค(าใกล& 1 แสดงวิ(า ตั�วิแป็รสองตั�วิน�2นม�ควิามส�มพั�นธ์�ก�นมากและม�ทศึทางเด�ยวิก�น กล(าวิค%อ ถ&า X ม�ค(ามาก Y จะม�ค(ามากด&วิย ถ&า r ม�ค(าใกล& -1 แสดงวิ(า ตั�วิแป็รสองตั�วิน�2นม�ควิามส�มพั�นธ์�ก�นมากเช้(นก�นแตั(ม�ทศึทางตัรง
ข&ามก�น กล(าวิค%อ ถ&า X ม�ค(ามาก Y จะม�ค(าน&อย ห์ร%อ X ม�ค(าน&อย Y จะม�ค(ามาก ถ&า X และ Y ม�ควิามส�มพั�นธ์�ก�นน&อย ค(าส�มป็ระสทธ์1สห์ส�มพั�นธ์� r จะเข&าใกล& 0
11. 2 ตั�วแบบก�รถดถอยเชิ�งเส้�นำอย��งง��ย (Simple Linear Regression Model) เราจะสมมตัวิ(า Y และ X ม�ควิามส�มพั�นธ์�ก�นในร+ป็ Y = + X + . . . (1) โดยท�� และ เร�ยกวิ(า ส�มป็ระสทธ์1การถดถอยของป็ระช้ากร (Population Regression Coefficient) จะถ%อวิ(าเป็�นค(าคงท��และไม(ทราบค(า น��นค%อ และ เป็�นพัารามเตัอร�ท��ไม(ทราบค(า เราเร�ยก (1) วิ(า ตั�วิแบบการถดถอยเช้งเส&นอย(างง(าย
- 2 - ในเบ%2องตั&น เราสามารถตัรวิจสอบควิามส�มพั�นธ์�ระห์วิ(าง Y ก�บ X วิ(าม�ควิามส�มพั�นธ์�เช้งเส&นตัรงห์ร%อไม(โดยการน0าค(าของ Y ก�บ X พัลอตัเป็�นจ$ด แผนภาพัท�� ได& เราเร�ยกวิ(า แผนภาพัการกระจาย (Scatter Diagram) ด�งแสดงข&างล(าง
เม%�อเราทราบวิ(า Y ก�บ X วิ(าม�ควิามส�มพั�นธ์�เช้งเส&นตัรง เราป็ระมาณตั� วิแบบใน (1) ด&วิยสมการการถดถอย (Regression Equation) Y = a + bX . . . (2)โดยท�� a และ b เป็�นตั�วิป็ระมาณแบบก0า ล�งสองตั0�า ส$ด (Least Square Methods) ของ และ ตัามล0า ด�บ กล(าวิค%อ เราจะห์า a และ b ท��ท0าให์& SSE = = ม�ค(าน&อยท��ส$ด ซึ่��งค(าของ a และ b จะเป็�นค(าป็ระมาณของ และ ตัามล0าด�บ เราเร�ยก a และ b วิ(า ส�มป็ระสทธ์1การถดถอยของตั�วิอย(าง (Sample Regression Coefficient) โดยท�� a = Y - bX
และ b = XY - ( X)( Y) / n
X - ( X)
n2
2
เม%�อก0าห์นดส�ญญล�กษณ� SXX = ( )X X 2 = X2
- ( X)
n
2
SXY = ( )( )X X Y Y = XY - ( )( )X Y
n
SYY = ( )Y Y 2 = Y2 - ( )Y
n
2
เราสามารถเข�ยน b = SXYSXX
- 3 - ตั�วอย��งท�� 11.1 ข&อม+ลข&างล(างเป็�นค(าใช้&จ(ายเก��ยวิก�บอาห์าร
ของคร�วิเร%อน (Y) ก�บรายได&ของคร�วิเร%อน (X)
คร�วิเร%อนท�� Y (ร&อยบาท)
X (พั�นบาท)
1 22 8 2 23 10 3 18 7 4 9 2 5 14 4 6 20 6 7 21 7 8 18 6 9 16 4 10 19 6
สมมตัวิ(า Y ก�บ X วิ(าม�ควิามส�มพั�นธ์�เช้งเส&นตัรงและม�ตั�วิแบบ Y = + X +
จงห์าสมการการถดถอย Y = a + bX Descriptive Statistics
Mean Std. Deviation N
Y 18.0000 4.16333 10
X 6.0000 2.26078 10
Model Summary
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate
1 .933a .870 .853 1.59398
a. Predictors: (Constant), X
- 4 -ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 135.674 1 135.674 53.399 .000a
Residual 20.326 8 2.541
Total 156.000 9
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig.
95% Confidence Interval for B
B Std. Error Beta Lower Bound Upper Bound
1 (Constant) 7.696 1.497 5.139 .001 4.242
X 1.717 .235 .933 7.307 .000 1.175
ในท��น�2 จะได&สมการการถดถอย Y = 7.696 + 1.717Xค(า b ในสมการการถดถอยในท��น�2ค%อ 1.717 จะบอกการเป็ล��ยนแป็ลงของ Y เม%� อ X เป็ล��ยนไป็ 1 ห์น(วิย ในท��น�2ห์มายควิามวิ(า ถ&าคร�วิเร%อนม�รายได&แตักตั(างก�น 1000 บาท จะม�ค(าใช้&จ(ายเก��ยวิก�บอาห์ารแตักตั(างก�นป็ระมาณ 171.7
บาท
- 5 -11.3 ก�รทดส้อบส้มมตั�ฐ�นำเก��ยวก�บ และ ในการทดสอบสมมตัฐานเก��ยวิก�บ และ เราจะตั&องม�ข&อสมมตัเก��ยวิก�บ ด�งน�2 NID(0, 2)
11.3.1 การป็ระมาณค(า 2
การป็ระมาณค(า 2 เป็�นข�2นตัอนแรกในการทดสอบสมมตัฐาน(และสร&างช้(วิงควิามเช้%�อม��น) ท��จะกล(าวิในตัอนตั(อไป็ เราได&วิ(า ตั�วิป็ระมาณท��ไม(เอนเอ�ยงของ 2 ค%อ S2 = SSE
n 2
รากท�� สองของ S2 ค%อ S บางคร�2ง เรา เร�ยกวิ( า ควิามคลาดเค ล%� อนมา ตั รฐานของ ค( า ป็ ร ะมาณ ห์ร%อ ควิามคลาดเคล%�อนมาตัรฐานของการถดถอย (Standard
Error of Estimate ห์ ร% อ Standard Error of Regression)เราสามารถเข�ยน S2 =
SYY bSXYn
2
11.3.2 การทดสอบสมมตัฐาน และสร&างช้(วิงควิามเช้%�อม��นเก��ยวิก�บ
ในการทดสอบสมมตัฐาน H0: = 0 และ H1: 0
สถตัท��ใช้&ทดสอบค%อ ใช้& t test
t = ม�การแจกแจงแบบ t ท��ม�องศึาแห์(ง
ควิามอสระ = n – 2 ในตั�วิอย(างท�� 11.1 จะได&
t = 5.139 และค(า P-value = 0.001
ช้(วิงควิามเช้%�อม��น 95 % ของ ค%อ 4.242 < < 11.149 11.3.3 การทดสอบสมมตัฐาน และสร&างช้(วิงควิามเช้%�อม��นเก��ยวิก�บ ในการทดสอบสมมตัฐาน H0: = 0 และ H1: 0
ก. ใช้& t test
t = ม�การแจกแจงแบบ t ท��ม�องศึาแห์(งควิามอสระ = n – 2
ในตั�วิอย(างท�� 11.1 จะได& t = 7.307 และค(า P-value < 0.001
ช้(วิงควิามเช้%�อม��น 95 % ของ ค%อ 4.242 < < 11.149 ข. ใช้&การวิเคราะห์�ควิามแป็รป็รวิน (Analysis
of Variance) เข�ยนย(อวิ(า ANOVA
ตัารางวิเคราะห์�ควิามแป็รป็รวินส0าห์ร�บการถดถอยเช้งเส&นอย(างง(าย
ANOVA
Source of Variation df SS MS FRegression 1 SSR MSR F = MSR/MSEError n - 2 SSE MSETotal n - 1 SST โดยท�� SST = SYY เร�ยกวิ(า Total Sum of Squares
SSR = bSXY เร�ยกวิ(า Regression Sum of Squares และ SSE = SST - SSR เร�ยกวิ(า Error Sum of Squares F = MSR
MSE ม�การแจกแจงแบบเอฟ ท��ม�องศึาแห์(งควิามอสระ
(1, 2) โดยท�� 1 = 1 และ 2 = n - 2
จะป็ฏิเสธ์ H0 ถ&า F F( 1, 2 )
11.3.4 Coefficient of Determination เรา เร�ยก R2 = (นยมบอกเป็�น เป็อร�เซึ่นตั� ) วิ( า Coefficient of Determination เราใช้& R2 เป็�นเคร%�องช้�2ควิามส0าค�ญของ X ท��ม�ตั(อ Y
ในตั�วิอย(างท�� 11.1 จะได& R2 = 87% ห์มายควิามวิ(า 87% ของควิามแป็รผ�นท�2งห์มด (total
variation) ในค(าใช้&จ(ายเก��ยวิก�บอาห์ารของคร�วิเร%อน (Y)
สามารถอธ์บายได&ด&วิยรายได&ของคร�วิเร%อน (X)
- 7 -
11.4 ก�รว�เคร�ะห์ ส้ห์ส้�มพั�นำธ์ เราทราบควิามห์มายของการวิเคราะห์�สห์ส�มพั�นธ์�แล&งในตัอนท�� 11.1 ส+ตัรส0าห์ร�บค0านวิณ ส�มป็ระสทธ์1สห์ส�มพั�นธ์� r ค%อ
r =
ซึ่��งเราสามารถแสดงได&วิ(า r = ในตั�วิอย(างท�� 11.1 จะได& r = 0.933