บทที่ `...
TRANSCRIPT
บทท 8
สหสมพนธและการวเคราะหการถดถอย
การหาความสมพนธระหวางขอมลเชงปรมาณ 2 ชด หรอมากกวานนถาใชเทคนคการทดสอบไคสแควรจะตองแปลงขอมลเชงปรมาณเปนขอมลเชงกลมเสยกอนแลวจงนบความถ ซงการท าเชนนจะสญเสยรายละเอยดของขอมลไป เทคนคการวเคราะหสหสมพนธเปนเทคนคการหาความสมพนธระหวางขอมลเชงปรมาณตงแต 2 ชดขนไป หรอตวแปรแบบตอเนองตงแต 2 ตวขนไป และสามารถบอกไดวาขอมลทมความสมพนธกนนนมความสมพนธกนในทศทางใด ในขณะเดยวกนหากขอมลตงแต 2 ชดมความสมพนธโดยทขอมลชดหนง (ตวแปรตาม) ขนอยกบขอมลชดอน ๆ (ตวแปรอสระ) เทคนคการวเคราะหการถดถอยจะชวยพยากรณคาของตวแปรตามเมอก าหนดคาของตวแปรอสระเหลานน
สหสมพนธ (Correlation)
สหสมพนธเปนการศกษาความสมพนธระหวางขอมลหรอตวแปรตงแต2 ตวขนไป วามความสมพนธกนในระดบใด และมความสมพนธในทศทางใด เชนความสงกบน าหนกของคนมความสมพนธกนมากหรอนอย และมความสมพนธในทศทางเดยวกนหรอตรงกนขาม
ถาให X เปนตวแปรแทน ความสง (cm) Y เปนตวแปรแทนน าหนก (kg) ลกษณะของขอมลทเกบรวมรวมมาจะตองเปนขอมลทมาจากหนวยตวอยางเดยวกน
เชนคนเดยวกน ดงน
คนท น าหนก (Y) ความสง (X) 1 2
n
y1
y2
yn
x1
x2
xn
232
จากตารางจะเหนวาคาของตวแปร Y และ X ไดมาจากคน ๆ เดยวกน ซงอาจจะมหนวยเดยวกนหรอหนวยตางกนกได
การหาความสมพนธระหวางขอมลหรอตวแปร 2 ตว เรยกวาสหสมพนธอยางงาย(simple correlation) การหาความสมพนธระหวางขอมลหรอตวแปรมากกวา 2 ตว เรยกวาสหสมพนธเชงพห (multiple correlation) ในเอกสารฉบบนจะกลาวถงสหสมพนธอยางงายเทานน
วธการตรวจสอบลกษณะความสมพนธ
การตรวจสอบลกษณะความสมพนธของตวแปรสามารถท าไดหลายวธ ดงน 1. แผนภาพการกระจาย (scatter diagram) 2. คาสมประสทธสหสมพนธ (correlation coefficient)
1. แผนภาพการกระจาย
แผนภาพการกระจายเปนวธการดลกษณะความสมพนธของขอมลอยางคราว ๆโดยดจากลกษณะการกระจาย หรอแนวโนมของจดเมอเทยบกบเสนตรง ดงน
ในรป (a) แนวโนมของจดชขนดานขวาตามแนวเสนตรง เมอ x มคามาก y มคามาก เมอ x มคานอย y มคานอย เรยกวามความสมพนธเชงเสนเชงบวก (positive and linear correlation) หรอความสมพนธแบบแปรตามกน
ในรป (b) แนวโนมของจดชลงดานขวาตามแนวเสนตรง เมอ x มคามาก y มคานอย เมอ x มคานอย y มคามาก เรยกวามความสมพนธเชงเสนเชงลบ (negative and linear correlation) หรอความสมพนธแบบแปรผกผน
233
ในรป (c) แนวโนมของจดชลงดานขวาตามแนวเสนโคง เรยกวามความสมพนธไมเชงเสนเชงลบ(negative and nonlinear correlation)
ในรป (d) แนวโนมของจดกระจายออกไมมแนวเสนตรง เ รยกวาไม มความสมพนธ (no correlation)
2. คาสมประสทธสหสมพนธ
ส าหรบตวสถตทใชวดคาสหสมพนธอยางงายวามความสมพนธมากหรอนอยเพยงใดคอสมประสทธสหสมพนธ (Correlation coefficient) ซงในกรณของสหสมพนธอยางงายตวสถตนเรยกวาสมประสทธสหสมพนธอยางงาย (Simple Correlation Coefficient) เขยนแทนดวยสญลกษณ หรอ xy ในกรณทเปนคาพารามเตอร และ r หรอ rxyในกรณทเปนคาสถตโดยท และ r จะไมมหนวยและมคาตงแต -1 ถง 1
2.1 ความหมายของคาสมประสทธสหสมพนธ คาสมประสทธสหสมพนธทค านวณไดมความหมายดงน
1. ถา หรอ r มคาเปนบวก แสดงวาตวแปร X และ Y มความสมพนธเชงบวก หมายความวาถาตวแปร X มคาเพมขนตวแปร Y จะมคาเพมขนหรอถาตวแปร X มคาลดลง ตวแปร Y จะมคาลดลง
2. ถา หรอ r มคาเปนลบ แสดงวาตวแปร X และ Y มความสมพนธเชงลบ หมายความวาถาตวแปร X มคาเพมขนตวแปร Y จะมคาลดลง หรอถาตวแปร X มคาลดลง ตวแปร Y จะมคาเพมขน
234
3. ถา หรอ r มคาเทากบ 1 แสดงวาตวแปร X และ Y มความสมพนธเชงบวกอยางสมบรณ (perfect positive correlation)
4. ถา หรอ r มคาเทากบ -1 แสดงวาตวแปร X และ Y มความสมพนธเชงลบอยางสมบรณ (perfect negative correlation)
5. ถา หรอ r มคาเขาใกล 1 แสดงวาตวแปร X และ Y มความสมพนธเชงบวกและมความสมพนธมาก
6. ถา หรอ r มคาเขาใกล -1 แสดงวาตวแปร X และ Y มความสมพนธเชงลบและมความสมพนธมาก
7. ถา หรอ r มคาเขาใกล 0 แสดงวาตวแปร X และ Y ม ความสมพนธกนนอย
8. ถา หรอ r มคาเทากบ 0 แสดงวาตวแปร X และ Y ไมมความสมพนธเชงเสน
ตวอยางเชนถาคาสมประสทธสหสมพนธระหวางความสงกบน าหนกเทากบ
0.85 หมายความวาความสงมความสมพนธเชงบวกอยางมากกบน าหนก ถาความสงมากน าหนกจะมากดวย และถาความสงนอยน าหนกจะนอยดวย เปนตน
ความหมายของ หรอ r สามารถแสดงดวยแผนภาพการกระจาย ดงน
235
2.2 วธการค านวณหาคาสมประสทธสหสมพนธ วธการค านวณคาสมประสทธสหสมพนธมหลายวธขนอยกบประเภทของขอมลหรอตวแปร เชนสมประสทธสหสมพนธฟ สมประสทธสหสมพนธสเปยรแมน สมประสทธสหสมพนธเพยรสน เปนตน
ในเอกสารฉบบนจะกลาวเฉพาะการค านวณหาคาสมประสทธสหสมพนธของเพยรสน ซงใชหาความสมพนธระหวางขอมลเชงปรมาณ หรอตวแปรแบบตอเนอง สมประสทธสหสมพนธเพยรสนเขยนแทนดวยสญลกษณ ซงคดคนโดย คารล เพยรสน (Karl Pearson) บางครงอาจเรยกวา Pearson Product moment correlation Coefficient ซงสามารถค านวณไดจากสตร ดงน
yx
yx
),cov( หรอ
yx
xy
2
1
2
1
1
)()(
)()(
yi
N
ixi
N
i
yixi
N
i
yx
yx
โดยท แทนสมประสทธสหสมพนธเพยรสน cov(x,y) หรอ xy แทนความแปรปรวนรวมของตวแปร X และ Y yx , แทนสวนเบยงเบนมาตรฐานของตวแปรX และ Y
yx , แทนคาเฉลยของตวแปร X และ Y
ในการปฏบตเราเกบรวบรวมขอมลจากตวอยาง ดงนนจะประมาณ ดวย r โดยท
yxss
yxr
),cov(
2
1
2
1
1
)()(
))((
yyxx
yyxx
i
n
ii
n
i
ii
n
i
2
1
2
1
2
1
2
1
111
)()()()( i
n
ii
n
i
n
i
ii
n
i
i
n
ii
n
iii
n
i
yynxxn
yxyxn
236
โดยท r แทนสมประสทธสหสมพนธเพยรสน cov(x,y) แทนความแปรปรวนรวมของตวแปร X และ Y yx ss , แทนสวนเบยงเบนมาตรฐานของตวแปร X และ Y yx , แทนคาเฉลยของตวแปร X และ Y n แทนจ านวนตวอยาง
2.3 ขอตกลงเบองตน ของสมประสทธสหสมพนธของเพยรสน เปนดงน 1. ตวแปร 2 ตว เปนตวแปรแบบตอเนอง หรอเปนขอมลเชงปรมาณ 2. ความสมพนธระหวาง 2 ตวแปรเปนเสนตรง (Linear Relationship)
ตวอยาง 8.1 จากคะแนนสอบของนกศกษาเอกคณตศาสตรทสอบวชาแคลคลส 1 และแคลคลส2 จ านวน 12 คน เปนดงตารางดานลางอยากทราบวาคะแนนสอบทง 2 วชามความสมพนธกนเพยงใด
คนท. คะแนนสอบวชาแคลคลส 1 (Y)
คะแนนสอบวชาแคลคลส 2 (X)
1 2 3 4 5 6 7 8 9
10 11 12
51 68 72 97 55 73 95 74 20 91 74 80
74 70 88 93 67 73 99 73 33 91 80 86
y = 850 x = 927
237
วธท า จากขอมล จะได 2y 2x xy
2601 4624 5184 9409 3025 5329 9025 5476 400
8281 5476 6400
5476 4900 7744 8649 7789 5329 9801 5329 1089 8281 6400 7396
3774 4760 6336 9021 3685 5329 9045 5402 660
8281 5920 6880
65230y2 74883x2 69453xy
2i
n
1i
2i
n
1i
2n
1i
i2
i
n
1i
i
n
1ii
n
1iii
n
1i
yynxxn
yxyxn
r
)()()()(
))()(())()((
))(()(
22 85065230129277488312
8509276945312
))(( 6026039267
787950833436
2366229420
45486
9350.
935.0r หมายความวาคะแนนสอบวชาแคลคลส 1 และแคลคลส 2 ของนกศกษา 12 คนมความสมพนธอยางมากในเชงบวก นนคอถาคะแนนสอบวชาแคลคลส 1 เพมขนคะแนนสอบวชาแคลคลส 2 จะเพมขน หรอถาคะแนนสอบวชาแคลคลส 1 ลดลงคะแนนสอบวชาแคลคลส 2 จะลดลงดวย
238
การประมาณคาสมประสทธสหสมพนธเพยรสน ( xy )
1. การประมาณคาแบบจดของสมประสทธสหสมพนธ
ตวประมาณแบบจดของ xy คอ
2i
n
1i
2i
n
1i
2n
1i
i2
i
n
1i
i
n
1ii
n
1iii
n
1i
yynxxn
yxyxn
r
)()()()(
2. การประมาณคาแบบชวงของสมประสทธสหสมพนธ
เนองจากคาสมประสทธสหสมพนธมคาไมเทากบ 0 ดงนนการแจกแจงของสมประสทธสหสมพนธจงไมเปนสมมาตร เพอใหการแจกแจงของสมประสทธสหสมพนธเปนสมมาตร จงตองเปลยนคา xyr เปน rZ ตามวธการของ Fisher ดงน
r1
r1n1
2
1Zr
จะได rZ มการแจกแจงแบบปกตดวยคาเฉลย
1
1ln
2
1Zr
ความ
แปรปรวน 3
12
nZr
นนคอ ),ln(~3n
1
1
1
2
1NZr
ดงนนจะได 3nZ
ZZ
Zrr
Zr
Zrr
)(
จะได %)( 1001 ของ rZ คอ 3nzZr
2
3nzZrZ
2
L
และ 3nzZrZ
2
u
239
ในการประมาณคาแบบชวงของ ตองเปลยนขอบเขตบนและขอบเขตลางของการประมาณคาแบบชวงเปนขอบเขตบนของ ( U ) และขอบเขตลางของ ( L ) เสยกอนโดยท
1e
1e
Zu2
Zu2
U
และ
1e
1e
L
L
Z2
Z2
L
ดงนนชวงความเชอมน %)( 1001 ของ คอ UL
ตวอยาง 8.2 จากตวอยาง 8.1 คะแนนสอบวชาแคลคลส 1 และแคลคลส 2 ของนกศกษาเอกคณตศาสตรมความสมพนธกนในระดบใด ทความเชอมน 95 %
จาก rZ =
r1
r1
2
1ln
=
93501
93501
2
1
.
.ln
= 77292
1.ln
= ).( 3932
1
= 671. จะได %)( 1001 ของ rZ คอ
3nzZr
2
= 312
961671
.).(
ดงนน 021Z322Zu L .. และ
จาก 1e
1e
Zu2
Zu2
U
และ
1e
1e
L
L
Z2
Z2
L
980
54104
54102
1e
1e
3222
3222
U
.
.
.
).(
).(
770
698
696
1e
1e
0212
0212
L
.
.
.
).(
).(
หมายความวาทระดบความเชอมน 95 % สมประสทธสหสมพนธของคะแนนสอบวชาแคลคลส 1 และแคลคลส 2 มคาในชวง 0.77 ถง 0.98
240
การทดสอบสมมตฐานเกยวกบสมประสทธสหสมพนธ ( )
เปนการทดสอบวาตวแปร X และตวแปร Y มความสมพนธกนหรอไม
สมมตฐานเชงสถต 0H0 : หรอ :0H X และ Y ไมมความสมพนธเชงเสนตรง 0H1 : หรอ :1H X และ Y มความสมพนธเชงเสนตรง
เนองจาก 0 จะไดวา r มการแจกแจงแบบปกต และมสวนเบยงเบนมาตรฐาน
คอ )/()( 2nr1 2
ตวสถตทดสอบ
2nr1
0rT
2
)(
คาวกฤต 2n
22n
2
tt
,,
,
ในบางกรณความตองการทดสอบสมมตฐานวา ส.ป.ส สหสมพนธมคาเทากบคาใดคาหนงหรอไม (หมายความวา 00 ) จะตองเปลยนคา r ใหเปน Zr rเสยกอนโดยท
r1
r1
2
1Zr ln และ
3n
1
1
1
2
1NZr ,ln~
ดงนน ตวสถตทดสอบ )( 3n
1
ZZrZ 0
โดยท
0
00
1
1
2
1Z
ln
คาวกฤต 22
zz ,
ตวอยาง 8.3 จากตวอยาง 8.1 ตองการทดสอบวาคะแนนสอบวชาแคลคลส 1 และแคลคลส 2 มความสมพนธในรปเชงเสนตรงหรอไม ทระดบนยส าคญ 0.05
H0: คะแนนวชาแคลคลส 1 และแคลคลส 2 ไมมความสมพนธเชงเสนตรง H1: คะแนนวชาแคลคลส 1 และแคลคลส 2 มความสมพนธเชงเสนตรง
241
หรอ 0H0 : 0H1 :
ตวสถตทดสอบ 2nr1
0rT
2
/)(
= 21293501
9350
2 /).(
.
= 101260
9350
/.
.
= 8.33
คาวกฤต 2282tt 1002502n
2
.,.,
2282tt 1002502n
2
.,.,
เนองจาก T = 8.33 มากกวา t 0.025,10 = 2.228 มคาอยในบรเวณปฏเสธ H0หมายความวา คะแนนวชาแคลคลส 1 และแคลคลส 2 มความสมพนธเชงเสนตรง อยางมนยส าคญทระดบ 0.05
การวเคราะหการถดถอย (Regression Analysis)
เปนการศกษาถงความสมพนธของตวแปรตงแต 2 ตวขนไป โดยมวตถประสงคทจะประมาณหรอพยากรณคาของตวแปรหนง จากตวแปรอน ๆ ทมความสมพนธกบตวแปรทตองการพยากรณ โดยจะตองมการก าหนดหรอทราบคาของตวแปรอน ๆ ลวงหนา ในทนเรยกวาตวแปรอสระ (Independence Variable) จงจะท าใหทราบคาของตวแปรอกตวหนง ซงในทนเรยกวาตวแปรตาม (Dependence Variable) เชน เมอทราบวาราคาทดนกบขนาดของทดนมความสมพนธกนแลว และคดวาราคาทดนขนอยกบขนาดของทดนหรอขนาดของทดนมผลตอราคาทดน นนคอขนาดทดนเปนตวแปรอสระ และราคาทดนเปนตวแปรตาม หมายความวาเมอก าหนดขนาดของทดนจะท าใหประมาณหรอพยากรณราคาทดนนนได และสามารถศกษาการเปลยนแปลงของราคาทดนเมอขนาดของทดนเปลยนแปลงไป โดยอาศยหลกการของการวเคราะหการถดถอย ดงนนวตถประสงคของ การวเคราะหการถดถอย คอพยากรณคาตวแปรตามในอนาคต เมอก าหนดคาตวแปรอสระ
หมายเหต โดยทวไปมกใหตวแปรอสระแทนดวย X และตวแปรตามแทนดวย Y
242
การทจะน าตวแปร X มาพยากรณ Y ไดนน ตวแปร X และ Y จะตองมความสมพนธกน (จากแผนภาพการกระจาย) ถาตวแปรX และ Y มความสมพนธเชงเสนตรงและ คาของ Y ขนอยกบคาของ X จะเรยกการถดถอยนนวาการวเคราะหการถดถอยเชงเสน (Linear Regression Analysis)
ถาตวแปร X และ Y มความสมพนธเชงเสนตรง และตวแปร Y ถกพยากรณดวยตวแปร X เพยง 1 ตวจะเรยกวา การถดถอยเชงเสนอยางงาย (Simple Linear Regression)
ถาตวแปร X และ Y มความสมพนธเชงเสนตรง และตวแปร Y ถกพยากรณดวยตวแปร X มากกวา 1 ตวจะเรยกวาการถดถอยเชงเสนพหคณ (Multiple Linear Regression)
ซงในเอกสารฉบบนจะศกษาเฉพาะ Simple Linear Regression เทานน
การวเคราะหการถดถอยเชงเสนอยางงาย (Simple Linear Regression Analysis)
หลกการของการวเคราะหการถดถอยคอใชขอมลเมอก าหนดคาตวแปรอสระ (X) แลวท าใหเกดคาตวแปรตาม (Y) ในอดตน ามาสรางสมการเชงเสนทเหมาะสมทสด เพอพยากรณคา Y ในอนาคต
แตในบางครงคาของ x และ y ทเกดขนนนอาจสรางสมการเชงเสนตรงไดหลายเสน คอนดบ (x,y) อาจไมอยในแนวเสนตรงเดยวกนทงหมด ดงรป
243
ตวอยาง 8.4 รายจายมกขนอยกบรายไดเสมอ หากตองการพยากรณคาของรายจายในอนาคตเมอก าหนดรายไดจงท าการบนทกขอมลรายได และรายจายของครอบครว โดยท X เปนตวแปรอสระแทนเงนเดอน (พนบาท)
Y เปนตวแปรตามแทนรายจาย (พนบาท) ไดขอมลดงน
เมอน าขอมลนมาเขยน scatter diagram จะไดดงรป
จะเหนวาจากขอมลขางตนอาจสามารถสรางสมการเชงเสนตรงได 2 เสนคอ L1 และ L2 ถาก าหนดใหสมการทวไปของ L1 และ L2 คอ
L1 : Y = A1 + B1 x L2 : Y = A2 + B2 x
ครอบครวท รายได X (พนบาท) รายจาย Y (พนบาท) 1 2 3 4 5 6 7 8 9
10
8 8 9 9
10 10 12 12 14 15
7 8 8
10 8 9 9
11 12 14
L1 L2
244
การพจารณาดวยสายตาวาควรใช L1 หรอ L2 ในการพยากรณคา Y นนท าใหตดสนใจล าบาก จงมแนวคดทางคณตศาสตรมาชวยในการตดสนใจเลอกสมการเชงเสนตรงทเหมาะสมทสด วธนนคอวธก าลงสองนอยทสด (Least Square Method)
1. วธก าลงสองนอยทสด (Least Square Method)
หลกการของวธก าลงสองนอยทสด คอเลอกสมการถดถอยเชงเสนทใหคาความคลาดเคลอนระหวางคาสงเกตของ y (คาจรง) กบคาประมาณของ y หรอคาจากสมการ )ˆ( y นอยทสด พจารณาขอมลตอไปน
ล าดบท x y 1 1 10 2 2 30 3 3 50
สามารถสรางสมการเชงเสนได 3 สมการ x1010yL 11 ˆ: x15yL 22 ˆ: x2010yL 33 ˆ:
ค านวณหาความคลาดเคลอนระหวาง y กบ y
ความคลาดเคลอน x y 1y 2y 3y 1yy ˆ 2yy ˆ 3yy ˆ 1 10 20 15 10 -10 5 0 2 30 30 30 30 0 0 0 3 50 40 45 50 10 5 0
ผลรวมความคลาดเคลอน 0 0 0 เมอน ามาค านวณก าลง 2 ของความคลาดเคลอนจะได ดงน 2
1yy )ˆ( 22yy )ˆ( 2
3yy )ˆ( 100 25 0 0 0 0 100 25 0 ผลรวม 200 50 0
245
จะเหนวาสมการเชงเสน L3 ยงใหคาผลรวมก าลงสองต าสด และเมอพจารณาจากกราฟ
จะเหนวา L3 เปนเสนกราฟดทสด โดยปกตเรานยามวาเสนตรงทดควรมคาความ
คลาดเคลอนระหวางเสนตรงกบจดขอมลนอยทสด และเรยกเสนตรงนนวา สมการถดถอยเชงเสนอยางงาย วธการก าลงสองนอยทสดจะเลอกสมการทใหความคลาดเคลอนระหวาง y กบ y นอยทสดเชนกน
สรปสมการถดถอยเชงเสนอยางงายทจะเปนตวแทนแสดงความสมพนธเชงเสนระหวางตวแปรอสระ (X) และตวแปรตาม (Y) จงหมายถงสมการเสนตรงทท าใหผลรวมก าลงสองของความคลาดเคลอน ))ˆ(( 2yy มคาต าสด โดยอาศยวธการก าลงสองนอยทสด
2. ประโยชนของสมการถดถอยเชงเสน
สมการถดถอยเชงเสนสามารถใชประโยชนในการแสดงความสมพนธของตวแปร X กบ Y ใน 2 ประการ ดงน
1. ใชในการประมาณคา (estimation) เชนในการศกษาคาสมพนธระหวางปรมาณหมกทใชกบความเรวทพมพ
ถาให Y แทนปรมาณหมกทใช X แทนความเรวในการพมพ เราอาจท าการทดลองหาปรมาณหมกทใชในแตละระดบของความเรวในการ
พมพแลวน ามาใชในการหาสมการประมาณคาปรมาณหมกทใชในระดบความเรวตาง ๆ 2. ใชในการพยากรณ (forecasting) เชน ถา X คอป พ.ศ. Y คอปรมาณการสงออก
ของผลไมไทย การบนทกปรมาณการสงออกของผลไมไทยในปตาง ๆ ทผานมา ท าใหเราสามารถใชสมการถดถอยพยากรณปรมาณการสงออกของผลไมไทยใน 5 หรอ 10 ปขางหนาได
L1
L2
L3
246
3. ตวแบบ (Model) ขอสมมต (Assumptions) และวธการหาสมการถดถอยเชงเสนอยางงาย
3.1 ตวแบบ โดยทวไปสมการถดถอยเชงเสนอยางงายจะมตวแบบดงน
XY 10
โดยท 0 เปนจดตดแกน Y หรอคาของ y เมอ x=0 1 คออตราการเปลยนแปลงของ Y เมอ X เปลยนไป 1 หนวย หรอเรยกวา สมประสทธถดถอย (regression coefficient) คอ คาคลาดเคลอนเชงสม (error)
3.2 ขอสมมตของสมการถดถอยเชงเสน จากหลกการของการถดถอยเชงเสน คอก าหนดคาของตวแปรอสระ X ท าให
เกดตวแปรตาม Y จะเหนวาตวแปร X เปนตวแปรทใชควบคม (Fixed Variable) ถกก าหนดคา หรอถกสงเกต หรอมผลตอตวแปร Y ดงนน Y จงเปนตวแปรสม เชน
ปรมาณปยมผลตอปรมาณผลผลตขาว X Y (ควบคม) (ตวแปรตาม)
คะแนนสอบเขามผลตอเกรดเฉลยชนปท 1 X Y (สงเกต) (ตวแปรตาม)
จะเหนวาตวแปรอสระ 1 คา สามารถมคา Y ทเปนไปไดมากมายหลายคา ดงรป
247
ซงการใชสมการถดถอยท าการประมาณ คา Y นน จงท าใหเกดความคลาดเคลอนขน ( i ) ซงความคลาดเคลอนนประกอบดวยความคลาดเคลอน 2 สวนใหญ ๆ คอ
สวนท 1 ความคลาดเคลอนสมซงเกดจากการทมปจจยอน ๆ ทมผลตอตวแปรตามแตไมไดน ามารวมกน และความผดพลาดในการวดคา (พจารณาเฉพาะความคลาดเคลอนในตวแปรตาม)
สวนท 2 ความคลาดเคลอนเนองจากใชตวแบบไมเหมาะสม (Lack of fit) เชนความสมพนธระหวาง x กบ y จรง ๆ เปนเสนโคง แตตวแบบทใชในการวเคราะหเปนเสนตรง เปนตน (ความคลาดเคลอนประเภทนจะไมกลาวถงรายละเอยด ดงนนส าหรบการวเคราะหการถดถอยตอไปนจะสมมตวาตวแบบทใชเหมาะสม)
ดวยเหตผลนในการหาสมการถดถอยเชงเสนโดยวธก าลงสองนอยทสดจงมขอสมมตเกยวกบความคลาดเคลอน ( i ) ดงตอไปน
1. i ของตวแปรอสระแตละคาไมสมพนธกน 2. i ของตวแปรแตละคาเปนตวแปรสมและ i ~N(0,2) เนองจาก Y~N(0,2)
ภายใตเงอนไขขอน จะตองน าไปใชในการทดสอบสมมตฐานและการหาชวงเชอมนตอไป ขอสมมตในขอ 2 เปนสวนส าคญมาก นนคอถา ),0(N~ 2
i ไมเปนจรงวธการทใชในการประมาณคา 10 , จะไมเปนไปตามทควรเปน ดงน นควรตรวจสอบเสมอวา
),(~ 2i 0N หรอไม
3.3 การสรางสมการถดถอยเชงเสนอยางงาย จากตวแบบสมการถดถอยเชงเสน XY 10 เปาหมายคอตองการ
หาคา 10 , ทท าใหผลรวมของความคลาดเคลอนเปนศนย ( 0i ) และผลรวมก าลงสอง
ของความคลาดเคลอน ( 2i ) นอยทสด แตในความเปนจรงเราไมสามารถหาคาพารามเตอร
10 , จงตองอาศยคาจากตวอยางเพอหาคาประมาณของ 10 , ในตวแบบสมการถดถอยเชงเสนจากตวอยาง ดงน
i10 ebby ˆ
เมอ y แทนคาประมาณของ y b0 แทนคาประมาณของ 0
b1 แทนคาประมาณของ 1 ei แทนคาประมาณของ i หรอเรยกวาสวนเหลอ (residual)
248
3.4 การประมาณคาพารามเตอร 10 , การหาคา b0 และ b1 มดวยกนหลายวธ แตคาประมาณทไดจากวธก าลงสอง
นอยทสดจะท าใหผลรวมของก าลงสองของผลตางระหวาง y กบ y มคานอยทสด จากวธก าลงสองนอยทสดจะได
1b2
i2
i
iiii
xxn
xyyxn
)(
และ 0b = xby 1
ตวอยาง 8.5 จากตวอยาง 8.4 ขอมลรายจายกบรายได จงหาสมการถดถอยเชงเสนอยางงาย ตวแบบสมการถดถอยเชงเสนอยางงาย i10 ebby ˆ
1b = 2
i2
i
iiii
xxn
xyyxn
)(
= 2107119910
10796107010
)()(
))(()(
= 0.791 0b = xby 1 = (9.6)-(0.791)(10.7) = 1.1363
ดงนนสมการถดถอยเชงเสน คอ y = 1.1363 + 0.791X หมายความวาถารายไดเพมขน 1 พนบาท รายจายจะเพมขน 0.791 พนบาท หรอถารายไดลดลง 1 พนบาท รายจายจะลดลง 0.791 พนบาท
การประมาณคาและการทดสอบสมมตฐาน
1. การประมาณคา 0
ชวงความเชอมน 100(1- )% ของ 0 คอ
2
i
2i
2n2
0xxn
xstb
)(,
249
2. การทดสอบสมมตฐานของ 0 (ตองการทราบวาเสนถดถอยนผานจดก าเนดหรอไม)
สมมตฐานเชงสถต H0 : 0 = 00 (คาคงท) H1 : 000 H1 : 0>00 H1 : 0<00
ตวสถตทดสอบ
2i
2i
000
xxn
xs
bt
)(
คาวกฤต 2n
2
t
,
หรอ 2nt , หรอ 2nt ,
3. การประมาณคา 1
ชวงความเชอมน 100(1- )% ของ 1 คอ
2i
2n2
1 xxstb )(/,
4. การทดสอบสมมตฐานของ 1 (ตองการทดสอบวาตวแปร X มผลตอตวแปร Y หรอไม)
สมมตฐาน H0 : 1 = 10 (คาคงท) H1 : 1 > 10 (มความสมพนธในทางบวก) H1 : 1 < 10 (มความสมพนธในทางลบ) H1 : 1 10 (มความสมพนธกน)
ตวสถตทดสอบ
2i
101
xxs
bt
)(/
คาวกฤต 2nt , หรอ 2nt , หรอ 2n
2
t
,
250
ตวอยาง 8.6 จากตารางแสดงจ านวนชวโมงเฉลยในการท าการบานตอสปดาหของนกศกษา 6 คน กบเกรดเฉลยทนกศกษาไดในภาคเรยนนน เปนดงน
จ านวนชม.เฉลยในการท าการบาน (X)
15 28 13 20 4 10
เกรดเฉลย (Y) 2 2.7 1.3 1.9 0.9 1.7
จาก 623yxn
1xysxy .))((
344xn
1xs 22
xx )(
9151yn
1ys 22
yy .)(
หรอ
9194530
yynxxn
yxxynr
ss
sr
2222
yyxx
xyxy
.
)()(
r = 0.919 หมายความวาจ านวนชวโมงเฉลยในการท าการบานและเกรดเฉลยม
ความสมพนธเชงเสนเชงบวกกนคอนขางมาก นนคอถาจ านวนชวโมงเฉลยในการท าการบานเพมขนเกรดเฉลยจะเพมขนดวย และถาจ านวนชวโมงเฉลยในการท าการบานลดลงเกรดเฉลยจะลดลงดวย
ประมาณคา โดย แปลง r เปน 591r1
r1
2
1Zr .
)(
)(ln
ทระดบความเชอมน 95% ชวงความเชอมนของ rz คอ
131591
36
961591
3n
z
Zr 2
..
).(.
จะไดชวงเชอมน 95% rz คอ 722460
rz ..
251
ทระดบความเชอมน 95% ชวงความเชอมนของ คอ UL โดยท
990
44231
44229
1e
1e
u
u
U z2
z2
.
.
.
และ
430
513
511
1e
1e
L
L
L z2
z2
.
.
.
99.043.0 หมายความวาทระดบความเชอมน 95% สมประสทธสหสมพนธของจ านวนชวโมงเฉลยในการท าการบานกบเกรดเฉลยมคาประมาณ 0.43 ถง 0.99
หาคา b0 และ b1
จาก 068600
xxn
yxyxnb
2i
2i
iiii1
.
)(
720930
xbyb 10
.
สมการถดถอยเชงเสนคอ x06860720930y ..ˆ หมายความวาถาไมมชวโมงในการท าการบานเลยจะไดเกรดเฉลย 0.72093 และถาเพมชวโมงในการท าการบาน 1 ชวโมง เกรดเฉลยจะเพมขน 0.0686
ทดสอบสมมตฐาน 0H
0H
11
10
:
: เมอ 050.
ตวสถตทดสอบ
2i
11
xxs
bt
)(/
โดยท 27202n
SSEs .
3442720
006860
/.
.
= 4.678
คาวกฤต t0.025,24 = 2.776
เนองจาก t = 4.678 อยในบรเวณปฏเสธ H0 แสดงวา 1 0 นนคอ x และ y มความสมพนธเชงเสน ทระดบนยส าคญ 0.05
252
ประมาณคา 1 ทระดบความเชอมน 95% ชวงความเชอมนของ 1คอ
xx2n2
1s
stb
,
= ).(. 01466507762b1
= 0.06860 0.0471
ดงนนทระดบความเชอมน 95% ชวงความเชอมนของ 1คอ 0.0215 ≤1≤ 0.1157
การใชโปรแกรมส าเรจรป SPSS
1. การตรวจสอบความสมพนธดวยแผนภาพการกระจาย
ตวอยาง 8.7 จงตรวจสอบความสมพนธของตวแปร X และ Y ในแฟมขอมล example16.sav
ขนท 1 เปดแฟมขอมล example16.sav เลอกค าสง Graphs / Scatter…
ขนท 2 เลอกค าสง Scatter จะไดเมนยอยเปนดงน
253
ขนท 3 เลอกรปแบบกราฟเปน Simple เสรจแลวคลกปม Define จะไดเมนยอยเปน
ขนท 4 เลอกตวแปร x ไวท X Axis และตวแปร y ไวท Y Axis
254
ขนท 5. คลก OK จะไดกราฟของแผนภาพการกระจายท SPSS Viewer ดงน
2. การหาคาสมประสทธสหสมพนธ
ตวอยาง 8.8 จงหาคาสมประสทธสหสมพนธของตวแปร X และ Y ในแฟมขอมล example16.sav ขนท 1 เปดแฟมขอมล example16.sav เลอกค าสง Analyze / Correlate / Bivariate…
255
ขนท 2 เลอกค าสง Bivariate จะไดเมนยอยดงน
ขนท 3 เลอกตวแปร X ละ Y ไวทชอง Variables: และเลอก Pearson ในสวน Correlation Coefficient
256
ขนท 4 เลอก OK ไดผลลพธดงน
ตวแปร X และ Y มความสมพนธกนคอนขางมากอยางมนยส าคญทางสถตทระดบ
0.01 (p_value = 0.000, r = 0.991)
3. การสรางสมการถดถอย
ตวอยาง 8.8 จงสรางสมการถดถอยเชงเสนอยางงายของตวแปร Y ในแฟมขอมล example16.sav ขนท 1 เปดแฟมขอมล example16.sav เลอกค าสง เลอกค าสง Analyze / Regression / Linear
C or re la tions
1 .991**
. .000
9 9
.991** 1
.000 .
9 9
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
X
Y
X Y
Correlation is significant at the 0.01 level
(2-tailed).
**.
257
ขนท 2. คลกท Linear จะไดเมนของค าสงดงน
ขนท 3.เลอกตวแปร x เปนตวแปรอสระน าไปไวทชอง Independent(s) เลอกตวแปร y เปนตวแปรตามน าไปไวทชอง Dependent
หมายเหต หากตองการเฉพาะคา b0, b1 และ r ใหคลก OK จะไดผลการวเคราะหทนท แตถาตองการใหมการเขยนกราฟใหคลก Plots หรอ ตองการหาชวงความเชอมนของคาพารามเตอร β0 และ β1
ใหคลกทปม Statistics จะไดเมนยอย ดงน
258
ขนท 4. เลอก Confidence Intervals เพอหาชวงความเชอมนของคาพารามเตอร β0 และ β1
ขนท 5. คลก Continue เพอกลบไปทเมน Linear Regression
259
ขนท 7. คลก OK จะไดผลการค านวณเปนดงน
Var iabl es En te red/ R em ov edb
Xa . EnterModel1
Variables
Entered
Variables
Removed Method
All requested variables entered.a.
Dependent Variable: Yb.
M ode l Sum m ary
.991a .982 .980 .53877Model1
R R Square
Adjusted
R Square
Std. Error of
the Estimate
Predictors: (Constant), Xa.
260
การใชโปรแกรมส าเรจรป MS EXCEL
ใชขอมลจากตวอยางท 8.1 ดงนนการใสขอมลใน Microsoft Excel เปนดงน
AN OVAb
112.484 1 112.484 387.516 .000a
2.032 7 .290
114.516 8
Regress ion
Residual
Total
Model1
Sum of
Squares df Mean Square F Sig.
Predic tors : (Constant), Xa.
Dependent Variable: Yb.
C oef f i c i en t sa
.257 .532 .483 .644 -1.002 1.516
2.930 .149 .991 19.685 .000 2.578 3.282
(Constant)
X
Model1
B Std. Error
Unstandardized
Coefficients
Beta
Standardized
Coefficients
t Sig. Lower Bound Upper Bound
95% Confidence Interval for B
Dependent Variable: Ya.
261
1. การตรวจสอบความสมพนธดวยแผนภาพการกระจาย ขนท 1 เลอก cell ขอมล เลอกเมน Insert เลอก Chart เลอก Scatter ดงรป
ขนท 2 จะไดผลลพธ ดงรป
262
2. การหาคาสมประสทธสหสมพนธ
ขนท 1 เมน Tools เลอก Data Analysis เลอก Correlation ดงรป
ขนท 2 ในสวน Input Range ใหใส cell ทเปนขอมลทงหมด ในสวน Group By เปนการเลอกการแบงกลมของขอมล
ขนตอนท 3 จะไดผลลพธ ดงรป
935.0r หมายความวาคะแนนสอบวชาเศรษฐศาสตร และวชามานษยวทยา ของนกศกษา 12 คนมความสมพนธอยางมากในเชงบวก
263
3. การสรางสมการถดถอย ขนตอนท 1 ใสขอมลดบ เลอกเมน Tools เลอก Data Analysis เลอก regression ดงรป
264
ขนตอนท 2 ในสวน Input Y Range ใหใส cell ทเปนขอมลตวแปรตาม ในสวน Input X Range ใหใส cell ทเปนขอมลตวแปรอสระ
ดงนนสมการถดถอยเชงเสน คอ y = 1.1363 + 0.791X หมายความวาถารายไดเพมขน 1 พนบาทรายจายจะเพมขน 0.791 พนบาท หรอถารายไดลดลง 1 พนบาท รายจายจะลดลง 0.791 พนบาท
265
สรปทายบท
สหสมพนธและการวเคราะหการถดถอยเปนเทคนคการวเคราะหขอมลในทางสถตเพอหาความสมพนธของขอมล หรอตวแปรตงแต 2 ตว ถาขอมลทง 2 ชดเปนขอมลเชงปรมาณ หรอตวแปร 2 ตวแปรเปนตวแปรแบบตอเนองการหาความสมพนธจะเรยกวาสหสมพนธอยางงาย และวดระดบควาสมพนธโดยใชสมประสทธสหสมพนธเพยรสน และถาขอมล หรอตวแปรตวหนงเปนตวแปรทมคาตามทก าหนดหรอมผลตอตวแปรอกตวหนงจะเรยกตวแปรนวาตวแปรอสระ สวนตวแปรทมคาเปลยนไปตามคาของตวแปรอสระเรยกวาตวแปรตาม เมอตวแปรอสระและตวแปรตามมความสมพนธกน และตองการพยากรณคาของตวแปรตามเมอก าหนดคาตวแปรอสระโดยอาศยหลกการของการวเคราะหการถดถอย ดงนนวตถประสงคของ การวเคราะหการถดถอย คอพยากรณคาตวแปรตามในอนาคต เมอก าหนดคาตวแปรอสระ
แบบฝกหดทายบท
1. นายแพทยผหนงตองการศกษาเกยวกบความสมพนธระหวางน าหนก(Y) และความดนโลหต(X) ของชายอาย 25-30 ป จงท าการสมตวอยางชายอาย 25-30 ปจ านวน 26 คน แลววดน าหนกกบความดนโลหต ไดผลดงน
คนท น าหนก ความดนโลหต 1 165 130 2 167 133 3 180 150 4 155 128 5 212 151 6 175 146 7 190 150 8 210 140 9 200 148 10 149 125 11 158 133 12 169 135 13 170 150 14 172 153 15 159 128
266
คนท น าหนก ความดนโลหต 16 168 132 17 174 149 18 183 158 19 215 150 20 195 163 21 180 156 22 143 124 23 240 170 24 256 165 25 192 160 26 187 159
นายแพทยผนตองการทราบวา ก. น าหนกกบความดนโลหตของชายอาย 25-30 ป จะมความสมพนธกบในระดบใด ทชวงความชอมน 95% ข. น าหนกกบความดนโลหตจะมความสมพนธกนในระดบสง ดวยสมประสทธสหสมพนธเทากบ 0.9 หรอไม ทระดบนยส าคญ 0.05 2. ขอมลตอไปน เปนปรมาณน า (นว) และผลผลตขาว (ตน/10 ดอร) ทส ารวจไวในไรทดลอง ปรมาณน า (X) 12 18 24 30 36 42 48 ผลผลตขาว (Y) 5.27 5.68 6.25 7.21 8.02 8.71 8.42 จงหา ก. สมการถดถอยโดยวธก าลงสองนอยทสด ข. หาคา 90% ชองความเชอมนและทดสอบสมมตฐานของ b0 , b1 ค. ดวยความเชอมน 90% จงคาดคะเนคา y ณ จดท x = 40 ง. หา 90% ชองความเชอมนของ E(y|x) ณ จดท x = 40