บทที่ 8 สหสัมพันธ์และการ...

30
บทที่ 8 สหสัมพันธ์และการวิเคราะห์การถดถอย การหาความสัมพันธ์ระหว่างข้อมูลเชิงปริมาณ 2 ชุด หรือมากกว่านั ้นถ ้าใช้เทคนิคการ ทดสอบไคสแควร์จะต้องแบ่งข้อมูลเชิงปริมาณนั ้นออกเป็นกลุ่ม ๆ เสียก่อนแล ้วจึงนับความถี่ ซึ ่ง การทาเช่นนี ้จะสูญเสียรายละเอียดของข ้อมูลไป เทคนิคการวิเคราะห์สหสัมพันธ์เป็นเทคนิคการหา ความสัมพันธ์ระหว่างข้อมูลเชิงปริมาณตั ้งแต่ 2 ชุดขึ ้นไป และสามารถบอกได้ว่าข้อมูลที่มี ความสัมพันธ์กันนั ้นมีความสัมพันธ์กันในทิศทางใด สหสัมพันธ์ (Correlation) สหสัมพันธ์เป็นการศึกษาความสัมพันธ์ระหว่างข้อมูลหรือตัวแปรตั ้งแต่ 2 ตัวขึ ้นไป ว่ามีความสัมพันธ์กันในระดับใด และมีความสัมพันธ์ในทิศทางใด เช่นความสูงกับน าหนักของคน มีความสัมพันธ์กันมากหรือน้อย และมีความสัมพันธ์ในทิศทางเดียวกันหรือตรงกันข้าม ถ้าให้ X เป็นตัวแปรแทน ความสูง (cm) Y เป็นตัวแปรแทนน าหนัก (kg) ลักษณะของข้อมูลที่เก็บรวมรวมมาจะต้องเป็นข้อมูลที่มาจากหน่วยตัวอย่างเดียวกัน เช่นคนเดียวกัน ดังนี คนทีาหนัก (Y) ความสูง (X) 1 2 n y 1 y 2 y n x 1 x 2 x n จากตารางจะเห็นว่าค่าของตัวแปรYและ Xได้มาจากคน ๆ เดียวกัน ซึ ่งอาจจะมีหน่วย เดียวกันหรือหน่วยต่างกันก็ได้

Upload: others

Post on 26-Dec-2019

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

บทท 8

สหสมพนธและการวเคราะหการถดถอย

การหาความสมพนธระหวางขอมลเชงปรมาณ 2 ชด หรอมากกวานนถาใชเทคนคการทดสอบไคสแควรจะตองแบงขอมลเชงปรมาณนนออกเปนกลม ๆ เสยกอนแลวจงนบความถ ซงการท าเชนนจะสญเสยรายละเอยดของขอมลไป เทคนคการวเคราะหสหสมพนธเปนเทคนคการหาความสมพนธระหวางขอมลเชงปรมาณต งแต 2 ชดขนไป และสามารถบอกไดวาขอมลทมความสมพนธกนนนมความสมพนธกนในทศทางใด

สหสมพนธ (Correlation)

สหสมพนธเปนการศกษาความสมพนธระหวางขอมลหรอตวแปรตงแต2 ตวขนไป วามความสมพนธกนในระดบใด และมความสมพนธในทศทางใด เชนความสงกบน าหนกของคนมความสมพนธกนมากหรอนอย และมความสมพนธในทศทางเดยวกนหรอตรงกนขาม

ถาให X เปนตวแปรแทน ความสง (cm) Y เปนตวแปรแทนน าหนก (kg) ลกษณะของขอมลทเกบรวมรวมมาจะตองเปนขอมลทมาจากหนวยตวอยางเดยวกน

เชนคนเดยวกน ดงน

คนท น าหนก (Y) ความสง (X) 1 2

n

y1

y2

yn

x1

x2

xn

จากตารางจะเหนวาคาของตวแปรYและ Xไดมาจากคน ๆ เดยวกน ซงอาจจะมหนวยเดยวกนหรอหนวยตางกนกได

Page 2: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

242

การหาความสมพนธระหวางขอมลหรอตวแปร 2 ตว เรยกวาสหสมพนธอยางงาย(simple correlation) การหาความสมพนธระหวางขอมลหรอตวแปรมากกวา 2 ตว เรยกวาสหสมพนธเชงพห (multiple correlation) ในเอกสารฉบบนจะกลาวถงสหสมพนธอยางงายเทานน

วธการดลกษณะความสมพนธ

การดลกษณะความสมพนธของขอมล หรอตวแปรสามารถท าไดหลายวธ ดงน 1. แผนภาพการกระจาย (scatter diagram) 2. คาสมประสทธสหสมพนธ (correlation coefficient)

1. แผนภาพการกระจาย

แผนภาพการกระจายเปนวธการดลกษณะความสมพนธของขอมลอยางคราว ๆโดยดจากลกษณะการกระจาย หรอแนวโนมของจดเมอเทยบกบเสนตรง ดงน

ในรป (a) แนวโนมของจดชขนดานขวาตามแนวเสนตรง เมอ x มคามาก y มคามาก เมอ x มคานอย y มคานอย เรยกวามความสมพนธเชงเสนเชงบวก (positive and linear correlation) หรอความสมพนธแบบแปรตามกน

ในรป (b) แนวโนมของจดชลงดานขวาตามแนวเสนตรง เมอ x มคามาก y มคา

นอย เมอ x มคานอย y มคามาก เรยกวามความสมพนธเชงเสนเชงลบ (negative and linear correlation) หรอความสมพนธแบบแปรผกผน

Page 3: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

243

ในรป (c) แนวโนมของจดชลงดานขวาตามแนวเสนโคง เรยกวามความสมพนธไมเชงเสนเชงลบ(negative and nonlinear correlation)

ในรป (d) แนวโนมของจดกระจายออกไม มแนวเสนตรง เ รยกวาไม มความสมพนธ (no correlation)

2. คาสมประสทธสหสมพนธ

ส าหรบตวสถตทใชวดคาสหสมพนธอยางงายวามความสมพนธมากหรอนอยเพยงใดคอสมประสทธสหสมพนธ (Correlation coefficient) ซงในกรณของสหสมพนธอยางงายตวสถตนเรยกวาสมประสทธสหสมพนธอยางงาย (Simple Correlation Coefficient) เขยนแทนดวยสญลกษณ หรอ xy ในกรณทเปนคาพารามเตอร และ r หรอ rxyในกรณทเปนคาสถตโดยท และ r จะไมมหนวยและมคาตงแต -1 ถง 1

2.1 ความหมายของคาสมประสทธสหสมพนธ คาสมประสทธสหสมพนธทค านวณไดมความหมายดงน

1. ถา และ r มคาเปนบวก แสดงวาตวแปรXและ Yมความสมพนธเชงบวกหมายความวาถาตวแปร X มคาเพมขนตวแปร Y จะมคาเพมขนหรอถาตวแปร X มคาลดลง ตวแปร Y จะมคาลดลง

Page 4: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

244

2. ถา และ r มคาเปนลบ แสดงวาตวแปร Xและ Yมความสมพนธเชงลบ หมายความวาถาตวแปร X มคาเพมขนตวแปร Y จะมคาลดลง หรอถาตวแปร X มคาลดลง ตวแปร Y จะมคาเพมขน

3. ถา และ r มคาเทากบ1 แสดงวาตวแปรXและ Yมความสมพนธเชงบวกอยางสมบรณ (perfect positive correlation)

4. ถา และ r มคาเทากบ-1 แสดงวาตวแปรXและ Yมความสมพนธเชงลบอยางสมบรณ (perfect negative correlation)

5. ถา และ rมคาเขาใกล 1 แสดงวาตวแปรXและ Yมความสมพนธเชงบวกและมความสมพนธมาก

6. ถา และ rมคาเขาใกล -1 แสดงวาตวแปร Xและ Yมความสมพนธเชงลบและมความสมพนธมาก

7. ถา และ r มคาเขาใกล 0 แสดงวาตวแปรXและ Yม ความสมพนธกนนอย 8. ถา และ rมคาเทากบ 0 แสดงวาตวแปรXและ Yไมมความสมพนธเชงเสน ตวอยางเชนถาคาสมประสทธสหสมพนธระหวางความสงกบน าหนกเทากบ

0.85 หมายความวาความสงมความสมพนธเชงบวกอยางมากกบน าหนก ถาความสงมากน าหนกจะมากดวย และถาความสงนอยน าหนกจะนอยดวย เปนตน

ความหมายของ และ r สามารถแสดงดวยแผนภาพการกระจาย ดงน

Page 5: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

245

2.2 วธการค านวณหาคาสมประสทธสหสมพนธวธการค านวณคาสมประสทธสหสมพนธมหลายวธขนอยกบประเภทของขอมลหรอตวแปร เชนสมประสทธสหสมพนธสเปยรแมน สมประสทธสหสมพนธฟ สมประสทธสหสมพนธเพยรสน เปนตน

ในเอกสารฉบบนจะกลาวเฉพาะการค านวณหาคาสมประสทธสหสมพนธของเพยรสน ซงใชหาความสมพนธระหวางขอมลเชงปรมาณ หรอตวแปรแบบตอเนอง สมประสทธสหสมพนธเพยรสนเขยนแทนดวยสญลกษณ ซงคดคนโดย คารล เพยรสน (Karl Pearson) บางครงอาจเรยกวา Pearson Product moment correlation Coefficient ซงสามารถค านวณไดจากสตร ดงน

yx

yx

),cov( หรอ

yx

xy

2

yi

N

1i

2xi

N

1i

yixi

N

1i

yx

yx

)()(

)()(

โดยท แทนสมประสทธสหสมพนธเพยรสน cov(x,y) หรอ xy แทนความแปรปรวนรวมของตวแปร X และ Y yx , แทนสวนเบยงเบนมาตรฐานของตวแปรX และ Y yx , แทนคาเฉลยของตวแปร X และ Y

ในทางปฏบตเราเกบรวบรวมขอมลจากตวอยาง ดงนนจะประมาณ ดวย r โดยท

yxss

yxr

),cov(

2

1

2

1

1

)()(

))((

yyxx

yyxx

i

n

ii

n

i

ii

n

i

2

1

2

1

2

1

2

1

111

)()()()( i

n

ii

n

i

n

i

ii

n

i

i

n

ii

n

iii

n

i

yynxxn

yxyxn

Page 6: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

246

โดยท r แทนสมประสทธสหสมพนธเพยรสน cov(x,y) แทนความแปรปรวนรวมของตวแปร X และ Y yx ss , แทนสวนเบยงเบนมาตรฐานของตวแปร X และ Y yx , แทนคาเฉลยของตวแปร X และ Y n แทนจ านวนตวอยาง

2.3 ขอตกลงเบองตน ของสมประสทธสหสมพนธของเพยรสน เปนดงน 1. ตวแปร 2 ตว เปนตวแปรแบบตอเนอง หรอเปนขอมลเชงปรมาณ 2. ความสมพนธระหวาง 2 ตวแปรเปนเสนตรง (Linear Relationship)

ตวอยาง 8.1 จากคะแนนสอบของนกศกษาวชาเอกบรหารธรกจทสอบวชาเศรษฐศาสตร และมานษยวทยา 12 คน เปนดงตารางดานลางอยากทราบวาคะแนนสอบทง 2 วชามความสมพนธกนเพยงใด

คนท. คะแนนสอบวชาเศรษฐศาสตร (Y)

คะแนนสอบวชามานษยวทยา (X)

1 2 3 4 5 6 7 8 9

10 11 12

51 68 72 97 55 73 95 74 20 91 74 80

74 70 88 93 67 73 99 73 33 91 80 86

y = 850 x = 927

Page 7: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

247

วธท า จากขอมล จะได 2y 2x xy

2601 4624 5184 9409 3025 5329 9025 5476 400

8281 5476 6400

5476 4900 7744 8649 7789 5329 9801 5329 1089 8281 6400 7396

3774 4760 6336 9021 3685 5329 9045 5402 660

8281 5920 6880

65230y2 74883x2 69453xy

2i

n

1i

2i

n

1i

2n

1i

i2

i

n

1i

i

n

1ii

n

1iii

n

1i

yynxxn

yxyxn

r

)()()()(

))()(())()((

))(()(

22 85065230129277488312

8509276945312

))(( 6026039267

787950833436

2366229420

45486

9350.

935.0r หมายความวาคะแนนสอบวชาเศรษฐศาสตรและวชามานษยวทยาของนกศกษา 12 คนมความสมพนธอยางมากในเชงบวก นนคอถาคะแนนสอบวชาเศรษฐศาสตรเพมขนคะแนนสอบวชามานษยวทยาจะเพมขน หรอถาคะแนนสอบวชาเศรษฐศาสตรลดลงคะแนนสอบวชามานษยวทยาจะลดลงดวย

Page 8: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

248

หมายเหตจาก yx

xy

ss

sr

))((

n

1i

i

n

1i

i

n

1i

iixy yxn

1yxs

2n

1i

n

i

2ix x

n

1xs )()(

2n

1i

n

1i

2iy y

n

1ys )(

การประมาณคาสมประสทธสหสมพนธเพยรสน ( xy )

1. การประมาณคาแบบจดของสมประสทธสหสมพนธ

ตวประมาณแบบจดของ xy คอ

2i

n

1i

2i

n

1i

2n

1i

i2

i

n

1i

i

n

1ii

n

1iii

n

1i

yynxxn

yxyxn

r

)()()()(

2. การประมาณคาแบบชวงของสมประสทธสหสมพนธ

เนองจากคาสมประสทธสหสมพนธมคาไมเทากบ 0 ดงนนการแจกแจงของสมประสทธสหสมพนธจงไมเปนสมมาตร เพอใหการแจกแจงของสมประสทธสหสมพนธเปนสมมาตร จงตองเปลยนคา xyr เปน rZ ตามวธการของ Fisher ดงน

r1

r1n1

2

1Zr

จะได rZ มการแจกแจงแบบปกตดวยคาเฉลย

1

1ln

2

1Zr

ความ

แปรปรวน 3

12

nZr

นนคอ ),ln(~3n

1

1

1

2

1NZr

Page 9: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

249

ดงนนจะได 3nZ

ZZ

Zrr

Zr

Zrr

)(

ในการประมาณคาแบบชวงของ ตองเปลยนขอบเขตบนและขอบเขตลางของการประมาณคาแบบชวงเปนขอบเขตบนของ ( U ) และขอบเขตลางของ ( L ) เสยกอนโดยท

1e

1e

Zu2

Zu2

U

และ

1e

1e

L

L

Z2

Z2

L

ดงนนชวงความเชอมน %)( 1001 ของ คอ UL

ตวอยาง 8.2 จากตวอยาง 8.1 คะแนนสอบวชาเศรษฐศาสตรและมานษยวทยาจะประมาณคาแบบชวงของ ทความเชอมน 95 %

จาก rZ =

r1

r1

2

1ln

=

93501

93501

2

1

.

.ln

= 77292

1.ln

= ).( 3932

1

= 671. จะได %)( 1001 ของ rZ คอ

3nzZr

2

= 312

961671

.).(

ดงนน 021Z322Zu L .. และ

จาก 1e

1e

Zu2

Zu2

U

และ

1e

1e

L

L

Z2

Z2

L

980

54104

54102

1e

1e

3222

3222

U

.

.

.

).(

).(

770

698

696

1e

1e

0212

0212

L

.

.

.

).(

).(

หมายความวาทระดบความเชอมน 95 % สมประสทธสหสมพนธของคะแนนสอบวชาเศรษฐศาสตร กบวชามานษยวทยามคาในชวง 0.77 ถง 0.98

Page 10: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

250

การทดสอบสมมตฐานเกยวกบสมประสทธสหสมพนธ ( )

เปนการทดสอบวาตวแปรXและตวแปรYมความสมพนธกนหรอไม

สมมตฐานเชงสถต 0H0 : หรอ :0H X และ Y ไมมความสมพนธเชงเสนตรง 0H1 : หรอ :1H X และ Y มความสมพนธเชงเสนตรง

เนองจาก 0 จะไดวา r มการแจกแจงแบบปกต และมสวนเบยงเบนมาตรฐาน

คอ )/()( 2nr1 2

ตวสถตทดสอบจงแบงออกเปน 2 กรณ ดงน กรณ n 30

ตวสถตทดสอบ 2nr1

0rT

2

)(

คาวกฤต 2n

22n

2

tt

,,

,

กรณ n > 30

ตวสถตทดสอบ 2nr1

0rZ

2

)(

คาวกฤต 22

zz ,

ในบางกรณความตองการทดสอบสมมตฐานวา ส.ป.ส สหสมพนธมคาเทากบคาใดคาหนงหรอไม (หมายความวา 00 ) จะตองเปลยนคา r ใหเปน Zr rเสยกอนโดยท

r1

r1

2

1Zr ln และ

3n

1

1

1

2

1NZr ,ln~

ดงนน ตวสถตทดสอบ )( 3n

1

ZZrZ 0

โดยท

0

00

1

1

2

1Z

ln

คาวกฤต 22

zz ,

Page 11: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

251

ตวอยาง 8.3 จากตวอยาง 8.1 คะแนนสอบวชาเศรษฐศาสตรกบมานษยวทยา ตองการทดสอบวาคะแนนทงสองวชามความสมพนธในรปเชงเสนตรงหรอไม ทระดบนยส าคญ 0.05

H0: คะแนนวชาเศรษฐศาสตรกบมานษยวทยาไมมความสมพนธเชงเสนตรง H1: คะแนนวชาเศรษฐศาสตรกบมานษยวทยามความสมพนธเชงเสนตรง หรอ 0H0 :

0H1 :

ตวสถตทดสอบ 2nr1

0rT

2

/)(

= 21293501

9350

2 /).(

.

= 101260

9350

/.

.

= 8.33

คาวกฤต 2282tt 1002502n

2

.,.,

2282tt 1002502n

2

.,.,

เนองจาก T = 8.33 มากกวา t 0.025,10 = 2.228 มคาอยในบรเวณปฏเสธ H0หมายความวา คะแนนวชาเศรษฐศาสตรและวชามานษยวทยามความสมพนธเชงเสนตรง อยางมนยส าคญทระดบ 0.05

การวเคราะหการถดถอย (Regression Analysis)

เปนการศกษาถงความสมพนธของตวแปรตงแต 2 ตวขนไป โดยมวตถประสงคทจะประมาณหรอพยากรณคาของตวแปรหนง จากตวแปรอน ๆ ทมความสมพนธกบตวแปรทตองการพยากรณ โดยจะตองมการก าหนดหรอทราบคาของตวแปรอน ๆ ลวงหนา ในทนเรยกวาตวแปรอสระ (Independence Variable) จงจะท าใหทราบคาของตวแปรอกตวหนง ซงในทนเรยกวาตวแปรตาม (Dependence Variable) เชน เมอทราบวาราคาทดนกบขนาดของทดนมความสมพนธกนแลว และคดวาราคาทดนขนอยกบขนาดของทดนหรอขนาดของทดนมผลตอราคาทดน นนคอขนาดทดนเปนตวแปรอสระ และราคาทดนเปนตวแปรตาม หมายความวาเมอก าหนดขนาดของทดนจะ

Page 12: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

252

ท าใหประมาณหรอพยากรณราคาทดนนนได และสามารถศกษาการเปลยนแปลงของราคาทดนเมอขนาดของทดนเปลยนแปลงไป โดยอาศยหลกการของการวเคราะหการถดถอย ดงนนวตถประสงคของ การวเคราะหการถดถอย คอพยากรณคาตวแปรตามในอนาคต เมอก าหนดคาตวแปรอสระ

หมายเหต โดยทวไปมกใหตวแปรอสระแทนดวย X และตวแปรตามแทนดวย Y

การทจะน าตวแปร X มาพยากรณ Y ไดนน ตวแปร X และ Y จะตองมความสมพนธกน (จากแผนภาพการกระจาย) ถาตวแปรX และ Y มความสมพนธเชงเสนตรงและ คาของ Y ขนอยกบคาของ X จะเรยกการถดถอยนนวาการวเคราะหการถดถอยเชงเสน (Linear Regression Analysis)

ถาตวแปร X และ Y มความสมพนธเชงเสนตรง และตวแปร Y ถกพยากรณดวยตวแปร X เพยง 1 ตวจะเรยกวา การถดถอยเชงเสนอยางงาย (Simple Linear Regression)

ถาตวแปร X และ Y มความสมพนธเชงเสนตรง และตวแปร Y ถกพยากรณดวยตวแปร X มากกวา 1 ตวจะเรยกวาการถดถอยเชงเสนพหคณ (Multiple Linear Regression)

ซงในเอกสารฉบบนจะศกษาเฉพาะ Simple Linear Regression เทานน

การวเคราะหการถดถอยเชงเสนอยางงาย (Simple Linear Regression Analysis)

หลกการของการวเคราะหการถดถอยคอใชขอมลเมอก าหนดคาตวแปรอสระ (X) แลวท าใหเกดคาตวแปรตาม (Y) ในอดตน ามาสรางสมการเชงเสนทเหมาะสมทสด เพอพยากรณคา Y ในอนาคต

แตในบางครงคาของ x และ y ทเกดขนนนอาจสรางสมการเชงเสนตรงไดหลายเสน คอนดบ (x,y) อาจไมอยในแนวเสนตรงเดยวกนทงหมด ดงรป

Page 13: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

253

ตวอยาง 8.4 รายจายมกขนอยกบรายไดเสมอ หากตองการพยากรณคาของรายจายในอนาคตเมอก าหนดรายไดจงท าการบนทกขอมลรายได และรายจายของครอบครว โดยท X เปนตวแปรอสระแทนเงนเดอน (พนบาท)

Y เปนตวแปรตามแทนรายจาย (พนบาท) ไดขอมลดงน

เมอน าขอมลนมาเขยน scatter diagram จะไดดงรป

จะเหนวาจากขอมลขางตนอาจสามารถสรางสมการเชงเสนตรงได 2 เสนคอ L1และ

L2ถาก าหนดใหสมการทวไปของL1และ L2คอ L1 : Y = A1 + B1 x L2 : Y = A2 + B2 x

ครอบครวท รายได X (พนบาท) รายจาย Y (พนบาท) 1 2 3 4 5 6 7 8 9

10

8 8 9 9

10 10 12 12 14 15

7 8 8

10 8 9 9

11 12 14

L1

L2

Page 14: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

254

การพจารณาดวยสายตาวาควรใช L1 หรอ L2 ในการพยากรณคา Y นนท าใหตดสนใจล าบาก จงมแนวคดทางคณตศาสตรมาชวยในการตดสนใจเลอกสมการเชงเสนตรงทเหมาะสมทสด วธนนคอวธก าลงสองนอยทสด (Least Square Method)

1. วธก าลงสองนอยทสด (Least Square Method)

หลกการของวธก าลงสองนอยทสด คอเลอกสมการถดถอยเชงเสนทใหคาความคลาดเคลอนระหวางคาสงเกตของ y (คาจรง) กบคาประมาณของ y หรอคาจากสมการ )ˆ( y นอยทสด พจารณาขอมลตอไปน

ล าดบท x y 1 1 10 2 2 30 3 3 50

สามารถสรางสมการเชงเสนได 3 สมการ x1010yL 11 ˆ: x15yL 22 ˆ: x2010yL 33 ˆ:

ค านวณหาความคลาดเคลอนระหวาง y กบ y

ความคลาดเคลอน x y 1y 2y 3y 1yy ˆ 2yy ˆ 3yy ˆ 1 10 20 15 10 -10 5 0 2 30 30 30 30 0 0 0 3 50 40 45 50 10 5 0

ผลรวมความคลาดเคลอน 0 0 0 เมอน ามาค านวณก าลง 2 ของความคลาดเคลอนจะได ดงน 2

1yy )ˆ( 22yy )ˆ( 2

3yy )ˆ( 100 25 0 0 0 0 100 25 0 ผลรวม 200 50 0

Page 15: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

255

จะเหนวาสมการเชงเสน L3ยงใหคาผลรวมก าลงสองต าสด และเมอพจารณาจากกราฟ

จะเหนวา L3เปนเสนกราฟดทสด โดยปกตเรานยามวาเสนตรงทดควรมคาความ

คลาดเคลอนระหวางเสนตรงกบจดขอมลนอยทสด และเรยกเสนตรงนนวา สมการถดถอยเชงเสนอยางงายวธการก าลงสองนอยทสดจะเลอกสมการทใหความคลาดเคลอนระหวาง y กบ yนอยทสดเชนกน

สรปสมการถดถอยเชงเสนอยางงายทจะเปนตวแทนแสดงความสมพนธเชงเสนระหวางตวแปรอสระ (X) และตวแปรตาม (Y) จงหมายถงสมการเสนตรงทท าใหผลรวมก าลงสองของความคลาดเคลอน ))ˆ(( 2yy มคาต าสด โดยอาศยวธการก าลงสองนอยทสด

2. ประโยชนของสมการถดถอยเชงเสน

สมการถดถอยเชงเสนสามารถใชประโยชนในการแสดงความสมพนธของตวแปร Xกบ Yใน2 ประการ ดงน

1. ใชในการประมาณคา (estimation) เชนในการศกษาคาสมพนธระหวางปรมาณหมกทใชกบความเรวทพมพ

ถาให Y แทนปรมาณหมกทใช X แทนความเรวในการพมพ เราอาจท าการทดลองหาปรมาณหมกทใชในแตละระดบของความเรวในการ

พมพแลวน ามาใชในการหาสมการประมาณคาปรมาณหมกทใชในระดบความเรวตาง ๆ 2. ใชในการพยากรณ (forecasting) เชน ถา X คอป พ.ศ. Y คอปรมาณการสงออก

ของผลไมไทย การบนทกปรมาณการสงออกของผลไมไทยในปตาง ๆ ทผานมา ท าใหเราสามารถใชสมการถดถอยพยากรณปรมาณการสงออกของผลไมไทยใน 5 หรอ 10 ปขางหนาได

L1

L2

L3

Page 16: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

256

3. ตวแบบ (Model) ขอสมมต (Assumptions) และวธการหาสมการถดถอยเชงเสนอยางงาย

3.1 ตวแบบ โดยทวไปสมการถดถอยเชงเสนอยางงายจะมตวแบบดงน

XY 10

โดยท 0 เปนจดตดแกน Y หรอคาของ y เมอ x=0 1 คออตราการเปลยนแปลงของ Y เมอ X เปลยนไป 1 หนวย หรอเรยกวา สมประสทธถดถอย (regression coefficient) คอ คาคลาดเคลอนเชงสม (error) 3.2 ขอสมมตของสมการถดถอยเชงเสน

จากหลกการของการถดถอยเชงเสน คอก าหนดคาของตวแปรอสระ X ท าใหเกดตวแปรตาม Y จะเหนวาตวแปร X เปนตวแปรทใชควบคม (Fixed Variable) ถกก าหนดคา หรอถกสงเกต หรอมผลตอตวแปร Y ดงนน Y จงเปนตวแปรสม เชน

ปรมาณปยมผลตอปรมาณผลผลตขาว X Y (ควบคม) (ตวแปรตาม)

คะแนนสอบเขามผลตอเกรดเฉลยชนปท 1 X Y (สงเกต) (ตวแปรตาม) จะเหนวาตวแปรอสระ 1 คา สามารถมคา Y ทเปนไปไดมากมายหลายคา ดงรป

Page 17: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

257

ซงการใชสมการถดถอยท าการประมาณ คา Y นน จงท าใหเกดความคลาดเคลอนขน ( i ) ซงความคลาดเคลอนนประกอบดวยความคลาดเคลอน 2 สวนใหญ ๆ คอ

สวนท 1 ความคลาดเคลอนสมซงเกดจากการทมปจจยอน ๆ ทมผลตอตวแปรตามแตไมไดน ามารวมกน และความผดพลาดในการวดคา (พจารณาเฉพาะความคลาดเคลอนในตวแปรตาม)

สวนท 2 ความคลาดเคลอนเนองจากใชตวแบบไมเหมาะสม (Lack of fit) เชนความสมพนธระหวาง x กบ y จรง ๆ เปนเสนโคง แตตวแบบทใชในการวเคราะหเปนเสนตรง เปนตน (ความคลาดเคลอนประเภทนจะไมกลาวถงรายละเอยด ดงนนส าหรบการวเคราะหการถดถอยตอไปนจะสมมตวาตวแบบทใชเหมาะสม)

ดวยเหตผลนในการหาสมการถดถอยเชงเสนโดยวธก าลงสองนอยทสดวาตองมขอสมมตเกยวกบความคลาดเคลอน ( i ) ดงตอไปน

1. i ของตวแปรอสระแตละคาไมสมพนธกน 2. i ของตวแปรแตละคาเปนตวแปรสมและ i ~N(0,2) เนองจาก Y~N(0,2)

ภายใตเงอนไขขอน จะตองน าไปใชในการทดสอบสมมตฐานและการหาชวงเชอมนตอไป ขอสมมตในขอ 2 เปนสวนส าคญมาก นนคอถา ),0(N~ 2

i ไมเปนจรงวธการทใชในการประมาณคา 10 , จะไมเปนไปตามทควรเปน ดงน นควรตรวจสอบเสมอวา

),(~ 2i 0N หรอไม

3.3 การสรางสมการถดถอยเชงเสนอยางงาย จากตวแบบสมการถดถอยเชงเสน XY 10 เปาหมายคอตองการ

หาคา 10 , ทท าใหผลรวมของความคลาดเคลอนเปนศนย ( 0i ) และผลรวมก าลงสอง

ของความคลาดเคลอน ( 2i ) นอยทสด แตในความเปนจรงเราไมสามารถหาคาพารามเตอร

10 , จงตองอาศยคาจากตวอยางเพอหาคาประมาณของ 10 , ในตวแบบสมการถดถอยเชงเสนจากตวอยาง ดงน

i10 ebby ˆ

เมอ y แทนคาประมาณของ y b0 แทนคาประมาณของ 0

b1 แทนคาประมาณของ 1 ei แทนคาประมาณของ i หรอเรยกวาสวนเหลอ (residual)

Page 18: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

258

3.4 การประมาณคาพารามเตอร 10 , การหาคา b0 และ b1 มดวยกนหลายวธ แตคาประมาณทไดจากวธก าลงสอง

นอยทสดจะท าใหผลรวมของก าลงสองของผลตางระหวาง y กบ y มคานอยทสด โดยท

n

xb

n

yb i1i

0

หรอ xbyb 10

1b2

i2

i

iiii

xxn

xyyxn

)(

ตวอยาง 8.5 จากตวอยาง 8.4 ขอมลรายจายกบรายได จงหาสมการถดถอยเชงเสนอยางงาย ตวแบบสมการถดถอยเชงเสนอยางงาย i10 ebby ˆ

1b = 2

i2

i

iiii

xxn

xyyxn

)(

= 2107119910

10796107010

)()(

))(()(

= 0.791 0b = xby 1 = (9.6)-(0.791)(10.7) = 1.1363

ดงนนสมการถดถอยเชงเสน คอ y = 1.1363 + 0.791X หมายความวาถารายไดเพมขน 1 พนบาท รายจายจะเพมขน 0.791 พนบาท หรอถารายไดลดลง 1 พนบาท รายจายจะลดลง 0.791 พนบาท

การประมาณคาและการทดสอบสมมตฐาน

1. การประมาณคา 0

เนองจาก b0 เปนตวประมาณทไมเอนเอยงของ 0 ทม v(b0) =

2

i

2

i2

xxn

x

)(

Page 19: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

259

ดงนนจะได )1,0(N~

)xx(n

x

b

)b(v

bz

2i

2i

00

0

00

แตเนองจากไมทราบ 2 จะตองประมาณ 2 ดวย s2 = 2n

yy 2i

)ˆ( ซงเปนตว

ประมาณทไมเอนเอยงของ 2 จะไดวา

t = 2ndf

2i

2i

10 t~

)xx(n

xs

b

ดงนนชวงความเชอมน 100(1- )% ของ 0 คอ

2

i

2i

2n2

0xxn

xstb

)(,

2. การทดสอบสมมตฐานของ 0

เปนการทดสอบสมมตฐานวาเสนถดถอยนผานจดก าเนดหรอไม ดงนน

สมมตฐานเชงสถต H0 : 0 = 00 (คาคงท) H1 : 000 H1 : 0>00 H1 : 0<00

ตวสถตทดสอบ

2i

2i

000

xxn

xs

bt

)(

คาวกฤต 2n

2

t

,

หรอ 2nt , หรอ 2nt ,

Page 20: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

260

3. การประมาณคา 1

เนองจาก b1 เปนตวประมาณทไมเอนเอยงของ 1 ทม v(b1) = 2

i

2

xx )(

ดงนนจะได ),(~

)(/

10N

xx

bz

2i

11

แตเนองจากไมทราบ 2 จงประมาณ 2ดวย s2 = 2n

yy 2i

)ˆ(

ซงเปนตว

ประมาณทไมเอนเอยงของ 2จะไดวา

2ndf2

i

11 t~

)xx(/s

bt

ดงนนชวงความเชอมน 100(1- )% ของ 1 คอ

2i

2n2

1 xxstb )(/,

4. การทดสอบสมมตฐานของ 1

เปนการทดสอบสมมตฐานวาตวแปร X มผลตอตวแปร Y หรอไม

สมมตฐาน H0 : 1 = 10 (คาคงท) H1 : 1 > 10 (มความสมพนธในทางบวก) H1 : 1 < 10 (มความสมพนธในทางลบ) H1 : 1 10 (มความสมพนธกน)

ตวสถตทดสอบ

2i

101

xxs

bt

)(/

คาวกฤต 2nt , หรอ 2nt , หรอ

2n2

t

,

Page 21: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

261

สรปขนตอนการวเคราะหการถดถอยและสหสมพนธอยางงาย 1. พจารณา X ทมผลตอ Y มากทสด 2. ดความสมพนธของ X และ Y จาก Scatter diagram 3. หาสมประสทธสหสมพนธ ประมาณคา และทดสอบสมมตฐาน 4. ประมาณคา 0 และ 1 และทดสอบสมมตฐาน 0และ 1

ตวอยาง 8.6 จากตารางแสดงจ านวนชวโมงเฉลยในการท าการบานตอสปดาหของนกศกษา 6 คน กบเกรดเฉลยทนกศกษาไดในภาคเรยนนน เปนดงน

จ านวนชม.เฉลยในการท าการบาน (x)

เกรดเฉลย (y)

15 28 13 20 4

10

2.0 2.7 1.3 1.9 0.9 1.7

วธท า จาก 623yxn

1xysxy .))((

344xn

1xs 22

xx )(

9151yn

1ys 22

yy .)(

หรอ

9194530

yynxxn

yxxynr

ss

sr

2222

yyxx

xyxy

.

)()(

ประมาณคา โดย แปลง r เปน 591r1

r1

2

1Zr .

)(

)(ln

Page 22: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

262

ทระดบความเชอมน 95% ชวงความเชอมนของ rz คอ

131591

36

961591

3n

z

Zr 2

..

).(.

จะได 95% CI of rz คอ 722460

rz ..

ทระดบความเชอมน 95% ชวงความเชอมนของ คอ UL โดยท

990

44231

44229

1e

1e

u

u

U z2

z2

.

.

.

และ

430

513

511

1e

1e

L

L

L z2

z2

.

.

.

ทระดบความเชอมน 95% ชวงความเชอมนของ คอ 990430 ..

หาคา b0 และ b1

จาก 068600

xxn

yxyxnb

2i

2i

iiii1

.

)(

720930

xbyb 10

.

สมการถดถอยเชงเสนคอ x06860720930y ..ˆ

ทดสอบสมมตฐาน 0H

0H

11

10

:

: เมอ 050.

ตวสถตทดสอบ

2i

11

xxs

bt

)(/

โดยท 27202n

SSEs .

3442720

006860

/.

.

= 4.678

คาวกฤต t0.025,24 = 2.776

เนองจาก t = 4.678 อยในบรเวณปฏเสธ H0 แสดงวา 1 0 นนคอ x และ y มความสมพนธเชงเสน ทระดบนยส าคญ 0.05

Page 23: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

263

ประมาณคา 1 ทระดบความเชอมน 95% ชวงความเชอมนของ 1คอ

xx2n2

1s

stb

,

= ).(. 01466507762b1

= 0.06860 0.0471

ดงนนทระดบความเชอมน 95% ชวงความเชอมนของ 1คอ 0.0215 ≤1≤ 0.1157

การใชโปรแกรมส าเรจรป

ใชขอมลจากตวอยางท 8.1 ดงนนการใสขอมลใน Microsoft Excel เปนดงน

1. การตรวจสอบความสมพนธดวยแผนภาพการกระจาย

ขนตอนท 1 เลอก cell ขอมล เลอกเมน Insert เลอก Chart เลอก XY(Scatter) ดงรป

Page 24: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

264

ขนตอนท 2 ใสขอมลใน Chart Wizard ขนตอนท 3 จะไดผลลพธ ดงรป

Page 25: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

265

2. การหาคาสมประสทธสหสมพนธ

ขนตอนท 1 เมน Tools เลอก Data Analysis เลอก Correlation ดงรป

ขนตอนท 2 ในสวน Input Range ใหใส cell ทเปนขอมลทงหมด ในสวน Group By เปนการเลอกการแบงกลมของขอมล

Page 26: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

266

ขนตอนท 3 จะไดผลลพธ ดงรป

935.0r หมายความวาคะแนนสอบวชาเศรษฐศาสตร และวชามานษยวทยา ของนกศกษา 12 คนมความสมพนธอยางมากในเชงบวก

3. การสรางสมการถดถอย

ขนตอนท 1 ใสขอมลดบ เลอกเมน Tools เลอก Data Analysis เลอก regression ดงรป

Page 27: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

267

ขนตอนท 2 เลอกเมน Tools เลอก Data Analysis เลอก regression ดงรป

ขนตอนท 3 ในสวน Input Y Range ใหใส cell ทเปนขอมลตวแปรตาม ในสวน Input X Range ใหใส cell ทเปนขอมลตวแปรอสระ

จะไดผลลพธ ดงน

Page 28: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

268

ดงนนสมการถดถอยเชงเสน คอ y = 1.1363 + 0.791X หมายความวาถารายไดเพมขน 1 พนบาทรายจายจะเพมขน 0.791 พนบาท หรอถารายไดลดลง 1 พนบาท รายจายจะลดลง 0.791 พนบาท

สรปทายบท

สหสมพนธและการวเคราะหการถดถอยเปนเทคนคการวเคราะหขอมลในทางสถตเพอหาความสมพนธของขอมล หรอตวแปรตงแต 2 ตว ถาขอมลทง 2 ชดเปนขอมลเชงปรมาณ หรอตวแปร 2 ตวแปรเปนตวแปรแบบตอเนองการหาความสมพนธจะเรยกวาสหสมพนธอยางงาย และวดระดบควาสมพนธโดยใชสมประสทธสหสมพนธเพยรสน และถาขอมล หรอตวแปรตวหนงเปนตวแปรทมคาตามทก าหนดหรอมผลตอตวแปรอกตวหนงจะเรยกตวแปรนวาตวแปรอสระ สวนตวแปรทมคาเปลยนไปตามคาของตวแปรอสระเรยกวาตวแปรตาม เมอตวแปรอสระและตวแปรตามมความสมพนธกน และตองการพยากรณคาของตวแปรตามเมอก าหนดคาตวแปรอสระโดยอาศยหลกการของการวเคราะหการถดถอย ดงนนวตถประสงคของ การวเคราะหการถดถอย คอพยากรณคาตวแปรตามในอนาคต เมอก าหนดคาตวแปรอสระ

แบบฝกหดทายบท

1. นายแพทยผหนงตองการศกษาเกยวกบความสมพนธระหวางน าหนก(Y) และความดนโลหต(X) ของชายอาย 25-30 ป จงท าการสมตวอยางชายอาย 25-30 ปจ านวน 26 คน แลววดน าหนกกบความดนโลหต ไดผลดงน

คนท น าหนก ความดนโลหต 1 165 130 2 167 133 3 180 150 4 155 128 5 212 151 6 175 146 7 190 150 8 210 140 9 200 148

Page 29: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

269

คนท น าหนก ความดนโลหต 10 149 125 11 158 133 12 169 135 13 170 150 14 172 153 15 159 128 16 168 132 17 174 149 18 183 158 19 215 150 20 195 163 21 180 156 22 143 124 23 240 170 24 256 165 25 192 160 26 187 159

นายแพทยผนตองการทราบวา 1.1 น าหนกกบความดนโลหตของชายอาย 25-30 ป จะมความสมพนธกบในระดบใด ทชวง

ความชอมน 95% 1.2 น าหนกกบความดนโลหตจะมความสมพนธกนในระดบสง ดวยสมประสทธสหสมพนธ

เทากบ 0.9 หรอไม ทระดบนยส าคญ 0.05 2. ขอมลตอไปนสมมาจากการศกษาการขาดงานของลกจาง 15 คน โดยก าหนดให

X คอจ านวนการขาดงานในชวง 6 เดอนแรก(วน) Y คอจ านวนการขาดงานในชวง 6 เดอนหลง(วน)

จ านวนการขาดงาน 6 เดอนแรก (X) 7 6 8 6 1 1 1 0 1 0 0 6 0 0 6 6 เดอนหลง (Y) 2 1 1 3 5 7 6 8 5 7 5 1 4 2 3

ก าหนด 318y261x93xy60y43x 22 ,,,,

Page 30: บทที่ 8 สหสัมพันธ์และการ ...pws.npru.ac.th/chalida/data/files/บทที่ 8... · 2017-05-26 · การหาความสัมพนัธ์ระหว่างข้อมูลเชิงปริมาณ

270

2.1 จงอธบายความสมพนธระหวางจ านวนการขาดงานของลกจางในชวง 6 เดอนแรก และ 6 เดอนหลง ดวยคาสมประสทธสหสมพนธ

2.2 การขาดของลกจางในชวง 6 เดอนแรก และ 6 เดอนหลง สมพนธกนอยางมนยส าคญทระดบ 0.05 หรอไม