บทที่10janya/88520159/... · 2018. 11. 6. · บทที่10 ... m...
TRANSCRIPT
บทที่ 10 การประมาณค่าและทดสอบสมมติฐานเกี่ยวกับ
อัตราส่วนความแปรปรวนของประชากร 𝜎12/𝜎22
88520159
PROBABIL ITY AND STATIST ICS FOR COMPUTING
1/29
อัตราส่วนความแปรปรวนของประชากร 𝜎12/𝜎22
• การเปรียบเทียบความแปรปรวนของประชากรสองกลุ่ม
• การเปรียบเทียบ ความแม่นย า ความคงตัว ความเสถียร ความคงเส้นคงวา หรือ ความเที่ยง ที่เกิดขึ้นในสองกลุ่มประชากร
• ตัวอย่าง
ความเสถียรของความเร็วอินเตอร์เน็ต บริษัท X กับ บริษัท Y
ความแม่นย าการปาลูกดอก ของ X กับ Y
ความเที่ยงตรงของการวัดอุณหภูมิด้วยเครื่องมือวัดยี่ห้อ X กับ Y
2/29
การประมาณค่าอัตราส่วนความแปรปรวน• การเปรียบเทียบความแปรปรวน หรือ ส่วนเบี่ยงเบนมาตรฐาน• ก าหนดให้ X1, X2 ,· · · , Xn เป็นตัวอย่างสุ่มที่มาจากประชากรที่มีการแจกแจงปกติ ค่าเฉลี่ย 𝜇𝑋 และความแปรปรวน 𝜎𝑋
2
• และ Y1, Y2 ,· · · , Ym เป็นตัวอย่างสุ่มที่มาจากประชากรที่มีการแจกแจงปกติ ค่าเฉลี่ย 𝜇𝑌 และความแปรปรวน 𝜎𝑌
2
• เปรียบเทียบความแปรปรวนสองกลุ่มประชากรในรูปอัตราส่วน𝜎𝑋2
𝜎𝑌2
• การประมาณแบบจุดของอัตราส่วนความแปรปรวนของประชากร คืออัตราความแปรปรวนของตัวอย่าง
𝑆𝑋2
𝑆𝑌2
3/29
การประมาณค่าอัตราส่วนความแปรปรวน
การประมาณแบบช่วงของอัตราส่วนความแปรปรวนของประชากร
โดยอัตราส่วนความแปรปรวนมีการแจกแจงแบบเอฟ
ที่มีองศาเสรี 𝑛 − 1,𝑚 − 1
เมื่อ 𝑛 และ 𝑚 คือจ านวนตัวอย่างของกลุ่ม 1 และ 2 ตามล าดับ
ช่วงความเชื่อมั่น (1 − 𝛼) 100% ของอัตราส่วนความแปรปรวน คือ
𝑆𝑋2/𝑆𝑌
2
𝐹𝛼2,𝑛−1,𝑚−1
≤𝜎𝑋2
𝜎𝑌2 ≤
𝑆𝑋2/𝑆𝑌
2
𝐹1−𝛼2 ,𝑛−1,𝑚−1
4/29
การประมาณแบบช่วงของ 𝜎12/𝜎22 ด้วย โปรแกรม R
var.test(x, y, conf.level = 0.95)
x และ y คือ ข้อมูลแบบ vector ของตัวอย่างกลุ่ม 1 และ 2 ตามล าดับ
conf.level คือ ระดับความเชื่อมั่น Default = 0.95
5/29
ตัวอย่างที่ 1
ปัจจุบัน data channel มีความเร็วในการส่งข้อมูล (MBps) ดังนี้ 176, 181, 177 , 180 , 178 , 179 , 177 , 179 , 182 , 178 , 180 , 178, 181, 180, 181
เมื่อหน่วยงานอัพเกรดอุปกรณ์ เพื่อช่วยให้ความเสถียรของการส่งข้อมูลดีขึ้น ในขณะที่ความเร็วจะต้องคงเดิม ท าการบันทึกความเร็วในการส่งข้อมูลดังนี้180 , 180 , 181 , 180 , 180 , 180 , 180 , 180 , 182 , 180 , 181, 179, 181, 179, 180
1. จงประมาณอัตราส่วนความแปรปรวนของความเร็วในการส่งข้อมูลก่อนและหลังอัพเกรดอุปกรณ์ พร้อมทั้งอธิบายความหมาย
2. จงหาช่วงความเชื่อมั่น 95% ของอัตราส่วนความแปรปรวนของความเร็วในการส่งข้อมูลก่อนและหลังอัพเกรดอุปกรณ์ พร้อมทั้งอธิบายความหมาย
6/29
ตัวอย่างที่ 1
> x=c(176,181,177,180,178,179,177,179,182,178,180,178,181,180,181)> y=c(180,180,181,180,180,180,180,180,182,180,181,179,181,179,180)> boxplot(x,y)
7/29
ตัวอย่างที่ 1
1.จงประมาณอัตราส่วนความแปรปรวนของความเร็วในการส่งข้อมูลก่อนและหลังอัพเกรดอุปกรณ์ พร้อมทั้งอธิบายความหมาย> s1=var(x)[1] 3.12381> s2=var(y)[1] 0.6> s1/s2[1] 5.206349
อัตราส่วนความแปรปรวนของความเร็วในการส่งข้อมูลก่อนและหลังอัพเกรดอุปกรณ์มีค่าเป็นมีค่าเป็น 5.206349หมายความว่า ก่อนอัพเกรดอุปกรณ์ความแปรปรวนของความเร็วในการส่งข้อมูลมีค่าสูงกว่าหลังจากอัพเกรดอุปกรณ์แล้วประมาณ 5.2 เท่า
8/29
ตัวอย่างที่ 1
2. จงหาช่วงความเชื่อมั่น 95% ของอัตราส่วนความแปรปรวนของความเร็วในการส่งข้อมูลก่อนและหลังอัพเกรดอุปกรณ์ พร้อมทั้งอธิบายความหมาย
> var.test(x, y, conf.level=0.95)F test to compare two variancesdata: x and yF = 5.2063, num df = 14, denom df = 14, p-value = 0.003914alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval:1.747926 15.507567sample estimates:ratio of variances5.206349
9/29
ตัวอย่างที่ 1
สรุป ช่วงความเชื่อมั่นที่ 95% ของอัตราส่วนความแปรปรวนมีค่าอยู่ในช่วง 1.747926 ถึง 15.507567หมายความว่า ก่อนอัพเกรดอุปกรณ์ความแปรปรวนของความเร็วในการส่งข้อมูลมีค่ามากกว่าหลังอัพเกรดอุปกรณ์ 1.75 เท่า ถึง 15.51 เท่า แสดงว่าการอัพเกรดอุปกรณ์ช่วยท าให้การส่งข้อมูลมีความเสถียรมากขึ้น
10/29
ตัวอย่างที่ 2ในการศึกษาวิธีการสอน 2 วิธี คือ สอนด้วยโปรแกรม และสอนด้วยวิธีปกติ โดยสุ่มตัวอย่างนักเรียนมา 16 คน สอนด้วยโปรแกรม และ 21 คนสอนด้วยวิธีปกติ แล้วให้นักเรียนท าข้อสอบ
กลุ่มที่สอนด้วยโปรแกรมมีคะแนนดังนี้
56, 64 , 60, 60, 59, 58, 48, 62, 58, 55, 63, 67, 75, 63, 66, 71
กลุ่มที่สอนด้วยวิธีปกตมิีคะแนนดังนี้
63, 52, 64, 57, 64, 54, 64, 54, 44, 66, 57, 43, 80, 61, 44, 52, 57, 76,47, 65, 62
จงประมาณอัตราส่วนความแปรปรวนของคะแนนนักเรียนที่เรียนด้วยวิธีการสอนด้วยโปรแกรมและสอนด้วยวิธีปกติ ที่ช่วงความเชื่อมั่น 90%
11/29
ตัวอย่างที่ 2
> x=c(56, 64 , 60, 60, 59, 58, 48, 62, 58, 55, 63, 67, 75, 63, 66, 71)> y=c(63, 52, 64, 57, 64, 54, 64, 54, 44, 66, 57, 43, 80, 61, 44, 52, 57, 76, 47, 65, 62)> var.test(x,y,conf.level = 0.90)
F test to compare two variancesdata: x and yF = 0.43308, num df = 15, denom df = 20, p-value = 0.1031alternative hypothesis: true ratio of variances is not equal to 190 percent confidence interval:0.1965598 1.0079975sample estimates:ratio of variances
0.4330751
12/29
ตัวอย่างที่ 2
สรุป ช่วงความเชื่อมั่นที่ 90% ของอัตราส่วนความแปรปรวนของคะแนนนักเรียนที่เรียนด้วยวิธีการสอนด้วยโปรแกรมและสอนด้วยวิธีปกติมีค่าอยู่ในช่วง 0.1965598 ถึง 1.0079975
13/29
การทดสอบมสมติฐานอัตราส่วนความแปรปรวน
การตั้งสมมติฐาน
สมมติฐานสองทาง สมมติฐานทางเดียวด้านซ้าย สมมติฐานทางเดียวด้านขวา
𝐻0 : 𝜎12/𝜎2
2 ≥ 1
𝐻1 : 𝜎12/𝜎2
2 < 1
𝐻0 : 𝜎12/𝜎2
2 = 1
𝐻1 : 𝜎12/𝜎2
2 ≠ 1
𝐻0 : 𝜎12/𝜎2
2 ≤ 1
𝐻1 : 𝜎12/𝜎2
2 > 1
14/29
การทดสอบสมมติฐานของ 𝜎12/𝜎22 ด้วย โปรแกรม R
var.test(x, y, conf.level = 0.95,
alternative=c("two.sided", "less", "greater"))
x และ y คือ ข้อมูลแบบ vector ของตัวอย่างกลุ่ม 1 และ 2 ตามล าดับ
alternative คือ เครื่องหมายในสมมติฐานรอง (𝐻1 )
conf.level คือ ระดับความเชื่อมั่น Default = 0.95
15/29
ตัวอย่างที่ 3
ในการเปรียบเทียบความเหนียวของเชือก 2 ชนิด โดยการสุ่มตัวอย่างเชือกทั้ง 2 ชนิด และท าการวัดความทนทานในการรับน้ าหนักของเชือก (กิโลกรัม) แต่ละเส้น
สุ่มเชือกชนิดที่ 1 มา 16 เส้น
20.1, 12.5, 20.3, 14.8, 14.6, 14.7, 9.8, 13.2, 18.0, 15.6, 17.1,13.4, 12.2, 18.3, 12.6, 12.8
และสุ่มเชือกชนิดที่ 2 มา 10 เส้น
17.5, 11.9, 14.0, 17.9, 17.2, 12.3, 16.1, 12.9, 16.6, 17.2
ให้ทดสอบว่าความแปรปรวนในการรับน้ าหนักของเชือกชนิดที่ 1 และ ชนิดที่ 2 มีความแตกต่างกันหรือไม่ ที่ระดับนัยส าคัญ 0.05
16/29
ตัวอย่างที่ 3
ก าหนดให้ 𝜎12คือ ความแปรปรวนในการรับน้ าหนักของเชือกชนิดที่ 1
𝜎22 คือ ความแปรปรวนในการรับน้ าหนักของเชือกชนิดที่ 2
1. ตั้งสมมติฐานในการทดสอบ𝐻0 : 𝜎1
2/𝜎22 = 1
𝐻1 : 𝜎12/𝜎2
2 ≠ 1
2. ก าหนดระดับนัยส าคัญ (𝛼) = 0.05
0.05
17/29
3. ค านวณหาค่า p-value
ตัวอย่างที่ 3
rope1=c(20.1, 12.5, 20.3, 14.8, 14.6, 14.7, 9.8, 13.2, 18.0, 15.6, 17.1, 13.4, 12.2, 18.3, 12.6, 12.8)rope2=c(17.5, 11.9, 14.0, 17.9, 17.2, 12.3, 16.1, 12.9, 16.6, 17.2)var.test(rope1,rope2,conf.level = 0.95, alternative = "two.sided")F test to compare two variancesdata: rope1 and rope2F = 1.6682, num df = 15, denom df = 9, p-value = 0.4421alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval:0.4425653 5.2092660sample estimates:ratio of variances
1.668187
18/29
p-value = 0.4421 ซึ่งมีค่ามากกว่าระดับนัยส าคัญ
4. สรุป ยอมรับ 𝐻0 ที่ระดับนัยส าคัญ 0.05 ความแปรปรวนในการรับน้ าหนักของเชือกชนิดที่ 1 และ ชนิดที่ 2 ไม่มคีวามแตกต่างกัน
ตัวอย่างที่ 3
19/29
ตัวอย่างที่ 4โรงงานผลิตน้ าตาลทรายแห่งหนึ่งได้ซ้ือเครื่องจักรใหม่มา 1 เครื่อง ต้องการศึกษาประสิทธิภาพการท างานของเครื่องจักรใหม่ท างานได้ดีกว่าเครื่องจักรเก่าหรือไม่ ที่ระดับนัยส าคัญ 0.05 โดยเปรียบเทียบประสิทธิภาพจากความแปรปรวนของน้ าตาลที่บรรจุ หากมีค่าต่ ากว่าแสดงว่าเครื่องจักรนั้นท างานได้มีประสิทธิภาพมากกว่า จึงสุ่มน้ าตาลบรรจุถุงมาเครื่องจักรละ 20 ถุง (กิโลกรัม) ได้ข้อมูลดังนี้
เครื่องจักรใหม่
0.97, 1.01, 0.97, 1.01, 0.96, 0.97, 0.99, 1.01, 1.03, 1.02, 1.00, 0.95,0.99, 1.00, 0.99, 1.00, 0.94, 0.99, 1.01, 1.02
เครื่องจักรเก่า
0.96, 0.96, 0.99, 1.00, 0.95, 1.02, 1.02, 1.01, 1.00, 0.97, 0.94, 1.02,0.93, 0.96, 0.98, 1.03, 1.01, 0.99, 1.03, 0.99
20/29
ตัวอย่างที่ 4
ก าหนดให้ 𝜎12คือ ความแปรปรวนของน้ าหนักน้ าตาลที่บรรจุด้วยเครื่องจักรใหม่
𝜎22 คือ ความแปรปรวนของน้ าหนักน้ าตาลที่บรรจุด้วยเครื่องจักรเก่า
1. ตั้งสมมติฐานในการทดสอบ𝐻0 : 𝜎1
2/𝜎22 ≥ 1
𝐻1 : 𝜎12/𝜎2
2 < 1
2. ก าหนดระดับนัยส าคัญ (𝛼) = 0.05
0.05
21/29
3. ค านวณหาค่า p-value
ตัวอย่างที่ 4
> sugar.old=c(0.97, 1.01, 0.97, 1.01, 0.96, 0.97, 0.99, 1.01, 1.03, 1.02, 1.00, 0.95, 0.99, 1.00, 0.99, 1.00, 0.94, 0.99, 1.01, 1.02)> sugar.new=c(0.96, 0.96, 0.99, 1.00, 0.95, 1.02, 1.02, 1.01, 1.00, 0.97, 0.94, 1.02, 0.93, 0.96, 0.98, 1.03, 1.01, 0.99, 1.03, 0.99)> var.test(sugar.new,sugar.old,conf.level = 0.95, alternative = "less")
F test to compare two variancesdata: sugar.new and sugar.oldF = 1.5469, num df = 19, denom df = 19, p-value = 0.825alternative hypothesis: true ratio of variances is less than 195 percent confidence interval:0.000000 3.354118
sample estimates:ratio of variances
1.546923
22/29
p-value = 0.825 ซึ่งมีค่ามากกว่าระดับนัยส าคัญ
4. สรุป ยอมรับ 𝐻0 ที่ระดับนัยส าคัญ 0.05 ความแปรปรวนของน้ าหนักน้ าตาลที่บรรจุด้วยเครื่องจักรใหม่มีค่ามากกว่าหรือเท่ากับเครื่องจักรเก่า แสดงว่าประสิทธิภาพการท างานของเครื่องจักรใหม่ท างานได้ดีกว่าเครื่องจักรเก่าไม่เป็นความจริง
ตัวอย่างที่ 4
23/29
ตัวอย่างที่ 5
ต้องการเปรียบเทียบประสิทธิภาพของอาหาร 2 ชนิด ที่มีผลต่อน้ าหนักของไก่ โดยวัดจากความแปรปวนน้ าหนักของไก่ที่กินอาหารชนิด A และ ชนิด B จึงท าการ ที่กินอาหารแต่ละชนิด และชั่งน้ าหนัก (กิโลกรัม)
สุ่มไก่ 15 ตัวที่กินอาหารชนิด A ชั่งน้ าหนักได้ดังนี้
1.30, 0.86, 1.10, 1.04, 1.14, 1.29, 0.66, 1.27, 1.55, 1.99, 0.94, 1.53, 0.85, 0.99, 1.48
สุ่มไก่ 18 ตัวที่กินอาหารชนิด B ชั่งน้ าหนักได้ดังนี้
1.18, 1.30, 0.96, 1.09, 0.86, 0.80, 1.20, 0.80, 1.18, 0.95,0.98, 0.93, 0.89, 0.94, 1.18, 1.00, 1.05, 0.64
24/29
ตัวอย่างที่ 51. จงประมาณอัตราส่วนความแปรปรวนของน้ าหนักของไก่ที่กินอาหารชนิด A และชนิด B พร้อมทั้งอธิบายความหมาย
ค่าประมาณของอัตราส่วนความแปรปรวนของน้ าหนักของไก่ที่กินอาหารชนิด A และชนิด B มีค่าเป็น 4.042848หมายความว่า ความแปรปรวนของน้ าหนักของไก่ที่กินอาหารชนิด A มากกว่าไก่ที่กินอาหารและชนิด B ประมาณ 4 เท่า
> chick.A=c(1.30, 0.86, 1.10, 1.04, 1.14, 1.29, 0.66, 1.27, 1.55, 1.99, 0.94, 1.53, 0.85, 0.99, 1.48)> chick.B=c(1.18, 1.30, 0.96, 1.09, 0.86, 0.80, 1.20, 0.80, 1.18, 0.95,0.98, 0.93, 0.89, 0.94, 1.18, 1.00, 1.05, 0.64)> var(chick.A)[1] 0.1169638> var(chick.B)[1] 0.02893105> var(chick.A)/var(chick.B)[1] 4.042848
25/29
ตัวอย่างที่ 5
2. จงหาช่วงความเชื่อมั่น 95% ของอัตราส่วนความแปรปรวนของน้ าหนักของไก่ที่กินอาหารชนิด A และชนิด B
> var.test(chick.A, chick.B, conf.level = 0.95)F test to compare two variances
data: chick.A and chick.BF = 4.0428, num df = 14, denom df = 17, p-value = 0.00766alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval:1.468716 11.725303
sample estimates:ratio of variances
4.042848
สรุป ช่วงความเชื่อมั่นท่ี 95% ของอัตราส่วนความแปรปรวนของน้ าหนักของไก่ที่กินอาหารชนิด A และชนิด B 1.468716 ถึง 11.725303
26/29
ตัวอย่างที่ 5
3. จงทดสอบว่าความแปรปรวนของน้ าหนักไก่ที่กินอาหารชนิด A มากกว่าอาหารชนิด B หรือไม่ ที่ระดับนัยส าคัญ 0.05
ก าหนดให้ 𝜎12คือ ความแปรปรวนของน้ าหนักของไก่ที่กินอาหารชนิด A
𝜎22 คือ ความแปรปรวนของน้ าหนักของไก่ที่กินอาหารชนิด B
1. ตั้งสมมติฐานในการทดสอบ𝐻0 : 𝜎1
2/𝜎22 ≤ 1
𝐻1 : 𝜎12/𝜎2
2 > 1
2. ก าหนดระดับนัยส าคัญ (𝛼) = 0.05
27/29
3. ค านวณหาค่า p-value
ตัวอย่างที่ 5
> var.test(chick.A,chick.B,conf.level = 0.95, alternative = "greater")F test to compare two variances
data: chick.A and chick.BF = 4.0428, num df = 14, denom df = 17, p-value = 0.00383alternative hypothesis: true ratio of variances is greater than 195 percent confidence interval:1.735909 Infsample estimates:ratio of variances
4.042848
28/29
p-value = 0.00383 ซึ่งมีค่าน้อยกว่าระดับนัยส าคัญ
4. สรุป ปฏิเสธ 𝐻0 ที่ระดับนัยส าคัญ 0.05 ความแปรปรวนของน้ าหนักของไก่ที่กินอาหารชนิด A มากกว่าอาหาชนิด B เป็นความจริง
ตัวอย่างที่ 5
29/29