ch1 intro54 - sukon.cmustat.comsukon.cmustat.com/stat208348/ch1_introduction.pdf · 9...
TRANSCRIPT
สถิตินอนพาราเมตริกสถิตินอนพาราเมตริกและทบทวนความรูและทบทวนความรู
208348 : สถิตนิอนพาราเมตริก
โดย ผศ. ดร. สุคนธ ประสิทธิ์วัฒนเสรีภาควิชาสถติิ คณะวิทยาศาสตร มหาวิทยาลยัเชยีงใหม
2
เนื้อหาความหมายของสถิตินอนพาราเมตริกเมื่อใดควรใชสถิตินอนพาราเมตริกทบทวนความรูศัพททางสถิติที่สําคัญและความหมายการเลือกตัวอยางการทดสอบสมมติฐาน
3
ความหมายของสถิตินอนพาราเมตริกการอนุมานทางสถิติ (Statistical inference)
เปาหมาย : ตองการสรปุลักษณะของประชากร โดยอาศัยลักษณะของตัวอยาง
Population???
Sampling
Samplexxx
รูปแบบวธิี :การประมาณคาการทดสอบสมมติฐาน
สถิติที่ใช :สถิติพาราเมตริกสถิตินอนพาราเมตริก
Statisticalinference
4
ความหมายของสถิตินอนพาราเมตริก
สถิติพาราเมตริก (Parametric statistics)ที่รูจักกันดี
• การอนมุานคาเฉล่ียปชก. : z – test, t – test • การอนมุานคาสัดสวนปชก. : z – test• การอนมุานคาความแปรปรวนปชก. : F - testขอกําหนดเบื้องตนของสถิติพาราเมตริก(Assumption of parametric statistics)
• คาสังเกตตัองเปนอิสระกนั• ขอมูลตองมีการแจกแจงแบบปกติ• ขอมูลตองเปนขอมูลเชิงปริมาณ
PopulationX1,…,XN
X
Sampling
Samplex1,…,xn
X = Quantiative variable
x1,…,xn independent
5
ความหมายของสถิตินอนพาราเมตริก
สถิตินอนพาราเมตริก (Nonparametric statistics)มีเงื่อนไขขอกําหนดเบื้องตนในการใชงานนอยกวาสถิติพาราเมตริกไมมีขอกําหนดลักษณะการแจกแจงของขอมูล (Distribution free)สามารถใชวิเคราะหขอมูลคุณภาพไดขอกําหนดเบื้องตนของสถิตินอนพาราเมตริก
• คาสังเกตตัองเปนอิสระกนั
PopulationX1,…,XN
X
Sampling
Samplex1,…,xn
X = Quantiative/Qualitative v.
x1,…,xn independent
6
เมื่อใดควรใชสถิตินอนพารา-เมตริก
เมื่อลักษณะการแจกแจงของขอมลูไมชัดเจนวามีการแจกแจงแบบปกติโดยท่ัวไปมักไมทราบลกัษณะการแจกแจงของปชก. จึงตองพิจารณาจากชุดตัวอยางแทน หากชุดตัวอยางมีขนาดเล็กมาก มักพบวาไมมีลักษณะการแจกแจงแบบปกติ
เมื่อเปาหมายเปนการทดสอบเกีย่วกับลักษณะการแจกแจงของปชก.เมื่อขอมูลเปนขอมูลคณุภาพ (ท้ังมาตรวัดนามบัญญตัิหรือมาตรเรยีงลาํดับ)
PopulationX1,…,XN
x
Sampling
Samplex1,…,xn
เมื่อ n เล็ก
7
ทบทวนความรูศัพททางสถิติที่สาํคัญ และความหมายชนิดของสถิติศาสตร• สถิติเชิงพรรณนา (Descriptive statistics)เกี่ยวของกับการนําเสนอ การวิเคราะหเบื้องตนเพื่อสรุปลักษณะของขอมูล
• สถิติเชิงอนุมาน (Inferential statistics) เกี่ยวของกับการอาศยัลักษณะของกลุมตัวอยางที่สุมไดผานกระบวนการตาง ๆ เพือใหไดขอสรุปเกีย่วกับประชากร
การทดลองทางสถิติการกระทําใด ๆ เพื่อใหไดคาสังเกตมา โดยกลุมของคาสังเกตเรียกวา ขอมูล (Data)
8
ทบทวนความรูศัพททางสถิติที่สาํคัญ และความหมายตัวคงที่ (Constant)คาสังเกตในการทดลองแตละคร้ังมีคาเทากัน เรียกชุดคาสังเกตนั้นวา ตัวคงที่ตัวคงที่ตัวแปร (Variable)คาสังเกตในการทดลองแตละคร้ังมีคาหลากหลาย เรียกชุดคาสังเกตนั้นวา ตัวแปรตัวแปร แบงเปน- ตัวแปรปริมาณ (Quantitative variable)- ตัวแปรคุณภาพ (Qualitative variable)
9
ทบทวนความรู
คาสงัเกตจากการทดลอง n ครั้ง
X1, X2, …, Xn
ถา X1,…,Xn มีคาเทากัน เรียก X วา ตวัคงที่
ถา X1,…,Xn มีคาหลากหลาย เรียก X วา ตัวแปร
ผลการสอบถามน.ศ. 10 คน วามรีถยนตสวนตัวหรือไม
x1 = มี, x2 = ไมมี, … , x10 = ไมมี
⇒ เรียก X วา ตัวแปรคณุภาพ
ผลการสอบถามสวนสูงของน.ศ. 10 คน
x1 = 170, x2 = 180, … , x10 = 150
⇒ เรียก X วา ตัวแปรปริมาณ
10
ทบทวนความรูศัพททางสถิติที่สาํคัญ และความหมายมาตรวัดขอมูล• มาตรนามบญัญัติ (Norminal scale)• มาตรเรียงลําดับ (Ordinal scale)• มาตรอันตรภาค (Interval scale)• มาตรอัตราสวน (Ratio scale)
คนที่ เพศ อายุ (ป) คะแนนสอบ ผลการเรียน
1 ชาย 20 30 ปานกลาง
2 หญิง 21 40 ดี
3 หญิง 19 50 ดีมาก
11
ทบทวนความรู
ศัพททางสถิติที่สําคัญ และความหมายตัวแปรสุม (Random variable)คือตัวแปรที่แทนคาสังเกตที่เปนไปไดทั้งหมดจากการทดลองในรูปตัวเลข จําแนกเปน• ตัวแปรสุมไมตอเนื่อง (Discrete rv.)• ตัวแปรสุมตอเนื่อง (Continuous rv.)
12
ทบทวนความรู
ผลการสอบถามน.ศ. 10 คน วามรีถยนตสวนตัวหรือไม
x1 = มี, x2 = ไมมี, … , x10 = ไมมี
⇒ เรียก X วา ตัวแปรคณุภาพ
กําหนดให Y แทนจํานวนน.ศ.ที่เปนไปไดทั้งหมดที่มีรถยนตสวนตัว
Y : 0, 1, 2, 3, … , 10
⇒ เรียก Y วา ตัวแปรสุมไมตอเนื่อง
13
ทบทวนความรู
ผลการสอบถามสวนสูงของน.ศ. 10 คน
x1 = 170, x2 = 180, … , x10 = 150
⇒ เรียก X วา ตัวแปรปริมาณ
กําหนดให Y แทนความสงูของน.ศ. ทีเ่ปนไปไดทั้งหมด
0 < Y < 250
⇒ เรียก Y วา ตัวแปรสุมตอเนื่อง
14
ทบทวนความรู
ศัพททางสถิติที่สําคัญ และความหมายประชากร (Population)คือหนวยทดลองทั้งหมดที่สนใจศึกษา จําแนกเปน• ประชากรจํากัด (Finite population)คือประชากรที่มีขนาดอยูภายใตขอบเขตหนึ่ง ซึ่งสามารถแจงนับได
• ประชากรไมจํากัด (Infinite population)คือประชากรที่มีขนาดซึ่งไมสามารถแจงนับไดครบถวน
15
ทบทวนความรูศพัททางสถิติท่ีสําคัญ และความหมายตัวอยาง (Sample)คือบางสวนของประชากรที่ถูกเลือกมาศึกษาดวยวิธีการตาง ๆ ซึ่งมักถูกใชเปนตัวแทนของประชากร โดยขนาดตัวอยางแทนดวย nหนวยตัวอยางหนวยตัวอยาง (Sample unit)(Sample unit)คือหนวยที่ใหขอมูลหนวยแจงนับหนวยแจงนับ (Enumeration unit)(Enumeration unit)คือหนวยที่ถกูทําการเก็บรวบรวมขอมลู
สนใจศึกษารายไดตอครัวเรือนใน จ.เชียงใหม
ตัวอยาง :180 ครัวเรือน
หนวยตัวอยาง : ครัวเรือน
หนวยแจงนับ : หัวหนาครัวเรือน
กรอบตัวอยางกรอบตัวอยาง (Sampling Frame)(Sampling Frame)คือบัญชีหนวยตัวอยางทั้งหมดของประชากรที่สนใจศึกษา
16
ทบทวนความรูศัพททางสถิติที่สําคัญ และความหมายพารามิเตอรพารามิเตอร (Parameter)(Parameter)คือคาที่แสดงคุณลักษณะของประชากรคาสถิติคาสถิติ (Statistics)(Statistics)คือคาที่แสดงคุณลักษณะของตัวอยาง
ประชากร ตัวอยาง
คาเฉล่ีย ( ) = 20
คาความแปรปรวน (s2) = 10
คาเฉล่ีย (µ)= 30
คาความแปรปรวน (σ2) = 12
x
คาพารามิเตอรคาพารามิเตอร คาสถติิคาสถติิ
17
ทบทวนความรูการเลือกตัวอยางการเลือกโดยใชหลักความนาจะเปนสามารถประมาณโอกาสที่แตละตัวอยางจะถูกเลือก - การสุมตัวอยางอยางงาย- การสุมตัวอยางแบบมีระบบ- การสุมตัวอยางแบบแบงช้ันภูมิ- การสุมตัวอยางแบบแบงกลุมการเลือกโดยไมใชหลักความนาจะเปนไมสามารถประมาณโอกาสที่แตละตัวอยางจะถูกเลือก- Convenience sample
18
ทบทวนความรู
Target populationประชากรที่ตองการใชผลการศึกษาที่ไดสรุปอางอิงถึงSample populationประชากรที่ถูกใชเพื่อการสุมเลือกตัวอยาง
19
ทบทวนความรูการทดสอบสมมตฐิาน (Hypothesis testing)จุดมุงหมาย : เพื่อทําการทดสอบขอสงสัยที่มีเกี่ยวกับคาพารามิเตอรที่สนใจ โดยมักสนใจทดสอบสมมติฐานคาพารามิเตอรคาเฉลี่ย (µ)คาความแปรปรวน (σ2)คาสัดสวน (P)
20
การทดสอบสมมตฐิานสมมติฐานทางสถติิสมมติฐานทางสถติิคือขอสนันษิฐานเกี่ยวกับลักษณะของประชากร 1 กลุมหรือหลายกลุม ซ่ึงอาจจะเปนจริงหรือไมจริงก็ได ประกอบดวย• สมมติฐานหลัก (Null Hypothesis), H0
เปนสมมติฐานที่ใชในการทดสอบพารามิเตอร ดังน้ันตองระบุคาที่ชัดเจนเกี่ยวกับพารามิเตอร
• สมมติฐานทางเลือก (Alternative Hypothesis), H1
เปนสมมติฐานทางเลือกในกรณีที่ปฏิเสธ H0
H0 : µ = kH1 : µ ≠ k H1 : µ > kH1 : µ < k
H0 : µ < kH0 : µ > k= =
Two-tailed test One-tailed test
21
การทดสอบสมมตฐิานลองเขียนสมมติฐานทางสถิติจากขอสงสยัตอไปนี้
• ถาน AA กระรอกบิน ใชไดนานเฉลี่ยเทากับ 300 นาทีจริงหรือไม
ถาให µ แทนระยะเวลาเฉลี่ยของการใชงานถาน AA
ขอสงสัยในที่นี้คือ µ = 300 ?
สมมติฐานทางสถิติ
H0 :
H1 :
µ = 300
µ ≠ 300
22
การทดสอบสมมตฐิานลองเขียนสมมติฐานทางสถิติจากขอสงสยัตอไปนี้
• ผูผลิต TV กลาววา อายุการใชงานเฉลี่ยของ TV รุนหนึ่งมากกวา 8 ป
ถาให µ แทนระยะเวลาเฉลี่ยของการใชงาน
ขอสงสัยในที่นี้คือ µ > 8 ?
สมมติฐานทางสถิติ
H0 :
H1 :
µ < 8 หรือ µ = 8
µ > 8
23
การทดสอบสมมตฐิานลองเขียนสมมติฐานทางสถิติจากขอสงสยัตอไปนี้
• รถยนตยี่หอหนึ่งโฆษณาวา ชวยประหยัดน้ํามันมากกวา โดยสามารถวิ่งไดระยะทางเฉลี่ยไมนอยกวา 28 กม./ลิตรถาให µ แทนระยะทางเฉลี่ยตอลิตร
ขอสงสัยในที่นี้คือ µ > 28 ?
สมมติฐานทางสถิติ
H0 :
H1 :
µ > 28µ < 28
หรือ µ = 28
24
การทดสอบสมมตฐิานสถิติทดสอบสถิติทดสอบ (Test statistic)(Test statistic) พิจารณาตัวสถิติทดสอบจากลกัษณะการแจกแจงของคาสถิติตัวอยาง เชน การแจกแจงคาเฉลี่ยตัวอยาง
Sampling distribution สถิตทิดสอบ
(เมื่อทราบคา σ2 หรือ n > 30)
(เมื่อ n < 30)
),(~ 2xxNx σµ
tx ~
x
xxz σµ−=
x
xxt σµ−=
25
การทดสอบสมมตฐิาน
ความคลาดเคลื่อนในการทดสอบความคลาดเคลื่อนในการทดสอบทุก ๆ ครั้งในการทดสอบสมมติฐานทางสถิติ จะเปนการทดสอบคาพารามิเตอรภายใต H0 ซึ่งขอสรุปที่เปนไปไดมี 2 กรณี คอื
• ปฏิเสธ H0 (Reject H0)
• ไมปฏิเสธ H0 (No reject H0)
ผลจากการตดัสินใจดังกลาว อาจเปนการตัดสินใจที่ผิดพลาดได ทั้งน้ีเพราะอาศัยขอมูลทีไ่ดจากกลุมตัวอยางเปนฐานในการตัดสินใจ
26
การทดสอบสมมตฐิานความคลาดเคลื่อนในการทดสอบความคลาดเคลื่อนในการทดสอบ
สถานการณจริง
การตัดสนิใจ H0 เปนจรงิ H0 เปนเท็จ
ยอมรับ H0 Type II error
ปฏิเสธ H0 Type I error
ดังน้ันในการตัดสินใจแตละครั้งจําเปนตองทําการควบคุมความผิดพลาดที่อาจเกิดขึ้น (ที่มาของการกําหนดเกณฑในการตัดสินใจ)
27
การทดสอบสมมติฐานType I and Type II ErrorsType I and Type II Errors
พิจารณากรณีตอไปนี้กรณีท่ี 1สมมติฐาน H0 : µ = 30 vs. H1 : µ ≠ 30การตัดสินใจ ปฏิเสธ H0
(ทั้งนี้เพราะภายใต H0 เชื่อวา µ = 30 แต x = 15 แตกตางกันเกนิไป)
Type I errorType I error คือปฏิเสธ H0 ทั้ง ๆ ที่ H0 เปนจริง
กรณีท่ี 2สมมติฐาน H0 : µ = 15 vs. H1 : µ ≠ 15การตัดสินใจ ไมปฏิเสธ H0(ทั้งนี้เพราะภายใต H0 เชื่อวา µ = 15 และ x = 15 ใกลเคียงกนัมาก)
Type II errorType II error คือไมปฏิเสธ H0 ทั้ง ๆ ที ่H0 เปนเท็จ
Population
10, 20, 30, 40, 50
mean = 30
Sample (n=2)
10, 20
mean = 15
28
การทดสอบสมมติฐาน
• Type I error = การปฏิเสธ H0 ทัง้ ๆ ที ่H0 เปนจริง
ความนาจะเปนที่จะเกิด Type I error เรียกวา ระดับนัยสําคญั (level of significance) ของการทดสอบ → α (alpha)
• Type II error = การไมปฏิเสธ H0 ทัง้ ๆ ที ่H0 เปนเท็จ
ความนาจะเปนที่จะเกิด Type II error → β (beta)
คา (1 - β) เรียกวา กําลงัในการทดสอบ (power of test)
โดยปกติ ในการทดสอบสมมติฐานทางสถิติมักกําหนดคาระดบันัยสําคัญ (α) ใหมีคานอย ๆ น่ันคือตองการใหโอกาสที่จะปฏิเสธ H0 ทีเ่ปนจริงเกิดขึ้นนอย ๆ
ที่นิยมใชคือ α = 0.10, α = 0.05, α = 0.01
29
การทดสอบสมมตฐิานอาณาเขตวิกฤตอาณาเขตวิกฤต เปนชวงที่บงบอกวา H0 ไมนาเปนไปได หากคาสถิติทดสอบตกอยูชวงนี้ จึงควรทําการปฏิเสธ H0
โดยกําหนดอาณาเขตวิกฤตมีพื้นที่ = α (เพื่อใหโอกาสในการปฏิเสธ H0 น้ัน จะเปนการปฏิเสธ H0 ที่เปนจริงไมเกิน α)
30
การทดสอบสมมติฐานอาณาเขตวกิฤตอาณาเขตวกิฤต
- การทดสอบแบบทางเดียว
• รูปแบบอาณาเขตวิกฤต ขึ้นอยูกบั H1 และตัวสถิติทดสอบ
- การทดสอบแบบ 2 ทาง
H0 : µ = kH1 : µ ≠ k
H1 : µ > kH1 : µ < k
H0 : µ = kH0 : µ = k
การทดสอบแบบทางเดียวดานนอยหรือทางซายมือการทดสอบแบบทางเดียวดานมากหรือทางขวามือ
Rejection Rejection regionregion
Rejection Rejection regionregionAcceptionAcception
regionregion
1 - αα/2
α/2
21 α−z21 α−− z
z
AcceptionAcceptionregionregion
1 - αα
z-z1-α
AcceptionAcceptionregionregion
1 - α α
zZ1-α
31
การทดสอบสมมตฐิาน
สรุปขั้นตอนการทดสอบสมมติฐานสรุปขั้นตอนการทดสอบสมมติฐานกําหนดสมมติฐานทางสถิติเลือกตัวสถิติทดสอบกําหนดอาณาเขตวิกฤต ภายใตระดับนัยสําคัญ αคํานวณคาสถิติสรุปผลการทดสอบสมมติฐาน
32
เปนที่เชื่อกันวาอายุการใชงานเฉลี่ยของหลอดไฟที่ผลิตจากโรงงานแหงหนึ่งมีคาเปน 1,500 ชั่วโมง และสวนเบี่ยงเบนมาตรฐานเปน 160 ชั่วโมง โรงงานที่ผลิตหลอดไฟนี้ไดโฆษณาวาอายุการใชงานเฉลี่ยของหลอดไฟที่ผลิตไดจะมีคาเฉลี่ยมากกวา 1,500 ชั่วโมง หากทําการสุมตัวอยางหลอดไฟที่ผลิตจากโรงงานนี ้64 หลอด พบวามีอายุการใชงานเฉลี่ย 1,540 ชั่วโมง
จงทดสอบสมมุติฐานที่ระดับนัยสําคัญ 0.05
ตัวอยางที่ตัวอยางที่ 11
ตองการใหทําการทดสอบสมมติฐานทางสถิติ
33
Population อายุการใชงานหลอดไฟที่ผลิตโดยโรงงานนี ้(X)
Sample n = 64
สงสัยวาอายใุชงานเฉล่ียไมมากกวา
1500 ช่ัวโมง หรือไม (µ > 1500?)
การทดสอบสมมติฐาน
ตัวอยางที่ตัวอยางที่ 11
Parameter : µ = อายุใชงานเฉลี่ย = ?
σ = 160
Statistic : อายุการใชงานเฉลี่ยของตัวอยาง, x = 1540
X
สมมติให X มีการแจกแจงปกติ
34
คําถาม อายกุารใชงานเฉลี่ยไมมากกวา 1500?
ตองการทดสอบ µ < 1500 ?
สมมติฐานสถิติ H0 :
H1 :
µ < 1500
µ > 1500
สถิติทดสอบ
nxzσ
µ0−=
เขตวิกฤต
.05
z > 1.645
ตัวอยางที่ตัวอยางที่ 11โจทย σ = 160,
n = 64, x = 1540
0.95ทราบ σ2
α = .05
Z.95 = 1.645
คํานวณคาสถติทิดสอบ
0.264160
15001540 == −cz
สรุปผล
zc = 2.0
zc > 1.645 ดังน้ัน ปฏิเสธ H0
สรุปไดวาอายุการใชงานเฉลี่ยของหลอดไฟมีคาเกินกวา 1500 ชั่วโมงที่ α = 0.05
zและสมมติอายุการใชงานมีการแจกแจงปกติ
35
การทดลองปลูกขาวโดยใชพันธุขาว 2 ชนิด ๆ ละ 50 แปลง ในสภาพแวดลอมเดียวกัน ปรากฏวา
- ขาวชนิดแรกใหผลผลิตเฉล่ีย 78.3 ถัง
คาเบี่ยงเบนมาตรฐาน 5.6 ถัง
- ในขณะที่ขาวชนิดที่สองใหผลผลิตเฉล่ีย 81.7 ถัง
คาเบี่ยงเบนมาตรฐาน 6.3 ถัง
จากขอมูลน้ีสามารถกลาวไดหรือไมวา โดยท่ัวไปขาวชนิดแรกจะใหผลผลิตไมนอยกวาชนดิที่ 2 ที่ระดบันัยสําคัญ 0.05
ตัวอยางที่ตัวอยางที่ 22
36
Population1ผลผลติขาว 1 (X1)
Sample1 n1 = 50
สงสัยวาขาว1 ใหผลผลติไมนอยกวาขาว 2(µ1 < µ2?)
ตัวอยางที่ตัวอยางที่ 22
Parameter : µ1 = ผลผลติเฉลี่ย = ?
σ1 = ?
Statistic :x1 = 78.3 s1 = 5.6
X
สมมติให X1 และ X2 มีการแจกแจงปกติ
Population2ผลผลติขาว 2 (X2)
Sample2 n2 = 50
Parameter : µ2 = ผลผลติเฉลี่ย = ?
σ2 = ?
Statistic :x2 = 81.7 s2 = 6.3
การทดสอบสมมติฐาน
37
คําถาม ผลผลิตจากขาว 1 ไมนอยกวาขาว 2 ?
ตองการทดสอบ µ1 > µ2 ?
สมมติฐานสถิติ H0 :
H1 :
µ1 > µ2
µ1 < µ2
สถิติทดสอบ
2
22
1
21
)()( 2121
ns
ns
xxz+
−−−=
µµ
เขตวิกฤต
.05
z < -1.645
ตัวอยางที่ตัวอยางที่ 22
0.95n1,n2 > 30
α = .05
Z.05 = -1.645สรุปผลzc < -1.645 ดังน้ัน ปฏิเสธ H0
สรุปไดวาผลผลิตขาว 1 นอยกวาขาว 2 ที่ α = 0.05
zและสมมตผิลผลิตขาวมีการแจกแจงปกติ
โจทย n1 = n2 = 50
x1 = 78.3, s1 = 5.6
x2 = 81.7, s2 = 6.3
zc = -2.85
38
ในการสํารวจเกี่ยวกับสุขภาพของผูหญิงและผูชายที่มีอายุ 40 ปขึ้นไป ในเขตชุมชนแหงหนึ่ง ไดขอมูลดังตอไปน้ี
ตัวอยางที่ตัวอยางที่ 33
ผูหญิง ผูชาย
จํานวน (คน) 13 15
จํานวนครั้งโดยเฉลี่ยที่พบแพทยใน 1 ป 6.8 5.3
คาเบี่ยงเบนมาตรฐาน 1.8 1.6
ขอมูลที่ไดใหหลักฐานพอเพียงที่ช้ีวา มีความแตกตางระหวางจํานวนครั้งโดยเฉล่ียที่ไปพบแพทยของผูหญิงและผูชายหรือไม จงทดสอบโดยใชระดับนัยสําคัญ 0.01
39
Pop1 : หญิงจน.ครั้งที่พบแพทย (X1)
Sample1 n1 = 13
สงสัยวาจน.ครัง้เฉลี่ยที่พบ
แพทยของหญงิและชายแตกตางกัน
(µ1 ≠ µ2?)
ตัวอยางที่ตัวอยางที่ 33
Parameter : µ1 = จน.ครั้งเฉลี่ย = ?
σ1 = ?
Statistic :x1 = 6.8 s1 = 1.8
X
สมมติให X1 และ X2 มีการแจกแจงปกติ
Pop2 : ชายจน.ครั้งที่พบแพทย (X2)
Sample2 n2 = 15
Parameter : µ2 = จน.ครั้งเฉลี่ย = ?
σ2 = ?
Statistic :x2 = 5.3 s2 = 1.6
การทดสอบสมมติฐาน
40
คําถาม จน.คร้ังท่ีพบแพทยของหญิงและชายแตกตางกัน ?
ตองการทดสอบ µ1 ≠ µ2 ?
สมมติฐานสถิติ H0 :
H1 :
µ1 = µ2
µ1 ≠ µ2
สถิติทดสอบ
21
112121 )()(
nnpsxxt
+−−−
=µµ
เขตวิกฤต
.005
t < -2.779 หรือt > 2.779
ตัวอยางที่ตัวอยางที่ 33
0.99n1,n2 < 30
α = .01, df =13+15-2= 26
t.975,26 = 2.779สรุปผลtc < 2.779 ดังน้ัน ยอมรบั H0
ยังไมมีหลักฐานเพียงพอจะสรปุวาจน.ครั้งเฉลี่ยที่พบแพทยของหญิงและชายแตกตางกัน
tและสมมตคิวามแปรปรวน 2 กลุมเทากัน
โจทย n1=13, n2=15
x1 = 6.8, s1 = 1.8
x2 = 5.3, s2 = 1.6
tc = 2.34
.005
41
Significance Level and p-value
Significance Level, αเปนคาที่กําหนดไวตั้งแตตอนเร่ิมการศึกษา ถึงขนาดความผิดพลาดแบบที่ 1 ที่สามารถยอมรับใหเกิดขึ้นไดในการศึกษานั้น
p-valueคาความนาจะเปนที่จะเกิดความผิดพลาดแบบที่ 1 ที่คํานวณไดจากคาสถิติทดสอบ (หรือคาที่สังเกตได) ภายใตสมมติฐานที่ใชทดสอบ
ดังน้ัน หากคา p-value < α ก็จะปฏเิสธ H0
42
การคาํนวณคา p-valueจากตัวอยางที่ 1H0 : µ = 1500, H1 : µ > 1500zc = 2.00p-value = P(z > zc) = P(z > 2.00)
= 0.0228
.050.95
α = .05
Z.95 = 1.645zc = 2.0
z
zc = 2.0
z
p-value
p = .0228
43
การคาํนวณคา p-valueจากตัวอยางที่ 2H0 : µ1 - µ2 = 0, H1 : µ1 - µ2 < 0zc = -2.85p-value = P(z < zc) = P(z < -2.85)
= 0.0022
.05 0.95
α = .05
Z.05 = -1.645z
.0022
p-value
Zc = -2.85z
44
การคาํนวณคา p-valueจากตัวอยางที่ 3H0 : µ1 - µ2 = 0, H1 : µ1 - µ2 ≠ 0tc = 2.34, df = 26p-value = 2P(t > tc) = 2P(t > 2.34)เนื่องจากการเปดตาราง t ไมสามารถหาคาที่พอดีได จึงใชคาใกลเคียงแทนจากตาราง t (df=26) จะไดP(t > 2.056) = 0.025P(t > 2.479) = 0.01ดังนัน้ 0.01 < P(t > 2.34) < 0.025เพราะฉะนั้น 0.02 < p-value < 0.05
.005 0.99
α = .01, df =13+15-2= 26
t.995,26 = 2.779t
.005
.01-.025
p-value
tc = 2.34t
.01-.025