hypothesis review
DESCRIPTION
Hypothesis Review.TRANSCRIPT
1
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
1
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP. HCM
Khoa KTXD - Bộ môn KTTNN
Giảng viên: PGS. TS. NGUYỄN THỐNG
E-mail: [email protected] or [email protected]
Web: http://www4.hcmut.edu.vn/~nguyenthong/
Tél. (08) 38 640 979 - 098 99 66 719 PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
NỘI DUNG MÔN HỌC Chương 1. Thống kê mô tả (ôn).
Chương 1bis. Xác suất & phân phối thống kê (ôn)..
Chương 2. Khoảng tin cậy.
Chương 3. Kiểm định thống kê.
Chương 4. Phân loại dữ liệu (Classification).
Chương 5. Phân nhóm dữ liệu (Cluster).
Chương 6. Phân tích thành phần chính (PCA).
Chương 7. Phân tích chuỗi thời gian.
Chương 8. Hồi quy tuyến tính.
Chương 9. Xử lý số liệu thực nghiệm.
Chương 10. Giới thiệu phần mềm SPSS or R
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
3
KIỂM ĐỊNH THỐNG KÊ
Đươc sử dung khi phải đưa ra cac
kết luận liên quan đến cac biến
thống kê ơ dạng xac suất.
Vi du: So sanh 2 gia trị cua biến
thống kê Xét 2 biến thống kê dạng
liên tuc Xác suất để 2 biến này BẰNG
nhau là bằng 0 !
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
4
PHÂN PHỐI CHUẨN N(0,1) biến liên tuc
0
-2.5 -1.5 -0.5 0.5 1.5 2.5
p(t)
tt0
vôùi
Haøm maät ñoä
xaùc suaát
S1
S2
t1 t
2
2t
21
p(t) e2
t [ , ]
Gia trị TB Độ lệch
chuẩn
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
5
KIỂM ĐỊNH THỐNG KÊ
Hoăc xac định quy luật cua
một biến quan sat co bản chất
la biến xac suất so với một quy
luật xac suất DƯ KIÊN.
So sánh giá trị TB từ mẫu
khảo sát so với giá trị giả thiết
đưa ra. PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
6
Kiểm định giả thiết là một kỹ thuật cho phép đưa ra các
kết luận, với một độ tin cậy cho trước, khi tiến hành
so sánh giữa các biến thống kê.
Các bước kiểm định:
• Bước 1: Thành lập giả thiết H0 và phản giả thiết H1.
• Bước 2: Đề xuất ngưỡng chấp nhận cua kiểm định.
• Bước 3: Chọn lựa tham số thống kê thích hơp cho
kiểm định.
• Bước 4: Xác định giá trị tới hạn thống kê cua kiểm
định.
• Bước 5: Thiết lập gia trị đươc lấy bơi kiểm định.
• Bước 6: Ra quyết định.
2
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
7
KIỂM ĐỊNH GIÁ TRỊ
TRUNG BÌNH THỐNG KÊ
Để kiểm định người ta dùng
hoăc:
Phân phối chuẩn.
Dùng phân phối Student.
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
8
KIỂM ĐỊNH GIÁ TRỊ
TRUNG BÌNH VỚI P/P CHUẨN.
T/hơp sử dung:
n > 30
Hoăc n < 30, tập hơp mẹ theo
phân phối chuẩn và biết σ.
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
9
Ví du. Keát quaû chòu löïc trung bình cuûa vaät lieäu
Z ñöôïc coâng boá laø 15000N/cm2. Giaû thieát giaù
trò trung bình theo phaân phoái chuaån.
Ñeå kieåm ñònh giaù trò trung bình, ngöôøi ta laáy
ngaãu nhieân n=60 maãu vaø keát quaû tính cho
thaáy giaù trò chòu löïc trung bình laø
14000N/cm2, = 4000N/cm
2. Haõy kieåm ñònh sự sai biệt vôùi möùc ñoä ruûi ro
=5% (ñoä tin caäy 95%).
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
10
H0: : giá trị chịu lực trung bình là bằng
15000N/m2.
H1: : giá trị chịu lực trung bình là khác
15000N/m2.
a : tham số cần xac định.
x a
x a
0
-2.5 -1.5 -0.5 0.5 1.5 2.5
p(t)
tt0-t0
H0: (1-) H
1 :α%
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
11
Ta coù:
1 0Pr H \ H Pr \x a x
1 Pr a x a
x x x
a x -μ a= Pr(- < < )
σ σ σ
x x
a a0.95 = Pr(- < t < )
σ σx
xt
96.1x
a
Tra baûng
vôùi
Giaù trò tra töø p/p
chuaån N(0,1)
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
12
HD:
0
-2.5 -1.5 -0.5 0.5 1.5 2.5
p(t)
tt0-t0
00 tttPr95.0
0ttPr025.0
3
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
13
Töø ñoù:
a=1012,14
Ngoai ra từ số liệu mẫu ta thấy:
Giả thiết H0 đươc chấp nhận.
Kết luận: Với mức độ rui ro là 5% (độ tin
cậy 95%) ta có thể kết luận giá trị chịu
lực trung bình là 15000N/m2.
n*96,196,1a x
x a 1000 1012 14,
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
14
Bài tập. Keát quaû trọng löôïng töï nhieân trung
bình cuûa ñaát trong thiết kế ñöôïc coâng boá laø
16kN/m3.
Ñeå kieåm ñònh soá lieäu, ngöôøi ta laáy ngaãu nhieân
n=36 maãu vaø keát quaû tính cho thaáy giaù trò
trung bình vaø ñoä leäch chuaån laø 14.8kN/m3,
s= = 2kN/m3.
Haõy kieåm ñònh keát quaû coâng boá vôùi ñoä ruõi ro laø
=5% (ñoä tin caäy 95%).
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
15
KIEÅM ÑÒNH GIAÙ TRÒ
TRUNG BÌNH
VÔÙI PHAÂN PHOÁI
STUDENT
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
16
Phân phối Student đươc áp dung
thay thế phân phối chuẩn trong
kiểm định giá trị trung bình khi:
Mẫu có kích thước bé (n < 30);
Phân phối mẹ là phân phối
chuẩn nhưng độ lệch chuẩn
không biết.
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
17
Ví du. Keát quaû chòu löïc trung bình cuûa vaät
lieäu Z ñöôïc coâng boá laø 15000N/cm2.
Ñeå kieåm ñònh giaù trò trung bình coâng boá neâu
treân, ngöôøi ta laáy maãu ngaãu nhieân n=16
maãu vaø keát quaû tính cho thaáy giaù trò chòu
löïc trung bình vaø ñoä leäch chuaån cuûa maãu
laø 14000N/cm2
vaø =1500N/cm2
.
Haõy kieåm ñònh keát quaû coâng boá vôùi ñoä ruõi ro
laø =5% (ñoä tin caäy 95%).
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
18
Ví du. Cơ quan thống kê thành phố A cho
biết thu nhập trung bình cua dân thành
phố là 15000$/năm.
Để kiểm định kết quả này, người ta lấy một
mẫu ngẫu nhiên n =16 gia đình và kết
quả tính cho giá trị trung bình là 13500$
và độ lệch chuẩn cua mẫu là 4000$.
Haõy kieåm ñònh keát quaû coâng boá vôùi ñoä ruõi ro laø
=5% (ñoä tin caäy 95%).
4
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
19
Ta coù:
Với α=5% và df=(16-1)=15, tra bảng phân
phối Student ta có:
1 0Pr H \ H
Pr \ Pr Pr( )x x x
x a ax a x t
x
a2.131
2131
16
4000*131,2 a
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
20
Ngoai ra từ số liệu mẫu ta thấy:
Giả thiết H0 đươc chấp nhận.
Kết luận: Với một độ tin cậy 95% (hay với mức độ
rui ro là 5%) ta có thể nói là thu nhập bình
quân cua dân thành phố A là 15000$.
Ví du: Tương tự bài trên với n=26 và giá trị độ
lệch chuẩn tính từ mẫu là 3000$.
Đap số: Kết luận: H1 chấp nhận thu nhập trung
bình khác 15000$.
x 1500 a 2131
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
21
KIỂM ĐỊNH GIẢ THIÊT
VỀ SƯ SAI BIỆT CỦA
GIÁ TRỊ TRUNG BÌNH VÀ 0
VỚI PHÂN PHỐI STUDENT.
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
22
Ví du. Nghieân cöùu moät bieán thoáng keâ töø
moät maãu ngaãu nhieân goàm n=16 phaàn
töû, ngöôøi ta xaùc ñònh ñöôïc giaù trò trung
bình X laø 1,5 vaø ñoä leäch chuaån töø maãu
laø 2.
Haõy kieåm ñònh sự sai biệt cuûa giaù trò trung
bình noùi treân vaø giaù trò 0 vôùi ñoä ruõi ro
laø 5% (ñoä tin caäy 95%).
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
23
Giaûi
H0:
Giá trị TB BẰNG giá trị 0 theo quan điểm
thống kê.
H1:
Giá trị TB KHÁC giá trị 0 theo quan điểm
thống kê.
0x a x 0
x a x 0
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
24
YÙ nghóa ñoà thò:
0
-2.5 -1.5 -0.5 0.5 1.5 2.5
p(t)
ta-a
H0
H1: α%
1 0Pr( \ ) Pr( 0 )H H x a
5
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
25
Töø ñoù:
Từ bảng tra phân phối Student với bậc tự do df=16-1=15 và α=5%, ta có:
Ta thaáy:
Keát luaän: Vôùi ñoä tin caäy 95%, giaù trò X laø khaùc 0
theo quan ñieåm thoáng keâ.
Pr( ) Pr( )x x x
x a at
H1 chaáp nhaän
131,2a
X
065,116
2131,2131,2a
X
1H065.15,1X
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
26
CHÚ Ý
Người ta gọi tỷ số
tỷ Student cua X.
Trong thực hành nguời ta hay
kiểm định giá trị TB cua 1 biến
thống kê là KHÁC hay BẰNG 0.
Gọi là T test !
X/X
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
27
Baøi taäp 1: Nghieân cöùu bieán thoáng keâ töø
maãu n=9 cho thaáy giaù trò trung bình X
laø 3,5 vaø ñoä leäch chuaån cuûa maãu laø 4.
Kieåm ñònh giaû thieát söï sai bieät giöõa X
vaø giaù trò 0 vôùi ñoä tin caäy 95% (H1).
(Kiểm định xem gía trị X là KHÁC 0 hay
BẰNG 0 theo quan điểm thống kê).
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
28
Baøi taäp 2: Töông töï baøi treân vôùi n=9,
X=5,2 vaø =9 (H0).
Anh (Chò) ruùt ra keát luaän gì töø 2 baøi taäp
neâu treân trong keát luaän giaù trò trung
bình cuûa bieán thoáng keâ laø khaùc hay
baèng giaù trò 0 ?
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
29
CHÚ Ý
Giá trị TB cua 1 biến thống kê sẽ
khác 0 hay bằng 0 phu thuộc
vào:
Bản thân giá trị TB tính ra
Độ lệch chuẩn cua biến thống
kê nghiên cứu.
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
30
Ví du: Khảo sát một mẫu thống kê có kích
thước n=10, cho thấy giá trị trung bình là
xtb=10 và độ lệch chuẩn là s=6. Với rũi ro
5%, so sánh giá trị trung bình nêu trên
với 0.
H0:
H1:
0x a x 0
x a x 0
6
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
31
YÙ nghóa ñoà thò:
0
-2.5 -1.5 -0.5 0.5 1.5 2.5
p(t)
ta-a
H0
H1: α%
1 0Pr( \ ) Pr( 0 )H H x a
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
32
Töø ñoù:
Từ bảng tra phân phối Student với bậc tự
do df=10-1=9 và α=5%, ta có:
Ta thaáy:
Pr( ) Pr( )x x x
x a at
2.262x
a
62.262* 2.262 4.29
10xa
10 4.29x a H1 chaáp nhaän
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
33
Kết luận: Với độ tin cậy là 95%, ta có thể
kết luận là giá trị là khác 0.
Ví du: Tương tự bài trên với n=6 và s=15.
Đap số: Với độ tin cậy là 95%, ta có thể kết
luận là giá trị là bằng 0.
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
34
Baøi taäp: Với rũi ro 5%, so sánh các giá trị trung bình cua một biến thống kê khảo sát tính đươc sau đây với 0:
a.
b.
Giả thiết biến khảo sát tuân theo phân phối Student có bậc tự do df=10.
Chuù yù: Giaù trò trung bình cuûa 1 ñaïi löôïng thoáng
keâ seõ khaùc 0 hay baèng 0 phuï thuoäc khoâng
nhöõng vaøo giaù trò cuûa noù maø coøn phuï thuoäc
vaøo ñoä leäch chuaån cuûa noù.
xx 1; 0.4
xx 1.5; 0.7
(H1)
(H0)
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
35
KIỂM ĐỊNH GIẢ THUYÊT
VỀ SƯ SAI BIỆT
CỦA 2 GIÁ TRỊ TRUNG BÌNH
VỚI PHÂN PHỐI STUDENT
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
36
ÑAËT VAÁN ÑEÀ
Trong thöïc haønh, khi nghieân cöùu giaù
trò trung bình cuûa moät bieán thoáng
keâ ta caàn xem xeùt söï sai bieät cuûa 2
giaù trò naøy coù nghóa (khaùc 0) hay
khoâng.
7
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
37
Ví duï: Ñeå xaùc ñònh giaù trò ma saùt trong
trung bình cuûa moät taàng ñòa chaát, ngöôøi
ta tieán haønh laáy maãu vaø thí nghieäm hai
laàn khaùc nhau.
Laàn 1: n1=16 coù
1=22,3
0 vaø
1=2
0.
Laàn 2: n2=12 coù
2=24,0
0 vaø
2=1.8
0.
Haõy kieåm ñònh giaû thieát veà söï khaùc bieät
cuûa 2 giaù trò treân vôùi ñoä ruõi ro = 5%.
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
38
Giaûi:
H0: KHOÂNG COÙ söï khaùc
bieät giöõa 2 giaù trò trung bình.
H1: COÙ söï khaùc bieät giöõa 2 giaù
trò trung bình.
aXX 21
aXX 21
aXXPr0H\1HPr 21
212121 XXXXXX
21 atPr
aXXPr
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
39
Öôùc löôïng ñoä leäch chuaån cuûa taäp hôïp meï:
Ñoä leäch chuaån cuûa bieán thoáng keâ laø hieäu 2 giaù
trò trung bình, theo lyù thuyeát thoáng keâ:
68.3
2nn
s)1n(s)1n(
21
2
22
2
112
73.0
n
1
n
1
21
XX 21
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
40
Töø baûng tra phaân phoái Student vôùi df=n1+n
2-2
vaø =5%, ta xaùc ñònh ñöôïc:
Töø ñoù
Keát luaän: COÙ söï khaùc bieät giöõa 2 giaù trò
trung bình. Keát luaän treân vôùi ruõi ro 5%.
501.1a056,2a
21 XX
1Ha7.121
XX
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
41
Baøi taäp: Gioáng nhö baøi taäp treân nhöng vôùi
dung troïng trung bình:
Laàn 1: n1=20 coù
1=18.0kN/m
3 vaø
1=
1.5kN/m3
Laàn 2: n2=16 coù
2=16.5kN/m
3 vaø
2=
1.0kN/m3
Haõy kieåm ñònh giaû thieát veà söï khaùc bieät
cuûa 2 giaù trò treân vôùi ñoä ruõi ro = 5%.
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
42
KIEÅM ÑÒNH GIAÛ THUYEÁT THOÁNG KEÂ
CUÛA TOÅNG BÌNH PHÖÔNG
BIEÁN THOÁNG KEÂ
VÔÙI HAØM PHAÂN PHOÁI XAÙC SUAÁT 2
(xem baûng tra sau)
8
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
43
Đăt vấn đề: Xét một đại lương là
tổng các giá trị bình phương. Mỗi
giá trị bình phương là một biến
thống kế.
Trong một số trường hơp ta cần
kiểm định xem một đại lương này
BẰNG zero hay KHÔNG theo quan
đểm thống kê. PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
44
Haøm maät ñoä xaùc suaát 2 ñöôïc söû duïng ñeå kieåm
ñònh caùc bieán thoáng keâ coù daïng laø moät
TOÅNG BÌNH PHÖÔNG.
p
2 0
Dạng ham mật độ xac
suất 2 với bậc tự do df
e
2(%,df)
H0 2 = 0
H1 2 > 0
S= = Pr(2 > e2)
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
45
KIEÅM ÑÒNH VÔÙI 2
Ví dụ 1: Kiểm định sự phù hợp (bài toán 1D)
• Một nhà cung cấp tủ lạnh phân chia vùng kinh
doanh ra làm 4 khu vực. Người ta muốn kiểm tra
xem số tủ lạnh bán ra có bằng nhau ở 4 khu vực
này hay không?
Để kiểm tra giả thuyết này, người ta lấy một mẫu
ngẫu nhiên gồm 40 hồ sơ khách hàng đã mua ở
năm trước.
Kết quả ghi nhận từng khu vực phân bố như sau:
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
46
Khu vực Tổng
A B C D
Gia trị quan sat (f0) 6 12 14 8 40
Gia trị lý thuyết (fe)
KHÔNG co sự khac
biệt về doanh số cua
4 khu vực (H0)
10 10
(=40/4)
10 10 40
2
0 e2
i 1,4 e
f f4
f
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
47
Để đanh giá có sự khác biệt hay không, ta sẽ
so sánh với giá trị lý thuyết:
• Nếu : : kết luận có sự khác biệt ơ
các khu A, B, C, D
• Nếu : : kết luận không có sự khác
biệt ơ các khu A, B, C, D
Trong đo đươc xác định từ phân phối
có bậc tự do dl=k-m-1 và ngưỡng rui ro α
(thường là 5%).
(k=4 số khu vực khảo sát, số tham số tính từ
số liệu mẫu khảo sát)
2
022
e
2
2
e
2
2
e
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
48
Với = 5 %, và dl =k-m-1 = 3 (mảng 1D)
Ta có:
Ta thấy: , ta chấp nhận H0
Kết luận: Với mức độ rui ro là 5 %, ta có
thể nói số lương tu lạnh bán cho 4 khu
vực là như nhau.
e
2 7 81 ,
2
e
2 4
9
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
49
CHÚ Ý
Để áp dung kiểm định 2
chính xác, KINH NGHIỆM
yêu cầu SĨ SỐ cua các lớp
LỚN HƠN 4 5 QUAN
SÁT.
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
50
KIEÅM ÑÒNH VÔÙI 2 (bài toán 2D)
Ví du. Người ta muốn kiểm tra xem
có liên hệ hay không giữa chế
độ tưới nước nhằm bảo dưỡng
bê tông sau khi đổ & cường độ.
Kết quả thí nghiệm đươc trình
bày trong bảng sau. Kiểm định
giả thiết với độ tin cậy 99%.
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
51
KIEÅM ÑÒNH VÔÙI 2 (bài toán 2D)
Soá ngaøy töôùi
nöôùc sau khi ñoå
Cường độ
3-5
ngaøy
6-9
ngaøy
Toång
85-90kg/cm2 60 50 110
90-95kg/cm2
80 10 90
Toång coäng 140 60 200
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
52
KIEÅM ÑÒNH VÔÙI 2 (bài toán 2D): fe
Soá ngaøy töôùi nöôùc
sau khi ñoå
Cường độ
3-5 ngaøy 6-9
ngaøy
Toång
85-90kg/cm2 77=140*110/200 33 110
90-95kg/cm2
63 27 90
Toång coäng 140 60 200
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
53
Baäc töï do (maûng 2D): dl = (r - 1)(k -1) = (2 -1)(2 -1) = 1
Vôùi r, k soá phaân loaïi cho moãi bieán xeùt.
Vôùi = 1% vaø dl =1, tra töø baûng phaân phoái 2, ta coù:
Keát luaän: Vôùi ñoä tin caäy laø 99%, ta coù theå keát luaän
cheá ñoä baûo döôõng vaø cöôøng ñoä chòu löïc beâ toâng laø
KHOÂNG ÑOÄC LAÄP.
8.27
f
ff
i e
2
eo2
63,62
0 2
0
2 Nhaän H1
fe: l/thuyeát
f0: q/saùt
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
54
KIEÅM ÑÒNH VÔÙI 2 (bài toán 2D)
Baøi taäp. Moät cöûa haøng baùn ñóa nhaïc khaûo
saùt 200 khaùch haøng moät caùch ngaãu
nhieân ñeå ñaùnh giaù xem coù söï lieân quan
hay khoâng giöõa tuoåi taùc & giôùi tính ñoái
vôùi ngöôøi ñi mua nhaïc vôùi ñoä tin caäy
95%.
Soá lieäu quan saùt (f0) ñược ghi nhận nhö
sau:
10
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
55
KIEÅM ÑÒNH VÔÙI 2 (bài toán 2D)
Tuoåi Nam Nöõ Toång
< 30 tuoåi 40 70 110
30 30 60 90
Toång coäng 70 130 200
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
56
Bai tập: Trương phong tổ chức một Công ty
muốn biết xem co sự quan hệ hay không giữa
những người “găn bo” với Công ty va hoan
cảnh gia đình (số lương con phải nuôi). Hồ sơ
lưu cua Công ty cho cac kết quả sau:
Hay kiểm định giả thiết với rũi ro =5%
Thời gian \Số con nuôi >=3 <3
<= 5 năm 40 70
> 5 năm 65 25
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
57
Baøi taäp. Moät thaêm doø veà thu nhaäp haøng thaùng ñöôïc
thöïc hieän treân 3 loaïi ñoái töôïng khaùc. Kieåm tra
xem coù söï khaùc bieät löông trong caùc lónh vöïc:
Löông CN. May CN. XD. N. daân Toång
25 - 30 10 13 8 31
30 - 35 17 17 8 42
35 - 40 26 16 10 52
40 - 45 24 7 13 44
45 - 50 18 6 5 29
Toång 95 59 44 198
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
58
Bài tập: Ngöôøi ta muoán bieát caùc taàng lôùp xaõ hoäi khaùc
nhau (A,B,C) nghieân cöùu khaùc nhau naøy coù aûnh
höôûng ñeán thu nhaäp cuûa hoï hay khoâng.
Q/Saùt L/T
Tuoåi A B C A B C
25 - 30 10 13 8 31 14,9 9,2 6,9
30 - 35 17 17 8 42 20,2 12,5 9,3
35 - 40 26 16 10 52 24,9 15,5 11,6
40 - 45 24 7 13 44 21,1 13,1 9,8
45 - 50 18 6 5 29 13,9 8,7 6,4
Toång 95 59 44 198 95 59 44
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
59
Töø ñoù:
Baäc töï do = (k -1)(n - 1) vaø = 5%. Ta coù:
H0 chaáp nhaän
Keát luaän: Vôùi ñoä ruõi ro =5%, ta coù theå noùi laø
löông nhaän ñöôïc cuûa caùc ñoái töôïng nghieân
cöùu thì ñoäc laäp vôùi 3 loaïi ngaønh ngheà ôû treân.
e
2
eo2
f
ff =12,4
5,154,12 2
e
2
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
60
KIỂM ĐỊNH THỐNG KÊ
DÙNG TRONG
XÁC ĐỊNH
QUY LUẬT
PHÂN PHỐI
XÁC SUẤT
11
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
61
KIEÅM ÑÒNH VÔÙI PHAÂN PHOÁI 2
Baøi taäp. Ngöôøi ta giaû thieát soá söï coá xaûy ra cho
caùc thieát bò hoaït ñoäng trong moät nhaø maùy
tuaân theo phaân phoái Poisson. Baûng soá lieäu
sau ghi ñöôïc soá laàn söï coá xaûy ra trong thôøi
gian 40 chu kyø quan saùt ngaãu nhieân, moãi chu
kyø quan saùt daøi 1 giôø.
a. Xaùc ñònh soá söï coá trung bình ( thoâng soá
trong phaân phoái Poisson). Giaù trò naøy seõ
ñöôïc duøng ñeå kieåm ñònh giaû thieát laø soá löôïng
söï coá thì phaân boá theo moät phaân phoái
Poisson.
PGS. Dr. Nguyễn Thống
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
62
b. Xaùc ñònh soá löôïng söï coá lyù thuyeát töø phaân
phoái Poisson noùi ôû caâu (a) cho maãu khaûo saùt
goàm 40 chu kyø naøy .
c. Kieåm ñònh giaû thieát laø soá löôïng söï coá xaûy ra
tuaân theo phaân phoái Poisson vôùi ñoä ruõi ro
=5%.
(Xem baûng tra phaân phoái Poisson ôû sau)
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
63
Soá lieäu quan saùt thöïc
Giaù trò
bieán (x) Soá laàn
quan
saùt (f0)
f0 .x Giaù trò
bieán
(x)
Soá laàn
quan
saùt (f0)
f0 .x
0 0 0 4 7 28
1 6 6 5 4 20
2 8 16 6 3 18
3 11 33 7 1 7
Toång 40 128
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
64
GIAÛI:
a. Öôùc löôïng giaù trò trung bình cuûa söï coá töø soá
lieäu:
Giaù trò trung bình cuûa p/phoái Poisson seõ laø: =
3,2
b. Soá laàn söï coá lyù thuyeát ñöôïc tính töø baûng tra
phaân phoái Poisson vôùi = 3,2 vaø n = 40 cho ta:
)h/co_su(2,340
128xx
ff
0
0
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
65
Ta coù:
(x) (p) (fe =
np) (x) (p) (fe =
np)
0 0,0400 1,6 7 0,027 1,1
1 0,1300 5,2 8 0,011 0,4
2 0,208 8,3 9 0,004 0,2
3 0,222 8,9 10 0,0013 0,1
4 0,178 7,1 11 0,0004 0
5 0,114 4,6 12 0,0001 0
6 0,060 2,4 13 0,000 0
Toång 1,000 39,9
Tra töø p/p Poisson vôùi =3.2
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
66
Giaù trò bieán Số lần quan
sát f0
Số lần theo lý
thuyết fe
(f0-fe)2/fe
0 0 1,6 0,094
1 6 (0+6=6) 5,2
2 8 8,3 0,011
3 11 8,9 0,496
4 7 7,1 0,001
5 4 4,6
6 3 2,4
7 1 1,1 0,073
8 0 0,4
9 0 0,2
10 0 0,1
(4+3+1=8)
(6.8)
(8.8)
12
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
67
Chuù yù: Neáu soá löôïng quan saùt nhoû hôn 5, ta seõ tieán
haønh goäp laïi tröôùc khi tính 2 .
Ta coù:
Baäc töï do dl = k - m -1 = 5 -1 -1 = 3 (m = 1 vì ta ñaõ duøng
soá lieäu quan saùt ñeå öôùc tính giaù trò trung bình ) vaø
vôùi = 5%, tra töø baûng tra phaân phoái ta coù:
Do ñoù: ta chaáp nhaän H0.
Keát luaän: Vôùi ñoä ruûi ro = 5%, soá löôïng söï coá trong 1h, xaûy ra
trong nhaø maùy laø tuaân theo p/phoái Poisson coù =3,2.
675,02
0
e
27 81 ,
22
0e
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
68
KIEÅM ÑÒNH VÔÙI PHAÂN PHOÁI 2
Baøi taäp. Ngöôøi ta giaû thieát soá söï coá xaûy ra
cho caùc maùy tính trong moät Coâng ty
tuaân theo phaân phoái Poisson. Baûng soá
lieäu sau ghi ñöôïc soá laàn söï coá xaûy ra
trong thôøi gian 100 chu kyø quan saùt
ngaãu nhieân, moãi chu kyø quan saùt daøi 1
giôø.
Kieåm ñònh vôùi ñoä tin caäy 95%.
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
69
Soá lieäu quan saùt thöïc
Giaù trò
bieán (x) Soá laàn quan
saùt (f0) Giaù trò
bieán (x)
Soá laàn quan
saùt (f0)
0 2 4 15
1 15 5 9
2 24 6 3
3 30 7 2
Toång 100
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
70
Baøi taäp. Baûng soá lieäu sau ñaây ghi laïi soá tai naïn
trung bình X tính treân 1000 ngöôøi ñaøn oâng
treân moät giôø. Soá lieäu naøy laáy töø moät maãu
goàm 50 Xí nghieäp treân cuøng moät ngaønh.
Töø soá lieäu tính ñöôïc giaù trò trung bình Xtb
= 2,32
vaø độ lệch chuẩn của tập hợp mẹ ước lượng
từ mẫu là s = 0,42.
Kieåm ñònh giaû thieát laø phaân phoái naøy tuaân theo
moät phaân phoái chuaån vôùi ñoä ruõi ro =5%.
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
71
YÙ nghóa ñoà thò:
Số sự cố (X)
Số lương quan sat (fo)
Xtb
Phân phối
chuẩn (Xtb, s) ??
0 x1 x2
s=Pr(x1<x<x2)
=Pr(x<x2)-
Pr(x<x1)
s
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
72
Soá lieäu quan saùt ñöôïc:
Soá tai naïn trung bình X
(nghìn ngöôøi/giôø) Soá Xí nghieäp ñöôïc quan saùt
ñöôïc
1,45 - 1,7 3
1,8 - 2,0 12
2,1 - 2,3 14
2,4 - 2,6 9
2,7 - 2,9 7
3,0 - 3,25 5
50
13
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
73
ÔÛ ñaây ta coù hai thoâng soá laø vaø s tính töø maãu
khaûo saùt, do ñoù baäc töï do seõ laø:
dl = k - m -1 = 4 -2 -1 = 1
Vôùi dl = 1 vaø d = 5%, tra töø phaân phoái 2 ta coù:
Tính giaù trò .
Xaùc ñònh soá Xí nghieäp lyù thuyeát töø 50 Xí nghieäp.
x
`
e
23 84 ,
0
2
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
74
Soá tai naïn
TB/nghìn
ngöôøi/giôø, X
Giaù trò bieán
chuaån
töông öùng, t
Xaùc suaát
cho töøng
khoaûng(p)
Soá Xí
nghieäp lyù
thuyeát
(*) (**) (***) (50p)
1,45 1,75 -2,07 -1,36 0,085 4,5
1,75 2,05 -1,36 -0,64 0,17 8,5
2,05 2,35 -0,64 0,07 0,27 13,5
2,35 2,65 0,07 0,79 0,26 13,0
2,65 2,95 0,79 1,50 0,15 7,0
2,95 3,25 1,50 2,24 0,065 3,5
1,0 50.0
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
75
(*) giaù trò bieân laáy chính laø giaù trò trung bình caùc bieân
ôû soá lieäu ban ñaàu.
(**) vôùi , s = 0,42 vaø x=1.45 ta coù t=-2.07:
(***) Tra töø baûng phaân phoái chuaån.
Ta coù:
Ta thaáy: : giaû thieát H0 ñöôïc chaáp nhaän.
Keát luaän: Vôùi ñoä ruõi ro =5%, soá löôïng tai naïn trong
caùc Xí nghieäp quan traéc (döïa vaøo soá tai naïn trung
bình xaûy ra) tuaân theo quy luaät phaân phoái chuaån coù
giaù trò TB laø 2,32 vaø ñoä leäch chuaån s = 0,42.
x 2 32,
s
x
45.107.2
0
21 65 ,
0
2 2
e
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
76
Bài tập: Để đanh giá chất lương đề
thi cua một môn học người ta
muốn kiểm định xem điểm kết
quả thi cua thí sinh có tuân theo
một phân phối chuẩn?. Hãy kiểm
định với độ tin cậy 95%. Số liệu
xem sau (giá trị TB & độ lệch
chuẩn ước lương từ mẫu).
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
77
Số liệu: Điểm X Số lương ghi nhận
X <=2 10
2< . <=3 15
3< . <=4 30
4< . <=5 55
5< . <=6 84
6< . <=7 50
7< . <=8
. > 8
20
6
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
78
KIEÅM ÑÒNH THOÁNG KEÂ
CUÛA GIAÙ TRÒ LAØ TỶ SỐ 2 TOÅNG BÌNH
PHÖÔNG BIEÁN THOÁNG KEÂ
VÔÙI HAØM PHAÂN PHOÁI XAÙC SUAÁT FISHER
(xem baûng tra sau)
14
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
79
ĐÂY LÀ KIỂM ĐỊNH XEM XÉT GIÁ TRỊ BIÊN F LÀ TỶ SỐ GIỮA 2 ĐẠI LƯỢNG THỐNG KÊ:
BẬC TƯ DO CỦA A & B
MỖI ĐẠI LƯỢNG THỐNG KÊ LÀ TỔNG CỦA CÁC BÌNH PHƯƠNG CỦA CÁC GIÁ TRỊ THỐNG KÊ.
j
2
2
j
i
1
2
i
21)(B
)(A
),(F
21,
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
80
XEM XÉT ĐẠI LƯỢNG F NÀY LÀ KHÁC 0 HAY
BẰNG 0 THEO QUAN ĐIỂM THỐNG KÊ ?
TRÌNH TƯ GIẢI QUYÊT VẦN ĐỀ GIỐNG NHƯ
BÀI TOÁN VỚI CỦA PHÂN PHỐI 2
VỚI TRA BẢNG PHÂN PHỐI FISHER
F0:
NÊU F > F0 ĐẠI LƯỢNG F KHÁC 0 THEO
QUAN ĐIỂM THỐNG KÊ
NÊU F < F0 ĐẠI LƯỢNG X BẰNG 0 THEO
QUAN ĐIỂM THỐNG KÊ
21,
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
81
Kieåm ñònh giaù trò F khaùc 0 vôùi
phaân phoái Fisher
0
p
H0
(đại lượng kiểm tra=0)
H1 (đại lượng kiểm tra khác 0)
F0(1; 2)
=Pr(Fi>F
0)
F
Ham mật độ xac suất
p cua Fisher(1; 2)
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
82
Bài tập: Một đại lương thống kê F=4.2, đươc
xác định từ tỷ số cua 2 tổng các giá trị
thống kê dạng bình phương A & B
(F=A2 / B2). Biết rằng A có bậc tự do là
5 và B có bậc tự do là 12.
Với mức rũi ro 5%, hãy kiểm định giá trị F
khác 0 hay bằng 0 theo quan điểm thống
kê.
HD: Tra bảng F0=3.11 < F=4.2 H1 chọn
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
83
Bài tập: Xét đại lương thống kê F là tỷ số
cua hai đại lương thống kê với mỗi đại
lương là tổng các giá trị bình phương:
A=50 với bậc tự do là 5 và B có giá trị là
20 với bậc tự do là 8.
Với mức rũi ro 5%, hãy kiểm định giá trị F
so với 0 theo quan điểm thống kê.
HD: Tra bảng F0=3.69 > F=50/20=2.5 H0 chọn
F=0 theo quan điểm thống kê !
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
84
TÓM TẮT VỀ
KIỂM ĐỊNH
GIẢ THIÊT
THỐNG KÊ
15
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
85
CHUÙ YÙ
Kieåm ñònh giaù trò trung bình cuûa ñaïi löôïng
thoáng keâ khaùc 0 duøng kieåm ñònh vôùi phaân
phoái Chuaån (hoaëc phaân phoái Student). T test.
Kieåm ñònh giaù trò toång caùc bình phöông cuûa
ñaïi löôïng thoáng keâ khaùc 0 duøng kieåm ñònh
vôùi 2.
Kieåm ñònh giaù trò laø tyû soá cuûa 2 ñaïi löôïng laø
toång caùc bình phöông cuûa ñaïi löôïng thoáng keâ
khaùc 0 duøng kieåm ñònh vôùi phaân phoái
Fisher. F test PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
86
Phân phối Chuẩn
t
α=Pr(X>t)
0
p Hàm mật độ xác suất p
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
87
t 0 1 2 3 4 5 6 7 8 9
0 5000 4960 4920 4880 4840 4801 4761 4721 4681 4641
0.1 4602 4562 4522 4483 4443 4404 4364 4325 4686 4247
0.2 4207 4168 4129 4090 4052 4013 3974 3936 3897 3859
0.3 3821 3873 3745 3707 3669 3632 3594 3557 3520 3483
0.4 3446 3409 3372 3336 3300 3264 3228 3192 3156 3121
0.5 3085 3050 3015 2981 2946 2912 2877 2843 2810 2776
0.6 2743 2709 2676 2643 2611 2578 2546 2514 2483 2451
0.7 2420 2389 2358 2327 2296 2266 2236 2206 2217 2148
0.8 2119 2090 2061 2033 2005 1977 1949 1922 1894 1867
0.9 1841 1814 1788 1762 1736 1711 1685 1660 1635 1611
1 1587 1562 1539 1515 1492 1469 1446 1423 1401 1379
1.1 1357 1335 1314 1292 1271 1251 1230 1210 1190 1170
1.2 1151 1131 1112 1093 1075 1056 1038 1020 1003 985
1.3 968 951 934 918 901 885 869 853 838 823
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
88
1.4 808 793 778 764 749 735 721 708 694 681
1.5 668 655 643 630 618 606 594 582 571 559
1.6 548 537 526 516 505 495 485 475 465 455
1.7 446 436 427 418 409 401 392 384 375 367
1.8 359 351 344 366 329 322 314 307 301 294
1.9 287 281 274 268 262 256 250 244 239 233
2 228 222 217 212 207 202 197 192 188 183
2.1 179 174 170 166 162 158 154 150 146 143
2.2 139 136 132 129 125 122 119 116 113 110
2.3 107 104 102 99 96 94 91 89 87 84
2.4 82 80 78 75 73 71 69 68 66 64
2.5 62 60 59 57 55 54 52 51 49 48
2.6 47 45 44 43 41 40 39 38 37 36
2.7 35 34 33 32 31 30 29 28 27 26
2.8 26 25 24 23 23 22 21 20 20 19
2.9 19 18 18 17 16 16 15 15 14 14
3 13 13 13 12 12 11 11 10 11 10
t 0 1 2 3 4 5 6 7 8 9
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
89
PHAÂN PHOÁI
LUAÄT STUDENT
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
90
Phân phối Student
t 0
p Hàm mật độ xác suất p
-t
Pr( X t)
16
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
91
dl (df) 80 60 40 20 10 5 2 1
1 ,325 ,727 1,376 3,078 3,314 12,706 31,821 63,657
2 ,289 ,617 1,061 1,886 2,920 4,303 6,965 9,925
3 ,277 ,584 ,978 1,638 2,353 3,182 4,541 5,841
4 ,271 ,569 ,941 1,533 2,132 2,776 3,747 4,604
5 ,267 ,559 ,920 1,476 2,015 2,571 3,365 4,032
6 ,265 ,553 ,906 1,440 1,943 2,447 3,143 3,707
7 ,263 ,549 ,896 1,415 1,895 2,365 2,998 3,499
8 ,262 ,546 ,889 1,397 1,860 2,306 2,896 3,355
9 ,261 ,543 ,883 1,383 1,833 2,262 2,821 3,250
10 ,260 ,542 ,879 1,372 1,812 2,228 2,764 3,169
11 ,260 ,540 ,876 1,363 1,796 2,201 2,718 3,106
12 ,259 ,539 ,873 1,356 1,782 2,179 2,681 3,055
13 ,259 ,538 ,870 1,350 1,771 2,160 2,650 3,012
14 ,258 ,537 ,868 1,345 1,761 2,145 2,624 2,977
15 ,258 ,536 ,866 1,341 1,753 2,131 2,602 2,947
16 ,258 ,535 ,865 1,337 1,746 2,120 2,583 2,921
17 ,257 ,534 ,863 1,333 1,740 2,110 2,567 2,898
Baäc töï do
t
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
92
16 ,258 ,535 ,865 1,337 1,746 2,120 2,583 2,921
17 ,257 ,534 ,863 1,333 1,740 2,110 2,567 2,898
18 ,257 ,534 ,862 1,330 1,734 2,101 2,552 2,878
19 ,257 ,533 ,861 1,328 1,729 2,093 2,539 2,861
20 ,257 ,533 ,860 1,325 1,725 2,086 2,528 2,845
21 ,257 ,532 ,859 1,323 1,721 2,080 2,518 2,831
22 ,256 ,532 ,858 1,321 1,717 2,074 2,508 2,819
23 ,256 ,532 ,858 1,319 1,714 2,069 2,500 2,807
24 ,256 ,531 ,857 1,318 1,711 2,064 2,492 2,797
25 ,256 ,531 ,856 1,316 1,708 2,060 2,485 2,787
26 ,256 ,531 ,856 1,315 1,706 2,056 2,479 2,779
27 ,256 ,531 ,855 1,314 1,703 2,052 2,473 2,771
28 ,256 ,530 ,855 1,313 1,701 2,048 2,467 2,763
29 ,256 ,530 ,854 1,311 1,699 2,045 2,462 2,756
30 ,256 ,530 ,854 1,310 1,697 2,042 2,457 2,750
40 ,255 ,529 ,851 1,303 1,684 2,021 2,423 2,704
60 ,254 ,527 ,848 1,296 1,671 2,000 2,390 2,660
120 ,254 ,526 ,845 1,289 1,658 1,980 2,358 2,617
,253 ,524 ,842 1,282 1,645 1,960 2,326 2,576
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
93
PHAÂN PHOÁI
LUAÄT 2
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
94
• Phân phối 2
2
0Pr(X )
2
00
p
H0
(đại lượng kiểm tra=0)
H1 (đại lượng kiểm tra khác 0)
x
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
95
df (α%)
99.5 99 97.5 95 90 10 5 2.5 1 0.5
1 0 0.0002 0.001 0.0039 0.0158 2.71 3.84 5.02 6.63 7.88
2 0.01 0.0201 0.0506 0.1026 0.2107 4.61 5.99 7.38 9.21 10.6
3 0.0717 0.115 0.216 0.352 0.584 6.25 7.81 9.35 11.34 12.84
4 0.207 0.297 0.484 0.711 1.064 7.78 9.49 11.14 13.28 14.86
5 0.412 0.554 0.831 1.15 1.61 9.24 11.07 12.83 15.09 16.75
6 0.676 0.872 1.24 1.64 2.2 10.64 12.59 14.45 16.81 18.55
7 0.989 1.24 1.69 2.17 2.83 12.02 14.07 16.01 18.48 20.28
8 1.34 1.65 2.18 2.73 3.49 13.36 15.51 17.53 20.09 21.96
9 1.73 2.09 2.7 3.33 4.17 14.68 16.92 19.02 21.67 23.59
10 2.16 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21 25.19
11 2.6 3.05 3.82 4.57 5.58 17.28 19.68 21.92 24.73 26.76
12 3.07 3.57 4.4 5.23 6.3 18.55 21.03 23.34 26.22 28.3
13 3.57 4.11 5.01 5.89 7.04 19.81 22.36 24.74 27.69 29.82
2
0
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
96
df (α%)
99.5 99 97.5 95 90 10 5 2.5 1 0.5
14 4.07 4.66 5.63 6.57 7.79 21.06 23.68 26.12 29.14 31.32
15 4.6 5.23 6.26 7.26 8.55 22.31 25 27.49 30.58 32.8
16 5.14 5.81 6.91 7.96 9.31 23.54 26.3 28.85 32 34.27
18 6.26 7.01 8.23 9.39 10.86 25.99 28.87 31.53 34.81 37.16
20 7.43 8.26 9.59 10.85 12.44 28.41 31.41 34.17 37.57 40
24 9.89 10.86 12.4 13.85 15.66 33.2 36.42 39.36 42.98 45.56
30 13.79 14.95 16.79 18.49 20.6 40.26 43.77 47.98 50.89 53.67
40 20.71 22.16 24.43 26.51 29.05 51.81 55.76 59.34 63.69 66.77
60 35.53 37.48 40.48 43.19 46.46 74.4 79.08 83.3 88.38 91.95
120 83.85 86.92 91.58 95.7 100.6 140.2 146.5 152.2 158.9 163.6
17
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
97
PHAÂN PHOÁI
LUAÄT POISSON
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
98
DAÏNG TOÅNG QUAÙT PHAÂN PHOÁI POISSON
(Bieán rôøi raïc)
p
X 0 1 2 3 4 5 6 .
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
99
• Luật Poisson
Có k và , tính xac suất
Pr!
k
X k ek
0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45
k
0 0,951 0,9048 0,8607 0,8187 0,7788 0,7408 0,7047 0,670 0,6376
1 0,047 0,0905 0,1291 0,1637 0,1947 0,2222 0,2466 0,268 0,2869
2 0,001 0,0045 0,0097 0,0164 0,0243 0,0333 0,0432 0,0536 0,0646
3 0,000 0,0002 0,0005 0,0011 0,0020 0,0033 0,0050 0,007 0,0097
4 0,0000 0,0000 0,0001 0,0001 0,0003 0,0004 0,0007 0,0011
5 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
100
0,5 0,55 0,6 0,65 0,7 0,75 0,8 0,85 0,9
k
0 0,6065 0,5769 0,5488 0,5220 0,4966 0,4724 0,4493 0,4274 0,4066
1 0,3033 0,3173 0,3293 0,3393 0,3476 0,3543 0,3595 0,3633 0,3659
2 0,0758 0,0873 0,0988 0,1103 0,1217 0,1329 0,1438 0,1544 0,1647
3 0,0126 0,0160 0,0198 0,0239 0,0284 0,0332 0,0383 0,0437 0,0494
4 0,0016 0,0022 0,0030 0,0039 0,0050 0,0062 0,0077 0,0093 0,0111
5 0,0002 0,0002 0,0004 0,0005 0,0007 0,0009 0,0012 0,0016 0,0020
6 0,0000 0,0000 0,0000 0,0001 0,0001 0,0001 0,0002 0,0002 0,0003
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
101
1 1,5 2 2,5 3 3,5 4 4,5 5
k
0 0,3679 0,2231 0,1353 0,0821 0,0498 0,0302 0,0183 0,0111 0,0067
1 0,3679 0,3347 0,2707 0,2052 0,1494 0,1057 0,0733 0,0500 0,0337
2 0,1839 0,2510 0,2707 0,2565 0,2240 0,1850 0,1465 0,1125 0,0842
3 0,0613 0,1255 0,1804 0,2138 0,2240 0,2158 0,1954 0,1687 0,1404
4 0,0153 0,0471 0,0902 0,1336 0,1680 0,1888 0,1954 0,1898 0,1755
5 0,0031 0,0141 0,0361 0,0668 0,1008 0,1322 0,1563 0,1708 0,1755
6 0,0005 0,0035 0,0120 0,0278 0,0504 0,0771 0,1042 0,1281 0,1462
7 0,0001 0,0008 0,0034 0,0099 0,0216 0,0385 0,0595 0,0824 0,1044
8 0,0000 0,0001 0,0009 0,0031 0,0081 0,0169 0,0298 0,0463 0,0653
9 0,0000 0,0002 0,0009 0,0027 0,0066 0,0132 0,0232 0,0363
10 0,0000 0,0002 0,0008 0,0023 0,0053 0,0104 0,0181
11 0,0000 0,0002 0,0007 0,0019 0,0043 0,0082
12 0,0001 0,0002 0,0006 0,0016 0,0034
13 0,0000 0,0001 0,0002 0,0006 0,0013
14 0,0000 0,0001 0,0002 0,0005
15 0,0000 0,0001 0,0002 PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
102
PHAÂN PHOÁI
LUAÄT FISHER
18
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
103
0
p
F0(1; 2)
=5%
F
Ham mật độ xac suất
p cua Fisher(1; 2)
Xem bảng sau PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
104
Gia trị F0 Fisher với α=5%
2\ν1 1 2 3 4 5 6 7 8 9
1 161 200 216 225 230 234 237 239 241
2 18.5 19 19.2 19.2 19.3 19.3 19.4 19.4 19.4
3 10.1 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.1
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68
8 5.32 4.46 4.07 3.84 3.69 3.58 3.5 3.44 3.39
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18
10 4.96 4.1 3.71 3.48 3.33 3.22 3.14 3.07 3.02
11 4.84 3.98 3.59 3.36 3.2 3.09 3.01 2.95 2.9
12 4.75 3.89 3.49 3.26 3.11 3.0 2.91 2.85 2.8
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71
14 4.6 3.74 3.34 3.11 2.96 2.85 2.76 2.7 2.65
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
105 Fisher với α=5%
15 4.54 3.68 3.29 3.06 2.9 2.79 2.71 2.64 2.59
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54
17 4.45 3.59 3.2 2.96 2.81 2.7 2.61 2.55 2.48
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46
19 4.38 3.52 3.13 2.9 2.74 2.63 2.54 2.48 2.42
20 4.35 3.49 3.1 2.87 2.71 2.6 2.51 2.45 2.39
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37
22 4.3 3.44 3.05 2.82 2.66 2.55 2.46 2.4 2.34
23 4.28 3.42 3.03 2.8 2.64 2.53 2.44 2.37 2.32
24 4.26 3.4 3.01 2.78 2.62 2.51 2.42 2.36 2.3
25 4.24 3.39 2.99 2.76 2.6 2.49 2.4 2.34 2.28
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12
60 4 3.15 2.76 2.53 2.37 2.25 2.17 2.1 2.04
120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96
3.84 3 2.6 2.37 2.21 2.1 2.01 1.94 1.88
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
106
10 12 15 20 24 30 40 60 120
242 244 246 248 249 250 251 252 253 254
19.4 19.4 19.4 19.5 19.5 19.5 19.5 19.5 19.5 19.5
8.79 8.74 8.7 8.66 8.64 8.62 8.59 8.57 8.55 8.53
5.96 5.91 5.86 5.8 5.77 5.75 5.72 5.69 5.66 5.63
4.74 4.68 4.62 4.56 4.53 4.5 4.46 4.43 4.4 4.37
4.06 4 3.94 3.87 3.84 3.81 3.77 3.74 3.7 3.67
3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.3 3.27 3.23
3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93
3.14 3.07 3.01 2.94 2.9 2.86 2.83 2.79 2.75 2.71
2.98 2.91 2.85 2.77 2.74 2.7 2.66 2.62 2.58 2.54
2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.4
2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.3
2.67 2.6 2.53 2.46 2.42 2.38 2.34 2.3 2.25 2.21
2.6 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13
2.54 2.48 2.4 2.33 2.29 2.25 2.2 2.16 2.11 2.07
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
107
2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01
2.45 2.38 2.31 2.23 2.19 2.15 2.1 2.06 2.01 1.96
2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92
2.39 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88
2.35 2.28 2.2 2.12 2.08 2.04 1.99 1.95 1.9 1.84
2.32 2.25 2.18 2.1 2.05 2.01 1.96 1.92 1.87 1.81
2.3 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78
2.27 2.2 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76
2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73
2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71
2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62
2.08 2 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51
1.99 1.92 1.84 1.75 1.7 1.65 1.59 1.53 1.47 1.39
1.91 1.83 1.75 1.66 1.61 1.55 1.5 1.43 1.35 1.25
1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1
PGS. TS. Nguyễn Thống
PHÂN TÍCH DỮ LIỆU
Chương 3: Kiểm định giả thuyết thống kê
108
HEÁT CHÖÔNG