chƯƠng 4: lý thuyẾt mẪu - · pdf filethông tin đầu tiên và...
TRANSCRIPT
CHƯƠNG 4: LÝ THUYẾT MẪU
Thông tin đầu tiên và nhiều khi cũng là thông tin duy nhất mà chúng ta dựa vào để nghiên cứu, phân tích chính là các kết quả mà chúng ta quan sát được, vì vậy các kết quả này phải đảm bảo tính chính xác, tính ngẫu nhiên của nó, phải là các đại diện một cách trung thực cho hiện tượng hoặc cho đại lượng mà chúng ta đang nghiên cứu.
Xuất phát từ thông tin sai lệch thì các kết luận nhận được sẽ phản ánh không đúng hiện tượng nghiên cứu, thậm chí còn làm cho ta nghi ngờ ngay cả tính hiệu quả của phương pháp ta sử dụng. Do vậy trước tiên ta quan tâm đến việc thu thập thông tin ban đầu.
BÀI 4.1: CÁC PHƯƠNG PHÁP LẤY MẪU ĐƠN GIẢN
Các quan sát độc lập hay các phép thử độc lập: Các quan sát được tiến hành một cách độc lập với nhau, kết quả của quan sát ( phép thử ) này không phụ thuộc vào kết quả quan sát ( phép thử ) khác và cũng không ảnh hưởng đến khả năng xảy ra kết quả quan sát ( phép thử ) khác
Các phép thử lặp: Các phép thử được tiến hành trong các điều kiện hoàn toàn như nhau.
Lấy mẫu ngẫu nhiên có hoàn lại: rút ngẫu nhiên từmột tập nào đó ra một phần tử. Ghi lại các số đặc trưng cần thiết từ phần tử đó, sau đó trả nó trở lại tập ban đầu trước khi rút tiếp ngẫu nhiên lần sau.
Lấy mẫu ngẫu nhiên không hoàn lại: tương tự nhưtrên, chỉ khác ở chỗ các phần tử được rút ra sẽ không được trả lại tập ban đầu.
BÀI 4.1: CÁC PHƯƠNG PHÁP LẤY MẪU ĐƠN GIẢN
BÀI 4.1: CÁC PHƯƠNG PHÁP LẤY MẪU ĐƠN GIẢN
Phương pháp thu thập thông tin
Trực tiếp Gián tiếp
Qua xử sự bằng lời Qua hành vi Qua văn bản
Phương pháp phỏng vấn
Phương pháp nghiên cứu
Phương pháp phân tích tư liệu
Tiến hành n quan sát độc lập về biến ngẫu nhiên X nào đó ta gọi là việc quan
sát thứ i về biến ngẫu nhiên. Khi đó ( ) được gọi là mẫu ngẫu nhiên, n được gọi là cỡ mẫu hay số lần quan sát. Nhưvậy mẫu ngẫu nhiên cỡ n thực chất là n biến ngẫu nhiên độc lập, cùng phân phối như biến ngẫu nhiên X.
Ta gọi là kết quả quan sát được ở lần thứ i. Khi đó ( ) là n giá trị cụ thể ta quan sát được. Đó là một giá trị cụ thể mà ngẫu nhiên ( ) nhận.
Từ nay về sau, khi nói rằng ta có một mẫu ngẫu nhiên cỡ n được rút ra từ biến ngẫu nhiên X, ta sẽ hiểu đó là n biến ngẫu nhiên độc lập cùng phân phối nếu ta không quan tâm đến kết quảcụ thể quan sát được mà ta muốn nghiên cứu các tính chất chung của mẫu, của các đặc trưng mẫu, còn ta sẽ hiểu đó là n giá trị cụthể quan sát được nếu ta quan tâm đến kết quả cụ thể và ta cần những tính toán cụ thể.
Như vậy chúng ta có trong tay một mẫu ngẫu nhiên, dựa trên đó ta sẽ dùng các phương pháp và kết quả của thống kê đểphân tích và rút ra những kết luận cần thiết.
BÀI4. 2: MẪU NGẪU NHIÊN
nXXX ,...,, 21
nXXX ,...,, 21
nXXX ,...,, 21
Xuất phát từ các mẫu cụ thể khác nhau ta nhận được các
hàm phân phối thực nghiệm khác nhau. Đồ thị của
chúng đều là các đường bậc thang. Các đường bậc thang
khác nhau đều có chung một tính chất là: khi cỡ mẫu
tăng vô hạn các hàm phân phối thực nghiệm tiến đến
hàm phân phối lý thuyết cần tìm. Điều đó được thể hiện
qua định lý sau:
Định lý Glivencô: giả sử là hàm phân phối của biến ngẫu
nhiên X mà ta đang cần tìm. là hàm phân phối thực
nghiệm nhận được từ mẫu ngẫu nhiên cỡ n. Khi đó
P{ khi n }= 1
BÀI 4.3: PHÂN PHỐI THỰC NGHIỆM
0n )()(Fsup
xFxx
BÀI 4.4 ĐA GIÁC TẦN SUẤT VÀ TỔ CHỨC ĐỒ
0
0.05
0.1
0.15
0.2
0.25
300 550 850 1150 1450
BÀI 4.4 ĐA GIÁC TẦN SUẤT VÀ TỔ CHỨC ĐỒ
12
45
8
10
1817
12
9
76
01
Tổ chức đồ thực nghiệm
BÀI 4.4 ĐA GIÁC TẦN SUẤT VÀ TỔ CHỨC ĐỒ
khoảng
glucoza
số người khoảng số người
(65-70)
(70-75)
(75-80)
(80-85)
(85-90)
(90-95)
(95-100)
1
0
2
5
8
16
18
(100-105)
(105-110)
(110-115)
(115-120)
(120-125)
(125-130)
17
16
9
5
2
1
BÀI 4.4 ĐA GIÁC TẦN SUẤT VÀ TỔ CHỨC ĐỒ
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
DXE 2X;
n
XXp i
1'
Kỳ vọng mẫu:
Do X1,X2,…,Xn là các biến ngẫu nhiên độc
lập cùng phân phối như X, nên kỳ vọng
mẫu là một biến ngẫu nhiên. Do đó ta lại
tìm kỳ vọng và phương sai của :
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
n
i
iXEX1n
1X
X1
Xn
1X
n
1i
i Enn
EE
nn
DXDXn
nDX
nXD
n
i
2
21
2
11
Phương sai mẫu:
Ta có:
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
2
1
2
2
2 11XX
nXX
nXDs
n
i
ii
2
1
2 1s E
n
i
i XXn
22
1
i -XX1
En
n
i
21.
1
n
n
n
DXDXXDDXn
n
Vì giá trị trung bình của s2 không đúng
bằng , do đó nhiều khi thay cho s2 ta
dùng.
Khi đó
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
2
2
2
1
2
11
1ˆ s
n
nXX
ns
n
i
i
222 1
1s E
1-n
ns E
n
n
n
n
Cách tính và
Ta lập bảng tính như sau:
Nếu các giá trị mẫu không gọn, lại cách đều
nhau thì ta có thể thu gọn số liệu bằng
phép biến đổi tuyến tính.
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
X2s
xi mi ui miui mi u2
… … … … …
n (*) (*)
h
xxu i
i0
Từ bảng tính ta tính được
Trở lại số liệu ban đầu ta có:
Trong trường hợp tính toán bằng các phương tiện thô sơ thì việc lập bảng tính và thu gọn số liệu là rất cần thiết và có lợi.
Nếu mẫu được cho dưới dạng các khoảng, ta chọn mỗi khoảng một điểm đại diện, thông thường là điểm giữa khoảng lúc đó ta lại có mẫu thu gọn
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
k
i
iun
u1
i .m1 22
.
2 .1 uumn
s iiu
uhxX .0 222 . ux shS
Khoảng
(nghìn đồng)
mi xi mi /n ui ui ×mi
2
0
15
31
65
52
57
40
20
11
2
4
0
1
300
350
450
550
650
750
850
950
1050
1150
1250
1350
1450
1550
0,006
0
0,05
0,103
0,216
0,173
0,19
0,133
0,066
0,036
0,006
0,013
0
0,003
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
-12
0
-60
-93
-130
-52
0
40
40
33
8
20
0
7
72
0
240
279
260
52
0
40
80
99
32
100
0
49∑ 300 -199 1303
2
ii um
1500
]15001400(
]14001300(
]13001200(
]12001100(
11001000
1000900
900800
800700
700600
]600500(
]500400(
]400300(
300
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
Qua bảng trên ta tính được :
780,47778,4100
784)66,0(100850
778,4)066,0(300
13031
66,0300
1991
2222
0
2
1
222
1
ux
k
i
iiu
k
i
ii
shS
uhXX
uumn
s
umn
u
Bài 4.5: CÁC ĐẶC TRƯNG MẪU