chuong 5 chon mau - wordpress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï...

61
1 CÁC PHƯƠNG PHÁP CHỌN MẪU

Upload: others

Post on 04-Jan-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

1

CÁC PHƯƠNG PHÁP CHỌN MẪU

Page 2: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Điều tra chọn mẫu

Page 3: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Một số khái niệmPhần tử (element): đơn vị cần quan sát và thu

thập dữ liệu (cá nhân, hộ gia đình, tổ chức,…).Tổng thể nghiên cứu (study population): tập hợp

các phần tử mà thực tế có thể nhận dạng và lấymẫu. Ví dụ tổng thể nghiên cứu là số hộ gia đìnhcủa một địa phương, số doanh nghiệp tại một địaphương, số sinh viên tại một trường đại học, sốngười tiêu dùng tại một vùng...

Page 4: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Điều tra chọn mẫu

Tổng thể MẫuTóm tắt các đặc trưng

Suy diễn cho các tham số của tổng thể

Page 5: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Điều tra chọn mẫuTổng thể làtoàn bộ bóngđèn mới màcông ty A sảnxuất (tuổi thọtrung bình củabóng đèn mớichưa biết)

MẫuTóm tắt các đặc trưng

Suy diễn cho các tham số của tổng thể

200 bóng đèn được chọn đểkiểm tra tuổi thọ

Tính tuổi thọ trung bình của200 bóng đèn nàyTuổi thọ trung bình của bóng

đèn mới

Page 6: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Một số khái niệmKhung mẫu (sampling frame): Danh sách cácđơn vị lấy mẫu có sẵn để phục vụ cho việc lấymẫu.

STT Hộ1 Nguyễn Văn A2 Trần Thị B3 Trần Thị B4 Lê Văn C

Page 7: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu (sampling)Là quá trình lựa chọn một bộ phận tương

đối nhỏ từ tổng thể với tích cách là đạidiện cho tổng thể cần nghiên cứu.

Dựa trên kết quả thu được từ mẫu, nhànghiên cứu sẽ suy diễn rộng ra cho tổngthể.

Page 8: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Vì sao phải chọn mẫu?Để có thông tin nhanh hơn và tiết kiệm hơn.Vd: muốn có số liệu về thu nhập của các hộ gia

đình ở Việt Nam thì nên điều tra toàn bộ hay điềutra chọn mẫu?

Trường hợp khi tiến hành điều tra làm biến dạnghay phá hủy thuộc tính của đơn vị

Vd: thử độ bền của vỏ xe sản xuất

Page 9: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Vì sao phải chọn mẫu? Trường hợp số đơn vị của hiện tượng vô hạn hoặc không

xác địnhVd: muốn có số liệu về những người bệnh cao huyết áp tại

TPHCM Khi muốn so sánh các hiện tượng với nhau mà chưa có

thông tin cụ thể hoặc khi muốn kiểm định một giả thuyếtđặt ra, người ta thường dùng điều tra chọn mẫu để thuthập dữ liệu.

Vd: kiểm tra tác dụng của một loại thuốc đối với điều trịtim mạch

Page 10: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Quá trình chọn mẫuB1: Định nghĩa tổng thể và phần tửB2: Xác định khung lấy mẫuB3: Xác định kích thước mẫuB4: Xác định phương pháp chọn mẫuB5: Tiến hành lấy mẫu theo phương pháp đã chọn

Page 11: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Các phương pháp chọn mẫu1.Chọn mẫu xác suất2.Chọn mẫu phi xác

suất11

Page 12: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu xác suấtBiết trước xác suất xuất hiện của các phần tử

vào trong mẫu.Quá trình chọn mẫu tuân theo quy luật toán,

không thể tự ý thay đổi.Các thông số của mẫu có thể dùng để ước

lượng/kiểm nghiệm các thông số của tổng thể.Nhược điểm: ?

Page 13: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Hạn chế(1) Trong nhiều trường hợp không mang tính khả

thi vì không thể có được danh sách tất cả cácđối tượng liên hệ, hoặc nhà nghiên cứu khôngđủ thời gian để tiếp cận các đối tượng khi họphân tán ở nhiều địa bàn cách xa nhau.

(2) Tốn kém nhiều thời gian và công sức

Page 14: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu phi xác suấtNhà nghiên cứu chọn các phần tử vào mẫu

không theo quy luật ngẫu nhiênKhông biết xác suất xuất hiện của các phần tử.

Chọn mẫu tùy thuộc vào nhà nghiên cứu.Ví dụ đến siêu thị phỏng vấn các bà nội trợ về

chi tiêu hàng ngày cho lương thựcNhược điểm: ?

Page 15: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Hạn chếViệc chọn mẫu phải dựa vào kỹ năng

của nhà nghiên cứu hay của nhân viênchọn mẫu.

Page 16: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Phân loạiChọn mẫu xác suất Chọn mẫu phi xác suấtNgẫu nhiên đơn giản

(simple random)Lấy mẫu thuận tiện

(convenience)Hệ thống

(systematic)Lấy mẫu phán đoán

(judgment)Phân tầng

(stratified random)Lấy mẫu theo lớp

(quota)Theo nhóm (cụm,

chùm)(cluster)

Lấy mẫu theo mầm(snow ball)

16

Page 17: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu ngẫu nhiên đơn giảnQuy trình: Cần danh sách của tất cả các

đơn vị mẫu Số lượng các đơn vị (cỡ mẫu). Chọn ngẫu nhiên các đơn vị

trong danh sáchVí dụ: Khảo sát thực trạng hiểu

biết về luật giao thông đườngbộ trong 1000 học sinh tại mộttrường phổ thông trung học,chọn mẫu ngẫu nhiên 100 họcsinh để khảo sát. 17

Page 18: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Câu hỏiTheo danh sách chọn mẫu, người thu thập

dữ liệu phải phỏng vấn sinh kế của hộ A.Nhưng hộ A đi vắng, hộ B (không cótrong danh sách mẫu) sẵn sàng cung cấpdữ liệu sinh kế của gia đình mình (hộ B) .Người thu thập dữ liệu nên chờ hộ A vềphỏng vấn hay phỏng vấn hộ B?

Page 19: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Thực hành trên Excel Cần lấy mẫu ngẫu nhiên 10 phần tử từ khung mẫu có

20 phần tử. Thực hiện 1. Tạo một danh sách số thứ tự từ 1 đến 20 (giả sử đây

là khung mẫu) 2. Tại cột mới (cột Ngẫu nhiên) dùng hàm RAND() 3. Sắp xếp theo thứ tự cột mới 4. Chọn 10 phần tử đầu tiên vào mẫu.

Page 20: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu hệ thốngChọn ngẫu nhiên một

điểm xuất phát, dựa vàobước nhảy để xác địnhcác phần tử tiếp theo

20

Page 21: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu hệ thống

Page 22: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu hệ thống

Page 23: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu phân tầng (stratified random) Tổng thể được chia ra nhiều tầng

(strata) theo nguyên tắc: “cùng tầngđồng nhất, khác tầng dị biệt”.

Để chọn phần tử trong mỗi tầng: có thểdùng p.p. hệ thống.

Số phần tử trong mỗi tầng được xácđịnh theo tỷ lệ hoặc không theo tỷ lệvới kích thước tổng thể.

Ví dụ về các tầng: Theo địa lý: bắc,trung, nam, 7 vùng kinh tế; Tôngiáo/sắc tộc; mức thu nhập; giới tính,nghề nghiệp… 23

Page 24: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu phân tầng

Page 25: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Các phương pháp chọn mẫu ngẫu nhiênc. Chọn mẫu phân tầng

Page 26: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu theo nhóm/cụm (cluster) Tổng thể được chia làm nhiều nhóm(mỗi nhóm mang tính đại diện cho tổngthể) và tuân theo nguyên tắc: “cùngnhóm dị biệt, khác nhóm đồng nhất”.

Các nhóm sẽ được chọn một cách ngẫunhiên để tạo thành mẫu

Ví dụ: Chọn mẫu điều tra cá nhân hộ giađình

Bước 1: lựa chọn ngẫu nhiên một sốhuyện.

Bước 2: các hộ gia đình được lựa chọntrong các huyện vừa được chọn.

Bước 3: Tất cả cá nhân từ hộ được chọn. 26

Page 27: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Các phương pháp chọn mẫu ngẫu nhiênd. Chọn mẫu theo nhóm

Page 28: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu theo nhóm (cluster)Ví dụ 2: Chuỗi cửa hàng thức ăn nhanh muốn

tìm hiểu món ăn nào được đặt nhiều nhất.B1: Chọn ngẫu nhiên một vài cửa hàngB2: Hỏi ý kiến tất cả khách hàng tại các cửa

hàng được chọn.

Page 29: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Ví dụMột nhà phân tích thị trường ô tô khảo sát mức độ

hài lòng của những người mới mua ô tô. Danhsách có tên của 10.000 chủ xe, trong đó 2.500người mua Ford, 2.500 người mua Honda, 2.500người mua Toyota, 2.500 người mua GM. Nhàphân tích này lấy một mẫu danh sách 400 chủxe bằng cách chọn ngẫu nhiên 100 chủ xe ở mỗinhãn hiệu. Nhà phân tích đang sử dụng phươngpháp chọn mẫu nào? Giải thích.

29

Page 30: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Câu hỏiGiống và khác giữa chọn mẫu phân

tầng và chọn mẫu theo nhóm?

Page 31: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Trả lờiGiống: Chia tổng thể thành nhiều nhóm (tầng)Khác:Phân tầng: Khi lấy mẫu thì chọn một vài quan sát

trong tầngNhóm: Khi lấy mẫu thì chọn tất cả quan sát trong

nhóm

Page 32: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Bài tập cá nhânTình huống: Có một NC cần quy mô mẫu

500 SV năm một của 5 trường đại học.Tổng số SV năm một của 5 trường là10.000 với số lượng từng trường 1, 2, 3, 4,5 là 2000, 2000, 1000, 2500, 2500. Sinhviên hãy cho biết cụ thể cách chọn mẫu500 SV theo 4 cách của phương phápchọn mẫu xác suất.

Page 33: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Số liệu giả định về số hộ gia đình nông thôn có vốn đầu tưcho sản xuất, kinh doanh phân theo vùng của địa bàn “Y”. Sv cho biết cách chọn mẫu 20 hộ.TT bản Tên

bản Số hộ Vùng(*) TT bản Tên bản Số hộ Vùng

1 A 9 1 11 N 10 22 I 10 2 12 E 13 13 D 11 3 13 P 11 34 B 11 1 14 F 11 25 K 12 1 15 G 12 16 Y 12 2 16 Q 9 37 C 9 3 17 Z 10 28 L 10 2 18 J 8 19 V 11 1 19 H 13 1

10 M 10 1 20 S 14 2Tổng số 216

(*)Ghi chú: 1: Vùng cánh đồng; 2: Vùng khe dọc; 3: vùng cao

Page 34: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu thuận tiện (convenience)Chọn phần tử dựa trên sự thuận tiện, dễ tiếp

cận, dễ lấy thông tin.Nhược điểm: Không xác định được sai số lấy

mẫu và không thể kết luận cho tổng thể từ kếtquả mẫu.

Sử dụng phổ biến khi bị giới hạn về thời gianvà chi phí.

Vd: phỏng vấn các bà nội trợ tại các siêu thị đểtìm hiểu về hành vi tiêu dùng của người nội trợ.

34

Page 35: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu phán đoán (judgment)Nhà nghiên cứu tự phán đoán sự thích hợp của

các phần tử để mời họ tham gia vào mẫu.Đặc điểm giống như chọn mẫu thuận tiện,

nhưng nếu khả năng/kinh nghiệm phán đoántốt sẽ cho mẫu tốt hơn thuận tiện.

Ví dụ muốn tìm hiểu thói quen tiêu dùng của phụnữ thành đạt, nhà nghiên cứu theo phán đoán sẽchọn những phụ nữ ăn mặc sang trọng đểphỏng vấn.

35

Page 36: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu theo lớp (quota) Dựa vào một số thuộc tính kiểm soát xác định một số

phần tử sao cho chúng đảm bảo tỷ lệ của tổng thể vàcác đặc trưng kiểm soát.

Có thể dùng 1 hoặc nhiều thuộc tính kiểm soát nhưtuổi, giới tính, thu nhập, loại hình DN…

Vd. Cần phỏng vấn 800 người có tuổi trên 18 tại 1 thànhphố. Phân tổ theo giới tính và tuổi như sau: chọn 400người (200 nam và 200 nữ) có tuổi từ 18 đến 40, chọn400 người (200 nam và 200 nữ) có tuổi từ 40 trở lên.

36

Page 37: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Chọn mẫu theo mầm (snow ball)Chọn ngẫu nhiên những người phỏng

vấn ban đầu, những người tiếp theođược chọn dựa trên sự giới thiệu củangười trước

37

Page 38: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Sai lệch liên quan đến việc chọn mẫu Sai lệch do chọn mẫu (do tính đại diện của

mẫu)Sai lệch không do chọn mẫu (xảy ra trong quá

trình phỏng vấn, hiệu chỉnh, nhập dữ liệu,..).

38

Page 39: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Bài tập Một công ty có ba nhà máy A, B, C cùng sản xuất linh

kiện điện tử với số lượng lần lượt tại các nhà máy là20%, 50% và 30%. Bộ phận quản lý chất lượng củacông ty muốn kiểm tra ngẫu nhiên chất lượng 100 linhkiện ở ba nhà máy nên yêu cầu mỗi nhà máy gửi sốlượng linh kiện như sau: A gửi 20, B gửi 50, C gửi 30.

a. Bộ phận quản lý chất lượng có phải đang lấy mẫungẫu nhiên đơn giản không?

b. Nếu không phải thì bộ phận này đang lấy mẫu theophương pháp nào?

Page 40: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Bài tập Công ty A muốn khảo sát việc sử dụng ngân hàng điện

tử của những người trong độ tuổi từ 18 trở lên. Ở gầnđịa bàn của công ty A có năm công ty khác nên A đếnphỏng vấn các nhân viên của năm công ty này.

a. Tổng thể mà A quan tâm là gì? b. Phương pháp thu thập dữ liệu như vậy là phương

pháp gì? c. Anh chị cho rằng kết quả phân tích việc sử dụng

ngân hàng điện tử của mẫu này có phản ánh đúng tổngthể không?

Page 41: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

BÀI TẬPCho danh sách 100 công ty được đánh số

thứ tự từ 0 đến 99 và sản lượng sản xuấtnăm qua. (ĐTV: 10.000 bảng Anh)

1. Lấy các mẫu theo phương pháp ngẫunhiên đơn giản, mỗi mẫu chọn 10 công ty.

2. Tính trung bình sản lượng của các côngty ở các mẫu.

01/04/2017 41

Page 42: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

BÀI TẬPCho danh sách 100 công ty được đánh số thứ tự từ 0 đến

99 và sản lượng sản xuất năm qua. (ĐTV: 10.000bảng Anh)

3. Giả sử trung bình tổng thể là 66,08900 bảng Anh.Trung bình mẫu so với trung bình tổng thể có sai lệchkhông?

01/04/2017 42

Page 43: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Hướng dẫn Lấy giấy cắt thành 20 tờ thăm. Chia đôi thành 2 phần Phần 1: 10 tờ thăm đánh số từ 0 đến 9 biểu thị cho hàng

đơn vị Phần 2: 10 tờ thăm đánh số từ 0 đến 9 biểu thị cho hàng

chục Bốc ngẫu nhiên hàng chục trước, ví dụ số 1. Bốc ngẫu nhiên hàng đơn vị, ví dụ số 3 Vậy công ty thứ 13 được chọn vào mẫu. Làm tiếp tục để

có thêm các công ty khác vào mẫu. Nếu thăm bốc trùngthứ tự công ty thì bốc lại.

01/04/2017

701014 chuong 5-

Thiết kế nghiên cứu

và các phương

pháp lấy mẫu43

Page 44: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

BÀI TẬP4. Chọn quy mô mẫu là 10% so với tổng thể và

chọn theo phương pháp hệ thống5. Tính trung bình cho mẫu này.6. So sánh với trung bình tổng thể là 660,8900

thì trung bình mẫu này cho kết quả tốt hơn haytệ hơn so với trung bình hai mẫu trên?

01/04/2017 44

Page 45: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

01/04/2017

701014 chuong 5-

Thiết kế nghiên cứu

và các phương

pháp lấy mẫu45

Page 46: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Giả sử trung bình tổng thể là 660.89. Trung bình mẫuso với trung bình tổng thể có sai lệch không?

Trung bình bàn 1: 825.05 Trung bình bàn 2: 593.8 Trung bình bàn 3: 706.35 Trung bình bàn 4: 632.6 Trung bình thứ 5: 989.6

Page 47: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

BÀI TẬP Tổng thể có 111376 dân phân bố theo tuổi và giới tính

như dưới đây. Hãy chọn mẫu 10% theo quota

01/04/2017

701014 chuong 5-

Thiết kế nghiên cứu

và các phương

pháp lấy mẫu47

Page 48: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

XÁC ĐỊNH CỠ MẪUXác định cỡ mẫu (số đơn vị mẫu) chính là xác

định số lượng đơn vị điều tra trong tổng thểmẫu để tiến hành thu thập số liệu. Yêu cầu củacỡ mẫu là vừa đủ để vừa đảm bảo độ tin cậycần thiết của số liệu điều tra vừa đảm bảo phùhợp với điều kiện về nhân lực và kinh phí và cóthể thực hiện được, tức là có tính khả thi.

Page 49: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

XÁC ĐỊNH CỠ MẪU Khi điều tra chọn mẫu để suy rộng số bình quân theo

một tiêu thức nào đó

Khi điều tra chọn mẫu để suy rộng tỷ lệ theo một tiêuthức nào đó

Trong đó:- N là số đơn vị tổng thể chung.- S2 và p (1- p) là phương sai của tổng thể chung với chỉ tiêu bình quân và chỉ tiêu tỷ lệ.- t là hệ số tin cậy- ε là phạm vi sai số chọn mẫu.

Page 50: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

hệ số tin cậy và xác suất tin cậy

t1 0,6826

1,5 0,86632 0,9545

2,5 0,98753 0,9973

Page 51: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

XÁC ĐỊNH CỠ MẪU Các thông tin trên đây cần có từ khi chuẩn bị điều tra

để xây dựng và quyết định phương án điều tra. Trongđó, số đơn vị tổng thể chung (N) lấy từ số liệu thốngkê; xác xuất tin cậy (pt) và phạm vi sai số chọn mẫu(ε) do người tổ chức điều tra yêu cầu cho từng cuộcđiều tra. Riêng phương sai của tổng thể chung (S2 vàp(1-p)) thì phải dựa và kết quả của các cuộc điều tratrước đó;

Page 52: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

XÁC ĐỊNH CỠ MẪU Trường hợp không có các cuộc điều tra trước tương tự

hoặc có nhưng không tính được phương sai thì sẽ xửlý như sau:

- Khi điều tra nghiên cứu chỉ tiêu bình quân thì phảiđiều tra mẫu nhỏ để xác định phương sai

Hoặc

- Khi điều tra nghiên cứu chỉ tiêu tỷ lệ thì sẽ lấyphương sai lớn nhất: p(1-p) = 0,5 x (1-0,5) =0,25

Page 53: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

VÍ DỤ XÁC ĐỊNH CỠ MẪUHãy xác định số hộ (cỡ mẫu) để điều tra thu nhập 1

năm của hộ nông dân trên địa bàn tỉnh “Y” có200.000 hộ gia đình (N = 200.000), với xác xuất tincậy là 0,9875 (tức là t = 2,5), phạm vi sai số chọnmẫu (ε) không vượt quá 2,52 triệu đồng/năm trongđiều kiện có phương sai về thu nhập của hộ:S2=61,52.

Page 54: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

VÍ DỤ XÁC ĐỊNH CỠ MẪUHãy xác định số hộ (cỡ mẫu) để điều tra thu nhập 1

năm của hộ nông dân trên địa bàn tỉnh “Y” có200.000 hộ gia đình (N = 200.000), với xác xuất tincậy là 0,9875 (tức là t = 2,5), phạm vi sai số chọnmẫu (ε) không vượt quá 2,52 triệu đồng/năm trongđiều kiện có phương sai về thu nhập của hộ:S2=61,52.

Page 55: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Xác định cỡ mẫu trong nghiên cứu Nghiên cứu mô tả: tùy thuộc vào số phần tử của

đám đông (N) N< 10.000 phần tử: chọn cỡ mẫu 10% N từ 10.000 đến 100.000: chọn từ 1%-5% N từ 100.000 đến 1.000.000: chọn 1% N trên 1.000.000: chọn 0.1% đến 0.5%

01/04/2017 55

Page 56: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

Xác định cỡ mẫu trong nghiên cứu Nghiên cứu giải thích

Theo yêu cầu xử lý thống kê: Cỡ mẫu n = bậc của thang đo x số câu hỏi Nếu phân tích nhiều nhóm: n= bậc thang đo x số câu

hỏi x số nhóm

01/04/2017 56

Page 57: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

THANG ĐO LIKERTLà thang đo thường có 5 (hoặc 7,9) mức độVí dụ: “Xin đọc kỹ các phát biểu sau. Sau mỗi phát biểu, vui

lòng trả lời bằng cách khoanh tròn vào con số tương ứngvới chọn lựa của Anh/Chị, với qui ước:Số 1: Rất không đồng ý với câu phát biểuSố 2: Không đồng ý với câu phát biểuSố 3: Trung hoà với câu phát biểuSố 4: Đồng ý với câu phát biểuSố 5: Rất đồng ý với câu phát biểu”

Công ty có chế độ phúc lợi tốt 1 2 3 4 5Công ty thực hiện chế độ bảohiểm xã hội tốt 1 2 3 4 5Công ty thực hiện chế độ bảohiểm y tế tốt 1 2 3 4 5

Page 58: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

1. Hãy xác định số hộ (cỡ mẫu) để xác định mức thunhập trung bình hàng năm của các hộ gia đình biết

a. xác xuất tin cậy là 0,9875 (tức là t = 2.5),b. phạm vi sai số chọn mẫu không vượt quá 20 ngàn

đồngc. Độ lệch chuẩn về thu nhập của hộ 160 ngàn

VÍ DỤ: TÍNH QUY MÔ MẪU

Page 59: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

1. Hãy xác định số hộ (cỡ mẫu) để xác định mức thu nhậptrung bình hàng năm của các hộ gia đình biết

a. xác xuất tin cậy là 0,9875 (tức là t = 2.5),b. phạm vi sai số chọn mẫu (ε) không vượt quá 20 ngàn đồngc. Độ lệch chuẩn về thu nhập của hộ: S= 160 (S2= 1602 )Nếu xác xuất tin cậy là 0,9875

Nếu xác xuất tin cậy là 0,95 (t=2)

(hộ)

VÍ DỤ: TÍNH QUY MÔ MẪU

Page 60: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

1. Ở 1 tỉnh người ta tổ chức điều tra để xác định tỷ lệ mùchữ ở độ tuổi lớn hơn 8 tuổi biết

a. xác xuất tin cậy là 0,95 (tức là t = 2),b. phạm vi sai số chọn mẫu ( ε) là 1%c. Ở cuộc điều tra năm trước đã xác định tỷ lệ mù chữ ở

tỉnh này là 9%Tính quy mô mẫu cho cuộc điều tra mù chữ năm nay

VÍ DỤ: TÍNH QUY MÔ MẪU

Page 61: Chuong 5 Chon mau - WordPress.com · 2017-04-01 · 0 qwv inkilql _p 3k «q w ñ hohphqw ÿ kq y Ï f «q txdq viw yj wkx wk ±sg óol Ëx fiqkkq k Ýjldÿuqk w Ùfk íf « 7 Ùqjwk

1. Ở 1 tỉnh người ta tổ chức điều tra để xác định tỷ lệ mùchữ ở độ tuổi lớn hơn 8 tuổi biết

a. xác xuất tin cậy là 0,95 (tức là t = 2),b. phạm vi sai số chọn mẫu ( Δ) là 1%c. Ở cuộc điều tra năm trước đã xác định tỷ lệ mù chữ ở

tỉnh này là 9%Tính quy mô mẫu cho cuộc điều tra mù chữ năm nay

(người)

VÍ DỤ: TÍNH QUY MÔ MẪU