ngay 2 -_bai_giang_7[1]

25
BÀI 7 PHƯƠNG PHÁP CHỌN MẪU

Upload: leq-ever

Post on 16-Apr-2017

517 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Ngay 2 -_bai_giang_7[1]

BÀI 7PHƯƠNG PHÁP CHỌN MẪU

Page 2: Ngay 2 -_bai_giang_7[1]

NỘI DUNGXác định cỡ mẫuCác cách chọn mẫu

◦Chọn mẫu phi xác suất◦Chọn mẫu xác suất

Chọn mẫu ngẫu nhiên đơn giản Chọn mẫu hệ thống Chọn mẫu cụm Chọn mẫu phân tầng (nhiều giai đoạn)

Page 3: Ngay 2 -_bai_giang_7[1]

Xác định cỡ mẫuSố lượng các đơn vị chọn mẫu được lấy ra để

nghiên cứu được gọi là dụng lượng mẫu hay còn gọi là cỡ mẫu.

Để xác định cỡ mẫu phụ thuộc vào rất nhiều yếu tố. Có rất nhiều công thức tính cỡ mẫu, các công thức này khác nhau tuỳ theo các phương pháp chọn mẫu.

Page 4: Ngay 2 -_bai_giang_7[1]

Xác định cỡ mẫuCỡ mẫu phụ thuộc vào các yếu tố cơ bản

sau:◦Mục đích của cuộc điều tra◦Khả năng vật chất (tài chính)◦Nguồn lực (số lượng điều tra viên)◦Quy mô dân số.◦Lỗi mẫu cho phép (Yêu cầu về độ chính xác)◦Ngoài ra, các yếu tố về số lượng tiêu thức điều

tra, mức độ thuần nhất của tổng thể.

Page 5: Ngay 2 -_bai_giang_7[1]

Xác định cỡ mẫu

Chúng ta sử dụng công thức dưới đây để xác định kích thước mẫu: 

Trong đó:◦n: kích cỡ mẫu được tính◦Z: giá trị liên quan đến độ tin cậy (thường chọn độ

tinh cậy 95% => z= 1.96

Page 6: Ngay 2 -_bai_giang_7[1]

Xác định cỡ mẫu

p = ước tính phần trăm trong tập hợp. Thông thường p sẽ thấy ở một vài nghiên cứu trước đó hoặc một vài nguồn thông tin. Trong trường hợp chúng ta không có thông tin trước liên quan đến p, chúng ta thường thiết lập giá trị của p tới 0.5

q = (1-p)e = sai số (Sai số càng nhỏ thì kích thước

mẫu càng lớn. Giá trị tham khảo: 0.05

Tham khảo http://vidac.org/Support/T%C3%ADnhk%C3%ADchthướcmẫu/tabid/132/language/vi-VN/Default.aspx

Page 7: Ngay 2 -_bai_giang_7[1]

Các cách chọn mẫuChọn mẫu phi xác suất

◦Nghiên cứu thăm dò◦Chọn mẫu thuận tiện◦Chọn mẫu không biết trước xác suất của mẫu

Chọn mẫu xác suất◦Tổng quát hóa cho toàn bộ tổng thể◦Chọn mẫu nhắm đến kết quả◦Chọn mẫu biết trước xác suất được lựa chọn

nằm trong mẫu

Page 8: Ngay 2 -_bai_giang_7[1]

Chọn mẫu phi xác suấtMẫu thuận tiện (dễ dàng lấy mẫu)Chọn mẫu theo mạng quan hệ (VD: dựa

trên quan hệ bạn bè)Chọn mẫu có mục tiêu(chọn mẫu có phán

đoán) Sẽ chọn mẫu dựa theo mục đích nghiên cứu về đối

tượng nào

Page 9: Ngay 2 -_bai_giang_7[1]

Chọn mẫu xác suấtMẫu ngẫu nhiên giản đơnMẫu hệ thốngChọn mẫu chùmChọn mẫu phân tầng (nhiều giai

đoạn)

Page 10: Ngay 2 -_bai_giang_7[1]

Chọn mẫu ngẫu nhiên đơn giảnĐịnh nghĩa: là cách chọn các đơn vị từ tổng thể vào mẫu

hoàn toàn ngẫu nhiên. Xác suất được chọn của các phần tử là như nhau: n/N

(trong đó: n=cỡ mẫu, N= cỡ của tổng thể)Nguyên tắc:

◦ Xác suất chọn của các phần tử là ngang nhauCác bước tiến hành:

◦ Xác định khung lấy mẫu Liệt kê tất cả các phần tử chọn mẫu Đánh số tất cả các phần tử

◦ Lấy ngẫu nhiên các phần tử

Page 11: Ngay 2 -_bai_giang_7[1]

Chọn mẫu ngẫu nhiên đơn giảnVí dụ: ước lượng tỷ lệ hộ gia đình được tiếp

cận với nước sạch trong thôn AKhung lấy mẫu: danh sách các hộ gia đình

trong thôn A.Cách chọn:

◦Liệt kê tất cả hộ gia đình trong thôn A (vd: 1200 hộ)◦Đánh số các hộ này từ 1 đến 1200◦Chọn cỡ mẫu bằng 100◦Chọn ngẫu nhiên 100 số trong khoảng từ 1 đến

1200

Page 12: Ngay 2 -_bai_giang_7[1]

Chọn mẫu ngẫu nhiên đơn giảnCách 2: dùng Excel:

◦Excel option/ add-in/ excel – analysis toolPak◦Data analysis/ Sampling

Page 13: Ngay 2 -_bai_giang_7[1]

Chọn mẫu ngẫu nhiên đơn giản

Page 14: Ngay 2 -_bai_giang_7[1]

Chọn mẫu ngẫu nhiên đơn giảnƯu điểm:

◦ Đơn giản◦ Dễ dàng trong việc đo lường sai lệch chọn mẫu

Nhược điểm:◦ Phải liệt kê tất cả các phần tử◦ Không phải lúc nào cũng lấy được mẫu đại diện tốt

nhất◦ Các phần tử có thể phân tán và khó khăn thu thập

Page 15: Ngay 2 -_bai_giang_7[1]

Chọn mẫu hệ thốngĐịnh nghĩa: chọn các đơn vị từ tổng thể vào

mẫu theo một khoảng cách cố định sau khi đã chọn ngẫu nhiên một nhóm nào đó trên cơ sở các đơn vị điều tra được sắp xếp theo thứ tự

Nguyên tắc◦ Chọn mẫu trong khoảng thông thường, tùy thuộc vào

khoảng lấy mẫu

Page 16: Ngay 2 -_bai_giang_7[1]

Chọn mẫu hệ thốngQuy trình chọn mẫu:

◦Khung lấy mẫu: Tấm bản đồ hoặc danh sách các hộ gia đình. (1200 hộ chọn 60 hộ)

◦Đơn vị lấy mẫu: Hộ gia đình◦Xác định khoảng cách mẫu: SI = 1200/60 = 20◦Phương pháp chọn mẫu:

B1: Đánh số liên tục các khu nhà từ 1 đến 20 trong khung chọn mẫu.

B2: Chọn ngẫu nhiên 1 số từ 1 – SI: tức là 1- 20 => 8 B3: Chọn các hộ tiếp theo: 8+SI => 8, 28, 48….

Page 17: Ngay 2 -_bai_giang_7[1]

Chọn mẫu hệ thốngƯu điểm:

◦ Đơn giản◦ Dễ dàng đánh giá được những lỗi trong chọn mẫu

Nhược điểm:◦ Phải liệt kê tất cả các phần tử◦ Phải có tính tuần hoàn

Page 18: Ngay 2 -_bai_giang_7[1]

Chọn mẫu hệ thống

Page 19: Ngay 2 -_bai_giang_7[1]

Chọn mẫu chùmNguyên tắc:Lấy mẫu theo chùm là phương pháp

chọn mẫu các nhóm riêng biệt (thường được gọi là chùm hoặc cụm) của các đơn vị nhỏ hơn tổng thể và gọi là phần tử. Tức là tổng thể được phân chia ra làm các chùm sao cho :◦Mỗi đơn vị nghiên cứu được phân và một chùm◦Mỗi chùm cố gắng chứa nhiều đơn vị khác nhau

sao cho sự phân bố các đơn vị của nó giống như tổng thể.

◦Giữa các chùm có sự phân bố tương đối đồng đều với nhau.

Page 20: Ngay 2 -_bai_giang_7[1]

20

Khu vực 4Khu vực: 5

Khu vực: 3

Khu vực: 2Khu vực 1

Ví dụ: Chọn mẫu theo chùm

Page 21: Ngay 2 -_bai_giang_7[1]

21

Chọn mẫu theo chùmƯu điểm:

◦ Đơn giản vì không yêu cầu liệt kê tất cả các phần tử chọn mẫu trong tổng thể

◦ Đỡ tốn kém (đi điều tra ở các đơn vị ở gần nhau)ppplNhược điểm:

◦ Có thể xảy ra trường hợp các phần tử trong cùng một nhóm này giống nhau nhiều hơn các phần tử trong cùng một nhóm khác. Donhững hộ gia đình gần nhau thì có xu hướng mang những đặc trưng giống nhau, do ảnh hưởng đến tính đại diện của mẫu và làm cho sai số lấy mẫu tăng lên.

Page 22: Ngay 2 -_bai_giang_7[1]

22

Chọn mẫu phân tầng (nhiều giai đoạn)

Nguyên tắc: Chọn mẫu liên tiếpPhần tử chọn mẫu: hộ gia đình

◦Giai đoạn 1: Lựa chọn tỉnh◦Giai đoạn 2: Lựa chọn khu vực (thôn)◦Giai đoạn 3: lựa chọn hộ gia đình

Page 23: Ngay 2 -_bai_giang_7[1]

23

Chọn mẫu phân tầng (nhiều giai đoạn)

Ưu điểm◦ Có thể thu thập được thông tin của toàn bộ tổng thể và cả

từng tầng nhỏ◦ Tính chính xác cao nếu sự khác biệt trong mỗi nhóm nhỏ

là đồng nhất hơn sự khác biệt giữa các nhómNhược điểm

◦ Khó khăn trong việc xác định các tầng◦ Tính chính xác của mẫu không còn nếu có quá ít phần tử

trong từng tầng nhỏ Có thể khắc phục bằng cách lấy tỷ lệ chọn mẫu theo tổng thể các

mỗi tầng

Page 24: Ngay 2 -_bai_giang_7[1]

24

Lựa chọn phương pháp chọn mẫu

Tổng thể được nghiên cứu◦Quy mô và sự phân bố về mặt địa lý◦Tính không thuần nhất đối với các biến

Sự sẵn có của danh sách các phần tử chọn mẫu

Mức độ chính xác cần thiếtCác nguồn lực sẵn có

Page 25: Ngay 2 -_bai_giang_7[1]

Thực hành