抽样方法简介

Post on 03-Jan-2016

65 Views

Category:

Documents

24 Downloads

Preview:

Click to see full reader

DESCRIPTION

抽样方法简介. 北京大学公共卫生学院 陈育德. 抽样方法. 单纯随机抽样:如:抽签、摸球、随机数字表 系统抽样:又称间隔抽样、机械抽样:例如:抽户的方法是先确定一户,如第 5 户,以后每间隔 10 户抽一户,则得到样本户 5 、 15 、 25 、 35 …… 分层抽样:先按某种特征将总体分为若干组(类型、区),统称为“层”,再从每一“层”中进行随机抽样。 整群抽样:以“整群”为抽样单位。例如以乡、村等为“整群”进行抽样。 阶段抽样(多阶段抽样):例如在市(区、县)中先以乡镇(街道)为整群进行抽样再在乡(街道)中以管理区(村)、居委会为整群进行抽样。. - PowerPoint PPT Presentation

TRANSCRIPT

抽样方法简介

北京大学公共卫生学院陈育德

2

抽样方法1. 单纯随机抽样:如:抽签、摸球、随机数字表2. 系统抽样:又称间隔抽样、机械抽样:例如:抽户

的方法是先确定一户,如第 5 户,以后每间隔 10 户抽一户,则得到样本户 5 、 15 、 25 、 35……

3. 分层抽样:先按某种特征将总体分为若干组(类型、区),统称为“层”,再从每一“层”中进行随机抽样。

4. 整群抽样:以“整群”为抽样单位。例如以乡、村等为“整群”进行抽样。

5. 阶段抽样(多阶段抽样):例如在市(区、县)中先以乡镇(街道)为整群进行抽样再在乡(街道)中以管理区(村)、居委会为整群进行抽样。

3

第二阶段抽样调查实例1. 全县人口累计(各乡)数为: 2486002. 抽样间隔: 248600/5=497203. 取一张人民币:号为 FP59243854 ,后 5 位为 43854 ,

是为随机数4. 确定第一个样本: 43854 落在第 3 编号乡(玉阳镇)后面

的累计数之内,故确定玉阳为第 1 个样本。5. 确定第二个样本: 43854+49720=93574 ,落在第 5 编号

乡(新龙乡)后面的累计数之内,故确定新龙乡为第 2 个样本。

6. 确定第三个样本: 93574+49720=143294 ,落在第 8 编号乡(新原乡)后面的累计数之内,故确定新原乡为第 3个样本。

4

第二阶段抽样调查实例编号乡镇 人口

数累计 编号乡镇 人口

数累计 编号乡镇 人口

数累计

1城关镇 22000 22000 7平原乡 16400 134900 13新店镇

10000 205500

2平湖镇 21000 43000 8新原乡 15000 149900*

14安定乡

9500 215000

3玉阳镇 20000 63000* 9古农乡 14000 163900 15五岖乡

8900 223900

4五一乡 19500 82500 10王店乡

11000 174900 16五庙乡

8500 232400

5新龙乡 18400 100900*

11 双莲乡

10500 185400*

17双山乡

8200 240600

6湖泊乡 17600 118500 12桐连乡

10100 195500*

18四顶乡

8000 248600*

5

第三阶段随机整群抽样实例 全乡人口(各村人口累计): 7337 抽样间隔: 7337/2=3669 取一张人民币,确定其编号后四位数 2273 为

随机数 确定第一个样本: 2273 落在第四编号(镇北

村)的累计数之内,确定镇北村为第一个样本。 确定第二个样本: 2273+3669=5942 ,落在

第 10 编号的累计数之内,确定清平村为第二样本村。

6

第三阶段随机整群抽样实例 编号

村 人口数 累计数 编号 村 人口数 累计数

1 镇西店村 724 724 7 长生庙村 589 4606

2 唐家铺村 721 1445 8 王甸子村 574 5180

3 镇东村 689 2134 9 民生村 571 5751

4 镇北村 671 2805* 10 清平村 544 6295*

5 李家店村 610 3415 11 老平埠村 534 6829

6 湖泊村 602 4017 12 高水村 508 7337

7

样本个体的抽样 最终的抽样单位是住户,在每个“样本村”

(居委会)中按 20% 的比例随机抽取住户,平均每个村抽 60 户,全国共抽取 54000 户。全国平均每户被抽取为样本的概率为 54000/28000 万,约每 5000 户中抽一户。如果按每户四人计算,人口抽样比也为 1 : 5000 左右。

8

样本个体的抽样 抽户方法是个样本乡镇(街道)的调查指导员按

上述抽样比例在样本村(居委会)随机抽取。具体方法是:

1. 按人口普查的编码顺序,按门牌号、楼号、单元号、门号从小到大排列;

2. 对同一门牌号、同一个大院和楼号的,按门号从小到大排列,对同一门牌号内没有门号的按从左到右、从外到里、从下到上的原则编码,一经编码不许变动。

3. 编好住户码列入住户清单表式中:

9

样本个体的抽样 本村人口: 1200 ,户数 300 ,每户平均人口数 4 人 应抽户数: 60 抽样间隔: 1200/60=20 确定随机数字:取一张人民币,后两位数为 12 确定第一样本户: 12 落在第三编号户累计数之内,

故确定第三户为第一样本户。 确定第二样本户: 12+20=32 ,落在第几编号户累计

数内,该户即为第二样本户。

10

样本个体的抽样序号 户主名称 家庭住址 门牌号码 家庭人口数 累计人口数 抽中住户

1 张三 *村 *组

东 1 5 5  

2 李四 *村 *组

东 2 4 9  

3 王五 *村 *组

东 3 4 13 *

4 赵六 *村 *组

东 4 3 17  

5 陈七 *村 *组

东 5 5 22  

……

           

……

           

300 赵末 *村 *组

北 6 6 1200  

top related