美国渔业和野生动物保护机构规定 :“ 每个扇贝肉 的重量至少 1/36...
DESCRIPTION
美国渔业和野生动物保护机构规定 :“ 每个扇贝肉 的重量至少 1/36 磅才可以捕捞” 。 . !. ?. 这艘渔船上的扇贝符合捕捞标准吗?. 第九章 抽样估计. 第一节 抽样估计概论 第二节 抽样估计的基本概念 第三节 简单随机抽样的抽样误差测定 第四节 简单随机抽样的抽样估计 第五节 必要抽样单位数的确定 第六节 抽样方案设计. 第一节 抽样估计概论. 一 、 抽样估计的概念 二、抽样估计的特点 三、 抽样估计的用途 四、 抽样估计的步骤. 一、抽样估计的概念 抽样估计即根据 样本统计量 推断 总体参数 的过程。. - PowerPoint PPT PresentationTRANSCRIPT
美国渔业和野生动物保护机构规定 :“ 每个扇贝肉的重量至少 1/36 磅才可以捕捞”。 !
? 这艘渔船上的扇贝符合捕捞标准吗?
第九章 抽样估计• 第一节 抽样估计概论• 第二节 抽样估计的基本概念• 第三节 简单随机抽样的抽样误差测定 • 第四节 简单随机抽样的抽样估计 • 第五节 必要抽样单位数的确定• 第六节 抽样方案设计
第一节 抽样估计概论• 一、抽样估计的概念• 二、抽样估计的特点• 三、抽样估计的用途• 四、抽样估计的步骤
一、抽样估计的概念 抽样估计即根据样本统计量推断总体参数的过程。
统计推断
全及总体指标:参数(未知量)
样本总体指标:统计量(已知量)
分为:点估计和区间估计
二、抽样估计的特点
随机样本:与总体分布特征趋同
非随机样本:与总体分布特征不同
并非所有的抽样估计都按随机原则抽取样本。也有非随机抽样。
特点之一:按随机原则抽取样本
二、抽样估计的特点特点之二:具有科学的理论基础,其估计结果具有可靠性。
抽样估计的理论基础抽样估计的理论基础
大 数 定 律大 数 定 律 中 心 极 限 定 理中 心 极 限 定 理
特点之三:存在估计误差,并可加以控制。
抽样调查误差
登记误差
代表性误差
用设计、培训、管理等方法消除
用抽样方法、样本容量等手段控制
二、抽样估计的特点
三、抽样估计的用途
• 抽样估计可用于四种情况:• 不可能进行全面调查时• 不必要进行全面调查时• 来不及进行全面调查时• 对全面调查补充修订时
统计法对调查方法的规定:以周期性的普查为基础,以抽样调查为主要方法,以其他方法为辅助手段。
抽取样本单位
收集样本数据
计算样本统计量
推断总体参数重点掌握
四、抽样估计的步骤
点估计点估计指直接以样本指标来估计总指直接以样本指标来估计总体指标,也叫定值估计体指标,也叫定值估计
区间估计
指根据指根据样本指标样本指标和和抽样极限误差抽样极限误差以一定的以一定的可靠程度可靠程度推断总体指标的可推断总体指标的可能范围能范围。。
• 2005 年中国消费者协会的主题是 “健康 · 维权” . 想象你是中国消费者协会的官员 , 负责治理缺斤少两的不法行为。
• 假设你对可口可乐公司生产的一种瓶装雪碧(包装上标明其净含量是 500ml )进行调查。在市场上随机抽取了 50 瓶,测得其平均净含量为 499.5ml ,标准差为 0.63ml 。其中要做的一件事情就是 :
• 做出一个估计:你有 95.45%的把握说该种包装的雪碧平均净含量在 498.24~500.76ml 之间,然后向消协写份报告。
随机性原则• 所谓随机性原则,
就是在抽选样本单位时,总体中每一个单位被抽中的机会相等,样本单位的抽中与否完全是偶然的。
• 例如:一些彩票的中奖号码 ; 电脑抽取中奖的身份证号或手机号等等 .
第二节 抽样估计的基本概念一、全及总体和抽样总体二、总体指标和样本指标三、抽样框 四、有限总体与无限总体 五、简单随机样本六、重复抽样与不重复抽样七、样本容量与可能的样本数目八、抽样分布
(一)全及总体和抽样总体
全及总体简称总体或母体,它是指所要调查研究对象的全体。全及总体的单位数用字母 N 表示。
【例】研究某学校 5000名学生的学习情况,则该校的 5000名学生即构成全及总体。
一具体问题来说,全及总体是唯一确定的。全及总体是样本所赖以抽取的母体。对于某
1. 全及总体
注意
2. 抽样总体。
抽样总体简称样本或子样,它是指在全及总体中按随机原则抽取的那一部分单位所构成的集合体。
抽样总体的单位数称为样本容量,通常用字 母 n 表示。
概念
【例】从全校 10000名学生中随机抽取 100名学生进行健康状况调查,请举出由 100人构成的一个抽样总体。共有多少种抽样总体?
通常,样本容量 n远小于总体单位数 N。在抽样中, n≥30的样本称为大样本, n< 30的样本称为小样本。样本总体不是唯一确定的,因为从总体 N中抽取容量为 n的样本(当 n< N)时,共有
注意
nNC
(二)总体指标和样本指标
1. 总体指标
一个总体常常有多个总体参数,它们从不同的角度反映了总体分布的基本状况和主要特征。由于全及总体是唯一确定的,因此,依据全及总体的数据计算的全及指标也是唯一确定的。
注意
总体指标也称为母体参数、总体参数或全及总体,它是根据总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。
X常用的总体指标有总体平均数 、总体比率 P、总体标准差 σ或方差 以及总体标志总量 N或总体中某一部分单位总数 等。
21N
设总体中, N个总体单位按某项标志的标志值分组,分组结果为:
变量值 X
次数 F
mXXX ,,, 21
mFFF ,,, 21
则,( 1)总体平均数的计算公式为:计算公式
m
ii
m
iii
m
mm
F
FX
FFF
FXFXFXX
1
1
21
2211
总体指标的计算
( 2)总体方差的计算公式为:
m
ii
m
iii
m
mm
F
FXX
FFF
FXXFXXFXX
1
1
2
21
22
221
212
)()()()(
m
ii
m
iii
m
mm
F
FXX
FFF
FXXFXXFXX
1
1
2
21
22
221
21
)()()()(
( 4 )总体比率( 4 )总体比率 概念 在抽样估计中,比率习惯上称为成数,也就是总体中具有某一属性的单位占总体全部单位数的比重。
( 3)总体标准差的计算公式为:
( 5)是非标志
分组 单位数 F 变量值 X
具有某一属性不具有某一属性
10
合计 —0N1N
为了研究是非标志总体的数量特征,令
N
①是非标志指总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志
②是非标志总体的指标
具有某种标志表现的单位数所占的成数
具有某种标志表现的单位数所占的成数 N
NP 1
不具有某种标志表现的单位数所占的成数不具有某种标志表现的单位数所占的成数 N
NQ 0
10101
N
N
N
NNN
NN
NQP且有
成数 实际上,就是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重。
均值
标准差
PN
N
N
NN
F
XFX P
101 01
PQPQPQQPPQ
NN
NPNP
F
FXXp
22
01
02
122
01)(
方差 PPPQ 12
25.05.0 2max 时,有当 QP
〖例〗某厂某月份生产了 400 件产品,其中合格品 380 件,不合格品 20 件。求产品质量分布的集中趋势与离散趋势。
解:
218.0)95.01(95.0
95.0
5400
2095
400
380
20380400
01
01
PQ
PX
N
NQ
N
NP
NNN
p
P
所以有:
﹪,﹪,
件,则件,件,己知
P
Q
P
P
P
PP
XV
P
P
11
标准差系数
样本指标也称为统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征值计算的、用以估计和推断相应总体指标的综合指标。
一个样本总体也常常有多个样本指标,它们从不同的角度反映了样本分布的基本状况和主要特征。但由于样本总体不是唯一确定的,因此,依据样本总体的数据计算的样本指标也不是唯一确定的。
2.样本指标
x常用的样本指标有样本平均数 、样本比率 P 、样本标准差 s 或方差 以及样本总体总量 n 或样本中某一部分单位总数 等。1n
变量值 x
次数 f
mxxx ,,, 21
mfff ,,, 21
则,( 1)样本平均数的计算公式为:
设样本中, n个总体单位按某项标志的标志值分组,分组结果为:
计算公式
m
ii
m
iii
m
mm
f
fx
fff
fxfxfxx
1
1
21
2211
2s
( 2)无偏样本方差的计算公式为:
1
)(
1
)()()(
1
1
2
21
22
221
212
m
ii
m
iii
m
mm
f
fXX
fff
fXXfXXfXXs
无偏
m
ii
m
iii
m
mm
f
fXX
fff
fXXfXXfXXs
1
1
2
21
22
221
21
1
)(
1
)()()(
无偏
( 3)无偏样本标准差的计算公式为:
样本单位数减 1 ,主要是满足统计量要符合三个评选标准:①无偏性②一致性③有效性
注意
( 2)有偏样本方差的计算公式为:
m
ii
m
iii
m
mm
f
fXX
fff
fXXfXXfXXs
1
1
2
21
22
221
212
)()()()(
有偏
m
ii
m
iii
m
mm
f
fXX
fff
fXXfXXfXXs
1
1
2
21
22
221
21
)()()()(
有偏
( 3)有偏样本标准差的计算公式为:
有偏样本方差,主要是不满足统计量要符合的三个评选标准:①无偏性②一致性③有效性
注意
分组 单位数 f 变量值 x
具有某一属性不具有某一属性
10
合计 —0n1n
( 5)是非标志
指样本总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志为了研究是非标志样本总体的数量特征,令
n
( 4 )样本比率( 4 )样本比率 在抽样估计中,比率习惯上称为成数,也就是样本中具有某一属性的单位占总体全部单位数的比重。
成数实际上就是非标志样本总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重。
具有某种标志表现的单位数所占的成数
具有某种标志表现的单位数所占的成数 n
np 1
不具有某种标志表现的单位数所占的成数不具有某种标志表现的单位数所占的成数 n
nq 0
10101
n
n
n
nnn
nn
nqp且有
均值
标准差
pn
n
n
nn
f
xfxp
101 01
1
01
1
)(
01
02
122
nn
npnp
f
fxxsp
方差
1
01
1
)(
01
02
122
2
nn
npnp
f
fxxsp
〖例 1〗一批货物( 1800箱)运抵仓库,随机抽取 2% 进行检验,获得下列资料。
求该批货物每箱平均重量、该批货物重量的方差、标准差。
平均每箱重量(克)抽样数目f(箱) 500—540 3 540—580 5 580—620 6 620—660 10 660—700 7 700—740 5合计 36
由于这批货物运抵仓库后,是随机抽取解:2% 进行检验来获得上面资料的。因此,
上述资料属于抽样资料,要用样本指标计算。
解:
〖例 2〗辽宁省 1984 年第二季度城市居民家庭生活基本情况一次性调查资料见表1
城镇居民家庭按生活费月收入分组资料月收入(人民币元)家庭人口f(人)
20以下 2371 20—25 3706
25—35 17659 35—50 39188
50—60 14782 60—70 6736 70以上 3885合计 88327
求月平均收入、月收入的方差、标准差。
(三)有限总体与无限总体
在抽样估计中,总体单位为有限个、且可以逐个调查登记的总体称为有限总体。 总体单位为无限个、或总体单位虽然有限但不可能逐个调查的总体称为无限总体。
以下内容被视为属于无限总体: 单位数太多的总体; 一个正在进行的过程; 预期将会发生的某个总量。
有限总体与无限总体
有限总体:N已知,可以排队编号并利用随机数表抽取样本单位。无限总体:N未知,不能编号,不能使用随机数表。
抽样框
抽样框:包含所有总体单位的名单框架。
仅对有限总体而言
姓 名 身高 体重 ( cm )( kg)丁 一 182 70 于 峰 175 62 马 宁 160 50 王一波 172 66 王忠烈 169 62 王洪宇 182 70 刘可心 166 61 李元元 152 48 李 煌 188 90 李一民 173 63
编号 001 002 003 004 005 006 007 008 009 010
抽样框应当调查的对象(居民户)已购或未购微波炉的住户已购该公司微波炉的住户有购买微波炉意向的住户
某外国公司在大连进行微波炉市场调查: 微波炉普及情况 居民的喜好特征 居民购买力水平 公司产品知名度 公司产品信誉度
在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
中山区… 沙河口区 星海街道… 黑石礁街道 尖山一委… 尖山二委 居民一组 居民二组 …
抽样框
连续出产的产品总体可以编制抽样框:均匀的出产时间、可以预见到的产品总量。
连续到加油站加油的汽车总体无法编制抽样框:时间不定、总量也无法确定。
简单随机样本
在不对总体进行划分、排队的情况下按随机原则抽取样本单位的方法称为简单随机抽样,抽取出的样本称为简单随机样本。
自有限总体抽取的简单随机样本:各样本单位以相等的概率被抽出。
自无限总体抽取的简单随机样本:各样本单位来自于同一总体;各单位的抽取是相互独立的。
重复抽样与不重复抽样
重复抽样放回抽样: 抽出
个体登记特征
放回总体
继续抽取
通常只在必须使样本单位能重复出现时使用
某彩票中奖号码(号码不重复出现): 1 2 3 4 5 6失去中奖机会的号码
11、 121 、 122 、1231 、 1232 、 1233 、12341 、 12342 、 12343 、 12344、123451 、 123452 、 123453 、 123454、123455
总计: 12345 个 至少占总数1
%
重复抽样与不重复抽样
有限总体修正系数 1
N
nN
N
n1
当 N足够大时
nN
nNx
2
1
nx
2
用于不重复抽样 用于重复抽样
<
样本容量与可能的样本数目
样本容量:一个样本中包含的样本单位数。通常用 n来表示。
大样本: n≥30小样本: n < 30
样本容量与可能的样本数目
• 1 、考虑顺序的不重复抽样• 2 、考虑顺序的重复抽样• 3 、不考虑顺序的不重复抽样• 4 、不考虑顺序的重复抽样
抽样分布
抽样分布:样本统计量所有可能值的概率分布。
样本统计量
总体未知参数
样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量
分布的形状及接近总体参数的程度
抽样分布
分布的特征值:均值和标准差
样本主要统计量 平均数 比率(成数) 方差
xp
2S
平均数的抽样分布学生 A B C D E F G成绩 30 40 50 60 70 80 90
按随机原则抽选出4名学生,并计算平均分数。
平均数的抽样分布
0
1
2
30 40 50 60 70 80 90
样 本 均 值 样 本 均 值 样 本 均 值
ABCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF
4547.55052.55052.5555557.56052.555
ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF
57.557.56062.56062.56567.55557.56060
BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG
62.56562.56567.5706567.57072.575
样本均值 45 47.5 50 52.5 55 57.5 60
出现次数 1 1 2 3 4 4 5
样本均值 62.5 65 67.5 70 72.5 75
出现次数 4 4 3 2 1 1
0
1
2
3
4
5
6
45 50 55 60 65 70 750
1
2
30 40 50 60 70 80 90
二者均值相等
07.7x
《统计学》第四章 抽样估计样本均值 45 47.5 50 52.5 55 57.5 60
出现次数 1 1 2 3 4 4 5
离 差 -15 -12.5 -10 -7.5 -5 -2.5 0
样本均值 62.5 65 67.5 70 72.5 75
出现次数 4 4 3 2 1 1
离 差 2.5 5 7.5 10 12.5 15
学生 A B C D E F G成绩 30 40 50 60 70 80 90离差 -30 -20 -10 0 10 20 30
20
07.71002
1
4
20
17
47
12
2
nN
nNx
第三节 简单随机抽样的抽样误差测定
一、抽样误差概述
二、抽样平均误差
三、抽样极限误差
一、抽样误差概述
㈠抽样估计的可能误差
㈡抽样误差的控制
抽样估计的可能误差
抽样推断误差
登记误差
代表性误差
由人为原因造成的、可以避免的误差:非抽样误差
非人为原因造成的、无法避免的误差:抽样误差
抽样估计的可能误差
• 非抽样误差的种类及产生的原因:设计失误或工具不良;调查对象选择失误;无回答;数据处理失误;调查人员误导;被调查者说谎。
• 抽样误差产生的原因:用部分单位来推断总体
抽样误差的控制
• 关于抽样误差的几点认识:• 抽抽样误差是样本统计量与总体参数之间的绝对差异
• 对对于任何一个样本,其抽样误差都不可能测量出来
• 抽抽样误差的大小可以依据概率分布理论加以说明
抽样误差的控制
抽样误差的控制途径: 第一,选择合适的抽样方式 第二,控制样本容量
样本容量越大,则样本统计量就越接近总体参数。
分层随机样本可能优于简单随机样本
二、抽样平均误差
1 、抽样平均误差的概念2 、平均数的抽样平均误差3 、比率的抽样平均误差
抽样平均误差的概念
抽样平均误差即全部可能样本的统计量与总体参数离差的平均数。又称抽样标准误差、抽样标准误
meanESxx
m
xx
2)(
n
xxS
2)(
注意:不要混淆抽样标准差与样本标准差!
平均数的抽样平均误差
m
xx
2)(
nnxx
2
)(总体方差
11)(
2
N
nN
nN
nN
nxx
若总体方差2未知:用 样本方差S 2 代替用 历史资料代替用 试验结果估算 n
SSxx
n
xxS
2)(
比率的抽样平均误差
1
)1()(
N
nN
n
PPpp
n
PP
n
PPpp
)1()1()(
n
ppS pp
)1(
总体方差已知
总体方差未知
三、抽样极限误差
1 、抽样极限误差的概念
2 、平均数的抽样极限误差
3 、比率的抽样极限误差
抽样极限误差的概念
抽样极限误差:在一定概率保证下,样本统计量偏离总体参数的最大幅度。
抽样极限误差越大 , 则概率保证程度越高。
)()( px
平均数的抽样极限误差
nzzx x
)(
z 值为给定概率保证程度下样本均值偏离总体均值的抽样标准差个数。常用的值及相应的概率保证程度为: z 概率保证程度 1 0.6827 1.96 0.95 2 0.9545 2.33 0.98 2.58 0.99 3 0.9973
比率的抽样极限误差
n
PPzzp p
)1()(
例 某企业生产某种产品的工人有 1000人,某日采用不重复抽样从中随机抽取 100人调查他们的当日产量,样本人均产量为 35 件,产量的样本标准差为 4.5 件,试以 0.9545 的置信度估计平均产量的抽样极限误差。
由题意知,样本标准差 s解: =1000
,样本单位数n
总体单位数 N=4.5(件),
=100属于大样本,并且采用不重复抽样,
抽样平均误差x
1000
1001
100
5. 4
N
n
n
s 1 9487 . 0 5. 4 (件) 2692 . 4
。但抽样平均误差和概率度均未知,因此,我们先求x
2
zx
2
z
因此,平均产量的抽样极限误
然后,再求概率度 。 题中给出置信度为 0.9545,
因此,1- α=0.9545
,α=0.0455,
=0.02275,
2
通过查表并计算,得概率度
2
z =2,
因此,我们求得平均产量的抽样极限误差为:
x2
zx
2 2692 . 4 (件) 5384 . 8
解释 就是根据 11)(22
z ,然后查附表。
概率度2
z 求法。
第四节 简单随机抽样的抽样估计
• 一、平均数的抽样分布• 二、比率的抽样分布• 三、点估计• 四、区间估计
平均数的抽样分布
全部可能样本平均数的均值等于总体均值,即: 从非正态总体中抽取的样本平均数当 n足够大时其分布接近正态分布。 从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。 样本均值的标准差为总体标准差的 。n1
)()( xxE
),(~ nNx
比率的抽样分布
全部可能样本比率的均值等于总体比率,即: 从非正态总体中抽取的样本比率当 n足够大时其分布接近正态分布。 从正态总体中抽取的样本比率不论容量大小其分布均为正态分布。 样本比率的标准差为总体标准差的 。n1
)()( PpPpE
5)1(
5
))1(,(~
pn
np
nPPPNp
STAT
比率的抽样分布例
教师 是否博士 A 是 B 是 C 否 D 否 E 否 F 是
具有博士学位的比率: P= 0.5比率的标准差: = 0.5
从总体中按不重复抽样方法随机抽取4人,计算其比率P和标准差 p
比率的抽样分布
样 本 比率 离差 样 本 比率 离差ABCDABCEABCFABDEABDFABEFACDEACDF
0.50.50.750.50.750.750.250.5
000.2500.250.25-0.250
ACEFADEFBCDEBCDFBCEFBDEFCDEF
0.50.50.250.50.50.50.25
00-0.25000-0.25
Pn
pp 5.0
p
5
2
4
5.05.0
1
)1(
1581.015
375.0)( 2
N
nN
n
PP
f
fppp
三、点估计三、点估计
pPsxX ,,
指直接以样本指标来估计总指直接以样本指标来估计总体指标,也叫体指标,也叫定值估计定值估计
简单,具体明确简单,具体明确优点优点
缺点缺点 无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况
四、区间估计区间估计
㈠ 区间估计的定义和原理㈠ 区间估计的定义和原理
㈡ 总体平均数的区间估计㈡ 总体平均数的区间估计
㈢总体成数的区间估计㈢总体成数的区间估计
区间估计的概念
指根据样本指标和抽样极限误差以一指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范定的可靠程度推断总体指标的可能范围;其中,被推断的总体指标的下限围;其中,被推断的总体指标的下限与上限所包括的区间称为与上限所包括的区间称为置信区间置信区间,,估计的可靠程度也称为估计的可靠程度也称为置信度置信度。。
((这里只讨论常用的大样本的情况)这里只讨论常用的大样本的情况)
区间估计原理区间估计原理
0.9545
落在 落在 范围内的概率范围内的概率为为 95.45%95.45%
xx 2X
X
样本抽样分布曲线
原总体分布曲线
区间估计原理区间估计原理
0.9973 落在 范围内的概率为 99.73%
X xx 3
X
样本抽样分布曲线样本抽样分布曲线
总体分布曲线总体分布曲线
总体平均数的区间估计总体平均数的区间估计
xx
xx
xxX
xXx
,或
,表表达达式式
表表达达式式
其中, 为极限误差xxZ
总体平均数的区间估计步骤总体平均数的区间估计步骤
⒈ ⒈ 计算样本平均数计算样本平均数 ; ;x
1
,1
2
2
2
2
f
fxxs
n
xxs
⒉⒉ 搜集总体方差的经验数据 ;或计搜集总体方差的经验数据 ;或计算样本标准差 ,即算样本标准差 ,即
22s
总体平均数的区间估计步骤总体平均数的区间估计步骤
⒊ ⒊ 计算抽样平均误差:计算抽样平均误差:
n
s
nx 或重复抽样时重复抽样时
N
n
n
s
N
n
nx 1122
或
不重复抽样时:不重复抽样时:
总体平均数的区间估计步骤总体平均数的区间估计步骤
⒋ ⒋ 计算抽样极限误差:计算抽样极限误差:xx
Z
⒌ ⒌ 确定总体平均数的置信区间:确定总体平均数的置信区间:
xx
xx
xxX
xXx
,或
,
总体平均数的区间估计步骤(例)总体平均数的区间估计步骤(例)
【例【例 AA 】】某企业生产某种产品的工某企业生产某种产品的工人有人有 10001000 人,某日采用不重复抽人,某日采用不重复抽样从中随机抽取样从中随机抽取 100100 人调查他们的人调查他们的当日产量,要求在当日产量,要求在 95﹪95﹪的概率保的概率保证程度下,证程度下,估计该厂全部工人的日估计该厂全部工人的日平均产量和日总产量。平均产量和日总产量。
按 日产量分组(件)
组中值(件)
工人数(人)
110~ 114
114~ 118
118~ 122
122~ 126
126~ 130
130~ 134
134~ 138
138~ 142
112
116
120
124
128
132
136
140
3
7
18
23
21
18
6
4
336
812
2160
2852
2688
2376
816
560
588
700
648
92
84
648
600
784
合计 — 100 12600 4144
x fxf fxx
2
100100 名工人的日产量分组资料名工人的日产量分组资料
解
件
件
47.699
4144
1
126100
12600
2
f
fxxs
f
xfx
件614.01000
1001
100
47.6
1
2
2
N
n
n
sx
件203.1614.096.1 xxZ
则该企业工人人均产量则该企业工人人均产量 及日及日总产总产量 的置信区间为:量 的置信区间为:
XXN
203.11261000203.11261000
,203.1126203.1126
XN
X
即该企业工人人均产量在即该企业工人人均产量在 124.797124.797 至至 127127.203.203 件之间,其日总产量在件之间,其日总产量在 124797124797 至至 121273037303 件之间,估计的可靠程度为件之间,估计的可靠程度为 95﹪95﹪。。
总体成数的区间估计总体成数的区间估计
pp
pp
ppP
pPp
,或
,表表达达式式
表表达达式式
其中, 为极限误差pp Z
总体成数的区间估计步骤总体成数的区间估计步骤
步步骤骤步步骤骤
⒈ ⒈ 计算样本成数计算样本成数 ; ;n
np 1
⒉ ⒉ 搜集总体方差的经验数据搜集总体方差的经验数据 ; ;2p⒊ ⒊ 计算抽样平均误差:计算抽样平均误差:
1
11
1
1
n
pppp
n
n
nnp
p 或
N
n
n
pp
N
n
np
p 11
11
2
或
重复抽样重复抽样条件下条件下
不重复抽不重复抽样条件下样条件下
总体成数的区间估计步骤总体成数的区间估计步骤
步步骤骤步步骤骤⒋ ⒋ 计算抽样极限误差:计算抽样极限误差:
pp Z
⒌ ⒌ 确定总体成数的置信区间:确定总体成数的置信区间:
pp
pp
ppP
pPp
,或
,
总体成数的区间估计步骤(例)总体成数的区间估计步骤(例)
【例【例 BB 】】若例若例 AA 中工人日产量在中工人日产量在 111188 件以上者为完成生产定额任务,件以上者为完成生产定额任务,要求在要求在 95﹪95﹪的概率保证程度下,的概率保证程度下,估计该厂全部工人中完成定额的工估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。人比重及完成定额的工人总数。
例
按 日产量分组(件)组中值(件) 工人数(人)
110~ 114
114~ 118
118~ 122
122~ 126
126~ 130
130~ 134
134~ 138
138~ 142
112
116
120
124
128
132
136
140
3
7
18
23
21
18
6
4
合计 — 100
x f
100100 名工人的日产量分组资料名工人的日产量分组资料
完成定额完成定额的人数的人数
解:
0568.0029.096.1
029.0
1000
1001
1100
1.09.01
1
1
,9.0100
90
,96.1,10,90,100,1000
1
01
pp
p
Z
N
n
n
pp
n
np
ZnnnN
则
己知
则该企业全部工人中完成定额的工人比则该企业全部工人中完成定额的工人比重 及完成定额的工人总数 的置信重 及完成定额的工人总数 的置信区间为:区间为:P NP
0568.09.010000568.09.01000
,0568.09.00568.09.0
NP
P
即该企业工人中完成定额的工人比重在即该企业工人中完成定额的工人比重在0.84320.8432 至至 0.95680.9568 之间,完成定额的工之间,完成定额的工人总数在人总数在 843.2843.2 至至 956.8956.8 人之间,估计人之间,估计的可靠程度为的可靠程度为 95﹪95﹪。。
第五节 必要抽样单位数的确定
一、 确定样本容量的意义一、 确定样本容量的意义
二、 推断总体平均数所需的样本容量二、 推断总体平均数所需的样本容量
三、 推断总体成数所需的样本容量三、 推断总体成数所需的样本容量
四、 必要样本容量的影响因素四、 必要样本容量的影响因素
确定样本容量的意义确定样本容量的意义
样本容量调查误差调查误差
调查费用调查费用
小样本容量小样本容量节省费用但节省费用但调查误差大调查误差大
大样本容量大样本容量调查精度高调查精度高但费用较大但费用较大
找出在规定误差范围内的最小样本容量
找出在限定费用范围内的最大样本容量
推断总体平均数所需的样本容量推断总体平均数所需的样本容量
确确定定方方法法
确确定定方方法法
⑴ ⑴ 重复抽样条件下:重复抽样条件下:
,n
ZZxx
2
2
2
22
xx
Zn
通常的做法是先确定置信度,然后限定抽样极限误差。
或 S通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的 S。
计算结果通常向上进位
推断总体平均数所需的样本容量推断总体平均数所需的样本容量
,12
N
n
nZZ
xx
⑵ ⑵ 不重复抽样条件下:不重复抽样条件下:确确定定方方法法
确确定定方方法法
22
2
222
22
xx N
N
ZN
NZn
例【例【例 AA 】】某食品厂要检验本月生产某食品厂要检验本月生产的的 1000010000 袋某产品的重量,根据上袋某产品的重量,根据上月资料,这种产品每袋重量的标准月资料,这种产品每袋重量的标准差为差为 2525 克。要求在克。要求在 95.45﹪95.45﹪的概的概率保证程度下,平均每袋重量的误率保证程度下,平均每袋重量的误差范围不超过差范围不超过 55 克,应抽查多少袋克,应抽查多少袋产品?产品?
解
袋袋
在不重复抽样条件下:
袋
则在重复抽样条件下:
克克己知
10001.99
252510000
25210000
1005
252
,2,5,25,10000
222
22
222
22
2
22
2
22
ZN
NZn
Zn
ZN
x
x
x
推断总体成数所需的样本容量推断总体成数所需的样本容量
确确定定方方法法
确确定定方方法法
⑴ ⑴ 重复抽样条件下:重复抽样条件下:
,
1
n
PPZZ pp
22
2 11
PP
PPPPZn
通常的做法是先确定置信度,然后限定抽样极限误差。
计算结果通常向上进位
通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的 ;③取方差的最大值 0.25 。
2P
2Ps
推断总体成数所需的样本容量推断总体成数所需的样本容量
,1
1
N
n
n
PPZZ pp
⑵ ⑵ 不重复抽样条件下:不重复抽样条件下:
确确定定方方法法
确确定定方方法法
PPN
PNP
PPZN
PPNZn
pp
1
1
1
1222
2
例【例【例 BB 】】某企业对一批总数为某企业对一批总数为 50005000 件件的产品进行质量检查,过去几次同类调的产品进行质量检查,过去几次同类调查所得的产品合格率为查所得的产品合格率为 93﹪93﹪、、 95﹪95﹪、、96﹪96﹪,为了使合格率的允许误差不超过,为了使合格率的允许误差不超过3﹪3﹪,在,在 99.73﹪99.73﹪的概率保证程度下,的概率保证程度下,应抽查多少件产品?应抽查多少件产品?
【分析】因为共有三个过去的合格率的【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其资料,为保证推断的把握程度,应选其中方差最大者,即中方差最大者,即 P=93﹪P=93﹪。。
解
件件
在不重复抽样条件下:
件
则在重复抽样条件下:
﹪己知
577004.576
0651.0303.05000
0651.035000
1
1
65103.0
0651.031
,0651.01,3,3,5000
22
2
22
2
2
2
2
2
2
PPZN
PPNZn
PPZn
PPZN
p
p
pp
影响样本容量的因素影响样本容量的因素
总体方差的大小;总体方差的大小;允许误差范围的大小;允许误差范围的大小;概率保证程度;概率保证程度;抽样方法;抽样方法;抽样的组织方式。抽样的组织方式。
总体方差的大小;总体方差的大小;允许误差范围的大小;允许误差范围的大小;概率保证程度;概率保证程度;抽样方法;抽样方法;抽样的组织方式。抽样的组织方式。
重复抽样条件下:重复抽样条件下:
2
2
2
22
xx
Zn
不重复抽样条件下不重复抽样条件下::
22
2
222
22
xx N
N
ZN
NZn
第六节 抽样方案设计
• 一、简单随机抽样一、简单随机抽样• 二、类型抽样二、类型抽样• 三、机械抽样三、机械抽样• 四、整群抽样四、整群抽样• 五、多阶段抽样五、多阶段抽样
一、简单随机抽样一、简单随机抽样
1 、概念:又称纯随机抽样。是指不对总体做任何处理,就从总体中的全部单位随机抽选样本单位。
具体做法:直接抽选法 抽签法 随机数码表示法
2 、适用情况:( 1 )对调查对象的情况了解很少( 2 )总体单位的排列没有顺序( 3 )抽到的单位比较分散时也不影响工作3 、误差计算公式
二、类型抽样二、类型抽样
• 1 、概念:又称分类抽样,是指先对总体各单位按一定标志进行分类(层),然后再从各类(层)中按随机原则抽取样本,由各类(层)内的样本组成一个总样本。
• 2 、抽样单位数的确定• ( 1 )类型比例抽样单位数的确定
• ( 2 )类型适宜抽样单位数的确定• 原则:对标志变动程度大的组,抽取样本单位
数的比例应该大些;反之,则应该小些。公式为:
3 、类型抽样误差的计算
• 重复抽样条件下
• 不重复抽样条件下
三、机械抽样三、机械抽样
• 1 、概念:又称等距抽样或系统抽样,是指对研究的总体按一定的顺序排列,每隔一定的间隔抽取一个或若干个单位,并把这些抽取的单位组成样本进行观察的方法。
以“渔文化”为魂演绎渔都风情 - zjoljrpt.zjol.com.cn/resfile/2016-12-23/01/01.pdf · 司董事长周路明说,通过这些文化 场馆的建设,向各地游客展示舟山
2015 中国渔业统计年鉴2015).pdf图 1 2009—2014 年全国渔业经济总产值及构成 渔业 渔业工业和建筑业 渔业流通和服务业 2009 2010 2011 2012 2013 2014