第 8 章 抽样推断与参数估计

39
第8第 第第第第第第第第第

Upload: norman-mayer

Post on 03-Jan-2016

73 views

Category:

Documents


13 download

DESCRIPTION

第 8 章 抽样推断与参数估计. 第一节 抽样误差 第二节 抽样单位数目的确定 第三节 参数估计. 第一节 抽样误差. 2.1 、抽样平均误差 (一)概念 (二)计算 1 、简单随机抽样 2 、类型抽样 3 、等距抽样 4 、整群抽样 5 、阶段抽样 (三)影响抽样平均误差的因素 2.2 、抽样极限误差 2.3 、抽样极限误差与抽样平均误差的关系 返回. 实际误差. 平均误差. 一、抽样平均误差. (一)抽样平均误差的概念. 抽样平均误差:样本指标与总体指标间平均的离差. 二、抽样平均误差计算. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第 8 章  抽样推断与参数估计

第 8 章 抽样推断与参数估计

Page 2: 第 8 章  抽样推断与参数估计

第一节 抽样误差

第二节 抽样单位数目的确定

第三节 参数估计

Page 3: 第 8 章  抽样推断与参数估计

第一节 抽样误差

2.1 、抽样平均误差 (一)概念 (二)计算 1 、简单随机抽样 2 、类型抽样 3 、等距抽样 4 、整群抽样 5 、阶段抽样 (三)影响抽样平均误差的因素 2.2 、抽样极限误差 2.3 、抽样极限误差与抽样平均误差的关系 返回

Page 4: 第 8 章  抽样推断与参数估计

一、抽样平均误差

(一)抽样平均误差的概念)(1 Xx )(2 Xx

Pp 1 Pp 2

实际误差

平均误差MXx

ux

2))((

MPp

up

2)(

• 抽样平均误差:样本指标与总体指标间平均的离差

Page 5: 第 8 章  抽样推断与参数估计

1 、简单随机抽样平均误差的计算公式 ① 平均数的抽样平均误差

② 成数的抽样平均误差

)(重复n

ux

σ

或)1

(2

N

nNn

ux

σ)()1(

2

不重复Nn

nux

σ

)()1(重复

nPP

up

)()1()1(

)1

()1(

不重复或Nn

nPP

uN

nNn

pPu pp

二、抽样平均误差计算

Page 6: 第 8 章  抽样推断与参数估计

练习

1 、某冷库冻鸡平均每只重 1200 克,标准差 70 克,如果重复随机抽取 100 只和 200 只,分别计算抽样平均误差。

2 、该冷库冻鸡合格率为 97% ,如果重复随机抽取 100 只和 200 只,分别计算抽样平均误差。

)(710070

克n

u xx

σ)954

20070

(克xu

%71100

%)971%(971(

nPP

up)

%21200

%)971%(97

pu

Page 7: 第 8 章  抽样推断与参数估计

3 、据电视观众抽样调查资料显示:电视观众平均收视时间为 95 分钟,标准差为 70 ,如果采用重复抽样的方法随机抽取 10000 人或 40000 人,分别计算抽样平均误差。

4 、据 CNNIC “ 中国互联网络发展状况统计报告”显示:截止到 2009年 1 月中国宽带网民占网民总体的 90.6% ,如果采用重复随机抽取方法在网民中抽取 100 人和 400 人,分别计算抽样平均误差。

10000

70

nu xx

40000

70xu

100

%)6.901%(6.901(

n

PPu p

Page 8: 第 8 章  抽样推断与参数估计

5. 从总体 300 个单位中随机重复抽取 36 个单位作样本,其标准差为 6 ,则平均数的平均抽样误差为: ( )

( 1 ) 2 ( 2 ) 1 ( 3 ) 3 ( 4 ) 4

6 .从总体 300 个单位中随机不重复抽取 36个单位作样本,其标准差为 6 ,则平均数的平均抽样误差为: ( )

7. 在随机重复抽样条件下,为使抽样误差减少一半,样本容量应增加到: ( )

( 1 ) 1 倍 ( 2 ) 2 倍 ( 3 ) 3 倍 ( 4 ) 4 倍

Page 9: 第 8 章  抽样推断与参数估计

2 、类型抽样

( 1 )概念:类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。

( 2 )样本单位数在各类型组中的分配方式 ① 等额分配:在各类型组中分配同等单位数。 ② 等比例分配:按各类型组在总体中所占比例分配样本单位

数。即:

③ 最优分配:按各类型组的规模大小和差异程度,确定各类型组的样本单位数。

Nn

Nn

Nn

Nn

k

k 2

2

1

1

Page 10: 第 8 章  抽样推断与参数估计

( 3 )抽样平均误差的计算公式

① 平均数的抽样平均误差 重复

不重复且等比例

② 成数的抽样平均误差 重复

不重复且等比例

nu i

x

NNii

i

2

2 σσ

)1(2

N

n

nu ix

nPP

u iip

)1(

N

NPPPP

ii

k

ii

ii

)1()1( 1

)1()1(

Nn

nPP

u iip

Page 11: 第 8 章  抽样推断与参数估计

例 题

①有 12 块小麦地,每块 1 亩。 6 块处于丘陵地带,亩产量(斤)分别为: 300 330 330 340 370 370 。 6 块处于平原地带,亩产量(斤)分别为: 420 420 450 460 490 520 。抽查 4 块,测定 12 块地的平均亩产量,计算其抽样误差。

② 设亩产在 350 以上的为高产田,抽查 4 块,测定 12 块地高产田的比重,计算其抽样误差。

用类型抽样,每类抽 2 块 计算各组方差 平均组内方差 抽样误差

Page 12: 第 8 章  抽样推断与参数估计

亩产量300 1600

330 100

330 100

340 0

370 900

370 900

合计 3600

211 )( XX

亩产量420 1600

420 1600

450 100

460 0

490 900

520 3600

合计 7800

222 )( XX

1X 2X

丘陵 平原

3401 X

6006

360021

4602 X

13006

780022

95012

6130066002

2

N

N iii

41.1549502

n

σu i

x 5712

)124

1(4950

)1(2

Nn

u ix

Page 13: 第 8 章  抽样推断与参数估计

地块数

高产田数

高产田比重 %

丘陵 6 2 33.3 66.67 22.2

平原 6 6 100 0 0

iP1

)1( ii PP iP

%1.1112

06%2.22)1()1(

NNPP

PP iiiii

%65.164%1.11)1(

n

PPu ii

p

%6.13)124

1(4%1.11

)1()1(

Nn

nPP

u iip

Page 14: 第 8 章  抽样推断与参数估计

3 、等距抽样

( 1 )概念:将总体各单位标志值按某一标志顺序排队,然而按一定的间隔抽取样本单位。

( 2 )排对的方法 ① 无关标志排队 ②有关标志排队( 3 )抽取样本单位的方法 ① 按相等的距离取样 ② 对称等距取样( 4 )抽取第一个样本单位的方法 ① 随机抽取 ②居中抽取

Page 15: 第 8 章  抽样推断与参数估计

4 、整群抽样

(1) 概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数登记调查。

( 2 )抽样平均误差的计算公式

某水泥厂一昼夜的产量为 14400 袋,现每隔 144 分钟抽取 1 分钟的水泥( 10 袋)检查平均每袋重量和一级品率,样本资料如下:

计算抽样平均误差

)1

(2

R

rRr

δu x

x RXX

δ ix

22 )(

rxx

δ ix

22 )(

)1

(2

R

rRr

δu p

p RPP

δ ip

22 )(

rpp

δ ip

22 )(

( 3 )例题

Page 16: 第 8 章  抽样推断与参数估计

一昼夜有 1440 分钟,即把总体分为 1440群, R=1440

每隔 144 分钟抽取 1 分钟的水泥( 10 袋), r= 10

513.0)11440101440

(10652

)1

(2

R

rRr

δu x

x

0069.0)11440101440

(1000048.0

)1

(2

R

rRr

δu p

p

Page 17: 第 8 章  抽样推断与参数估计

(三)影响抽样平均误差的因素

1 、总体标准差的大小 2 、样本单位数的多少 3 、抽样方法的不同 4 、抽样组织方式的差别

Page 18: 第 8 章  抽样推断与参数估计

2.2 抽样极限误差

样本指标围绕总体指标左右两侧波动形成的一定范围。 抽样极限误差:样本指标与总体指标最大可能的误差

范围

Ppp xx

Page 19: 第 8 章  抽样推断与参数估计

2.3 、抽样极限误差与抽样平均误差的关系(一)抽样分布

据中心极限定理,当总体为正态或总体非正态但 n≥30 时,样本均值的分布趋近于正态分布;当 n 足够大时,样本成数的分布近似为正态分布。

(二)关系

x

x

x uuXx

z

Page 20: 第 8 章  抽样推断与参数估计

第三节 抽样单位数目的确定

3.1 、抽样单位数目的计算 (一)简单随机抽样 (二)类型抽样 (三)等距抽样 (四)整群抽样3.2 、影响抽样单位数目的因素

Page 21: 第 8 章  抽样推断与参数估计

3.1 抽样单位数目的计算

(一)简单随机抽样单位数目的确定1 、计算公式( 1 )平均数

( 2 )成数

nzzu x

xx

2

2

22

x

xz

n

222

22

xx

x

zN

Nzn

2

2 )1(

p

PPzn

)1(

)1(22

2

PPzN

PpNzn

p

Page 22: 第 8 章  抽样推断与参数估计

2. 例题

( 1 )某类产品根据以往资料的估计,总体方差 5.456 千克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求可靠程度达到 99.73% ,误差范围不超过 0.9 千克,需要抽多少样本单位?

按题意

( 2 )根据以往资料的估计,该类产品的一等品率为 90% ,可靠程度仍为 99.73% ,误差范围不超过 5% ,推断

该批产品的一等品率,需要抽多少样本单位?按题意

45652 xσ 3z90x

61)90(

456532

2

n

324)050(

109032

2

n

%90P

%5p

3z

Page 23: 第 8 章  抽样推断与参数估计

(二)类型抽样

1 、计算公式

重复抽样 不重复抽样

平均数2

22

x

izn

222

22

ix

i

zN

Nzn

Page 24: 第 8 章  抽样推断与参数估计

2 、例题

某工厂早、中、晚生产罐头 10000瓶,根据以往资料的估计平均重量的类型平均方差为 0.549 克,合格率的类型平均方差为 0.02787 ,要求可靠程度为何 95% ,平均重量的允许误差为 0.11克 ,合格率的允许误差为 0.025 ,用类型抽样推断10000瓶罐头的平均重量和合格率,需要抽多少样本单位?

据题意

1715490)961()110(10000

5490)961(1000022

2

n

10000N 54902 iσ 961z 110x

027870)1( ii PP 0250p

171)0250(

027870)961(2

2

n

Page 25: 第 8 章  抽样推断与参数估计

(三)等距抽样

计算公式( 1 )按有关标志排队 同类型重复抽样

( 2 )按无关标志排队 同简单随机不重复抽样

2

22

x

izn

2

2

2)1(

p

ii ppzn

22

2

2

22

2

xx

x

zN

Nzn

)1(

)1(2

2

2

2

2

PPzN

PpNzn

p

Page 26: 第 8 章  抽样推断与参数估计

3.2、影响抽样单位数目的因素

总体各单位的变异程度抽样推断的准确程度△抽样推断的可靠程度 Z 抽样的组织形式 抽样的方法

σ

Page 27: 第 8 章  抽样推断与参数估计

第四节 抽样估计

4.1 估计量的优良标准 : 无偏性、有效性、一致性

4.2 抽样估计的方法 (一)点估计:直接用样本指标代替总体指标不能准确的告诉我们估计的把握程度(二)区间估计 :不仅仅告诉我们一个范围,告诉我们估计

的把握程度 1 、平均数的区间估计 2 、成数的区间估计 3 、 2 个总体平均数之差的估计

4 、两个总体比例之差的估计

Page 28: 第 8 章  抽样推断与参数估计

二、抽样估计的方法

(一)点估计

(二)区间估计 特点:不是指出被估计参数的确定数值,而是指出被估计参数的的可能范

围,同时对参数落在某一范围内给定相应概率的保证程度。 z- 概率度 1 、平均数的区间估计 (1) 样本取自总体方差已知的正态分布 (大、小样本)

xX pP

xu

Xxz

xx

zuxXuzx

返回

nux

)1

(2

NnN

nux

Page 29: 第 8 章  抽样推断与参数估计

例:经抽样调查计算样本亩产粮食 600 公斤,并求得抽样平均误差是 3 公斤,现给定抽样误差极限为 6 公斤,求总体平均亩产落在估计区间的概率?

已知: u=3 公斤 Δ=6 公斤则估计区间( 600-6, 600+6) = ( 594, 606 )

查正态概率表得,落在估计区间的概率为 : F( z)=F(2)=95.45%

600x

23

6|

|Xx

z

Page 30: 第 8 章  抽样推断与参数估计
Page 31: 第 8 章  抽样推断与参数估计

例:麦当劳餐馆在7星期内抽查4 9 名顾客的消费额如下 ,在概率 90%的保证下 , 顾客平均消费额的估计区间.

15 24 38 26 30 42 18 30 25 34 44 20 35 46 28 47…..

解:①计算样本的平均数和标准差:

② 根据给定的置信度F (z )= 90%, 查概率表 z=1.64

③ 计算 : 消费额下限 = 消费额上限 = 点估计 :麦当劳餐馆顾客平均消费额为 32元 区间估计 :以 90% 的概率保证 ,麦当劳餐馆顾客消费额在 29.8-34.2之间

35.149

45.9

n

32x45.9

元2.235.164.1 z

元8.292.232 x元2.342.232 x

Page 32: 第 8 章  抽样推断与参数估计

某制造厂质量管理部门希望估计本厂生产的 5500包原材料的平均重量,抽出 250包,测得平均重量 65 千克。总体标准差 15 千克。总体为正态分布,在置信水平为 95% 的条件下建立这种原材料的置信区间。

5500包原材料的平均重量在 63.14~66.86之间。

65x 15

96.1z

86.165250

1596.165

nzx

Page 33: 第 8 章  抽样推断与参数估计

总体平均数估计 根据置信度的要求,估计极限误差可能的范围,并指出估计区间,具体步骤如下:

① 抽取样本,并根据样本的标志值求出样本平均数 和标准差S,在大样本的情况下用 S 代替

② 根据给定的置信度F (z ),查正态分布概率表得到 z

③ 根据 计算估计区间的上下限。z

x

Page 34: 第 8 章  抽样推断与参数估计

例:为了估计一分钟广告的平均费用,抽出 15 个电视台组成样本,得样本均值 10000元,标准差 2000元。总体近似服从正态分布,在置信水平为 96.76%(z=2.14) 的条件下建立广告平均费用的置信区间。

电视台一分钟广告的平均费用在 8894~11106之间。

10000x 2000s 14.2z110610000

15

200014.210000

n

szx

Page 35: 第 8 章  抽样推断与参数估计

(二 )根据极限抽样误差 ,求概率保证度F (z ) 。具体步骤如下: ① 抽取样本,并根据样本的标志值求出样本平均数 作为总体

平均数的估计值,并计算标准差 S以推算平均误差② 根据给定的极限抽样误差,估计总体平均数上下限。③ 根据 概率度z, 查正态分布概率表,求得置信度

F(z )。z

x

Page 36: 第 8 章  抽样推断与参数估计

在一项新广告的跟踪调查中,在被调查的 400 人中有 240 人会记起广告的标语。试求会记起广告语占总体比率的 95%置信度的估计区间。

根据样本资料计算: P=n1/n2=240/400=60%

根据给定的置信度要求 F(Z)= 95% ,查表 Z=1.96 根据

以概率 95% 的保证程度,会计会记起广告语的人数占总体比率的55.2-64.8之间

0245.0400

4.06.0)1(

49.0)6.01(6.0)1(

n

pp

pp

64.8%%8.4%60

55.2%%8.4%60

%8.4%45.296.1

p

p

z

上限下限

:则总体比率的上下限为

Page 37: 第 8 章  抽样推断与参数估计

总体成数的估计 (一 )根据置信度的要求,估计极限误差可能的范围,并指出估

计区间范围,具体步骤如下: ① 抽取样本,计算样本的成数 p和标准差 S,并由此推算出抽

样的平均误差 u

② 根据给定的置信度F (z ),查正态分布概率表得到 z

③ 根据 计算总体成数的上下限。z

Page 38: 第 8 章  抽样推断与参数估计

成数的区间估计

•例 1: 某企业在一项关于职工流动原因的研究中,从原职工中随机抽取了 200 人访问,有 140 人离开的原因是工资太低。以 95% 的置信水平对总体这种原因离开的人员比例进行区间估计。

7.0p 96.1z064.07.0

200

)7.01(7.096.17.0

)1(

n

ppzp

该企业由于工资低离开的职工比例为 63.6% 与 76.4%之间

Page 39: 第 8 章  抽样推断与参数估计