第 5 章 统计抽样与参数估计

126

Upload: alana-ochoa

Post on 03-Jan-2016

125 views

Category:

Documents


0 download

DESCRIPTION

第 5 章 统计抽样与参数估计. ★. 第一节 抽样推断 第二节 抽样误差 第三节 参数估计的基本方法 第四节 抽样组织的设计. 第一节 抽样推断. ★. 一、抽样推断的意义和一般步骤 二、总体参数与样本统计量 三、抽样框与样本数 四、概率抽样与非概率抽样. 一、抽样推断的意义和一般步骤. ㈠ 抽样推断的定义 ㈡ 抽样推断的特点 ㈢ 抽样推断的运用 ㈣ 抽样推断的一般步骤. 抽样推断. 按照 随机原则 从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第 5 章  统计抽样与参数估计
Page 2: 第 5 章  统计抽样与参数估计

工大经院 统计学

STAT

第第 55 章 统计抽样与参数估章 统计抽样与参数估计计

★第一节第一节 抽样推断抽样推断第二节第二节 抽样误差抽样误差第三节第三节 参数估计的基本方法参数估计的基本方法第四节第四节 抽样组织的设计 抽样组织的设计

Page 3: 第 5 章  统计抽样与参数估计

第一节第一节 抽样推断抽样推断

一、抽样推断的意义和一般步骤一、抽样推断的意义和一般步骤二、总体参数与样本统计量二、总体参数与样本统计量三、抽样框与样本数三、抽样框与样本数四、概率抽样与非概率抽样四、概率抽样与非概率抽样

Page 4: 第 5 章  统计抽样与参数估计

一、抽样推断的意义和一般步骤一、抽样推断的意义和一般步骤

㈠ 抽样推断的定义㈠ 抽样推断的定义㈡ 抽样推断的特点㈡ 抽样推断的特点㈢ 抽样推断的运用㈢ 抽样推断的运用㈣ 抽样推断的一般步骤㈣ 抽样推断的一般步骤

Page 5: 第 5 章  统计抽样与参数估计

指样本单位的抽取不受主指样本单位的抽取不受主观因素及其他系统性因素观因素及其他系统性因素的影响,每个总体单位都的影响,每个总体单位都

有均等的被抽中机会有均等的被抽中机会

抽样推断抽样推断抽样推断抽样推断

按照按照随机原则随机原则 从调查对象中抽取一部分从调查对象中抽取一部分单位进行调查,并以调查结果对总体数单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法推断,从而认识总体的一种统计方法

Page 6: 第 5 章  统计抽样与参数估计

统计推断

全及总体指标:全及总体指标:参数(未知量)

样本总体指标:样本总体指标:统计量(已知量)

抽样推断抽样推断抽样推断抽样推断

Page 7: 第 5 章  统计抽样与参数估计

并非所有的抽样估计都按随机原并非所有的抽样估计都按随机原则抽取样本,也有则抽取样本,也有非随机抽样非随机抽样

总体总体

随机样本随机样本

非随机样本非随机样本

与总体分布与总体分布特征相同特征相同

与总体分布与总体分布特征不同特征不同

Page 8: 第 5 章  统计抽样与参数估计

按随机原则抽取样本单位按随机原则抽取样本单位目的是推断总体的数量特征目的是推断总体的数量特征抽样推断的结果具有一定的可靠程度,抽样推断的结果具有一定的可靠程度,抽样误差可以事先计算并控制抽样误差可以事先计算并控制

抽样推断的特点抽样推断的特点抽样推断的特点抽样推断的特点

Page 9: 第 5 章  统计抽样与参数估计

 不可能进行全面调查时 不可能进行全面调查时 不必要进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时 对全面调查资料进行补充修正时

抽样推断的应用抽样推断的应用抽样推断的应用抽样推断的应用

Page 10: 第 5 章  统计抽样与参数估计

抽样调查研究Sampling Study

为什么要抽样? 1. 涉及破坏受试对象

质量控制2. 取得精确可靠的结果3. 实际情况的约束

时间,成本等

Page 11: 第 5 章  统计抽样与参数估计

设设计计抽抽样样方方案案

抽抽取取样样本本单单位位

收收集集样样本本数数据据

计计算算样样本本统统计计量量

推推断断总总体体参参数数

抽样推断的一般步骤抽样推断的一般步骤抽样推断的一般步骤抽样推断的一般步骤

Page 12: 第 5 章  统计抽样与参数估计

第一节第一节 抽样推断抽样推断

一、抽样推断的意义和一般步骤一、抽样推断的意义和一般步骤二、总体参数与样本统计量二、总体参数与样本统计量三、抽样框与样本数三、抽样框与样本数四、概率抽样与非概率抽样四、概率抽样与非概率抽样

★★

Page 13: 第 5 章  统计抽样与参数估计

二、总体参数和样本估计量二、总体参数和样本估计量

㈠ 总体和样本㈠ 总体和样本

㈡ 总体参数和样本统计量㈡ 总体参数和样本统计量

Page 14: 第 5 章  统计抽样与参数估计

• 总体(总体( populationpopulation )) 全及总体简称总体,是指所要认识对象的全体。全及总体简称总体,是指所要认识对象的全体。 全及总体的单位数用全及总体的单位数用 NN 表示,即使是有限总体,表示,即使是有限总体, NN

一般也都是很大的。一般也都是很大的。

• 样本(样本( samplesample )) 样本总体简称样本。是从全及总体中随机抽取出来,样本总体简称样本。是从全及总体中随机抽取出来,

代表全及总体的部分单位的集合体。代表全及总体的部分单位的集合体。 样本总体的单位数通常用样本总体的单位数通常用 nn 表示,对于表示,对于 NN 来说,来说, nn 是是

很小的。 很小的。

Page 15: 第 5 章  统计抽样与参数估计

一般来说,样本单位数达到或超过一般来说,样本单位数达到或超过 3030 个称为大个称为大样本,样本, 3030 个以下称为小样本。社会经济调查一般个以下称为小样本。社会经济调查一般为大样本。为大样本。

• 以很小的样本来推断很大的总体,这是抽样推断以很小的样本来推断很大的总体,这是抽样推断的特点之一。的特点之一。

• 把 把 n/N n/N 叫做抽样比例。 叫做抽样比例。

• 全及总体是唯一确定的。而一个总体中可能抽取全及总体是唯一确定的。而一个总体中可能抽取很多个抽样的样本。很多个抽样的样本。

•样本概念的二重性:一般的讨论样本时,样本应理样本概念的二重性:一般的讨论样本时,样本应理解为解为 nn 维随机变量;在一次具体容量为维随机变量;在一次具体容量为 nn 的抽样中,的抽样中,则样本是则样本是 nn 维随机变量的一个观察值。 维随机变量的一个观察值。

Page 16: 第 5 章  统计抽样与参数估计

X

某个样本某个样本容量的抽容量的抽样分布样分布

更大样本更大样本容量的抽容量的抽样分布样分布

nx

Page 17: 第 5 章  统计抽样与参数估计

设总体中 个总体单位某项标志的标志值分别设总体中 个总体单位某项标志的标志值分别为 ,其中具有某种属性的有 个为 ,其中具有某种属性的有 个单位,不具有某种属性的有 个单位,则单位,不具有某种属性的有 个单位,则

设总体中 个总体单位某项标志的标志值分别设总体中 个总体单位某项标志的标志值分别为 ,其中具有某种属性的有 个为 ,其中具有某种属性的有 个单位,不具有某种属性的有 个单位,则单位,不具有某种属性的有 个单位,则

N

NXXX ,, 21

0N1N

⒈ ⒈ 总体平均数(又叫总体均值):总体平均数(又叫总体均值):

m

ii

m

iii

N

ii

f

fXX

N

XX

1

11 或

指被估计的总体指标,又被指被估计的总体指标,又被称为称为全及指标全及指标

总体参数总体参数总体参数总体参数

Page 18: 第 5 章  统计抽样与参数估计

m

iiim

ii

N

ii

fXXf

XXN 1

2

1

1

2 11 或

⒉ ⒉ 总体单位标志值的标准差:总体单位标志值的标准差:

⒊ ⒊ 总体单位标志值的方差:总体单位标志值的方差:

m

iiim

ii

N

ii fXX

fXX

N 1

2

1

2

1

22 11 或

Page 19: 第 5 章  统计抽样与参数估计

PN

NQ

N

NP 1, 01⒋ ⒋ 总体成数:总体成数:

⒌ ⒌ 总体是非标志的标准差:总体是非标志的标准差:

PQPPP 1

⒍ ⒍ 总体是非标志的方差:总体是非标志的方差:

PQPPP 12

有最大值时,当 PQP 5.0

Page 20: 第 5 章  统计抽样与参数估计

设样本中 个样本单位某项标志的标志值设样本中 个样本单位某项标志的标志值分别为 ,其中具有和不具有某分别为 ,其中具有和不具有某种属性的样本单位数目分别为 和 个,则种属性的样本单位数目分别为 和 个,则

设样本中 个样本单位某项标志的标志值设样本中 个样本单位某项标志的标志值分别为 ,其中具有和不具有某分别为 ,其中具有和不具有某种属性的样本单位数目分别为 和 个,则种属性的样本单位数目分别为 和 个,则

nnxxx ,, 21

0n1n

⒈ ⒈ 样本平均数(又叫样本均值):样本平均数(又叫样本均值):

m

ii

m

iii

n

ii

f

fxx

n

xx

1

11 或

指根据样本单位的标志值计算的用指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合以估计和推断相应总体指标的综合指标,又被称为指标,又被称为估计量或统计量估计量或统计量

样本估计量样本估计量样本估计量样本估计量

Page 21: 第 5 章  统计抽样与参数估计

⒉ ⒉ 样本单位标志值的标准差:样本单位标志值的标准差:

⒊ ⒊ 样本单位标志值的方差:样本单位标志值的方差:

m

iiim

ii

n

ii fxx

fsxx

ns

1

2

1

1

2

1

1

1

1或

m

iiim

ii

n

ii fxx

fsxx

ns

1

2

1

2

1

22

1

1

1

1或

为自由度

为 的无偏估计2

为 的无偏估计

Page 22: 第 5 章  统计抽样与参数估计

pn

nq

n

np 1, 01

⒋ ⒋ 样本成数:样本成数:

⒌ ⒌ 样本单位是非标志的标准差:样本单位是非标志的标准差:

pqn

npp

n

nsp 1

11

⒍ ⒍ 样本单位是非标志的方差:样本单位是非标志的方差:

pqn

npp

n

nsp 1

11

2

为 的无偏估计

2P

为 的无偏估计

P

Page 23: 第 5 章  统计抽样与参数估计

总体参数总体参数 样本统计量样本统计量名称名称 符号符号 名称名称 符号符号

总体容量 总体容量 样本容量 样本容量

总体平均数 总体平均数 样本平均数 样本平均数

总体方差 总体方差 样本方差 样本方差

总体标准差 总体标准差 样本标准差 样本标准差

总体比例 总体比例 样本比例 样本比例

N

X2

P

nx

2ssp

Page 24: 第 5 章  统计抽样与参数估计

第一节第一节 抽样推断抽样推断

一、抽样推断的意义和一般步骤一、抽样推断的意义和一般步骤二、总体参数与样本统计量二、总体参数与样本统计量三、抽样框与样本数三、抽样框与样本数四、概率抽样与非概率抽样四、概率抽样与非概率抽样

★★★

Page 25: 第 5 章  统计抽样与参数估计

㈠ 抽样框㈠ 抽样框㈡ 抽样方法㈡ 抽样方法㈢ 抽样组织方式㈢ 抽样组织方式㈣ 样本数和样本容量㈣ 样本数和样本容量

三、三、抽样框与样本数抽样框与样本数

Page 26: 第 5 章  统计抽样与参数估计

㈠ 随机原则㈠ 随机原则—— 抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位㈡ 抽样误差最小㈡ 抽样误差最小—— 在其他条件相同的情况下,选抽样误差最小的方案㈢ 费用最少㈢ 费用最少—— 在其他条件相同的情况下,选费用最少的方案

设计抽样方案时,通常是设计抽样方案时,通常是在误差达到一定要求的条在误差达到一定要求的条

件下,选择费用最少的方案件下,选择费用最少的方案

抽样方案设计的基本准则抽样方案设计的基本准则抽样方案设计的基本准则抽样方案设计的基本准则

Page 27: 第 5 章  统计抽样与参数估计

抽样框抽样框抽样框抽样框 指包括全部抽样单位的名单框架,指包括全部抽样单位的名单框架,仅对有限总体而言仅对有限总体而言

主要形式

主要形式

名单抽样框名单抽样框

区域抽样框区域抽样框

时间表抽样框时间表抽样框

编制抽样框编制抽样框编制抽样框编制抽样框

Page 28: 第 5 章  统计抽样与参数估计

• 列出全部总体单位列出全部总体单位名录的一览表。名录的一览表。

• 如职工或企业名单如职工或企业名单等。等。

• 可采用抽签方式或可采用抽签方式或随机数字表进行抽随机数字表进行抽选样本的单位。选样本的单位。

名单抽样框名单抽样框 序序号号

学号学号 姓名姓名

11 05112101010511210101 关晶璞关晶璞

22 05112101020511210102 胡遵权胡遵权33 05112101030511210103 焦杨焦杨44 05112101040511210104 李源李源55 05112101050511210105 刘顺先刘顺先66 05112101070511210107 王军王军77 05112101080511210108 徐士民徐士民88 05112101090511210109 杨保中杨保中…… …… ……

Page 29: 第 5 章  统计抽样与参数估计

区域抽样框区域抽样框

在商场的大门口

在微波炉柜台前

在市区街道旁边

在某个住宅小区

和平区、河西区…   南开区    

八里台街、新兴路街…  

学府街   

平湖里、风湖里…   

照湖里

居民一组

居民二组…

某外国公司在天津进某外国公司在天津进行微波炉市场调查:行微波炉市场调查:

Page 30: 第 5 章  统计抽样与参数估计

时间表抽样框时间表抽样框连续出产的产品总体可以编制抽样框:均匀的出产时间、可以预见到的产品总量。

连续到加油站加油的汽车总体无法编制抽样框:时间不定、总量也无法确定。

Page 31: 第 5 章  统计抽样与参数估计

抽样方法抽样方法抽样方法抽样方法

重复抽样重复抽样重复抽样重复抽样 又被称作重置抽样、有放回抽样又被称作重置抽样、有放回抽样

抽出个体

登记特征

放回总体

继续抽取

特点特点 同一总体单位有可能被重复抽中,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行而且每次抽取都是独立进行

Page 32: 第 5 章  统计抽样与参数估计

不重复抽样不重复抽样不重复抽样不重复抽样又被称作不重置抽样、不放又被称作不重置抽样、不放回抽样回抽样

抽出个体

登记特征

继续抽取

特点特点同一总体中每个单位被抽中的机会并同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不均等,在连续抽取时,每次抽取都不是独立进行不是独立进行

是最为常用的抽样方法,用于无限总体和是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。许多有限总体样本单位的抽样。 是最为常用的抽样方法,用于无限总体和是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。许多有限总体样本单位的抽样。

Page 33: 第 5 章  统计抽样与参数估计

第一节第一节 抽样推断抽样推断

一、抽样推断的意义和一般步骤一、抽样推断的意义和一般步骤二、总体参数与样本统计量二、总体参数与样本统计量三、抽样框与样本数三、抽样框与样本数四、概率抽样与非概率抽样四、概率抽样与非概率抽样

★★★★

Page 34: 第 5 章  统计抽样与参数估计

概率抽样概率抽样• 按照概率的随机原则抽取样本,称为概率抽样,按照概率的随机原则抽取样本,称为概率抽样,

得到的样本称为随机样本。得到的样本称为随机样本。

• 基本的概率抽样方式有:简单随机抽样、分层抽基本的概率抽样方式有:简单随机抽样、分层抽样、等距抽样和整群抽样。样、等距抽样和整群抽样。

• 从理论上说,概率抽样是最理想最科学的抽样方从理论上说,概率抽样是最理想最科学的抽样方法,能保证样本数据对总体参数的代表性,而且法,能保证样本数据对总体参数的代表性,而且能够将抽样误差限制在一定范围之内。相对来说,能够将抽样误差限制在一定范围之内。相对来说,也是花费较大的抽样方式。也是花费较大的抽样方式。

Page 35: 第 5 章  统计抽样与参数估计

非概率抽样非概率抽样• 也叫做非随机抽样。是根据调查者的经验或判断,从也叫做非随机抽样。是根据调查者的经验或判断,从

总体中有意识的抽取若干单位构成样本。总体中有意识的抽取若干单位构成样本。

• 重点调查、典型调查、配额调查、方便调查等都属于重点调查、典型调查、配额调查、方便调查等都属于非随机抽样。非随机抽样。

• 大多数种类的研究,如产品测试、街头访问、电话调大多数种类的研究,如产品测试、街头访问、电话调查、座谈会等,只要不是属于要进行总体数量推论的查、座谈会等,只要不是属于要进行总体数量推论的项目都可以使用。项目都可以使用。

• 容易产生倾向性误差,且不能计算和控制抽样误差,容易产生倾向性误差,且不能计算和控制抽样误差,无法说明调查结果的可靠程度。无法说明调查结果的可靠程度。

Page 36: 第 5 章  统计抽样与参数估计

工大经院 统计学

STAT

第第 55 章 统计抽样与参数估章 统计抽样与参数估计计

★第一节第一节 抽样推断抽样推断第二节第二节 抽样误差抽样误差第三节第三节 参数估计的基本方法参数估计的基本方法第四节第四节 抽样组织的设计 抽样组织的设计

Page 37: 第 5 章  统计抽样与参数估计

工大经院 统计学

STAT第二节第二节 抽样误差抽样误差

★ 一、一、抽样误差的概念抽样误差的概念二、影响二、影响抽样误差的因素抽样误差的因素三、抽样平均误差三、抽样平均误差四、抽样极限误差四、抽样极限误差五、抽样估计的概率度、精度五、抽样估计的概率度、精度 和可靠程度和可靠程度

Page 38: 第 5 章  统计抽样与参数估计

统计误差 统计误差 • 统计调查中的两类误差:统计调查中的两类误差:• 一类是调查误差——各种调查方式中都可一类是调查误差——各种调查方式中都可

能出现。指在调查过程中由于观察、测量、能出现。指在调查过程中由于观察、测量、登记、计算上的差错而引起的误差。又称登记、计算上的差错而引起的误差。又称为登记性误差。为登记性误差。

• 一类是一类是代表性误差代表性误差——指在抽样调查过程——指在抽样调查过程中用样本推断总体指标时可能产生的误差,中用样本推断总体指标时可能产生的误差,是样本对于总体代表性引起的误差。是样本对于总体代表性引起的误差。

Page 39: 第 5 章  统计抽样与参数估计

• 代表性误差的两种情况:代表性误差的两种情况:

• 系统性偏误——由于违反随机原则而产生系统性偏误——由于违反随机原则而产生的系统性误差。的系统性误差。

• 随机性误差——按随机原则抽样时,不同随机性误差——按随机原则抽样时,不同抽样所得到的不同抽样指标值与总体参数抽样所得到的不同抽样指标值与总体参数之间的差异,具有随机性和偶然性,是抽之间的差异,具有随机性和偶然性,是抽样调查本身不可避免的误差。但这种随机样调查本身不可避免的误差。但这种随机性误差可利用大数定律精确的计算并通过性误差可利用大数定律精确的计算并通过抽样设计加以控制。抽样设计加以控制。

Page 40: 第 5 章  统计抽样与参数估计

说说明明说说明明

对于任何一个样本,其抽样误对于任何一个样本,其抽样误差都不可能测量出来差都不可能测量出来抽样误差的大小可以依据概率抽样误差的大小可以依据概率分布理论加以说明分布理论加以说明

指样本估计量与总体参数之间数量指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不抽取样本而产生的代表性误差,不包括登记性误差和系统偏差包括登记性误差和系统偏差

抽样误差抽样误差抽样误差抽样误差

Page 41: 第 5 章  统计抽样与参数估计

常见的抽样误差常见的抽样误差常见的抽样误差常见的抽样误差

• 抽样平均数与总体平均数之差抽样平均数与总体平均数之差

• 抽样成数与总体成数之差抽样成数与总体成数之差

Xx

Pp

Page 42: 第 5 章  统计抽样与参数估计

工大经院 统计学

STAT第二节第二节 抽样误差抽样误差

★ 一、一、抽样误差的概念抽样误差的概念二、影响二、影响抽样误差的因素抽样误差的因素三、抽样平均误差三、抽样平均误差四、抽样极限误差四、抽样极限误差五、抽样估计的概率度、精度五、抽样估计的概率度、精度 和可靠程度和可靠程度

Page 43: 第 5 章  统计抽样与参数估计

影响抽样误差的因素影响抽样误差的因素影响抽样误差的因素影响抽样误差的因素

总体各单位标志值的差异程度(即标准总体各单位标志值的差异程度(即标准差的大小):差的大小): 越大,抽样误差越大;越大,抽样误差越大;样本单位数的多少:样本单位数的多少: 越大,抽样误差越大,抽样误差越小;越小;抽样方法:抽样方法:不重复抽样的抽样误差比重不重复抽样的抽样误差比重复抽样的抽样误差小;复抽样的抽样误差小;抽样组织方式:抽样组织方式:简单随机抽样的误差最简单随机抽样的误差最大。大。

n

Page 44: 第 5 章  统计抽样与参数估计

1.1. 所有样本指标(如均值、比例、方差等)所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布所形成的分布称为抽样分布

2.2. 是一种理论概率分布是一种理论概率分布3.3. 随机变量是 随机变量是 样本统计量样本统计量

———— 样本均值样本均值 , , 样本比例等样本比例等

4.4. 结果来自结果来自容量相同容量相同的的所有所有可能样本可能样本

抽样分布抽样分布(概念要点)(概念要点)

Page 45: 第 5 章  统计抽样与参数估计

样本统计量 总体未

知参数

样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量

抽样分布抽样分布抽样分布抽样分布 样本统计量所有可能值的样本统计量所有可能值的概率分布概率分布

主要样本

统计量

平均数 比率(成数) 方差平均数 比率(成数) 方差

x p 2S

Page 46: 第 5 章  统计抽样与参数估计

样本均值的抽样分布样本均值的抽样分布(一个例子)(一个例子)

【例】设一个总体,含有【例】设一个总体,含有 44 个元素(个体),即总个元素(个体),即总体单位数体单位数 NN=4=4 。。 4 4 个个体分别为个个体分别为 XX11=1=1 、、 XX22=2=2 、、XX33=3 =3 、、 XX44=4 =4 。总体的均值、方差及分布如下。总体的均值、方差及分布如下

均值和方差均值和方差 总体分布总体分布

11 4422 3300.1.1

.2.2

.3.35.21

N

XN

ii

5.21

N

XN

ii

25.1)(

1

2

2

N

XN

ii

25.1)(

1

2

2

N

XN

ii

Page 47: 第 5 章  统计抽样与参数估计

样本均值的抽样分布样本均值的抽样分布 (一个例子)(一个例子)

现从总体中抽取现从总体中抽取 nn == 22 的简单随机样本,在重的简单随机样本,在重复抽样条件下,共有复抽样条件下,共有 4422=16=16 个样本。所有样本的个样本。所有样本的结果如下表结果如下表

•3,43,4•3,33,3•3,23,2•3,13,1•33

•2,42,4•2,32,3•2,22,2•2,12,1•22

•4,44,4•4,34,3•4,24,2•4,14,1•44

•1,41,4

•44

•1,31,3

•33•22•11

•1,21,2•1,11,1•11

•第二个观察值第二个观察值•第一个第一个•观察值观察值

•所有可能的所有可能的 nn = 2 = 2 的样本(共的样本(共 1616 个)个)

Page 48: 第 5 章  统计抽样与参数估计

样本均值的抽样分布样本均值的抽样分布 (一个例子)(一个例子)

计算出各样本的均值,如下表。并给出样本计算出各样本的均值,如下表。并给出样本均值的抽样分布均值的抽样分布

•3.53.5•3.03.0•2.52.5•2.02.0•3

•3.03.0•2.52.5•2.02.0•1.51.5•2

•4.04.0•3.53.5•3.03.0•2.52.5•4

•2.52.5

•4

•2.02.0

•3•2•1

•1.51.5•1.01.0•1

•第二个观察值•第一个•观察值

•16 个样本的均值( x )

样本均值的抽样分布样本均值的抽样分布1.01.0

00

.1.1

.2.2

.3.3 P P ( ( x x ))

1.51.5 3.03.0 4.04.03.53.52.02.0 2.52.5xx

Page 49: 第 5 章  统计抽样与参数估计

所有样本均值的均值和方差所有样本均值的均值和方差

XX

式中:式中: MM 为样本数目为样本数目

比较及结论:比较及结论: 1. 1. 样本均值的均值(数学期望)等于总体均样本均值的均值(数学期望)等于总体均值值

2. 2. 样本均值的方差等于总体方差的样本均值的方差等于总体方差的 1/1/nn

n

M

xn

ixi

x

222

1

2

2

625.016

)5.20.4()5.20.1(

)(

n

M

xn

ixi

x

222

1

2

2

625.016

)5.20.4()5.20.1(

)(

5= u.2

16

0.45.10.11 M

xn

ii

XX

Page 50: 第 5 章  统计抽样与参数估计

样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较

XX

XX

抽样分布抽样分布

= 2.5 = 2.5 σσ2 2 =1.25=1.25

总体分布总体分布

11 4422 3300

.1.1

.2.2

.3.3

P P ( ( x x ))

1.01.0

00

.1.1

.2.2

.3.3

1.51.5 3.03.0 4.04.03.53.52.02.0 2.52.5 xx

625.02 x 625.02 xXX = 2.5= 2.5

Page 51: 第 5 章  统计抽样与参数估计

样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理

= 50= 50 = 50= 50

=10=10 =10=10

XXXX

总体分布总体分布总体分布总体分布

nn = 4 = 4

抽样分布抽样分布抽样分布抽样分布X

nn =16 =165x 5x

50x 50x

5.2x 5.2x

当总体服从正态分布当总体服从正态分布 N N ~ (~ (μμ,,σσ2 2 )) 时,来自该总体的时,来自该总体的所有容量为所有容量为 nn 的样本的均值的样本的均值 XX 也服从正态分布,也服从正态分布,XX 的数学期望为的数学期望为 μμ ,方差为,方差为 σσ22//nn 。即。即 XX ~~ NN((μμ,,σσ22//nn))

Page 52: 第 5 章  统计抽样与参数估计

中心极限定理(图示)

当样本容量足够当样本容量足够大时大时 ((nn 30) 30) ,样本均值的抽,样本均值的抽样分布逐渐趋于样分布逐渐趋于正态分布正态分布

x n

x n

中心极限定理:设从均值为中心极限定理:设从均值为,方差为,方差为 22 的一个任意总的一个任意总

体中抽取容量为体中抽取容量为 nn 的样本,当的样本,当 nn 充分大时,样本均值的充分大时,样本均值的抽样分布近似服从均值为抽样分布近似服从均值为 μμ 、方差为、方差为 σσ22//nn 的正态分布的正态分布

一个任意分一个任意分布的总体布的总体

x x XX

Page 53: 第 5 章  统计抽样与参数估计

平均数的抽样分布平均数的抽样分布平均数的抽样分布平均数的抽样分布全部可能样本平均数的均值等于总体均全部可能样本平均数的均值等于总体均值,即:  值,即:  从非正态总体中抽取的样本平均数当从非正态总体中抽取的样本平均数当 nn足够大时其分布接近正态分布。 足够大时其分布接近正态分布。 从正态总体中抽取的样本平均数不论容从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。 量大小其分布均为正态分布。 样本均值的标准差为总体标准差的样本均值的标准差为总体标准差的 n

1

)()( XxXxE

Page 54: 第 5 章  统计抽样与参数估计

比率的抽样分布比率的抽样分布比率的抽样分布比率的抽样分布全部可能样本比率的均值等于总体比率,全部可能样本比率的均值等于总体比率,即:    即:    从非正态总体中抽取的样本比率,当从非正态总体中抽取的样本比率,当 nn足够大时其分布接近正态分布。 足够大时其分布接近正态分布。 从正态总体中抽取的样本比率,不论容从正态总体中抽取的样本比率,不论容量大小其分布均为正态分布。量大小其分布均为正态分布。样本比率的标准差为总体标准差的样本比率的标准差为总体标准差的

)()( PpPpE

n

1

Page 55: 第 5 章  统计抽样与参数估计

X

5

10

样本抽样分布

原总体分布

x

X

Page 56: 第 5 章  统计抽样与参数估计

估计量的优良性准则估计量的优良性准则(无偏性)(无偏性)

PP( ( X X ))

XX

CCCCAAAA

无偏无偏无偏无偏 有偏有偏有偏有偏

指样本指标的均值应等于被估计的总指样本指标的均值应等于被估计的总体指标。或说,体指标。或说,估计量的数学期望等估计量的数学期望等于被估计的总体参数。于被估计的总体参数。

无偏性无偏性无偏性无偏性

Page 57: 第 5 章  统计抽样与参数估计

估计量的优良性准则估计量的优良性准则(有效性)(有效性)

AA

BB

中位数的抽样分布中位数的抽样分布

均值的抽样分布均值的抽样分布

XX

PP((X X ))

作为优良的估计量,除了满足无偏性的要求作为优良的估计量,除了满足无偏性的要求外,其方差应比较小。或说,外,其方差应比较小。或说,一个方差较小一个方差较小的无偏估计量称为一个更有效的估计量。的无偏估计量称为一个更有效的估计量。

有效性有效性有效性有效性

Page 58: 第 5 章  统计抽样与参数估计

估计量的优良性准则估计量的优良性准则(一致性)(一致性)

AA

BB

较小的样本容量较小的样本容量

较大的样本容量较大的样本容量

PP((X X ))

XX

指随着样本单位数 的增大,样本估计量指随着样本单位数 的增大,样本估计量将在概率意义下越来越接近于总体真实值将在概率意义下越来越接近于总体真实值

n一致性一致性一致性一致性

对于任意 ε>0 ,有 1ˆ lim

Pn

Page 59: 第 5 章  统计抽样与参数估计

为  的无偏、有效、一致估计量; 为  的无偏、有效、一致估计量; 为  的无偏、有效、一致估计量。

x X

1nS p P

数理统计证明:数理统计证明:

抽样估计量的优良标准抽样估计量的优良标准抽样估计量的优良标准抽样估计量的优良标准

Page 60: 第 5 章  统计抽样与参数估计

工大经院 统计学

STAT第二节第二节 抽样误差抽样误差

★ 一、一、抽样误差的概念抽样误差的概念二、影响二、影响抽样误差的因素抽样误差的因素三、抽样平均误差三、抽样平均误差四、抽样极限误差四、抽样极限误差五、抽样估计的概率度、精度五、抽样估计的概率度、精度 和可靠程度和可靠程度

★★

Page 61: 第 5 章  统计抽样与参数估计

重置抽样分布重置抽样分布 ---- 样本平均数的分布样本平均数的分布

• 某班组某班组 55 个工人个工人的日奖金为的日奖金为 3434 、、3838 、、 4242 、、 4646 、、5050元。元。

= 42= 42 2 2 = 32= 32• 现用重置抽样的现用重置抽样的

方法从方法从 55人中随人中随机抽机抽 22 个构成样个构成样本。共有本。共有 5522=25=25个样本。如右图。个样本。如右图。

样本 样本平均数X

样本 样本平均数X

34,34 34,38 34,42 34,46 34,50 38,34 38,38 38,42 38,46 38,50 42,34 42,38 42,42 42,46 42,50

34 36 38 40 42 36 38 40 42 44 38 40 42 44 46

46,34 46,38 46,42 46,46 46,50 50,34 50,38 50,42 50,46 50,50

40 42 44 46 48 42 44 46 48 50

Page 62: 第 5 章  统计抽样与参数估计

样本平均数X 频数 34 36 38 40 42 44 46 48 50

1 2 3 4 5 4 3 2 1

合计 25

( ) ( )XfE X Xf

42元

( )( ) ( )X X fXf

22 216元

Page 63: 第 5 章  统计抽样与参数估计

• 验证了以下两个结论:验证了以下两个结论:

• 抽样平均数的标准差反映所有的样本平均数抽样平均数的标准差反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误与总体平均数的平均误差,称为抽样平均误差,用 表示。差,用 表示。

( )E X ( )n

X 2

2

X

X n

Page 64: 第 5 章  统计抽样与参数估计

• 由概率论知,如果总体是正态分布的,则样由概率论知,如果总体是正态分布的,则样本平均数的抽样分布是如下正态分布本平均数的抽样分布是如下正态分布

• 这是一个非常重要的结论,有广泛的应用。这是一个非常重要的结论,有广泛的应用。(请参见中心极限定理。)(请参见中心极限定理。)

2

( , )Nn

Page 65: 第 5 章  统计抽样与参数估计

抽样平均抽样平均误差误差

抽样平均抽样平均误差误差

指每一个可能样本的估计值与指每一个可能样本的估计值与总体指标值之间离差的平均数,总体指标值之间离差的平均数,即样本估计量的标准差即样本估计量的标准差

M

iix Xx

M 1

21

式中: 为样本平均数的抽样平均误差; 为式中: 为样本平均数的抽样平均误差; 为可能的样本数目; 为第 个可能样本的平均可能的样本数目; 为第 个可能样本的平均数; 为总体平均数数; 为总体平均数

xi

Xix

M

1

)( 2

n

xxS

注意:不要混淆抽样标准差与样本标准差!

Page 66: 第 5 章  统计抽样与参数估计

抽样平均误差的计算公式抽样平均误差的计算公式抽样平均误差的计算公式抽样平均误差的计算公式

nnx

2

N

n

nN

nN

nx 11

22

⒈ ⒈ 样本平均数的抽样平均误差样本平均数的抽样平均误差

当 N≥500 时,有

N

n

N

nN

N

nN

11

重复抽样时:重复抽样时:

不重复抽样时:不重复抽样时:

Page 67: 第 5 章  统计抽样与参数估计

⒉ ⒉ 样本成数的抽样平均误差样本成数的抽样平均误差

n

PPp

1

N

n

n

PP

N

nN

n

PPp 1

1

1

1

重复抽样时:重复抽样时:

不重复抽样时:不重复抽样时:

当 N≥500 时,有

N

n

N

nN

N

nN

11

抽样平均误差的计算公式抽样平均误差的计算公式抽样平均误差的计算公式抽样平均误差的计算公式

Page 68: 第 5 章  统计抽样与参数估计

关于总体方差的估计方法关于总体方差的估计方法关于总体方差的估计方法关于总体方差的估计方法用过去同类问题全面调查或抽样调查的经用过去同类问题全面调查或抽样调查的经验数据代替;验数据代替;用样本标准差 代替总体标准差 ,用 用样本标准差 代替总体标准差 ,用 代替 。 代替 。

s psP

11

22

f

fxx

n

xx或 pp

n

n

1

1

抽样平均误差的计算公式抽样平均误差的计算公式抽样平均误差的计算公式抽样平均误差的计算公式

Page 69: 第 5 章  统计抽样与参数估计

样本平均数的分布样本平均数的分布 样本成数的分布样本成数的分布

重复重复抽样抽样

不重不重复抽复抽

样样

( ) n

X 1p pP

n

2

( )1

N nX

n N

1

1

p p N nP

n N

Page 70: 第 5 章  统计抽样与参数估计

工大经院 统计学

STAT第二节第二节 抽样误差抽样误差

★ 一、一、抽样误差的概念抽样误差的概念二、影响二、影响抽样误差的因素抽样误差的因素三、抽样平均误差三、抽样平均误差四、抽样极限误差四、抽样极限误差五、抽样估计的概率度、精度五、抽样估计的概率度、精度 和可靠程度和可靠程度

★★★

Page 71: 第 5 章  统计抽样与参数估计

抽样极限抽样极限误差误差

抽样极限抽样极限误差误差

指在一定的概率保证程度下,指在一定的概率保证程度下,抽样误差不允许超过的某一给抽样误差不允许超过的某一给定的最大可能范围,也称作定的最大可能范围,也称作允允许误差、误差范围、误差置信许误差、误差范围、误差置信限限等。记作 等。记作 △△

设待估计的总体参数是设待估计的总体参数是 θθ ,用以估计该参数,用以估计该参数的统计量是 ,抽样估计的的统计量是 ,抽样估计的极限误差极限误差是是 ΔΔ ,,即:即:

换句话说:极限误差是根据研究对象的变异程度和分换句话说:极限误差是根据研究对象的变异程度和分析任务的性质来确定的在一定概率下的允许误差范围。析任务的性质来确定的在一定概率下的允许误差范围。

Page 72: 第 5 章  统计抽样与参数估计

注意到:注意到: 极限误差与概率有关,与抽样误差有关 极限误差与概率有关,与抽样误差有关 提高把握程度,会增大允许误差,使估计提高把握程度,会增大允许误差,使估计

精度降低;精度降低;

缩小允许误差,提高估计的精度,又会降缩小允许误差,提高估计的精度,又会降低估计的把握程度。低估计的把握程度。

所以在实际中应根据具体情况,先确定一所以在实际中应根据具体情况,先确定一个合理的把握程度,再求相应的允许误差个合理的把握程度,再求相应的允许误差或先确定一个允许误差范围再求相应的把或先确定一个允许误差范围再求相应的把握程度。握程度。

Page 73: 第 5 章  统计抽样与参数估计

抽样极限误差的计算公式抽样极限误差的计算公式抽样极限误差的计算公式抽样极限误差的计算公式(大样本条件下)(大样本条件下)

样本平均数的样本平均数的极限误差:极限误差:

⒈⒈

样本成数的极样本成数的极限误差:限误差:

⒉⒉

tt为概率度,是给定概率保证程度下样本均值为概率度,是给定概率保证程度下样本均值偏离总体均值的抽样平均误差的倍数。偏离总体均值的抽样平均误差的倍数。

xxt

ppt

Page 74: 第 5 章  统计抽样与参数估计

工大经院 统计学

STAT第二节第二节 抽样误差抽样误差

★ 一、一、抽样误差的概念抽样误差的概念二、影响二、影响抽样误差的因素抽样误差的因素三、抽样平均误差三、抽样平均误差四、抽样极限误差四、抽样极限误差五、抽样估计的概率度、精度五、抽样估计的概率度、精度 和可靠程度和可靠程度

★★★★

Page 75: 第 5 章  统计抽样与参数估计

• 估计正确性的一个概率保证,通常称为估计的置信度。

估计误差的最大范围,通过极限误差来反映。显然, Δ越小,估计的精度要求越高, Δ越大,估计的精度要求越低。极限误差的确定要以实际需要为基本标准。

参数估计的两个要求:参数估计的两个要求:

精度:精度:

可靠度:可靠度:

Page 76: 第 5 章  统计抽样与参数估计

tt 与相应的概率保证程度存在一一对应关系,与相应的概率保证程度存在一一对应关系,常用常用 ZZ 值及相应的概率保证程度为:值及相应的概率保证程度为:  

tt 值  概率保证程度值  概率保证程度 FF(( tt ))     1.00 0.6827 1.00 0.6827 1.65 0.9000 1.65 0.9000 1.96 0.95001.96 0.9500 2.00 0.95452.00 0.9545 2.58 0.99002.58 0.9900 3.00 0.99733.00 0.9973

1

概率度(大样本条件下)概率度(大样本条件下)

Page 77: 第 5 章  统计抽样与参数估计

68.27%

95.45%

99.73%

抽样极限误差抽样极限误差抽样极限误差抽样极限误差

),(~ 2 nXNx X x

x

2x

3x

2x

x

3 x

Page 78: 第 5 章  统计抽样与参数估计

dtext

Z

Z

2

2

2

1

2Z

2Z

221

Page 79: 第 5 章  统计抽样与参数估计

221

975.02105.0

,95.01

x应查,则

若确定了保证程度

dtext

x2

2

2

1

标准正态分布函数值表

Page 80: 第 5 章  统计抽样与参数估计

2Z

2Z

96.1025.02

,05.0

2

ZxP 得到,

则查若确定了显著性水平

21

2

dtexPt

x

2

2

2

1

Page 81: 第 5 章  统计抽样与参数估计

工大经院 统计学

STAT

第第 55 章 统计抽样与参数估章 统计抽样与参数估计计

★第一节第一节 抽样推断抽样推断第二节第二节 抽样误差抽样误差第三节第三节 参数估计的基本方法参数估计的基本方法第四节第四节 抽样组织的设计 抽样组织的设计

★★

Page 82: 第 5 章  统计抽样与参数估计

一、点估计一、点估计二、区间估计二、区间估计三、样本容量的确定三、样本容量的确定

第三节第三节 参数估计的基本方法参数估计的基本方法

Page 83: 第 5 章  统计抽样与参数估计

pPsxX ,,

点估计点估计点估计点估计 指直接以样本指标来估计总指直接以样本指标来估计总体指标,也叫体指标,也叫定值估计定值估计

简单,具体明确简单,具体明确优点优点

缺点缺点 无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况

Page 84: 第 5 章  统计抽样与参数估计

一、点估计一、点估计二、区间估计二、区间估计三、样本容量的确定三、样本容量的确定

第三节第三节 参数估计的基本方法参数估计的基本方法

★★

Page 85: 第 5 章  统计抽样与参数估计

二、区间估计二、区间估计

㈠ 区间估计的定义和原理㈠ 区间估计的定义和原理

㈡ 总体平均数的区间估计㈡ 总体平均数的区间估计

㈢总体成数的区间估计㈢总体成数的区间估计

Page 86: 第 5 章  统计抽样与参数估计

区间估计区间估计区间估计区间估计

指根据样本指标和抽样极限误差以一指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范定的可靠程度推断总体指标的可能范围;其中,被推断的总体指标的下限围;其中,被推断的总体指标的下限与上限所包括的区间称为与上限所包括的区间称为置信区间置信区间,,估计的可靠程度也称为估计的可靠程度也称为置信度。置信度。

(这里只讨论常用的大样本的情况)(这里只讨论常用的大样本的情况)

Page 87: 第 5 章  统计抽样与参数估计

区间估计原理区间估计原理区间估计原理区间估计原理

0.6827   落在   落在   范围内的概率范围内的概率为为 68.27%68.27%

xx X

X

样本抽样分布曲线

原总体分布曲线

Page 88: 第 5 章  统计抽样与参数估计

区间估计原理区间估计原理区间估计原理区间估计原理0.9545

  落在   落在   范围内的概率范围内的概率为为 95.45%95.45%

xx 2X

X

样本抽样分布曲线

原总体分布曲线

Page 89: 第 5 章  统计抽样与参数估计

区间估计原理区间估计原理区间估计原理区间估计原理

0.9973 落在   范围内的概率为 99.73%

X xx 3

X

样本抽样分布曲线样本抽样分布曲线

总体分布曲线总体分布曲线

Page 90: 第 5 章  统计抽样与参数估计

总体平均数的区间估计总体平均数的区间估计总体平均数的区间估计总体平均数的区间估计

xx

xx

xxX

xXx

,或

,表表达达式式

表表达达式式

其中, 为极限误差xxt

Page 91: 第 5 章  统计抽样与参数估计

步骤步骤步骤步骤

⒈ ⒈ 计算样本平均数 ;计算样本平均数 ;x

1

,1

2

2

2

2

f

fxxs

n

xxs

⒉ ⒉ 搜集总体方差的经验数据 ;或计搜集总体方差的经验数据 ;或计算样本标准差 ,即算样本标准差 ,即

22s

总体平均数的区间估计总体平均数的区间估计总体平均数的区间估计总体平均数的区间估计

Page 92: 第 5 章  统计抽样与参数估计

步步骤骤步步骤骤

⒊ ⒊ 计算抽样平均误差:计算抽样平均误差:

n

s

nx 或

重复抽样时: 重复抽样时:

N

n

n

s

N

n

nx 1122

不重复抽样时:不重复抽样时:

总体平均数的区间估计总体平均数的区间估计总体平均数的区间估计总体平均数的区间估计

Page 93: 第 5 章  统计抽样与参数估计

步步骤骤步步骤骤

⒋ ⒋ 计算抽样极限误差:计算抽样极限误差:

⒌ ⒌ 确定总体平均数的置信区间:确定总体平均数的置信区间:

xx

xx

xxX

xXx

,或

总体平均数的区间估计总体平均数的区间估计总体平均数的区间估计总体平均数的区间估计

xxt

Page 94: 第 5 章  统计抽样与参数估计

【例【例 AA 】】某企业生产某种产品的工某企业生产某种产品的工人有人有 10001000 人,某日采用不重复抽人,某日采用不重复抽样从中随机抽取样从中随机抽取 100100 人调查他们的人调查他们的当日产量,要求在当日产量,要求在 95﹪95﹪的概率保的概率保证程度下,证程度下,估计该厂全部工人的日估计该厂全部工人的日平均产量和日总产量。平均产量和日总产量。

总体平均数的区间估计总体平均数的区间估计总体平均数的区间估计总体平均数的区间估计

Page 95: 第 5 章  统计抽样与参数估计

按 日产量分组(件)

组中值(件)

工人数(人)

110~ 114

114~ 118

118~ 122

122~ 126

126~ 130

130~ 134

134~ 138

138~ 142

112

116

120

124

128

132

136

140

3

7

18

23

21

18

6

4

336

812

2160

2852

2688

2376

816

560

588

700

648

92

84

648

600

784

合计 — 100 12600 4144

x fxf fxx

2

100100名工人的日产量分组资料名工人的日产量分组资料

Page 96: 第 5 章  统计抽样与参数估计

解:解:

47.699

4144

1

126100

12600

2

f

fxxs

f

xfx

件614.01000

1001

100

47.6

1

2

2

N

n

n

sx

Page 97: 第 5 章  统计抽样与参数估计

件203.1614.096.1 xxZ

则该企业工人人均产量 及日总产则该企业工人人均产量 及日总产量 的置信区间为:量 的置信区间为:

XXN

203.11261000203.11261000

,203.1126203.1126

XN

X

即该企业工人人均产量在即该企业工人人均产量在 124.797124.797 至至 127.127.203203 件之间,其日总产量在件之间,其日总产量在 124797124797 至至 127127303303 件之间,估计的可靠程度为件之间,估计的可靠程度为 95﹪95﹪。。

Page 98: 第 5 章  统计抽样与参数估计

总体成数的区间估计总体成数的区间估计总体成数的区间估计总体成数的区间估计

pp

pp

ppP

pPp

,或

,表表达达式式

表表达达式式

其中, 为极限误差ppt

Page 99: 第 5 章  统计抽样与参数估计

步步骤骤步步骤骤

⒈ ⒈ 计算样本成数 ;计算样本成数 ;n

np 1

⒉ ⒉ 搜集总体方差的经验数据 ;搜集总体方差的经验数据 ;2p

⒊ ⒊ 计算抽样平均误差:计算抽样平均误差:

1

11

1

1

n

pppp

n

n

nnp

p 或

N

n

n

pp

N

n

np

p 11

11

2

重复抽样重复抽样条件下条件下

不重复抽不重复抽样条件下样条件下

总体成数的区间估计总体成数的区间估计总体成数的区间估计总体成数的区间估计

Page 100: 第 5 章  统计抽样与参数估计

步步骤骤步步骤骤

⒋ ⒋ 计算抽样极限误差:计算抽样极限误差:

⒌ ⒌ 确定总体成数的置信区间:确定总体成数的置信区间:

pp

pp

ppP

pPp

,或

总体成数的区间估计总体成数的区间估计总体成数的区间估计总体成数的区间估计

ppt

Page 101: 第 5 章  统计抽样与参数估计

【例【例 BB 】】若例若例 AA 中工人日产量在中工人日产量在 111188 件以上者为完成生产定额任务,件以上者为完成生产定额任务,要求在要求在 95﹪95﹪的概率保证程度下,的概率保证程度下,估计该厂全部工人中完成定额的工估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。人比重及完成定额的工人总数。

总体成数的区间估计总体成数的区间估计总体成数的区间估计总体成数的区间估计

Page 102: 第 5 章  统计抽样与参数估计

按 日产量分组(件)

组中值(件) 工人数(人)

110~ 114

114~ 118

118~ 122

122~ 126

126~ 130

130~ 134

134~ 138

138~ 142

112

116

120

124

128

132

136

140

3

7

18

23

21

18

6

4

合计 — 100

x f

100100 名工人的日产量分组资料名工人的日产量分组资料

完成定额完成定额的人数的人数

Page 103: 第 5 章  统计抽样与参数估计

解:解:

0568.0029.096.1

029.0

1000

1001

1100

1.09.01

1

1

,9.0100

90

,96.1,10,90,100,1000

1

01

pp

p

Z

N

n

n

pp

n

np

ZnnnN

己知

Page 104: 第 5 章  统计抽样与参数估计

则该企业全部工人中完成定额的工人比则该企业全部工人中完成定额的工人比重 及完成定额的工人总数 的置信重 及完成定额的工人总数 的置信区间为:区间为:P NP

0568.09.010000568.09.01000

,0568.09.00568.09.0

NP

P

即该企业工人中完成定额的工人比重在即该企业工人中完成定额的工人比重在0.84320.8432 至至 0.95680.9568 之间,完成定额的工之间,完成定额的工人总数在人总数在 843.2843.2 至至 956.8956.8 人之间,估计人之间,估计的可靠程度为的可靠程度为 95﹪95﹪。。

Page 105: 第 5 章  统计抽样与参数估计

一、点估计一、点估计二、区间估计二、区间估计三、样本容量的确定三、样本容量的确定

第三节第三节 参数估计的基本方法参数估计的基本方法

★★★

Page 106: 第 5 章  统计抽样与参数估计

三、样本容量的确定三、样本容量的确定

㈠ 确定样本容量的意义㈠ 确定样本容量的意义

㈡ 推断总体平均数所需的样本容量㈡ 推断总体平均数所需的样本容量

㈢ 推断总体成数所需的样本容量㈢ 推断总体成数所需的样本容量

㈣ 必要样本容量的影响因素㈣ 必要样本容量的影响因素

Page 107: 第 5 章  统计抽样与参数估计

样本容量调查误差调查误差

调查费用调查费用

小样本容量小样本容量节省费用但节省费用但调查误差大调查误差大

大样本容量大样本容量调查精度高调查精度高但费用较大但费用较大

找出在规定误差范围内的最小样本容量

确定样本容量的意义确定样本容量的意义

找出在限定费用范围内的最大样本容量

Page 108: 第 5 章  统计抽样与参数估计

确确定定方方法法

确确定定方方法法

推断总体平均数所需的样本容量推断总体平均数所需的样本容量

⑴ ⑴ 重复抽样条件下:重复抽样条件下:

,n

ZZxx

2

2

2

22

xx

Zn

通常的做法是先确定置信度,然后限定抽样极限误差。

或 S通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的 S。

计算结果通常向上进位

Page 109: 第 5 章  统计抽样与参数估计

,12

N

n

nZZ

xx

⑵ ⑵ 不重复抽样条件下:不重复抽样条件下:确确定定方方法法

确确定定方方法法

推断总体平均数所需的样本容量推断总体平均数所需的样本容量

22

2

222

22

xx N

N

ZN

NZn

Page 110: 第 5 章  统计抽样与参数估计

【例【例 AA 】】某食品厂要检验本月生产某食品厂要检验本月生产的的 1000010000 袋某产品的重量,根据上袋某产品的重量,根据上月资料,这种产品每袋重量的标准月资料,这种产品每袋重量的标准差为差为 2525 克。要求在克。要求在 95.45﹪95.45﹪ 的概的概率保证程度下,平均每袋重量的误率保证程度下,平均每袋重量的误差范围不超过差范围不超过 55 克,应抽查多少袋克,应抽查多少袋产品?产品?

Page 111: 第 5 章  统计抽样与参数估计

袋袋

在不重复抽样条件下:

则在重复抽样条件下:

克克己知

10001.99

252510000

25210000

1005

252

,2,5,25,10000

222

22

222

22

2

22

2

22

ZN

NZn

Zn

ZN

x

x

x

解:解:

Page 112: 第 5 章  统计抽样与参数估计

确确定定方方法法

确确定定方方法法

推断总体成数所需的样本容量推断总体成数所需的样本容量

⑴ ⑴ 重复抽样条件下:重复抽样条件下:

,

1

n

PPZZ pp

22

2 11

PP

PPPPZn

通常的做法是先确定置信度,然后限定抽样极限误差。

计算结果通常向上进位

通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的 ;③取方差的最大值 0.25。

2P

2Ps

Page 113: 第 5 章  统计抽样与参数估计

,1

1

N

n

n

PPZZ pp

⑵ ⑵ 不重复抽样条件下:不重复抽样条件下:

确确定定方方法法

确确定定方方法法

推断总体成数所需的样本容量推断总体成数所需的样本容量

PPN

PNP

PPZN

PPNZn

pp

1

1

1

1222

2

Page 114: 第 5 章  统计抽样与参数估计

【例【例 BB】】某企业对一批总数为某企业对一批总数为 50005000 件件的产品进行质量检查,过去几次同类调的产品进行质量检查,过去几次同类调查所得的产品合格率为查所得的产品合格率为 93﹪93﹪、、 95﹪95﹪、、96﹪96﹪,为了使合格率的允许误差不超过,为了使合格率的允许误差不超过3﹪3﹪,在,在 99.73﹪99.73﹪的概率保证程度下,的概率保证程度下,应抽查多少件产品?应抽查多少件产品?【分析】因为共有三个过去的合格率的【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其资料,为保证推断的把握程度,应选其中方差最大者,即中方差最大者,即 P=93﹪P=93﹪。。

Page 115: 第 5 章  统计抽样与参数估计

件件

在不重复抽样条件下:

则在重复抽样条件下:

﹪己知

577004.576

0651.0303.05000

0651.035000

1

1

65103.0

0651.031

,0651.01,3,3,5000

22

2

22

2

2

2

2

2

2

PPZN

PPNZn

PPZn

PPZN

p

p

pp 解:解:

Page 116: 第 5 章  统计抽样与参数估计

必要样本容量的影响因素必要样本容量的影响因素

总体方差的大小;总体方差的大小;允许误差范围的大小;允许误差范围的大小;概率保证程度;概率保证程度;抽样方法;抽样方法;抽样的组织方式。抽样的组织方式。

总体方差的大小;总体方差的大小;允许误差范围的大小;允许误差范围的大小;概率保证程度;概率保证程度;抽样方法;抽样方法;抽样的组织方式。抽样的组织方式。

重复抽样条件下:重复抽样条件下:

2

2

2

22

xx

Zn

不重复抽样条件下:不重复抽样条件下:

22

2

222

22

xx N

N

ZN

NZn

Page 117: 第 5 章  统计抽样与参数估计

抽样复查的方法抽样复查的方法抽样复查的方法抽样复查的方法其全面调查时的登记结其全面调查时的登记结果为果为 2.28612.2861 亿元亿元

其抽样复查的结果为其抽样复查的结果为2.17342.1734 亿元亿元

随机抽取随机抽取

五个下属单位五个下属单位

修正系数为 9507.02861.2

1734.2则:则:

该企业集团所拥有的固定资产原值应为16.851×0.9507=16.020 (亿元)

所拥有固定资产原值的普查结果为16.851亿元某企业集团

总体总体

Page 118: 第 5 章  统计抽样与参数估计

工大经院 统计学

STAT

第第 55 章 统计抽样与参数估章 统计抽样与参数估计计

★第一节第一节 抽样推断抽样推断第二节第二节 抽样误差抽样误差第三节第三节 参数估计的基本方法参数估计的基本方法第四节第四节 抽样组织的设计 抽样组织的设计

★★★

Page 119: 第 5 章  统计抽样与参数估计

抽样组织方式抽样组织方式抽样组织方式抽样组织方式

1· 1· 简单随机抽样(纯随机抽样)简单随机抽样(纯随机抽样)———— 对总体单位逐一编号,然后按随机原对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本则直接从总体中抽出若干单位构成样本

应用应用 仅适用于规模不大、内部各单位仅适用于规模不大、内部各单位标志值差异较小的总体标志值差异较小的总体

是最简单、最基本、最符合随机原则,是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式但同时也是抽样误差最大的抽样组织形式是最简单、最基本、最符合随机原则,是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式但同时也是抽样误差最大的抽样组织形式

Page 120: 第 5 章  统计抽样与参数估计

2· 2· 类型抽样(分层抽样)类型抽样(分层抽样)

———— 将总体全部单位分类,形成 若干个类型组,将总体全部单位分类,形成 若干个类型组,然后从各类型中分别抽取样本单位组成样本。然后从各类型中分别抽取样本单位组成样本。

···

2N 2N总体

N样本

n

等额抽取

等比例抽取kN kN

1N 1N 1n1n

2n2n

knkn

···

能使样本结构更接近于总体结构,提高样本的能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标代表性;能同时推断总体指标和各子总体的指标能使样本结构更接近于总体结构,提高样本的能使样本结构更接近于总体结构,提高样本的

代表性;能同时推断总体指标和各子总体的指标代表性;能同时推断总体指标和各子总体的指标

Page 121: 第 5 章  统计抽样与参数估计

3· 3· 等距抽样(机械抽样或系统抽样)等距抽样(机械抽样或系统抽样)———— 将总体单位按某一标志排序,而后按一将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。定的间隔抽取样本单位。

······

随机起点随机起点 半距起点半距起点 对称起点对称起点

(总体单位按某一标志排序)

按无关标志排队,其抽样效果相当于按无关标志排队,其抽样效果相当于简单随机抽样简单随机抽样;;按有关标志排队,其抽样效果相当于按有关标志排队,其抽样效果相当于类型抽样类型抽样。。按无关标志排队,其抽样效果相当于按无关标志排队,其抽样效果相当于简单随机抽样简单随机抽样;;按有关标志排队,其抽样效果相当于按有关标志排队,其抽样效果相当于类型抽样类型抽样。。

Page 122: 第 5 章  统计抽样与参数估计

4· 4· 整群抽样(集团抽样)整群抽样(集团抽样)—— —— 将总体全部单位分为若干将总体全部单位分为若干“群”“群”,然后,然后随机抽取一部分随机抽取一部分“群”“群”,被抽中群体的所有,被抽中群体的所有单位构成样本单位构成样本

例:总体群数例:总体群数 R=16 R=16 样本群数样本群数 r=4r=4

hlpd nnnnn

AB

C

D

EF

GH

I

JK

L

MN

OP

L

H

P

D

样本容量

简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差

Page 123: 第 5 章  统计抽样与参数估计

5·5· 多阶段抽样多阶段抽样—— —— 指分两个或两个以上的阶段来完成抽指分两个或两个以上的阶段来完成抽取样本单位的过程取样本单位的过程

例:在某省例:在某省 100100 多万农户抽取多万农户抽取 10001000 户调户调查农户生产性投资情况。查农户生产性投资情况。

第一阶段:从该省所有县中抽取第一阶段:从该省所有县中抽取 55 个县个县第二阶段:从被抽中的第二阶段:从被抽中的 55 个县中各抽个县中各抽 44 个乡个乡

第三阶段:从被抽中的第三阶段:从被抽中的 2020 个乡中各抽个乡中各抽 55 个村个村 第四阶段:从被抽中的第四阶段:从被抽中的 100100 个村中各抽个村中各抽 1010户户

样本样本 n=100×10=1000(n=100×10=1000( 户户 ))

Page 124: 第 5 章  统计抽样与参数估计

调查对象的性质特点调查对象的性质特点对调查对象的了解程度(抽样框的特对调查对象的了解程度(抽样框的特点)点)抽样误差的大小抽样误差的大小人力、财力和物力等条件的限制人力、财力和物力等条件的限制

调查对象的性质特点调查对象的性质特点对调查对象的了解程度(抽样框的特对调查对象的了解程度(抽样框的特点)点)抽样误差的大小抽样误差的大小人力、财力和物力等条件的限制人力、财力和物力等条件的限制

在实际工作中,选择适当的抽样组在实际工作中,选择适当的抽样组织方式主要应考虑:织方式主要应考虑:

Page 125: 第 5 章  统计抽样与参数估计

样本的可能数目样本的可能数目在考虑顺序的抽样条件下,从在考虑顺序的抽样条件下,从总体总体 NN 中随机抽取中随机抽取 nn 个样本单个样本单位共有多少种可能的抽选结果位共有多少种可能的抽选结果

⒈ ⒈ 重复抽样的可能样本数目:重复抽样的可能样本数目:

⒉ ⒉ 不重复抽样的可能样本数目:不重复抽样的可能样本数目:

nnN NNNNP

共 n 个

11 nNNNC nN

样本的数量和容量样本的数量和容量样本的数量和容量样本的数量和容量

Page 126: 第 5 章  统计抽样与参数估计

n≥30n≥30,为大样本;,为大样本; n < 30n < 30,为小样,为小样本本

样本容量样本容量 指样本中含有的总体单位的数目,通常用 n 来表示。

确定适当样本容量的意义确定适当样本容量的意义::

若若 nn 过大,调查工作量增大,体现不出抽过大,调查工作量增大,体现不出抽样调查的优越性;样调查的优越性;若若 nn 过小,抽样误差会增大,抽样推断就过小,抽样误差会增大,抽样推断就会失去价值。会失去价值。

若若 nn 过大,调查工作量增大,体现不出抽过大,调查工作量增大,体现不出抽样调查的优越性;样调查的优越性;若若 nn 过小,抽样误差会增大,抽样推断就过小,抽样误差会增大,抽样推断就会失去价值。会失去价值。