概 率 论 ( 续)
DESCRIPTION
概 率 论 ( 续). 注 1 答疑安排 时间:每周六上午 8 : 30---10 : 50 地点:东 1B— 东 2 间长廊 1 楼教师休息室 注 2 联系方式 张彩伢: [email protected] ( 助教)项燕彪 : [email protected] 注 3 课件下载 浙江大学数学系主页 ——》 师资队伍 ——》 数学系教师介绍 ——》 统计研究所 ——》 张彩伢 http://www.math.zju.edu.cn. 第五章 大数定律和中心极限定理. 关键词: 契比雪夫不等式 大数定律 中心极限定理. - PowerPoint PPT PresentationTRANSCRIPT
1
概 率 论概 率 论 (( 续)续)
►注注 11 答疑安排答疑安排► 时间:每周六上午时间:每周六上午 88 :: 30---1030---10:: 5050► 地点:东地点:东 1B—1B—东东 22 间长廊间长廊 11 楼教师休息室楼教师休息室►注注 22 联系方式联系方式► 张彩伢:张彩伢: [email protected]@zju.edu.cn► (( 助教)项燕彪 :助教)项燕彪 :
[email protected]►注注 3 3 课件下载课件下载► 浙江大学数学系主页浙江大学数学系主页——》——》师资队伍师资队伍——》——》数学系数学系教师介绍教师介绍——》——》统计研究所统计研究所——》——》张彩伢张彩伢►http://www.math.zju.edu.cnhttp://www.math.zju.edu.cn
2
3
第五章 大数定律和中心极限定理 关键词:
契比雪夫不等式大数定律中心极限定理
4
§1 大数定律
背景 本章的大数定律,对第一章中提出的 “ 频率稳定性”,给出理论上的论证
为了证明大数定理,先介绍一个重要不等式
5
2
2
2
2
2
5.1 ,
0,
1
X E X D X
P X E X
P X E X
定理 契比雪夫不等式 :设随机变量 具有数学期望 方差
则对于任意 都有:
定理的 为:等价形式
,X X f x证明:仅就 为连续型时证之 设 的概率密度为
x
P X f x dx
则 2
2x
xf x dx
22
1 x f x dx
2
2 2
D X
( )f x
• 思考:切比雪夫不等式的意义
6
7
例 1 :在 n 重贝努里试验中,若已知每次试验事件 A 出现的概率为 0.75 ,试利用契比雪夫不等式 ,(1)若 n=7500, 估计 A 出现的频率在 0.74至 0.76 之间的概率至少有多大;( 2 )估计 n,使 A 出现的频率在 0.74至 0.76 之间的概率不小于 0.90 。
n A解:设在 重贝努里试验中,事件 出现的次数为X, ,0.75b n则X , 0.75 , 0.1875 ,E X np n D X npq n
nXf A n又
0.74 0.76 0.75 0.01XP P X n nn
(2)
20.187510.01
nn
18751 0.90n 18750n
(1) 7500, 0.74 0.76 0.75 0.01Xn P P X n nn
20.187510.01
nn
18751 0.757500
8
随机变量序列依概率收敛的定义
1 2 35.1 , , , ,0, 0,nn
n
Y Y Y alim P Y a
Y aPY an
。
定义 :设随机变量序列 若存在某常数 , 使得 均有:
则称随机变量序列 依概率收敛于常数 ,
记为:
a aa
9
1 2
2
1
1
1
5.2
, , , ,
1 , 0
1lim lim 1.
1 .
n
n
n kk
n
n kn n kn
Pk
k
X X X
n
Y Xn
P Y P Xn
Xn
定理 契比雪夫定理的特殊情形 :
设随机变量序列 相互独立,且具有相同的
数学期望 和相同的方差 ,作前 个随机变量的算术平均:
则 ,有:
即,
1
1 1 ,n
n kk
E Y E X nn n
证明:由于
1
1 n
n kk
D Y D Xn
2
1
1 n
kk
D Xn
2
22
1 n nn
2
21
1 1n
kk
nP Xn
由契比雪夫不等式得:
1
1 1n
kn k
lim P Xn
10
1 2
1
1
5.3
, , , ,
1
0
1lim lim 1.
n
n
n kk
n
n kn n k
X X X
n Y Xn
P Y P Xn
定理 辛钦定理 :
设随机变量序列 相互独立,服从同一分布,
且存在数学期望 ,作前 个随机变量的算术平均:
则 ,有:
契比雪夫大数定律表明,当 n 很大时,的算术平均 接近于数学期望 。这种接近是在概率意义下的接近。1
1 n
kk
Xn
1 2, , , ,nX X X
此外,定理中要求随机变量的方差存在,但当随机变量服从相同分布时,就不需要这一要求。
11
例 2 : 1 1
2
1 1 1
, , , , ~ ( 1,1).1 1 11 2 3
n
n n n
k k kk k k
X X X U
X X Xn n n
设随机变量 相互独立同分布, 则
() ,() ,() 分别依概率收敛吗?
如果依概率收敛,分别收敛于什么?
1 1
1 1
2 2 21 1
2
1 1 1
, , , , ( ), , , , ( )
, , , , ( )1 1 1
n
n
n
n n n
k k kk k k
X X E X
X X E X
X X E X
X X Xn n n
解:由辛钦大数定律, 相互独立同分布, 存在,相互独立同分布, 存在,相互独立同分布, 存在,
故, , , 均依概率收敛。
1( ) 0,E X 因为,1
1 n
kk
Xn
P故, 0,1
1 1( ) ,E X x dx
1 1同理, 2 2
12 21 1
( ) ,E X x dx
1 12 3
1
1 n
kk
Xn
P 1,2
2
1
1 n
kk
Xn
P 1。3
12
大数定律的重要意义:贝努里大数定律建立了在大量重复独立试验中事件出现频率的稳定性,正因为这种稳定性,概率的概念才有客观意义,贝努里大数定律还提供了通过试验来确定事件概率的方法,既然频率nA/n 与概率 p 有较大偏差的可能性很小,我们便可以通过做试验确定某事件发生的频率并把它作为相应的概率估计,这种方法即是在第 7 章将要介绍的参数估计法,参数估计的重要理论基础之一就是大数定理。
5.4
, 0, 1
A
A
n
A p n nnA lim P pn
定理 贝努里大数定理 设事件 在每次试验中发生的概率为 ,记 为 次独立重复试验
中 发生的次数 则 有:
, ,An b n p证明:利用契比雪夫不等式,因 故:
1 1 ,AA
nE E n np pn n n
20, 1An pqP pn n
于是, 有
2 21 1A
An pqD D n npqn nn n
1A
n
nlim P pn
即得:
13
§2 中心极限定理背景: 有许多随机变量,它们是由大量的相互独立 的随机变量的综合影响所形成的,而其中每 个个别的因素作用都很小,这种随机变量往 往服从或近似服从正态分布,或者说它的极 限分布是正态分布,中心极限定理正是从数 学上论证了这一现象,它在长达两个世纪的 时期内曾是概率论研究的中心课题。
14
5.5 定理 独立同分布的中心极限定理
2
1
0,1 .
( , ),
n
n
ii
n Y N
X N n n
此定理表明,当 充分大时, 近似服从
即: (近似)~
1
1 n
ii
X Xn
思考题:
的近似
分布是什么?
2
( , )Nn答案:
2
1 2
2
1
1 2
, , , ,
, , 1, 2,
1,2
n
i i
n
ii
n
n
i txi
nn n
X X
E X D X i
X nn Y
n
X nx R lim P Y x lim P x e dt
n
设随机变量X 相互独立同分布,
则前 个变量的和的标准化变量为:
有:
证明略。
1( ) ( ) ( ).
n
ii
b n a nP a X bn n
从而,
15
5.6 定理 德莫佛- -拉普拉斯定理
2
215.4,(1 ) 2
tbA
n a
n nplim P a b e dtnp p
由定理
1 0 i
i AX
i A
第次试验时 发生证明:令
第次试验时 未发生
2
2
0 1 ,
1, lim ,(1 ) 2
A
tbA
n a
n n A P A p p
n npa b P a b e dtnp p
设 为 重贝努里试验中 发生的次数,
则对任何区间( ],有:
1 2, , , , ~ (1, ).n iX X X X b p 则 相互独立同分布,
1 2 ,A nn X X X 由于
( ) ~ ( , (1 )).An N np np p即: 近似
( )(1 )
( )(1 )
AP a n bb npnp pa npnp p
16
例 3 :设某种电器元件的寿命服从均值为 100 小时的指 数分布,现随机取得 16只,设它们的寿命是相互 独立的 ,求这 16只元件的寿命的总和大于 1920 小 时的概率。1 2 1616 , , , ,X X X解:记 只电器元件的寿命分别为
16
116 i
iX X
则 只电器元件的寿命总和为 ,
2100, 100i iE X D X 由题设
16
116 100
1600 0,14 100 400
iiX
XY N
根据独立同分布的中心极限定理:
近似服从
1920 1 1920P X P X 1920 16001 400
1 0.8 0.2119
17
例 4 :某保险公司的老年人寿保险有 1 万人参加,每人每年交 200元 , 若老人在该年内死亡,公司付给受益人 1 万元。设老年人死亡 率为 0.017 ,试求保险公司在一年内这项保险亏本的概率。
200P X
, , 10000, 0.017b n p n p 解:设X为一年中投保老人的死亡数,则X- -由德莫佛 拉普拉斯中心极限定理,保险公司亏本的概率为:
10000 10000 200P X
2001
1np
np p
1 2.32 0.01
10
思考题:求保险公司至少盈利 万元的概率。
答案:0. 937
18
例 5 :设某工厂有 400台同类机器,各台机器发生故障的概 率都是 0.02 ,各台机器工作是相互独立的,试求机 器出故障的台数不小于 2 的概率。
400 0.02 0.98 2.8
12 1 ( 1) 1
7 2.5 0.99382.8
npq
npP X P Xnpq
, 400,0.02 b解:设机器出故障的台数为X则X ,分别用三种方法计算:
1. 用二项分布计算
400 3992 1 0 1 1 0.98 400 0.02 0.98 0.9972P X P X P X
2. 用泊松分布近似计算
400 0.02 8 ,
2 1 0 1 1 0.000335 0.002684 0.9969.np
P X P X P X
3. 用正态分布近似计算
19
例 6 : 1 20 1
20 20 202
1 1 1
, , , ~ ( 1,1)1 1 11 2 320 20 20k k k
k k k
X X X U
X X X
设随机变量 相互独立同分布, 。分别求
() ,() ,() 的近似分布。
20 20 202
1 1 1
1 1 120 20 20k k k
k k k
X X X 解:由中心极限定理, , , 均近似服从正态分布。
1( ) 0,E X 因为,
1( ) ,E X 12
21( ) ,E X
13
14( ) ,
12D X
13
20
1
1 ~ (0, ),20 k
k
X N
近似 1
602 2
1 1 1( ) ( ) [ ( )] ,D X E X E X 112
20
1
1 ~ ( , )20 k
k
X N
近似 1 1 ,2 240
2 4 2 21 1 1( ) ( ) [ ( )] ,D X E X E X
1 1 45 9 45
2
1
1 ~ ( , )n
kk
X Nn
近似 1 1
。3 225
20
例 7 :(例 1续)在 n 重贝努里试验中,若已知每次试验事件 A 出现的概率为 0.75 ,试利用中心极限定理 ,(1)若 n=7500, 估计 A 出现的频率在 0.74至 0.76 之间的概率近似值;( 2 )估计 n,使 A 出现的频率在 0.74至 0.76 之间的概率不小于 0.90 。
n A解:设在 重贝努里试验中,事件 出现的次数为X, ,0.75b n则X , 0.75 , 0.1875 ,E X np n D X npq n
0.76 0.75 0.74 0.750.74 0.76 ( ) ( )0.1875 0.1875n n n nXP
n n n (2)
18750n
契比雪夫不等式估计
。
(1) 7500, 0.74 0.76Xn P n 0.76 0.75 0.74 0.75( ) ( )0.1875 0.1875n n n n
n n
0.042 ( ) 1 2 (2) 1 0.95443n
0.042 ( ) 1 0.9,3n 0.04( ) 0.95,
3n
20.04 1.645, (25 1.645) 3 50743n n
21
数 理 统 数 理 统 计计
22
数理统计学是一门关于随机数据收集、整理 分析和推断的科学。
以样本的信息来推断总体的信息 ----- 统计推断
23
§1 总体和样本总体:研究对象的全体。常常用随机变量(或随机向量) X 及其分布 F(x) 来描述总体随机样本:从总体中随机抽取 n 个个体组成的集合,其中 n 为样本容量。容量为 n 的随机样本可看成 n 个随机变量(或随机向量)
简单随机样本:(独立同分布性)1. 每个 Xi与 X 同分布2. X1,X2,…,Xn 是相互独立的随机变量
(具有非常好的代表性!)
nXXXX ,,,~21
• 设总体 X 具有分布函数 ,则样本• 的联合分布函数为:
• 设总体具有概率密度或分布律函数 ,则样本• 的联合概率密度或联合分布律为
24
)(),,,1
21
n
iin xFxxxF (
)(),,,1
21
n
iin xfxxxf (
xF nXXXX ,,,~21
xf
• 例 1 :独立重复抛掷硬币 100 次,设
• 写出 的联合分布列。• 例 2 :设总体 ,写出简单随机样本• 的联合概率密度。 •
25
否则次出现正面第
01 i
X i
)( 1 nXX ,,
),( 2~ NX)~
1 nXXX ,,(
26
统计量:样本的不含任何未知参数的函数。常用统计量:设( X1,X2,…,Xn )为取自总体 X 的样本1
1 1. n
ii
X Xn 样本均值
1
1
1 1, 2,
1 ( ) 2,
3. n
kk i
i
nk
k ii
k A X kn
k B X X kn
样本矩 阶矩:
阶中心矩:
2 2
1
1 2. (1
) ,n
ii
S X X Sn
样本方差 为样本标准差
1 1
2 2
1 1
1 1
, , , ,
1 1 ( )1
1 11,2, ( ) 2,
n n
n n
i ii i
n nk k
k i k ii i
X X x x
x x s x xn n
a x k b x x kn n
当获得样本 的观察值 后,上述统计量的观察值记为
, ,
, , ,
27
2 21 2 3
1 2 3 2 1 2 3
32
3 121
, , , ,
1 2 2 3 max , ,
1 4 5 ii
N X X X
X X X X X X X
X X X
思考题:设在总体 中抽取样本 其中 已知, 未知
指出在
中哪些是统计量,哪些不是统计量,
为什么?
2
2
2
, ,...,
( ) , ( )
( ) __, ( ) ___, ( ) __ .
nX X X X
E X D X
E X D X E S
1例1设 是总体 的样本,若
,
则
答:只有(4)不是统计量。
2
n
2
2 22
2(1 ), 0 1,( )
0,
, ,..., ( ) __, ( ) ______, ( ) __ .n
x xX f x
X X X X E X E X E S
1
例2 设总体 的概率密度为其它
是总体 的样本,则
1
0
1( ) 2 (1 ) ,3
E X x x dx 解: 12 2
0
1( ) 2 (1 ) ,6
E X x x dx 1( ) ,
18D X
13
1 118 9n
118
28
§2 常用的分布•
2
2 2
1 2
2
1
2
, , 0,1 1, 2, ,
1
1
n i
n
n ii
X X X X N i n
X
n n
定义:设随机变量 相互独立,
则称
服从自由度为 的 分布,记为
指 式右端包含的独立变自由度 量的个数.
22
1
2 2
1
0
1 026.1 2 2 0 0
ny
nn
x
y e yn f y n
y
x e dx
定理 : 分布的概率密度为:
其中
2 分布
x
( )f x
0
10n
1n
4n
2 分布的概率密度函数
29
2 分布的一些重要性质: 2 2 2 2, ,1. 2n E n D n 设 则有
2 2 21 1 2 2 1 2 1 2 1 2, , ,2. Y n Y n Y Y Y Y n n 设 且 相互独立,则有
22 分布的可加性性质 称为 ,可推广到有限个的情形:
2 21 2
1 1~ , , , , ~
m m
i i m i ii i
Y n Y Y Y Y n
设 且 相互独立,则
2
2
2 2 2
,0 1,
,
nnf y dy
n n
n
上 分
对给定的概率 称满足条件 的点 为
分布的 上 分位位数 数 的值可查 分布表
2 n0
2 分布的上 分位数
x
( )f x
30
2 21 2
2 22
1
2 2 21 2 3 4 5
1 , , , , , ,
1 ( )
5 ) (2 ) ~ ( ),, ,
n
n
ii
X N X X X X
X
n a X X b X X X ka b k
例:设总体 已知。 是取自总体 的样本
求(1)统计量 的分布;
(2)设 ,若 ( 则 各为多少?
1, 2, ,ii
XY i n
解:(1)作变换 1 2, , , 0,1 1,2, ,n iY Y Y Y N i n 显然 相互独立,且
2 2 2
1 1( )
n ni
ii i
XY n
2于是
22 21 2
1 2 2
( )(2) ~ (0,2 ), ~ (1)2
X XX X N
22 23 4 5
3 4 5 2
(2 )2 ~ (0,6 ), ~ (1)6
X X XX X X N
1 2 3 4 5
2223 4 51 2
2 2
(2 )( ) ~ (2)2 6
X X X X X
X X XX X
与2 相互独立,
故 +
2
2
1 ,21 ,
62.
a
b
k
31
20,1 , ~ , ,
~
X N Y n X Y
XT T t nY n
n t
定义:设 并且 相互独立,
则称随机变量 服从自由度为 的分布,记为
, 0 1, ,t n
f t n dt t n
t n t t
对给定的 称满足条件 的点
为 分布的 。分布的上 分位数可分位数 查上 分布表
t 分布
121 2
2
2
6.2 , 1 ,
nn
ntt n f t n tnn
定理 : 分布的概率密度为:
t n
f x
x0
t 分布的上 分位数
10n
313 x
( )f x
1n
4n
202 1t分布的密度函数
1 ( ) ( )t n t n
32
2 21 2
11 2 1 2
2
1 2
, , ,
/ , ~/
,
X n Y n X Y
X nF n n F F F n nY n
n n
定义:设 且 独立,
则称随机变量 服从自由度 的 分布,记为
其中 称为第一自由度, 称为第二自由度
F分布
1 21 2 12 2 2
1 2
1 2
1 21 2 2 1
2 21 2
1 11
0
6.3 ,
1 0, ; ,
0 0
, 1
n n n n n
n n
b
F n n
n n x n n x xBf x n n
x
a bB a b x x dx
定理 : 分布的概率密度为:
其中 a b
11 2 2 1~ ( , ), ~ ( , )F F n n F F n n性质: 则
33
1 2
1 2 1 2,
1 2 1 2
, 0 1, ; , ,
, ,F n n
f x n n dx F n n
F n n F n n F
对于给定的 称满足条件 的点
为 分布的上 分位数。 的值可查 分布表
0 x1 2
f x
1 220,n n
1 220, 25n n
1 220, 10n n
F分布的密度函数
0 x 1 2,F n n
( )f x
F 分布的上 分位数
11 1 2 2 1( , ) [ ( , )]F n n F n n
34
z
, 0,1 , ,0 1X N z P X z
z
此外设 若 满足条件
则称点 为标准正态分布的上 分位数。
1z z
35
正态总体样本均值和方差的分布
21 2
2
2
22
2
2
6.4 , , , ,
,
1. ,
1 2. 1
3.
nX X X N
X S
X Nn
n Sn
X S
定理 :设 是总体 的样本,
分别是样本均值和样本方差,则有:
和 相互独立.
2
2
11 ~ 1
/
t
n Xn SX n t nSn
且两者独立,由分布定义得:
2 216.5 , , ,
~ 1
nX X N X S
n Xt n
S
定理 :设 是总体 的样本, 和 分别是样本
均值和样本方差,则有:
2
22
16.4 ~ 0,1 , ~ 1 ,
/n SX N n
n
证明:由定理 知,
36
1 2
2 21 1 1 1 2 2
2 21 2
2 2 2 22 1 1 1
1 22 22 22 21 2
1 2
2 21 2
1 2
21
6.6 , , , , , ,
, ,
1 ~ 1, 1
2 ~ (0,1),
3
n nX X Y Y N N
S S
S SF F n nSS
X YN
n n
定理 :设样本 和 分别来自总体 和
并且它们相互独立,其样本方差分别为
则:
当
1 22 22 1 2
1 2
2 21 1 2 22 2
1 2
~ 21 1
1 1 ,2
w
w w w
X Yt n n
S n n
n S n SS S Sn n
时,
其中
37
F且两者独立,由 分布的定义,有:
2 2
1 1 2 22 21 22 2
1 2
1 16.4 ~ 1 , ~ 1
n S n Sn n
证明:1 由定理 知,
2 21 2
1 21 2
(2) 6.4, ~ ( , ), ~ ( , ),X N Y N X Yn n 由定理 且 与 相互独立,
2 21 2
1 21 2
~ ( , )X Y Nn n 所以 ,
21 1
12 2 21 2 1
1 22 2 22 2 1 2
222
11
~ 1, 11
1
n Sn
S F n nn S S
n
1 22 21 2
1 2
( ) ( ) ~ (0,1)X Y N
n n
即
1 2
1 2
~ 0,11 1
X YU N
n n
213 2 2
2当 = = 时,由(2)得
2, 且它们相互独立 故有 分布的可加性知:
2 2
1 1 2 22 21 22 2
1 1 ~ 1 , ~ 1
n S n Sn n
又由给定条件知:
,U V且 与 相互独立
2 2
1 1 2 2 21 22
1 1~ 2
n S n SV n n
1 2
1 2
1 21 2
~ 21 12
w
t
X YU t n nV n n S n n
于是按分布知:
39
21 4 1 9
2 21 2
2 21 2
1
42 2
2 1 2 1 21
2 , , , , ,
, ,
( ); (2) ~ ( ), ,
(3) ( ) ~ ( , ), , ,ii
X N X X Y Y X
X S Y S
X YD S S a t k a kS
b X S F n n b n n
例 :设总体 , 与 是取自总体 的
两个独立样本, 和 分别为样本均值和样本方差;
求(1) 则 各为多少?
则 各为多少?
22
2
( 1) ~ ( 1),n S n
解:(1)一般地,由
2 2
(2) ~ ( , ), ~ ( , ),4 9
X N Y N X Y 且 与 相互独立,
2
2
( 1) 2( 1)n SD n
4
2 2( ) .1D Sn
4 42 2
1 22( ) , ( )
3 4D S D S 所以,
42 2 2 2
1 2 1 211( ) ( ) ( ) .12D S S D S D S 因此,
213~ (0, ),36
X Y N
22 21
12
3 ~ (3),S X Y S
又 且 与 相互独立,
40
21 4 1 9
2 21 2
2 21 2
1
42 2
2 1 2 1 21
2 , , , , ,
, ,
( ); (2) ~ ( ), ,
(3) ( ) ~ ( , ), , ,ii
X N X X Y Y X
X S Y S
X YD S S a t k a kS
b X S F n n b n n
例 :设总体 , 与 是取自总体 的
两个独立样本, 和 分别为样本均值和样本方差;
求(1) 则 各为多少?
则 各为多少?
2 2
(2) ~ ( , ), ~ ( , ),4 9
X N Y N X Y 且 与续 相互独立,
212
1
6 1336 ~ (3)3 1313
X YSX Y tS 所以,
22 21
12
3 ~ (3),S X Y S
又 且 与 相互独立,213~ (0, ),
36X Y N
6 13 , 3.13
a k
24 42 2 2 2 22
22 21 1
81(3) ( ) ~ (4), ~ (8), ( )i ii i
SX X S
且 与 独立,
24 42 2 22
22 21 1
81 1( ) ( ) ~ (4,8),44 8i ii i
SX X S F
1 2
1 , ( , ) (4,8).4
b n n
41
复习思考题 61.什么叫总体?什么叫简单随机样本?总体 X 的样本 X1,X2,…,Xn 有 哪两个主要性质?2.什么是统计量?什么是统计量的值?3.样本均值和样本方差如何计算?4.N(0,1) 分布 ,t 分布 ,χ2 分布和 F 分布的双侧、下侧、上侧分位点是 如何定义的?怎样利用附表查这些分位点的值?5. 对一个正态总体的三个常用统计量及其分布是什么?6. 对两个正态总体的三个常用统计量及其分布是什么?
42
第七章 参数估计关键词:
矩估计法 极大似然估计法 置信区间 置信度
43
2
22 2
2 2
,
1 ; , 2
, ,
x
X
X
f x e x
参数估计是统计推断的基本问题之一,实际工作中碰到的总体它的分布类型往往是知道的,只是不知道其中的某些参数,例如:产品的质量指标 服从正态分布,其概率密度为:
但参数 的值未知,要求估计 ,有时还希望以一定的可靠性来估计 值是在某个范围内或者不低于某个数。
参数估计问题就是要求
问题的提出:
通过样本估计总体分布所包含的未知参数的值。
点参 估数估 计法计的两种 和区方法: 间估计法
44
§1 参数的点估计
1 2
1 2
, , ,
1, 2, ,ˆ ˆ , , ,
n
i
i i n i
X X X
k
X
i
i
X X
点估计的问题就是根据样本 ,
对每一个未知参数 ,构造出一
个统计量 ,作为参数 的估计,
称为 。的估计量
点估计有两种方法:矩估计法和最大似然估计法
45
1 2 1 2
1 2 1 2
1
; , , , , , , ,
, , , 1, 2, , , , , , ,
1 1, 2, ,
, , ,1 1 2 1
, , ,2 1 2
k k
k
vv k n
nv
v ii
X F x
X k E X
E X v k X X X X
v A X v k
k
Ak
n
A
设总体 的分布函数为 是待
估计的未知参数,假定总体 的 阶原点矩 存在,
则有: 对于样本
其 阶样本矩是:
用样本矩作为总体矩的估计,即令:
1 21 2
2
,
ˆ, , , , , ,
, ,1 2
k k
Ak k k
解此方程即得 的一个矩估计量
一 矩估计法:
46
1 2
1 0 ,
, , , ,n
X
X X X X
2 2 2
2例:设总体 的均值 和方差 都存在,且 , 均未知,
是取自 的一个样本,试求 的矩估计。
1 12
2 21
ˆ 1ˆ ( )
n
ii
XAA X X
n
2令
解:先求总体矩:
2 2 21 2, E X E X D X E X 2
21 2
1 1
1 1, n n
i ii i
A X X A Xn n
再求样本矩:
47
1
1 2
2
0 1 0 0
, , n
X
x xf x
X X X X
例 :设总体 的密度为:
为未知参数,其他
, 为取自 的样本,求 的矩估计。
E X xf x dx
解:
1
1
0x dx
1X
E X X令 2
ˆ1XX
48
最大似然估计的原理介绍考察以下例子: 假设在一个罐中放着许多白球和黑球,并假定已经知道两种球的数目之比是 1:3 ,但不知道哪种颜色的球多。如果用放回抽样方法从罐中取 5 个球,观察结果为:黑、白、黑、黑、黑,估计取到黑球的概率 p.
31, .4 4p p 解:设抽到黑球的概率为 则本例中, 或
3 31 1 .4 4 4 1024
p 4
当 时,出现本次观察结果的概率为
3 3 811 .4 4 4 1024p 4
当 时,出现本次观察结果的概率为
3 81 3 31 ˆ .1024 1024 4 4 4
p p p 由于 ,因此认为 比 更有可能,于是 取为 更合理
二 最大似然估计法:
49
,X f x 若总体 为连续型的,其概率密度为 , , 为未知参数。
~ ( ; )X p x 一般地,设离散型总体 , , 未知。
1 1, , , ,n nX X X x x 从总体 中取得样本 ,其观察值为 ,
1 1
1 1 11
, ,
( ) , , ( ; )... ( ; ) ( ; ).
n n
n
n n n ii
X x X x
L P X x X x p x p x p x
则事件 发生的概率为
1ˆ( ( , , )) max ( ).nL x x L
最大似然原理:似然
函数1
1
ˆ , ,ˆ , ,n
n
x x
X X
称( )为 的 ,
相应统计量( )为 最
最大似然估
大似然
计
的
值
估计量。
1 2 1 2
1
, , , , , ,
,
n nn
ii
X X X x x x
L f x
则对于样本 的观察值 ,
似然函数 。
50
1 2 1. , , , k 未知参数可能不是一个,一般设为说明 ;
2.
ˆ0, 1,2,..., . 1, 2,..., .ii
L lnL
lnL
lnLi k i k
在求 的最大值时,通常转换为求: 的最大值,
称为对数似然函数.
利用 解得 ,
3. i
i
L
若 关于某个 是单调增 减 函数,
此时 的最大似然估计在其边界取得;
ˆ ˆ4. g g 若 是 的最大似然估计,则 的最大似然估计为 。
51
3 2 例 :求矩估计部分的例 中 的最大似然估计量。
2
2
1
ˆ n
ii
n
lnX
的最大似然估计量为:
2
1
11
1 1
,
n
n
ii
n n
i ii i
L f x
x x
解:似然函数
1
1 ln2
n
ii
nlnL ln x
1
1 1 ln 0 2 2
n
ii
dlnL n xd
令
1ln
n
ii
n x 即:
1 0 1
0
X
x xf x
即,总体 的密度为:
其他
52
1
1 4 ,
0
0, , , , ,
,
x
n
e xX f x
X X X
例 :设总体 的概率密度为:其它
其中 是未知常量 为 的样本,
求 的矩估计与最大似然估计。
1 解: 矩估计 E X xf x dx
2
1
1 ( )n
ii
E X X
D X X Xn
令
2( )D X E X
2
1
2
1
1ˆ ( )
1ˆ ( )
n
ii
n
ii
X Xn
X X Xn
1 xx e dx
2 1( ) xx e dx
2 2
01( )
t xtt e dt
53
2 最大似然估计
1
1, in
x
iL e
此处不能通过求偏导数获得 的最大似然估计量,
1
11,
n
ii
nx
nL e L
另一方面, 是 的增函数, 取到最大值时, 达到最大。
1 2, , , ,i nx x min x x x 故 的取值范围最大不超过
1
11 , 1, 2,..., .
n
ii
x
in e x i n
12
1
1 0n
ii
dlnL n X Xd
令
1 21 , , , ,nX min X X X
故
1ˆ X X
1
1 ˆn
ii
lnL nln X
又
54
1 2
5 0, 0
, , , n
X
x x x
例 :设总体 服从 上的均匀分布, 未知,
试由样本 求出 的最大似然估计和矩估计。
1 解: 最大似然估计
1 0;
0
xX f x
因 的概率密度为:其它
1 21 0 , , ,
0
nn x x xL
故参数 的似然函数为:
其它 ˆ0, L
dln nd
由于 不能用微分法求
ˆ :L从 义 发以下 定 出 求
1 20 , , , ,i nnx x max x x x 因为 故 的取值范围最小为
1
L̂n nnL x L x L
又 对 的 是减函数, 越小, 越大,故 时, 最大;
0
12
E X xdx X
由
2 矩估计 1 2
ˆ , , ,L nnX max X X X 所以 的最大似然估计量为
ˆ 2X
55
2, 0 ,32
X
1 2 3例6:设总体 的概率分布律为: 其中 ,未知2 1- 3
现得到样本观测值2,3,2,1,3,求 的矩估计与最大似然估计。
1 解: 矩估计
k kE X x p
( )E X X令
3 5 2 2 2 3 (1 3 2)
2.2X ˆ 0.32
2 最大似然估计
( ) ( 2)(1 3 2)( 2) (1 3 2)L 3 21
16 (2 3 ) ln ( ) ln16 3ln 2ln(2 3 )L
ln ( ) 3 6 02 3
d Ld
ˆ 0.4
56
表 1 例 2 ,例 4 ,例 5 中两种估计方法所得结果 例 题 矩估计量 最大似然估计量
例 2
例 4
例 5
2
1
2
1
1ˆ ( )
1ˆ ( )
n
ii
n
ii
X Xn
X X Xn
ˆ 2X ˆ
nX
1
1
ˆ
ˆ
X X
X
2
2
1
L̂ n
ii
n
lnX
2ˆ
1XX
57
§2 估计量的评选标准 从表 1 看到,对总体的未知参数可用不同方法求得不同的估计量,如何评价好坏? 通常用三条标准检验:无偏性,有效性,相合性
无偏性
ˆ ˆ,
ˆ,n
E
li
E
m E
若 那么 称为估计量 的
若 则
偏差
渐近称 是 的 无偏估计量
1 2ˆ , , , ˆ ,,
ˆnX X EX
定义:若参数 的估计量 满足
则称 是 的一个 无偏估计量。
58
2
2 2
6
, ,
X
E X D X
X S
例 :设总体 的一阶和二阶矩存在,分布是任意的,
记
证明:样本均值 和样本方差 分别是 和 的无偏估计。
1 2, , , nX X X X证:因 与 同分布,故有:
X 故 是 的无偏估计.
1
1 n
ii
E X E Xn
2 2
1
1 ( )1
n
ii
S X Xn
2 2
1
1 ( )1
n
ii
E S E X Xn
22
1
1 ( )1
n
ii
E X n Xn
2 2 211 nn
2 2S 故 是 的无偏估计.
1
1 n
iiE Xn
1 nn
2
1
1 ( )1
n
ii
E X Xn
1
11
n
iiD X nD Xn
59
ˆ ˆ7 5 2 L nX X 例 :检验例 的矩估计量 与最大似然估计量 的无偏性。
0, , ,2X U E X 解: 1, , nX X X由于 与 同分布
ˆ 2E E X 1
2 n
iiE Xn
22nn
ˆ 2X 因此 是 的无偏估计
L̂ n nX X 为考察 的无偏性,先求 的分布,
5由第三章第 节知:
,
n
n
XF x F x
1 0
0 n
n
nX
nx xf x
于是其它
1
0
n
nx nx dx
L̂ nE E X 因此有: 1
nn
L̂ nX 所以 是有偏的。
60
纠偏方法
1
ˆ , , , 0
1 ˆ
17 ,
ˆ , ,ˆ
n nn
n
E a b a b a
ba
nX X Xn
X X
如果 其中 是常数,且
则 是 的无偏估计。
在例 中,取 则 是 的无偏估计
无偏性是对估计量的一个最常见的重要要求,“ ”是 好 估计的标准之一。
无偏性的统计意义是指在大量重复试验下,由 所作的估计值的平均恰是 ,
从而无偏性保证了 没有系统误差。
61
有效性
1 2
1 2
1 2
ˆ ˆ,
,
ˆ ˆ
ˆ ˆD D
定义:设 是 的两个 估计,
如果 对一切 成立,
且不等号至少对某一 成立,则 比 。称 有效
无偏
62
2 2
142 12 3D D X n n 解:
1 0
0
n
n
nX
nx xf x
由其它
22
22 2
1n n
nD E X E X
n
于是
2 2
1 2 2 1 3 2D Dn n n
因为 比 更有效
12 2
0 2
n
n nnx nE X dx n
2
2n n
1
1 2
1 2
8 ~ 0, , , ,
1ˆ ˆ2 , 7
ˆ ˆ 2
n
n
X U X X X
nX Xn
n
例 :设总体 是取自 的样本,已知 的
两个无偏估计为 见例 ,
判别 与 哪个有效 时 ?
63
相合性
1, ,
0, 0
n
n
nn
n
lim P
X Xn
定义:设 为参数 的估计量, 若对于任意 ,当 时,依概率收敛于 ,
即 有: 成立,
则称 为 相合估计量或的 一致估计量
64
1
1
1
2 2 22
1
9 ( ) ( 2) , , ,
(1) ( )
12 , 2,..., , 2,...,
13 ( ) , ( )
kk n
nl
l i li
n
ii
X k E X k X X X
X E X
A X l k l kn
B X X S D Xn
S
例 :设总体 的 阶矩 存在 是取自 的样本,
证明: 是 的相合估计;
() 是 的相合估计;
() 是 的相合估计;
(4) 是 的相合估计。
1
1 ( ), 1, 2,..., .
(1) 2
nl li l
iX E X l k
n
证明:由辛钦大数定律知, 依概率收敛到
因此 ,()成立。
1 1
1 1 1
,..., ,...,( ,..., ) ( ,..., ) ( ,..., )
k k
k k k
A Ag g A A g
根据依概率收敛的性质,由 是 的相合估计,
若 是连续函数,则 是 的相合估计。
2 2 2 2 22 1 2 2
1
2 2 2 22
1( ) ( )
1
n
ii
D X B X X A XnnS B S S Sn
因为 ,所以 是 的相合估计,
注意到 ,因此 也是 的相合估计; 是 的相合估计。
65
1 2ˆ ˆ ,E E 证:
1
1 2
10 0, , , ,
1ˆ ˆ 2
n
n
X U X X X
nX Xn
例 :设总体 是取自 的样本,
证明: 和 是 的相合估计。
0, n 由契比雪夫不等式, 当 时,
1
1 2
ˆˆ
DP
有:
2
2 03n
1 2ˆ ˆ 所以 和 都是 的相合估计。
2
1̂ ,3
Dn
2
2̂ 2D
n n
2
2 2
ˆˆ
DP
同理:
2
2 02n n
66
§3 区间估计
1
1 1 2 21 1
1 2
ˆ
, ,
, , , , ,
,
n
n n
X X X
X X X X
引言:点估计是由样本求出未知参数 的一个估计值 ,
而区间估计则要由样本给出参数 的一个估计范围,并指出
该区间包含 的可靠程度。假设 是总体 的一个样本,
区间估计的方法是给出两个统计量
使区间 以一定的可靠程度盖住 。
67
置信区间 置信度
1
;
, , 0 1 ,n
X F x
X X X
定义:设总体 的分布函数 含有一个未知参数 ,
是总体 的一个样本,对给定的值
1 1 2 21 1
1 21 1
, , , , ,
, , , , 1 7 1
n n
n n
X X X X
P X X X X
如果有两个统计量 ,使得:
1 2
1 2
, 1
则称随机区间 是 的双侧置信区间;称 为置信度;
和 分别称为双侧置信下限和双侧置信上限。
68
置信区间的含义:
),
, , ,
n
若反复抽样多次(各次得到的样本容量相等,都为 每个
样本值确定一个区间 每个这样的区间或者包含 的真值
或者不包含 的真值。见下图
100(1 )%.0.05, 95%
0.01, 99%
按伯努里大数定律,在这些区间中,包含 真值的约占如反复抽样10000次,当 即置信水平为 时, 10000个区间中不包含 的真值的约为500个; 当 即置信水平为 时,10000个区间中不包含 的真值的约为100个。
69
单侧置信限
1 1
1 1
1
7 1
, , 1 , 7 2
, ,
, 1
n
n
P X X
X X
在以上定义中,若将 式改为:
则称 为 的单侧置信下限。
随机区间 是 的置信度为 的单侧置信区间。
2 1
2 1
2
7 2
, , 1 , 7 3
, ,
, 1
n
n
P X X
X X
又若将 式改为:
则称 为 的单侧置信上限。
随机区间 是 的置信度为 的单侧置信区间。
70
求未知参数 的置信区间(置信限)方法:
1ˆ1. , , nX X 根据样本 ,得到 的估计
(如最大似然估计,无偏估计,矩估计等);ˆ2. ( ; ),
ˆ( ; )
W
W
构造函数 它不包含其它未知参数,且分布已知,
分布中的参数均已知(称 为枢轴量);
3. 1 ,
ˆ( ; ) 1
a b
P a W b
对于给定的置信度 ,定出两个常数 ,使得
;
1 21 1
1 2
ˆ4. ( ; )
, , , ,
, 1
n n
a W b
X X X X
若能从 得到等价的不等式
那么 就是 的置信度为 的置信区间。
ˆ. 3. ( ; ) 1
ˆ ˆ( ; ) 1 ( ; ) 1
P a W b
P a W P W b
若要求单侧置信限,只要将 中
改为 或
注
即可。
71
正态总体均值方差的区间估计 2 ~ ,X N 一 单个正态总体 的情形
21 2, , , , , 1nX X X X X S 为来自 的样本 和 分别为样本均值和方差置信度为
1. 均值 的置信区间
21 已知时
, ~ 0,1XX Nn
是 的无偏估计 由
2 1XP zn
有
2 2 1P X z X zn n
即
2 2,X z X zn n
置信区间为:
1-?
思考题:均值 的置信度 的置信下限是什么呢
: X zn
答案
ba
0.99
0.0050.005 1 2 2
72
22 未知时
~ 1X t nS n
由
2 21 1 1XP t n t nS n
有
2 21 1 1S SP X t n X t nn n
即
2 21 , 1S SX t n X t nn n
置信区间为:
0t
1 2
2
0t 2 1t n 2 1t n
73
22. 方差 的置信区间设 未知
2
22
1~ 1
n Sn
由
2
2 21 2 22
11 1 1
n SP n n
有
2 22
2 22 1 2
1 11
1 1n S n S
Pn n
即
2 2
2 22 1 2
1 1,
1 1n S n S
n n
置信区间为:
2
2
2
1
2
12
2
1-?
2思考题:
方差 的置信度 的置信上限是什么
2
21
:
( 1) .( 1)
n Sn
答案
2
12
( 1)n
2
2
( 1)n
74
2
2 2 2
10 , ,
36 , 15 . ,95
1 16; 2 , 16;
X cm N
cm
S
例 :设某种植物的高度 服从正态分布
随机选取 棵 其平均高度为 就以下两种情形 求 的 %双侧置信区间:
未知
36, 15, 4n X 1解:
1.96 1.96 0.95P X Xn n
由
1.96 41.96 15 13.69336
Xn 得:
1.96 41.96 15 16.30736
Xn
13.693,16.307的置信区间为
75
2 36, 15, 16n X S 2
0.025 0.025(35) (35) 1 0.05S SP X t X tn n
由
0.025 35 2.0301t 查表得:2.0301 4 2.0301 4 15 13.647, 15 16.3536 6
又:
13.647,16.353的置信区间为
99 1 2
求置信度为 %时
两种情况下 的置信区间
?
1 13.333,16.667
2 13.184,16.815
?答案:
76
1 2 比较 两种情形下 的置信区间:
2 2, 16, 13.693,16.307 已知 置信区间:
2 2, 16, 13.647,16.353S 未知 置信区间:
, ,t X S n
2但第二种情形更实用,因为多数时候, 未知
用分布求 的置信区间只依赖于样本数据及统计量
区间短
区间长
[说明 ] 置信区间包含两方面含义 1.置信水平 2.区间长度置信水平越高,区间越大,但区间精确度差置信区间越小,精确度高,但置信水平低
77
2 2
11 ,,
, 25 ,
4.25. 95 99S
例 :一个园艺科学家正在培养一个新品种的苹果 这种苹果除了口感好和颜色鲜艳以外另一个重要特征是单个重量差异不大。为了
评估新苹果 她随机挑选了 个测试重量 单位:克 其样本方
差为 试求 的置信度为 %和的 %的置信区间。
95%解:置信度为 时
2 22
2 20.025 1 0.025
1 11 0.05
n S n SP
2 20.025 0.97524 39.4, 24 12.4; 查表得:
25 1 4.25 25 1 4.25 2.59, 8.2339.4 12.4
又:
2.59,8.23 2的置信区间为
20.005
20.995
99% ,
24 45.6,
24 9.89,
25 1 4.252.24,45.6
25 1 4.2510.319.89
置信度为 时
2.24,10.31 2的置信区间为
78
2 21 1 2 2 , , ,N N 二 两个正态总体 的情形
1 2
1 2
2
2 21 2 1 1 1 2 2 2
2 21
1 21 1
, , , , , , , , , ,
1 1, , , , 1 .
n n
n n
i ji j
X X X N Y Y Y N
X X Y Y S Sn n
来自 来自
和 分别为第一 二个总体的样本方差置信度为
1 21. 的置信区间
2 21 21 , 已知时
2 21 2
1 21 2
~ ,X Y N n n
由
1 2
2 21 2
1 2
~ 0,1X Y
N
n n
有
2 21 2
2 1 2X Y z n n
置信区间为:
79
2 2 2 21 22 , 未知
1 21 2
1 2
6.6, ~ 21 1
w
X Yt n n
S n n
此时由第六章定理
2 21 1 2 22 2
1 2
1 1 ,2w w w
n S n SS S Sn n
其中
1 22 1 2
1 12 wX Y t n n S n n
置信区间为:
80
2122
2. 的置信区间
1 2, 设 未知
2 2
1 21 22 2
1 2
~ 1, 1S S F n n
由
2 2
1 21 2 1 22 21
2 21 2
1, 1 1, 1 1S SP F n n F n n
有
2 2
1 12 2
1 2 1 22 2 12 2
1 1,1, 1 1, 1
S SF n n F n nS S
置信区间为:
2 2 2
1 1 12 2 2
1 2 1 22 2 2 12 2
1 1 11, 1 1, 1
S SPF n n F n nS S
即
81
例 12 :两台机床生产同一个型号的滚珠,从甲机床生产的滚珠中抽取 8 个,从乙机床生产的滚珠中抽取 9 个,测得这些滚珠得直径 (毫米 ) 如下 :甲机床 15.0 14.8 15.2 15.4 14.9 15.1 15.2 14.8乙机床 15.2 15.0 14.8 15.1 14.6 14.8 15.1 14.5 15.0
2 21 1 2 2
1 2 1 2
1 2 1 2
21
1 2 22
, , , , ,
1 0.18, 0.24, 0.90
2 0.90
3 , 0.90
X Y X N Y N
设两机床生产的滚珠直径分别为 且
求 的置信度为 的置信区间;
若 未知,求 的置信度为 的置信区间;
若 未知,求 的置信度为 的置信区间.
82
2 21 1 2 2 8, 15.05, 0.0457 9, 14.9, 0.0575n x S n y S 解: ;
1 2 1 22 0.90 当 未知时, 的置信度为 的置信区间为:
1 2 1 21 0.18, 0.24 , 0.90 当 时 求 的置信度为 的
置信区间为:2 21 2
21 2
X Y z n n
0.05 1.645, 0.018,0.318z 查表得: 从而所求区间为
0.051 2
1 115 1.7531, 0.228, 0.486wt S n n
2 1 21 2
1 12 wX Y t n n S n n
0.044,0.344从而所求区间为
1 2
0 当 - 的置信区间包
含 时,可以认为两个总体的均值之间没有显著差异。
83
21
1 2 22
3 , 0.90
当 未知时, 的置信度为 的置信区间为:
2 2
1 12 2
2 1 2 1 2 1 22 2
1 1,1, 1 1, 1
S SF n n F n nS S
0.05 0.950.05
1 17,8 3.50, 7,8 0.2683.738,7F F
F 由
2122
0.90 0.227,2.965
得 的置信度为 的置信区间为
2122
当 的置信区间包含1时,
可以认为两个总体的方差之间没有显著差异。
待估待估 参数参数 其他 其他
参数参数W W 的 分 布的 分 布 置信区间置信区间 单侧置信限单侧置信限
一个正态总体
一个正态总体
两个正态总体
两个正态总体
2
1 2
2122
2 已知
2 21 2, 已知
2 21 2
2
未知
1 2, 未知
2X zn
2 1SX t nn
2 2
2 22 1 2
1 1,
1 1n S n S
n n
1 2
2 未知
未知
2 21 2
21 2
X Y z n n
212
2 1 22
212
1 2 1 22
1 ,1, 1
11, 1
SF n nS
SF n nS
2 1 21 2
1 12 wX Y t n n S n n
~ 0,1XZ Nn
~ 1Xt t nS n
2
2 22
1~ 1
n Sn
1 2
2 21 2
1 2
~ 0,1X Y
Z N
n n
2 2
1 21 22 2
1 2
~ 1, 1S SF F n n
1 21 2
1 2
~ 21 1
w
X Yt t n n
S n n
X zn
X zn
1
1
SX t nnSX t nn
22
21
22
2
11
11
n Sn
n Sn
2 21 2
1 21 2
2 21 2
1 21 2
X Y z n n
X Y z n n
2 21 12 2
1 1 22 22 21 12 2
1 22 2
11, 1
11, 1
SF n nS
SF n nS
1 2 1 21 2
1 2 1 21 2
1 12
1 12
w
w
X Y t n n Sn n
X Y t n n S n n
正态总体均值、方差的置信区间与单侧置信限 1 置信度
复习思考题 71.总体未知参数矩估计的思想方法是什么?试写出 0-1 分布、 二项分布 b(m,p) 、泊松分布∏ (λ) 、均匀分布 U(a,b) 、正态分布
N(μ,σ2)中有关参数的矩估计式2. 极大似然估计的主要步骤是什么?3.未知参数的估计量与估计值有什么区别?
5. 估计量的三个基本评价标准是什么?你能理解它们的含义吗?6. 求参数置信区间的一般方法是什么?对正态总体,试从有关 的统计量自行导出几类参数的置信区间?7.置信度的含义是什么?置信度、区间长度和样本容量的关系怎样?
1
2 2
12
1, ,
1 ( ) ,1
( ),
4.
,
n
ii
n
ii
X n X Xn
S X Xn
E X E X E S D X
总体 有容量为 的样本 样本均值
样本方差有性质 这是否只对正态总体成立?
23/4/24
课件待续 !