概率论 ( 续）

1

概率论概率论 (( 续）续）

►注注 11 答疑安排答疑安排► 时间：每周六上午时间：每周六上午 88 ：： 30---1030---10：： 5050► 地点：东地点：东 1B—1B—东东 22 间长廊间长廊 11 楼教师休息室楼教师休息室►注注 22 联系方式联系方式► 张彩伢：张彩伢： [email protected]@zju.edu.cn► (( 助教）项燕彪：助教）项燕彪：

[email protected]►注注 3 3 课件下载课件下载► 浙江大学数学系主页浙江大学数学系主页——》——》师资队伍师资队伍——》——》数学系数学系教师介绍教师介绍——》——》统计研究所统计研究所——》——》张彩伢张彩伢►http://www.math.zju.edu.cnhttp://www.math.zju.edu.cn

2

mailto:[email protected]

3

第五章大数定律和中心极限定理关键词：

契比雪夫不等式大数定律中心极限定理

4

§1 大数定律

背景本章的大数定律，对第一章中提出的 “ 频率稳定性”，给出理论上的论证

为了证明大数定理，先介绍一个重要不等式

5

2

2

2

2

2

5.1 ,

0,

1

X E X D X

P X E X

P X E X

定理契比雪夫不等式：设随机变量具有数学期望方差

则对于任意都有：

定理的为：等价形式

,X X f x证明：仅就为连续型时证之设的概率密度为

x

P X f x dx

则 2

2x

xf x dx

22

1 x f x dx

2

2 2

D X

( )f x

• 思考：切比雪夫不等式的意义

6

7

例 1 ：在 n 重贝努里试验中，若已知每次试验事件 A 出现的概率为 0.75 ，试利用契比雪夫不等式 ,(1)若 n=7500, 估计 A 出现的频率在 0.74至 0.76 之间的概率至少有多大；（ 2 ）估计 n,使 A 出现的频率在 0.74至 0.76 之间的概率不小于 0.90 。

n A解：设在重贝努里试验中，事件出现的次数为X， ,0.75b n则X , 0.75 , 0.1875 ,E X np n D X npq n

nXf A n又

0.74 0.76 0.75 0.01XP P X n nn

(2)

20.187510.01

nn

18751 0.90n 18750n

(1) 7500, 0.74 0.76 0.75 0.01Xn P P X n nn

20.187510.01

nn

18751 0.757500

8

随机变量序列依概率收敛的定义

1 2 35.1 , , , ,0, 0,nn

n

Y Y Y alim P Y a

Y aPY an

。

定义：设随机变量序列若存在某常数，使得均有：

则称随机变量序列依概率收敛于常数，

记为：

a aa

9

1 2

2

1

1

1

5.2

, , , ,

1 , 0

1lim lim 1.

1 .

n

n

n kk

n

n kn n kn

Pk

k

X X X

n

Y Xn

P Y P Xn

Xn

定理契比雪夫定理的特殊情形：

设随机变量序列相互独立，且具有相同的

数学期望和相同的方差，作前个随机变量的算术平均：

则，有：

即，

1

1 1 ,n

n kk

E Y E X nn n

证明：由于

1

1 n

n kk

D Y D Xn

2

1

1 n

kk

D Xn

2

22

1 n nn

2

21

1 1n

kk

nP Xn

由契比雪夫不等式得：

1

1 1n

kn k

lim P Xn

10

1 2

1

1

5.3

, , , ,

1

0

1lim lim 1.

n

n

n kk

n

n kn n k

X X X

n Y Xn

P Y P Xn

定理辛钦定理：

设随机变量序列相互独立，服从同一分布，

且存在数学期望，作前个随机变量的算术平均：

则，有：

契比雪夫大数定律表明，当 n 很大时，的算术平均接近于数学期望。这种接近是在概率意义下的接近。1

1 n

kk

Xn

1 2, , , ,nX X X

此外，定理中要求随机变量的方差存在，但当随机变量服从相同分布时，就不需要这一要求。

11

例 2 ： 1 1

2

1 1 1

, , , , ~ ( 1,1).1 1 11 2 3

n

n n n

k k kk k k

X X X U

X X Xn n n

设随机变量相互独立同分布，则

（），（），（）分别依概率收敛吗？

如果依概率收敛，分别收敛于什么？

1 1

1 1

2 2 21 1

2

1 1 1

, , , , ( ), , , , ( )

, , , , ( )1 1 1

n

n

n

n n n

k k kk k k

X X E X

X X E X

X X E X

X X Xn n n

解：由辛钦大数定律，相互独立同分布，存在,相互独立同分布，存在,相互独立同分布，存在,

故，，，均依概率收敛。

1( ) 0,E X 因为，1

1 n

kk

Xn

P故， 0，1

1 1( ) ,E X x dx

1 1同理， 2 2

12 21 1

( ) ,E X x dx

1 12 3

1

1 n

kk

Xn

P 1，2

2

1

1 n

kk

Xn

P 1。3

12

大数定律的重要意义：贝努里大数定律建立了在大量重复独立试验中事件出现频率的稳定性，正因为这种稳定性，概率的概念才有客观意义，贝努里大数定律还提供了通过试验来确定事件概率的方法，既然频率nA/n 与概率 p 有较大偏差的可能性很小，我们便可以通过做试验确定某事件发生的频率并把它作为相应的概率估计，这种方法即是在第 7 章将要介绍的参数估计法，参数估计的重要理论基础之一就是大数定理。

5.4

, 0, 1

A

A

n

A p n nnA lim P pn

定理贝努里大数定理设事件在每次试验中发生的概率为，记为次独立重复试验

中发生的次数则有：

, ,An b n p证明：利用契比雪夫不等式，因故：

1 1 ,AA

nE E n np pn n n

20, 1An pqP pn n

于是，有

2 21 1A

An pqD D n npqn nn n

1A

n

nlim P pn

即得：

13

§2 中心极限定理背景：有许多随机变量，它们是由大量的相互独立的随机变量的综合影响所形成的，而其中每个个别的因素作用都很小，这种随机变量往往服从或近似服从正态分布，或者说它的极限分布是正态分布，中心极限定理正是从数学上论证了这一现象，它在长达两个世纪的时期内曾是概率论研究的中心课题。

14

5.5 定理独立同分布的中心极限定理

2

1

0,1 .

( , ),

n

n

ii

n Y N

X N n n

此定理表明，当充分大时，近似服从

即：（近似）～

1

1 n

ii

X Xn

思考题：

的近似

分布是什么？

2

( , )Nn答案：

2

1 2

2

1

1 2

, , , ,

, , 1, 2,

1,2

n

i i

n

ii

n

n

i txi

nn n

X X

E X D X i

X nn Y

n

X nx R lim P Y x lim P x e dt

n

设随机变量X 相互独立同分布，

则前个变量的和的标准化变量为：

有：

证明略。

1( ) ( ) ( ).

n

ii

b n a nP a X bn n

从而，

15

5.6 定理德莫佛- -拉普拉斯定理

2

215.4,(1 ) 2

tbA

n a

n nplim P a b e dtnp p

由定理

1 0 i

i AX

i A

第次试验时发生证明：令

第次试验时未发生

2

2

0 1 ,

1, lim ,(1 ) 2

A

tbA

n a

n n A P A p p

n npa b P a b e dtnp p

设为重贝努里试验中发生的次数，

则对任何区间( ]，有：

1 2, , , , ~ (1, ).n iX X X X b p 则相互独立同分布,

1 2 ,A nn X X X 由于

( ) ~ ( , (1 )).An N np np p即: 近似

( )(1 )

( )(1 )

AP a n bb npnp pa npnp p

16

例 3 ：设某种电器元件的寿命服从均值为 100 小时的指数分布，现随机取得 16只，设它们的寿命是相互独立的 ,求这 16只元件的寿命的总和大于 1920 小时的概率。1 2 1616 , , , ,X X X解：记只电器元件的寿命分别为

16

116 i

iX X

则只电器元件的寿命总和为 ,

2100, 100i iE X D X 由题设

16

116 100

1600 0,14 100 400

iiX

XY N

根据独立同分布的中心极限定理:

近似服从

1920 1 1920P X P X 1920 16001 400

1 0.8 0.2119

17

例 4 ：某保险公司的老年人寿保险有 1 万人参加，每人每年交 200元 , 若老人在该年内死亡，公司付给受益人 1 万元。设老年人死亡率为 0.017 ，试求保险公司在一年内这项保险亏本的概率。

200P X

, , 10000, 0.017b n p n p 解：设X为一年中投保老人的死亡数，则X- -由德莫佛拉普拉斯中心极限定理，保险公司亏本的概率为：

10000 10000 200P X

2001

1np

np p

1 2.32 0.01

10

思考题：求保险公司至少盈利万元的概率。

答案：0. 937

18

例 5 ：设某工厂有 400台同类机器，各台机器发生故障的概率都是 0.02 ，各台机器工作是相互独立的，试求机器出故障的台数不小于 2 的概率。

400 0.02 0.98 2.8

12 1 ( 1) 1

7 2.5 0.99382.8

npq

npP X P Xnpq

, 400,0.02 b解：设机器出故障的台数为X则X ，分别用三种方法计算：

1. 用二项分布计算

400 3992 1 0 1 1 0.98 400 0.02 0.98 0.9972P X P X P X

2. 用泊松分布近似计算

400 0.02 8 ,

2 1 0 1 1 0.000335 0.002684 0.9969.np

P X P X P X

3. 用正态分布近似计算

19

例 6 ： 1 20 1

20 20 202

1 1 1

, , , ~ ( 1,1)1 1 11 2 320 20 20k k k

k k k

X X X U

X X X

设随机变量相互独立同分布，。分别求

（），（），（）的近似分布。

20 20 202

1 1 1

1 1 120 20 20k k k

k k k

X X X 解：由中心极限定理，，，均近似服从正态分布。

1( ) 0,E X 因为，

1( ) ,E X 12

21( ) ,E X

13

14( ) ,

12D X

13

20

1

1 ~ (0, ),20 k

k

X N

近似 1

602 2

1 1 1( ) ( ) [ ( )] ,D X E X E X 112

20

1

1 ~ ( , )20 k

k

X N

近似 1 1 ，2 240

2 4 2 21 1 1( ) ( ) [ ( )] ,D X E X E X

1 1 45 9 45

2

1

1 ~ ( , )n

kk

X Nn

近似 1 1

。3 225

20

例 7 ：（例 1续）在 n 重贝努里试验中，若已知每次试验事件 A 出现的概率为 0.75 ，试利用中心极限定理 ,(1)若 n=7500, 估计 A 出现的频率在 0.74至 0.76 之间的概率近似值；（ 2 ）估计 n,使 A 出现的频率在 0.74至 0.76 之间的概率不小于 0.90 。

n A解：设在重贝努里试验中，事件出现的次数为X， ,0.75b n则X , 0.75 , 0.1875 ,E X np n D X npq n

0.76 0.75 0.74 0.750.74 0.76 ( ) ( )0.1875 0.1875n n n nXP

n n n (2)

18750n

契比雪夫不等式估计

。

(1) 7500, 0.74 0.76Xn P n 0.76 0.75 0.74 0.75( ) ( )0.1875 0.1875n n n n

n n

0.042 ( ) 1 2 (2) 1 0.95443n

0.042 ( ) 1 0.9,3n 0.04( ) 0.95,

3n

20.04 1.645, (25 1.645) 3 50743n n

21

数理统数理统计计

22

数理统计学是一门关于随机数据收集、整理分析和推断的科学。

以样本的信息来推断总体的信息 ----- 统计推断

23

§1 总体和样本总体：研究对象的全体。常常用随机变量（或随机向量） X 及其分布 F(x) 来描述总体随机样本：从总体中随机抽取 n 个个体组成的集合，其中 n 为样本容量。容量为 n 的随机样本可看成 n 个随机变量（或随机向量）

简单随机样本：（独立同分布性）1. 每个 Xi与 X 同分布2. X1,X2,…,Xn 是相互独立的随机变量

（具有非常好的代表性！）

nXXXX ,,,~21

• 设总体 X 具有分布函数，则样本• 的联合分布函数为：

• 设总体具有概率密度或分布律函数，则样本• 的联合概率密度或联合分布律为

24

)(),,,1

21

n

iin xFxxxF （

)(),,,1

21

n

iin xfxxxf （

xF nXXXX ,,,~21

xf

• 例 1 ：独立重复抛掷硬币 100 次，设

• 写出的联合分布列。• 例 2 ：设总体，写出简单随机样本• 的联合概率密度。 •

25

否则次出现正面第

01 i

X i

)( 1 nXX ，，

），（ 2~ NX)~

1 nXXX ，，（

26

统计量：样本的不含任何未知参数的函数。常用统计量：设（ X1,X2,…,Xn ）为取自总体 X 的样本1

1 1. n

ii

X Xn 样本均值

1

1

1 1, 2,

1 ( ) 2,

3. n

kk i

i

nk

k ii

k A X kn

k B X X kn

样本矩阶矩：

阶中心矩：

2 2

1

1 2. (1

) ,n

ii

S X X Sn

样本方差为样本标准差

1 1

2 2

1 1

1 1

, , , ,

1 1 ( )1

1 11,2, ( ) 2,

n n

n n

i ii i

n nk k

k i k ii i

X X x x

x x s x xn n

a x k b x x kn n

当获得样本的观察值后，上述统计量的观察值记为

，，

，，，

27

2 21 2 3

1 2 3 2 1 2 3

32

3 121

, , , ,

1 2 2 3 max , ,

1 4 5 ii

N X X X

X X X X X X X

X X X

思考题：设在总体中抽取样本其中已知，未知

指出在

中哪些是统计量，哪些不是统计量，

为什么？

2

2

2

, ,...,

( ) , ( )

( ) __, ( ) ___, ( ) __ .

nX X X X

E X D X

E X D X E S

1例1设是总体的样本，若

，

则

答：只有(4)不是统计量。

2

n

2

2 22

2(1 ), 0 1,( )

0,

, ,..., ( ) __, ( ) ______, ( ) __ .n

x xX f x

X X X X E X E X E S

1

例2 设总体的概率密度为其它

是总体的样本，则

1

0

1( ) 2 (1 ) ,3

E X x x dx 解： 12 2

0

1( ) 2 (1 ) ,6

E X x x dx 1( ) ,

18D X

13

1 118 9n

118

28

§2 常用的分布•

2

2 2

1 2

2

1

2

, , 0,1 1, 2, ,

1

1

n i

n

n ii

X X X X N i n

X

n n

定义：设随机变量相互独立，

则称

服从自由度为的分布，记为

指式右端包含的独立变自由度量的个数.

22

1

2 2

1

0

1 026.1 2 2 0 0

ny

nn

x

y e yn f y n

y

x e dx

定理：分布的概率密度为：

其中

2 分布

x

( )f x

0

10n

1n

4n

2 分布的概率密度函数

29

2 分布的一些重要性质： 2 2 2 2, ,1. 2n E n D n 设则有

2 2 21 1 2 2 1 2 1 2 1 2, , ,2. Y n Y n Y Y Y Y n n 设且相互独立，则有

22 分布的可加性性质称为，可推广到有限个的情形：

2 21 2

1 1~ , , , , ~

m m

i i m i ii i

Y n Y Y Y Y n

设且相互独立，则

2

2

2 2 2

,0 1,

,

nnf y dy

n n

n

上分

对给定的概率称满足条件的点为

分布的上分位位数数的值可查分布表

2 n0

2 分布的上分位数

x

( )f x

30

2 21 2

2 22

1

2 2 21 2 3 4 5

1 , , , , , ,

1 ( )

5 ) (2 ) ~ ( ),, ,

n

n

ii

X N X X X X

X

n a X X b X X X ka b k

例：设总体已知。是取自总体的样本

求(1)统计量的分布；

（2）设 ,若 ( 则各为多少？

1, 2, ,ii

XY i n

解：(1)作变换 1 2, , , 0,1 1,2, ,n iY Y Y Y N i n 显然相互独立，且

2 2 2

1 1( )

n ni

ii i

XY n

2于是

22 21 2

1 2 2

( )(2) ~ (0,2 ), ~ (1)2

X XX X N

22 23 4 5

3 4 5 2

(2 )2 ~ (0,6 ), ~ (1)6

X X XX X X N

1 2 3 4 5

2223 4 51 2

2 2

(2 )( ) ~ (2)2 6

X X X X X

X X XX X

与2 相互独立，

故＋

2

2

1 ,21 ,

62.

a

b

k

31

20,1 , ~ , ,

~

X N Y n X Y

XT T t nY n

n t

定义：设并且相互独立，

则称随机变量服从自由度为的分布，记为

, 0 1, ,t n

f t n dt t n

t n t t

对给定的称满足条件的点

为分布的。分布的上分位数可分位数查上分布表

t 分布

121 2

2

2

6.2 , 1 ,

nn

ntt n f t n tnn


t n

f x

x0

t 分布的上分位数

10n

313 x

( )f x

1n

4n

202 1t分布的密度函数

1 ( ) ( )t n t n

32

2 21 2

11 2 1 2

2

1 2

, , ,

/ , ~/

,

X n Y n X Y

X nF n n F F F n nY n

n n

定义：设且独立，

则称随机变量服从自由度的分布，记为

其中称为第一自由度，称为第二自由度

F分布

1 21 2 12 2 2

1 2

1 2

1 21 2 2 1

2 21 2

1 11

0

6.3 ,

1 0, ; ,

0 0

, 1

n n n n n

n n

b

F n n

n n x n n x xBf x n n

x

a bB a b x x dx


其中 a b

11 2 2 1~ ( , ), ~ ( , )F F n n F F n n性质：则

33

1 2

1 2 1 2,

1 2 1 2

, 0 1, ; , ,

, ,F n n

f x n n dx F n n

F n n F n n F

对于给定的称满足条件的点

为分布的上分位数。的值可查分布表

0 x1 2

f x

1 220,n n

1 220, 25n n

1 220, 10n n

F分布的密度函数

0 x 1 2,F n n

( )f x

F 分布的上分位数

11 1 2 2 1( , ) [ ( , )]F n n F n n

34

z

, 0,1 , ,0 1X N z P X z

z

此外设若满足条件

则称点为标准正态分布的上分位数。

1z z

35

正态总体样本均值和方差的分布

21 2

2

2

22

2

2

6.4 , , , ,

,

1. ,

1 2. 1

3.

nX X X N

X S

X Nn

n Sn

X S

定理：设是总体的样本，

分别是样本均值和样本方差，则有：

和相互独立.

2

2

11 ~ 1

/

t

n Xn SX n t nSn

且两者独立，由分布定义得：

2 216.5 , , ,

~ 1

nX X N X S

n Xt n

S

定理：设是总体的样本，和分别是样本

均值和样本方差，则有：

2

22

16.4 ~ 0,1 , ~ 1 ,

/n SX N n

n

证明：由定理知，

36

1 2

2 21 1 1 1 2 2

2 21 2

2 2 2 22 1 1 1

1 22 22 22 21 2

1 2

2 21 2

1 2

21

6.6 , , , , , ,

, ,

1 ~ 1, 1

2 ~ (0,1),

3

n nX X Y Y N N

S S

S SF F n nSS

X YN

n n

定理：设样本和分别来自总体和

并且它们相互独立，其样本方差分别为

则：

当

1 22 22 1 2

1 2

2 21 1 2 22 2

1 2

~ 21 1

1 1 ,2

w

w w w

X Yt n n

S n n

n S n SS S Sn n

时，

其中

37

F且两者独立，由分布的定义，有：

2 2

1 1 2 22 21 22 2

1 2

1 16.4 ~ 1 , ~ 1

n S n Sn n

证明：1 由定理知，

2 21 2

1 21 2

(2) 6.4, ~ ( , ), ~ ( , ),X N Y N X Yn n 由定理且与相互独立，

2 21 2

1 21 2

~ ( , )X Y Nn n 所以，

21 1

12 2 21 2 1

1 22 2 22 2 1 2

222

11

~ 1, 11

1

n Sn

S F n nn S S

n

1 22 21 2

1 2

( ) ( ) ~ (0,1)X Y N

n n

即

1 2

1 2

~ 0,11 1

X YU N

n n

213 2 2

2当 = = 时，由（2）得

2, 且它们相互独立故有分布的可加性知：

2 2

1 1 2 22 21 22 2

1 1 ~ 1 , ~ 1

n S n Sn n

又由给定条件知：

,U V且与相互独立

2 2

1 1 2 2 21 22

1 1~ 2

n S n SV n n

1 2

1 2

1 21 2

~ 21 12

w

t

X YU t n nV n n S n n

于是按分布知：

39

21 4 1 9

2 21 2

2 21 2

1

42 2

2 1 2 1 21

2 , , , , ,

, ,

( ); (2) ~ ( ), ,

(3) ( ) ~ ( , ), , ,ii

X N X X Y Y X

X S Y S

X YD S S a t k a kS

b X S F n n b n n

例：设总体，与是取自总体的

两个独立样本，和分别为样本均值和样本方差；

求(1) 则各为多少？

则各为多少？

22

2

( 1) ~ ( 1),n S n

解：(1)一般地，由

2 2

(2) ~ ( , ), ~ ( , ),4 9

X N Y N X Y 且与相互独立，

2

2

( 1) 2( 1)n SD n

4

2 2( ) .1D Sn

4 42 2

1 22( ) , ( )

3 4D S D S 所以，

42 2 2 2

1 2 1 211( ) ( ) ( ) .12D S S D S D S 因此，

213~ (0, ),36

X Y N

22 21

12

3 ~ (3),S X Y S

又且与相互独立，

40

21 4 1 9

2 21 2

2 21 2

1

42 2

2 1 2 1 21

2 , , , , ,

, ,

( ); (2) ~ ( ), ,

(3) ( ) ~ ( , ), , ,ii

X N X X Y Y X

X S Y S

X YD S S a t k a kS

b X S F n n b n n

例：设总体，与是取自总体的

两个独立样本，和分别为样本均值和样本方差；

求(1) 则各为多少？

则各为多少？

2 2

(2) ~ ( , ), ~ ( , ),4 9

X N Y N X Y 且与续相互独立，

212

1

6 1336 ~ (3)3 1313

X YSX Y tS 所以，

22 21

12

3 ~ (3),S X Y S

又且与相互独立，213~ (0, ),

36X Y N

6 13 , 3.13

a k

24 42 2 2 2 22

22 21 1

81(3) ( ) ~ (4), ~ (8), ( )i ii i

SX X S

且与独立，

24 42 2 22

22 21 1

81 1( ) ( ) ~ (4,8),44 8i ii i

SX X S F

1 2

1 , ( , ) (4,8).4

b n n

41

复习思考题 61.什么叫总体？什么叫简单随机样本？总体 X 的样本 X1,X2,…,Xn 有哪两个主要性质？2.什么是统计量？什么是统计量的值？3.样本均值和样本方差如何计算？4.N(0,1) 分布 ,t 分布 ,χ2 分布和 F 分布的双侧、下侧、上侧分位点是如何定义的？怎样利用附表查这些分位点的值？5. 对一个正态总体的三个常用统计量及其分布是什么？6. 对两个正态总体的三个常用统计量及其分布是什么？

42

第七章参数估计关键词：

矩估计法极大似然估计法置信区间置信度

43

2

22 2

2 2

,

1 ; , 2

, ,

x

X

X

f x e x

参数估计是统计推断的基本问题之一，实际工作中碰到的总体它的分布类型往往是知道的，只是不知道其中的某些参数，例如：产品的质量指标服从正态分布，其概率密度为：

但参数的值未知，要求估计，有时还希望以一定的可靠性来估计值是在某个范围内或者不低于某个数。

参数估计问题就是要求

问题的提出：

通过样本估计总体分布所包含的未知参数的值。

点参估数估计法计的两种和区方法：间估计法

44

§1 参数的点估计

1 2

1 2

, , ,

1, 2, ,ˆ ˆ , , ,

n

i

i i n i

X X X

k

X

i

i

X X

点估计的问题就是根据样本，

对每一个未知参数，构造出一

个统计量，作为参数的估计，

称为。的估计量

点估计有两种方法：矩估计法和最大似然估计法

45

1 2 1 2

1 2 1 2

1

; , , , , , , ,

, , , 1, 2, , , , , , ,

1 1, 2, ,

, , ,1 1 2 1

, , ,2 1 2

k k

k

vv k n

nv

v ii

X F x

X k E X

E X v k X X X X

v A X v k

k

Ak

n

A

设总体的分布函数为是待

估计的未知参数，假定总体的阶原点矩存在，

则有：对于样本

其阶样本矩是：

用样本矩作为总体矩的估计，即令：

1 21 2

2

,

ˆ, , , , , ,

, ,1 2

k k

Ak k k

解此方程即得的一个矩估计量

一矩估计法：

46

1 2

1 0 ,

, , , ,n

X

X X X X

2 2 2

2例：设总体的均值和方差都存在，且，均未知，

是取自的一个样本，试求的矩估计。

1 12

2 21

ˆ 1ˆ ( )

n

ii

XAA X X

n

2令

解：先求总体矩：

2 2 21 2, E X E X D X E X 2

21 2

1 1

1 1, n n

i ii i

A X X A Xn n

再求样本矩：

47

1

1 2

2

0 1 0 0

, , n

X

x xf x

X X X X

例：设总体的密度为：

为未知参数，其他

，为取自的样本，求的矩估计。

E X xf x dx

解：

1

1

0x dx

1X

E X X令 2

ˆ1XX

48

最大似然估计的原理介绍考察以下例子：假设在一个罐中放着许多白球和黑球，并假定已经知道两种球的数目之比是 1:3 ，但不知道哪种颜色的球多。如果用放回抽样方法从罐中取 5 个球，观察结果为：黑、白、黑、黑、黑，估计取到黑球的概率 p.

31, .4 4p p 解：设抽到黑球的概率为则本例中，或

3 31 1 .4 4 4 1024

p 4

当时，出现本次观察结果的概率为

3 3 811 .4 4 4 1024p 4

当时，出现本次观察结果的概率为

3 81 3 31 ˆ .1024 1024 4 4 4

p p p 由于，因此认为比更有可能，于是取为更合理

二最大似然估计法：

49

,X f x 若总体为连续型的，其概率密度为，，为未知参数。

~ ( ; )X p x 一般地，设离散型总体，，未知。

1 1, , , ,n nX X X x x 从总体中取得样本，其观察值为，

1 1

1 1 11

, ,

( ) , , ( ; )... ( ; ) ( ; ).

n n

n

n n n ii

X x X x

L P X x X x p x p x p x

则事件发生的概率为

1ˆ( ( , , )) max ( ).nL x x L

最大似然原理：似然

函数1

1

ˆ , ,ˆ , ,n

n

x x

X X

称（）为的，

相应统计量（）为最

最大似然估

大似然

计

的

值

估计量。

1 2 1 2

1

, , , , , ,

,

n nn

ii

X X X x x x

L f x

则对于样本的观察值，

似然函数。

50

1 2 1. , , , k 未知参数可能不是一个，一般设为说明；

2.

ˆ0, 1,2,..., . 1, 2,..., .ii

L lnL

lnL

lnLi k i k

在求的最大值时，通常转换为求：的最大值，

称为对数似然函数.

利用解得，

3. i

i

L

若关于某个是单调增减函数，

此时的最大似然估计在其边界取得；

ˆ ˆ4. g g 若是的最大似然估计，则的最大似然估计为。

51

3 2 例：求矩估计部分的例中的最大似然估计量。

2

2

1

ˆ n

ii

n

lnX

的最大似然估计量为：

2

1

11

1 1

,

n

n

ii

n n

i ii i

L f x

x x

解：似然函数

1

1 ln2

n

ii

nlnL ln x

1

1 1 ln 0 2 2

n

ii

dlnL n xd

令

1ln

n

ii

n x 即：

1 0 1

0

X

x xf x

即，总体的密度为：

其他

52

1

1 4 ,

0

0, , , , ,

,

x

n

e xX f x

X X X

例：设总体的概率密度为：其它

其中是未知常量为的样本，

求的矩估计与最大似然估计。

1 解：矩估计 E X xf x dx

2

1

1 ( )n

ii

E X X

D X X Xn

令

2( )D X E X

2

1

2

1

1ˆ ( )

1ˆ ( )

n

ii

n

ii

X Xn

X X Xn

1 xx e dx

2 1( ) xx e dx

2 2

01( )

t xtt e dt

53

2 最大似然估计

1

1, in

x

iL e

此处不能通过求偏导数获得的最大似然估计量，

1

11,

n

ii

nx

nL e L

另一方面，是的增函数，取到最大值时，达到最大。

1 2, , , ,i nx x min x x x 故的取值范围最大不超过

1

11 , 1, 2,..., .

n

ii

x

in e x i n

12

1

1 0n

ii

dlnL n X Xd

令

1 21 , , , ,nX min X X X

故

1ˆ X X

1

1 ˆn

ii

lnL nln X

又

54

1 2

5 0, 0

, , , n

X

x x x

例：设总体服从上的均匀分布，未知，

试由样本求出的最大似然估计和矩估计。

1 解：最大似然估计

1 0;

0

xX f x

因的概率密度为：其它

1 21 0 , , ,

0

nn x x xL

故参数的似然函数为：

其它 ˆ0, L

dln nd

由于不能用微分法求

ˆ :L从义发以下定出求

1 20 , , , ,i nnx x max x x x 因为故的取值范围最小为

1

L̂n nnL x L x L

又对的是减函数，越小，越大，故时，最大；

0

12

E X xdx X

由

2 矩估计 1 2

ˆ , , ,L nnX max X X X 所以的最大似然估计量为

ˆ 2X

55

2, 0 ,32

X

1 2 3例6：设总体的概率分布律为：其中 ,未知2 1- 3

现得到样本观测值2，3，2，1，3，求的矩估计与最大似然估计。

1 解：矩估计

k kE X x p

( )E X X令

3 5 2 2 2 3 (1 3 2)

2.2X ˆ 0.32

2 最大似然估计

( ) ( 2)(1 3 2)( 2) (1 3 2)L 3 21

16 (2 3 ) ln ( ) ln16 3ln 2ln(2 3 )L

ln ( ) 3 6 02 3

d Ld

ˆ 0.4

56

表 1 例 2 ，例 4 ，例 5 中两种估计方法所得结果例题矩估计量最大似然估计量

例 2

例 4

例 5

2

1

2

1

1ˆ ( )

1ˆ ( )

n

ii

n

ii

X Xn

X X Xn

ˆ 2X ˆ

nX

1

1

ˆ

ˆ

X X

X

2

2

1

L̂ n

ii

n

lnX

2ˆ

1XX

57

§2 估计量的评选标准从表 1 看到，对总体的未知参数可用不同方法求得不同的估计量，如何评价好坏？通常用三条标准检验：无偏性，有效性，相合性

无偏性

ˆ ˆ,

ˆ,n

E

li

E

m E

若那么称为估计量的

若则

偏差

渐近称是的无偏估计量

1 2ˆ , , , ˆ ,,

ˆnX X EX

定义：若参数的估计量满足

则称是的一个无偏估计量。

58

2

2 2

6

, ,

X

E X D X

X S

例：设总体的一阶和二阶矩存在，分布是任意的，

记

证明：样本均值和样本方差分别是和的无偏估计。

1 2, , , nX X X X证：因与同分布，故有：

X 故是的无偏估计.

1

1 n

ii

E X E Xn

2 2

1

1 ( )1

n

ii

S X Xn

2 2

1

1 ( )1

n

ii

E S E X Xn

22

1

1 ( )1

n

ii

E X n Xn

2 2 211 nn

2 2S 故是的无偏估计.

1

1 n

iiE Xn

1 nn

2

1

1 ( )1

n

ii

E X Xn

1

11

n

iiD X nD Xn

59

ˆ ˆ7 5 2 L nX X 例：检验例的矩估计量与最大似然估计量的无偏性。

0, , ,2X U E X 解： 1, , nX X X由于与同分布

ˆ 2E E X 1

2 n

iiE Xn

22nn

ˆ 2X 因此是的无偏估计

L̂ n nX X 为考察的无偏性，先求的分布，

5由第三章第节知：

,

n

n

XF x F x

1 0

0 n

n

nX

nx xf x

于是其它

1

0

n

nx nx dx

L̂ nE E X 因此有： 1

nn

L̂ nX 所以是有偏的。

60

纠偏方法

1

ˆ , , , 0

1 ˆ

17 ,

ˆ , ,ˆ

n nn

n

E a b a b a

ba

nX X Xn

X X

如果其中是常数，且

则是的无偏估计。

在例中，取则是的无偏估计

无偏性是对估计量的一个最常见的重要要求，“ ”是好估计的标准之一。

无偏性的统计意义是指在大量重复试验下，由所作的估计值的平均恰是，

从而无偏性保证了没有系统误差。

61

有效性

1 2

1 2

1 2

ˆ ˆ,

,

ˆ ˆ

ˆ ˆD D

定义：设是的两个估计，

如果对一切成立，

且不等号至少对某一成立，则比。称有效

无偏

62

2 2

142 12 3D D X n n 解：

1 0

0

n

n

nX

nx xf x

由其它

22

22 2

1n n

nD E X E X

n

于是

2 2

1 2 2 1 3 2D Dn n n

因为比更有效

12 2

0 2

n

n nnx nE X dx n

2

2n n

1

1 2

1 2

8 ~ 0, , , ,

1ˆ ˆ2 , 7

ˆ ˆ 2

n

n

X U X X X

nX Xn

n

例：设总体是取自的样本，已知的

两个无偏估计为见例，

判别与哪个有效时？

63

相合性

1, ,

0, 0

n

n

nn

n

lim P

X Xn

定义：设为参数的估计量，若对于任意，当时，依概率收敛于，

即有：成立，

则称为相合估计量或的一致估计量

64

1

1

1

2 2 22

1

9 ( ) ( 2) , , ,

(1) ( )

12 , 2,..., , 2,...,

13 ( ) , ( )

kk n

nl

l i li

n

ii

X k E X k X X X

X E X

A X l k l kn

B X X S D Xn

S

例：设总体的阶矩存在是取自的样本，

证明：是的相合估计；

（）是的相合估计；

（）是的相合估计；

(4) 是的相合估计。

1

1 ( ), 1, 2,..., .

(1) 2

nl li l

iX E X l k

n

证明：由辛钦大数定律知，依概率收敛到

因此，（）成立。

1 1

1 1 1

,..., ,...,( ,..., ) ( ,..., ) ( ,..., )

k k

k k k

A Ag g A A g

根据依概率收敛的性质，由是的相合估计，

若是连续函数，则是的相合估计。

2 2 2 2 22 1 2 2

1

2 2 2 22

1( ) ( )

1

n

ii

D X B X X A XnnS B S S Sn

因为，所以是的相合估计，

注意到，因此也是的相合估计；是的相合估计。

65

1 2ˆ ˆ ,E E 证：

1

1 2

10 0, , , ,

1ˆ ˆ 2

n

n

X U X X X

nX Xn

例：设总体是取自的样本，

证明：和是的相合估计。

0, n 由契比雪夫不等式，当时，

1

1 2

ˆˆ

DP

有：

2

2 03n

1 2ˆ ˆ 所以和都是的相合估计。

2

1̂ ,3

Dn

2

2̂ 2D

n n

2

2 2

ˆˆ

DP

同理：

2

2 02n n

66

§3 区间估计

1

1 1 2 21 1

1 2

ˆ

, ,

, , , , ,

,

n

n n

X X X

X X X X

引言：点估计是由样本求出未知参数的一个估计值，

而区间估计则要由样本给出参数的一个估计范围，并指出

该区间包含的可靠程度。假设是总体的一个样本，

区间估计的方法是给出两个统计量

使区间以一定的可靠程度盖住。

67

置信区间置信度

1

;

, , 0 1 ,n

X F x

X X X

定义：设总体的分布函数含有一个未知参数，

是总体的一个样本，对给定的值

1 1 2 21 1

1 21 1

, , , , ,

, , , , 1 7 1

n n

n n

X X X X

P X X X X

如果有两个统计量，使得：

1 2

1 2

, 1

则称随机区间是的双侧置信区间；称为置信度；

和分别称为双侧置信下限和双侧置信上限。

68

置信区间的含义：

),

, , ,

n

若反复抽样多次(各次得到的样本容量相等，都为每个

样本值确定一个区间每个这样的区间或者包含的真值

或者不包含的真值。见下图

100(1 )%.0.05, 95%

0.01, 99%

按伯努里大数定律，在这些区间中，包含真值的约占如反复抽样10000次，当即置信水平为时, 10000个区间中不包含的真值的约为500个；当即置信水平为时,10000个区间中不包含的真值的约为100个。

69

单侧置信限

1 1

1 1

1

7 1

, , 1 , 7 2

, ,

, 1

n

n

P X X

X X

在以上定义中，若将式改为：

则称为的单侧置信下限。

随机区间是的置信度为的单侧置信区间。

2 1

2 1

2

7 2

, , 1 , 7 3

, ,

, 1

n

n

P X X

X X

又若将式改为：

则称为的单侧置信上限。

随机区间是的置信度为的单侧置信区间。

70

求未知参数的置信区间（置信限）方法：

1ˆ1. , , nX X 根据样本，得到的估计

（如最大似然估计，无偏估计，矩估计等）；ˆ2. ( ; ),

ˆ( ; )

W

W

构造函数它不包含其它未知参数，且分布已知，

分布中的参数均已知（称为枢轴量）；

3. 1 ,

ˆ( ; ) 1

a b

P a W b

对于给定的置信度，定出两个常数，使得

；

1 21 1

1 2

ˆ4. ( ; )

, , , ,

, 1

n n

a W b

X X X X

若能从得到等价的不等式

那么就是的置信度为的置信区间。

ˆ. 3. ( ; ) 1

ˆ ˆ( ; ) 1 ( ; ) 1

P a W b

P a W P W b

若要求单侧置信限，只要将中

改为或

注

即可。

71

正态总体均值方差的区间估计 2 ~ ,X N 一单个正态总体的情形

21 2, , , , , 1nX X X X X S 为来自的样本和分别为样本均值和方差置信度为

1. 均值的置信区间

21 已知时

, ~ 0,1XX Nn

是的无偏估计由

2 1XP zn

有

2 2 1P X z X zn n

即

2 2,X z X zn n

置信区间为：

1-?

思考题：均值的置信度的置信下限是什么呢

: X zn

答案

ba

0.99

0.0050.005 1 2 2

72

22 未知时

~ 1X t nS n

由

2 21 1 1XP t n t nS n

有

2 21 1 1S SP X t n X t nn n

即

2 21 , 1S SX t n X t nn n

置信区间为：

0t

1 2

2

0t 2 1t n 2 1t n

73

22. 方差的置信区间设未知

2

22

1~ 1

n Sn

由

2

2 21 2 22

11 1 1

n SP n n

有

2 22

2 22 1 2

1 11

1 1n S n S

Pn n

即

2 2

2 22 1 2

1 1,

1 1n S n S

n n

置信区间为：

2

2

2

1

2

12

2

1-?

2思考题:

方差的置信度的置信上限是什么

2

21

:

( 1) .( 1)

n Sn

答案

2

12

( 1)n

2

2

( 1)n

74

2

2 2 2

10 , ,

36 , 15 . ,95

1 16; 2 , 16;

X cm N

cm

S

例：设某种植物的高度服从正态分布

随机选取棵其平均高度为就以下两种情形求的％双侧置信区间：

未知

36, 15, 4n X 1解：

1.96 1.96 0.95P X Xn n

由

1.96 41.96 15 13.69336

Xn 得：

1.96 41.96 15 16.30736

Xn

13.693,16.307的置信区间为

75

2 36, 15, 16n X S 2

0.025 0.025(35) (35) 1 0.05S SP X t X tn n

由

0.025 35 2.0301t 查表得：2.0301 4 2.0301 4 15 13.647, 15 16.3536 6

又：

13.647,16.353的置信区间为

99 1 2

求置信度为％时

两种情况下的置信区间

？

1 13.333,16.667

2 13.184,16.815

?答案：

76

1 2 比较两种情形下的置信区间：

2 2, 16, 13.693,16.307 已知置信区间：

2 2, 16, 13.647,16.353S 未知置信区间：

, ,t X S n

2但第二种情形更实用,因为多数时候, 未知

用分布求的置信区间只依赖于样本数据及统计量

区间短

区间长

[说明 ] 置信区间包含两方面含义 1.置信水平 2.区间长度置信水平越高，区间越大，但区间精确度差置信区间越小，精确度高，但置信水平低

77

2 2

11 ,,

, 25 ,

4.25. 95 99S

例：一个园艺科学家正在培养一个新品种的苹果这种苹果除了口感好和颜色鲜艳以外另一个重要特征是单个重量差异不大。为了

评估新苹果她随机挑选了个测试重量单位：克其样本方

差为试求的置信度为％和的％的置信区间。

95%解：置信度为时

2 22

2 20.025 1 0.025

1 11 0.05

n S n SP

2 20.025 0.97524 39.4, 24 12.4; 查表得：

25 1 4.25 25 1 4.25 2.59, 8.2339.4 12.4

又：

2.59,8.23 2的置信区间为

20.005

20.995

99% ,

24 45.6,

24 9.89,

25 1 4.252.24,45.6

25 1 4.2510.319.89

置信度为时

2.24,10.31 2的置信区间为

78

2 21 1 2 2 , , ,N N 二两个正态总体的情形

1 2

1 2

2

2 21 2 1 1 1 2 2 2

2 21

1 21 1

, , , , , , , , , ,

1 1, , , , 1 .

n n

n n

i ji j

X X X N Y Y Y N

X X Y Y S Sn n

来自来自

和分别为第一二个总体的样本方差置信度为

1 21. 的置信区间

2 21 21 , 已知时

2 21 2

1 21 2

~ ,X Y N n n

由

1 2

2 21 2

1 2

~ 0,1X Y

N

n n

有

2 21 2

2 1 2X Y z n n

置信区间为：

79

2 2 2 21 22 , 未知

1 21 2

1 2

6.6, ~ 21 1

w

X Yt n n

S n n

此时由第六章定理

2 21 1 2 22 2

1 2

1 1 ,2w w w

n S n SS S Sn n

其中

1 22 1 2

1 12 wX Y t n n S n n

置信区间为：

80

2122

2. 的置信区间

1 2, 设未知

2 2

1 21 22 2

1 2

~ 1, 1S S F n n

由

2 2

1 21 2 1 22 21

2 21 2

1, 1 1, 1 1S SP F n n F n n

有

2 2

1 12 2

1 2 1 22 2 12 2

1 1,1, 1 1, 1

S SF n n F n nS S

置信区间为：

2 2 2

1 1 12 2 2

1 2 1 22 2 2 12 2

1 1 11, 1 1, 1

S SPF n n F n nS S

即

81

例 12 ：两台机床生产同一个型号的滚珠，从甲机床生产的滚珠中抽取 8 个，从乙机床生产的滚珠中抽取 9 个，测得这些滚珠得直径 (毫米 ) 如下 :甲机床 15.0 14.8 15.2 15.4 14.9 15.1 15.2 14.8乙机床 15.2 15.0 14.8 15.1 14.6 14.8 15.1 14.5 15.0

2 21 1 2 2

1 2 1 2

1 2 1 2

21

1 2 22

, , , , ,

1 0.18, 0.24, 0.90

2 0.90

3 , 0.90

X Y X N Y N

设两机床生产的滚珠直径分别为且

求的置信度为的置信区间；

若未知，求的置信度为的置信区间；

若未知，求的置信度为的置信区间.

82

2 21 1 2 2 8, 15.05, 0.0457 9, 14.9, 0.0575n x S n y S 解：；

1 2 1 22 0.90 当未知时，的置信度为的置信区间为：

1 2 1 21 0.18, 0.24 , 0.90 当时求的置信度为的

置信区间为：2 21 2

21 2

X Y z n n

0.05 1.645, 0.018,0.318z 查表得：从而所求区间为

0.051 2

1 115 1.7531, 0.228, 0.486wt S n n

2 1 21 2


0.044,0.344从而所求区间为

1 2

0 当－的置信区间包

含时，可以认为两个总体的均值之间没有显著差异。

83

21

1 2 22

3 , 0.90

当未知时，的置信度为的置信区间为：

2 2

1 12 2

2 1 2 1 2 1 22 2

1 1,1, 1 1, 1

S SF n n F n nS S

0.05 0.950.05

1 17,8 3.50, 7,8 0.2683.738,7F F

F 由

2122

0.90 0.227,2.965

得的置信度为的置信区间为

2122

当的置信区间包含1时，

可以认为两个总体的方差之间没有显著差异。

待估待估参数参数其他其他

参数参数W W 的分布的分布置信区间置信区间单侧置信限单侧置信限

一个正态总体

一个正态总体

两个正态总体

两个正态总体

2

1 2

2122

2 已知

2 21 2, 已知

2 21 2

2

未知

1 2, 未知

2X zn

2 1SX t nn

2 2

2 22 1 2

1 1,

1 1n S n S

n n

1 2

2 未知

未知

2 21 2

21 2

X Y z n n

212

2 1 22

212

1 2 1 22

1 ,1, 1

11, 1

SF n nS

SF n nS

2 1 21 2


~ 0,1XZ Nn

~ 1Xt t nS n

2

2 22

1~ 1

n Sn

1 2

2 21 2

1 2

~ 0,1X Y

Z N

n n

2 2

1 21 22 2

1 2

~ 1, 1S SF F n n

1 21 2

1 2

~ 21 1

w

X Yt t n n

S n n

X zn

X zn

1

1

SX t nnSX t nn

22

21

22

2

11

11

n Sn

n Sn

2 21 2

1 21 2

2 21 2

1 21 2

X Y z n n

X Y z n n

2 21 12 2

1 1 22 22 21 12 2

1 22 2

11, 1

11, 1

SF n nS

SF n nS

1 2 1 21 2

1 2 1 21 2

1 12

1 12

w

w

X Y t n n Sn n

X Y t n n S n n

正态总体均值、方差的置信区间与单侧置信限 1 置信度

复习思考题 71.总体未知参数矩估计的思想方法是什么？试写出 0-1 分布、二项分布 b(m,p) 、泊松分布∏ (λ) 、均匀分布 U(a,b) 、正态分布

N(μ,σ2)中有关参数的矩估计式2. 极大似然估计的主要步骤是什么？3.未知参数的估计量与估计值有什么区别？

5. 估计量的三个基本评价标准是什么？你能理解它们的含义吗？6. 求参数置信区间的一般方法是什么？对正态总体，试从有关的统计量自行导出几类参数的置信区间？7.置信度的含义是什么？置信度、区间长度和样本容量的关系怎样？

1

2 2

12

1, ,

1 ( ) ,1

( ),

4.

,

n

ii

n

ii

X n X Xn

S X Xn

E X E X E S D X

总体有容量为的样本样本均值

样本方差有性质这是否只对正态总体成立？

23/4/24

课件待续 !

概 率 论 ( 续）

Documents

概率论 ( 续）