第三章多维随机变量及其分布math.sjtu.edu.cn/upload/teachers/10034/ch3-1.pdf · 案例...

第三章多维随机变量及其分布

3.1 二维随机变量及其分布

案例某高校教学研究中心关注大学一年级学生“高等数学”

与“概率统计”这两科成绩的分布情况. 比如，研究中心想了解：

两科都不及格的学生概率是多少？两科都不超过80分的概率是多

少，两科都大于90分的概率是多少；再比如，仅仅关注“高等数

学”不及格的学生概率是多少；仅仅关注“概率统计”不及格的

学生概率是多少；这两科的成绩有没有关系等等.

分析：由于学生人数比较多，该研究往往通过随机抽查完成，下面是研究中心随机抽查的100个学生成绩分布散点图.

= ( , ); , 0,1, 2, ,100x y x y x yΩ = 高等数学成绩，概率统计成绩，

定义设𝑬𝑬是一个随机试验，𝛀𝛀是其样本空间，如果对𝛀𝛀中的任意一个样本点𝝎𝝎，按照一定的对应法则存在一对实数(𝑿𝑿 𝝎𝝎 ,𝒀𝒀(𝝎𝝎))与之对应，简记为𝑿𝑿,𝒀𝒀，称(𝑿𝑿,𝒀𝒀)为二维随机变量.

定义设(𝑿𝑿,𝒀𝒀)为二维随机变量，对于任意实数(𝒙𝒙,𝒚𝒚) ，称定义在实平面上的二元函数

𝑭𝑭 𝒙𝒙,𝒚𝒚 = 𝑷𝑷 𝑿𝑿 ≤ 𝒙𝒙 ∩ 𝒀𝒀 ≤ 𝒚𝒚 = 𝑷𝑷(𝑿𝑿 ≤ 𝒙𝒙,𝒀𝒀 ≤ 𝒚𝒚)

为二维随机变量(𝑿𝑿,𝒀𝒀)的联合分布函数，也简称之为联合分布或分布函数.

案例解：引入二维随机变量后，两科成绩都不及格的概率可以表示为𝑃𝑃(𝑋𝑋 ≤ 59,𝑌𝑌 ≤ 59)，两科都不超过80分的概率可以表示为𝑃𝑃 𝑋𝑋 ≤ 80,𝑌𝑌 ≤ 80 . 如图

分布函数的几何意义

如果用平面上的点 (x, y) 表示二维随机变量

(X , Y )的一组可能的取值，则 F (x, y) 表示(X , Y ) 的取值落入图所示角形区域的概率.

(x, y)

x

y

( , )−∞ −∞

F (x, y)的性质

（2）分别关于x或y单调不减

（3）分别关于x 或y右连续

（1） 0 ( , ) 1F x y≤ ≤

( , ) 0, ( , ) 0, ( , ) 0, ( , ) 1F y F x F F−∞ = −∞ = −∞ −∞ = +∞ +∞ =

（4）对 ,有1 2 1 2,x x y y∀ < <

2 2 1 2 1 1 2 1( , ) ( , ) ( , ) ( , ) 0F x y F x y F x y F x y− + − ≥(区域演示图见下页)

X

Y

x1

y1 (x1,y1)

x2

y2 (x2,y2)(x1,y2)

(x2,y1)

2 2 1 2 1 1 2 1(5) ( , ) ( , ) ( , ) ( , )F x y F x y F x y F x y− + −

0),( 2121 ≥≤<≤<= yYyxXxP

例 0, 1( , )

1, 1x y

F x yx y+ <

= + ≥设

讨论F (x, y)能否成为二维随机变量的分布函数？

解

x

y

• •

••

(0,0) (2,0)

(2,2)(0,2)(2,2) (0,2) (2,0) (0,0)F F F F− − +

1 1 1 01

= − − += −

故 F (x, y)不能作为二维随机变量的分布函数

注：满足上述性质的函数可作为二维随机变量的分布函数

继续案例其中关注“概率统计”

不及格的学生概率，事实上就是𝑷𝑷(𝒀𝒀 ≤ 𝟓𝟓𝟓𝟓)，如图

继续案例其中关注“高等数学”

不及格的学生概率，事实上就是𝑷𝑷(𝑿𝑿 ≤ 𝟓𝟓𝟓𝟓)，如图

二维随机变量的边缘分布

( )xXPxFX ≤=)(( )+∞<≤= YxXP ,

),( +∞= xF

( )yYPyFY ≤=)(( )yYXP ≤+∞<= ,

),( yF +∞=

x

y

x

x

yy

由联合分布函数边缘分布函数, 逆不真.

例设随机变量(X ,Y )的联合分布函数为

+∞<<−∞+∞<<∞−

+

+=

yx

yCxBAyxF

,2

arctan2

arctan),(

其中A , B , C 为常数.(1) 确定A , B , C ；

(2) 求X 和Y 的边缘分布函数；

(3) 求P (X > 2)

解 (1) 122

),( =

+

+=+∞+∞

ππ CBAF

022

),( =

+

−=+∞−∞

ππ CBAF

022

),( =

−

+=−∞+∞

ππ CBAF

21,

2,

2 πππ === ACB

(2) ),()( +∞= xFxFX

.,2

arctan121

+∞<<∞−+= xxπ

),()( yFyFY +∞=

.,2

arctan121

+∞<<∞−+= yyπ

(3) )2(1)2( ≤−=> XPXP

+−=

22arctan1

211

π.4/1=

可以将二维随机变量及其边缘分布函数的概念推广到 n 维随机变量及其联合分布函数与边缘分布函数

引例某大型超市搞促销活动，消费超过1000元有机会抽奖两次.

超市设置了两种抽奖方式：两种都是从装有10只红球，90只白球

的箱子中摸1只球，其中一种采用有放回的摸球、另一种采取无放

回的摸球，每次一球.奖励标准：摸到红球可以获得大礼包价值

200元，摸到白球无任何奖励.假设你是第一个消费超过1000元的

顾客，你希望比较两种抽奖方式吗？如何有效的把两种抽奖方式

的各种获奖、无获奖的情形表示出来？进一步，你是否希望表示

各种情形的概率？

二维离散型随机变量

200,0,

X

=

第一次摸到红球,

第一次摸到白球.

200,0,

Y

=

第二次摸到红球,

第二次摸到白球.

分析：我们可以按照获得奖励的价值建立对应关系：

(𝑋𝑋,𝑌𝑌)所有可能取值为有限对，类似这种情形我们称为

离散型二维随机变量.

定义：若(𝑿𝑿,𝒀𝒀)只取有限对或可列对实数值 𝒙𝒙𝒊𝒊,𝒚𝒚𝒋𝒋 , 𝒊𝒊, 𝒋𝒋 = 𝟏𝟏,𝟐𝟐,⋯ 则称其为二维离散型随机变量.

定义：二维随机变量(𝑿𝑿,𝒀𝒀)的联合分布律为

𝑷𝑷 𝑿𝑿 = 𝒙𝒙𝒊𝒊,𝒀𝒀 = 𝒚𝒚𝒋𝒋 = 𝒑𝒑𝒊𝒊𝒋𝒋

性质：（1）非负性 𝒑𝒑𝒊𝒊𝒋𝒋 ≥ 𝟎𝟎

（2）规范性 ∑𝒊𝒊∑𝒋𝒋 𝒑𝒑𝒊𝒊𝒋𝒋 = 𝟏𝟏

注：二维离散型随机变量分布函数与分布律互为确定，其分布函数可按下式求得：

𝑭𝑭 𝒙𝒙,𝒚𝒚 = 𝒙𝒙𝒊𝒊≤𝒙𝒙

𝒚𝒚𝒋𝒋≤𝒚𝒚

𝒑𝒑𝒊𝒊𝒋𝒋

二维离散随机变量的边缘分布律

,2,1,)(1

==== •

∞+

=∑ ippxXP ij

iji

记作

,2,1,)(1

==== •

∞+

=∑ jppyYP ji

ijj

记作

由联合分布可确定边缘分布,其逆不真.

1

x1 xi

11p

jp1

1ip

ijp

pi• p1• pi•

p• j

p•1

p• j

yj

y1

XY

联合分布列及边缘分布律

引例某大型超市搞促销活动，消费超过1000元有机会抽奖两次.

超市设置了两种抽奖方式：两种都是从装有10只红球，90只白球

的箱子中摸1只球，其中一种采用有放回的摸球、另一种采取无放

回的摸球，每次一球.奖励标准：摸到红球可以获得大礼包价值

200元，摸到白球无任何奖励.假设你是第一个消费超过1000元的

顾客，你希望比较两种抽奖方式吗？如何有效的把两种抽奖方式

的各种获奖、无获奖的情形表示出来？进一步，你是否希望表示

各种情形的概率？

引例分析与解

200,0,

X

=

第一次摸到红球,

第一次摸到白球.

200,0,

Y

=

第二次摸到红球,

第二次摸到白球.

“有放回摸球”、“无放回摸球”两种抽奖方式对应（X，Y）的联合分布律与边缘分布律分别如下

ijp X

j iji

p p⋅ = ∑ 0 200

Y 0 81

100 9100 9

10

200 9100 1

100 110

i ijj

p p⋅ = ∑ 910 1

10 1

ijp X

j iji

p p⋅ = ∑ 0 200

Y 0 89

110 111 9

10

200 111 1

110 110

i ijj

p p⋅ = ∑ 910 1

10 1

有放回

不放回

例已知随机变量X与Y的分布列分别为

0 1 1 0 1,

0.5 0.5 0.25 0.5 0.25−

且P(XY=0)=1，试求二维随机变量(X，Y)的联合分布列.

解因为 P (XY = 0) = 1,所以 P( XY ≠0) = 0

由此知: P (X= -1,Y=1) = P (X=1,Y=1) = 0

故有分布律

XY -1 0 1

p11 p21 p310 p22 0

01pi• 0.25 0.5 0.25

p•j

0.50.5

据联合分布律与边缘分布的关系可得到(X,Y)联合分布为

XY -1 0 1

12

0.25 0 0.250 0.5 0

定义对于二维随机变量(𝑿𝑿,𝒀𝒀)的分布函数𝑭𝑭(𝒙𝒙,𝒚𝒚) ，如果存在一个

二元非负可积函数𝒇𝒇(𝒙𝒙,𝒚𝒚) ，使得对于任意一对实数 𝒙𝒙,𝒚𝒚 有

𝑭𝑭 𝒙𝒙,𝒚𝒚 = −∞

𝒙𝒙−∞

𝒚𝒚𝒇𝒇(𝒖𝒖,𝒗𝒗)𝒅𝒅𝒗𝒗𝒅𝒅𝒖𝒖

成立，则称(𝑿𝑿,𝒀𝒀)为二维连续型随机变量，并称𝒇𝒇(𝒙𝒙,𝒚𝒚)为二维连续

型随机变量的联合概率密度函数，简称联合概率密度或联合密度.

性质：（1）非负性 𝒇𝒇 𝒙𝒙,𝒚𝒚 ≥ 𝟎𝟎

（2）规范性 ∫−∞+∞∫−∞

+∞𝒇𝒇 𝒙𝒙,𝒚𝒚 𝒅𝒅𝒙𝒙𝒅𝒅𝒚𝒚 = 𝟏𝟏

（3）设(𝑿𝑿,𝒀𝒀)为二维连续型随机变量，则对平面上任一区域𝑫𝑫有

𝑷𝑷 𝑿𝑿,𝒀𝒀 ∈ 𝑫𝑫 = 𝑫𝑫

𝒇𝒇 𝒙𝒙,𝒚𝒚 𝒅𝒅𝒙𝒙𝒅𝒅𝒚𝒚

（4）在(𝒙𝒙,𝒚𝒚)的连续点处有

𝝏𝝏𝟐𝟐𝑭𝑭(𝒙𝒙,𝒚𝒚)𝝏𝝏𝒙𝒙𝝏𝝏𝒚𝒚

= 𝒇𝒇(𝒙𝒙,𝒚𝒚)

注：设(𝑿𝑿,𝒀𝒀)为二维连续型随机变量，对平面上任一条简单曲线𝑳𝑳有

𝑷𝑷 𝑿𝑿,𝒀𝒀 ∈ 𝑳𝑳 = 𝟎𝟎

∫ ∫∞−∞+

∞−=

x

X dvduvufxF ),()(边缘分布函数与边缘密度函数

∫ ∫∞−∞+

∞−=

y

Y dudvvufyF ),()(∫

∞+

∞−= dvvxfxf X ),()(

∫∞+

∞−= duyufyfY ),()(

已知联合分布可以求得边缘分布；反之则不能唯一确定.

例设 r.v.( X ,Y ) 的联合 d.f. 为

≤≤≤≤

=其他,0

,10,0,),(

yyxkxyyxf

其中k 为常数. 求(1)常数 k ;(2) P ( X + Y ≥ 1) , P ( X < 0.5);(3)边缘 d.f. 与边缘分布函数；(4)联合分布函数 F (x,y)

y = x1

0x

y

10,0),( ≤≤≤≤= yyxyxD解令

D

(1) 1),( =∫ ∫∞+

∞−

∞+

∞−dxdyyxf

1),( =∫∫D

dxdyyxf

∫

∫ ∫

==1

0

2

1

0 0

82kdyyyk

kxydxdyy

8=k

y = x1

0x

y(2) )1( ≥+YXP

0.5

y = x1

0x

y

∫ ∫ −=1

5.0 18

y

yxydxdy

.6/5=

y = x1

0x

y

0.5

)5.0( <XP

∫ ∫=5.0

0

18

xxydydx

.16/7=

由联合密度求出边缘密度再积分求边缘分布函数.

∫∞+

∞−= dvvxfxf X ),()(

<≤= ∫

其他,010,8

1xxvdv

x

v=u1

0u

v

1

<≤−

=其他,0

10,44 3 xxx

(3)

<≤−

=其他,0

10,44)(

3 xxxxf X

<≤

=其他,0

10,4)(

3 yyyfY

( )XF x =0, x < 0，2x2–x4 , 0 ≤ x < 1,

1, x ≥ 1

( )YF y0, y < 0

y4 , 0 ≤ y < 1,1 , y ≥ 1

=

的分段区域

0<x

( , )F x y

0<y

y = x1

0 x

y

D

10 <≤ x

0 y x≤ <

1x y≤ <

1y ≥

1≥x

0 1y≤ <

1y ≥

当0≤ x< 1, 0≤ y< x 时，

1

(4) ( ) ∫ ∫∞− ∞−=≤≤=

x ydvduvufyYxXPyxF ),(,),(

当x<0 或 y<0 时,F(x,y) = 0

4

0 08 yuvdudv

y v== ∫ ∫

当0≤ x<1, x≤ y<1时，

4220

28),( xyxuvdvduyxFx y

u−== ∫ ∫

v=u1

0u

v

),( yxF

当0 ≤ x <1, y ≥ 1时，

∫ ∫=x

uuvdvduyxF

0

18),(

v=u1

0u

v

1422 xx −=

当x ≥ 1, 0 ≤ y < 1时，

v=u1

0u

v

1当 x ≥ 1, y ≥ 1 时，

1),( =yxF

4y=∫ ∫=

y vuvdudv

0 08),( yxF

F (x,y) =

0, x < 0 或 y < 0

y4 , 0 ≤ x <1, 0 ≤ y < x ，

2x2y2–x4, 0 ≤ x <1, x ≤ y <1，

2x2–x4 , 0 ≤ x <1, y ≥ 1，

y4 , x ≥ 1, 0 ≤ y < 1，

1, x ≥ 1, y ≥ 1，

设D是平面上的有界区域，其面积为A.若二维随机变量（ X,Y）具有概率密度

1 , ( , )( , )

0,

x y Df x y A

∈= 其它

则称（X,Y）在D上服从均匀分布.

常见的二维分布：

若( X ,Y )服从区域D上的均匀分布, 则

∀ D1 ⊆ D, 设D1的面积为A1,

( ) 11( , ) AP X Y D

A∈ =

边平行于坐标轴的矩形域上的均匀分布的

边缘分布仍为均匀分布

向平面上有界区域D上任投一质点，若质点落在D内任一小区域D1的概率与小区域的面积成正比，而与D1的位置无关. 则质点的坐标（X,Y）在D上服从均匀分布.

21y x= − −

例设随机向量(X,Y)服从区域D上的均匀分布,

其中 D=(x,y) | x2+y2≤1,求X,Y的边缘密度函数.

解 (1)由题意得:

2 21 1( , )

0

x yf x y π

+ ≤= 其它

( ) ( , )Xf x f x y dy+∞

−∞= ∫

X

Y

-1 1

21y x= −

当 |x|>1 时, f(x,y)=0,

所以, fX(x)=0

当|x|≤1时,

2 2

2 2

1 1

1 1( ) [ ] ( , )

x x

X x xf x f x y dy

− − − +∞

−∞ − − −= + +∫ ∫ ∫

2

2

1

1

1x

xdy

π−

− −= ∫ 22 1 x

π= −

所以,22 1 | | 1

( )0 | | 1

X

x xf x

xπ − ≤= >

22 1 | | 1( )

0 | | 1Y

y yf y

yπ − ≤= >

同理,

例设(X ,Y ) ~ D 上的均匀分布,

( , ) 0 ,0 1D x y y x x= ≤ ≤ ≤ ≤

(1) f ( x, y );

(2) P ( Y > X 2 );

(3) ( X ,Y ) 在平面上的落点到 y 轴距离小

于0.3的概率.

求

解 (1)

y=x1

0x

y

1

≤≤≤≤

=其他,0

10,0,2),(

xxyyxf

D

(2) y = x2

∫ ∫=1

0 22

x

xdydx

.3/1=

)( 2XYP >

(3) )3.03.0()3.0|(| <<−=< XPXP

09.0)3.0(212 2 =⋅⋅=

y = x1

0 x

y

10.3

若二维随机变量（X,Y）具有概率密度

2122

11 2

1 1( , ) exp [( )2(1 )2 1

xf x y µρ σπσ σ ρ

−= − −−

21 2 2

1 2 2

2 ( )( ) ( ) ]x y yµ µ µρσ σ σ

− − −− +

记作（ X,Y）～N( )2 21 1 2 2, ; , ;µ σ µ σ ρ

则称（ X,Y）服从参数为𝝁𝝁𝟏𝟏,𝝈𝝈𝟏𝟏𝟐𝟐,𝝁𝝁𝟐𝟐,𝝈𝝈𝟐𝟐𝟐𝟐,𝝆𝝆的二维正态分布.

其中均为常数,且 ,0,0 21 >> σσ 1|| <ρρσσµµ ,,,, 2121

正态分布的边缘分布仍为正态分布

+∞<<−∞=−

−

xexfx

X ,21)(

21

21

2)(

1

σµ

σπ

+∞<<−∞=−

−

yeyfy

Y ,21)(

22

22

2)(

2

σµ

σπ

则X,Y的边缘概率密度分别为

X~N(μ1,σ12), Y~ N(μ2,σ2

2)

可以证明若

即二维正态分布(X,Y)的边缘概率分布是一维正态分布，

反之未必成立．

注：这是二维正态分布(X,Y)的特征，

其他分布未必成立．

𝑿𝑿,𝒀𝒀 ~𝑵𝑵(𝝁𝝁𝟏𝟏,𝝈𝝈𝟏𝟏𝟐𝟐;𝝁𝝁𝟐𝟐,𝝈𝝈𝟐𝟐𝟐𝟐;𝝆𝝆)

例设二维随机向量(X,Y)的联合概率密度为2 2

21( , ) (1 sin sin ) ( , )2

x y

f x y e x y x yπ

+−

= + −∞ < < +∞

求(X,Y)关于X,Y的边缘概率密度.

解2 2

21( ) ( , ) (1 sin sin )2

x y

Xf x f x y dy e x y dyπ

++∞ +∞ −

−∞ −∞= = +∫ ∫

2 2 2 2

2 21 (sin sin )2

x y x y

e dy e x y dyπ

+ ++∞ +∞− −

−∞ −∞

= +

∫ ∫

2 2 2

2 2 21 sin sin2

x y y

e e dy x e ydyπ

+∞ +∞− − −

−∞ −∞

= +

∫ ∫

∫∞+

∞−

−−= dyee

yx22

22

21

21

ππ2

2

21 x

e−

=π

即 2

2

21)(

x

X exf−

=π

同理可得 2

2

21)(

y

Y eyf−

=π

X,Y的边缘概率密度为一维正态分布.

边缘概率密度为一维正态分布的二维随机向量不一定

是二维正态分布.

第三章多维随机变量及其分布math.sjtu.edu.cn/upload/teachers/10034/ch3-1.pdf · 案例...

Documents