第三章多维随机变量及其分布math.sjtu.edu.cn/upload/teachers/10034/ch3-1.pdf · 案例...
TRANSCRIPT
第三章 多维随机变量及其分布
3.1 二维随机变量及其分布
案例 某高校教学研究中心关注大学一年级学生“高等数学”
与“概率统计”这两科成绩的分布情况. 比如,研究中心想了解:
两科都不及格的学生概率是多少?两科都不超过80分的概率是多
少,两科都大于90分的概率是多少;再比如,仅仅关注“高等数
学”不及格的学生概率是多少;仅仅关注“概率统计”不及格的
学生概率是多少;这两科的成绩有没有关系等等.
分析:由于学生人数比较多,该研究往往通过随机抽查完成,下面是研究中心随机抽查的100个学生成绩分布散点图.
= ( , ); , 0,1, 2, ,100x y x y x yΩ = 高等数学成绩 ,概率统计成绩 ,
定义 设𝑬𝑬是一个随机试验,𝛀𝛀是其样本空间,如果对𝛀𝛀中的任意一个样本点𝝎𝝎,按照一定的对应法则存在一对实数(𝑿𝑿 𝝎𝝎 ,𝒀𝒀(𝝎𝝎))与之对应,简记为𝑿𝑿,𝒀𝒀,称(𝑿𝑿,𝒀𝒀)为二维随机变量.
定义 设(𝑿𝑿,𝒀𝒀)为二维随机变量,对于任意实数(𝒙𝒙,𝒚𝒚) ,称定义在实平面上的二元函数
𝑭𝑭 𝒙𝒙,𝒚𝒚 = 𝑷𝑷 𝑿𝑿 ≤ 𝒙𝒙 ∩ 𝒀𝒀 ≤ 𝒚𝒚 = 𝑷𝑷(𝑿𝑿 ≤ 𝒙𝒙,𝒀𝒀 ≤ 𝒚𝒚)
为二维随机变量(𝑿𝑿,𝒀𝒀)的联合分布函数,也简称之为联合分布或分布函数.
案例解:引入二维随机变量后,两科成绩都不及格的概率可以表示为𝑃𝑃(𝑋𝑋 ≤ 59,𝑌𝑌 ≤ 59),两科都不超过80分的概率可以表示为𝑃𝑃 𝑋𝑋 ≤ 80,𝑌𝑌 ≤ 80 . 如图
分布函数的几何意义
如果用平面上的点 (x, y) 表示二维随机变量
(X , Y )的一组可能的取值,则 F (x, y) 表示(X , Y ) 的取值落入图所示角形区域的概率.
(x, y)
x
y
( , )−∞ −∞
F (x, y)的性质
(2)分别关于x或y单调不减
(3)分别关于x 或y右连续
(1) 0 ( , ) 1F x y≤ ≤
( , ) 0, ( , ) 0, ( , ) 0, ( , ) 1F y F x F F−∞ = −∞ = −∞ −∞ = +∞ +∞ =
(4)对 ,有1 2 1 2,x x y y∀ < <
2 2 1 2 1 1 2 1( , ) ( , ) ( , ) ( , ) 0F x y F x y F x y F x y− + − ≥(区域演示图见下页)
X
Y
x1
y1 (x1,y1)
x2
y2 (x2,y2)(x1,y2)
(x2,y1)
2 2 1 2 1 1 2 1(5) ( , ) ( , ) ( , ) ( , )F x y F x y F x y F x y− + −
0),( 2121 ≥≤<≤<= yYyxXxP
例 0, 1( , )
1, 1x y
F x yx y+ <
= + ≥设
讨论F (x, y)能否成为二维随机变量的分布函数?
解
x
y
• •
••
(0,0) (2,0)
(2,2)(0,2)(2,2) (0,2) (2,0) (0,0)F F F F− − +
1 1 1 01
= − − += −
故 F (x, y)不能作为二维随机变量的分布函数
注: 满足上述性质的函数可作为二维随机变量的分布函数
继续案例 其中关注“概率统计”
不及格的学生概率,事实上就是𝑷𝑷(𝒀𝒀 ≤ 𝟓𝟓𝟓𝟓),如图
继续案例 其中关注“高等数学”
不及格的学生概率,事实上就是𝑷𝑷(𝑿𝑿 ≤ 𝟓𝟓𝟓𝟓),如图
二维随机变量的边缘分布
( )xXPxFX ≤=)(( )+∞<≤= YxXP ,
),( +∞= xF
( )yYPyFY ≤=)(( )yYXP ≤+∞<= ,
),( yF +∞=
x
y
x
x
yy
由联合分布函数 边缘分布函数, 逆不真.
例设随机变量(X ,Y )的联合分布函数为
+∞<<−∞+∞<<∞−
+
+=
yx
yCxBAyxF
,2
arctan2
arctan),(
其中A , B , C 为常数.(1) 确定A , B , C ;
(2) 求X 和Y 的边缘分布函数;
(3) 求P (X > 2)
解 (1) 122
),( =
+
+=+∞+∞
ππ CBAF
022
),( =
+
−=+∞−∞
ππ CBAF
022
),( =
−
+=−∞+∞
ππ CBAF
21,
2,
2 πππ === ACB
(2) ),()( +∞= xFxFX
.,2
arctan121
+∞<<∞−+= xxπ
),()( yFyFY +∞=
.,2
arctan121
+∞<<∞−+= yyπ
(3) )2(1)2( ≤−=> XPXP
+−=
22arctan1
211
π.4/1=
可以将二维随机变量及其边缘分布函数的概念推广到 n 维随机变量及其联合分布函数与边缘分布函数
引例 某大型超市搞促销活动,消费超过1000元有机会抽奖两次.
超市设置了两种抽奖方式:两种都是从装有10只红球,90只白球
的箱子中摸1只球,其中一种采用有放回的摸球、另一种采取无放
回的摸球,每次一球.奖励标准:摸到红球可以获得大礼包价值
200元,摸到白球无任何奖励.假设你是第一个消费超过1000元的
顾客,你希望比较两种抽奖方式吗?如何有效的把两种抽奖方式
的各种获奖、无获奖的情形表示出来?进一步,你是否希望表示
各种情形的概率?
二维离散型随机变量
200,0,
X
=
第一次摸到红球,
第一次摸到白球.
200,0,
Y
=
第二次摸到红球,
第二次摸到白球.
分析:我们可以按照获得奖励的价值建立对应关系:
(𝑋𝑋,𝑌𝑌)所有可能取值为有限对,类似这种情形我们称为
离散型二维随机变量.
定义:若(𝑿𝑿,𝒀𝒀)只取有限对或可列对实数值 𝒙𝒙𝒊𝒊,𝒚𝒚𝒋𝒋 , 𝒊𝒊, 𝒋𝒋 = 𝟏𝟏,𝟐𝟐,⋯ 则称其为二维离散型随机变量.
定义:二维随机变量(𝑿𝑿,𝒀𝒀)的联合分布律为
𝑷𝑷 𝑿𝑿 = 𝒙𝒙𝒊𝒊,𝒀𝒀 = 𝒚𝒚𝒋𝒋 = 𝒑𝒑𝒊𝒊𝒋𝒋
性质:(1)非负性 𝒑𝒑𝒊𝒊𝒋𝒋 ≥ 𝟎𝟎
(2)规范性 ∑𝒊𝒊∑𝒋𝒋 𝒑𝒑𝒊𝒊𝒋𝒋 = 𝟏𝟏
注:二维离散型随机变量分布函数与分布律互为确定,其分布函数可按下式求得:
𝑭𝑭 𝒙𝒙,𝒚𝒚 = 𝒙𝒙𝒊𝒊≤𝒙𝒙
𝒚𝒚𝒋𝒋≤𝒚𝒚
𝒑𝒑𝒊𝒊𝒋𝒋
二维离散随机变量的边缘分布律
,2,1,)(1
==== •
∞+
=∑ ippxXP ij
iji
记作
,2,1,)(1
==== •
∞+
=∑ jppyYP ji
ijj
记作
由联合分布可确定边缘分布,其逆不真.
1
x1 xi
11p
jp1
1ip
ijp
pi• p1• pi•
p• j
p•1
p• j
yj
y1
XY
联合分布列及边缘分布律
引例 某大型超市搞促销活动,消费超过1000元有机会抽奖两次.
超市设置了两种抽奖方式:两种都是从装有10只红球,90只白球
的箱子中摸1只球,其中一种采用有放回的摸球、另一种采取无放
回的摸球,每次一球.奖励标准:摸到红球可以获得大礼包价值
200元,摸到白球无任何奖励.假设你是第一个消费超过1000元的
顾客,你希望比较两种抽奖方式吗?如何有效的把两种抽奖方式
的各种获奖、无获奖的情形表示出来?进一步,你是否希望表示
各种情形的概率?
引例分析与解
200,0,
X
=
第一次摸到红球,
第一次摸到白球.
200,0,
Y
=
第二次摸到红球,
第二次摸到白球.
“有放回摸球”、“无放回摸球”两种抽奖方式对应(X,Y)的联合分布律与边缘分布律分别如下
ijp X
j iji
p p⋅ = ∑ 0 200
Y 0 81
100 9100 9
10
200 9100 1
100 110
i ijj
p p⋅ = ∑ 910 1
10 1
ijp X
j iji
p p⋅ = ∑ 0 200
Y 0 89
110 111 9
10
200 111 1
110 110
i ijj
p p⋅ = ∑ 910 1
10 1
有放回
不放回
例 已知随机变量X与Y的分布列分别为
0 1 1 0 1,
0.5 0.5 0.25 0.5 0.25−
且P(XY=0)=1,试求二维随机变量(X,Y)的联合分布列.
解 因为 P (XY = 0) = 1,所以 P( XY ≠0) = 0
由此知: P (X= -1,Y=1) = P (X=1,Y=1) = 0
故有分布律
XY -1 0 1
p11 p21 p310 p22 0
01pi• 0.25 0.5 0.25
p•j
0.50.5
据联合分布律与边缘分布的关系可得到(X,Y)联合分布为
XY -1 0 1
12
0.25 0 0.250 0.5 0
定义 对于二维随机变量(𝑿𝑿,𝒀𝒀)的分布函数𝑭𝑭(𝒙𝒙,𝒚𝒚) ,如果存在一个
二元非负可积函数𝒇𝒇(𝒙𝒙,𝒚𝒚) ,使得对于任意一对实数 𝒙𝒙,𝒚𝒚 有
𝑭𝑭 𝒙𝒙,𝒚𝒚 = −∞
𝒙𝒙−∞
𝒚𝒚𝒇𝒇(𝒖𝒖,𝒗𝒗)𝒅𝒅𝒗𝒗𝒅𝒅𝒖𝒖
成立,则称(𝑿𝑿,𝒀𝒀)为二维连续型随机变量,并称𝒇𝒇(𝒙𝒙,𝒚𝒚)为二维连续
型随机变量的联合概率密度函数,简称联合概率密度或联合密度.
性质:(1)非负性 𝒇𝒇 𝒙𝒙,𝒚𝒚 ≥ 𝟎𝟎
(2)规范性 ∫−∞+∞∫−∞
+∞𝒇𝒇 𝒙𝒙,𝒚𝒚 𝒅𝒅𝒙𝒙𝒅𝒅𝒚𝒚 = 𝟏𝟏
(3)设(𝑿𝑿,𝒀𝒀)为二维连续型随机变量,则对平面上任一区域𝑫𝑫有
𝑷𝑷 𝑿𝑿,𝒀𝒀 ∈ 𝑫𝑫 = 𝑫𝑫
𝒇𝒇 𝒙𝒙,𝒚𝒚 𝒅𝒅𝒙𝒙𝒅𝒅𝒚𝒚
(4)在(𝒙𝒙,𝒚𝒚)的连续点处有
𝝏𝝏𝟐𝟐𝑭𝑭(𝒙𝒙,𝒚𝒚)𝝏𝝏𝒙𝒙𝝏𝝏𝒚𝒚
= 𝒇𝒇(𝒙𝒙,𝒚𝒚)
注:设(𝑿𝑿,𝒀𝒀)为二维连续型随机变量,对平面上任一条简单曲线𝑳𝑳有
𝑷𝑷 𝑿𝑿,𝒀𝒀 ∈ 𝑳𝑳 = 𝟎𝟎
∫ ∫∞−∞+
∞−=
x
X dvduvufxF ),()(边缘分布函数与边缘密度函数
∫ ∫∞−∞+
∞−=
y
Y dudvvufyF ),()(∫
∞+
∞−= dvvxfxf X ),()(
∫∞+
∞−= duyufyfY ),()(
已知联合分布可以求得边缘分布;反之则不能唯一确定.
例 设 r.v.( X ,Y ) 的联合 d.f. 为
≤≤≤≤
=其他,0
,10,0,),(
yyxkxyyxf
其中k 为常数. 求(1)常数 k ;(2) P ( X + Y ≥ 1) , P ( X < 0.5);(3)边缘 d.f. 与边缘分布函数;(4)联合分布函数 F (x,y)
y = x1
0x
y
10,0),( ≤≤≤≤= yyxyxD解 令
D
(1) 1),( =∫ ∫∞+
∞−
∞+
∞−dxdyyxf
1),( =∫∫D
dxdyyxf
∫
∫ ∫
==1
0
2
1
0 0
82kdyyyk
kxydxdyy
8=k
y = x1
0x
y(2) )1( ≥+YXP
0.5
y = x1
0x
y
∫ ∫ −=1
5.0 18
y
yxydxdy
.6/5=
y = x1
0x
y
0.5
)5.0( <XP
∫ ∫=5.0
0
18
xxydydx
.16/7=
由联合密度求出边缘密度再积分求边缘分布函数.
∫∞+
∞−= dvvxfxf X ),()(
<≤= ∫
其他,010,8
1xxvdv
x
v=u1
0u
v
1
<≤−
=其他,0
10,44 3 xxx
(3)
<≤−
=其他,0
10,44)(
3 xxxxf X
<≤
=其他,0
10,4)(
3 yyyfY
( )XF x =0, x < 0,2x2–x4 , 0 ≤ x < 1,
1, x ≥ 1
( )YF y0, y < 0
y4 , 0 ≤ y < 1,1 , y ≥ 1
=
的分段区域
0<x
( , )F x y
0<y
y = x1
0 x
y
D
10 <≤ x
0 y x≤ <
1x y≤ <
1y ≥
1≥x
0 1y≤ <
1y ≥
当0≤ x< 1, 0≤ y< x 时,
1
(4) ( ) ∫ ∫∞− ∞−=≤≤=
x ydvduvufyYxXPyxF ),(,),(
当x<0 或 y<0 时,F(x,y) = 0
4
0 08 yuvdudv
y v== ∫ ∫
当0≤ x<1, x≤ y<1时,
4220
28),( xyxuvdvduyxFx y
u−== ∫ ∫
v=u1
0u
v
),( yxF
当0 ≤ x <1, y ≥ 1时,
∫ ∫=x
uuvdvduyxF
0
18),(
v=u1
0u
v
1422 xx −=
当x ≥ 1, 0 ≤ y < 1时,
v=u1
0u
v
1当 x ≥ 1, y ≥ 1 时,
1),( =yxF
4y=∫ ∫=
y vuvdudv
0 08),( yxF
F (x,y) =
0, x < 0 或 y < 0
y4 , 0 ≤ x <1, 0 ≤ y < x ,
2x2y2–x4, 0 ≤ x <1, x ≤ y <1,
2x2–x4 , 0 ≤ x <1, y ≥ 1,
y4 , x ≥ 1, 0 ≤ y < 1,
1, x ≥ 1, y ≥ 1,
设D是平面上的有界区域,其面积为A.若二维随机变量( X,Y)具有概率密度
1 , ( , )( , )
0,
x y Df x y A
∈= 其它
则称(X,Y)在D上服从均匀分布.
常见的二维分布:
若( X ,Y )服从区域D上的均匀分布, 则
∀ D1 ⊆ D, 设D1的面积为A1,
( ) 11( , ) AP X Y D
A∈ =
边平行于坐标轴的矩形域上的均匀分布的
边缘分布仍为均匀分布
向平面上有界区域D上任投一质点,若质点落在D内任一小区域D1的概率与小区域的面积成正比,而与D1的位置无关. 则质点的坐标(X,Y)在D上服从均匀分布.
21y x= − −
例 设随机向量(X,Y)服从区域D上的均匀分布,
其中 D=(x,y) | x2+y2≤1,求X,Y的边缘密度函数.
解 (1)由题意得:
2 21 1( , )
0
x yf x y π
+ ≤= 其它
( ) ( , )Xf x f x y dy+∞
−∞= ∫
X
Y
-1 1
21y x= −
当 |x|>1 时, f(x,y)=0,
所以, fX(x)=0
当|x|≤1时,
2 2
2 2
1 1
1 1( ) [ ] ( , )
x x
X x xf x f x y dy
− − − +∞
−∞ − − −= + +∫ ∫ ∫
2
2
1
1
1x
xdy
π−
− −= ∫ 22 1 x
π= −
所以,22 1 | | 1
( )0 | | 1
X
x xf x
xπ − ≤= >
22 1 | | 1( )
0 | | 1Y
y yf y
yπ − ≤= >
同理,
例 设(X ,Y ) ~ D 上的均匀分布,
( , ) 0 ,0 1D x y y x x= ≤ ≤ ≤ ≤
(1) f ( x, y );
(2) P ( Y > X 2 );
(3) ( X ,Y ) 在平面上的落点到 y 轴距离小
于0.3的概率.
求
解 (1)
y=x1
0x
y
1
≤≤≤≤
=其他,0
10,0,2),(
xxyyxf
D
(2) y = x2
∫ ∫=1
0 22
x
xdydx
.3/1=
)( 2XYP >
(3) )3.03.0()3.0|(| <<−=< XPXP
09.0)3.0(212 2 =⋅⋅=
y = x1
0 x
y
10.3
若二维随机变量(X,Y)具有概率密度
2122
11 2
1 1( , ) exp [( )2(1 )2 1
xf x y µρ σπσ σ ρ
−= − −−
21 2 2
1 2 2
2 ( )( ) ( ) ]x y yµ µ µρσ σ σ
− − −− +
记作( X,Y)~N( )2 21 1 2 2, ; , ;µ σ µ σ ρ
则称( X,Y)服从参数为𝝁𝝁𝟏𝟏,𝝈𝝈𝟏𝟏𝟐𝟐,𝝁𝝁𝟐𝟐,𝝈𝝈𝟐𝟐𝟐𝟐,𝝆𝝆的二维正态分布.
其中 均为常数,且 ,0,0 21 >> σσ 1|| <ρρσσµµ ,,,, 2121
正态分布的边缘分布仍为正态分布
+∞<<−∞=−
−
xexfx
X ,21)(
21
21
2)(
1
σµ
σπ
+∞<<−∞=−
−
yeyfy
Y ,21)(
22
22
2)(
2
σµ
σπ
则X,Y的边缘概率密度分别为
X~N(μ1,σ12), Y~ N(μ2,σ2
2)
可以证明 若
即 二维正态分布(X,Y)的边缘概率分布是一维正态分布,
反之未必成立.
注:这是二维正态分布(X,Y)的特征,
其他分布未必成立.
𝑿𝑿,𝒀𝒀 ~𝑵𝑵(𝝁𝝁𝟏𝟏,𝝈𝝈𝟏𝟏𝟐𝟐;𝝁𝝁𝟐𝟐,𝝈𝝈𝟐𝟐𝟐𝟐;𝝆𝝆)
例 设二维随机向量(X,Y)的联合概率密度为2 2
21( , ) (1 sin sin ) ( , )2
x y
f x y e x y x yπ
+−
= + −∞ < < +∞
求(X,Y)关于X,Y的边缘概率密度.
解2 2
21( ) ( , ) (1 sin sin )2
x y
Xf x f x y dy e x y dyπ
++∞ +∞ −
−∞ −∞= = +∫ ∫
2 2 2 2
2 21 (sin sin )2
x y x y
e dy e x y dyπ
+ ++∞ +∞− −
−∞ −∞
= +
∫ ∫
2 2 2
2 2 21 sin sin2
x y y
e e dy x e ydyπ
+∞ +∞− − −
−∞ −∞
= +
∫ ∫
∫∞+
∞−
−−= dyee
yx22
22
21
21
ππ2
2
21 x
e−
=π
即 2
2
21)(
x
X exf−
=π
同理可得 2
2
21)(
y
Y eyf−
=π
X,Y的边缘概率密度为一维正态分布.
边缘概率密度为一维正态分布的二维随机向量不一定
是二维正态分布.