概率论与数理统计
DESCRIPTION
概率论与数理统计. 福建师范大学福清分校数计系. 第三章 多维随机变量及其分布. 第 1 讲. §1 二维随机变量. - PowerPoint PPT PresentationTRANSCRIPT
1
概率论与数理统计
福建师范大学福清分校数计系
2
第三章 多维随机变量及其分布
第 1讲
3
§1 二维随机变量
4
在实际问题中 , 对于某些随机试验的结果需要同时用两个或两个以上的随机变量来描述 . 例如 , 为了研究某一地区学龄前儿童的发育情况 , 对这一地区的儿童进行抽查 , 对于每个儿童都能观察到他的身高 H 和体重 W. 在这里 , 样本空间 S={e}={ 某地区的全部学龄前儿童 , 而 H(e), 和 W(e) 是定义在 S 上的两个随机变量 . 又如炮弹弹着点的位置需要由它的横坐标和纵坐标来确定 , 而横坐标和纵坐标是定义在同一个样本空间的两个随机变量 .
5
一般 , 设 E 是一个随机试验 , 它的样本空间是 S={e}, 设 X=X(e) 和 Y=Y(e) 是定义在 S 上的随机变量 , 由它们构成的一个向量 (X,Y), 叫做二维随机向量或二维随机变量 .
Se
X(e)
Y(e)
6
定义 设 (X,Y) 是二维随机变量 , 对于任意实数 x,y, 二元函数 :
},{)}(){(),( yYxXPyYxXPyxF 记成
称为二维随机变量 (X,Y) 的分布函数 , 或称为随机变量 X 和 Y 的联合分布函数 .
(x,y)
x
y
O
7
易知 , 随机点 (X,Y) 落在矩形域[x1<Xx2, y1<Yy2] 的概率为P{x1<Xx2, y1<Yy2} =F(x2,y2)F(x2,y1)+F(x1,y1)F(x1,y2). (1.1)
x
y
y1
y2
x1 x2
8
分布函数 F(x,y) 具有的基本性质 :
1, F(x,y) 是变量 x 和 y 的不减函数 , 即对于任意固定的 y, 当 x2>x1 时 F(x2,y)F(x1,y); 对于任意固定的 x, 当 y2>y1 时 F(x,y2)F(x,y1).2, 0F(x,y)1, 且对于任意固定的 y, F(,y)=0, 对于任意固定的 x, F(x,)=0,F(,)=0, F(+, +)=1.3, F(x,y) 关于 x 和关于 y 都右连续 .4, 任给 (x1,y1),(x2,y2), x1<x2, y1<y2,F(x2,y2)F(x2,y1)+F(x1,y1)F(x1,y2)0
9
.壹 (X,Y) 是二维离散型的随机变量如果二维随机变量 (X,Y) 全部可能取到的不相同的值 是有限对或可列无限多对 , 则称 (X,Y) 是离散型的随机变量 .设二维离散型随机变量 (X,Y) 所有可能取的值为 (xi,yj), i,j=1,2,..., 记 P{X=xi, Y=yj}=pij, i,j=1,2,..., 则由概率的定义有
.1,01 1
i jijij pp
10
称 P{X=xi, Y=yj}=pij, i,j=1,2,..., 为二维离散型随机变量 X 和 Y 的分布律 , 或随机变量 X 和Y 的联合分布律 .也可用表格表示 X 和 Y 的联合分布律 :
Y X x1 x2 ... xi ...
y1 p11 p21 ... pi1 ...
y2 p12 p22 ... pi2 ...
... ... ... ... ...
yj p1j p2j ... pij ...
... ... ... ... ... ...
11
例 1 设随机变量 X 在 1,2,3,4 四个整数中等可能地取一个值 , 另一个随机变量 Y 在 1~X 中等可能地取一整数值 . 试求 (X,Y) 的分布律 .
解 由乘法公式容易求得 (X,Y) 的分布律 , 易知 {X=i,Y=j} 的取值情况是 : i=1,2,3,4, j 取不大于 i 的正整数 , 且
.,4,3,2,1
,1
41
}|{}{},{
ijii
iXjYPiXPjYiXP
12
于是 (X,Y) 的分布律为.,4,3,2,1
,1
41
}|{}{},{
ijii
iXjYPiXPjYiXP
Y X 1 2 3 4
1 1/4 1/8 1/12 1/16
2 0 1/8 1/12 1/16
3 0 0 1/12 1/16
4 0 0 0 1/16
13
将 (X,Y) 看成一个随机点的坐标 , 则离散型随机变量 X 和 Y 的联合分布函数为
)2.1(,),(
xx yy
ij
i j
pyxF
其中和式是对一切满足 xix,yjy 的 i,j 来求和的 .
补充例题 :
求例 1 中随机变量 X 和 Y 的联合分布函数 .
解 : 由例 1 所求的随机变量 X 和 Y 的联合分布律得随机变量 X 和 Y 的联合分布函数为 :
14
0 1 1
12 1
43
3 284
3 2811
4 22416
, 4 32418
424
4 1 2
4 2 3
4 3 4
4 4
x y
x y
x y
x y
x y
F X Y x y
x
x y
x y
x y
x y
当 或
当1 且
当2 且1
当2 且
当3 且1
当3 且2
当3 且y 3
25 当 且4838 当 且4845 当 且481 当 且
15
二 . (X,Y) 是二维连续型的随机变量 与一维随机变量相似 , 对于二维随机变量 (X,Y)的分布函数 F(x,y), 如果存在非负的函数 f(x,y) 使对于任意 x,y 有
,dd),(),(
y xvuvufyxF
则称 (X,Y) 是连续型的二维随机变量 , 函数 f(x,y) 称为二维随机变量 (X,Y) 的概率密度 , 或称为随机变量 X 和 Y 的联合概率密度 .
16
按定义 , 概率密度 f(x,y) 具有以下性质 :1, f(x,y)0.
.1dd),(,2
yxyxf
)3.1(.dd),(}),{( G
yxyxfGYXP
3, 设 G 是 xOy 平面上的区域 , 点 (X,Y) 落在G 内的概率为
4. 若 f(x,y) 在点 (x,y) 连续 , 则有
).,(),(2
yxfyx
yxF
17
由性质 4, 在 f(x,y) 的连续点处有
).,(),(
)],()Δ,(
),Δ()Δ,Δ([ΔΔ1
lim
ΔΔ}Δ,Δ{
lim
2
0Δ0Δ
0Δ0Δ
yxfyx
yxFyxFyyxF
yxxFyyxxFyx
yxyyYyxxXxP
yx
yx
18
这表示若 f(x,y) 在点 (x,y) 处连续 , 则当 x,y 很小时P{x<Xx+x, y<Yy+y}f(x,y)xy,即 (X,Y) 落在小长方形 (x,x+x](y,y+y] 内的概率近似等于 f(x,y)xy.在几何上 z=f(x,y) 表示空间的一个曲面 , 由性质2知 , 介于它和 xOy 平面的空间区域的体积为 1, 由性质3, P{(X,Y)G} 的值等于以 G
为底 , 以曲面 z=f(x,y) 为顶面的柱体体积 .
19
例 2 设二维随机变量 (X,Y) 具有概率密度
.,0
,0,0,e2),(
)2(
其它yx
yxfyx
.,0
0,0,dde2
dd),(),(
0 0
)2(
其它
yxyx
yxyxfyxF
y x yx
y x
(1) 求分布函数 F(x,y); (2) 求概率 P{YX}.
解 (1)
20
(2) 将 (X,Y) 看作是平面上随机点的坐标 , 即有
{YX}={(X,Y)G},其中 G 为 xOy 平面上直线 y=x 及其下方的部分 , 于是
.,0
,0,0),1)(1(),(
2
其它即有
yxeeyxF
yx
.31
dde2
dd),(}),{(}{
0
)2(
y
yx
G
yx
yxyxfGYXPXYP
21
x
y
O
G
22
以上关于二维随机变量的讨论 , 不难推广到n(n>2) 维随机变量的情况 . 一般 , 设 E 是一个随机变量 , 它的样本空间是 S={e}, 设 X1=X1(e), X2=X2(e), ..., Xn=Xn(e) 是定义在 S 上的随机变量 , 由它们构成的一个 n 维随机向量 (X1,X2,...,Xn) 叫做 n 维随机向量或 n 维随机变量 .
任给 n 个实数 x1,x2,...,xn, n 元函数F(x1,x2,...,xn)=P{X1x1,X2x2,...,Xnxn}称为 n 维随机变量 (X1,X2,...,Xn} 的分布函数或联合分布函数 . 它具有类似于二维随机变量的分布函数的性质 .
23
§2 边缘分布
24
二维随机变量 (X,Y) 作为一个整体 , 具有分布函数 F(x,y). 而 X 和 Y 都是随机变量 , 分别也有分布函数 , 将它们分别记为 FX(x),FY(y), 依次称为二维随机变量 (X,Y) 关于 X 和关于 Y的边缘分布函数 . 边缘分布函数可以由 (X,Y)的分布函数 F(x,y) 所确定 , 事实上 , FX(x)=P{Xx}=P{Xx, Y<}=F(x,),
即 FX(x)=F(x,). (2.1)
同理 FY(y)=F(,y). (2.2)
25
.壹 (X,Y) 是二维离散型的随机变量
对于离散型随机变量 , 由 (1.2),(2.1)式可得.),()(
1
xx j
ijX
i
pxFxF
,2,1,}{1
ipxXPj
iji
与第二章 (3.2)式比较 , 知道 X 的分布律为
同样 ,Y 的分布律为
1
{ } , 1,2,j iji
P Y y p j
26
记
,,2,1},{
,2,1},{
1
1
jyYPpp
ixXPpp
ji
ijj
ij
iji
分别称 pi(i=1,2,...) 和 pj(j=1,2,...) 为 (X,Y) 关于 X 和关于 Y 的边缘分布律 ( 注意 , 记号 pi
中的 "" 是由 pij 关于 j 求和后得到的 ; 同样 , pj 是由 pij 关于 i 求和后得到的 ).
27
二 . (X,Y) 是二维连续型的随机变量对于连续型随机变量 (X,Y), 设它的概率密度为 f(x,y), 由于 ,dd),(),()(
x
X xyyxfxFxF
)3.2(d),()(
yyxfxf X
由第二章 (4.1)式知道 , X 是一个连续型随机变量 , 且其概率密度为
同样 , Y 也是一个连续型随机变量 , 其概率密度为( ) ( , )d (2.4)Yf y f x y x
称 fX(x),fY(y) 为 (X,Y) 关于 X 和关于 Y 的边缘概率密度
28
例 1 一整数 N 等可能地在 1,2,3,...,10 十个值中取一个值 . 设 D=D(N) 是能整除 N 的正整数的个数 , F=F(N) 是能整除 N 的素数的个数 ( 注意 1 不是素数 ), 试写出 D 和 F 的联合分布律及边缘分布律 .解 先将试验的样本空间及 D,F 取值的情况列如如下 :
样本点 1 2 3 4 5 6 7 8 9 10
D 1 2 2 3 2 4 2 4 3 4
F 0 1 1 1 1 2 1 1 1 2
29
D 和 F 的联合分布律及边缘分布律如下表所示 :
样本点 1 2 3 4 5 6 7 8 9 10
D 1 2 2 3 2 4 2 4 3 4
F 0 1 1 1 1 2 1 1 1 2
F D 1 2 3 4 P{F=j}
0 1/10 0 0 0 1/10
1 0 4/10 2/10 1/10 7/10
2 0 0 0 2/10 2/10
P{D=i} 1/10 4/10 2/10 3/10 1
30
例 2 设随机变量 X 和 Y 具有联合概率密度
).(),(
.,0
,,6),(
2
yfxf
xyxyxf
YX求边缘概率密度
其它
x
y
O
y=x2
y=x
31
解
.,0
,10),(6d6
d),()(
.0
,10),(6d6
d),()(
22
其它
其它
yyyx
xyxfyf
xxxy
yyxfxf
y
y
Y
x
x
X
x
y
O
y=x2
y=x
32
例 3 二维随机变量 (X,Y) 的概率密度为
,,
,)())((
2
)(
)1(2
1exp
1π2
1),(
22
22
21
21
21
21
2221
yx
yyx
xyxf
其中 1,2,1,2, 都是常数 , 且 1>0,2>0, ||<1. 称(X,Y) 为服从参数 1,2,1,2, 的二维正态分布 , 记为 (X,Y)~N(1,2,1
2,22,). 试求二维正态随机变量
的边缘概率密度 .
33
解
,)(
))((2
)(
,d),()(
21
212
2
1
1
2
2
21
2122
22
xxy
yxy
yyxfxf X
由于
.dee12
1
)(2
1
1
2
222
1
21
)1(2
1
2
)(
221
y
xf
xyx
X
于是
34
.,2
1)(
.2
1)(
,d2
1)(
,1
1
22
22
21
21
221
21
2
)(
2
2
)(
1
2/2
)(
1
1
1
2
2
2
yeyf
xexf
teexf
xyt
y
Y
x
X
t
x
X
同理
即
则有令
35
由此我们得知 :
二维正态分布的两个边缘分布都是一维正态分布 , 并且不依赖于参数也也也也也也也也也 1,2,1,2, 不同的也也也也也二维正态分布 , 它们的边缘分布都是一样的 . 这一事实表明 , 单由关于 X 和 Y 的边缘分布 , 一般来说是不能确定随机变量 X 和 Y 的联合分布的 .
36
§3 条件分布
37
.壹 (X,Y) 是二维离散型随机变量设 (X,Y) 是二维离散型随机变量 , 其分布律为
P{X=xi,Y=yj}=pij, i,j=1,2,....
(X,Y) 关于 X 和关于 Y 的边缘分布律分别为
,,2,1,}{
,,2,1,}{
1
1
jppyYP
ippxXP
iijjj
jijii
设 pij>0, 考虑在事件 {Y=yj} 条件下事件 {X=xi} 发生的概率 , 也就是求条件概率
P{X=xi|Y=yj}, i=1,2,...
38
由条件概率公式 , 可得
,2,1
}{
},{}|{
i
p
p
yYP
yYxXPyYxXP
j
ij
j
jiji
.1}|{,2
;0}|{,1
11
j
j
i j
ij
iji
ji
p
p
p
pyYxXP
yYxXP
易知上述条件概率具有分布律的性质 :
39
定义 设 (X,Y) 是二维离散型随机变量 , 对于固定的 j, 若 P{Y=yj}>0, 则称
)1.3(,2,1
,}{
},{}|{
i
p
p
yYP
yYxXPyYxXP
j
ij
j
jiji
)2.3(,2,1,}|{
jp
pxXyYP
i
ijij
为在 Y=yj 条件下的随机变量 X 的条件分布律 .
同样 , 对于固定的 i, 若 P{X=xi}>0, 则称
为在 X=xi 条件下随机变量 Y 的条件分布律
40
例 1 在一汽车工厂中 , 一辆汽车有两道工序是由机器人完成的 . 其一是紧固 3只螺栓 , 其二是焊接 2 处焊点 . 以 X 表示螺栓紧固得不良的数目 ,Y 表示焊接点不良数目 . 已知 (X,Y) 的分布律 :Y X 0 1 2 3 P{Y=j}
0 0.840 0.030 0.020 0.010 0.900
1 0.060 0.010 0.008 0.002 0.080
2 0.010 0.005 0.004 0.001 0.020
P{X=i} 0.910 0.045 0.032 0.013 1.000
(1) 求在 X=1 的条件下 , Y 的条件分布律 ;(2)求在 Y=0 的条件下 , X 的条件分布律 .
41
解Y X 0 1 2 3 P{Y=j}
0 0.840 0.030 0.020 0.010 0.900
1 0.060 0.010 0.008 0.002 0.080
2 0.010 0.005 0.004 0.001 0.020
P{X=i} 0.910 0.045 0.032 0.013 1.000
Y=k 0 1 2
P{Y=k|X=1} 6/9 2/9 1/9
X=k 0 1 2 3
P{X=k|Y=0} 84/90 3/90 2/90 1/90
42
例 2 一射手进行射击 , 击中目标的概率为 p (0<p<1), 射击直至击中目标两次为止 . 设以X 表示首次击中目标所进行的射击次数 , 以Y 表示总共进行的射击次数 , 试求 X 和 Y 的联合分布律及条件分布律 .
2 2
2
( 1 ).n
n
p p q q q p q q p
也 也也 也 也 也也个
这里
解 按题意 Y=n 表示在第 n 次射击时击中目标 , 且在第 1 次 , 第 2 次 ,..., 第 n-1 次射击中恰有一次击中目标 . 已知各次射击是相互独立的 , 于是不管 m(m<n) 是多少 , 概率 P{X=m,Y=n} 都应等于
43
即得 X 和 Y 的联合分布律为P{X=m,Y=n}=p2qn2, n=2,3,...; m=1,2,...,n1.
.,3,2,)1(
},{}{
,,2,1,1
},{}{
221
1
22
1
1
112
1
22
1
22
1
nqpnqp
nYmXPnYP
mpqq
qpqp
qpnYmXPmXP
nn
m
n
n
m
mm
mn
n
mn
n
mn
又
44
于是由 (3.1),(3.2) 式得到所求的条件分布律为
,2,1
,}|{
,2,1
;1,,2,1
,1
1
)1(}|{
,3,2
11
22
22
22
mmn
pqpq
qpmXnYP
m
nm
nqpn
qpnYmXP
n
mnm
n
n
n
时当
时当
45
二 . (X,Y) 为连续型随机变量 如 (X,Y) 为连续型随机变量 , 概率密度为 f(x,y), 其关于 Y 的边缘概率密度为 fY(y), 给定 y, 对于一固定的非常小的正数 >0, 如 P{y<Yy+}>0,
)3.3(d)(),(
)(
d),(
d)(
dd),(
}{},{
}|{
x
Y
Y
x
y
y Y
x y
y
uyfyuf
yf
uyuf
vvf
uvvuf
yYyPyYyxXP
yYyxXP
46
定义 设二维随机变量 (X,Y) 的概率密度为 f(x,y), (X,Y) 关于 Y 的边缘概率密度为 fY(y).
)4.3(.)(),(
)|(
,
)(),(
,0)(,
| yfyxf
yxf
XyY
yfyxf
yfy
YYX
YY
记为条件概率密度的条件下
为在则称若对于固定的
47
|
|
|
( , )( | ) d d
( )
, ,
{ | } ( | ),
( , )( | ) { | } d . (3.5)
( )
x x
X YY
X Y
x
X YY
f x yf x y x x
f y
Y y X
P X x Y y F x y
f x yF x y P X x Y y x
f y
称:
为在 条件下 的条件分布函数记为: 或 即:
48
|
|
| |
0,
( , )( | )
( )
( , )( | ) d
( )
{ | } ( | )d ( | ).
Y XX
y
Y XX
x
X Y X Y
x X x
f x yf y x
f x
f x yF y x y
f x
P X x y Y y f x y x F x y
X类似地可以定义:对于固定的x, f 在条件 下
Y的条件概率密度为:
条件分布函数为:
且有
49
例 3 设 G 是平面上的有界区域 , 其面积为 A. 若二维随机变量 (X,Y) 具有概率密度
,,0
,),(,1
),(其它
GyxAyxf
则称 (X,Y) 在 G 上服从均匀分布 . 现设二维随机变量 (X,Y) 在圆域 x2+y21 上服从均匀分布 , 求条件概率密度 fX|Y(x|y).
50
解 由假设知随机变量 (X,Y) 具有概率密度
,,0
,1,π1
),(22
其它
yxyxf
,
( )X YY
f x yf x y
f y
因为
51
而 y 的边缘概率密度为 : y 0 x
2
2
1 2
1
( ) ( , )d
1 2d 1 , 1 1,
π π0, .
Y
y
y
f y f x y x
x y y
其它
2 2 1x y
21 y21 y
52
于是当 1<y<1 时有
2 2
22
|
1/π 1, 1 1 ,
2 2 11
,( | )
0,
X YY
y x yyy
f x yf x y
f y
其它
53
例 4 设数 X 在区间 (0,1) 上随机地取值 , 当观察到 X=x(0<x<1) 时 , 数 Y 在区间 (x,1) 上随机地取值 . 求 Y 的概率密度 fY(y).解 按题意 X 具有概率密度
.,0
,10,1)(
其它x
xf X
.,0
,1,1
1)|(|
其它
yxxxyf XY
对任意给定的值 x(0<x<1), 在 X=x 条件下 , Y的条件概率密度为
54
由 (3.4)式得 X 和 Y 的联合概率密度为
.,0
,10,1
1)|()(),( |
其它
yxxxyfxfyxf XYX
.,0
,10),1ln(d1
1
d),()(
0
其它
yyxx
xyxfyf
y
Y
于是得关于 Y 的边缘概率密度为
55
作业 第三章习题 第 105页开始
第 8、 12 题
56
请提问