数理統計学 ( 第四回) 分散の性質と重要な法則
DESCRIPTION
数理統計学 ( 第四回) 分散の性質と重要な法則. 浜田知久馬. 分散についての性質. V[X+Y] = E[(X+Y - μ x - μ Y ) 2 ] = E[(X - μ x ) 2 +(Y - μ x ) 2 +2 (X - μ Y ) (Y - μ Y ) ] = E[(X - μ x ) 2 ]+ E[(Y - μ Y ) 2 ] +2E[(X - μ x ) (Y - μ Y )] = V[X]+V[Y]+2 ・ Cov[X,Y ] 独立のときは , V[X+Y] = V[X]+V[Y]. 分散についての性質. aは定数 - PowerPoint PPT PresentationTRANSCRIPT
数理統計学第4回 1
数理統計学 ( 第四回)分散の性質と重要な法則
浜田知久馬
数理統計学第4回 2
分散についての性質
V[X+Y] = E[(X+Y - μx - μY)2]
= E[(X - μx)2+(Y - μx)2 +2 (X - μY) (Y - μY) ]
= E[(X - μx)2]+ E[(Y - μY)2]
+2E[(X - μx) (Y - μY)]
= V[X]+V[Y]+2 ・ Cov[X,Y ]独立のときは ,
V[X+Y] = V[X]+V[Y]
数理統計学第4回 3
分散についての性質aは定数V[a+X] = E[(a+X - a - μx)2] = V[X]
V[aX] = E[(aX - aμx)2]
= E[a(X - μx)2]
= a2E[(X - μx)2] = a2 V[X]
E[a+X] = a+E[X], E[aX] = a ・ E[X],
数理統計学第4回 4
分散についての性質Z= a1X1+ a2X2+ ・・・ + apXp
V[ Z ] = ΣΣaiajCov [ Xi,X j ]
= Σai2 V[Xi]+ΣΣ2aiajCov[Xi, X j ]
i < j
X1, X2, ・・・ ,Xp が互いに独立の場合
V[ Z ] = Σai2 V[Xi]
= a12V[X1]+a2
2V[X2]+ ・・・ + a p2V[X p ]
(分散の加法性)
数理統計学第4回 5
分散についての性質
Z= a1X1+ a2X2
V[ Z ] = V[a1X1+ a2X2]
= E[(a1X1+ a2X2 - a1μ1 - a2μ2)2]
= E[(a1X1 - a1μ1 + a2X2 - a1μ2)2]
= E[(a1X1 - a1μ1)2 ] + E[(a2X2 - a2μ2)2 ]
+2E[(a1X1 - a1μ1)(a2X2 - a2μ2) ]
= a12V[X1]+a2
2V[X2] +2a1a2Cov[X1, X2]
数理統計学第4回 6
分散・共分散行列3 変数の場合 V[X1] Cov[X1, X2] Cov[X1, X3]
V= Cov[X2, X1] V[X2] Cov[X2, X3]
Cov[X3, X1] Cov[X3, X2] V[X3]
一般にp変数ある場合,分散・共分散行列はp × pの対称行列になる .
数理統計学第4回 7
行列表現a T=[a1, a2,・・・, ap] a:p行のベクト
ルx T=[X1, X2,・・・, Xp] x:p行のベクトル
V :分散・共分散行列 ( p × p ) Z =a TxV[ Z ] =a T VaZ= a1X1+ a2X2+ a3X3
の場合についてV[ Z ] を書き下せ.
数理統計学第4回 8
Z= a1X1+ a2X2+ a3X3 の分散
Z= a1X1+ a2X2+ a3X3
V[ Z ] =a T Va= a1
2V[X1]+ a1a2Cov[X1,X2]+ a1a3Cov[X1,X3]
+a2a1Cov[X2,X 1 ]+ a22V[X2]+a2a3Cov[X2,X3]
+a3a1Cov[X3,X1]+ a3a2Cov[X3,X2]+ a32V[X3]
数理統計学第4回 9
共分散の計算Z 1 = a1X1+ a2X2+ ・・・ +a3X3 =a T xZ 2 =b 1X1+ b 2X2+ ・・・ + b 3X3 =b T xのときCov[ Z 1, Z 2] = Cov[ a T x , b T x ]
= ΣaibjCov [ Xi,X j ]
=a T VbV[ Z 1] = Cov[ a T x , a T x ] =a T Va
数理統計学第4回 10
共分散の計算
Z 1 = a1X1+ a2X2+ a3X3
Z 1 = b1X1+ b2X2+ b3X3
Cov[ Z 1, Z 2] =a T Vb= a1b1V[X1]+ a1b2Cov[X1,X2]+ a1b3Cov[X1,X3]
+a2b1Cov[X2,X 1 ]+ a2b2V[X2]+a2b3Cov[X2,X3]
+a3b1Cov[X3,X1]+ a3b2Cov[X3,X2]+ a3b3V[X3]
数理統計学第4回 11
分散の加法性の応用平均値の分散は?X1, X2, ・・・ ,Xn が互いに独立に分散 σ2 の
分布にしたがうとき
nn
n
n
nn
n
XXXVXV
n
i
n
2
2
2
12
2
2
2
2
2
21][
数理統計学第4回 12
分散の加法性の応用E[X] = 0,V[X]=32=9
E[Y] = 0,V[Y]=42=16
でかつ X と Y が独立のときX+Y の期待値と分散は?X - Y の期待値と分散は?
数理統計学第4回 13
乱数による確認実験data data;do i=1 to 1000;x=3*rannor(5963);y=4*rannor(5963);z1=x+y;z2=x-y;output;end;proc means mean var std maxdec=2;run;
数理統計学第4回 14
要約統計量変数 平均値 分散 標準偏差---------------------------------x 0.05 8.72 2.95y -0.05 16.07 4.01z1 0.01 25.95 5.09z2 0.10 23.65 4.86----------------------------------
数理統計学第4回 15
演習問題
X 1 ,X 2 ,・・・,X 6 が確率変数でそれぞれ独立に正規分布N (μ , σ2) に従っているとき,1)~7)の期待値と分散を示せ.0) X i: 解答例 期待値 μ ,分散 σ2
321
654321
2)3
)23
)1
XXX
XXXXXX
X i
数理統計学第4回 16
演習問題
4321
21
21
11
33)722
)6
22)5
22)4
XXXX
XX
XX
XX
数理統計学第4回 17
中心極限定理Central Limit Theorem
多くの分布が一山分布になるのはなぜだろうか?
例)センター入試,身長,血圧中心 : 分布の中心 , 平均値は極限:nを大きくすると正規分布にしたがう .
「和や平均値の分布は山型の分布にしたがう」
数理統計学第4回 18
平均値の2つの性質と SE
1)平均値の分散 ( バラツキ ) は生データの1/N,標準偏差に直せば1/√Nになる.
2)Nがある程度大きくなれば,平均値の分布は正規分布になる.
数理統計学第4回 19
乱数実験A)0,1の一様分布 (0 ~ 1 の間を等しい確率でとる ) にしたがう乱数を1万個発生さる.
B)一様分布にしたがう乱数を4万個発生させ,4個づつ組にして平均値を計1万個計算する .
C)一様分布にしたがう乱数を9万個発生させ,9個づつ組にして1万個の平均値を計算する .
数理統計学第4回 20
生データのヒストグラム A
0.00 0.30 0.60 0.90
Y1
0
200
400
度数
数理統計学第4回 21
4 個の平均のヒストグラム B
0.00 0.30 0.60 0.90
Y4
0
500
1000
度数
数理統計学第4回 22
9 個の平均のヒストグラム C
0.00 0.30 0.60 0.90
Y9
0
500
1000
1500
度数
数理統計学第4回 23
実験結果のまとめ
平均値 標準偏差 分散A)生データ 0.499 0.289
0.0838B)4個の平均 0.499 0.144
0.0206C)9個の平均 0.500 0.095
0.00906
数理統計学第4回 24
大数の法則 (law of large numbers)
平均値はnを大きくすると,真の値に収束する .
平均値→ E(X) = μ (n→∞)limP ( | 平均値- μ| ε≧ )= 0n→∞
マルコフの不等式 (Markov’s inequality)
チェビシェフの不等式 (Chebyshev’s inequality)
数理統計学第4回 25
マルコフの不等式X 0≧ :非負の確率変数 c> 0 :正の定数P ( X ≧ c)≦ E ( X )/c例)交通事故による死亡が 10 を越える確率は?Y = 0 if X <c c if X ≧ c常に Y X≦ なので→ E ( Y )≦ E ( X )E ( Y )= 0×P(Y=0)+ c ×P(Y=c) =c ×P(X ≧
c )E ( Y )=c ×P(X ≧ c ) E≦ ( X )P ( X ≧ c)≦ E ( X )/c
数理統計学第4回 26
マルコフの不等式
X
Y
c
c0
Y=X
数理統計学第4回 27
マルコフの不等式の応用宝くじで1等2億円が当たる確率は?X :宝くじの賞金金額P ( X ≧ 2億円)E ( X )= 150 円 , c= 2億円P ( X ≧ c)≦ E ( X )/c= 150 円/ 2億円= 1/133 万正確な確率は 1/500 万
数理統計学第4回 28
チェビシェフの不等式
E ( X )= μ,V ( X )= σ2
P ( |X - μ| ≧ c)≦ σ2 /c 2
Y =( X - μ ) 2 とおいてマルコフの不等式を適用
P ( Y ≧ c 2 )≦ E ( Y )/c 2 = σ2 /c 2
Y ≧ c 2 ⇔ |X - μ| ≧ c なのでP ( Y ≧ c 2 ) = P ( |X - μ| ≧ c)
数理統計学第4回 29
チェビシェフの不等式の意味σ2= 1のときc チェビシェフの上限 正規分布1 1
0.32 2 0.25(1/22) 0.05
3 0.11(1/32) 0.003
4 0.06(1/42) <0.0001
数理統計学第4回 30
日本人身長の例 ( 浜田世代)男性 平均: 170.1 SD : 5.6 単位
(cm)
平均 ±SD : 164.5 ~ 175.7
平均 ±2SD : 158.9 ~ 181.3
平均 ±3SD : 153.3 ~ 186.9
平均 ±4SD : 147.7 ~ 192.5
平均 ±5SD : 142.1 ~ 198.1
数理統計学第4回 31
日本人身長の例 ( 浜田世代)女性 平均: 157.3 SD : 5.0 単位
(cm)
平均 ±SD : 152.3 ~ 162.3
平均 ±2SD : 147.3 ~ 167.3
平均 ±3SD : 142.3 ~ 172.3
平均 ±4SD : 137.3 ~ 177.3
平均 ±5SD : 132.3 ~ 182.3
数理統計学第4回 32
大数の法則
にチェビシェフの不等式を適用すると
n→∞のとき右辺は 0 に収束するから
2
2
2
)(
][,][
nXP
nXVXE
0)(lim
XPn
X
X