数理統計学 ( 第五回) 統計的推測とは?

42
数数数数数数 1 数数数数数 ( 数数数数数数数数数数数数数数数

Upload: dannon

Post on 19-Jan-2016

95 views

Category:

Documents


0 download

DESCRIPTION

数理統計学 ( 第五回) 統計的推測とは?. 浜田知久馬. 確率分布. 数理統計学で確率分布を勉強. 確率分布は便利 確率分布がわかれば , 様々な事象を確率的に記述できる.(同時 , 周辺 , 条件付) 確率分布は母数によって定まる. 母数をどう求めればよいのか?. 推定の問題. ある目的で , ある確率変数 Y をn回観測し ,  標本 Y =(Y 1 , Y 2 , ・・・ , Y n ) を得る . ・標本 Y の分布はある分布族に属している .  「分布を規定する 母数 は未知である」 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 1

数理統計学 ( 第五回)統計的推測とは?

浜田知久馬

Page 2: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 2

確率分布数理統計学で確率分布を勉強.確率分布は便利確率分布がわかれば , 様々な事象を確率的に

記述できる.(同時 , 周辺 , 条件付)確率分布は母数によって定まる.母数をどう求めればよいのか?

Page 3: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 3

• ある目的で , ある確率変数 Y をn回観測し ,

 標本 Y=(Y1, Y2, ・・・ , Y n ) を得る .・標本 Y の分布はある分布族に属している . 「分布を規定する母数は未知である」• 「標本 Y の実現値yに基づいて未知母数の真

の値がいくらであるか評価 , 断定する問題を「推定の問題」という .

推定の問題

Page 4: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 4

ダーウィンの植物の丈のデータ(単位インチ)

───────────────────────────────  No.自家受精  他家受精 No.自家受精  他家受精 ───────────────────────────────   1     17.375     23.5     9    16.5    18.25   2     20.375     12     10   18      21.625   3     20       21 11   18.25    23.25   4     20       22 12   18      21   5     18.375     19.125 13   12.75    22.125   6     18.625     21.5 14   15.5     23   7     18.625     22.125 15   18     12   8     15.25     20.375 ───────────────────────────────  平均   17.708      20.192 標準偏差  2.024     3.617 ───────────────────────────────

Page 5: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 5

Page 6: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 6

母数推定の前提

自家受精群と他家受精群に別々の正規分布をあてはめ

n個(n=15)の確率変数Yiが互いに独立に同一の正規分布にしたがう

Y1 , Y2 , Y3 , ・・・,Yn ~N( μ,σ2)

i.i.d. ( independent identically distributed )

Page 7: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 7

•  ある未知母数 の真の値を推定したいという問題を考える.

一つの答え方:•  観測変数 Y の統計量 t(Y) を一つ用意•  観測値がデータ y として得られたら,その

データを代入して得られる関数値 t(y) が   「母数 の真の値である」 と断定• このような方式を「(点)推定」 estimation

と言う,

点推定

Page 8: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 8

•  推定に使う関数 t(Y) を「推定量」 estimator ,データを代入して得られる値 t(y) を「推定値」 estimate という.

• 推定の問題において,数理統計学が問題にすることは,どんなやり方が良いかである.

• どんな推定量が良い推定量?

推定と推定量

Page 9: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 9

区間推定• 別の答え方• 2 つの統計量 tL(Y), tU(Y) を用意する .

• Y の実現値yを得たら , それを代入して得られる値 tL( y ) ~ tU( y ) の範囲に真の値があるとする .

• このような形式を「区間推定」  interval   estimation という .

Page 10: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 10

良い推定量の規準

• 良さを議論するには規準 criterion が必要• 一つの視点: 定性的,資格条件を限定し

ておいて,その中である規準量が最大(あるいは最小)となるものを良いものとする.

たとえば?• 定性的条件:不偏性,線形性• 定量的規準:分散最小性

• 不偏性とは?分散最小性とは?

Page 11: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 11

精度 , 偏り,正確さ

不偏だけど精密でない    偏りありかつ                   精密でない

不偏で精密 偏りあるけど精密

Page 12: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 12

点推定の良さの基準• β の推定量bがあるとする .

• 推定量の良さの基準で最も一般的なのは平均二乗誤差 (Mean Square Error : MSE)

• MSE=E[(b - β)2]

= E[(b - β)2] = E[(b -E [b] - β +E [b])2]

= E[(b -E [b])2]+ E[( E [b] - β)2]

  +2( E [b] - β) E[b -E [b]]  

Page 13: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 13

MSEMSE=E[(b -E [b])2]+ E[( E [b] - β)2]

      V [b]         bias    推定量の分散 推定量の偏り

両方を同時に最適化できるか?

分散を 0  → 常にb= 0   V [b]=0       

Page 14: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 14

推定での方法論的課題どんな推定量が良い推定量?定性的条件 , 例えば 不偏性=期待値が未知母数に一致 線形性=推定量が Y の線形式を 満たすものの中である規準量 , 例えば分散を最小 ( 最良 , 有効)にす

るものを良いとする⇒最良線形不偏推定量

Page 15: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 15

最良線形不偏推定量を求める方法はあるか?

• 一般的な方法はない .

 存在しないことも多い .

• 原理的に良い推定量を導きやすい原理は? ・最尤法 ・最小 2 乗法 ・モーメント法

Page 16: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 16

クラメル・ラオ (Cramer-Rao) の不等式

IV

d

YfdE

d

YfdEUEI

1][

),(log

),(log][

2

2

22

Page 17: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 17

クラメル・ラオ (Cramer-Rao) の不等式

不偏推定量の分散の下限についての不等式( 不偏推定量の分散はこれより小さくならな

い)θ を不偏推定量とするとV[θ] 1/I≧I :フイッシャーの情報量 (Fisher information)

等号が成り立つ場合は , 不偏推定量の中で分散が最小(有効)となる .

^^

22 ),(log][

d

YfdEUEI

Page 18: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 18

証明にあたって利用すること

1) 不偏推定量の定義  E[θ ( Y)]=θ2) 確率密度関数の和は1  ∫f ( y ,θ) dy =13) E[B]=0 のとき , E[A ・ B]=Cov [A,B] ,V[B]= E[B2]    { Cov [A,B] = E[A ・ B] - E[A] E[B] }4)

5 )微分と積分の交換可能性6 )  Cov [A,B] V[A] V[B]≦  相関係数の絶対値は1を越えない

d

yfdyf

d

ydf

d

ydf

yfd

yfd ),(log),(

),(),(

),(

1),(log

Page 19: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 19

クラメル・ラオ (Cramer-Rao) の不等式

不偏であるためには θ が 1 単位増加すれば期待値も 1 増加する

d

yfdYE

dyyfd

yfdY

dyd

ydfY

d

dyyfYd

d

d

dyyfYYE

)(log)(

)()(log

)(

)()(

)()(1

)()()(

の不偏推定量とするとを

Page 20: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 20

クラメル・ラオ (Cramer-Rao) の不等式積分と微分の交換可能性,傾きの期待値は 0

θ を動かしても確率密度の和は不変

d

yfdYE

d

yfdY

BAEBABE

d

yfdE

dyyfd

yfd

dyd

ydf

d

dyyfd

dyyf

)(log)(

)(log),(Cov

],[],[Cov0][

0),(log

),(),(log

),(0

),(

1),(

 

のとき,

 なので,

Page 21: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 21

クラメル・ラオ (Cramer-Rao) の不等式

12

2

)(log1)(

)()(log

)(

)(log)(

)(log),(Cov1

d

yfdE

IYV

IYVd

yfdEYV

d

yfdVYV

d

yfdY  

を越えないので相関係数の絶対値は1

Page 22: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 22

クラメル・ラオ (Cramer-Rao) の不等式

不偏推定量 θ の分散が ,

V[θ] = 1/I

を満たせば , θ は一様最小分散不偏推定量(Uniformly Minimum Variance Unbiased

estimator, UMVU)

である .

^^

Page 23: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 23

2 項分布の場合

d

ynyCdd

yfdU

Cyf

npV

pn

npE

n

Yp

yn

ynyyn

)1log()(loglog

),(log

)1(),(

)1(][

][,

の不偏推定量は

   

Page 24: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 24

2 項分布の場合

UMVUp

pV

n

nnyEUEI

nyynyynyd

ynyCd yn

][

1

)1(

)1(

)1(

)1(

)(][

)1()1(

)()1(

1

)1log()(loglog

2222

22

Page 25: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 25

最尤法 (Maximum Likelihood method )

•確率(密度)関数を未知母数の関数とみなしたものが ,尤度 (likelihood)

•確率が最大の母数の値は ,観測値 Yの関数 これを未知母数の推定量とする .•最尤法 ,得られる推定量が最尤推定量 確率が最大になるように推定  (MLE: Maximum Likelihood Estimator)

Page 26: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 26

最小二乗法• 観測変数 Y の値と , モデルから予測される

差の 2 乗和を最小にする母数の値を推定量とする方法

  Σ ( Yi - β0 - β1Xi ) 2

を最小にするように β0 と β1 を推定

Page 27: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 27

最小 2 乗法の模式図

X0

××

XX

×

Y=β0+β1X

Page 28: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 28

モーメント法

分布のモーメントを , 次数の低い方から未知母数の数pだけ求め , それを対応する標本モーメントと等しいとおき , 母数の推定量を構成する方法を“モーメント法” (moment   method) という

分布の期待値=データの平均E[X] = μ  : Σ x i / N分布の2次モーメント=データの2乗和E[X2] = μ2 +σ2 : Σ x i

2 / N            

Page 29: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 29

用語

最尤原理( maximum likelihood principle )最尤法( maximum likelihood method ) 最尤推定量( maximum likelihood

estimator )尤度( likelihood)

対数尤度 (log likelihood)

Fisher の情報量( Fisher's information )

Page 30: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 30

尤度,最尤推定量, Fisher の情報量

尤度( likelihood) : 尤(もっともらし)さの程度

        を確率で評価した指標最尤推定量 : 尤度が最大になるように母数      を推定する原理Fisher の情報量:最尤推定量の推定精度を        測る指標     

Page 31: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 31

最尤推定の例コインを 10 回投げて 7 回表が出たとする .このような事象が起きる確率は?確率分布として2 項分布 B( n= 10,π )を仮定するとp= 10C y π y( 1 - π ) 10- y

確率pは母数 π の関数である . 確率を母数の関数と考えたのが尤度( L : likelihood)

確率関数: π を固定したyの関数尤度関数: yを固定した π の関数 

Page 32: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 32

最らしい π は?   π 確率 1 0.1 0.00001 2 0.2 0.00079 3 0.3 0.00900 4 0.4 0.04247 5 0.5 0.11719 6 0.6 0.21499 7 0.7 0.26683 8 0.8 0.20133 9 0.9 0.05740

Page 33: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 33

尤度の計算プログラムdata q6;do phi=0.10 to 0.90 by 0.02;l=10*9*8/(3*2*1)*phi**7*(1-phi)**3;output;end;proc gplot;plot l*phi/href=0.7;symbol1 i=spline v=none h=4 w=4;run;

Page 34: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 34

π の関数の尤度

Page 35: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 35

最尤推定

尤度 (L )を最大にするように母数を求める .

尤度の最大化 ⇒ 対数尤度の最大化母数空間の全ての π について L を計算するか?山の頂上では傾き 0

対数尤度を π で微分して導関数を求め ,

導関数が 0 になる π を求める .

Page 36: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 36

西遊記ひたすら西を目指す.

Page 37: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 37

最尤法ひたすら山の頂上を目指す.

Page 38: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 38

山の頂上にいるのは?

Page 39: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 39

最尤推定量の誘導1

n

y

nyyny

ynyC

d

dL

CL

ynyynyyn

ynyyn

00)()1(

])1()()1([

0

)1(

11

Page 40: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 40

最尤推定量の誘導2

n

y

nyyny

d

Ld

ynyCL

CL

yn

ynyyn

0)1(1

log

)1log()(logloglog

)1(

Page 41: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 41

コインを 100 回投げて 70 回表が出たときの尤度

Page 42: 数理統計学 ( 第五回) 統計的推測とは?

数理統計学第5回 42

演習問題 ポアソン分布の推測

ポアソン分布の確率関数p ( x ) は, p ( x ) = λ x・ exp( - λ) /x!となる .λ が母数であり,xは確率変数の実現値で0、1、2・・・の値をとるものとする.

1)λ =1のとき,Xが1以上の値をとる確率を計算せよ.ヒント exp( 1)=2.718

2) お年玉付年賀状の当たり数がx= 5 となった . 当たり数の分布にポアソン分布を仮定して,このようなデータが得られた場合の尤度と対数尤度を計算せよ.

3) 対数尤度を, λ で微分せよ.また1次微分関数の値が 0 になるように λ を求めよ.