ベイズ統計学のmcmcとの出会い ご紹介内容...

42
1 ベイズ統計学のMCMCとの出会い 20041015関西SASユーザー会 塩野義製薬(株) 町田光陽,長谷川貴大,田崎武信

Upload: lamthien

Post on 03-Jul-2019

229 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

1

ベイズ統計学のMCMCとの出会い

2004年10月15日関西SASユーザー会

塩野義製薬(株)

町田光陽,長谷川貴大,田崎武信

Page 2: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

2

ご紹介内容

1.ベイズ統計のMCMCとの出会い→

2.ベイズ統計で最尤推定

3.ベイズ統計と混合効果モデルの関係

4.ベイズ論文の読みかた(私案)

Page 3: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

3

ベイズ統計学

主観,経験,知識

尤度

モデル

事前分布

事後分布

ベイズの定理データ

Page 4: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

4

ベイズの定理

∫=

θθθθθθ

dpxppxpxp

)()|()()|()|(

)|( θxp は統計学一般で利用される密度である. についての関数としてと

らえると尤度にあたる.

θ

)(θp右辺の は事前(データがとられる前の)確率密度とよばれる.これはベイ

ズ統計学でのみ登場する.

)|( xp θ左辺の は事後確率密度とよばれる.

分母の積分計算は困難な場合が多い.

Bayesian inference. Encyclopedia of Statistical Science,Vol.1,pp.197-204.

Page 5: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

5

MCMC(マルコフ連鎖モンテカルロ)

複雑な多次元分布から乱数を発生させる方法

MCMCの代表的なもの

Metropolis-Hastingsアルゴリズム

Page 6: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

6

密度関数 をもつ分布に従う乱数を生成するMetropolis-Hastingsアルゴリズム

)(⋅π

・初期値を とする.・ について以下を繰り返す.

1. から , から を生成する.

2. であれば, とおく.

ここに, である(数学的に厳密な表現はあえて避けた).

3.そうでなければ とおく.

・結果 を得る.

)0(xNj ,..,2,1=

),( )1( ⋅−jxq y )1,0(U

),( )1( yxu j−≤α yx j =)(

⎭⎬⎫

⎩⎨⎧

= −−

−−

),()(),()(,1min),( )1()1(

)1()1(

yxqxxyqyyx jj

jj

ππα

)1()( −= jj xx

{ })()2()1( ,...,, Nxxx

このアルゴリズムは候補発生密度 により特定される.),( )1( ⋅−jxq

Chib,S. and Greenberg,E.(1995).Understanding the Metropolis-Hastings Algorithm, The American Statistician,49,327-335.

Page 7: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

7

事後密度 をもつ分布に従う乱数を生成したい.

このときMetropolis-Hastingsアルゴリズムが利用できる.∫

=θθθ

θθθ

dpxppxp

xpprior

priorposterior )()|(

)()|()|(

・初期値を とする.・ について以下を繰り返す.

1. から , から を生成する.

2. であれば, とおく.

ここに, である.

3.そうでなければ とおく.

・結果 を得る.

)0(θNj ,..,2,1=

),( )1( ⋅−jq θ candidateθ )1,0(U

),( )1( candidateju θθα −≤ candidatej θθ =)(

)1()( −= jj θθ

{ })()2()1( ,...,, Nθθθ

事後密度の規格化定数(分母の積分の項)が必要でない.

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

= −−−

−−

),()()|(),()()|(

,1min),( )1()1()1(

)1()1(

candidatejjprior

j

jcandidatecandidateprior

candidatecandidatej

qpxpqpxp

θθθθθθθθ

θθα

このアルゴリズムは候補発生密度 により特定される.),( )1( ⋅−jq θ

Page 8: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

8

MCMCがベイズ統計の世界を広げた

積分に頼るベイズ統計

積分を楽にするために共役事前分布

規格化定数の計算

平均や分散の計算

事後分布のシミュレーション

MCMC

Page 9: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

9

がベクトル の場合,事後密度 をもつ分布に従う乱数を生成したい.θ )|( xpposterior θ),( 21 θθ

21,θθ の事前分布はそれぞれ独立,すなわち

と仮定する.このとき同時事後密度は,

となる.

)()(),( 2121 θθθθ priorpriorprior ppp =

∫ ∫=

212121

212121 )()(),|(

)()(),|()|,(

θθθθθθ

θθθθθθ

ddppxpppxp

xppriorprior

priorpriorposterior

Page 10: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

10

Metropolis-Hastingsアルゴリズムを利用する際の注意点

Metropolis-Hastingsアルゴリズムで, はベクトルであってもよい.しかし, がベクトルであれば,現実に, から を直接生

成する,というステップが可能になる例は少ないはずである.

y),( )1( ⋅−jxqy y

したがって,Metropolis-Hastingsアルゴリズムを利用するためには, をスカラーのように扱う工夫が必要である.y

Page 11: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

11

MCMCの代表的なもの

Metropolis-Hastingsアルゴリズム

yをスカラのように扱う工夫

1.Single Component Metropolis-Hastingsアルゴリズム2.Gibbsサンプリング

Page 12: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

12

Single Component Metropolis-Hastingsアルゴリズムを利用する場合

・初期値を ⎟⎟⎠

⎞⎜⎜⎝

⎛)0(

2

)0(1

θθ

とする.

・ Nj ,..,2,1= について以下を繰り返す.

1.)(

1jθ を発生させる.

(1)⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⋅⎟⎟⎠

⎞⎜⎜⎝

⎛−

,)1(2

)1(1

1 j

j

qθθ

からcandidate

1θ , )1,0(U からu を発生する.

(2) ),( 1)1(

11candidateju θθα −≤ であれば,

candidatej1

)(1 θθ = とおく.

ここに,

⎪⎪

⎪⎪

⎪⎪

⎪⎪

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⎟⎟⎠

⎞⎜⎜⎝

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⎟⎟⎠

⎞⎜⎜⎝

=

−−−

−−

candidatej

jjj

posterior

jj

candidatejcandidate

posteriorcandidatej

qxp

qxp

1)1(2

)1(1

1)1(

2)1(

1

)1(1)1(

2

11

)1(21

1)1(

11

,),|(

,),|(,1min),(

θθθ

θθ

θθθ

θθθθα である.

(数学的に厳密な表現はあえて避けた).

(3)そうでなければ)1(

1)(

1−= jj θθ とおく.

フルの条件付き事後分布の密度関数

Page 13: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

13

2.)(

2jθ を発生させる.

(1)⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⋅⎟⎟⎠

⎞⎜⎜⎝

⎛−

,)1(2

)(1

2 j

j

qθθ

からcandidate2θ , )1,0(U からuを発生する.

(2) ),( 2)1(

22candidateju θθα −≤ であれば,

candidatej2

)1(2 θθ =−

とおく.

ここに,

⎪⎪

⎪⎪

⎪⎪

⎪⎪

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⎟⎟⎠

⎞⎜⎜⎝

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⎟⎟⎠

⎞⎜⎜⎝

=

−−

candidatej

jjj

posterior

jcandidate

jjcandidate

posteriorj

qxp

qxpy

2)1(2

)(1

2)(

1)1(

2

)1(2

2

)(1

2)(

12)1(

22

,),|(

,),|(,1min),(

θθθ

θθ

θθθ

θθθα である.

(数学的に厳密な表現はあえて避けた).

(3)そうでなければ)1(

2)(

2−= jj θθ とおく.

・ 結果⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛)(

2

)(1

)2(2

)2(1

)1(2

)1(1 ,...,, N

N

θθ

θθ

θθ

を得る.

このアルゴリズムは候補発生密度⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⋅⎟⎟⎠

⎞⎜⎜⎝

⎛⋅

,)(2

)(1

1 θθ

q と⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⋅⎟⎟⎠

⎞⎜⎜⎝

⎛⋅

,)(2

)(1

2 θθ

q により特定される.

フルの条件付き事後分布の密度関数

Page 14: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

14

フルの条件付き事後分布の密度関数の導出

尤度関数と の事前密度の積に比例する.これは, と の事前分布を独立と仮定したためである.

1θ 2θ

を計算する際に約分されるのでこの積分は必要ない.

)(),|(

)(),|()(),|(

)(),|()()()(),|(

)()(),|()()(),|(

)|,()|,(

),|(

121

1121

121

11212

2121

12121

2121

121

2121

θθθ

θθθθ

θθθ

θθθθθ

θθθθ

θθθθθ

θθθθ

θθθ

θθθθ

prior

prior

prior

priorprior

priorprior

priorprior

priorprior

posterior

posteriorposterior

pxp

dpxppxp

dpxppppxp

dppxpppxp

dxpxp

xp

=

=

=

=

 

)(),|(),|( 22112 θθθθθ priorposterior pxpxp ∝

同様に,

のとき

)()(),( 2121 θθθθ priorpriorprior ppp =

あるパラメタの,他のすべてのパラメタに条件付きの分布はフルの条件付き分布とよばれる.

Page 15: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

15

フルの条件付き分布を利用することの正当性

に条件付きの の事後密度の比

( についてのフルの条件付き事後密度の比)

2θ 1θ

( )( )

( ) ( ) ( )( ) ( ) ( )

( ) ( ) ( )( ) ( ) ( )

( ) ( )( ) ( )

( )( ))1(

2)1(

1

)1(21

)1(1

)1(2

)1(1

1)1(

21

212121

)1(2

)1(1

)1(2

)1(1

212121

)1(21

)1(21

)1(2

)1(1

)1(21

,|,|

,|,|

θθθθθ,θ|,|

θθθθθ,θ|,|

|,|,

−−

−−−

−−−−

−−

−−

=

=

=

∫ ∫

∫ ∫

jjposterior

jcandidateposterior

jprior

jj

candidateprior

jcandidate

priorprior

jprior

jprior

jjpriorprior

jprior

candidateprior

jcandidate

jjposterior

jcandidateposterior

xpxp

pxppxp

ddppxpppxp

ddppxpppxp

xpxp

θθθθ

θθθθθθ

θθθθ

θθθθ

θθθθ

と の同時事後密度の比2θ1θ

Page 16: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

16

Gibbsサンプリングを利用する場合

・初期値を とする.

・ について以下を繰り返す.

⎟⎟⎠

⎞⎜⎜⎝

⎛)0(

2

)0(1

θθ

Nj ,...,1=

1. から を発生させる.),|( )1(2

−⋅ jposterior xp θ )(

1jθ

),|( )(1

jposterior xp θ⋅ )(

2jθ2. から を発生させる.

結果 を得る.⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛)(

2

)(1

)2(2

)2(1

)1(2

)1(1 ,...,, N

N

θθ

θθ

θθ

Page 17: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

17

Gibbsサンプリングの位置づけと特徴

<Single Component Metropolis-Hastingsアルゴリズムとの関係>

GibbsサンプリングはSingle Component M-Hアルゴリズムでの候補発生分布にフルの条件付き分布を設定した場合に相当する.

移動確率 が必ず1になるため,手順が簡単でかつサンプリング効率がよい方法である.

<Gibbsサンプリングの長所>

α

フルの条件付き事後分布に従う乱数を発生させる必要がある.フルの条件付き分布から乱数を直接発生させることが困難な場合は,棄却サンプリングなどを利用することが考えられる.

<Gibbsサンプリングの短所>

棄却サンプリングなどを利用してもフルの条件付き分布に従う乱数を生成することが困難な場合は,Gibbsサンプリング以外の手法に頼らざるをえないと考えられる.

Page 18: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

18

事例:2変量正規分布のシミュレーション

⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟⎠

⎞⎜⎜⎝

⎛00

)0(2

)0(1

xx

初期値 ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⋅⎟⎟⎠

⎞⎜⎜⎝

⎛−

,)1(2

)1(1

1 j

j

xx

q は,平均 ,標準偏差1の正規分布)1(1

−jx

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

⋅⎟⎟⎠

⎞⎜⎜⎝

⎛−

,)1(2

)(1

2 j

j

xx

q は,平均 ,標準偏差1の正規分布)1(2−jx

(設定)

Single Component M-Hアルゴリズムによる,平均ベクトル ,

分散共分散行列 をもつ2変量正規分布からのサンプリング

⎟⎟⎠

⎞⎜⎜⎝

⎛55

⎥⎦

⎤⎢⎣

⎡4111

最初の1000回の点の軌跡 点と発生させたい2変量正規分布の等高線

Page 19: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

19

Gibbsサンプリングによる,平均ベクトル ,分散共分散行列 をもつ2変量正規分布からのサンプリング

⎟⎟⎠

⎞⎜⎜⎝

⎛55

⎥⎦

⎤⎢⎣

⎡4111

⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟⎠

⎞⎜⎜⎝

⎛00

)0(2

)0(1

xx

初期値(設定)

最初の1000回の点の軌跡 点と発生させたい2変量正規分布の等高線

Page 20: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

20

Single Component M-Hアルゴリズム最初の1000回の点の軌跡の比較

従来法(コレスキー分解の応用)

Gibbsサンプリング

Page 21: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

21

ご紹介内容

1.ベイズ統計のMCMCとの出会い

2.ベイズ統計で最尤推定→

3.ベイズ統計と混合効果モデルの関係

4.ベイズ論文の読みかた(私案)

Page 22: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

22

ベイズ統計で最尤推定

ベイズ統計で無情報事前分布を設定した場合,得られる事後分布の密度関数は尤度関数に比例する.

( ) ( ) ( )( ) ( )∫

=θθθ

θθθθ

dpxLdpxL

xpprior

priorposterior |

||

ここで が, に依存しない定数であれば( )θpriorp θ

( )( )

( )xL

dxLxL

|

||

θ

θθθ

=∫

とくに,最尤推定値はベイズ統計で無情報事前分布を設定した場合の事後密度のモードに一致する.

Page 23: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

23

事例

確率変数 にパラメタ をもつポアソン分布,確率変数 にパラメタ をもつポアソン分布を想定したモデルをあてはめる.

( )( ) njPoY

miPoX

j

i

,,1 ,~,,1 ,~Λ

Λ=

=µθµ

Y µθµX

このとき, の最尤推定量は , の最尤推定量は となる.µ X θ XY

{ } { }2,2,1,1,1,1,0,0,7,6,6,4,2 == yx のとき,

近似的な無情報事前分布を用いたベイズ統計の枠組みで最尤推定を行った.

µ θおよび の各事前分布は とした.)100,0(U

事後分布をMCMCでシミュレーション

Burn-in回数: 500回収束後のサンプリング回数: 4500回

Page 24: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

24

事後分布(尤度関数に比例)のシミュレーション

µ の周辺密度 θ の周辺密度myu sample: 4500

2.0 4.0 6.0 8.0

0.0

0.2

0.4

0.6

theta sample: 4500

0.0 0.2 0.4 0.6

0.0

2.0

4.0

6.0

密度の最も高いところが,近似的な最尤推定値に相当する.下側2.5%点~97.5%点が95% credible intervalである.これは最尤法による95%信頼区間に相当する.

同時密度

Page 25: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

25

ご紹介内容

1.ベイズ統計のMCMCとの出会い

2.ベイズ統計で最尤推定

3.ベイズ統計と混合効果モデルの関係→

4.ベイズ論文の読みかた(私案)

Page 26: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

26

ベイズ統計と混合効果モデルの関係

Demidenko,E. (2004)の考え

混合効果モデル論 =

頻度論 ベイズ論+

Demidenko,E. (2004). A compromise between Bayesian and frequentist approaches,Mixed Models Theory and Applications,Section1.4,pp.8-11.John Wiley&Sons.

私たちの考え

混合効果モデル論頻度論 ベイズ論w 1-w

Page 27: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

27

Demidenko,E. (2004)の考え

頻度論

ベイズ論

混合効果モデル論

)|(| θyθy L~)(θθ G~

),|(| τθyθy L~),( τθθ G~

:θ:τ個体効果

集団効果

階層モデル

)|(| θyθy L~

Page 28: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

28

私たちの考え

利用できるデータが少ない経時データに対して個体ごとに切片と傾きが異なる直線をあてはめる場合で,モデルの推定可能性を検討した.

iは個体( 3,2,1=i ), jは時点を示す.頻度論

ijjiiij εxβαY +⋅+= ),0(~ 2εσε Nij

混合効果モデル論

),0(~ 2εσε Nij

ベイズ論ijjiiij εxβαY +⋅+=

ijjiiij ε)x(xβαY +−+=

),(~ 2αα σµα Ni ),(~ 2

ββ σµβ Ni

),(~ 2αα σµα Ni ),(~ 2

ββ σµβ Ni ),0(~ 2εσε Nij

)100,0(~ 2Nαµ )100,0(~ 2Nβµ事前分布 )001.0,001.0(1 2 Ga~αα στ =

)001.0,001.0(1 2 Ga~εε στ =)001.0,001.0(1 2 Ga~ββ στ =

利用可能な観測値数の組み合わせごとのモデル式の推定可能性

),,( 321 nnn(1,1,1) (2,1,1) (2,2,1) (3,2,1) (2,2,2) (3,2,2) (3,3,2) (3,3,3)

頻度論 × × × × × ○ ○ ○

混合効果モデル × × ○ ○ ○ ○ ○ ○

ベイズ統計 ○ ○ ○ ○ ○ ○ ○ ○

in は個体 で得られた観測値数とする.i

Page 29: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

29

ご紹介内容

1.ベイズ統計のMCMCとの出会い

2.ベイズ統計で最尤推定

3.ベイズ統計と混合効果モデルの関係

4.ベイズ論文の読みかた(私案)→

Page 30: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

30

ベイズ統計が登場する文献を読むためのコツ(1/2)

主観,経験,知識

尤度

モデル

事前分布

事後分布

ベイズの定理データ

1.モデルとデータ

2.興味のあるパラメタ

3.事前分布

Ⅰ.まずは以下の4つを確認する.

4.パラメタ間およびパラメタとデータ間の関係DAG(Directed Acyclic Graph)

Page 31: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

31

パラメタ間およびパラメタとデータ間の関係

DAG (Directed Acyclic Graph)に描くと頭の整理になる.

BUGSではDAGを描くと,計算プロセスが自動的にコーディングされる.

BUGS:ベイズ統計の考えに基づく計算を行うフリーのソフトウエア

Page 32: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

32

Log10(用量) 標本サイズ 死亡数1.691 59 41.724 60 101.755 62 191.784 56 311.811 63 521.837 59 531.861 62 601.844 60 60

データ(毒性試験)第 用量の常用対数変換値…

を標準化した値...

第 用量における動物数…

第 用量における死亡数…

第 用量における死亡率… kθ

kn

kmk

kk

事例.ロジスティック回帰分析

第 用量における死亡数 に二項分布 を仮定し,k ),( kk nBinomial θ

ロジスティック回帰モデル をあてはめる.k

k

θθ−1

log kxβα +=

km

に正規分布 を設定する.α )1,0( 2N

に正規分布 を設定する.β )3,0( 2N

モデル

事前分布

k kdkd kx

参考文献 :丹後俊郎(2000).統計モデル入門.朝倉書店.

Page 33: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

33

事例.ロジスティック回帰分析

用量の常用対数変換値を基準化した値を とする.kx

kd DAG

),( kkk nBinomialm θ~

k

k

θθ−1

log kxβα += 固定定数

観測される変数(データ)

の事前分布

の事前分布

)1,0( 2N~α

)3,0( 2N~β

α

β

観測されない変数

確率的な依存関係

論理的な関数

Page 34: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

34

ベイズ統計が登場する文献を読むためのコツ(2/2)

Ⅱ.次に以下を確認する.

MCMCを利用

1.MCMCアルゴリズム(詳細確認)

2.フルの条件付き事後分布(パラメタが複数個ある場合)

3.ソフトウエア

4.Burn-in回数と収束後のサンプリング回数

NO

確認内容

1.Gibbsサンプリング(自明)

2.フルの条件付き事後分布

3.BUGS(自明)

4.Burn-in回数と収束後のサンプリング回数

YES確認内容

共役事前分布の利用NO

確認内容

NO

BUGSを利用

YES

Page 35: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

35

共役事前分布

共役事前分布

二項分布

正規分布( が既知 )

指数分布

ポアソン分布

尤度関数

ベータ分布

正規分布

ガンマ分布

ガンマ分布

事前分布

ベータ分布

正規分布

ガンマ分布

ガンマ分布

事後分布同じ

分布族

参考文献:デビッド・ヴォース(長谷川 専,堤 盛人 訳)(2003).入門リスク分析.勁草書房.

Page 36: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

36

代表的なMCMCアルゴリズム:確認すべき内容

BUGS以外でMCMCを利用している場合利用アルゴリズムと以下の内容を確認にする.

M-Hアルゴリズム

Single Component M-Hアルゴリズム

Gibbsサンプリング

候補発生分布

候補発生分布フルの条件付き分布

フルの条件付き分布フルの条件付き分布からの1変量乱数発生方法

MCMCアルゴリズム 確認内容

Page 37: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

37

ご紹介内容

1.ベイズ統計のMCMCとの出会い

2.ベイズ統計で最尤推定

3.ベイズ統計と混合効果モデルの関係

4.ベイズ論文の読みかた(私案)

詳細釣り合い,階層モデルについても言及したかったのですが,今回は時間の都合もあり割愛させていただきました.

Metropolis-Hastingsアルゴリズムを私たちなりに解剖したスライドをご参考までに添付いたします.

Page 38: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

38

Metropolis-Hastingsアルゴリズム

密度関数 をもつ分布に従う乱数を生成する.)(⋅π

・初期値を とする.・ について以下を繰り返す.

1. から , から を生成する.

2. であれば, とおく.

ここに, である(数学的に厳密な表現はあえて避けた).

3.そうでなければ とおく.

・結果 を得る.

)0(xNj ,..,2,1=

),( )1( ⋅−jxq y )1,0(U

),( )1( yxu j−≤α yx j =)(

)1()( −= jj xx

⎭⎬⎫

⎩⎨⎧

= −−

−−

),()(),()(,1min),( )1()1(

)1()1(

yxqxxyqyyx jj

jj

ππα

{ })()2()1( ,...,, Nxxx

このアルゴリズムは候補発生密度 により特定される.),( )1( ⋅−jxq

Chib,S. and Greenberg,E.(1995).Understanding the Metropolis-Hastings Algorithm, The American Statistician,49,327-335.

Page 39: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

39

Metropolis-Hastingsアルゴリズムの骨子

密度関数 をもつ分布に従う乱数を生成する.)(⋅π

1. に依存する密度 をもつ分布から を発生させ,

確率 で とする.

2.そうでなければ, とする.

beforex ),( ⋅beforexq y

),( yxbeforeα yxafter =

beforeafter xx =

ここに, である(数学的に厳密な表現はあえて避けた).⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

=),()(

),()(,1min),(

yxqxxyqy

yxbeforebefore

beforebefore π

πα

「 から への推移」の密度:beforex y ),(),( yxyxq beforebefore α

Page 40: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

40

詳細釣り合い(detailed balance)

次の詳細釣り合いの等式を満たすとき,密度 をもつ分布は,

「 から への推移」の密度

で決まるマルコフ連鎖の定常分布である.

)(⋅π

beforex y ),( yxR before

),()(),()( beforebeforebefore xyRyyxRx ππ =

の密度beforex 「 から への推移」の密度

beforex y

Page 41: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

41

Metropolis-Hastingsアルゴリズムは詳細釣り合いを満たす.

Metropolis-Hastingsアルゴリズムでは,

),( yxR before ),(),( yxyxq beforebefore αは である.「 から への推移」の密度beforex y

{ }

),()(

1,),()(

),()(min),()(

),()(),,()(min

),()(),()(

,1min),()(

),(),()(),()(

before

before

beforebeforebefore

beforebeforebefore

beforebefore

beforebeforebefore

beforebeforebeforebeforebefore

xyRy

xyqyyxqx

xyqy

xyqyyxqx

yxqxxyqy

yxqx

yxyxqxyxRx

π

ππ

π

ππ

ππ

π

αππ

=

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

=

=

⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

=

=

すなわち,密度 をもつ分布は,「 から への推移」の密度が

であるマルコフ連鎖の定常分布である.

)(⋅π beforex y),(),( yxyxq beforebefore α

Page 42: ベイズ統計学のMCMCとの出会い ご紹介内容 →1.ベイズ統計のMCMCとの出会い 2.ベイズ統計で最尤推定 3.ベイズ統計と混合効果モデルの関係

42

詳細釣り合いが満足されていれば,あるサンプルが定常分布からいったんサンプリングされると,その後のサンプルはすべてその定常分布からのものとなる.

詳細釣り合い

定常分布が存在すればそれが である)(⋅π