グラフィカルモデルと確率的推論kazu/ecei-experimentd/2011/s… ·...
TRANSCRIPT
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
.
.
. ..
.
.
グラフィカルモデルと確率的推論
片岡 駿
東北大学大学院情報科学研究科応用情報科学専攻 D1
1 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
目次
.. .1 はじめに
.. .2 グラフィカルモデル
.. .3 確率伝搬法
.. .4 マルコフ連鎖モンテカルロ法
2 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
目次
.. .1 はじめに
.. .2 グラフィカルモデル
.. .3 確率伝搬法
.. .4 マルコフ連鎖モンテカルロ法
2 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
やること
.確率を使った情報処理 (確率的推論)..
.
. ..
.
.
sum rule: P(Y) =∑
X
P(X, Y)
product rule: P(X, Y) = P(X | Y)P(Y)
の繰り返し
⇒多くの問題では計算量が大きいため計算が実行できない⇒近似アルゴリズムを使う
...1 グラフィカルモデル:確率分布のグラフ表現
...2 確率伝搬法:メッセージ伝搬による近似
...3 マルコフ連鎖モンテカルロ法:乱数サンプリングによる近似
3 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
目次
.. .1 はじめに
.. .2 グラフィカルモデル
.. .3 確率伝搬法
.. .4 マルコフ連鎖モンテカルロ法
4 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
グラフィカルモデル
.グラフィカルモデル..
.
. ..
.
.
確率分布のグラフ表現
確率変数の条件付独立性をグラフの分離性と対応させたもの
...1 無向グラフでの表現⇒マルコフネットワーク
...2 有向非巡回グラフでの表現⇒ベイジアンネットワーク
5 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
条件付独立
.条件付独立..
.
. ..
.
.
確率変数の集合 X,Y ,Zに対して
P(X, Y | Z) = P(X | Z)P(Y | Z)
が成立するとき,確率変数 X,Y は確率変数 Zのもとで条件付独立とよび,XyY | Zで表す
6 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
グラフ
V:集合,Eu ⊆ {{x, y} | x, y ∈ V , (x , y)}, Ed ⊆ {(x, y) | x, y ∈ V , (x , y)},ただし (xi, xi+1) ∈ Ed(i = 1, . . . , k)⇒ (xk+1, x1) < Ed
.無向グラフ..
.
. ..
.
.
組 (V ,Eu)
頂点:V の要素
辺:Euの要素
� �
� �
.有向非巡回グラフ..
.
. ..
.
.
組 (V ,Ed)
頂点:V の要素
有向辺:Edの要素
� �
� �
7 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
グラフの分離 1
無向グラフ (V ,Eu)において {xi, xi+1} ∈ Eu(i = 1, . . . , k)であるとき{x1, . . . , xk+1}を x1, xk+1を結ぶ経路とよぶ.無向グラフの分離..
.
. ..
.
.
経路 {x1, . . . , xk+1}において xj ∈ Z ⊆ V(1 < j < k + 1)であるとき Zは経路を分離するという
X, Y ⊆ V を結ぶ任意の経路を Zが分離するとき Zは X,Y を分離するといい,⟨X |Z|Y⟩Gとかく
8 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
グラフの分離 2-1
有向非巡回グラフ (V ,Ed)において
(xi, xi+1) ∈ Edまたは (xi+1, xi) ∈ Ed(i = 1, . . . , k)であるとき{x1, . . . , xk+1}を x1, xk+1を結ぶ無向経路とよぶ
(xi, xi+1) ∈ Ed(i = 1, . . . , k)であるとき {x1, . . . , xk+1}を x1, xk+1
を結ぶ有向経路とよぶ
xから yへの有向経路が存在するとき yを xの子孫とよび,xの子孫の集合を D(x)で表す
9 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
グラフの分離 2-2
.有向非巡回グラフの分離..
.
. ..
.
.
無向経路 {x1, . . . , xk+1}において xj ∈ Z ⊆ V(1 < j < k + 1)が次のいずれかの条件を満たすとき Zは無向経路を分離するという
...1 (xj−1, xj), (xj, xj+1) ∈ Ed または (xj, xj−1), (xj+1, xj) ∈ Ed
...2 (xj, xj−1), (xj, xj+1) ∈ Ed
...3 (xi−1, xi), (xi+1, xi) ∈ Ed かつ ({xi} ∪ D(xi)) ∩ Z = ϕ
X, Y ⊆ V を結ぶ任意の無向経路を Zが分離するとき Zは X,Yを分離するといい,⟨X |Z|Y⟩Gとかく
10 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
確率モデルのグラフ表現
X, Y , Z ⊆ V を確率変数の集合とみなす.マルコフネットワーク..
.
. ..
.
.
無向グラフ (V ,Eu)が次の条件を満たすときグラフ (V ,Eu)をマルコフネットワークという
⟨X |Z|Y⟩G ⇒ XyY | Z:Imap
任意の E ⊂ Euに対して無向グラフ (V ,Eu)が Imapでない
.ベイジアンネットワーク..
.
. ..
.
.
有向非巡回グラフ (V ,Ed)が次の条件を満たすときグラフ (V ,Ed)をベイジアンネットワークという
⟨X |Z|Y⟩G ⇒ XyY | Z:Imap
任意の E ⊂ Edに対して有向非巡回グラフ (V ,Ed)が Imapでない
11 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
マルコフネットワークの例
P(x) =1Z
exp{− 1
2(x1 − x2)2 − 1
2(x2 − x3)2 − 1
2(x1 − x4)2 − 1
2(x2 − x5)2
− 12
(x3 − x6)2 − 12
(x4 − x5)2 − 12
(x5 − x6)2 − 12
(x4 − x7)2
− 12
(x5 − x8)2 − 12
(x6 − x9)2 − 12
(x7 − x8)2 − 12
(x8 − x9)2}
� � �
�� �
� �
12 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
ベイジアンネットワークの例
P(x) = P(xD)P(xI)P(xG | xD, xI)P(xS | xI)P(xL | xG)
���������� ���������
���� ���
������
13 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
目次
.. .1 はじめに
.. .2 グラフィカルモデル
.. .3 確率伝搬法
.. .4 マルコフ連鎖モンテカルロ法
14 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
確率伝搬法
.確率伝搬法..
.
. ..
.
.
メッセージにより周辺確率分布を近似
メッセージの更新式にしたがってメッセージを計算
木構造の確率モデルなら厳密
15 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
因子グラフ
a ∈ M ⊆ 2V として確率分布が
P(x) =1Z
∏a∈M
fa(xa)
の形にかける場合を考える,xa:aに含まれる要素に対応する確率変数,Z:規格化定数EM = {(i, a) | i ∈ a, a ∈ M}.因子グラフ..
.
. ..
.
.
組 (V ,M,EM)
変数頂点:V の要素
因子頂点:Mの要素辺:EMの要素
� �
�
�
16 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
周辺確率分布の近似
確率伝搬法ではメッセージ µa→i(xi), µi→a(xi)を導入し,周辺確率を次のように近似する
∑x\xi
P(x) = P(xi) ≃1Zi
∏a∈∂iµa→i(xi)
∑x\xa
P(x) = P(xa) ≃ 1Za
fa(xa)∏i∈∂aµi→a(xi)
�
�
�
17 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
メッセージに関する連立方程式 1
メッセージは以下の連立方程式の解として与えられる
µi→a(xi) =1
Zia
∏b∈∂i\a
µb→i(xi)
µa→i(xi) =1
Zai
∑xa\xi
fa(xa)∏
j∈∂a\iµj→a(xj)
�
�
�
�
18 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
メッセージに関する連立方程式 2
変数頂点から因子頂点へのメッセージ µi→aを消去した式
µa→i(xi) =1
Zji
∑xa\xi
fa(xa)∏
j∈∂a\i
∏b∈∂j\a
µb→j(xj)
�
�
�
�
19 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
マルコフネットワークの例
P(x) =1Z
exp{−1
2(x1 − x2)2 − 1
2(x2 − x3)2 − 1
2(x1 − x4)2 − 1
2(x2 − x5)2
−12
(x3 − x6)2 − 12
(x4 − x5)2 − 12
(x5 − x6)2 − 12
(x4 − x7)2
−12
(x5 − x8)2 − 12
(x6 − x9)2 − 12
(x7 − x8)2 − 12
(x8 − x9)2}
� � �
�� �
� �
20 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
ベイジアンネットワークの例
P(x) = P(xD)P(xI)P(xG | xD, xI)P(xS | xI)P(xL | xG)
���������� ���������
���� ���
������
21 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
目次
.. .1 はじめに
.. .2 グラフィカルモデル
.. .3 確率伝搬法
.. .4 マルコフ連鎖モンテカルロ法
22 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
マルコフ連鎖モンテカルロ法
.マルコフ連鎖モンテカルロ法 (MCMC)..
.
. ..
.
.
マルコフ連鎖を利用して確率分布から乱数をサンプリングする方法
適当な乱数から必要な確率分布の乱数をサンプリング
誤差:O(1/√
N)
期待値計算は独立な乱数 {x1, . . . , xN}をサンプリングすることで
∑x
f (x)P(x) ≃ 1N
N∑i=1
f (xi)
と近似できる
23 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
マルコフ連鎖
.マルコフ連鎖..
.
. ..
.
.
確率変数の系列 x1, x2, . . . , xMとm ∈ {1, 2, . . . ,M − 1}に対して,条件付独立性
P(xm+1 | x1, . . . , xm) = P(xm+1 | xm)
が成立するもの
xm+1の周辺確率分布は系列の一つ前の変数 xmの周辺確率分布をもちいて表される
P(xm+1) =∑xm
P(xm+1, xm) =∑xm
P(xm+1 | xm)P(xm)
P(xm+1 | xm)は遷移確率と呼ばれる
24 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
不変分布
.不変分布..
.
. ..
.
.
遷移確率が P(x′ | x)で与えられるマルコフ連鎖において,ある確率分布 P∗(x)が
P∗(x′) =∑
x
P(x′ | x)P∗(x)
を満たすとき,P∗(x)を不変分布と呼ぶ
25 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
平衡分布
.平衡分布..
.
. ..
.
.
初期分布 P(x0)の選択にかかわらず
P(xm+1) =∑xm
P(xm+1 | xm)P(xm)
の操作を繰り返して,m→ ∞で不変分布 P∗(x)に収束するとき,この不変分布を平衡分布と呼ぶ
.詳細釣り合い..
.
. ..
.
.
求めたい分布 PW(x)が不変分布であるための十分条件
P(x | x′)PW(x′) = P(x′ | x)PW(x)
26 / 27
. .はじめに
. . . . . . . . . .グラフィカルモデル
. . . . . . . .確率伝搬法
. . . . . .マルコフ連鎖モンテカルロ法
ギブスサンプリング(MCMCの一例)
分布 PW(x)から乱数をサンプリングする...1 一様分布から z(0) =
(z(0)
0 , . . . , z(0)M
)をサンプリング
...2 t = 1, . . . , τに対して以下を行う
1. i = 1, . . . ,N に対して遷移確率
P(zi|z(t)
1 , . . . , z(t)i−1, z
(t−1)i+1 , . . . , z
(t−1)M
)=
PW
(z(t)
1 , . . . , z(t)i−1, zi, z
(t−1)i−1 , . . . , z
(t−1)M
)∑
ziPW
(z(t)
1 , . . . , z(t)i−1, zi, z
(t−1)i+1 , . . . , z
(t−1)M
)を計算し,z(t)
i をサンプリングする2. 系列 xt =
(z(t)
0 , . . . , z(t)M
)を返す
...3 十分大きな Tに対して,系列 xt(t > T)から十分な間隔をあけてサンプリングする
マルコフ連鎖からの連続したサンプルは高い相関を持つ
27 / 27