nips2013読み会:inverse density as an inverse problem: the fredholm equation approach

29
Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献 . Inverse Density as an Inverse Problem: The Fredholm Equation Approach Qichao Que, Mikhail Belkin 発表者:大野健太 ([email protected]) 株式会社 Preferred Infrastructure NIPS2013 読み会, 2014/01/23, @東京大学 発表者:大野健太 ([email protected]) 株式会社 Preferred Infrastructure Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Upload: kenta-oono

Post on 05-Jul-2015

879 views

Category:

Technology


5 download

DESCRIPTION

2014年1月23日:NIPS2013読み会での大野担当分発表資料 Inverse Density as an Inverse Problem: The Fredholm Equation Approach

TRANSCRIPT

Page 1: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

.

Inverse Density as an Inverse Problem: TheFredholm Equation Approach

Qichao Que, Mikhail Belkin

発表者:大野健太 ([email protected])

株式会社 Preferred Infrastructure

NIPS2013読み会, 2014/01/23, @東京大学

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 2: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

資料置き場

今日のスライドは SlideShareに置いてあります。• http://www.slideshare.net/KentaOono/

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 3: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

大野健太 (@delta2323 )

• Twitter:@delta2323• サイト:https://sites.google.com/site/kentaoono0/• 出身:数学科(数理科学研究科)• 現職:PFI所属、バイオプロジェクトリーダー

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 4: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

論文概要 [8]

• 密度比推定問題を第 1種 Freedholm方程式に変形• これを Inverse Problemとして解く推定方法、FIREを提案

• FIRE = Fredholm Inverse Regularized Estimator• 密度比推定問題:分布 p, qからサンプリングされたデータ点達から、その商 p/qを推定する問題。

• (もちろん)理論保証あり• 推定で利用するカーネルが”local”ならば、分母 qの制限を弱められ、しかも理論的な近似の精度は良くなる。

• カーネルが”local”:!

kt(x , y)f (y)dy = f (x) + O(t)• 今回はこちらは詳しくは触れません。

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 5: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

応用 1:Importance Sampling(参考:PRML, 11.1.4章) I

確率が低い点で大きな値を取る関数の期待値をナイーブなサンプリングで推定すると、分散が大きくなる。→ 期待値を取る確率を都合の良いものに取り替えて分散を抑える。

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 6: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

応用 1:Importance Sampling(参考:PRML, 11.1.4章) II

適当な関数 f : Rd → Rに対し、次の計算を考える

EX∼p[f (X )] :="

Ωf (x)p(x)dx (1)

f (x)とピークの位置が近い別の分布 qを用意し、次のように変形

Ep[f (X )] ="

Ωf (x)p(x)dx =

"

Ωf (x)p(x)

q(x)q(x)dx = Eq

#f (x)p(x)

q(x)

$

(2)pの代わりに、qから点をサンプリングする。

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 7: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

応用 2:共変量シフト・バイアスサンプリング [2], [4] I

訓練データとテストデータを生成する分布が異なる状況で機械学習を行う手法。応用:転移学習(Transfer Learning)など

[10]より引用

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 8: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

応用 2:共変量シフト・バイアスサンプリング [2], [4] II

設定• 訓練データ:xi , yi

i.i.d.∼ p (i ∈ [N])• テストデータは分布 qから得られる

• 分布 pとは異なるかもしれない• ℓ : R × R → R : 損失関数(例:ℓ(y , y ′) = (y − y ′)2)• f : Ω → R:予測関数(例:f (x) = wtx)

目標テストデータでの損失の期待値の最小化

argminf E(x ,y)∼q(ℓ(f (x), y)) = E(x ,y)∼p

#ℓ(f (x), y)q(x , y)

p(x , y)

$(3)

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 9: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

関連研究密度比推定手法はこれまで様々な手法が提案されている。詳しくは東工大杉山先生のMLSS2012の講演資料 [10]参照

• Kernel Density Estimation• Parzen―Rosenblatt window method [7]

• Inverse Problem [3]• Probabilistic Classification• Moment Matching

• Kernel Mean Matching(KMM) [4]• Density Fitting

• Kullback-Leibler Importance EstimationProcedure(KLIEP) [11]

• Density Ratio Fitting• Least-Squares Importance Fitting(LSIF) [5],

Constrained/Unconstrained LSIF発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 10: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

関数解析関係

詳細は関数解析などの教科書を参照• ヒルベルト空間と内積・ノルム• 正定値カーネルと再生核ヒルベルト空間の関係• Representer定理

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 11: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

第 1種 Fredholm方程式とTikhonov-Phillips正則化 I

Q. H1, H2:ヒルベルト空間, K : H1 → H2:線形作用素(コンパクト作用素を要請する事も)、g ∈ H2に対して方程式

Kf = g (4)

を満たす f を求めたい。特にカーネル関数 k : Rd × Rd → Rに対して

(Kf )(x) =" b

ak(x , y)f (y)dy (5)

となっているものを(第 1種)Fredholm方程式という。

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 12: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

第 1種 Fredholm方程式とTikhonov-Phillips正則化 II

一般的には、この方程式の解は存在するとは限らないので、それに”近い”解を次のように決める。λ > 0に対して、

argminf ∥Kf − g∥2H2 + λ∥f ∥2

H1 (6)

これを Tikhonov-Phillips正則化という。適当な条件で、これが元の方程式の解に収束する事に関しては [1], [6]などを参照。

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 13: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

問題設定

Notation• Ω ⊂ Rd

• p, q : Ω → R : 分布• Xp = xp

1 , . . . , xpN : pから iidでサンプリング

• Xq = xq1 , . . . , xq

M : qから iidでサンプリング• サンプリングを利用するのは以下の 2つの場面

• 関数 f : Ω → Rに対して、!Ω

f (x)p(x)dx ,!Ω

f (x)q(x)dx が求める or 推定する。

• Representer定理の利用目標

• x ∈ Ωに対して、p(x)/q(x)を推定したい。

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 14: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

ナイーブな方法

p(x), q(x)を直接推定してそれの商を取る。

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 15: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

ポイント

適当なカーネル関数 k : Ω × Ω → Rに対して以下の等式は自明。"

Ωk(x , y)q(y)

p(y)p(y)dy ="

Ωk(x , y)q(y)dy (7)

(Kpf ) (·) := !Ω k(·, y)f (y)p(y)dy (resp. Kq)とすると、この式は

Kpqp = Kq1Ω (8)

となる(ここで、1Ωは定数関数 1)• Kq は計算可能 → この方程式は第 1種 Fredholm方程式

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 16: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

q/pの推定

今作った Fredholm方程式を Tikhonov-Phillips正則化を用いてapproximateに解くと、λ > 0ごとに、

qp ∼ argminf ∈H∥Kpf − Kq1Ω∥2 + λ∥f ∥2

H (9)

という近似が得られる(ただし、Hはカーネル k の再生核ヒルベルト空間)。これをさらに近似して、計算できるようにする。

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 17: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

T-P正則化解の近似

まず、p, qそれぞれから iidにサンプリングしたデータ点 Xp, Xqを用いて、

Kpf ∼ 1N

N%

i=1k(·, xp

i )f (xpi ) (10)

Kq1Ω ∼ 1M

M%

j=1k(·, xq

j )1Ω(xqj ) (11)

と近似する

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 18: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

Representer定理を用いた明示的な解の構成Representer定理より、argminHの解 q/pは

qp ∼

N%

i=1k(·, xp

i )vi (v = (v1, . . . , vN)T ∈ Rd) (12)

という形をしてなければならない。

(Kpp)ij =1N k(xp

i , xpj ) (i , j ∈ [N]) (13)

(Kpq)ij =1M k(xp

i , xqj ) (i ∈ [N], j ∈ [M]) (14)

(KH)ij = kH(xpi , xp

j ) (i , j ∈ [N]) (15)

とおくと、この vは以下のように具体的に計算できる。

v = (K2ppKH + nλI)−1Kpq1q (16)

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 19: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

ガウスカーネル使用時の誤差評価 [9]評価すべき誤差:近似による誤差+サンプリングによる誤差

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 20: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

実験評価方法

• 教師なし学習(モデル選択の精度を図る指標を定義しその大小で評価)

• 予測関数:Linear, Half-space, Kernel, K-indicator, Coord• 教師あり学習(回帰・分類)

• データセット:Bank8FM, CPUsmall and Kin8nm(回帰)、USPS and 20 news groups(分類)

• サンプリング:分布 pに対してはデータをそのまま使い、分布 qに対してはそこからリサンプリング(2通り)したデータを使用

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 21: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

実験(モデル選択) [9]

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 22: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

実験(モデル選択) [9]

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 23: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

実験(回帰) [9]

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 24: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

実験(分類) [9]

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 25: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

感想

• 密度比推定で問題になるのは高次元で動かなくなる事。このアルゴリズムではどのくらいの高次元まで耐えられる?

• 誤差評価はガウスカーネルの時しかなかった。一般のカーネルでの誤差評価はどうなる?

• 密度比推定の方法は既に数多く提案されている。この論文の貢献部分は Stabilityがある Inverse Problemの手法を開発した事か?

• 密度比推定の手法の多くは最適化問題に帰着させ、iterationで精度を上げる一方で、この手法は推定値を explicitに計算できている

• 最適化問題に帰着した場合に比べて計算速度はどのくらい速い?

• サンプリング数が精度にダイレクトに影響しそう

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 26: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

参考文献 I

Stephan W Anzengruber and Ronny Ramlau.Morozov’s discrepancy principle for tikhonov-type functionalswith nonlinear operators.Inverse Problems, 26(2):025001, 2010.Corinna Cortes, Mehryar Mohri, Michael Riley, and AfshinRostamizadeh.Sample selection bias correction theory.In Proceedings of the 19th International Conference onAlgorithmic Learning Theory, ALT ’08, pages 38–53, Berlin,Heidelberg, 2008. Springer-Verlag.

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 27: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

参考文献 II

P. Eggermont and V. LaRicca.Maximum smoothed likelihood density estimation for inverseproblems.Annals of Statistics, 23:199–220, 1995.Jiayuan Huang, Alexander J. Smola, Arthur Gretton,Karsten M. Borgwardt, and Bernhard Scholkopf.Correcting sample selection bias by unlabeled data.In NIPS, pages 601–608, 2006.Takafumi Kanamori, Shohei Hido, and Masashi Sugiyama.A least-squares approach to direct importance estimation.Journal of Machine Learning Research, 10:1391–1445, 2009.

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 28: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

参考文献 III

Encyclopedia of Mathematics.Tikhonov-Phillips regularization.Emanuel Parzen.On estimation of a probability density function and mode.The Annals of Mathematical Statistics, 33(3):pp. 1065–1076,1962.Qichao Que and Mikhail Belkin.Inverse density as an inverse problem: the fredholm equationapproach.In NIPS, pages 1484–1492, 2013.

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach

Page 29: NIPS2013読み会:Inverse Density as an Inverse Problem: The Fredholm Equation Approach

Introduction 応用 予備知識 問題設定 アルゴリズム導出 実験 考察 参考文献

参考文献 IV

Qichao Que and Mikhail Belkin.Inverse density as an inverse problem: The fredholm equationapproach.CoRR, abs/1304.5575, 2013.Masashi Sugiyama.Density Ratio Estimation in Machine Learning.Masashi Sugiyama, Shinichi Nakajima, Hisashi Kashima, Paulvon Bunau, and Motoaki Kawanabe.Direct importance estimation with model selection and itsapplication to covariate shift adaptation.In John C. Platt, Daphne Koller, Yoram Singer, and Sam T.Roweis, editors, NIPS. Curran Associates, Inc., 2007.

発表者:大野健太 ([email protected]) 株式会社 Preferred InfrastructureInverse Density as an Inverse Problem: The Fredholm Equation Approach