ibm 東京基礎研究所 井手剛

20
| 2007/08/20 | ICML 2007 をををを @ ををを Tokyo Research Laboratory © Copyright IBM Corporation 2007 “Regression on Manifolds using Kernel D imension Reduction” by Jens Nilsson, Fei Sha, and Michael I. Jordan IBM ををををををを ををを

Upload: nash-mclaughlin

Post on 03-Jan-2016

18 views

Category:

Documents


2 download

DESCRIPTION

“Regression on Manifolds using Kernel Dimension Reduction” by Jens Nilsson, Fei Sha, and Michael I. Jordan. IBM 東京基礎研究所 井手剛. 概要 ── 次元削減モノ。教師あり次元削減と、教師なし次元削減を組み合わせた点に新規性を主張。. 次元削減には 2 流派ある 教師なし データ X の分布( or 多様体)をうまく表すような座標を求める PCA 、 Isomap 、 Laplacian eigenmap 、 LLE 、... 教師あり - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

“Regression on Manifolds using Kernel Dimension Reduction” by Jens Nilsson, Fei Sha, and Michael I. Jordan

IBM 東京基礎研究所井手剛

Page 2: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 2

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

概要 ── 次元削減モノ。教師あり次元削減と、教師なし次元削減を組み合わせた点に新規性を主張。

次元削減には 2 流派ある 教師なし

• データ X の分布( or 多様体)をうまく表すような座標を求める• PCA 、 Isomap 、 Laplacian eigenmap 、 LLE 、...

教師あり• ラベル情報と矛盾しない写像を求める• FDA 、 LFDA 、その他

両者の組み合わせ• SELF (semi-supervised LFDA)

- M. Sugiyama et al., Technical report TR07-0006, http://www.cs.titech.ac.jp/~tr/reports/2007/TR07-0006.pdf

- ラベルが分かっているものについては LFDA 、そうでないものは PCA• ほか

この仕事は次の二つの次元削減手法の組み合わせ 教師なし: Laplacian eigenmap 教師あり : 福水さんのカーネル次元削減

Page 3: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 3

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

目次

カーネル次元削減とは

Laplacian eigenmap とは

どう組み合わせるのか

実験結果は?

Page 4: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 4

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

カーネル次元削減とは

Page 5: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 5

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

「十分な次元削減」( sufficient dimension reduction; SDR )。カーネル次元削減は SDR の一種。回帰関係を表すために最も「かけがえのない」部分空間を探す。

SDR は教師あり次元削減の一種 確率変数 X と Y が、何か強い結びつきを持つと仮定

• 回帰直線の周りにばらつくとか 直交射影の行列 B を使って、 X を狭めてみる

Z = BTX Z が動く範囲を S とする

SDR の問いかけ: 「もし S を失ったら、どれだけ Y と X は無関係になってしまうだろうか?」

「 S を失った結果、 Y と X が無関係になってしまう」 = 「 S はかけがえのないもの」

Z を与えた時に Y と X が条件付き独立になってしまうように、 B を選べばよい

Page 6: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 6

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

条件付き独立性の成立を、条件付き共分散行列の等式に帰着させる

「条件付き独立性を言うためには、 X と Y の同時分布がいるのでは?(問題を簡単にしてないのでは)?」という心配は要らない

確率モデルの仮定が要らぬ、というのが SDR および KDR のキモ。

論文の定理 1 (の半分): 条件付き独立性は、条件付き共分散行列の等式と同値

つまり、 この等式を満たすような B (射影行列)を求めればよい• でもそれを直接やるのは難しい

Page 7: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 7

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

等式を満たすのをあきらめて、「できる限り最善な」 B を求める

条件付き共分散行列についての性質: 「制約をゆるめるとばらつきの余地は大きい」 「制約が厳しいとばらつきの余地は小さい」

結局、 を B について「最小化」すればいい

残る問題 Z = BTX を使って を B についてパラメトライズするなんてできるのか 行列もしくは演算子の大きさの尺度をどう測るのか

直感的には、Z を与えた時の Y のばら

つき

Page 8: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 8

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

条件付き共分散行列を、条件なしのものを使って「展開」する

条件付き共分散行列(演算子)は、条件なしのものを使って書ける

• X とありますが、 Z のことです

ガウシアンを条件付けた時の共分散と同じ形をしているが、これは分布によらずに一般に成り立つ

証明は福水さんの論文たちに書いてある• Fukumizu et al. JMLR 2004• Fukumizu et al. 2006• 数学的にハイレベルだが、証明をフォローすることはなんとか可能

Page 9: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 9

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

条件なしの共分散行列をグラム行列で表す

条件付き共分散行列(演算子)は、条件なしのものを使って書ける

単純作業でグラム行列(中心化しておく)に書き換えることができる

Page 10: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 10

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

KDR の目的関数の完成条件付き共分散行列の大きさは Trace で測ることにする

単純作業でグラム行列(中心化しておく)に書き換えることができる

さらに簡単化する ノリ的には次のような式を使ったと思えばいい

行列の大きさはトレースで測ることにする 結局、条件付き独立性の条件は下記に帰着される

Page 11: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 11

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

Laplacian eigenmap とは

Page 12: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 12

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

原論文から (1/2) : M. Belkin and P. Niyogi, "Laplacian eigenmaps and spectral techniques for embedding and clustering", NIPS 2001

元の座標 x1 、 x2 、...から、新しい座標 y1 、...を求めたい。その時の目的関数

つまり、「集団移住した後でも近所のつながりを大切にする」

2 乗誤差の目的関数はグラフ・ラプラシアンを使って書き直せる 要するにこれを最小化すればいい

Page 13: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 13

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

原論文から (2/2): 一般化固有値問題として解ける

下記の最適化問題を解く

条件 1 : スケーリングの任意性を省く 条件 2: ゼロ固有値の解を省く

解は固有値最低のものから M 個の固有ベクトル ただし、ゼロ固有値(最小)は省く

Page 14: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 14

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

どう組み合わせるのか

Page 15: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 15

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

基本的に、 Laplacian eigenmap で次元削減されたデータに KDR を行うだけ

Laplacian eigenmap でもとの座標 xi を、 M 次元の座標に変換 M 本の固有ベクトルから作った M 次元データのデータ行列を U とする ui が新座標

そのデータ U から、 KDR により第 2 弾の次元削減写像を求める。 d 次元 Φui が新々座標

解くべきなのは下記

非線形、非凸。

射影勾配法で解く。

Page 16: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 16

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

実験結果は?

Page 17: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 17

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

実験結果 1地表面温度

もともとは 2 次元の問題 温度 Y vs 地表の位置 X

1 段目での次元削減 M=100

2 段目の次元削減 d=1

きれいな線形相関

次元「削減」としてはつまらないが、削減した座標により再現誤差を描いてみると、異常気象が分かる、らしい

Page 18: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 18

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

実験結果 2スノーマンの画像を回転してみる

本当の自由度は 4 回転角と傾き角、ずらし量(タテヨコ) 画像は 110×80 、 1000 枚

回転角( Y ) vs ピクセル強度( X )、のような回帰関係を設定したらしい。

Page 19: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 19

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

感想

Page 20: IBM 東京基礎研究所 井手剛

| 2007/08/20 | ICML 2007 を読む会 @ 大岡山Page 20

Tokyo Research Laboratory

© Copyright IBM Corporation 2007

感想

KDR は普通使われるような誤差基準とはちょっと毛色が変わっていて面白い 福水さんの論文についてはもうちょっと勉強の必要あり

この論文の組み合わせ方には、あまり感銘を受けなかった。 ただ福水さん論文に寄りかかっているだけ、という感じがした。

実験結果も、興味深いのか深くないのかよくわからなかった。