再生核ヒルベルト空間を...

40
1 再生核ヒルベルト空間を 用いた非線形データ解析法 情報・システム研究機構 統計数理研究所 (兼)総合研究大学院大学 福水 健次

Upload: others

Post on 25-Feb-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

1

再生核ヒルベルト空間を用いた非線形データ解析法

情報・システム研究機構 統計数理研究所

(兼)総合研究大学院大学

福水 健次

Page 2: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

2

Outlineイントロダクション

正定値カーネルと再生核ヒルベルト空間

正定値カーネルによるデータ解析 ~ カーネル法 ~

独立性、条件付独立性と再生核ヒルベルト空間

カーネル正準相関分析の統計的性質

おわりに-

Page 3: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

3

イントロダクション

線形のデータ解析古典的なデータ解析

データの行列表現

⇒ 線形の処理 (主成分分析,正準相関分析,線形回帰...)

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

=

Nm

N

m

m

XX

XX

XX

X

1

221

111

m 次元 N 点のデータmN×∈ R

Page 4: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

4

線形データ解析の例線形回帰分析

線形識別(2クラス)

問題データを説明するのに最適な超平面 y = aTx + b を求めよ

X

Y

問題赤: クラス1に属するデータ青: クラス2に属するデータ

2クラスを識別するのに最適な超平面 aTx + b = 0 を求めよ

Page 5: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

5

線形回帰の解

最適性の基準設定 最小2乗誤差

このとき、2乗誤差 =

線形なデータ解析を支えるもの

内積(相関)の計算 + 線形代数 + α

線形で十分か?

∑ = −Ni

iTi

aXaY1

2min

[ ]XaXaXaYYY TTTT

a+− 2min

( ) YXXXa TT 1ˆ

−=

(簡単のため b 省略)

YXXXXYYY TTTT 1)( −−

Page 6: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

6

非線形データ解析の重要性

-6 -4 -2 0 2 4 6-6

-4

-2

0

2

4

6

線形識別不能

0

5

10

15

20 0

5

10

15

20

-15

-10

-5

0

5

10

15

線形識別可能

)2,,(),,( 2122

21321 xxxxzzz =

Page 7: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

7

カーネル法の概略高次元空間への写像を構成する方法論

データを高次元のヒルベルト空間(一般には無限次元)へ写像し、解析しやすいデータに変換する。

カーネル法:

H内のデータに変換した後で線形の手法を用いる

H として再生核ヒルベルト空間を用いる

xiΦ(xi) zi

Ω

H→ΩΦ : 変換写像

Ω : もとのデータの空間

H : 高次元ベクトル空間

Page 8: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

8

正定値カーネルと再生核ヒルベルト空間

Page 9: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

9

正定値カーネル

正定値カーネルΩ:集合.

k(x,y) が Ω 上の正定値カーネルであるとは,次の2つを満たすことをいう

1.(対称性) k(x,y) = k(y,x)2.(正定値性) 任意の自然数 n と,任意のΩ の点 x1, …, xn に対し,

が(半)正定値.すなわち,任意の実数 c1,…, cn に対し,

対称行列 のことを,グラム行列と呼ぶ

0),(1,

≥∑ =

n

ji jiji xxkcc

( )njiji xxk

1,),(

=

R→Ω×Ω:k

( )njiji xxk

1,),(

= ⎟⎟⎟

⎜⎜⎜

⎛=

),(),(

),(),(

1

111

nnn

n

xxkxxk

xxkxxk

n×n 行列

Page 10: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

10

正定値カーネルの例多項式カーネル

ガウスカーネル

Fourierカーネル(複素数値)

dT cyxyxk )(),( +=mR=Ω

( d:自然数, )0≥c

⎟⎠⎞

⎜⎝⎛ −−= 2

2

1exp),( xyyxkσ

mR=Ω( σ > 0 )

mR=Ω )(1),( yxT

eyxk −−= ω ( )mR∈ω

Page 11: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

11

再生核ヒルベルト空間

集合 Ω 上の関数を要素に持つヒルベルト空間 Hが

再生核ヒルベルト空間(reproducing kernel Hilbert space, RKHS)であるとは,任意の x∈Ω に対して φx ∈Hがあって,任意の f∈Hに対し

が成り立つことをいう.

φxのことを再生核という.

)(, xff x =φ

Page 12: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

12

正定値カーネルと再生核ヒルベルト空間

定理k(x,y) : 集合 Ω 上の正定値カーネル

Ω 上の関数からなるヒルベルト空間 Hk が一意に存在して,次の3つを満たす

(1)

(2) 有限和 の形の関数全体は Hk の中で稠密

(3) (再生性)

注) k(・, x) ・・・ x を固定した1変数関数

kxk H∈⋅ ),( ( x ∈ Ω は任意に固定)

∑ = ⋅= ni ii xkcf 1 ),(

),(,)( xkfxf ⋅= ∀ f ∈Hk, x∈Ω

Page 13: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

13

正定値カーネルとRKHS正定値カーネル ⇒ RKHS正定値カーネル k(x,y) により定まる Hk は再生核を持つ(定理の(3))

RKHS ⇒ 正定値カーネル: 再生核 φx は正定値カーネルを定める

),( xkx ⋅=φ

正定値カーネル 再生核ヒルベルト空間

)(, xff x =⇒ φ

)(),( yxyk xφ=⇒

∑∑∑∑ ==== == nj xj

ni xi

nji xxji

nji jiji jiji

ccccxxkcc 111,1, ,,,),( φφφφ

02

1≥= ∑ =

n

i xi ic φ

yxx yxyk φφφ ,)(),( == (対称性もわかる)

(正定値性)

と定義

Page 14: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

14

正定値カーネルによるデータ解析

Page 15: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

15

カーネルによるデータ変換

データの非線形変換

データの空間 再生核ヒルベルト空間=特徴空間(feature space)

内積計算:

特徴空間における線形アルゴリズムデータの空間での非線形アルゴリズム

xi

ΦHk

Ω xj

,ixφ

jxφ

xxkxx φ=⋅=Φ ),()(

(Data space)

カーネルPCA,カーネルCCA, SVM,プライン平滑化 etc

),(),(),,()(),( yxkykxkyx =⋅⋅=ΦΦ ・・・ カーネルトリック

Page 16: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

16

カーネル法の例 – カーネルCCA –正準相関分析(canonical correlation analysis, CCA)2つの確率ベクトル X, Y に対して、相関が最大となる方向を見つける

データ X1, …, XN; Y1, …, YN に対して

bCbaCabCa

YYT

XXT

TXY

T

ba

n

m ˆˆˆ

maxRR

∈∈

( ) bCbaCabCa

YbXa

YbXa

YYT

XXT

TXY

T

baTT

TT

ba

n

m

n

m

RR

RR

∈∈

∈∈

= max]Var[]Var[

],Cov[max 2/1

( )( )∑ ∑∑= == −−= Ni

TNj

jN

iNj

jN

iNXY YYXXC 1 1

11

11ˆただし

]])[])([[( TYX XEXYEYEC −−=

Page 17: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

17

カーネルCCAΩX , ΩY 上の正定値カーネル kX , kY.

X1, …, XN φX1, …, φX

N

Y1, …, YN φY1, …, φY

N

X∈H

Y∈H( , ),X

i X ik Xφ = ⋅( , )Y

i Y ik Yφ = ⋅

,),(),(~1

1 ∑ = ⋅−⋅= Nj jXNiX

Xi XkXkφ ∑ = ⋅−⋅= N

j jYNiYY

i YkYk 11 ),(),(~φ

∑∑

==

=

∈∈ ++ N

i NY

iNNi N

XiN

Ni

Yi

XiN

HgHf

YYXX

YX

YX ggff

gf

1221

1221

11

~,~,

~,~,max

HHHH

HH

εφεφ

φφ

変換

とおいて関数データに対するCCAを書き下すと

Page 18: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

18

グラム行列による表現

{ } 1Span

NXi i

f φ=

∈ { } 1Span

NYi i

g φ=

1 ,N Xi iif a φ== ∑ 1

N Yi iig bφ== ∑

2

1, 1

1 11 , 1

( , ) ( , )

( , ) ( , )

NX ij i j i aaN

N Na j a ba a bN N

K k X X k X X

k X X K X X=

= =

= −

− +

∑ ∑

で十分

により表すと

( ) ( )2 2max

N

N

TX Y

T TaX N X Y N Yb

a K K b

a K N K a b K N K bε ε∈∈

+ +RR

ただし

固有値問題として解ける

Page 19: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

19

-1 -0.5 0 0.5 10

0.05

0.1

0.15

0.2

0.25

0.3

0.35

f(x)

-1 -0.5 0 0.5 1-0.35

-0.3

-0.25

-0.2

-0.15

-0.1

-0.05

0

g(y)-1 -0.5 0 0.5 1

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35-0.35

-0.3

-0.25

-0.2

-0.15

-0.1

-0.05

0

y

x

y

x

f(x)

g(y)

Gaussian kernel

is used.)/||~||exp( 22 σzz −−

Page 20: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

20

データ解析と関数空間

関数空間内での線形データ解析

線形データ解析のために必要な性質

内積(相関)の計算 ヒルベルト空間

「関数の値」が決まる 処理結果の利用

定理: 集合 Ω 上の関数を要素に持つヒルベルト空間 Hに対し、

任意の x∈Ω に対して

が連続汎関数であるとき、Hは再生核ヒルベルト空間である

RKHSは、データ解析を行うのに自然な関数空間

c.f. L2空間

)(xff,H R→

Page 21: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

21

RKHSを使う利点数理的な観点から

k がCr 級ならば Hk に属する関数は Cr 級

EP[k(X,X)] < ∞ ならば Hk ⊆ L2(P) かつ包含写像は連続

情報処理的観点から

関数空間での内積計算が容易

従来の線形手法の非線形拡張が容易: 相関行列 グラム行列

非ベクトルデータの処理

もとのデータ空間はベクトル空間でなくてもよい

グラフデータ、ツリーデータ、ヒストグラムなどの処理

∑∑ ⋅=⋅= j jji ii XkbgXkaf ),(),,( ),(, jiij ji XXkbagf ∑=

Page 22: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

22

独立性、条件付独立性と再生核ヒルベルト空間

Page 23: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

23

独立性とRKHS特性関数による独立性の特徴づけ(確率論の復習)

確率ベクトル X と Y が独立

[ ] [ ] [ ]YY

XX

YXXY

TTTT

eEeEeeE ηωηω 1111 −−−− =⇔ for all ω and η.

は様々な関数による非線形相関を調べるテスト関数yx TTee ηω 11 , −−

[ ] 0,Cov 11 =⇔ −− YX TTee ηω for all ω and η.

Page 24: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

24

RKHSによる独立性の特徴づけHX, HY : 可測空間 ΩX, ΩY 上のRKHS(有界で可測な正定値カーネル)

X: ΩX 上に値を持つ確率変数, Y: ΩY 上に値を持つ確率変数

X と Y が独立

という特徴づけは可能か?

確率決定的

H : 可測空間 (Ω, Β) 上の有界で可測な正定値カーネルによるRKHSΠ: (Ω, Β) 上の確率測度全体

Hが確率決定的であるとは

が単射であることをいう。

[ ] [ ] [ ])()()()( YgEXfEYgXfE YXXY =⇔ for all YX gf HH ∈∈ ,

)])([(,* XfEfP PH→Π

Page 25: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

25

定理1

直積 ( kXkY で定まるRKHS)が確率決定的であるとき、

X と Y が独立

定理2(Bach and Jordan, 2002)(Rm, Bm) に対して、ガウスRBFカーネル

は確率決定的である。

独立成分分析への応用

独立なm個の確率変数の線形変換像から、もとの確率変数を復元

[ ] [ ] [ ])()()()( YgEXfEYgXfE YXXY =⇔for all YX gf HH ∈∈ ,

2

2( , ) expz z

k z zσ

⎛ ⎞−= −⎜ ⎟⎜ ⎟

⎝ ⎠

X Y⊗H H

Page 26: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

26

相互共分散作用素

相互共分散作用素の定義X , Y: 可測空間 ΩX , ΩY に値をとる確率変数

HX , HY : ΩX , ΩY 上のRKHS (有界で可測な正定値カーネル)

有界作用素 を次式により定義することができる。

系3

YXYX HH →Σ :

)]([)]([)]()([, YgEXfEYgXfEfg YXXYYXY

−=Σ H

for all YX gf HH ∈∈ ,( ))](),([Cov YgXf=

HX , HY : ガウスカーネルによるRKHS OYX =Σ⇔X と Y が独立

c.f. ],[Cov YbXabCa TTYX

T =

Page 27: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

27

条件付共分散作用素

共分散作用素の分解相互共分散作用素 は以下のように分解できる

ただし VYX は有界作用素、 ||VYX || ≦ 1 かつ

条件付共分散作用素

YXYX HH →Σ :1/ 2 1/ 2

YX YY YX XXVΣ = Σ Σ

( ) ( ), ( ) ( )YX YY YX XXR V R N V N= Σ = Σ

2/12/1| YYXYYXYYYYXYY VV ΣΣ−Σ≡Σ

( )XYXXYXYY ΣΣΣ−Σ= −1

Page 28: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

28

条件付独立性とRKHS条件付共分散作用素と2乗誤差定理4

c.f. 線形回帰の2乗誤差

条件付分散による表現定理5 (1) 任意の g ∈ HY に対して

(2) は L2(PX) で稠密

YYXXYYYYT

YXba

CCCCbXaYEm

12

,|)(|min −

∈∈−=+−

RR

)(]|)([ 2XPLXYgE ∈⋅=

R⊕XH

[ ]]|)([Var, | XYgEgg XXYYY

=ΣH

2| )])([)(()])([)((inf, XfEXfYgEYgEgg XYfXYY

XY−−−=Σ

∈HH

Page 29: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

29

条件付独立性の特徴付け確率変数 Y, U, V に対し、

の特徴づけを考える。

定理6(Fukumizu et al. 2004)U, V, Y: 可測空間 ΩU , ΩV , ΩY に値をとる確率変数

HU, HV, HY : ΩU , ΩV , ΩY 上のRKHS(有界で可測なカーネルによる)

X = (U,V), (直積)

HX, HU は定理5の(1), (2) を満たすとする。このとき、

さらにHY が確率決定的であるならば

VUX HHH ⊗=

UVY |⊥ あるいは同値な条件 )),(( VUX =

XYYUYY || Σ≥Σ (≧は自己共役作用素の半順序)

UXYXYYUYY ||| ⊥⇔Σ=Σ

UXY |⊥

Page 30: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

30

条件付共分散作用素による次元削減

回帰問題における次元削減回帰問題: 確率変数 Y が X にどう依存するかを調べる

を推定する

回帰問題における次元削減

X : m次元確率ベクトル

を満たす m × d (d < m )行列 B を求める。回帰の低次元表現。

RKHSを用いた解法

)|( XYp

( | ) ( | )Tp Y X p Y B X= )|( XBXY T⊥⇔

[ ]XBYYB

T|Trmin Σ カーネル次元削減法

(Fukumizu et al. 2004)

Page 31: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

31

カーネルCCAの統計的性質

Page 32: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

32

統計的推測

統計的推測の原理データの背後には、それを発生させる確率分布がある

有限個のデータを用いて、その確率分布あるいはそれから決まる量を推測する

カーネル法の統計的推測としての見方データの変換ではなく、確率変数の変換

RKHSに値をとる確率変数

から決まる量(関数)を、有限個のデータから推測する

統計的推測法の妥当性一致性: 有限データからの推定量が、確率分布から決まる真の量に

収束するか?

),( Xk ⋅

),( Xk ⋅

Page 33: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

33

カーネルCCAの作用素による表現

期待値によるカーネルCCA

最適解ξ∗, ζ∗ : の最大特異値に対する単位固有ベクトル

,max , YXf g

g fΣ , 1,XXf fΣ = , 1YYg gΣ =subj. to

1/ 2* *

1/ 2* *

XX

YY

f

g

ξ

ζ

⎧ = Σ⎪⎨

= Σ⎪⎩

2/12/1 −− ΣΣΣ= XXYXYYYXV

Page 34: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

34

有限サンプルに対するカーネルCCA経験相互共分散作用素

カーネルCCA

( ) 1 1 11 1 1

ˆ, ( ) ( ) ( ) ( )N N NNYX i i i ii i iN N Ng f f X g Y f X g Y= = =Σ = −∑ ∑ ∑

( )

,ˆmax , N

YXf gg fΣ ( )( )ˆ, 1,N

XX Nf I fεΣ + =subj. to

( )( )ˆ, 1,NYY Ng I gεΣ + =

ˆ ˆ,N Nξ ζ ( ) ( )1/ 2 1/ 2( ) ( ) ( ) ( )ˆ ˆ ˆ ˆ:N N N NYX YY N YX XX NV I Iε ε

− −= Σ + Σ Σ +

( ) 1/ 2

( ) 1/ 2

ˆ ˆˆ( )ˆˆ( )ˆ

NN XX N N

NN YY N N

f I

g I

ε ξ

ε ζ

⎧ = Σ +⎪⎨

= Σ +⎪⎩

の最大特異値に対する単位固有ベクトル

Page 35: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

35

解の一致性(収束性)

あるいは

は成り立つか?

どのような関数空間のノルムのもとで収束するか?

収束するための正則化係数 εN の条件は?

** ˆ,ˆ ggff NN →→

**ˆ,ˆ ζζξξ →→ NN

Page 36: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

36

カーネルCCAの一致性

Theorem 1If VYX is compact, and the regularization coefficientsatisfies

then,

in probability as .

1/30, ( )N NN Nε ε→ → ∞ → ∞

*ˆ , 1,

XNξ ξ →

H *ˆ , 1

YNζ ζ →

H

N → ∞

Note: convergence of RKHS is very strong. If the kernels are bounded, it is stronger thanthe uniform norm.

Page 37: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

37

Theorem 2Suppose VYX is compact, and the regularization coefficient satisfies

If ξ* and ζ* are included in R(ΣXX) and R(ΣYY), respectively, then

in probability as .

1/30, ( ).N NN Nε ε→ → ∞ → ∞

N → ∞

( ) ( )2 ( )

ˆ ˆ[ ( )] [ ( )] 0X

N X N X L Pf E f X f E f X− − − →

( ) ( )2 ( )[ ( )] [ ( )] 0ˆ ˆ

YN Y N Y L Pg E g Y g E g Y− − − →

Page 38: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

38

証明の核になる命題命題

Hilbert-Schmidt ノルム

大数の法則

中心極限定理

上の命題は収束のオーダーに関する強い結果

)(),(ˆ 2/1)( ∞→=Σ−Σ − NNOpHSYXN

YX

21

2 |||||||| ∑∞== i iHS AA ϕ ∞

=1}{ iiϕ( :CONS)

∑∑ ∑ == =− Ni

iN

Ni

Ni

iN

iiN YgXfYgXf 1

11 1

11 )()()()()]([)]([)]()([ XgEXfEYgXfE −→

fgfg YXN

YX Σ→Σ ,ˆ, )(

( ) )(ˆ, 2/1)( −=Σ−Σ NOfg pYXN

YX

Page 39: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

39

おわりに

再生核ヒルベルト空間を用いたデータ解析RKHS: 関数の値が意味を持つヒルベルト空間

内積計算が容易

属する関数の連続性や微分可能性

ベクトルでないデータに対しても相関(内積)計算を可能にする

独立性、条件付独立性の特徴づけ相互共分散作用素を用いた線形手法の非線形化

カーネル法の統計的性質漸近的な性質、一致性

カーネルCCAの一致性のための正則化係数の十分条件

Page 40: 再生核ヒルベルト空間を 用いた非線形データ解析法fukumizu/papers/Nagoya_Nov2005.pdf · 2 Outline イントロダクション 正定値カーネルと再生核ヒルベルト空間

40

参考文献K. Fukumizu, F.R. Bach, and M.I. Jordan (2004)Dimensionality reduction for supervised learning with reproducing kernel Hilbert spaces. Journal of Machine Learning Research. 5:73-99.福水健次(2003)「再生核ヒルベルト空間を用いた回帰問題における

次元削減法」 日本数学会2003年秋季大会予稿集

K. Fukumizu, F.R. Bach, and Arthur Gretton (2005)Consistency of kernel canonical correlation analysis. ISM Research Memo 942.K. Fukumizu, F.R. Bach, and M.I. Jordan (2005)Consistency of kernel dimensionality reduction. In preparation.

URL: http://www.ism.ac.jp/~fukumizu/