離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...introduction...

43
Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田 達明 a) 、松添 博 b) a) 茨城大、b) 名工大 sul 13 settembre 2016 alla Hokudai | 1/21

Upload: others

Post on 08-Oct-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

離散と連続確率分布における双対平坦構造

和田達明 a)、松添 博 b)

a) 茨城大、b)名工大

sul 13 settembre 2016 alla Hokudai

| 1/21

Page 2: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

Outline

1 Introduction動機共役表現

2 双対平坦構造MaxEnt展望とまとめ

| 2/21

Page 3: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

Outline

1 Introduction動機共役表現

2 双対平坦構造MaxEnt展望とまとめ

| 3/21

Page 4: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

双対平坦座標系

{θi} ⇐ dual ⇒

{ηi}

Ψ⋆(η) =N∑

i=1

θiηi −Ψ(θ),

θi =∂

∂ηiΨ⋆(η), ηi =

∂θi Ψ(θ).

| 4/21

Page 5: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

双対平坦座標系

{θi} ⇐ dual ⇒

{ηi}

Ψ⋆(η) =N∑

i=1

θiηi −Ψ(θ),

θi =∂

∂ηiΨ⋆(η), ηi =

∂θi Ψ(θ).

離散確率分布と 連続確率分布とでは双対平坦座標系の取り方が異なっている。

しかし、これらを 区別する用語はないようである?

| 4/21

Page 6: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

連続確率分布の双対平坦座標系

指数型分布族: Sexp ≡

{pθ(x)

∣∣∣ pθ(x) = exp

[N∑

i=1

θiFi(x)−Ψ(θ)

]}.

θ- and η-coordinates

θi : 分布を特徴付けるパラメータ

ηi =

∫dx pθ(x)Fi(x) : 期待値パラメータ

Ψ⋆(η) =

∫dx pθ(x) ln pθ(x)

Sexp: 各 {ηi} 一定の下で、 エントロピ S = −Ψ⋆(η)を最大とする確率分布!

| 5/21

Page 7: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

連続確率分布の双対平坦座標系

指数型分布族: Sexp ≡

{pθ(x)

∣∣∣ pθ(x) = exp

[N∑

i=1

θiFi(x)−Ψ(θ)

]}.

θ- and η-coordinates

θi : 分布を特徴付けるパラメータ

ηi =

∫dx pθ(x)Fi(x) : 期待値パラメータ

Ψ⋆(η) =

∫dx pθ(x) ln pθ(x)

Sexp: 各 {ηi} 一定の下で、 エントロピ S = −Ψ⋆(η)を最大とする確率分布!

| 5/21

Page 8: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

連続確率分布の双対平坦座標系

指数型分布族: Sexp ≡

{pθ(x)

∣∣∣ pθ(x) = exp

[N∑

i=1

θiFi(x)−Ψ(θ)

]}.

θ- and η-coordinates

θi : 分布を特徴付けるパラメータ

ηi =

∫dx pθ(x)Fi(x) : 期待値パラメータ

Ψ⋆(η) =

∫dx pθ(x) ln pθ(x)

Sexp: 各 {ηi} 一定の下で、 エントロピ S = −Ψ⋆(η)を最大とする確率分布!

| 5/21

Page 9: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

離散確率分布の双対平坦座標系

SN ≡

p = (pµ)∣∣ pµ > 0,

N∑µ=0

pµ = 1

, with p0 := 1 −N∑

k=1

pk .

θ- and η-coordinates

θi= ln pi − ln p0,

ηi= pi , i = 1, · · · ,N.

Ψ(θ) = − ln p0, Ψ⋆(η) =N∑

µ=0

pµ ln pµ.

| 6/21

Page 10: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

離散確率分布の双対平坦座標系

SN ≡

p = (pµ)∣∣ pµ > 0,

N∑µ=0

pµ = 1

, with p0 := 1 −N∑

k=1

pk .

θ- and η-coordinates

θi= ln pi − ln p0,

ηi= pi , i = 1, · · · ,N.

Ψ(θ) = − ln p0, Ψ⋆(η) =N∑

µ=0

pµ ln pµ.

| 6/21

Page 11: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

離散確率分布の双対平坦座標系

SN ≡

p = (pµ)∣∣ pµ > 0,

N∑µ=0

pµ = 1

, with p0 := 1 −N∑

k=1

pk .

θ- and η-coordinates

θi= ln pi − ln p0,

ηi= pi , i = 1, · · · ,N.

Ψ(θ) = − ln p0, Ψ⋆(η) =N∑

µ=0

pµ ln pµ.

| 6/21

Page 12: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

離散確率分布は指数型分布族

θi = ln pi − ln p0  なので、

ln pi = ln pi − ln p0 + ln p0 = θi + ln p0,

| 7/21

Page 13: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

離散確率分布は指数型分布族

θi = ln pi − ln p0  なので、

ln pi = ln pi − ln p0 + ln p0 = θi + ln p0,

ln p0 = −Ψ(θ) なので、

| 7/21

Page 14: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

離散確率分布は指数型分布族

θi = ln pi − ln p0  なので、

ln pi = ln pi − ln p0 + ln p0 = θi + ln p0,

ln p0 = −Ψ(θ) なので、

指数型分布族

pi = exp(θi −Ψ(θ)

), i = 1, . . . ,N.

| 7/21

Page 15: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

離散確率分布は指数型分布族

θi = ln pi − ln p0  なので、

ln pi = ln pi − ln p0 + ln p0 = θi + ln p0,

ln p0 = −Ψ(θ) なので、

指数型分布族

pi = exp(θi −Ψ(θ)

), i = 1, . . . ,N.

⇒ 最大エントロピ法との関連は?

| 7/21

Page 16: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

Outline

1 Introduction動機共役表現

2 双対平坦構造MaxEnt展望とまとめ

| 8/21

Page 17: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

情報幾何学:  α表現

α-表現 (or α-immersion)p 7→ ℓα(p):=

21 − α

p1−α

2 ,

p 7→ ℓ−α(p):=2

1 + αp

1+α2 , −1 < α < 1.

Amari, Nagaoka: Methods of Information Geometry, (AMS 2001)

α-immersion

x

pθ(x)

statistical manifold

θ-coordinate

| 9/21

Page 18: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

共役表現

conjugate reps.

τ -rep. p 7→ τ(p) =df (ρ)dρ

(p),

ρ-rep. p 7→ ρ(p) =df ⋆(τ)

dτ(p),

Legendre双対な凸関数:f (ρ) = ρ τ(ρ)− f ∗

(τ(ρ)

),

f ⋆(τ) = ρ(τ) τ − f(ρ(τ)

).

J. Zhang, Neural Comp. 16, 159, (2004).

| 10/21

Page 19: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

共役表現

conjugate reps.

τ -rep. p 7→ τ(p) =df (ρ)dρ

(p),

ρ-rep. p 7→ ρ(p) =df ⋆(τ)

dτ(p),

Legendre双対な凸関数:f (ρ) = ρ τ(ρ)− f ∗

(τ(ρ)

),

f ⋆(τ) = ρ(τ) τ − f(ρ(τ)

).

J. Zhang, Neural Comp. 16, 159, (2004).

| 10/21

Page 20: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

α-表現は、共役表現の一例:

ρ(p) = ℓα(p), τ(p) = ℓ−α(p),

fα(ρ) =2

1 + α

(1 − α

) 21−α

, f ⋆α(τ) =2

1 − α

(1 + α

) 21+α

.

| 11/21

Page 21: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

指数型分布族の場合:

τ(p) = p, f ⋆(τ) = p ln p,

ρ =ddτ

f ⋆(τ) = ln p + 1, f (ρ) = exp(ρ− 1

)= p.

| 12/21

Page 22: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

指数型分布族の場合:

τ(p) = p, f ⋆(τ) = p ln p,

ρ =ddτ

f ⋆(τ) = ln p + 1, f (ρ) = exp(ρ− 1

)= p.

−∫

dx p(x) ln p(x) = −∫

dx f ⋆(τ(p(x))

)エントロピ汎関数 S = −Ψ⋆(η)

| 12/21

Page 23: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

Outline

1 Introduction動機共役表現

2 双対平坦構造MaxEnt展望とまとめ

| 13/21

Page 24: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

MaxEnt (最大エントロピ法)

δ

δp(x)

[−∫

dx f ⋆(τ(p(x))

)+

N∑i=1

θi∫

dx τ(p(x)) Fi(x)

−γ

∫dx τ(p(x))

]= 0,

ここで、θi および γ は、Lagrange 未定乗数。

| 14/21

Page 25: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

MaxEnt (最大エントロピ法)

δ

δp(x)

[−∫

dx f ⋆(τ(p(x))

)+

N∑i=1

θi∫

dx τ(p(x)) Fi(x)

−γ

∫dx τ(p(x))

]= 0,

ここで、θi および γ は、Lagrange 未定乗数。df ⋆(τ)/dτ = ρを利用して、

ρ(p(x)) τ ′(p(x)) =N∑

i=1

θiFi(x) τ ′(p(x))− γ τ ′(p(x)).

| 14/21

Page 26: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

MaxEnt (最大エントロピ法)

df ⋆(τ)/dτ = ρを利用して、

ρ(p(x)) τ ′(p(x)) =N∑

i=1

θiFi(x) τ ′(p(x))− γ τ ′(p(x)).

τ ′(p(x)) ̸= 0ならば、

ρ(p(x)

)=

N∑i=1

θi Fi(x)− γ.

| 14/21

Page 27: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

MaxEnt (最大エントロピ法)

τ ′(p(x)) ̸= 0ならば、

ρ(p(x)

)=

N∑i=1

θi Fi(x)− γ.

ρ(p(x)

)= ln p(x) + 1,

⇒ ln p(x) =N∑

i=1

θiFi(x)−Ψ(θ), with Ψ(θ) = γ + 1.

| 14/21

Page 28: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

離散確率分布

ρ(p(x)

)=

N∑i=1

θiFi(x)− γ,

の離散版を得るために:

p(xk ) → pk , Fi(xk ) → δi,k , i , k = 1, . . . ,N.

とする。

| 15/21

Page 29: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

離散確率分布

ρ(p(x)

)=

N∑i=1

θiFi(x)− γ,

の離散版を得るために:

p(xk ) → pk , Fi(xk ) → δi,k , i , k = 1, . . . ,N.

とする。

ρ(pk ) = θk − γ, k = 1, . . . ,N.

ρ(p0) = −γ,

| 15/21

Page 30: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

離散確率分布

ρ(pk ) = θk − γ, k = 1, . . . ,N.

ρ(p0) = −γ,

θk = ρ(pk )− ρ(p0), k = 1, . . . ,N.

| 15/21

Page 31: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

離散確率分布

θk = ρ(pk )− ρ(p0), k = 1, . . . ,N.

ρ(p) = ln p + 1, ⇒ θi = ln pk − ln p0

| 15/21

Page 32: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

最大エントロピ法との関連は?

∂pi

[−

N∑µ=0

f ⋆(τ(pµ)

)+

N∑k=1

θkτ(pk )− γ

N∑µ=0

τ(pµ)]= 0,

| 16/21

Page 33: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

最大エントロピ法との関連は?

∂pi

[−

N∑µ=0

f ⋆(τ(pµ)

)+

N∑k=1

θkτ(pk )− γ

N∑µ=0

τ(pµ)]= 0,

τ(p) = p, f ⋆(τ) = p ln p, ⇒

∂pi

[−

N∑µ=0

pµ ln pµ +N∑

k=1

θkpk − γ

N∑µ=0

]= 0,

| 16/21

Page 34: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

最大エントロピ法との関連は?

τ(p) = p, f ⋆(τ) = p ln p, ⇒

∂pi

[−

N∑µ=0

pµ ln pµ +N∑

k=1

θkpk − γ

N∑µ=0

]= 0,

各 pk が一定の下で、エントロピを最大化

| 16/21

Page 35: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

スコア関数と τ -期待値

ρ(p(x)) =N∑

i=1

θiFi(x)− γ(θ) なので、

スコア関数: s(x) ≡ ∂iρ(p(x)) = Fi(x)− ∂iγ,

| 17/21

Page 36: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

スコア関数と τ -期待値

スコア関数: s(x) ≡ ∂iρ(p(x)) = Fi(x)− ∂iγ,

Then∫dx τ(p(x)) s(x) =

∫dx τ(p(x))Fi(x)− ∂iγ

∫dx τ(p(x)).

| 17/21

Page 37: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

スコア関数と τ -期待値

スコア関数: s(x) ≡ ∂iρ(p(x)) = Fi(x)− ∂iγ,

Then∫dx τ(p(x)) s(x) =

∫dx τ(p(x))Fi(x)− ∂iγ

∫dx τ(p(x)).

τ -期待値

Eτ [Fi ] ≡∫

dx τ(p(x))Fi(x)∫dx τ(p(x))

.

| 17/21

Page 38: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

スコア関数と τ -期待値

スコア関数: s(x) ≡ ∂iρ(p(x)) = Fi(x)− ∂iγ,

Then∫dx τ(p(x)) s(x) =

∫dx τ(p(x))Fi(x)− ∂iγ

∫dx τ(p(x)).

τ -期待値

Eτ [Fi ] ≡∫

dx τ(p(x))Fi(x)∫dx τ(p(x))

.

Eτ [∂iρ(p)] = Eτ [Fi ]− ∂iγ,

where we used Eτ [1] = 1.

| 17/21

Page 39: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

η-座標系

Eτ [∂iρ(p)] = Eτ [Fi ]− ∂iγ,

τ(p) = p, ρ(p) = ln p + 1の場合、Ψ(θ) = γ + 1 だったので:

Ep [Fi]− ∂iγ = Ep [∂i ln p] = ∂iEp [1] = 0,

⇒ ηi = ∂iΨ(θ) = ∂i(γ + 1) = Ep [Fi] .

| 18/21

Page 40: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

Outline

1 Introduction動機共役表現

2 双対平坦構造MaxEnt展望とまとめ

| 19/21

Page 41: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

変形指数型分布族

κ-指数型分布族

Sκ ≡

{pθ(x)

∣∣∣pθ(x) = α exp{κ}

[1λ

(N∑

i=1

θiFi(x)− γ(θ)

)]}.

exp{κ}(x) :=(κx +

√1 + κ2x2

) 1κ.

κ-表現

τ(p)= p, f ⋆κ (τ)= τ ln{κ} τ.

ρ(p)= λ ln{κ}

(pα

), fκ(ρ)= α exp{κ}

(ρλ

)uκ

[α exp{κ}

(ρλ

)].

Ψ⋆κ =

∑i

f ⋆κ (τ(pi)) =∑

i

pi ln{κ} pi = −Sκ. κ−エントロピ

| 20/21

Page 42: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

変形指数型分布族

κ-指数型分布族

Sκ ≡

{pθ(x)

∣∣∣pθ(x) = α exp{κ}

[1λ

(N∑

i=1

θiFi(x)− γ(θ)

)]}.

exp{κ}(x) :=(κx +

√1 + κ2x2

) 1κ.

κ-表現

τ(p)= p, f ⋆κ (τ)= τ ln{κ} τ.

ρ(p)= λ ln{κ}

(pα

), fκ(ρ)= α exp{κ}

(ρλ

)uκ

[α exp{κ}

(ρλ

)].

Ψ⋆κ =

∑i

f ⋆κ (τ(pi)) =∑

i

pi ln{κ} pi = −Sκ. κ−エントロピ

| 20/21

Page 43: 離散と連続確率分布における双対平坦構造furuhata/workshop/stat/16/...Introduction 双対平坦構造 離散と連続確率分布における双対平坦構造 和田達明a)、松添博b)

Introduction 双対平坦構造

Summary

離散と連続確率分布における双対平坦座標系に注目。

共役表現と最大エントロピ法を利用して統一化。

| 21/21