20180601 osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/dlap2018/... · 2019-03-29 ·...

66
深層学習は統計系の温度 推定から何を学ぶのか ⻘⽊ 健⼀(⾦沢⼤)、藤⽥ 達⼤(⾦沢⼤)、⼩林 ⽟⻘(⽶⼦⾼専) ⼈⼯知能学会( JSAI )論⽂誌 33(2018)4Deep Learning & Physics 2018, Osaka

Upload: others

Post on 29-May-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

深層学習は統計系の温度推定から何を学ぶのか

⻘⽊健⼀(⾦沢⼤)、藤⽥達⼤(⾦沢⼤)、⼩林⽟⻘(⽶⼦⾼専)⼈⼯知能学会( JSAI )論⽂誌 33巻(2018)4号

Deep Learning & Physics 2018, Osaka

Page 2: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

くりこみ群 深層学習

類似性 関係性両者にとって⼤きなインパクトになり得る

Page 3: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Deep RBM vs. Renormalization Group

Aoki, K‐I., Kobayashi, T., Restricted Boltzmann Machines for the Long Range Ising Models,Mod. Phys. Lett. B30,1650401 (2016).⼊⼒データ⽤のMonte Carlo をまじめに⾏わずに学習する⽅法を提案くりこみ群との関係を議論

Page 4: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Machine Learning of Statistical SystemTanaka, A., Tomiya, A.,Detection of phase transition via convolutional neural network, J. Phys. Soc. Jpn. 86, 063001 (2017).

Detection of Phase TransitionFind out Critical Temperature Optimized Machine Parameters

WHY Japanese ?  HOW?

Page 5: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Long Range Ising Model (1‐dim.)Aoki,K‐I., Kobayashi,T., Tomita,H., Finite‐Range Scaling Method to Analyze Systems with Infinite‐Range Interactions,Prog. Theor. Phys. 119 509 (2008).

Where is Criticality?

Logarithmic Susceptibility 

BDRG(Block Decimation RG) => Free EnergyFinite Range Scaling

Green Functions

Quantum Model ofDissipation

Ohmic

Page 6: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Finite Range Scaling

外挿

Page 7: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Critical Temperature vs. 

Page 8: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Alpha Go Shock ・1‐dim Long Range Ising ModelPhase transition existsDifficult to evaluate critical temperature

Finite Range Scaling successfully evaluate criticalityExact calculation possible for finite n by BDRG

・Tensorflow vs. 私(⼈類代表)

Page 9: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

相転移点の前に温度推定能⼒必要・統計モデル=1dim⻑距離イジング模型:p=1.8; n=1, n=8; N=1024 periodic・温度16クラス:K=[0.2,0.5] 0.02刻み・各温度毎32000 configurations (MC)

マシン構成・⼊⼒: Domain Wall 表⽰・convolution 6段・filter: weight + bias + ReLU

n=1: size 2, stride 2, channel 1n=8: size 2, stride 2, channel 4

・16 site の和をとる。channel の和もとる。・full connection 層: 1 => 16 class output => softmax function・cost function: cross entropy

Translational Invariance

Page 10: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

結果: 正答率(Tensorflow)n=1 : 28.1%n=8 : 42.8% 

⼈間(私)がいろいろと凝ったこと(domain⻑の分布とか、そのくりこみによる変化とか・・・)を考えて勝負したけれど、勝てない・・・。というか、もともと、この結果って、どれくらいいいの?

正答率の理論的上限値の計算

Page 11: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Theoretical Probability Density vs. Energy

n=1

Page 12: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Theoretical Probability Density vs. Energyn=8

Page 13: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Maximum Likelihood Estimate

Page 14: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

正答率の理論的上限n=1 : 28.1%n=8 : 42.8% 

28.4%43.6%

理論的上限に⾮常に近い

配位のハミルトニアン(関数)を十分に正しくマシン内部に構成し得た、と⾔える

配位のエネルギーに応じて決まる出⼒温度クラスを⼗分に正しく選ぶ必要がある

エネルギー以外の物理量の情報を使うと正答率は必ず下がる。共分散不等式からも⽰される。

Page 15: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Accuracy for Input Temperature Class

n=1

Page 16: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Accuracy for Input Temperature Class

n=8

Page 17: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Output Class vs. Energy

bin size =0.007n=1

Page 18: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Output Class Average vs. Energy

bin size =0.007n=1

Page 19: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Output Class vs. Energy

bin size =0.007n=8

Page 20: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Output Class Average vs. Energy

bin size =0.007n=8

Page 21: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Input Cnfiguration vs. Energy

bin size =0.007n=1

Energy *(‐1)

Page 22: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Output Cass vs. Energy

Energy *(‐1)

bin size =0.007n=1

Page 23: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Input Cnfiguration vs. Energy

bin size =0.007n=8

Energy *(‐1)

Page 24: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Output Cass vs. Energy

bin size =0.007n=8

Energy *(‐1)

Page 25: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Hamiltonian Recognition Rate (HRR)n=1

Page 26: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Hamiltonian Recognition Rate (HRR)n=8

Page 27: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

ある⼊⼒温度の出⼒結果n=1

Page 28: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

学習したマシンはエネルギー測定器!n=8

「これだけ間違えましたね、、、」ではなく、エネルギースペクトル分解!

温度推定学習 温度に共役な物理量の測定器となるエネルギー以外の物理量の情報を使うと正答率は必ず下がる

Page 29: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

相転移、臨界温度の情報はどこに?

エネルギースペクトル分解ができるようになった

エネルギーのゆらぎ(⽐熱)は相転移点で特異性を持つ

この特異性が学習後のマシンのどこかに刻み込まれているはず

温度推定学習

マシンは、エネルギースペクトルメータ

Page 30: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Specific Heat of Long Range Ising Models

Page 31: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

最終段出⼒

最⼩化対象:cost function=Cross Entropy

Softmax function

あるいは が最⼤となる が出⼒温度

Page 32: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

‐40

‐30

‐20

‐10

0

10

20

0 2 4 6 8 10 12 14 16 18 20

y0 y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 y12 y13 y14 y15

最終段全結合n=1 凸多⾓形

Page 33: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

‐0.2

0

0.2

0.4

0.6

0.8

1

0 2 4 6 8 10 12 14 16 18 20

q0 q1 q2 q3 q4 q5 q6 q7 q8 q9 q10 q11 q12 q13 q14 q15

出⼒確率(温度推定)n=1

Page 34: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

最終段出⼒

0

5

10

15

20

25

30

35

40

45

50

‐150 ‐100 ‐50 0 50 100 150

y0 y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 y12 y13 y14 y15

n=8

Page 35: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

‐150 ‐100 ‐50 0 50 100 150

q0 q1 q2 q3 q4 q5 q6 q7 q8 q9 q10 q11 q12 q13 q14 q15

出⼒確率(温度推定)n=8

Page 36: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Cross Entropy の最⼩化

0

0.2

0.4

0.6

0.8

1

‐150 ‐100 ‐50 0 50 100 150

q0 q1 q2 q3 q4 q5

q6 q7 q8 q9 q10 q11

q12 q13 q14 q15

下記をエネルギー毎に規格化

最⼩値を与える

BDRGで計算n=1: 1.743n=8: 1.270

Cross Entropy 理論最⼩値

Page 37: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

0.00E+00

2.00E‐03

4.00E‐03

6.00E‐03

8.00E‐03

1.00E‐02

1.20E‐02

0 0.1 0.2 0.3 0.4 0.5 0.6

Measure

Data Sample Measure vs. Energy

n=1

Energy *(‐1)

Page 38: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

0

0.5

1

1.5

2

2.5

0 0.1 0.2 0.3 0.4 0.5 0.6

Entropy

Entropy vs. Energy

n=1

Energy *(‐1)

Page 39: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

0.00E+00

5.00E‐03

1.00E‐02

1.50E‐02

2.00E‐02

2.50E‐02

0 0.1 0.2 0.3 0.4 0.5 0.6

Entropy*Measure

Entropy*Measure vs. Energy

n=1

Energy *(‐1)

⾯積=1.743

Page 40: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

0

0.001

0.002

0.003

0.004

0.005

0.006

0.007

0.008

0.009

0.01

0 0.2 0.4 0.6 0.8 1 1.2 1.4

Measure

Data Sample Measure vs. Energy

n=8

Energy *(‐1)

Page 41: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

0 0.2 0.4 0.6 0.8 1 1.2 1.4

Entropy

Entropy vs. Energy

n=8

Energy *(‐1)

Page 42: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

0

0.002

0.004

0.006

0.008

0.01

0.012

0.014

0 0.2 0.4 0.6 0.8 1 1.2 1.4

Entropy*Measure

⾯積=1.270

Entropy*Measure vs. Energy

Energy *(‐1)

n=8

Page 43: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

学習:Cross Entropy の推移n=11M learnings

理論最⼩値=1.743

Page 44: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

学習:Cross Entropy の推移n=110M learnings

理論最⼩値=1.743

Page 45: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

学習:Cross Entropy の推移n=81M learnings

理論最⼩値=1.270

Page 46: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

学習:Cross Entropy の推移n=85M learnings

理論最⼩値=1.270

Page 47: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

完全最適化マシン:cross entropy 最⼩

Page 48: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

完全最適マシン解

は の⼀次式

は + の⼀次式

Free Energy が温度の関数として記録されている

温度 は等間隔である必要はない

Free Energy の温度による2階微分は不定性なくわかる

マシンは の情報は何も知らない

Page 49: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

x vs. energyn=1

Page 50: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

‐40

‐30

‐20

‐10

0

10

20

0 2 4 6 8 10 12 14 16 18 20

y0 y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 y12 y13 y14 y15

最終段全結合n=1

Page 51: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

y = 18.876x ‐ 7.3863R² = 0.9986

‐5

‐4

‐3

‐2

‐1

0

1

2

3

0.2 0.25 0.3 0.35 0.4 0.45 0.5

w_j

Machine Parameters: FC Weights

n=1

Page 52: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

‐50

‐40

‐30

‐20

‐10

0

10

20

30

40

0.2 0.25 0.3 0.35 0.4 0.45 0.5

b_j

Machine Parameters: Bias

n=1

Page 53: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

755

760

765

770

775

780

785

790

795

800

‐4 ‐3 ‐2 ‐1 0 1 2 3

Bias ― Free Energry vs. Weight

n=1

Page 54: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

0

0.005

0.01

0.015

0.02

0.025

0.03

0.035

0.04

0.2 0.25 0.3 0.35 0.4 0.45 0.5

Specific Heat

sigma_E_site_from_b_j sigma_E_site_exact

Specific Heat (Energy Fluctuation)

Theory

Machine Parameter after Learning

n=1

Page 55: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

x vs. energy n=8

Page 56: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

最終段全結合

0

5

10

15

20

25

30

35

40

45

50

‐150 ‐100 ‐50 0 50 100 150

y0 y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 y12 y13 y14 y15

n=8

Page 57: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

y = 3.2792x ‐ 1.1405R² = 0.9996

‐0.6

‐0.4

‐0.2

0

0.2

0.4

0.6

0.2 0.25 0.3 0.35 0.4 0.45 0.5

w_j

Machine Parameters: FC Weights

n=8

Page 58: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

‐25

‐20

‐15

‐10

‐5

0

5

10

15

0.2 0.25 0.3 0.35 0.4 0.45 0.5

b_j

Machine Parameters: Bias

n=8

Page 59: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

y = 204.43x + 817.2R² = 0.9999

700

750

800

850

900

950

‐0.6 ‐0.4 ‐0.2 0 0.2 0.4 0.6

b_j‐W_tot

Bias ― Free Energy vs. Weight

n=8

Page 60: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

0

0.5

1

1.5

2

2.5

3

3.5

0.2 0.25 0.3 0.35 0.4 0.45 0.5

Specific Heat

SH_exact SH_DL

Specific Heat (Energy Fluctuation)

Theory

Machine Parameter after Learning

n=8

Page 61: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

包絡線の正体

0

5

10

15

20

25

30

35

40

45

50

‐150 ‐100 ‐50 0 50 100 150

y0 y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 y12 y13 y14 y15

包絡線 エントロピーの凸性

+Energy の1次式

Page 62: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

まとめ、あるいは、補⾜(蛇⾜)・ここまでの結論の本質的部分、すなわち、

完全最適解においては、w_jは温度の⼀次式、b_jはfree energy +温度の⼀次式、となる

は、モデルの詳細、次元に依らない。更に、外部磁場を⼊れても成⽴する。従ってw_jは相転移特異性を持つ物理量(秩序変数)とはならない。この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

・もともと、「次元解析」的に、w_jは温度側の量であって、物理量側の量ではない。この理由からも、秩序変数にはなれない。

・完全最適解にはたくさんのcross entropy flat direction が存在するので、解は無数(多次元)にある。(1次式不定性、filter不定性・・・)

・いろいろな⾮現実的ハミルトニアンで機械を試すと⾯⽩い。・くりこみ群との関係性については、結局、前に進んでいない。

RBMを⽤いた解析を進める必要があるだろう。(cf. Iso, Shiba&Yokoo)

謝辞:藤井康弘,⼩内伸之介,堀祐輔,熊本真⼀郎の各⽒との⾮常に有意義で刺激的な相互作⽤に,そして、深層学習の基本をご教⽰いただいた安⽥宗樹⽒に深く感謝する。

Page 63: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

あ、さて。あ、さて。

Page 64: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Full Connection :凸多⾓形

Page 65: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Cross Entropy Flat Direction

Page 66: 20180601 Osaka webkabuto.phys.sci.osaka-u.ac.jp/~koji/workshop/DLAP2018/... · 2019-03-29 · この結論は、これまでの報告(Tanaka&Tomiya, Arai,Ohzeki&Tanaka)とは⾒解を異にする。

Entropy !!!