tensorflow white paperを読む

TensorFlow White Paperを読む v1.1

今日の内容• 自己紹介

• 神経回路網と実装

• TensorFlow White Paerの概説

自己紹介

自己紹介• バクフー株式会社代表取締役柏野雄太 (かしのゆうた)

• 大規模リアルタイムデータのデータプラットフォーム

• PPPP preprocess /process /persistence /providing

http://socio.bakfoo.com/socio@bakfoo.com

Closed Beta

自己紹介• 大規模リアルタイムのデータプラットフォーム

リアルタイムデータ前処理処理ストア提供

tweets 整形自然言語処理・分類 API, 検索, 可視化

気象データ変換分類・異常値検知 API, 検索,ストリーミング

位置データ変換分類 API, 検索, ストリーミング

経済データ整形・変換異常値検知 API, 検索, 可視化6

自己紹介• Zope3の開発

• Python • いくつかの本

• PyCon JP 2015でのトーク

• バックグラウンドは宇宙物理学

• 大規模データ統計解析，科学計算

• 深層学習ウオッチャー: 2012年Hinton講義

https://goo.gl/GG4Bo8

https://www.coursera.org/course/neuralnets7

神経回路網と実装

神経回路の数理表現

(k)(x) = g(a(k)(x))

(k)(x) = b

(k) +W

(k�1)(x)

b(1)W (1)

x1 x2 xd

(3)(x) = b

(3) +W

(2)(x)

(3) +W

(3)g(b(2) +W

(1)(x))

(3) +W

(3)g(b(2) +W

(2)g(b(1) +W

(1)x))

(0)(x) = x

(1)(x) = g(a(1)(x))

(2)(x) = g(a(2)(x))

(1)(x) = b

(1) +W

(0)(x)

(2)(x) = b

(2) +W

(1)(x)

(3)(x) = b

(3) +W

(2)(x)

(3)(x) = o(a(3)(x))

= f(x)

(1)(x)

(2)(x)

(3)(x)

(2)(x)

(1)(x)

f(x) = h

(3)(x)

b(1)W (1)

マルチレイヤー神経回路• L個の隠れ層の神経回路

• プレ活性

• 隠れ層活性

• 出力層活性

• レイヤーは関数適用に他ならない

(k)(x) = g(a(k)(x))

(k)(x) = b

(k) +W

(k�1)(x)

(L+1)(x) = o(a(L+1)(x))

= f(x)

(1)(x)

(2)(x)

(3)(x)

(2)(x)

(1)(x)

f(x) = h

(3)(x)

b(1)W (1)

機械学習と損失関数• パラメータ・トレーニングセット

• 目的関数最小化

• 損失関数・正則関数a

(1)(x)

(2)(x)

(3)(x)

(2)(x)

(1)(x)

f(x) = h

(3)(x)

b(1)W (1)

l(f(x), y)

✓ = {W (1), b(1), ...,W (L+1), b(L+1)}

(x(t), y(t))

⌦(✓)

l(f(x(t);✓), y(t)) = �logf(x(t)

L(✓) =1

l(f(x(t);✓), y(t)) + �⌦(✓)

argmin✓L(✓)

勾配降下と確率的勾配降下• 目的関数Lを最小化：勾配の方向にθを動かす

• 確率的勾配降下：ミニバッチ t だけをみて勾配計算

� = �r✓l(f(x(t);✓), y(t))

✓ ✓ + ↵�

Lの等高線

α: 学習率

勾配の計算：誤差逆伝搬• 目的関数を最小にするには勾配の計算が必要

• 勾配の計算＝誤差逆伝搬 � = �r✓l(f(x(t);✓), y(t))

✓ ✓ + ↵�

(1)(x)

(2)(x)

(3)(x)

(2)(x)

(1)(x)

f(x) = h

(3)(x)

b(1)W (1)

b(2)W (2)

l(f(x), y)

(1)(x)

(2)(x)

(3)(x)

(2)(x)

(1)(x)

f(x) = h

(3)(x)

b(1)W (1)

b(2)W (2)

l(f(x), y)

(2) l(f(x), y) ra

(2)(x)l(f(x), y)h(2)(x)T

(2)(x)l(f(x), y) rh

(2)(x)l(f(x), y)� [..., g0(a(2)(x)), ...]

(2)(x)l(f(x), y) W

(3)Tra

(3)(x)l(f(x), y)

勾配の計算：誤差逆伝搬• Hugo Larochelleの講義にGo https://goo.gl/UWtRWT

(1)(x)

(2)(x)

(3)(x)

(2)(x)

(1)(x)

f(x) = h

(3)(x)

b(1)W (1)

b(2)W (2)

l(f(x), y)

(1)(x)

(2)(x)

(3)(x)

(2)(x)

(1)(x)

f(x) = h

(3)(x)

b(1)W (1)

b(2)W (2)

l(f(x), y)

(2) l(f(x), y) ra

(2)(x)l(f(x), y)h(2)(x)T

(2)(x)l(f(x), y) rh

(2)(x)l(f(x), y)� [..., g0(a(2)(x)), ...]

(2)(x)l(f(x), y) W

(3)Tra

(3)(x)l(f(x), y)

勾配の計算：誤差逆伝搬• 主要DLライブラリは勾配を自動に計算 • 実はあまり気にしないでいい

(1)(x)

(2)(x)

(3)(x)

(2)(x)

(1)(x)

f(x) = h

(3)(x)

b(1)W (1)

b(2)W (2)

l(f(x), y)

(1)(x)

(2)(x)

(3)(x)

(2)(x)

(1)(x)

f(x) = h

(3)(x)

b(1)W (1)

b(2)W (2)

l(f(x), y)

(2) l(f(x), y) ra

(2)(x)l(f(x), y)h(2)(x)T

(2)(x)l(f(x), y) rh

(2)(x)l(f(x), y)� [..., g0(a(2)(x)), ...]

(2)(x)l(f(x), y) W

(3)Tra

(3)(x)l(f(x), y)

ライブラリ利用で必要なのは• データを入れる場所：テンソル • レイヤーの表現 • 活性化関数・出力関数 • 損失関数 • 最適化法 • 勾配計算（誤差伝搬）

• GPUへの対応

(1)(x)

(2)(x)

(3)(x)

(2)(x)

(1)(x)

f(x) = h

(3)(x)

b(1)W (1)

l(f(x), y)

TensorFlow

TensorFlowキャッチ

• 分散計算Theano

• 最もマーケティングに成功しつつある深層学習ライブラリ

• 最初のリリースについて機能的にガッカリ…

TensorFlow Demo• チュートリアルにあるMNIST

インストール

• 最初のリリースは動作環境も生焼け…

• Python2.7でないと動かない

• GPU: CUDA7.0 (7.5は動作しない）

• ProtocolBuffのバージョンでCaffeと衝突することがある

TensorFlow White Paperhttp://download.tensorflow.org/paper/whitepaper2015.pdf

ご注意

• White Paperに関して一つ一つのパラグラフを追いません

• 1stリリースのTensorFlowはWhite Paperにある実装の半分以上が実装されていません

コンセプトとモデリング• 有向非巡回グラフ(DAG)で計算を表現:

• Theano, Chainerと同じ

• nodeはoperationと呼ばれin/outを持つ

• operationはtensorを取ってtensorを返す

• opを実行する物理的実体がkernel

コンセプトとモデリング

• 最初にoperationのグラフを定義

• グラフの計算はsession内のrunで実行される

• Chainer的には“define and run”

• sessionはdevice非依存：マルチデバイス，分散実行

コンセプトとモデリング

• opのタイプ

• valiables: パーシステントなtensorを生成するoperation

計算：シングル・マルチ・分散

• サブグラフを実デバイス，マシンに分散させる

計算：デバイス間通信

• send/reciveノードを計算グラフに挟む

微分計算 (bprop)

• [db, dW, dx] = tf.gdadients( C, [b, W, x] )

部分計算：サブグラフの計算

• サブグラフを切断: feed/fetchノードを追加

計算グラフのフロー制御

• 低レベルのオペレータはある

• opの実行制御: Switch, Merge

• イテレーション：Enter, Leave,

NextIteration

入力ノード,キュー,コンテナ

• 入力制御：ノードとしてテンソルをファイル・データシステムから食わせることもできる

• キュー：enqurue/dequeueで非同期実行．FIFO+シャッフルキュー

• コンテナ：Variableで定義

実装の最適化

• 計算グラフの繰り返しや無駄を最適化

• GPUへのデータ転送，デバイス間の通信などたくさん最適化している（詳細不明）

• queueを使ったカーネルの非同期処理

• テンソル計算にはEigen libを使っている

• デバイス間のデータ転送には桁落ちしない圧縮

SGDを速く：データ並行• ミニバッチごとに複数デバイスにグラフをレプリ

SGDを速く: モデル並行• LSTMをつかうRNNなどはdeviceごとにopを割り振る

SGDを速く: 少数ステップ• 複数デバイスに分散するより，シングルデバイスで少ないステップをパイプライン化したほうが良い場合もある

ビジュアライゼーション• TensorBoard

python tensorboard.py --logdir=log-directory

localhost:6006

ビジュアライゼーション

今回の割愛

• 6 Status and Experience

• 9.2 Performance Tracing

• 10 Future Work

• 11 Related Work

Performance

• 単一マシンの速度はあまり速くない…

• ただ，Gの力を結集して最適化真っ最中

https://github.com/soumith/convnet-benchmarks/issues/66

Multiple Devices?

• シングルマシンのマルチGPUなら対応済みhttp://www.tensorflow.org/tutorials/deep_cnn/index.html

python cifar10_multi_gpu_train.py --num_gpus=2

Multiple Computers?http://www.tensorflow.org/resources/faq.html#running_a_tensorflow_computation

https://github.com/tensorflow/tensorflow/issues/23#issuecomment-155608002

kerasがTFに対応宣言

https://twitter.com/fchollet/status/663735623119949824

BlackBoxMLの動きも: skflow

• Simplified interface for TensorFlow (mimicking Scikit Learn)

https://github.com/google/skflow

DL学習リソース

動画講義 (全力でオススメ)

• Deep Learning Summer School 2015

• Hugo Larochelle (Twitter/U of Sherbrooke)

• Nando de Freitas (Oxford)

• CS231n: CNN for Visual Recognition

• CS224d: DL for Natural Language Processing

http://videolectures.net/deeplearning2015_montreal/

http://cs231n.stanford.edu/

http://cs224d.stanford.edu/index.html

https://www.cs.ox.ac.uk/people/nando.defreitas/machinelearning/

https://goo.gl/UWtRWT

書籍• 古典: Bengio et.al. 2015 DLBook

• Theano Tutorial

• Neural Networks and Deep Learning

• 岡谷貴之著深層学習 (機械学習プロ)

• 神嶌敏弘編深層学習: Deep Learning

http://www.iro.umontreal.ca/~bengioy/dlbook/

http://neuralnetworksanddeeplearning.com/

http://deeplearning.net/tutorial/deeplearning.pdf

ご質問・ご意見

kashino@bakfoo.com

@yutakashino

tensorflow white paperを読む

Software

パースレンダリングでies配光データを読み込むパースレンダリングでies...

広報誌『人間文化 vol.21』を読む

中日新聞「静岡発こう読む」...

pydata.tokyo hackathon#2 tensorflow

h2o & tensorflow - fabrizio

랩탑으로 tensorflow 도전하기 - tutorial

ビブリオサテライト書評会『世界を読む』発表...

20171002 nn論文を読む会

tensorflow user group #1

텐서플로 걸음마 (tensorflow tutorial)

最新号をpdfで読む [pdf 23mb]

the document foundationのnext decade manifestoを読む

랩탑으로 tensorflow 도전하기 - tensorflow 설치

stack overflow+英文読む時、便利なツール

배워봅시다 머신러닝 with tensorflow

distributed tensorflow on kubernetes

tensorflow in docker

nips 2010 読む会

tensorflow 入門

bunpo_to_yomu_renshu_n4...