caffeの特徴と最近の動向 -cnn、そしてrnnへ-

Caffeの特徴と最近の動向 - CNN、そしてRNNへ -

2017/03/21

・株式会社イーグル CTO

・先端IT活用推進コンソーシアム　　　クラウドテクノロジー活用部会サブリーダー

https://www.facebook.com/yasuyuki.sugai

よろしくお願いしまーす ※この資料の内容は、

個人の見解です

自己紹介

菅井康之

http://www.slideshare.net/yasuyukisugai/deep-learningcaffe

←Caffeを利用したハンズオン勉強会を過去に開催（細かいことはこっちで。。）

今日は私の特徴量だけでも覚えて帰ってもらえればと。。。2

Σ φw1w2 y

入力信号

入力信号への重み(係数)

0を超えた場合に出力(発火)

閾値の役割(発火のしやすさ)を果たす例)閾値を0.5にする場合、予め-0.5を用意しておくことで0を超えにくくする

(bに設定した数値の分、発火しやすくする)

Σ φw1=0.5w2=0.5 y

b=-0.7

x1 x2 y1 1 11 0 00 1 00 0 0

Σ φw1=0.5w2=0.5 y

b=-0.2

x1 x2 y1 1 11 0 10 1 10 0 0

Σ φw1=-0.5w2=-0.5 y

x1 x2 y1 1 01 0 10 1 10 0 1

Σ φw1w2 y

Σ φw1w2

Σ φw3

Σ φw1=0.5

b=-0.7

b=-0.7w5=0.5

w6=0.5

x1 x2 y1 1 01 0 10 1 10 0 0

w2=-0.5w3=0.5w2=-0.5

b=0.714

良く見るグラフ

Σ φw1w2

Σ φw3

活性化関数

relu <- function(x) sapply(x, function(z) max(0,z))ggplot(data=data.frame(x=c(-6,6))) + stat_function(fun=step) + xlim(-6,6)

step<-function(x){ifelse(x>0,1,0)}ggplot(data=data.frame(x=c(-6,6))) + stat_function(fun=step) + xlim(-6,6)

図を作るのに使ったRのコードをサンプルで掲載

sigmoid <- function(t){ 1/(1+exp(-t)) }ggplot(data=data.frame(x=c(-6,6))) + stat_function(fun=step) + xlim(-6,6)

Σ φw1w2

Σ φw3

時間がないのでここから

http://www.slideshare.net/yasuyukisugai/io-t-deeplearning

学習モデルを作成するためにGPUインスタンスをスポットで

一時的に利用

画像が蓄積されてきたらまたスポットを立ち上げて学習のサイクルを回す

https://github.com/microsoft/caffe

http://caffe.berkeleyvision.org/install_apt.html

http://caffe.berkeleyvision.org/install_osx.html

https://github.com/sh1r0/caffe-android-lib

https://github.com/BVLC/caffe/tree/opencl

https://github.com/BVLC/caffe/pulse/monthly

少し落ち着いてきたかな？

GoogLeNet: ILSVRC14 winner

https://github.com/BVLC/caffe/wiki/Model-Zoo

”Caffe offers themodel definitionsoptimization settingspre-trained weights

so you can start right away.”

http://caffe.berkeleyvision.org/

https://github.com/BVLC/caffe/

いろんなところに点在しちゃってる・・・

所々更新されないのはご愛嬌。。。

https://docs.google.com/presentation/d/1UeKXVgRvvxg9OUdh_UiC5G71UMscNPlvArsWER41PsU/edit#slide=id.p

個人的にはこれが一番纏まっててわかりやすいかと

http://demo.caffe.berkeleyvision.org/

http://places.csail.mit.edu/

時間が限られているので、主にConvolution層とPooling層だけ説明します

Convolution ReLU Pooling

Convolution ReLU Pooling Full-Connected softmax

-1 -1 -1 -1 -1 -1-1 1 -1 -1 -1 -1-1 1 -1 -1 -1 -1-1 1 1 1 -1 -1-1 -1 -1 -1 -1 -1-1 -1 -1 -1 -1 -1

-1 -1 -1

-1 1 -1

-1 -1 1

-1 1 -1

-1 -1 -1

-1 -1 1

-1 1 -1

1 -1 1

1 0.1 0.45 0.45

0.45 -0.33 0.45 0.33

0.33 0.1 0.45 0.33

0.1 -0.1 0.1 0.33

x x x x

フィルタを1つずつスライドしてスコア算出

左上は全て一致しているため、1となる

省略省略

白いところが負数から 0に変化

1 0.1 0.45 0.45

0.45 -0.33 0.45 0.33

0.33 0.1 0.45 0.33

0.1 -0.1 0.1 0.33

x x x x

1 0.1 0.45 0.45

0.45 0 0.45 0.33

0.33 0.1 0.45 0.33

0.1 0 0.1 0.33

x x x x

4x4を2x2に分割分割した領域ごとに最大値を算出し、

情報圧縮

省略省略

1 0.45

0.33 0.45

1 0.1 0.45 0.45

0.45 0 0.45 0.33

0.33 0.1 0.45 0.33

0.1 0 0.1 0.33

••

今日は細かい話は割愛します

https://docs.google.com/presentation/d/1UeKXVgRvvxg9OUdh_UiC5G71UMscNPlvArsWER41PsU/edit#slide=id.g129385c8da_651_127

•••

••

•••

•••••

http://host.robots.ox.ac.uk/pascal/VOC/voc2012/

••

https://github.com/BVLC/caffe/pull/3948

••••

••

http://tutorial.caffe.berkeleyvision.org/caffe-cvpr15-sequences.pdf

••

http://youtu.be/w2iV8gt5cd4

http://youtu.be/9VH8bn7ikbw

http://jeffdonahue.com/lrcn/

http://mscoco.org/

••

やはりデータの入手がいつまでも課題に。。。

https://github.com/BVLC/caffe/pull/2033

本家に取り込まれるのに時間がかかっただけで、

実装自体は前からあります。。。

そこまで新しい話ではないけど、 RNNがまた盛り上がってきてるし CNNとRNNを組み合わせるのは

大きな可能性を秘めているので、取り上げてみました

おわり。

caffeの特徴と最近の動向 -cnn、そしてrnnへ-

Technology

renaissance caffe

caffe e salute

giornale cnn

workshop deep learning - personal...

code로 이해하는 rnn

nuova dispensa caffe

universal caffe

understanding rnn and lstm

brochure domo caffe

caffe sicilia

cnn-rnn: a unified framework for multi-label image...

descubra sql caffe

heavens caffe

caffe yoruba

論文紹介: fast r-cnn&faster r-cnn

csb-rnn: a faster-than-realtime rnn acceleration …

realese caffe 2014

Εισαγωγή - cnn

rnn & lstm

manual scada b rnn