ボケるrnnを学習したい (chainer meetup 01)

ボケるRNNを学習したい

Chainer Meetup #01

Motoki Sato @aonotas

12/19

1

佐藤　元紀(さとう　もとき) 来年4月からNAIST松本研に行く予定休学中のM1です＠aonotas　　あおのたす

Chainer Meetupの参加枠に漏れる →LT枠で参加を決める（水曜）ボケるRNNを学習しよう！ →学習コードを動かす（木曜） →学習が終わらない　（今ココ２時間前） →バグが見つかる（１時間前） →一応学習できた…？温かい目で見守ってください。

自己紹介

2

Karpathy, Andrej, and Li Fei-Fei. "Deep visual-semantic alignments for generating image descriptions." arXiv preprint arXiv:1412.2306 (2014).

画像をRNNで説明する研究

3

1.  CNNで特徴抽出 2.  RNN（LSTM）で説明文を生成

ボケるRNNを学習したい

4

写真で一言ボケるサービス

画像

ボケてはスクレイピングしやすい

5

テキスト

ボケてはスクレイピングしやすい

学習済CNNに画像を入力して、最終層のベクトルを使う @mattyaさんのCNNのコードが参考になります https://github.com/mattya/chainer-gogh/blob/master/models.py RNN（LSTM）の入力として画像の特徴ベクトルを入力する Chainerのexamplesに入っているtrain_ptbが参考になります。 https://github.com/pfnet/chainer/blob/master/examples/ptb/train_ptb.py LSTM 1層入力層：dropout 出力層：softmax　 →　Linear (誤差関数でsoftmax_cross_entoropyを使ってるため不要) 誤差関数：softmax_cross_entropy

学習コード

6

CNN

RNN

構造

学習データに対してボケる

7

予測：何回押してももうお湯が出ない </s> （予測文字と同じ文章.）

未知データに対してボケる

8

正解: 「俺の彼女が観に来てくれてる」『俺の彼女もだ』「手振ってる」『俺の彼女もだ』「投げキッスまで」『？ … … 俺の彼女もだ』 </s>

未知データに対してボケる

9

予測：友人の AV コレクションがひたすら顔 </s>

•  Chainerで学習コードを書く時間は短縮できる •  今回500サンプル　→　2万サンプルでやってみたい

•  一応発表に間に合って良かった

•  ボケるRNNはでき…る！？

感想

10

ボケるrnnを学習したい (chainer meetup 01)

Technology