ボケるrnnを学習したい (chainer meetup 01)
TRANSCRIPT
佐藤 元紀(さとう もとき) 来年4月からNAIST松本研に行く予定 休学中のM1です @aonotas あおのたす
Chainer Meetupの参加枠に漏れる →LT枠で参加を決める(水曜) ボケるRNNを学習しよう! →学習コードを動かす(木曜) →学習が終わらない (今ココ 2時間前) →バグが見つかる (1時間前) →一応学習できた…? 温かい目で見守ってください。
自己紹介
2
Karpathy, Andrej, and Li Fei-Fei. "Deep visual-semantic alignments for generating image descriptions." arXiv preprint arXiv:1412.2306 (2014).
画像をRNNで説明する研究
3
1. CNNで特徴抽出 2. RNN(LSTM)で説明文を生成
学習済CNNに画像を入力して、 最終層のベクトルを使う @mattyaさんのCNNのコードが参考になります https://github.com/mattya/chainer-gogh/blob/master/models.py RNN(LSTM)の入力として画像の特徴ベクトルを入力する Chainerのexamplesに入っているtrain_ptbが参考になります。 https://github.com/pfnet/chainer/blob/master/examples/ptb/train_ptb.py LSTM 1層 入力層:dropout 出力層:softmax → Linear (誤差関数でsoftmax_cross_entoropyを使ってるため不要) 誤差関数:softmax_cross_entropy
学習コード
6
CNN
RNN
構造
未知データに対してボケる
8
正解: 「 俺 の 彼女 が 観 に 来 て くれ てる 」 『 俺 の 彼女 も だ 』 「 手 振っ てる 」 『 俺 の 彼女 も だ 』 「 投げ キッス まで 」 『 ? … … 俺 の 彼女 も だ 』 </s>