meta-learning with memory augmented neural network

渡辺有祐 (ソニー)

Meta-Learning with Memory-Augmented Neural Networks

ICML2016読み会

自己紹介

• 発表者: 渡辺有祐 (わたなべゆうすけ) • 著書｢グラフィカルモデル｣ (機械学習プロフェッショナルシリーズ)

• 所属: ソニー株式会社

• 機械学習関係の研究開発を行っている。 (最近は主にDeep Learning) • 2016年9月から一年間、会社派遣で、Ruslan Salakhutdinov先生 (CMU) の

研究室に留学予定

論文ひとことまとめ

Neural Turing Machine を One-Shot Learning に応用しました

Neural Turing Machine (NTM) とは [Graves+2014]

• NTMとは、外部記憶装置(メモリー)と、その読み書き機能を備えたNeural Network

• コピーやソートなどのアルゴリズムを学習することが出来る • Neural Network なので Back Propagation で学習できる

Controller

Memory Read Head Write Head

input output

メモリーとその読み書き機能も含めて、全体が Neural Network になっている!

例: NTMによる、系列2倍コピータスクの学習

入力系列出力系列

0100 011

01000100 011011

110111 110111110111

入力系列を2倍にコピーした系列になっている

10010 1001010010

学習時

アルゴリズムの入力系列と出力系列を教師データとして、 NTMを学習させるとそのアルゴリズムを学習することが出来る

例: NTMによる、系列2倍コピータスクの学習

NTMは入ってきた系列を順にメモリに書き込み、それを2回、順に読みだす

入力系列出力系列

010111000 010111000010111000

controller

010111000010111000

テスト時

010111000

One-Shot Learning とは

通常のNNの学習

1つ(少数)の例を見ただけで認識出来るようにしたい

One-Shot Learning

たくさんの教師データが必要

1つ見ただけで憶えたい (人間なら出来る!!)

One-Shot Learningの簡単なやり方: NN algorithm

このアプローチの課題 • 画像の類似度はどのように測ればよいのか? • Nearest-Neighbor アルゴリズムは最適か?

学習時

学習データの画像を全て丸暗記

テスト時

記憶の中で一番近い画像を答える

トリナクリア

トリナクリア!

⇒ NTMをつかって、Nearest-Neighborアルゴリズム (よりも良いアルゴリズム) を学習しよう

ピザ弥勒菩薩

論文概要

• Neural Turing Machine (NTM) を改変した、Memory-Augmented Neural Network (MANN) を提案

• One-Shot Learning を MANN によって行う • Omniglotデータセットで評価し、高性能を達成

Ominglotデータセットとは

• 多様な文字種の手書き文字画像からなるデータセット • 文字は1623種類, 各文字画像が20枚

• 最初に学習用とテスト用に文字種を分ける • 1200文字種を学習に、423文字種をテストに使う

タスク設定

• この一連のプロセスをエピソードと呼ぶ • エピソードの冒頭では、番号はランダムに推定するしかない • エピソードの後半に行くにつれて、正答率が上がってくる。

• 素早く正答率が上がる = One-Shot Learning がよく出来る

“少数の文字例を見ただけで、すぐに認識できるようになる” というタスクを学習させたい

記憶

タスク設定

記憶

タスク設定

記憶

タスク設定

1 2 不正解!

記憶

タスク設定

1 2 不正解! 2

記憶

タスク設定

記憶

タスク設定

記憶

タスク設定

記憶

タスク設定

3 1 不正解! 2

記憶

タスク設定

3 1 不正解! 2 1

記憶

タスク設定

記憶

タスク設定

記憶

タスク設定

記憶

タスク設定

2 正解! 2 1

記憶

タスク設定

2 正解! 2 1

以下50回続く...

記憶

エピソードの作り方

1. 文字種を5つ選び、1～5までの番号をランダムに振る 2. 各文字種類から10枚画像を選ぶ 3. この50枚の画像をランダムにシャッフルする:

(𝑥𝑥𝑡𝑡 ,𝑦𝑦𝑡𝑡) 𝑡𝑡=1,…,50

タスク: 画像𝑥𝑥𝑡𝑡を見せて、その番号(1～5)を答えさせる。その直後に正解番号𝑦𝑦𝑡𝑡を見せる。

1 episode

学習とテストの流れ学習時

テスト用のエピソードには、学習に使った文字はない

テスト時

大量のエピソードで学習

(文字の見分け方を学習)

アいアいうアうえおお...アお

ああはイイういははあ...イう

らむららももあむよよ...よも

エピソード長=50

ฆ ญฆ ฆช ฆ ... ค กข

1エピソードの中で、素早く正答率が上がれば、One-Shot Learningがよく出来たことになる

実験結果

MANN (提案手法)

LSTM (ベースライン)

40000エピソード程度学習すると、2例目で8割程度正解できる

• 学習のやり方はMANNの時と同じ • LSTMでは上手く学習できていない。原因と

しては、LSTMのセルでは、過去のデータを確実に記憶できないとかんがえられる。

n-th instance = 各ラベルの文字画像をn回目に見た時の正答率

実験結果 (数値)

• Human: 人間がこのタスクに挑戦した時の性能 • Feedforward: 正答率は1/5

実験結果: 他の手法との比較

• Nearest-NeighborアルゴリズムよりもMANNの方が高性能

• コントローラがFeedforwardのMANNは、メモリには記憶を蓄えることができる。

• LRUA(後述)が無いMANN (NTM) は性能が低い

(※今回説明した実験設定と若干異なる)

Read Head

MANNのアーキテクチャ模式図

( , 𝟎𝟎,𝟎𝟎,𝟏𝟏,𝟎𝟎,𝟎𝟎 )

Controller

Memory Read Head Read Head Read Head Write Head

LSTM cell_size=200

𝒊𝒊 はメモリの番地を表す

(write weightの計算方法は後述)

MANNのアーキテクチャ数式

• 読み出しキー𝒌𝒌𝒕𝒕から、メモリ上読みだす箇所を決める

(read weight)

𝒊𝒊 はメモリの番地を表す

• 書き込み: ラベルと画像のペアをメモリに格納する

値𝒂𝒂𝒕𝒕 をwrite weight に従ってメモリに書き込む

write weight の計算

least used weight 最近使われていないメモリ領域を表す重み

(後述)

MANNのアーキテクチャオリジナルNTMとの違い

• MANN は Least Recently Used Access (LRUA) の機能がある

• MANNは location-based addressing を用いない

used weight の計算

※正確には、used weightの小さい、上位m個で、値を1にする

新しい画像の情報は、まだ使っていないメモリの番地に書き込みたい。LRUA機構がそれを可能にしている。(LRUAがないとうまくいかない)

meta-learning with memory augmented neural network

Engineering

analisis dan implementasi long short term memory neural...

augmented gesundheit

meta-learning with memory augmented neural network

verkenning : wetenschappelijke inzichten over hypnose ·...

image understanding with organic...

neural activation by milnacipran and memory extinctionamong...

effects of cognitive training on attention and neural...

[emnlp2016読み会] memory-enhanced decoder for neural...

linguistic knowledge as memory for recurrent neural...

ousoderedesneurais convolucionaisetotalmente … · 2019....

memory internal memory and external memory

fpga implementation of a lstm neural networkabstract the...

memory training. memory: sensory memory vs. short-term...

gafi mélanie arthur pascale rachid -...

augmented warnings

szakdolgozatdigitus.itk.ppke.hu/~garay/lehoczky_zsombor... ·...

memory plus meta-learning - jaewonchung.me · memory +...

2.1 augmented reality - siam university · 2.1...

learning and memory: a comprehensive reference, 2e. · a...

long short-term memory untuk generate image...