deep learning abstract

48
Deep Learning Abstract 株株株株株株株株株株株株株株株株 株株株株株

Upload: ryousuke-wayama

Post on 21-Jan-2017

399 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: Deep Learning Abstract

Deep Learning Abstract

株式会社ノーザンシステムサービス 研究開発部

Page 2: Deep Learning Abstract

2

いきなりですが、

Page 3: Deep Learning Abstract

3

Deep Learningって知ってますか?

Page 4: Deep Learning Abstract

Deep Learningの事例• AlphaGo• Google DeepMindが開発したコンピュータ囲碁プログラム• 囲碁プログラムが勝利するまで

10年かかると言われていた• 計算する分岐数が宇宙に存在する原子の数()よりも多い

• ハンデ無しでプロ棋士に勝利

4

Page 5: Deep Learning Abstract

Deep Learningの事例•画像からキャプションを自動生成• 画像内の物体を認識し、関係性を考慮した文章を生成

•イラスト自動生成• 指定した特徴をもつイラストを生成

5http://qiita.com/mattya/items/e5bfe5e04b9d2f0bbd47

Page 6: Deep Learning Abstract

Deep Learningの事例•運転補助• カメラや各種センサーからの物体認識• 自動運転のハンドル操作

• Siri• 音声認識、文脈理解、音声合成

• Googleでは様々なサービスで Deep Learningを使用• 検索、画像検索、翻訳…

6

Page 7: Deep Learning Abstract

Deep Learningの事例•女子高生 AI「りんな」• Microsoftが Lineや Twitterでサービスを提供している会話ボット• 自然言語処理により会話• サービス開始 1ヶ月でユーザー数 130万人超え• 中国ではりんなのベースとなった女性型会話ボット Xiaoiceと結婚したいという男性も• TVドラマ「世にも奇妙な物語」に出演

7

Page 8: Deep Learning Abstract

Deep Learningの歴史• 1943年 形式ニューロンの考案• 人間の脳細胞、ニューロン・シナプスを元に考案された数式モデル

8ニューロン・シナプス

𝑥2 閾値 h 出力入力𝑥1

𝑥𝑛

𝑦❑

𝑤1

𝑤2

𝑤𝑛

形式ニューロン

結合荷重

Page 9: Deep Learning Abstract

Deep Learningの歴史• 1958年 パーセプトロンの開発• 史上初のニューラルネットワーク• 学習を行なうことで入力されたデータを 2つのクラスに分類

9

第 1次 AIブーム !!

パーセプトロン

𝑥2 𝑓 (.)出力

入力𝑥1

𝑥𝑛

𝑦❑

𝑤1

𝑤2

𝑤𝑛

結合荷重

Page 10: Deep Learning Abstract

Deep Learningの歴史• XOR問題• 線形分離不可能問題を解くことができない

•ブームは急速に下火に→冬の時代へ… 10

線形分離可能 線形分離不可能

現実に存在する多くの問題は線形分離不可能問題

Page 11: Deep Learning Abstract

Deep Learningの歴史• 1986年 誤差逆伝播法• 線形分離不可能問題も解けるように

実際やってみると…•思ったより精度が良くない• 学習に必要なデータの不足• マシンパワーの限界

•冬の時代再来

11

第 2次 AIブーム !!

Page 12: Deep Learning Abstract

Deep Learningの歴史• 人工知能から機械学習に移動する研究者が多数• 異なる分野でも同じ機械学習手法が使える• 特定の対象に特化させることで高い性能が得られる• 機械学習での特徴抽出のチューニングが盛んに          

→特徴の設定が複雑化し各研究室の秘伝のタレのような状態

• 学会に論文を出しても「ニューラルネットは終わった技術」というレッテルを貼られてリジェクトされる

• それでも残っていた研究者は地道に研究を続けた• 1979 年に福島らが開発したネオコグニトロンや、 1990 年代に LeCun らに

よって誤差逆伝搬法による学習法が確立される等、現在に至るディープラーニングの基礎はこの当たりで確立しているが、一部でのみ注目されていた 12

冬の時代の間…

機械学習が盛り上がる一方で人工知能は…

Page 13: Deep Learning Abstract

Deep Learningの歴史• 2000年代後半• 計算機が発達し、大量のデータでの訓練が可能に• Deep Neural Netの出現• 人の視覚野の働きに似た画像特徴抽出

• 視覚野 – 脳にある視覚情報の処理を行なう領域• 階層構造になっており、層が深くなるほど高次の情報を扱える         →これに似た働きをニューラルネットワークで実現• ニューラルネットワークはもともと脳の模倣                →脳科学の発展の恩恵を受ける(スパースネス等)

• Deep Learningという言葉が登場• まだ一部の研究者のみ注目している状況 

13

サルの脳の視覚野の構造

Page 14: Deep Learning Abstract

Deep Learningの歴史• 2010年代• 画像認識コンテストでニューラルネットワークを用いた手法が     2 位に大差をつけて圧勝

• 2 位の誤認識率約 0.26に対して 1 位は約 0.16• 画像の専門家ではない研究者が達成• 機械学習界隈に衝撃が走る

• Googleが Youtubeの動画をニューラルネットワークに学習させたところ、猫を認識するようになった

14

第 3次 AIブーム !!

Page 15: Deep Learning Abstract

Deep Learningと機械学習の違い• 従来の機械学習

• 何を使って判別すればいいのか人間が教える必要がある• 人間が判別に使用する特徴を抽出し機械学習に渡す

• 学習するまでに事前準備が必要• 特徴の設定は各領域の専門家による職人芸

• 学習させた判別器は特定の条件やドメインに特化→有効な範囲が狭い• タバコ自販機の顔認識による年齢判別→顔をしわくちゃにすれば高い年齢と判別される

• 計算が速いので多少誤差があってもいいところには使われてきた• プリクラやカメラの顔検出

15

Page 16: Deep Learning Abstract

Deep Learningと機械学習の違い• Deep Learning• 判別に必要な変数、特徴を自分で抽出する             →人間が特徴抽出したりベクトルに変換したりする必要がない• 特定の課題に特化しているわけではないため様々なタスクに利用できる→汎化性能が高い

16

Page 17: Deep Learning Abstract

Deep Learningの現状•様々な大手企業がDeep Learningに注目• Google, Microsoft, Baidu, Facebook,トヨタ、ドワンゴ…• Deep Learningへの投資も盛ん

• Baiduがシリコンバレーに研究所を作る• トヨタがシリコンバレーに人工知能技術の研究・開発の拠点として新会社設立• トヨタがマサチューセッツ工科大学、スタンフォード大学と連携研究センターを設立し今後 5年間で 5000万ドル投資すると発表

• 人材の奪い合いが勃発• 会社の買収

• GoogleがDeep Mind Technologiesを 4 億ドル(約 420 億円)で買収• 研究者のヘッドハンティング

• Baiduがスタンフォード大の教授を研究所所長に迎え、              300 億円を研究予算として投資• Facebookが人工知能研究所を設立し、ニューヨーク大の教授を所長に招く

17

Page 18: Deep Learning Abstract

Deep Learningの現状• 日本は遅れている• 冬の時代に研究者が人工知能関係から離れて機械学習へ

• 2度も冬の時代を経験していたので Deep Learningに懐疑的な人が多かった• 最近は産学官で盛り返しつつある• 人工知能専門の研究所の設置

• ドワンゴ人工知能研究所、産業技術総合研究所 人工知能研究センター…• 人工知能関連領域の研究者の育成

• 東大「先端人工知能学教育寄付講座」にドワンゴ、トヨタなどが 9 億円寄付

18

Page 19: Deep Learning Abstract

Deep Learning界隈の問題• ImageNet問題 (1)• Deep Leaeningは学習用のデータセットを作成するのが大変

• 精度を上げるには大量のデータが必要• そこに ImageNetと呼ばれるスタンフォード大の研究者 Fei-Fei Li 氏が作成した 1400万枚にもおよぶ画像データセットが登場

• Deep Learningの研究が盛んに• 皆このデータセットばかり使い始める

• 研究段階であれば問題ないが実際に使うとなると汎用性から問題に

19

ImageNetのデータセットだと精度が高いのに、他のデータセットだと精度ががた落ち

Page 20: Deep Learning Abstract

Deep Learning界隈の問題• ImageNet問題 (2)

• 実用化するには ImageNet 以外のデータセットも使って学習させる必要がある• Googleは画像・動画とコメントの組み合わせをもつコンテンツを持っている  →自分たちで画像データセットを作成することが比較的容易

• データセットを作成できるコンテンツを持っていない他のところは?• データセットをどうやって作成するかが重要になっている

• クラウドソーシングを使って安価に大量の画像データにラベリングしてもらう• そもそもデータセットがいらない教師無し学習や遺伝的アルゴリズム、強化学習なども有望そう

• ドワンゴがニコニコ動画の動画 IDとコメントデータを公開• コメントデータは時系列データのため動画内のシーンとコメントの紐付けが可能→教師データとして使える?

20

Page 21: Deep Learning Abstract

Deep Learning界隈の問題•計算資源の格差 (1)

• Deep Learningは学習の計算処理にとても時間がかかる• 層を多くすれば性能が向上するが行列計算が多くなる              →効率的に計算するには並列処理が重要に• CPUのコア数: 22 基( intelのサーバー向け CPU Xeon E5 v4 )• GPUのコア数: 3072 基( GeForce GTX TITAN X)

• 繰り返し実験を行なうには高性能なマシンが必要• Googleは数千台規模のサーバーをつないで一台                  のスーパーコンピュータのように使っている• Deep Learning 専用の TPUや量子コンピュータも開発

• 十分な計算資源を持てるのは大企業などに限られてくる                        21

Deep Learningには GPUがないと話にならないとまで言われるように

計算資源を持たないところとのレベル差が大きくなるGoogle が開発した TPU (左)と、量子ビット(右)

Page 22: Deep Learning Abstract

Deep Learning界隈の問題• 計算資源の格差 (2)

• 日本の計算資源• ディープラーニング専用GPUサーバーファーム「紅莉栖 (くりす )」(ドワンゴ)

• 全脳アーキテクチャ勉強会で発表する研究については無償貸し出し• さくらインターネットがDeep Learningなどの機械学習向けのサービス「高火力コンピューティング」の提供を開始• スーパーコンピュータ TSUBAME2.5(東工大)

• GPUを搭載したスーパーコンピュータ• 学外の研究機関・民間企業でも                        使うことができる

• PEZY Computing• スーパーコンピュータ向けのメニーコア プロセッサの開発を行なっている会社

• クラウドサービス• Amzon EC2でGPUインスタンスやGoogle の machine learning(ベータ公開中 )を学習時使うのもいいかも 22

Page 23: Deep Learning Abstract

23

Deep Learning界隈の問題•計算資源の格差 (3)• NVIDIAが様々なデバイスを開発• 車載用の自動運転開発キットを作成

• NVIDIA DRIVE PX2 – 車載デバイスとして開発された、自動運転車向け AI 搭載コンピュータ。• 組み込み系のデバイス

• NVIDIA JETSON TK1/TX1 – 組み込みプラットフォーム。• NVIDIA Tegra – モバイル向けプロセッサ。 Nintendo Switchにも採用。

• Deep Learningのライブラリ Tensorflowは iOS, Androidでも動かせる →スマートフォンでもDeep Learningを動かせる

Page 24: Deep Learning Abstract

Deep Learningの欠点•結果がどのように導き出されたのかわからない• 結果が出された過程がブラックボックス化

• 人間には理解できない内容になっている• 例: AlphaGoの敗因

• プロ棋士と対戦し 4勝 1 敗• 負けた局では悪手を連発                         → AlphaGoの製作者にも原因がわからなかった

24

Page 25: Deep Learning Abstract

Deep Learningの欠点•ブラックボックス化しているシステムを使っても大丈夫?• 問題が起きたとしても原因の特定が困難• 重要なタスクにはまだ使い辛い• 例:テスラ・モーターズの自動運転で死亡事故

• トレーラーの色が原因で誤認識したのではないかと              推測はされているが明確な答えはまだ出ていない

• 将来的にブラックボックス化した内容を人間に理解できるように解析する Deep Learningが登場するのでは?• デバック用になぜそのような判断をしたのか理由をログに出力など

25

Page 26: Deep Learning Abstract

Deep Learningの有望性•人間の補助という使い方• Watson

• IBMが作成したコンピュータシステム• 2000万件もの医学論文を学習• 医師にもわからなかった白血病患者の病気を特定• 最終的にこの判断に従うことを決定したのは人間の医師

•人間が最後の責任を持つような使い方であれば有効的に使うことができる

26

Page 27: Deep Learning Abstract

研究開発部での Deep Learning• 今まで人間には原因がわからなかった現象などについて

DeepLearningを用いると…

27

人間に新しい知見をもたらし様々な技術の発展につながる…かも?新たな特徴や法則性を発見!

Page 28: Deep Learning Abstract

研究開発部での Deep Learning•地震予測• 現在の地震予測は統計的手法によるもの• Deep Learningで学習することにより人間にはわからなかった特徴から地震を予測できるようになるのでは?• 時系列予測を行なう PredNetを地震波のデータ( IRISから取得)で学習

28

現在の取り組みとしては・・・

Page 29: Deep Learning Abstract

29

最近の Deep Learningの動向•人間の代わりに物理実験を行なう AI• 超低温のガス Bose-Einstein condensate(ボース=アインシュタイン凝縮)を作成する実験

• 作成時のパラメータをコントロールして効率的な作り方を見つける• AIは実験のやり方を 1時間足らずで覚える• 人間が考えもしなかった複雑な実験手法を編み出すことを期待

• 現在の作成手法を開発した研究者たちはノーベル賞を受賞 → AIが新しい手法を開発したらノーベル賞に匹敵?シンギュラリティが早まるのでは?

Page 30: Deep Learning Abstract

30

最近の Deep Learningの動向• Deep Learningでキュウリの仕分け• キュウリ農家が Deep Learningを使ってキュウリ仕分け機を自作

• 3つのカメラ画像からキュウリの等級を判別• 精度は 7~ 8割

• 時間のかかる仕分けを自動化することでおいしい野菜を      作ることに時間を割ける• Google Cloud Platform Japanの公式ブログでも紹介 (

http://googlecloudplatform-japan.blogspot.jp/2016/08/tensorflow_5.html)• 農林水産省も視察しており日本政府も注目

Page 31: Deep Learning Abstract

31

最近の Deep Learningの動向• Wavenet• Google DeepMindが開発した自然な音声を生成する DNN• 既存の合成音声の多くは音声の断片を繋ぎ合わせている →音声の種類によってそれぞれのデータベースが必要• Wavenetは音声の波形を直接生成するためデータベースはいらない• しかも、従来の手法よりも自然な音声を生成• 未知の言語の音声や楽器で演奏した音楽を作成することも可能• https://deepmind.com/blog/wavenet-generative-model-raw-au

dio/

Page 32: Deep Learning Abstract

32

最近の Deep Learningの動向• Differentiable Neural Computers(DNC)

• Google DeepMindが提案した外部メモリを持つニューラルネットワークモデル• 時系列処理を行なううえで、毎時刻の通常の外部入力に加えて外部メモリから読み出したデータを入力• 外部メモリを使うことで今まで扱えなかった複雑な情報処理が可能に →従来のニューラルネットでは特定のフレームに特化しないと難しかったタスクを解決• http://qiita.com/yos1up/items/599ff75c876f6f94d249• https://deepmind.com/blog/differentiable-neural-computers/

Page 33: Deep Learning Abstract

33

最近の Deep Learningの動向• 3D-GAN(3D Generative Adversarial Network)• 入力された画像を元に 3Dモデルを生成• https://arxiv.org/pdf/1610.07584v1.pdf

Page 34: Deep Learning Abstract

最近の Deep Learningの動向•入力されたモノクロ画像から色を予測してカラー化• https://github.com/satoshiiizuka/siggraph2016_colorization

34

Page 35: Deep Learning Abstract

35

最近の Deep Learningの動向•画像内のオブジェクトを抽出し、オブジェクトが何か分類する• https://github.com/facebookresearch/multipathnet

Page 36: Deep Learning Abstract

36

最近の Deep Learningの動向• DCGAN• https://arxiv.org/pdf/1511.06434v2.pdf• 画像生成技術• ベクトル化した概念で演算を行い画像を生成することが可能

• パラメータ zの差が意味ベクトルとなるzの値域

Z3 Z1

サングラスベクトル

Z2

女性ベクトル

Page 37: Deep Learning Abstract

37

デモ:イラストの自動生成•指定した特徴をもつイラストを自動で生成• デモ: http://mattya.github.io/chainer-DCGAN/

Page 38: Deep Learning Abstract

38

デモ:画像の自動生成• iGAN - ユーザが描いたガイド線を元に画像を生成• http://www.creativeai.net/posts/yLomAt5GqaRrbkW9g/igan-int

eractive-image-generation-powered-by-gan

Page 39: Deep Learning Abstract

39

最近の Deep Learningの動向• DCGANの発展• 静止画から動画を作成

• http://web.mit.edu/vondrick/tinyvideo/

Page 40: Deep Learning Abstract

40

最近の Deep Learningの動向• DCGANの発展• マルチモーダル変換

• http://web.mit.edu/vondrick/cmplaces_pami.pdf• 写真、イラスト、スケッチ、テキストなどを相互に変換

Page 41: Deep Learning Abstract

Deep Learningを実装するには?•プログラム言語は Python• スクリプト言語で機械学習系ではよく使われている

• 標準ライブラリが多く、数学系の計算が得意• Deep Learningの主なフレームワーク• Caffe

• Deep Learningのライブラリでは老舗• 研究や論文で使われていることが多い

• TensorFlow• Google 製の分散行列計算ライブラリ(機械学習以外にも使えるらしい)

• Chainer• Preferred Networks社(機械学習や人工知能系に特化した日本の企業)が開発した日本産のライブラリ• 日本語の情報やサンプルコードが多い 41

Page 42: Deep Learning Abstract

参考になりそうな資料• Preferrd Instructure(PFI) - https://preferred.jp/

• Deep Learning や機械学習をメインにしている日本の会社• 研究会などの資料をあげてくれている。最新の論文をサーベイするときにチェックして

おくと良いかもしれない

• cvpaper.challenge - https://twitter.com/CVpaperChalleng• サーベイした論文をピックアップ

• Qiita - https://qiita.com/• DeepLearning とかライブラリ名とかで検索するといいかも

• オンライン機械学習、深層学習(書籍)• PFI の中の人が書いた書籍。 must-read!

• Stack Overflow - http://stackoverflow.com/• Python 等様々なプログラミングの Q&A サイト

42The last programming book you'll ever need

Page 43: Deep Learning Abstract

参考になりそうな資料• 資料作成で特に参考にしたもの• http://www.slideshare.net/pfi/deep-learning-22350063• http://www.slideshare.net/beam2d/deep-learning-22544096• http://www.slideshare.net/Takayosi/deep-learning-seminar• http://www.gdep.jp/seminar/20150526/DLF2015-01-MATSUO.p

df

43

Page 44: Deep Learning Abstract

44

Deep Learningの展望• Deep Learningはあらゆる分野に波及していく• CVPR2015では Deep Learning 系の論文が 4割だったが CVPR2016では

8割に増加• Google Brain チームが AIを使った暗号技術の実験• 他にも様々な分野で AIの導入が模索されている

• キュウリの仕分け、物理実験、裁判官 AI、株取引…• Differentiable Neural Computers(DNC) - 外部メモリをニューラルネットワークに追加することで、特定のフレームに特化しないと難しいと思われたタスクを解決 →汎用性が向上しより多くの分野のタスクが解決できることが期待できる

Page 45: Deep Learning Abstract

45

Deep Learningの展望•現在の Deep Learningは過渡期であり進歩が著しく速い• 著作権の問題• Deep Learningが作り出した成果物の著作権は誰のもの?

• アプリを使ったユーザ?アプリの制作者?学習データの作者?• 学習効率を上げる蒸留

• 高度な NNの出力結果をよりシンプルな NNに再学習させる手法 →高度な NNとほぼ同等の性能をコンパクトな NNに簡単にコピーできてしまう

法整備が追いついていない

Page 46: Deep Learning Abstract

46

Deep Learningの展望•オバマ大統領が AI未来戦略レポートを発表し、 MITメディアラボの所長と AIについて対談• AIに仕事を奪われた人のために最低所得保障が必要?• 米政府も AIに注目している

Page 47: Deep Learning Abstract

47

Deep Learningの展望•世界規模で AIが社会に与える影響を重要視• G7 情報通信大臣会合で AI開発、 8原則を大筋合意

• AIの研究開発についての安全性の確保などの原則

•人工知能技術戦略会議の設置• 総務省・文部科学省・経済産業省が AI 技術の研究開発において連携• AI 技術の研究開発と成果の社会実装を加速化させる• 若手研究者の支援や人材育成プログラムなどを計画

日本でも…

日本での今後の AI 技術の発展に期待

Page 48: Deep Learning Abstract

48

ご清聴ありがとうございました