sushi is 何

38
寿司 is Image Classification Problem

Upload: 31-00

Post on 15-Jul-2015

219 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: Sushi is 何

寿司 is 何Image Classification Problem

Page 2: Sushi is 何

by 3100

Page 3: Sushi is 何

寿司とは何かWhat is Sushi?

Page 4: Sushi is 何
Page 5: Sushi is 何
Page 6: Sushi is 何

人は寿司をどう認識するのか

* 視覚 * 嗅覚 * 触覚 * 味覚

Page 7: Sushi is 何

人は寿司をどう認識するのか

* 視覚 ← * 嗅覚 * 触覚 * 味覚

Page 8: Sushi is 何
Page 9: Sushi is 何

常に100%正しい認識とは 限らない

Page 10: Sushi is 何

が、まぁまぁ 上手くいっている

Page 11: Sushi is 何

コンピュータの場合I’m sorry Dave, I’m afraid I can’t do that.

Page 12: Sushi is 何

コンピュータは識別は得意

* 同じ画像ファイルかどうかは判断可能

* トリミングや回転をすると難しくなる

Page 13: Sushi is 何

コンピュータは認識は苦手

* 似たような画像を探すのはまだ研究途上

* 形状や色、パターンなどを手がかりにする方法は制限のある環境でしか良い結果が出にくい

Page 14: Sushi is 何

コンピュータでの画像認識

* SIFT、HOGなどといった手法を用いて、画像から特徴量を算出する * 得られた特徴量からkNNなどの機械学習によって似た特徴量で画像を分類する * 良い分類が得られるまでパラメータを調整する

Page 15: Sushi is 何

SIFT

(http://robwhess.github.io/opensift/)

Page 16: Sushi is 何

SIFT

(http://robwhess.github.io/opensift/)

Page 17: Sushi is 何

SIFT

* 画像中の特徴的な点を128次元の特徴量として算出する * 回転、縮小に強く、雑多な画像の中でも検出可能

* パノラマ写真の合成などで活用

Page 18: Sushi is 何

HOG

(http://www.di.ens.fr/willow/teaching/recvis09/final_project/)

Page 19: Sushi is 何

HOG

* 画像を区分分けし、各輝度の勾配方向を算出する * 画像の中から似た形状を探すのに強い

* 自動運転車の車載カメラで人間の識別など

Page 20: Sushi is 何

そして突然のブレイクスルーBig brother is watching you.

Page 21: Sushi is 何

Deep Learning• 大規模ニューラルネットワークを使った画像分類が2012年の大規模画像認識コンテスト(ILSVRC)で優勝

• ニューラルネットワークを多層構造にすることで、人間が獲得している認識と同じ仕組みを目指す

• 2013年以降、ネットワーク巨大化合戦

Page 22: Sushi is 何

‘コンピューターは猫がどういうものであるか人間に教えられること無く、自力で理解した。’

(Google、脳のシミュレーションで成果……猫を認識 | RBB TODAY http://www.rbbtoday.com/article/2012/06/27/90985.html )

Page 23: Sushi is 何

寿司を認識するI’m addicted to Negi-toro.

Page 24: Sushi is 何

Deep Learning

-> Caffeというツールで体験できる

-> 理論的枠組の知識が足らずよくわからない

-> 専用GPUマシンないと時間かかるらしい

-> パス

Page 25: Sushi is 何

HOG

-> 寿司を検出するのは得意そう

-> 寿司フォーカス写真を作りたいわけではない

(顔フォーカスにHOG使えそう)

-> 寿司の種類を分類できるか不明

-> パス

Page 26: Sushi is 何

SIFT

-> 割りと基本(古典的)ぽい

-> golang実装はなかったが、python実装を見つけた

-> caltech101(101カテゴリ画像)の分類は精度が良いみたい

-> 君に決めた!

Page 27: Sushi is 何

デモ My demo was terrible. I was so young.

Page 28: Sushi is 何

実装

* python with scipy, numpy, vlfeat * flask (for web demo) * flickrpy (for images)

Page 29: Sushi is 何

制限など

* 今回は身近な16種類の分類

* 各ネタごとに50枚の画像を用意(100枚は時間的に無理でした)

* それでもモデル生成に約半日かかった

* 認識精度は約40%。。。

Page 30: Sushi is 何

改善点

* 学習用画像数を増やす

* SIFTは色情報を使わない?のだがRGBごとにSIFTを算出する方法があるらしい

* nginx使うとかでデモサイトを利用しやすく

Page 31: Sushi is 何

画像分類の限界

Page 32: Sushi is 何

“It’s 甘エビ!”, she says.YOU CAN (NOT) REDO.

Page 33: Sushi is 何

(今回の)画像分類の限界

* 先に定義されていないものについては語り得ない * 現実問題として、全世界の事象を認識させるには、時間も空間も足りない

Page 34: Sushi is 何

今後の展望May the Force be with you!

Page 35: Sushi is 何

やはりDeep Learningか

* Caffeに再挑戦したい

* その前にきちんと勉強する必要がありそう

* 全然仕事に関係ないぞ、これ。

Page 36: Sushi is 何

最近読み始めた本

Page 37: Sushi is 何

– Fin

輪読メンバー絶賛募集してます。

Page 38: Sushi is 何

参考資料• 3日で作る高速特定物体認識システム (2) SIFT

特徴量の抽出 - 人工知能に関する断創録

• Caffeで手軽に画像分類 - Yahoo! JAPAN Tech

Blog

• ねこと画像処理 part 1 – 素材集め « Rest Term