cvpr 2011 imagenet challenge 文献紹介

28
CVPR/ICCV 2011 輪講 2012/5/14 なりひら

Upload: narihira-takuya

Post on 07-Jul-2015

1.231 views

Category:

Technology


0 download

DESCRIPTION

[2010] Large-scale Image Classification: Fast Feature Extraction and SVM Training [2011] High-dimensional signature compression for large-scale image classification

TRANSCRIPT

Page 1: CVPR 2011 ImageNet Challenge 文献紹介

CVPR/ICCV 2011 輪講2012/5/14なりひら

Page 2: CVPR 2011 ImageNet Challenge 文献紹介

紹介内容

●ImageNet challengeの2010,2011 Winnerの報告● 2010 NEC-UIUC (CVPR2011) 紹介● 2011 XRCE(CVPR2011) 概要紹介

●ImageNet Challenge 2012● Fine-Grained classificationが追加● 多分有力:Yao Bangpeng, Fei-Fei Liら

Page 3: CVPR 2011 ImageNet Challenge 文献紹介

ImageNet Challenge● 大規模データセットImageNetを使った画像認識コンペ

とんでもないクラス数

とんでもないサンプル数

Page 4: CVPR 2011 ImageNet Challenge 文献紹介

評価方法

● Ground Truth– N classes labels / image

● アルゴリズム

– Top 5 classes labels / image● 評価

– [ sum [5 classesとも当たっていなければペナ1 for n=1:N] for i=1:numImage ]

Page 5: CVPR 2011 ImageNet Challenge 文献紹介

j

ImageNet Challenge 2010 Winner

(Published in CVPR 2011)

Page 6: CVPR 2011 ImageNet Challenge 文献紹介

The Contribution of this paper

新しいアルゴリズムは目的じゃない

中規模データセット(PASCAL VOCなど)の時と同等の性能で

効率的大規模データセット問題を解くこと

1. Hadoopによる特徴抽出並列化2. 大規模データでのSVMの効率的な学習

Page 7: CVPR 2011 ImageNet Challenge 文献紹介

中規模データセットでのState-of-the-art

HoG (Shape), LBP (Texture)Multi-scale 16, 24, 32

LCC: Sparse codingより改善Super-vector: 高次特徴量

Poolingになんとなく位置情報

Feature mapping次第で線形でいける

Page 8: CVPR 2011 ImageNet Challenge 文献紹介

大規模に適用しようとすると(1.2M画像、1000クラス)

〜208日(一枚〜15秒)

250日 Liblinear, svnlight etc.

No more than 500px at either side

Page 9: CVPR 2011 ImageNet Challenge 文献紹介

ScSPM: Sparse coding + Spatial pyramid pooling

spatial max pooling CVPR2009 average pooling

Histogram max pooling multiscale max pooling

Page 10: CVPR 2011 ImageNet Challenge 文献紹介

LCC JinJun Wang et al, CVPR2010

Sparse codingよりも速く性能も高いcoding方法

解析的に係数が求まるので速い

Page 11: CVPR 2011 ImageNet Challenge 文献紹介

Super-vector coding

Page 12: CVPR 2011 ImageNet Challenge 文献紹介

特徴量の規模

ぐぬぅ…

Page 13: CVPR 2011 ImageNet Challenge 文献紹介

Feature extractionをHadoopで配列化

● 特徴量計算はサンプルで独立だから並列化しやすい

● 流行のHadoop使ってやったぜ

208日 → 2日(120 workers)

Page 14: CVPR 2011 ImageNet Challenge 文献紹介

詳しくはWEBで  ぽち 

Page 15: CVPR 2011 ImageNet Challenge 文献紹介

SVM学習

1000 クラス 1-vs-all binary classifiersを学習

前述のとおり特徴量はとんでもないサイズ

SVN^light LibSVMなどはBatch最適化だから無理

Stochastic Gradient DescentでやるAveragingバージョンは更に良い

1000クラスでmemory sharingするとI/O効率的

Page 16: CVPR 2011 ImageNet Challenge 文献紹介

SVMのコスト関数

正則化+ヒンジロス

Page 17: CVPR 2011 ImageNet Challenge 文献紹介

コスト関数の偏微分

Page 18: CVPR 2011 ImageNet Challenge 文献紹介

Stochastic Gradient Descent (SGD)

サンプルごとの勾配でwを更新

Page 19: CVPR 2011 ImageNet Challenge 文献紹介

Averaging Stochastic Gradient Descent (ASGD)

超シンプル大規模データでないと上手くいかないらしい

2次のSGDと同様な収束性能Hesseの計算の必要なし

ちょっとした計算テクニックも紹介

Page 20: CVPR 2011 ImageNet Challenge 文献紹介

ASGD SVMの並列化

● File I/Oがボトルネック(Readだけで19 hours)

● Bin classifier x 1000 を並列化

● データセットをメモリ共有

250日 → 4日(6x12 workers)

Page 21: CVPR 2011 ImageNet Challenge 文献紹介

Results

セット5の結果

Page 22: CVPR 2011 ImageNet Challenge 文献紹介

ASGD v.s. SGD● ASGD converged

very fast!

Page 23: CVPR 2011 ImageNet Challenge 文献紹介

性能

● Classification accuracy: 52.9%

● Top 5 hit rate: 71.8%

Page 24: CVPR 2011 ImageNet Challenge 文献紹介
Page 25: CVPR 2011 ImageNet Challenge 文献紹介
Page 26: CVPR 2011 ImageNet Challenge 文献紹介

ImageNet Challenge 2011 Winner (Published in CVPR 2011)

Page 27: CVPR 2011 ImageNet Challenge 文献紹介

ポイント

高次元特徴量(+線形識別器)を使うと性能良いのは知られている

しかし、高次元(Fisher Vector)を扱うのは大変

良い特徴量圧縮方法Product quantizationを使うHash Kernelよりも性能が落ちない

Page 28: CVPR 2011 ImageNet Challenge 文献紹介

力尽き…