devlove20140823

50
プログラマは にんしきぎじゅつ をおぼえた! 2014.8.23 来栖川電算 山口 陽平 DevLOVE 甲子園 2014 西日本大会 ~ ラジオ体操で磨く認識技術 ~

Upload: youhei-yamaguchi

Post on 31-May-2015

796 views

Category:

Education


0 download

DESCRIPTION

認識技術をやれるチームを作るための方針について書かれています。

TRANSCRIPT

Page 1: DevLOVE20140823

プログラマは にんしきぎじゅつ をおぼえた! 2014.8.23 来栖川電算 山口 陽平 DevLOVE 甲子園 2014 西日本大会

~ ラジオ体操で磨く認識技術 ~

Page 2: DevLOVE20140823

今日の話すこと

• 自己紹介&会社紹介

• 毎朝体操 ← ンストールしておこう!

• ラジオ体操を題材に認識技術を学ぶ

• これから重要になること

• みんなでラジオ体操

Page 3: DevLOVE20140823

自己紹介&会社紹介 要するに技術力で開拓するタプ

Page 4: DevLOVE20140823

• 必要なら何でも徹底的にやる研究者

– プログラミング言語・データベース分散

– 機械学習・アルゴリズム・バイナリハック

– 文字認識・物体認識・モーション認識

– 名古屋工業大学出身・未踏ソフトウェア経験

• 人を驚かせるのが好きな36歳児

– ハードリアルタイムJavaVM

– 1000台越え構成のペタバイト分散DB

– 秒間1000万クエリ処理できるKVS

– 超多クラス対応で超高速な物体認識・モーション認識

山 口 陽 平 @melleo1978

※あくまでもメージです。 実物に髪の毛はありません。

Page 5: DevLOVE20140823

• 概要:10年以上 – 名古屋工業大学発ベンチャー(2003年)

• 目的:ロボの頭脳を作る – 知的インターフェイスによる社会の変革

– ソフトウェアの品質・生産性の向上

• スタッフ:31人 – 役員3人〃正社員14人〃見習い7人

– データ作成6人〃家政婦1人

– IPA未踏ソフトウェア経験者多数

• 社風:難しことを楽しく – 職人〃挑戦〃自由〃昼食・夕食・飲み会は無料

来栖川電算 http://kurusugawa.jp/

弊社が目指すロボ ※写真はあくまでもメージです。

Page 6: DevLOVE20140823

事業戦略 知的ンターフェスでよりユーザの近くへ

• 新領域に挑戦

– コンサルティング〃開発〃大規模インフラ構築

– 技術研究・評価

– データ作成

– ライセンス提供

– コンシューマサービスnew!

Page 7: DevLOVE20140823

情景画像文字認識 来栖川電算の

Page 8: DevLOVE20140823

情景画像文字認識とは

スマホなどで撮影した画像から文字を読み取る

Page 9: DevLOVE20140823

情景画像文字認識とは

様々なパース、様々なレゕウト、様々な書体

Page 10: DevLOVE20140823

情景画像文字認識とは

いわゆる “OCR” とは ”扱う画像” が違う

• 悪環境下での文字認識 – 手書き・様々な書体・かすれ・点描・きつい

パース・統一性のない並び・逆光・陰・影・グラデーション・モアレなど

• 使える場面 – 屋外でのスマホカメラを使った棚卸し

– 車載カメラからの標識認識

– 商品パッケージからの成分情報抽出

– キーワードによるアルバム・ビデオの頭出し

Page 11: DevLOVE20140823

事例:タンゴチュウ Twitter で情景画像文字認識を体験できるサービス

Page 12: DevLOVE20140823

物体認識 来栖川電算の

Page 13: DevLOVE20140823

物体認識とは

画像中の物体の種類・位置・姿勢を推定

Page 14: DevLOVE20140823

物体認識とは

様々な向き・ポーズを学習させ見えの多様性を獲得

• 特定物体認識は素人でも簡単に使える

– どんな画像を学習に使うかを学べばOK

Page 15: DevLOVE20140823

物体認識とは

モノをカウント、見た目で分からない情報を表示

• 使える場面

工場内で箱の仕分け

体験や評判の調査

ワンラベルで情報検索

AR付箋

集めて応募キャンペーン

ARフゖギュゕ

Page 16: DevLOVE20140823

事例:1000sors 誰でも簡単に使えるクラウド型物体認識エンジン

• 広い適用範囲 – 照明姿勢の変化に強く、様々な撮影環境に対応

• 驚異的な精度 – 数十万種類をほぼ完ぺきに識別

• 圧倒的な性能 – たった1台のPCで数百万種類を瞬時に識別 – 台数を増やせばリニアにスケールアウト

Page 17: DevLOVE20140823

事例:ShotSearch 表紙を撮影すると発売日や口コミが分かるゕプリ

• きついパースも、帯による隠れも、OK

Page 18: DevLOVE20140823

事例:ShotSearch 表紙を撮影すると発売日や口コミが分かるゕプリ

• よく似ていても、複数冊同時も、OK

Page 19: DevLOVE20140823

顧客事例:Cellars 18万件のワンラベルを認識するゕプリ

• 海外で賞を獲得した日本企業のゕプリ! – Asia Smartphone Apps Contest

• 広告マーケテゖング部門 Silver Award 2位

– 立命館大学 学生ベンチャーコンテスト • 最優秀賞 NICT賞

Page 20: DevLOVE20140823

事例:自動運転関連 車載カメラに映る車や人などを検出・識別・追跡

• 単眼でも高精度、大きさ・距離も推定

膨大な走行データを活用

Page 21: DevLOVE20140823

モーション認識 来栖川電算の

Page 22: DevLOVE20140823

モーション認識とは

センサー値から動作や行動の種類や位置を推定

Page 23: DevLOVE20140823

事例:ラフログ NTTドコモ様との共同研究プロジェクト

• リストバンドなどから行動を検出・分析

– 睡眠〃デスクワーク〃静止〃歩き〃走り〃自転車〃乗り物〃…

– 「行動 ≠ 動作」なものもいける

• リゕルタム:数秒 ~ 数分で検出

Page 24: DevLOVE20140823

事例:毎朝体操 スマホを持って体操すると腕の動きを認識・採点

• みんなのデータでどんどん賢く

Page 25: DevLOVE20140823

モノマネCOLLECTION ソーシャル型ジェスチャー認識 new!

• まねしてみた

– 仮面ライダーの変身ポーズ

– 波動拳・昇竜拳

• 踊ってみたを採点してみた

– プリキュアのダンス

– ようかい体操第一

• これをやるには次が必須

– スマホの中でオンライン学習

– モーションデータの交換

Page 26: DevLOVE20140823

毎朝体操 モーション認識でフゖットネスを楽しくする

Page 27: DevLOVE20140823

ラジオ体操ゕプリ だれでも、いつでも、どこでも、すぐできる

• Android版 iOS版 ⇒ http://maiasa.jp/

Page 28: DevLOVE20140823

スマホを持って体操 腕の動きを認識・採点し、素敵なレポートにするよ

• 頑張りに応じてトロフゖーがもらえたり、みんなの統計も見られるよ!

Page 29: DevLOVE20140823

ユーザ数拡大中 もうすぐ10万ダウンロード

• 健康&フゖットネスで常時ランクン!

Page 30: DevLOVE20140823

2014年8月23日時点

13313 いいね!

Facebookでは 中高年に人気。若い女性フゔン増えてほしい!

Page 31: DevLOVE20140823

67の国と地域 意外な場所で使われてる!!!

• 駐在さん?旅行者?

• 外国人もやってるぽい

Page 32: DevLOVE20140823

マグニチュード3~4 みんなのラジオ体操の熱量を合計するとヤバい!

• 13.581 GJ 2014年6月22日時点

– 実はラジオ体操は運動強度が高い!

熱量 状況

1.500 GJ 雷の平均のエネルギー

1.770 GJ 質量1kgの物体が木星の引力圏から脱出するために必要な運動エネルギー

2.000 GJ マグニチュード3の地震のエネルギー

4.184 GJ TNT火薬1トンの爆発のエネルギー

8.532 GJ 世界の人口1人あたりの年間消費電力量(2002年)

13.581 GJ 毎朝体操の総熱量 2014年6月22日時点

64.100 GJ マグニチュード4の地震のエネルギー

運動強度 状況

2.0 METS 電車の中で立っている

3.0 METS 庭仕事・野球の野手

3.5 METS 平地での自転車

4.0 METS ハイキング・速足

4.5 METS ラジオ体操

6.0 METS 階段昇降・卓球

9.0 METS 水泳・高強度の長距離走・筋力トレーニング

Page 33: DevLOVE20140823

MA9では 「優秀賞」と「企業賞」を受賞!

• TechCrunchにも載ったよ!!! ⇒

Page 34: DevLOVE20140823

徐々に知名度UP 最近いろいろなメデゖゕに取り上げられている!

• ゕプリソムリエの石井寛子さんが! – 【石井寛子ゕプリ事始】「毎朝体

操」超最先端ラジオ体操第1!?

• 日経新聞も! – 職場で気軽に体ほぐし ヨガ・体操

…お助けゕプリ

• ついにラジオも! – 文化放送(1134KHz)

– ドコモ団塊倶楽部

– 8月23日(土)11:00 ~ 13:00

– ゕプリ紹介コーナー(生方法)

– リポーターが実演&解説してくれる

Page 35: DevLOVE20140823

ラジオ体操を題材に 認識技術を学ぶ

まったくの初心者が

Page 36: DevLOVE20140823

認識技術の学び方 とにかくたくさんデータを見て試した人が強い

• 座学と演習

– 教わったことを自分の力で理解する。

– 実践中に必要になったらやるスタンスでよい。

• 実践

– 教わったことを現実のデータで試す。様々な組み合わせを試す。実験量命。

– チームメンバーと協力して、認識エコシステムを設計・運用し、ユーザ体験の改善に最も貢献する施策を選び出し、実施する。

Page 37: DevLOVE20140823

座学と演習 自分で調査・実装・実験して理解する

• 必要な時にとっかかり易くなる情報を与える

– 基本的な用語や考え方

– 機械学習アルゴリズム

– 最適化アルゴリズム

– 検索アルゴリズム

– 特徴抽出アルゴリズム

– 認識対象ドメインの知識

– 線形代数などの初歩的な数学

– 論文の読み方

Page 38: DevLOVE20140823

実践 現実世界のデータでゕルゴリズムを試し、理解する

• 認識エコシステム全体を設計・運用する

Page 39: DevLOVE20140823

実践 役割をローテーションし、打てる策を理解する

• ゕプリ開発者 – アプリが提供するユーザ体験を伝える。精度を求

めすぎない。

• エンジン開発者 – 精度がでる条件とデータやアルゴリズムの性質を

伝える。データの質や量を求めすぎない。

• ツール開発者 – 品質と生産性のバランスがよい条件を伝える。

• データ入力者 – 実際に入力し、品質と生産性を測定する。

Page 40: DevLOVE20140823

実践に適した題材 ラジオ体操は認識技術を学ぶのに適している

• 複雑な認識システムにならない – 採点問題を分類問題に落とし込める。

– 動きの種類が明確に定義できる。

• データを調達しやすい – 音楽に合わせて体操するだけで教師が付く。

– ユーザが毎日増やしてくれる。

• 理解しやすい – 体を動かしてデータの変化を調べられる。

– センサー値から最終結果までが近い。

Page 41: DevLOVE20140823

実践に適した題材 ラジオ体操は認識技術を学ぶのに適している

• いろいろな実験ができる

– 装着部位・デバイス・人の違いによる精度の違いを理解することで、手法の良し悪しを評価できる。どのように評価すべきかも学べる。

• データ量を徐々に増やすことで、課題や使える手法が変わることを学べる

– データからの特徴の獲得〃次元圧縮〃高度な検索〃様々な種類の近似〃データの品質保証方法

Page 42: DevLOVE20140823

実践に適した題材 ラジオ体操は認識技術を学ぶのに適している

• 価値提供のための全プロセスに関われる

– 精度よりユーザ体験の改善が重要なことを学べる。

• 試験のたび、気晴らしに体操する

– 運動不足を解消でき、肩こりにも効く。

– 残念ながら数回ではダイエット効果はない。

• デモのンパクトがすごい

– 客先で技術解説のために体操するとウケる。

– 一緒にやるとかなり盛り上がる。

– コンテストで入賞できる。

Page 43: DevLOVE20140823

続けた結果 SIの会社 から 認識技術の会社 へ進化

• 売上の大半は認識系

– 大企業の認識サービスの開発

– 大企業からの研究委託

– 大企業との共同研究

– 認識エンジンのライセンス販売

• ストックビジネスの割合が拡大

– 認識エンジンのライセンス販売

– コンシューマビジネス

Page 44: DevLOVE20140823

これから重要になること さらに学ばなければならないこと

Page 45: DevLOVE20140823

認識エコシステム 安く高品質なデータを調達できるサービス設計

• ユーザに教師を生成させる技術

Page 46: DevLOVE20140823

量と質の追及 エンジン開発・ツール開発・データ入力の連携

• 作りやすく効果が高いデータを発見するためのより緊密な連携

– 言葉で表すのはブレが大きく、言葉選びに迷いが生じ時間がかかるが、画像の領域選択ならそこそこ正確でブレない。

• ツール開発とセットになったクラウドソーシング

– 既存のクラウドソーシングでは分析が進んでいないタスクのデータは調達しづらい。

Page 47: DevLOVE20140823

計算資源の設計 エッジコンピューテゖング × オンラン学習

• できるだけユーザの計算資源を利用

– サーバ費用の節約:スマホの計算能力は高い

– 機敏なユーザ体験:リアルタイム > 精度

– オフライン利用:待機時間の削減

• できるだけパーソナラズ

– 計算資源の節約:本人のみのモデルは小さい

– 高品質なユーザ体験:本人のみだと賢い

Page 48: DevLOVE20140823

みんなでラジオ体操 時間ですよ!そろそろ準備はいいですか?

Page 49: DevLOVE20140823

やりますよね! ご清聴ありがとうございました

Page 50: DevLOVE20140823

スタッフ募集中 プロデューサ、UI・UXエンジニゕ、すぐ来て!

• 気軽にオフゖスへ遊びに来てね!

– 見学できて、ご飯も食べれて、泊まれる。

名古屋本社(2013年フロゕ増設)

オン千種・名大病院・名工大の近く

上野支社(2012年開設)

入谷駅・鶯谷駅・上野駅の近く