スタートアップカフェコザ - 最新 ai / machine learning 事情

27
#azurej p #azurej p 機機機機 / AI 機機機機機機機機機 機機 機機 機機機機機機機機機機機機機 機機機機機 機機機機機機機機 https://www.facebook.com/ dahatake/ https://twitter.com/ dahatake/ https://github.com/ dahatake/ https:// daiyuhatakeyama.wordpress.com/

Upload: daiyu-hatakeyama

Post on 08-Feb-2017

42 views

Category:

Technology


3 download

TRANSCRIPT

#azurejp#azurejp

https://www.facebook.com/dahatake/https://twitter.com/dahatake/https://github.com/dahatake/https://daiyuhatakeyama.wordpress.com/

#azurejp

コンテンツはビジネスを動かす 新しい原動力になる

#azurejp

1

2

3

4

5

6

7

8

9

10

11

0 2 4 6 8 10 12 14 16 18 20 2222

33

44

566

820

時間(年)

驚異的に短縮

スマ

ート

フォ

$499$10

2007

2015

単価

ドロ

ーン $100,000

$7002007

2013

単価

3D プ

リン

ター

$40,000$100

2007

2014

同程度の機能を実現する機器の単価

DNA

検査 $2.7BN

$10M$1,000

2000

2007

一回あたりの検査費用

2014

テクノロジーの製造コスト ビジネスが 10 億ドル規模に拡大するまでに要する時間

Source: World Economic Forum

3

#azurejp

機械学習で何ができるのか ?

#azurejp

パーソナルアシスタント( Cortana )

チャットボット( BOT Framework)

機械学習と開発環境( Azure Machine Learning Studio)

深層学習フレームワーク( Cognitive Toolkit)

認識 API( Cognitive Services)

翻訳 API(Microsoft Translator)

AI の民主化

#azurejp機械学習で可能となること

 過去のデータの傾向をモデル(数式やルール)に変換することができます。これを未来のデータに適用するシステムを作ると、過去の傾向から未来を予測することができるようになります。

例:倒産予測確率の算出  ダイレクトメール反応率の  算出

 ある時点のデータを、多次元(3つ以上のデータ項目)空間にマップし、近いデータを集めてグループを作ることができます。 この機能を活用すると人間には判別できなかった「似た傾向を持つ」グループを組むことができます。

例:顧客セグメント作成

 大量のデータ項目(変数)の関連性を高速に計算し、関係を可視化することができます。 これにより、業務環境の状況把握や、経年変化などを察知できるようになる。また、近年はセンサーデータの関連を分析して故障予測等に活かすソリューションが実現できます。

例:相関分析 機器故障に関係するセンサー  の組合せ発見

2多次元空間での集約

1傾向のモデル化と予測

3関連性の高い変数の

組み合わせ発見

#azurejp深層学習が変える画像認識• ImageNet• 最大規模のイメージデータセット

• 120 万の学習用イメージ、 10 のテスト用イメージ• 1000 クラス

http://image-net.org

1

28.2 25.8

16.411.7

7.3 6.7 5.1

3.5

Series1 Series2 Series3 Series4 Series5 Series6 Series7 Series8

#azurejp

https://blogs.microsoft.com/next/2016/09/13/microsoft-researchers-achieve-speech-recognition-milestone/#sm.001ven1zn15uce1vsrw1jcm18qdiw

その後チューニングにより 5.9% まで低

音声認識の単語誤り率で新記録

#azurejp

“Model” とは何か ?- 機械学習を理解するための最初かつ最大のハードル -

#azurejpdataClass Outlook Temp. WindyPlay Sunny Low Yes

No Play Sunny High YesNo Play Sunny High No

Play Overcast Low YesPlay Overcast High NoPlay Overcast Low No

No Play Rainy Low YesPlay Rainy Low No

? Sunny Low No

label (y)play / no play

featuresoutlook, temp, windy

values (x)[Sunny, Low, Yes]

#azurejpmodelClass Outlook Temp. WindyPlay Sunny Low Yes

No Play Sunny High YesNo Play Sunny High No

Play Overcast Low YesPlay Overcast High NoPlay Overcast Low No

No Play Rainy Low YesPlay Rainy Low No

? Sunny Low No

#azurejp機械学習の処理フロー

Input dataData

Transformation

Train Model

Algorithm Split Data

Score Model

Evaluate Model

#azurejpツールがある !

Two-Crass Boosted Decision Tree というアルゴリズムを選択した場合

どの Feature が何の Value だったら妥当なのかを

作ってくれる !

複数の Model を作ってくれる !

( 個数の指定が可能 )

#azurejp更新されたモデルの評価を可視化してくれる !

#azurejp

機械学習の実装

#azurejp主な機械学習の処理

回帰 クラスタリング異常検知分類 推薦

Deep Learning が向いている

画像認識 音声認識 機械翻訳物体を識別する

学習すべき特徴を抽出させる

数値を予測する所属を予測する

異常値を見つけ出す

グループやパターンを見つける

#azurejp#azurejp

機械学習 教師あり学習

教師なし学習

強化学習

決定木

線形回帰

SVM

ロジスティック回帰

ニューラルネットワーク

クラスタリング

次元削減

Q 学習

K-mean法

主成分分析

正準相関分析

ディープニューラルネットワーク

畳みこみニューラルネットワーク

再帰的ニューラルネットワーク

回帰結合ニューラルネットワーク

Deep Learning

#azurejp

Cognitive Toolkit (CNTK)

Azure Machine Learning

Cognitive Services Vision, Speech, Language などのトレーニング済みの認識モデル使用のサービスをAPI として提供

一般的に使用される学習アルゴリズムをモジュールとしてIDE 環境でデザイン、容易なサービス展開

大規模データを活用する深層学習・強化学習用フレームワーク

Deve

lope

rDa

ta S

cient

ist Microsoft R 既存のデータベースとの連携の中で一般的なアルゴリズムによるデータ解析を提供

Microsoft が提供する機械学習サービス

#azurejp開発の現場への機械学習のインパクト

#azurejpアルゴリズム• 職人による新規性、進歩性を競える職人 (?) の世界

処理

入力 出力

アルゴリズムとして実装

#azurejp機械学習• 入力と教師データとしての出力のデータ

モデルの構築はデータ任せ

処理

機械学習によるモデル化

アルゴリズムの実装ではなく、適切なデータの選択とクレンジング、学習アルゴリズムの選択とチューニング、そして試行錯誤

入力 出力

#azurejp変わる開発コストのバランス

アルゴリズム プログラム

データ 機械学習

• 高額なコンピューターリソース• 草創期における人材の流入• 限られたデータ• 限られた相互運用

#azurejp

無限のコンピューターリソースクラウドサービスにより、コンピュテーションコスト、リソースはもはや問題ではない

アルゴリズム プログラム

データ機械学習

#azurejp

まとめ

#azurejp学ぶべきこと

• これからの人 • もうすでにやっている人

FrameworkDeep Learning のアルゴリズム線形代数、行列演算、微分

AI 的な成果Azure N Series

GPU

#azurejpより深く学ぶには

#azurejp

© 2016 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries.

The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation.

MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION.