Download - スタートアップカフェコザ - 最新 AI / Machine Learning 事情
#azurejp#azurejp
https://www.facebook.com/dahatake/https://twitter.com/dahatake/https://github.com/dahatake/https://daiyuhatakeyama.wordpress.com/
#azurejp
1
2
3
4
5
6
7
8
9
10
11
0 2 4 6 8 10 12 14 16 18 20 2222
33
44
566
820
時間(年)
驚異的に短縮
スマ
ート
フォ
ン
$499$10
2007
2015
単価
ドロ
ーン $100,000
$7002007
2013
単価
3D プ
リン
ター
$40,000$100
2007
2014
同程度の機能を実現する機器の単価
DNA
検査 $2.7BN
$10M$1,000
2000
2007
一回あたりの検査費用
2014
テクノロジーの製造コスト ビジネスが 10 億ドル規模に拡大するまでに要する時間
Source: World Economic Forum
3
#azurejp
パーソナルアシスタント( Cortana )
チャットボット( BOT Framework)
機械学習と開発環境( Azure Machine Learning Studio)
深層学習フレームワーク( Cognitive Toolkit)
認識 API( Cognitive Services)
翻訳 API(Microsoft Translator)
AI の民主化
#azurejp機械学習で可能となること
過去のデータの傾向をモデル(数式やルール)に変換することができます。これを未来のデータに適用するシステムを作ると、過去の傾向から未来を予測することができるようになります。
例:倒産予測確率の算出 ダイレクトメール反応率の 算出
ある時点のデータを、多次元(3つ以上のデータ項目)空間にマップし、近いデータを集めてグループを作ることができます。 この機能を活用すると人間には判別できなかった「似た傾向を持つ」グループを組むことができます。
例:顧客セグメント作成
大量のデータ項目(変数)の関連性を高速に計算し、関係を可視化することができます。 これにより、業務環境の状況把握や、経年変化などを察知できるようになる。また、近年はセンサーデータの関連を分析して故障予測等に活かすソリューションが実現できます。
例:相関分析 機器故障に関係するセンサー の組合せ発見
2多次元空間での集約
1傾向のモデル化と予測
3関連性の高い変数の
組み合わせ発見
#azurejp深層学習が変える画像認識• ImageNet• 最大規模のイメージデータセット
• 120 万の学習用イメージ、 10 のテスト用イメージ• 1000 クラス
http://image-net.org
1
28.2 25.8
16.411.7
7.3 6.7 5.1
3.5
Series1 Series2 Series3 Series4 Series5 Series6 Series7 Series8
#azurejp
https://blogs.microsoft.com/next/2016/09/13/microsoft-researchers-achieve-speech-recognition-milestone/#sm.001ven1zn15uce1vsrw1jcm18qdiw
その後チューニングにより 5.9% まで低
減
音声認識の単語誤り率で新記録
#azurejpdataClass Outlook Temp. WindyPlay Sunny Low Yes
No Play Sunny High YesNo Play Sunny High No
Play Overcast Low YesPlay Overcast High NoPlay Overcast Low No
No Play Rainy Low YesPlay Rainy Low No
? Sunny Low No
label (y)play / no play
featuresoutlook, temp, windy
values (x)[Sunny, Low, Yes]
#azurejpmodelClass Outlook Temp. WindyPlay Sunny Low Yes
No Play Sunny High YesNo Play Sunny High No
Play Overcast Low YesPlay Overcast High NoPlay Overcast Low No
No Play Rainy Low YesPlay Rainy Low No
? Sunny Low No
#azurejp機械学習の処理フロー
Input dataData
Transformation
Train Model
Algorithm Split Data
Score Model
Evaluate Model
#azurejpツールがある !
Two-Crass Boosted Decision Tree というアルゴリズムを選択した場合
どの Feature が何の Value だったら妥当なのかを
作ってくれる !
複数の Model を作ってくれる !
( 個数の指定が可能 )
#azurejp主な機械学習の処理
回帰 クラスタリング異常検知分類 推薦
Deep Learning が向いている
画像認識 音声認識 機械翻訳物体を識別する
学習すべき特徴を抽出させる
数値を予測する所属を予測する
異常値を見つけ出す
グループやパターンを見つける
#azurejp#azurejp
機械学習 教師あり学習
教師なし学習
強化学習
決定木
線形回帰
SVM
ロジスティック回帰
ニューラルネットワーク
クラスタリング
次元削減
Q 学習
K-mean法
主成分分析
正準相関分析
ディープニューラルネットワーク
畳みこみニューラルネットワーク
再帰的ニューラルネットワーク
回帰結合ニューラルネットワーク
Deep Learning
#azurejp
Cognitive Toolkit (CNTK)
Azure Machine Learning
Cognitive Services Vision, Speech, Language などのトレーニング済みの認識モデル使用のサービスをAPI として提供
一般的に使用される学習アルゴリズムをモジュールとしてIDE 環境でデザイン、容易なサービス展開
大規模データを活用する深層学習・強化学習用フレームワーク
Deve
lope
rDa
ta S
cient
ist Microsoft R 既存のデータベースとの連携の中で一般的なアルゴリズムによるデータ解析を提供
Microsoft が提供する機械学習サービス
#azurejp機械学習• 入力と教師データとしての出力のデータ
モデルの構築はデータ任せ
処理
機械学習によるモデル化
アルゴリズムの実装ではなく、適切なデータの選択とクレンジング、学習アルゴリズムの選択とチューニング、そして試行錯誤
入力 出力
#azurejp学ぶべきこと
• これからの人 • もうすでにやっている人
FrameworkDeep Learning のアルゴリズム線形代数、行列演算、微分
AI 的な成果Azure N Series
GPU
#azurejp
© 2016 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries.
The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation.
MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION.