hpe hpc & ai フォーラム 2018 講演資料 · 機械学習 (ml)...
TRANSCRIPT
HPE HPC & AI フォーラム 2018
日本ヒューレットパッカード株式会社新事業推進室 室長 兼 通信メディアCTO重松隆之通信メディアソリューションズ統括本部 ITアーキテクト畠山伸
AI/ディープラーニング活用方法と取り組み
ビジネスの価値を引き出すAIによる新しい取り組み
3
AIの専門知識とアドバイスを活用した「探索、実験、拡大」
統合型AIソリューションをインフラストラクチャのニーズに合わせてカスタマイズ
パートナーとのイノベーションを実現する最新テクノロジーとエコシステム
HPEとNVIDIAのイノベーションHPE Apollo 6500 Gen10は新しいNVIDIA NVLinkGPUを8台搭載し、ディープラーニングトレーニングを迅速に提供する共有エンジニアリング
ディープラーニングコンピューティングソリューション新しいHPE Apollo 6500 Gen10システムで、最大3倍1のパフォーマンスを発揮する理想的なトレーニングソリューション
ヒューレット・パッカード・ラボの専門知識HPEディープラーニングパフォーマンスガイド、HPEディープラーニングのクックブックの新しいコンポーネントを使用した実証済みの最適なAI構成の選択
AI、データ、分析サービスHPE Pointnextの新しいHPE人工知能トランスフォーメーションワークショップで、AIを導入するための専門知識をコンサルティング
HPEとWekaIOのパートナーシップHPEプラットフォーム上で新しいWekaIO Matrixを使用し、フラッシュテクノロジーのイノベーションで最適化したパフォーマンスと低いレイテンシーを実現
統合ソリューションHPE Pointnextの新しいHPEデジタルプリスクリプティブメンテナンスサービスを使用した産業機器の故障防止と生産性向上の自動化
お客様をサポートする対話型1dayワークショップHPE AIトランスフォーメーションワークショップ
4
お客様にとってのメリット
1日の対話型のセッションにより、HPEの専門家が次世代のAIニーズに焦点を当て、ビジネス目標を達成するための変革の道のりを支援します。
データを行動と収益に変える
- AI、高度な分析、データ使用事例を選択・分析する
- 自動または手動で望ましい結果を特定する
- データ特性を評価する – データ準備、要件
適用範囲
- AIプロジェクトの迅速な立ち上げ- ビジネス、データ、IT運用チームの連携- 機会、優先順位を調べ、関連するユースケースを選択
- 依存関係、データソース、準備レベルを特定- インテリジェントデータ戦略のためのハイレベルなロードマップを定義
コンピューティング高速化のためのエンタープライズプラットフォームHPE Apollo 6500 Gen10システムを発表
5
お客様にとってのメリット
HPE Apollo 6500 Gen10システムは、サーバー1台あたり8基のNVIDIA Tesla V100 GPUとNVLinkインターコネクトを搭載し、GPU集約型ワークロードの1ドル当たりパフォーマンスを向上させ、最大125のTFlops単精度演算2を実行してインテリジェンスを高速化します。
- 前例のないパフォーマンス - 経済的なAIとディープラーニングを提供- 堅牢なエンタープライズレベルの信頼性、可用性、保守性 - RAS機能- 幅広いワークロードをサポート - 複雑なシミュレーションとモデリングのディープラーニングおよびHPCワークロードなど
新しいGen10システムを使用するとディープラーニングトレーニングの
速さが最大で3倍に1
- 車両、歩行者、標識を認識 (自動運転車など)
- 油田掘削装置を監視して災害を防止
- 不正行為検出のためのパターンマッチング
- 音声認識と翻訳
- 薬剤設計
使用事例高速インテリジェンスを提供する信頼性の高いディープラーニングとHPCプラットフォーム
AIとディープラーニングの関係
7
ディープラーニング
人工ニューラルネットワーク
機械学習
人工知能人工知能 (AI)
機械学習 (ML)
人工ニューラルネットワーク (ANN)
ディープラーニング (DL)
人間のようにマシンが課題を解決できるようにする技術
明確にプログラムされなくてもコンピュータが事例から学べるようにするアルゴリズム
脳の働きからアイデアを得た機械学習モデル
人工ディープニューラルネットワークをモデルとして使用し、データ表現の階層を自動的に構築するMLのサブセット
ディープラーニングのプロセス
8
推論Applying this capability
to new data
学習済モデルNew capabilityoptimized forperformance
New DataApp or ServiceFeaturing Capability
“cat”
“?”
“dog” “cat”
Training Dataset“dog”
“cat”
“dog”
“cat”
“dog”
“cat”
学習Learning a new capability
from existing data
学習前Neural Network Model
機械・深層学習教師あり(宝石鑑定例)
学習
学習済モデル
基データ収集
特徴分析/傾向学習
特徴抽出/傾向学習
深層学習
良、不良の調査判定基準策定
ラベル付け抽出 学習 実行
①データ収集 ②データ分析 ③教師データ作成 ④学習 ⑤予測
機械学習
この過程が最大の壁
不良
予測対象
予測結果
不良の定義が難しい・不良の出現が少なく収集が困難・不良の定義が曖昧・どんな不良があるか想定できない
良質の宝石
不良の宝石
教師あり活用事例(整理されたデータがあれば・・・)
10
画像認識による判別 時系列データ分析 音声、テキスト認識
事例
• 顔認識
• ビデオ分析
• 病気などの判別
• ナンバープレート、車種認識
• 匠の技の伝承
事例
• 株や為替の予測
• チケット販売予測
• プラント品質予測(温度予測)
• データセンター温度管理
事例
• 翻訳
• チャット
• 音声入力
• 自動音声認識
• 手書き文字認識
機械・深層学習教師なし(宝石鑑定例)
異常検知
抽出 学習
①データ収集 ③学習データ ④学習
①データ収集 ③’観測データ ⑤予測
学習
予測
分析・教師データ作成が不要
基データ収集学習
学習済モデル
特徴分析/傾向学習
特徴抽出/傾向学習
深層学習 実行
機械学習
不良
予測対象
予測結果
・入力は通常値のみ・知っているか知らないかで判定(教師ありは「知らない」判定ができない)
良質の宝石
教師なしモデルと活用事例
12
検知・観測
事例
• 異常検知(HW障害、システム障害、ノイズなど)
• 遺物検知(異物混入、品質管理など)
• 攻撃検知(セキュリティなど)
複数入力データ教師なし学習
Latent Z
Z
split
LSTM
LSTMLSTM
・・・
Linear Layer
Output ALSTM
LSTMLSTM
・・・
Linear Layer
Output B
LSTM
LSTMLSTM
・・・
Linear Layer
Output A
Encoder
concatenate
LSTM
LSTMLSTM ・・・
EmbedIDInput A
LSTM
LSTMLSTM ・・・
EmbedIDInput B
LSTM
LSTMLSTM ・・・
EmbedIDInput C
Decoder
AutoEncoder(自己符号化器)で異常検知
– AutoEncoderとは
– 入力と出力が同じになるようにネットワークを学習させる。
– 中心で次元を圧縮し特徴表現を獲得する。
– 以下の特徴を利用する
– 自動で特徴を覚える。
– 覚えている事を入力すると、同じような内容を出力する。
– 覚えていない事ことを入力すると、覚えている事の中から近いものを出力する。(入力値と出力値に差異がでる)
14
Encoder Decoder
Z圧縮された特徴次元
X入力
X’出力
AutoEncoder(自己符号化器)で異常検知
りんご、みかん、かきの例
–学習– りんごとみかんを正常と仮定し学習させる
–推論
–学習後のモデルにみかんを入力→ほぼみかんが出力される。正常。
–学習後のモデルにかきを入力→かきのようなみかん?が出力される
入力と出力の差異があるので、未知(異常)と判定。
15
Train
Validate
Validate
かきを入力したけど入力と出力が違う!未知のものだ!
入力と出力が同じになるように学習する。
学習後、みかんを入力すればみかんが出力される
異常検知デモスマホのセンサーデータ
センサーの測定値を入力値として学習する
x:上下方向加速度y:左右方向加速度z:前後方向加速度a: 縦方向回転b: 横方向回転g: 水平方向回転
検出データをそのまま入力IoTデバイスの利用を想定
異常検知デモデモシステム詳細
学習
予測
学習
予測
標準化データ加工
App Server
API
計測
Net
wor
k
ModelStub
CoreApp
ライブラリ
Chainer / Cupy / Numpy
Anaconda (Python)
FlaskSocketIO
CUDA/cuDNN
GPU
1. スマホを振る2. 正常パターンを学習する3. 未学習のパターンを検出する
異常検知デモ
21
モデル概要
LSTMを用いたAutoEncoder• 多次元時系列データをEncoderで潜在変数Zに押し込めて、
Decoderで再構築する。• 入力と出力の差(loss値)が小さくなるように学習させる。
Latent Z
Z
Encoder
LSTM
LSTMLSTM ・・・
Decoder
LSTM
LSTMLSTM・・・
Loss値の計算
異常検知デモ
22
検知方法• 入力と出力の差(loss値)が・・・
• 小さければ正常• 大きければ異常
正常値は学習済みのため、
入力値とほぼ同じ出力値が得られる。
⇒Loss値が小さい
異常値はDecoder正確に再構
築できず、入力値と差異のある出力値が得られる。
⇒Loss値が大きい
Latent Z
Z
Encoder
LSTM
LSTMLSTM ・・・
Decoder
LSTM
LSTMLSTM・・・
Latent Z
Z
Encoder
LSTM
LSTMLSTM ・・・
Decoder
LSTM
LSTMLSTM・・・
異常検知デモ複数の測定値を時系列データとしてLSTMへ入力
Y
X
Z
標準化
LTSM
入力パラメータx:上下方向加速度y:左右方向加速度z:前後方向加速度a: 縦方向回転b: 横方向回転g: 水平方向回転
入力
変化量
時系列
全結合層
LSTMLSTM LSTM LSTM
Linear Layer
異常検知デモスマホを振って、未知の振動を検出する。既知の振動は分類する。
1.スマホを振る2.正常パターンを学習する3.未学習のパターンを検出する4.新しいパターンを追加して学習する (New!)
5.未学習のパターンを検出する (New!)
デバイス AI判定機 判定結果
未知の事象を検出し、対処したら、既知事象として扱う
異常検知デモ
27
1.スマホを振る2.正常パターンを学習する3.未学習のパターンを検出する4.新しいパターンを追加して学習する5.未学習のパターンを検出する
Label 0
Label 1
Label 2
まわす
ひねる
静止
異常検知デモ
28
分類機能の追加
• 既知の異常値はラベルをつけて学習させてしまう。• 予測時にどのラベルに近いかも合わせて出力
異常度をチェック
データ種別を推測
Latent Z
Z
Encoder
LSTM
LSTMLSTM ・・・
Decoder
LSTM
LSTMLSTM・・・
Label 0
Label 1
Label 2
Classifierまわす
ひねる
静止
異常検知 - 利用例の紹介ログ出現パターンに対する異常検知
31
0 EOS1 Boot2 Shutdown3 Stat4 Output
:
インデックス化3, 5, 4, 6, 4, …5, 4, 6, 4, 7 …4, 6, 4, 7, 3 …
:
3, 5, 3, 6, 4, …5, 3, 6, 4, 7 …
5, 3, 2, 1, 7 …
学習
予測
0.120.081.54
loss値
インデックス化
学習用ログデータ(正常値)
判定用ログデータ(含異常値)
異常値 lossが大きくなる
ログIndex
ログ種別毎にIDを割り当て、ID同士の相関(Embed)と出現順のパターンを学習する。学習パターンとの誤差(loss)の大きさで異常を検知。
Embe
d
学習
予測
Latent Z
Z
Encoder
LSTM
LSTMLSTM ・・・
Decoder
LSTM
LSTMLSTM・・・
異常検知 - 利用例の紹介ログ出現パターンに対する異常検知
32
正常
異常
学習パターンと異なるとLoss値が高くなる
明確なエラー出力はないが、何かがおかしい、又はエラー発生の前兆を検知する事が目的lo
sslo
ss
time
time
34
Modelの検証– Modelのチューニング
– データ、パラメータの精度向上
2
PoCの段階– うまくいくかをいろいろ試してみる
– Try & Error
1
本格運用– 大量処理や自動化
– プラットフォーム化
3
The AI Journey
ディープラーニングを活用した技術革新と差別化の推進
多くの業界でもディープラーニングの可能性を認識音声
製造:倉庫部品の音声ピッキング
セキュリティ
銀行業務:詐欺検出によるリスク軽減
センサー
交通:車両保守のための予測分析
テキスト
メディア:
映画レビューのセンチメント分析
データ
農業:
データ分析による農作物の病気の検出
ビデオ
石油 ・ガス: 石油精製所のビデオ監視
画像
医療:組織分類による癌検出
35
正確な目を持った
• 何でも簡単に記憶してくれる• 記憶から超高速に判定をしてくれる• 過去の事象を有効に活用できるようになった