hpe hpc & ai フォーラム 2018 講演資料 · 機械学習 (ml)...

37
HPE HPC & AI フォーラム 2018 日本ヒューレットパッカード株式会社 新事業推進室 室長 兼 通信メディアCTO 重松隆之 通信メディアソリューションズ統括本部 ITアーキテクト 畠山伸 AI/ディープラーニング活用方法と取り組み

Upload: others

Post on 06-Jan-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

HPE HPC & AI フォーラム 2018

日本ヒューレットパッカード株式会社新事業推進室 室長 兼 通信メディアCTO重松隆之通信メディアソリューションズ統括本部 ITアーキテクト畠山伸

AI/ディープラーニング活用方法と取り組み

Agenda• HPEの取り組み• ディープラーニング活用方法とデモ• まとめ

1

HPEの取り組み

2

ビジネスの価値を引き出すAIによる新しい取り組み

3

AIの専門知識とアドバイスを活用した「探索、実験、拡大」

統合型AIソリューションをインフラストラクチャのニーズに合わせてカスタマイズ

パートナーとのイノベーションを実現する最新テクノロジーとエコシステム

HPEとNVIDIAのイノベーションHPE Apollo 6500 Gen10は新しいNVIDIA NVLinkGPUを8台搭載し、ディープラーニングトレーニングを迅速に提供する共有エンジニアリング

ディープラーニングコンピューティングソリューション新しいHPE Apollo 6500 Gen10システムで、最大3倍1のパフォーマンスを発揮する理想的なトレーニングソリューション

ヒューレット・パッカード・ラボの専門知識HPEディープラーニングパフォーマンスガイド、HPEディープラーニングのクックブックの新しいコンポーネントを使用した実証済みの最適なAI構成の選択

AI、データ、分析サービスHPE Pointnextの新しいHPE人工知能トランスフォーメーションワークショップで、AIを導入するための専門知識をコンサルティング

HPEとWekaIOのパートナーシップHPEプラットフォーム上で新しいWekaIO Matrixを使用し、フラッシュテクノロジーのイノベーションで最適化したパフォーマンスと低いレイテンシーを実現

統合ソリューションHPE Pointnextの新しいHPEデジタルプリスクリプティブメンテナンスサービスを使用した産業機器の故障防止と生産性向上の自動化

お客様をサポートする対話型1dayワークショップHPE AIトランスフォーメーションワークショップ

4

お客様にとってのメリット

1日の対話型のセッションにより、HPEの専門家が次世代のAIニーズに焦点を当て、ビジネス目標を達成するための変革の道のりを支援します。

データを行動と収益に変える

- AI、高度な分析、データ使用事例を選択・分析する

- 自動または手動で望ましい結果を特定する

- データ特性を評価する – データ準備、要件

適用範囲

- AIプロジェクトの迅速な立ち上げ- ビジネス、データ、IT運用チームの連携- 機会、優先順位を調べ、関連するユースケースを選択

- 依存関係、データソース、準備レベルを特定- インテリジェントデータ戦略のためのハイレベルなロードマップを定義

コンピューティング高速化のためのエンタープライズプラットフォームHPE Apollo 6500 Gen10システムを発表

5

お客様にとってのメリット

HPE Apollo 6500 Gen10システムは、サーバー1台あたり8基のNVIDIA Tesla V100 GPUとNVLinkインターコネクトを搭載し、GPU集約型ワークロードの1ドル当たりパフォーマンスを向上させ、最大125のTFlops単精度演算2を実行してインテリジェンスを高速化します。

- 前例のないパフォーマンス - 経済的なAIとディープラーニングを提供- 堅牢なエンタープライズレベルの信頼性、可用性、保守性 - RAS機能- 幅広いワークロードをサポート - 複雑なシミュレーションとモデリングのディープラーニングおよびHPCワークロードなど

新しいGen10システムを使用するとディープラーニングトレーニングの

速さが最大で3倍に1

- 車両、歩行者、標識を認識 (自動運転車など)

- 油田掘削装置を監視して災害を防止

- 不正行為検出のためのパターンマッチング

- 音声認識と翻訳

- 薬剤設計

使用事例高速インテリジェンスを提供する信頼性の高いディープラーニングとHPCプラットフォーム

HPEの取り組み日本ヒューレットパッカードの取り組み

6

AIとディープラーニングの関係

7

ディープラーニング

人工ニューラルネットワーク

機械学習

人工知能人工知能 (AI)

機械学習 (ML)

人工ニューラルネットワーク (ANN)

ディープラーニング (DL)

人間のようにマシンが課題を解決できるようにする技術

明確にプログラムされなくてもコンピュータが事例から学べるようにするアルゴリズム

脳の働きからアイデアを得た機械学習モデル

人工ディープニューラルネットワークをモデルとして使用し、データ表現の階層を自動的に構築するMLのサブセット

ディープラーニングのプロセス

8

推論Applying this capability

to new data

学習済モデルNew capabilityoptimized forperformance

New DataApp or ServiceFeaturing Capability

“cat”

“?”

“dog” “cat”

Training Dataset“dog”

“cat”

“dog”

“cat”

“dog”

“cat”

学習Learning a new capability

from existing data

学習前Neural Network Model

機械・深層学習教師あり(宝石鑑定例)

学習

学習済モデル

基データ収集

特徴分析/傾向学習

特徴抽出/傾向学習

深層学習

良、不良の調査判定基準策定

ラベル付け抽出 学習 実行

①データ収集 ②データ分析 ③教師データ作成 ④学習 ⑤予測

機械学習

この過程が最大の壁

不良

予測対象

予測結果

不良の定義が難しい・不良の出現が少なく収集が困難・不良の定義が曖昧・どんな不良があるか想定できない

良質の宝石

不良の宝石

教師あり活用事例(整理されたデータがあれば・・・)

10

画像認識による判別 時系列データ分析 音声、テキスト認識

事例

• 顔認識

• ビデオ分析

• 病気などの判別

• ナンバープレート、車種認識

• 匠の技の伝承

事例

• 株や為替の予測

• チケット販売予測

• プラント品質予測(温度予測)

• データセンター温度管理

事例

• 翻訳

• チャット

• 音声入力

• 自動音声認識

• 手書き文字認識

機械・深層学習教師なし(宝石鑑定例)

異常検知

抽出 学習

①データ収集 ③学習データ ④学習

①データ収集 ③’観測データ ⑤予測

学習

予測

分析・教師データ作成が不要

基データ収集学習

学習済モデル

特徴分析/傾向学習

特徴抽出/傾向学習

深層学習 実行

機械学習

不良

予測対象

予測結果

・入力は通常値のみ・知っているか知らないかで判定(教師ありは「知らない」判定ができない)

良質の宝石

教師なしモデルと活用事例

12

検知・観測

事例

• 異常検知(HW障害、システム障害、ノイズなど)

• 遺物検知(異物混入、品質管理など)

• 攻撃検知(セキュリティなど)

複数入力データ教師なし学習

Latent Z

Z

split

LSTM

LSTMLSTM

・・・

Linear Layer

Output ALSTM

LSTMLSTM

・・・

Linear Layer

Output B

LSTM

LSTMLSTM

・・・

Linear Layer

Output A

Encoder

concatenate

LSTM

LSTMLSTM ・・・

EmbedIDInput A

LSTM

LSTMLSTM ・・・

EmbedIDInput B

LSTM

LSTMLSTM ・・・

EmbedIDInput C

Decoder

ディープラーニング活用方法とデモ異常検知

13

AutoEncoder(自己符号化器)で異常検知

– AutoEncoderとは

– 入力と出力が同じになるようにネットワークを学習させる。

– 中心で次元を圧縮し特徴表現を獲得する。

– 以下の特徴を利用する

– 自動で特徴を覚える。

– 覚えている事を入力すると、同じような内容を出力する。

– 覚えていない事ことを入力すると、覚えている事の中から近いものを出力する。(入力値と出力値に差異がでる)

14

Encoder Decoder

Z圧縮された特徴次元

X入力

X’出力

AutoEncoder(自己符号化器)で異常検知

りんご、みかん、かきの例

–学習– りんごとみかんを正常と仮定し学習させる

–推論

–学習後のモデルにみかんを入力→ほぼみかんが出力される。正常。

–学習後のモデルにかきを入力→かきのようなみかん?が出力される

入力と出力の差異があるので、未知(異常)と判定。

15

Train

Validate

Validate

かきを入力したけど入力と出力が違う!未知のものだ!

入力と出力が同じになるように学習する。

学習後、みかんを入力すればみかんが出力される

異常検知デモスマホのセンサーデータ

センサーの測定値を入力値として学習する

x:上下方向加速度y:左右方向加速度z:前後方向加速度a: 縦方向回転b: 横方向回転g: 水平方向回転

検出データをそのまま入力IoTデバイスの利用を想定

異常検知デモスマホを振って、未知の振動を検出する(重回帰モデル)

1.スマホを振る2.正常パターンを学習する3.未学習のパターンを検出する

デバイス AI判定機 判定結果

異常検知デモ

18

1.スマホをまわす2.正常パターンを学習する3.未学習のパターンを検出する

異常検知デモ

19

1.スマホをまわす2.正常パターンを学習する3.未学習のパターンを検出する

異常検知デモデモシステム詳細

学習

予測

学習

予測

標準化データ加工

App Server

API

計測

Net

wor

k

ModelStub

CoreApp

ライブラリ

Chainer / Cupy / Numpy

Anaconda (Python)

FlaskSocketIO

CUDA/cuDNN

GPU

1. スマホを振る2. 正常パターンを学習する3. 未学習のパターンを検出する

異常検知デモ

21

モデル概要

LSTMを用いたAutoEncoder• 多次元時系列データをEncoderで潜在変数Zに押し込めて、

Decoderで再構築する。• 入力と出力の差(loss値)が小さくなるように学習させる。

Latent Z

Z

Encoder

LSTM

LSTMLSTM ・・・

Decoder

LSTM

LSTMLSTM・・・

Loss値の計算

異常検知デモ

22

検知方法• 入力と出力の差(loss値)が・・・

• 小さければ正常• 大きければ異常

正常値は学習済みのため、

入力値とほぼ同じ出力値が得られる。

⇒Loss値が小さい

異常値はDecoder正確に再構

築できず、入力値と差異のある出力値が得られる。

⇒Loss値が大きい

Latent Z

Z

Encoder

LSTM

LSTMLSTM ・・・

Decoder

LSTM

LSTMLSTM・・・

Latent Z

Z

Encoder

LSTM

LSTMLSTM ・・・

Decoder

LSTM

LSTMLSTM・・・

異常検知デモ複数の測定値を時系列データとしてLSTMへ入力

Y

X

Z

標準化

LTSM

入力パラメータx:上下方向加速度y:左右方向加速度z:前後方向加速度a: 縦方向回転b: 横方向回転g: 水平方向回転

入力

変化量

時系列

全結合層

LSTMLSTM LSTM LSTM

Linear Layer

異常検知デモ

24

1.スマホを振る2.正常パターンを学習する3.未学習のパターンを検出する

赤の値が大きいと異常です!

異常検知デモここまでのおさらい

– Loss値を監視する事で、未学習のパターンを検知した。

25

異常検知デモスマホを振って、未知の振動を検出する。既知の振動は分類する。

1.スマホを振る2.正常パターンを学習する3.未学習のパターンを検出する4.新しいパターンを追加して学習する (New!)

5.未学習のパターンを検出する (New!)

デバイス AI判定機 判定結果

未知の事象を検出し、対処したら、既知事象として扱う

異常検知デモ

27

1.スマホを振る2.正常パターンを学習する3.未学習のパターンを検出する4.新しいパターンを追加して学習する5.未学習のパターンを検出する

Label 0

Label 1

Label 2

まわす

ひねる

静止

異常検知デモ

28

分類機能の追加

• 既知の異常値はラベルをつけて学習させてしまう。• 予測時にどのラベルに近いかも合わせて出力

異常度をチェック

データ種別を推測

Latent Z

Z

Encoder

LSTM

LSTMLSTM ・・・

Decoder

LSTM

LSTMLSTM・・・

Label 0

Label 1

Label 2

Classifierまわす

ひねる

静止

異常検知デモ

29

1.スマホを振る2.正常パターンを学習する3.未学習のパターンを検出する4.新しいパターンを追加して学習する5.未学習のパターンを検出する

異常検知デモここまでのおさらい

– 既知の事象を分類した。

– Loss値を監視する事で、未学習のパターンを検知した。

30

異常検知 - 利用例の紹介ログ出現パターンに対する異常検知

31

0 EOS1 Boot2 Shutdown3 Stat4 Output

:

インデックス化3, 5, 4, 6, 4, …5, 4, 6, 4, 7 …4, 6, 4, 7, 3 …

:

3, 5, 3, 6, 4, …5, 3, 6, 4, 7 …

5, 3, 2, 1, 7 …

学習

予測

0.120.081.54

loss値

インデックス化

学習用ログデータ(正常値)

判定用ログデータ(含異常値)

異常値 lossが大きくなる

ログIndex

ログ種別毎にIDを割り当て、ID同士の相関(Embed)と出現順のパターンを学習する。学習パターンとの誤差(loss)の大きさで異常を検知。

Embe

d

学習

予測

Latent Z

Z

Encoder

LSTM

LSTMLSTM ・・・

Decoder

LSTM

LSTMLSTM・・・

異常検知 - 利用例の紹介ログ出現パターンに対する異常検知

32

正常

異常

学習パターンと異なるとLoss値が高くなる

明確なエラー出力はないが、何かがおかしい、又はエラー発生の前兆を検知する事が目的lo

sslo

ss

time

time

まとめ

33

34

Modelの検証– Modelのチューニング

– データ、パラメータの精度向上

2

PoCの段階– うまくいくかをいろいろ試してみる

– Try & Error

1

本格運用– 大量処理や自動化

– プラットフォーム化

3

The AI Journey

ディープラーニングを活用した技術革新と差別化の推進

多くの業界でもディープラーニングの可能性を認識音声

製造:倉庫部品の音声ピッキング

セキュリティ

銀行業務:詐欺検出によるリスク軽減

センサー

交通:車両保守のための予測分析

テキスト

メディア:

映画レビューのセンチメント分析

データ

農業:

データ分析による農作物の病気の検出

ビデオ

石油 ・ガス: 石油精製所のビデオ監視

画像

医療:組織分類による癌検出

35

正確な目を持った

• 何でも簡単に記憶してくれる• 記憶から超高速に判定をしてくれる• 過去の事象を有効に活用できるようになった

Thank you