ディープラーニング推論アクセラレーションを 使用した顔認識で … ·...

5
ディープラーニング推論アクセラレーションを 使用した顔認識でインテル® ビジョン・プロダクトの パワーを最大限に活用 ビデオ分析によって行方不明となった子供を迅速かつ効果的に捜索 概 要 多数の垂直市場と学術研究コミュニティーの両方で、ディープラーニング・ベースのコンピュー ター ・ビジョンの重要性が高まっています。 私たちの日常生活に AI が普及し影響を与える中で、 顔認識は小売でのパーソナライズからスマートシティーにおける安全性の向上まで、さまざまな ユースケースで使用される AI ソリューションの1つです。 顔認識は、 顔の特徴を検出、 抽出し、 照合するために、複雑なアルゴリズムを作成する必要があるため、ディープラーニング・タスクと 同様に、開発者とインテグレーターに極めて困難な課題をもたらしています。 インテルが行方不 明の子供の捜索を通して実施した顔検出 / 認識の概念実証では、先進のインテル® ハードウェア / ソフトウェア・テクノロジーと開発ツールのエンドツーエンドのポートフォリオとともに、インテル® ビジョン・アクセラレーター ・デザイン (インテル® Arria® 10 FPGA搭載版) を活用することに よって、これらのアルゴリズムを最適化し、高速化できることが実証されました。 実現されるパ フォーマンスと精度が向上した結果、顔認識を統合した AI ソリューションの効率と効果も向上し ました。 課 題 急増するビデオデータが分析に使用できるようになり、ほぼリアルタイムでデータを使用するこ とに対するニーズも高まっています。 ディープ・ニューラル・ネットワークによる顔 / 物体認識や 分類などの AI 機能により、 ストリーミング・ビデオをインテリジェンスのリポジトリーに変えて、 安全性の向上や新たな体験の実現に活用することができます。 これは、個人をいかに迅速に特 定できるかがカギとなります。 マシンラーニングを活用する上では、データ収集の起点における ビジュアル・インテリジェンスの段階から、プライバシーを侵害しない高度なラーニング・インフ ラストラクチャーを構築する必要があります。 ビデオデータや写真データをローカルで処理し、ネッ トワーク経由でのビデオや写真の送信を最小限に抑えるために、ディープラーニングをエッジで 実現することが非常に重要になります。 しかし、そのためには、ソリューション・プロバイダーと開発者に幅広い専門知識と複数のアルゴ リズムを開発して組み合わせるための十分な時間が必要であり、カメラ、ネットワーク・ビデオ・ レコーダー(NVR)、エッジ・アプライアンス、オンプレミス・サーバー、クラウドサーバーで生成さ れる膨大な量のビデオデータを効果的かつ効率的に処理できるインフラストラクチャーも必要 になります。 ソリューション概要 インテル® ビジョン・プロダクト 公共安全のための AI ソリューション インテル® ビジョン・アクセラレーター ・デザイン (インテル® Arria® 10 FPGA 搭載版) 新しいインテル® ビジョン・アクセラレーター ・デザイン (インテル® Arria® 10 FPGA 搭載版) は、PCIe* プラグイン によるアクセラレーター ・カードのブループリントとなります。 このアクセラレーター ・カードにより、幅広い業界の 開発者やソリューション・プロバイダー、エンドユーザーが、ビジョンベースの推論を利用して、高度かつ高精度の 高速ビジュアル・インテリジェンスをエッジ・アプライアンスやオンプレミス・サーバーなどのエッジで実現できます。

Upload: others

Post on 26-May-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ディープラーニング推論アクセラレーションを 使用した顔認識で … · ディープラーニング推論アクセラレーションを 使用した顔認識でインテル®

ディープラーニング推論アクセラレーションを使用した顔認識でインテル® ビジョン・プロダクトのパワーを最大限に活用

ビデオ分析によって行方不明となった子供を迅速かつ効果的に捜索

概 要多数の垂直市場と学術研究コミュニティーの両方で、 ディープラーニング・ベースのコンピューター ・ビジョンの重要性が高まっています。 私たちの日常生活に AI が普及し影響を与える中で、顔認識は小売でのパーソナライズからスマートシティーにおける安全性の向上まで、さまざまなユースケースで使用される AI ソリューションの 1 つです。 顔認識は、 顔の特徴を検出、 抽出し、照合するために、複雑なアルゴリズムを作成する必要があるため、ディープラーニング・タスクと同様に、開発者とインテグレーターに極めて困難な課題をもたらしています。 インテルが行方不明の子供の捜索を通して実施した顔検出 / 認識の概念実証では、先進のインテル® ハードウェア /ソフトウェア・テクノロジーと開発ツールのエンドツーエンドのポートフォリオとともに、インテル® ビジョン・アクセラレーター ・デザイン (インテル® Arria® 10 FPGA 搭載版) を活用することによって、 これらのアルゴリズムを最適化し、 高速化できることが実証されました。 実現されるパフォーマンスと精度が向上した結果、顔認識を統合した AI ソリューションの効率と効果も向上しました。

課 題急増するビデオデータが分析に使用できるようになり、ほぼリアルタイムでデータを使用することに対するニーズも高まっています。 ディープ・ニューラル・ネットワークによる顔 / 物体認識や分類などの AI 機能により、 ストリーミング・ビデオをインテリジェンスのリポジトリーに変えて、安全性の向上や新たな体験の実現に活用することができます。 これは、 個人をいかに迅速に特定できるかがカギとなります。 マシンラーニングを活用する上では、データ収集の起点におけるビジュアル・インテリジェンスの段階から、プライバシーを侵害しない高度なラーニング・インフラストラクチャーを構築する必要があります。 ビデオデータや写真データをローカルで処理し、ネットワーク経由でのビデオや写真の送信を最小限に抑えるために、ディープラーニングをエッジで実現することが非常に重要になります。

しかし、そのためには、ソリューション・プロバイダーと開発者に幅広い専門知識と複数のアルゴリズムを開発して組み合わせるための十分な時間が必要であり、 カメラ、 ネットワーク・ビデオ・レコーダー(NVR)、エッジ・アプライアンス、オンプレミス・サーバー、クラウドサーバーで生成される膨大な量のビデオデータを効果的かつ効率的に処理できるインフラストラクチャーも必要になります。

ソリューション概要インテル® ビジョン・プロダクト公共安全のための AI ソリューション

インテル® ビジョン・アクセラレーター ・デザイン (インテル® Arria® 10 FPGA 搭載版)新しいインテル® ビジョン・アクセラレーター ・デザイン (インテル® Arria® 10 FPGA 搭載版) は、PCIe* プラグインによるアクセラレーター ・カードのブループリントとなります。 このアクセラレーター ・カードにより、幅広い業界の開発者やソリューション・プロバイダー、エンドユーザーが、ビジョンベースの推論を利用して、高度かつ高精度の高速ビジュアル・インテリジェンスをエッジ・アプライアンスやオンプレミス・サーバーなどのエッジで実現できます。

Page 2: ディープラーニング推論アクセラレーションを 使用した顔認識で … · ディープラーニング推論アクセラレーションを 使用した顔認識でインテル®

2

ソリューション概要 | ディープラーニング推論アクセラレーションを使用した顔認識でインテル ® ビジョン・プロダクトのパワーを最大限に活用

ソリューション顔検出 / 認識の概念実証では、インテルの開発ツールに加え、PCIe* アドインカードのブループリントである、インテル® ビジョン・アクセラレーター ・デザイン (インテル® Arria® 10 FPGA 搭載版) を使用しました。これにより、現在の顔画像と認識データベース内の参照画像の類似性を測定できるようになりました。 このソリューションは、顔検出、特徴抽出、顔のインデックス作成と照合のプロセスを含む、 顔認識シーケンスに対応しています。 産業環境での労働者の保護や、都市環境での迷子また

顔検出では、人の顔の耳、鼻、口の位置を検出します。 OpenVINO™ ツールキット上で実行されるアルゴリズムにより、顔が識別に適した向きになるように向きと位置が調整されます。

特徴抽出では、 顔検出アルゴリズムによってキャプチャーされた各顔の形状と特徴の詳細を検出します。 OpenVINO™ ツールキット上で実行され、 インテル® FPGA によって高速化される特徴抽出アルゴリズムには、 詳細な特徴を抽出する特徴検出機能の 32 個のカーネルが含まれています。 顔は、 1,000 個の点要素を持つ特徴ベクトルに変換されます。

特徴照合では、 顔の詳細な特徴をデータベース・ストアと比較します。 新しい特徴ベクトルが存在する場合は、 高速データベース検索によって、最も類似する特徴ベクトルを持つエントリーが検出され、そのエントリーに関連するメタデータが抽出されます。

は行方不明の子供の発見など、 既存のユースケースから新たなユースケースまで幅広くサポートできます。 インテル® プロセッサーとインテル® ビジョン・アクセラレーター ・デザイン (インテル® Arria® 10 FPGA 搭載版) を活用した顔検出 / 認識機能により、行方不明の子供を特定する際の所要時間が20ミリ秒足らずになり、子供が特定されるとすぐに、オンラインで子供の追跡を開始できます。 1

概念実証(PoC) では、カメラ、ゲートウェイ、またはローカルの「エッジ」サーバーでアルゴリズムを実行して顔検出 / 認識を高速化しています。

顔検出は、カメラ、ゲートウェイ、またはローカルの「エッジ」サーバーでのビデオ分析から始まり、抽出された特徴をデータベースと照合するバックエンド・サーバーによって完了します。

顔検出

ビデオ分析モジュールで使用されるCPU SKU に応じた 10 ~ 32 台のカメラ

ビデオ分析モジュール トリミングされた顔

オンプレミスのエッジサーバー バックエンドまたはクラウドサーバー

特徴抽出 顔のインデックス作成 / 照合

特徴ベクトル(ビデオ / 写真なし)

主要機能• 顔検出

• ランドマーク検出

• 顔位置合わせ

• 特徴抽出

• 顔追跡

• 顔照合

Page 3: ディープラーニング推論アクセラレーションを 使用した顔認識で … · ディープラーニング推論アクセラレーションを 使用した顔認識でインテル®

3

ソリューション概要 | ディープラーニング推論アクセラレーションを使用した顔認識でインテル ® ビジョン・プロダクトのパワーを最大限に活用

サンプル構成の概要インテルが実施した概念実証を詳しく見ていきましょう。 この概念実証では、 行方不明となっている子供の問題を解決する支援を目的としたアプリケーションで、エンドツーエンドの顔検出 / 認識リファレンス・ソリューションを構成する方法を示しています。

まず、公開されているデータセットと独自のデータセットを使用して、顔検出 / 特徴抽出アルゴリズムをトレーニングしました。 顔検出では、 事前トレーニングされたディープラーニング・モデル・データ (PVANet トポロジーを使用) が指定されました。 インテル独自のトポロジーを使用して、アルゴリズムは元の画像内の顔の位置の座標を取得し、各顔の顔位置合わせ処理を実行して、 ランドマークの位置と向きを画像内の関心領域の中心に揃えます。

仕組み

ビデオ分析の開発者は、システムレベルの設計要件に応じて、インテル® Arria® 10 FPGA アクセラレーションを搭載したスマートカメラまたはNVR に、顔検出アルゴリズムと顔認識アルゴリズムを配置することもできます。

特徴抽出モデルは検出モジュールよりも複雑であるため、より多くのコンピューター ・リソースが必要となります。 インテル® Arria® 10 FPGA により、 高性能スループットを実現する電力効率に優れたアクセラレーションが追加できます。 特徴抽出により、 ビデオの各フレーム内で顔の場所と位置および顔の特徴が検出されるので、 ビデオをネットワーク経由で送るのではなく、顔特徴ベクトルのみをバックエンドに送信することになり、 エッジサーバーでは、 インテル® Arria® 10 FPGA によって100 倍のデータ圧縮を実現できます。2 抽出された特徴ベクトルは、ネットワーク帯域幅をあまり消費せずにサーバーに送信できます。

容量の拡張:2 つのインテル® Optane™ 3D XPoint™ NVMe* ディスクを搭載した1台のサーバーで、1億5,000万個以上のデータベース・エントリーを処理できます。 2,000 万個のデータベース・エントリーを使用するこの POC では、 OpenVINO™ ツールキットを利用することによって、エッジ・アプライアンス、オンプレミス・サーバー、あるいは AWS* または Azure* クラウドサーバーのハードウェア構成の任意のポイントでビデオ分析アルゴリズムを実行できます。

FPGA アクセラレーションを搭載した NVR のディープラーニング・ネットワークから顔特徴ベクトルを取得したら、 バックエンドのインテル® Xeon® スケーラブル・プロセッサー搭載サーバーでの大規模な顔照合のためにベクトルを提供できます。

バックエンド・サーバーのインテル® Xeon® スケーラブル・プロセッサーを有効に活用するために、 データベースを 2,000 万個の顔の多数の小規模なサブデータベースに分割できます。 各 CPU コアに指定されたト

顔データベースは、事前登録された顔セットに基づいて作成されました。行方不明の子供または成人の ID とデータは、既存のデータベースに存在する必要はありません。 親族が基本的なデータをビデオや写真の形で提供できます。 セキュリティーを強化し、 行方不明の子供とその家族のプライバシーを保護するために、データベースをバックエンド・サーバーに配置します。 エッジサーバーにはビデオ分析アルゴリズムのみを導入し、 データベースに事前登録されている顔の特徴に非常に近いものにのみ応答します。 これにより、ビデオや写真がネットワーク経由で送信されることはありません。

レーニング / 検索タスクは各物理コアが処理できるので、実際の識別は非常に迅速に行われます。 データベースでは、顔の向きの違いを調整するアルゴリズムによって、 割り当てられた点に従ってデータが事前に分類されます。

バックエンド・サーバーのデータ出力では、特徴ベクトルに基づいて顔一致が示されます。 シングルスレッド・モードとマルチスレッド・モードのどちらを使用しているかに応じて、 インテル® Xeon® Platinum プロセッサーを搭載した 1 台の 2-way サーバーを使用して、 1 照会当たり56 ミリ秒から 15 ミリ秒に検索時間を短縮できます。

このエンドツーエンド・ソリューションは、公共安全利用モデルの開発に最適です。

アルゴリズムは、特徴の位置合わせと抽出によって、動いている顔を識別します。

目、耳、鼻、口といった 27 個の点を分析することで識別が検証されます。

登録済みの FF

FT

FE FMFALDFD

新しい顔

+ メタデータ

Page 4: ディープラーニング推論アクセラレーションを 使用した顔認識で … · ディープラーニング推論アクセラレーションを 使用した顔認識でインテル®

4

ソリューション概要 | ディープラーニング推論アクセラレーションを使用した顔認識でインテル ® ビジョン・プロダクトのパワーを最大限に活用

特徴抽出 顔照合

主要テクノロジーこのソリューションでは、 インテル® ビジョン・アクセラレーター ・デザイン (インテル® Arria® 10 FPGA 搭載版) の優れた性能、 プログラマビリティー、 柔軟性を活用するだけでなく、 OpenVINO™ ツールキット、 インテル® Optane™ SSD、 インテル® 3D XPoint™ メモリー、Intel Atom® プロセッサー、 インテル® Core™ プロセッサー ・ ファミリー、 インテル® Xeon® Platinum プロセッサーも利用します(ただし、

インテル® Xeon® スケーラブル・プロセッサーとインテル® Optane™ メモリーを搭載したバックエンド・サーバーは、毎秒数百件の顔の照合を簡単にサポートできます。 インテル® 3D XPoint ™ テクノロジーは、コストのかかる数テラバイトのメモリーを必要とするのではなく、インテル® メモリー ・ ドライブ ・ テクノロジーを使用してメモリーとボリュームを 3D ディスクに統合することで、 データベース容量を増やし、高速検索を可能にします。 この例では、 拡張メモリーモードを使用しています。 このモードでは、インテル® Optane™ SSD は、オペレーティング・システム・レベル以上で DRAM を使用する共有メモリープールに参加できるので、より大容量または手ごろな価格のメモリーを使用できます。

ソリューションはインテル® Xeon® プロセッサーで動作します)。 ブループリント、統合されたハードウェア / ソフトウェア・テクノロジー、ソフトウェア開発ツールのセットにより、 ディープ・ニューラル・ネットワークの効率的かつ効果的なトレーニングと AI の推論を可能にする、信頼性の高い統合アーキテクチャーが提供されます。

OpenVINO™ ツールキットは、ハードウェア・アクセラレーター上でのディープラーニングと、インテルのシリコン・アーキテクチャー上での効率化されたシームレスな異種実行を可能にします。 このツールキットには、モデル・オプティマイザーと推論エンジンを搭載したインテル® ディープラーニング・デプロイメント・ツールキットに加え、 OpenCV およびOpenVX* の最適化されたコンピューター ・ビジョン・ライブラリーと機能が含まれています。 OpenVINO ™ ツールキットを使用すると、エッジサーバーとクラウドサーバー間でアルゴリズムを移動できます。 これにより、必要なサーバーとモジュールの数を減らすことができます。 要件とアルゴリズムは、開発者や顧客に影響を与えずに変更できます。

トリミングされた顔

特徴検出モジュール

顔検出

ビデオ分析モジュール

ビデオ分析モジュールで使用されるCPU の SKU に応じた 10 ~ 32 台のカメラ

オンプレミスのエッジサーバー バックエンドまたはクラウドサーバー

特徴抽出 顔のインデックス作成 / 照合

特徴ベクトル(ビデオ / 写真なし)

Intel Atom® プロセッサーインテル® Core™ プロセッサー ・ ファミリー

特徴抽出インテル® Xeon® スケーラブル ・ プロセッサーインテル® ビジョン ・ アクセラレーター ・ デザイン(インテル® Arria® 10 FPGA 搭載版)インテル® Optane™ SSD

特徴抽出 / 特徴照合インテル® Xeon® スケーラブル ・ プロセッサーインテル® ビジョン ・ アクセラレーター ・ デザイン(インテル® Arria® 10 FPGA 搭載版)インテル® Optane™ SSD

インテルの AI によるコンピューター ・ビジョン・テクノロジーは、顔認識のエンドツーエンド・プロセスをサポートします。

Page 5: ディープラーニング推論アクセラレーションを 使用した顔認識で … · ディープラーニング推論アクセラレーションを 使用した顔認識でインテル®

インテル® ビジョン・アクセラレーター ・デザイン (インテル® Arria® 10 FPGA 搭載版) は、カメラ、NVR、オンプレミス・サーバー、クラウドのいずれであっても、 コンピューター ・ビジョン・ソリューションに優れたパフォーマンス、 柔軟性、 拡張性を提供します。 このデザインは、 ディープラーニング・ワークロードのための高度なディスプレイ / ビデオ / 画像処理に適応します。 インテル® Arria® 10 FPGA は、 消費電力を抑えて高性能 ips(images-per-second) を実現し、動的柔軟性、安定した消費電力、カスタム・ワークロードや新しいワークロードに対応する将来性、低レイテンシーを提供します。

まとめインテルにより、 ソリューション・プロバイダー、 開発者、 垂直市場は、 AI 実装を簡素化し、 インサイト獲得までの時間を短縮できます。 行方不明の子供の発見は、ビデオデータがいかに役立つのか、複雑な課題を解決する方法であるのかを示す好例です。

詳細情報インテル® ビジョン・プロダクトの詳細:http://www.intel.co.jp/visionproducts/

インテルの AI イノベーションの詳細:http://www.intel.co.jp/ai/

無料ダウンロード:OpenVINO™ ツールキット (英語)

インテル® Arria® 10 FPGA は、特徴抽出アルゴリズムを実行し、高速化するために使用されます。 顔位置合わせアルゴリズムは、顔ランドマークを見つけ、類似性変換を適用し、入力画像をトリミングします。 顔ランドマーク検出アルゴリズムは、 目、 眉、 鼻、 口を検出します。 サンプルの特徴抽出アプリケーションは、インテル ® ディープラーニング・デプロイメント・ツールキットの一部として統合されています。

拡大し続ける一連の堅牢なインテル® ビジョン・プロダクトは、シームレスな統合を実現するように設計されており、パフォーマンスと効率に最適化されているため、AI イノベーションの柔軟で効果的な基盤となります。

1 インテル® Xeon® Platinum プロセッサー 8180、128GB DDR メモリー、インテル® メモリー ・ディスク・テクノロジー搭載 Optane™ ディスク x2(それぞれ 750GB)。2 インテル® Xeon® プロセッサー E3-1275Lv5、16GB DDR メモリー、インテル® Arria® 10 1150 GX FPGA、OpenVINO™ ツールキット R3。

パフォーマンスの測定結果は 2018 年 9 月付けのテストに基づいています。 また、すべての公開セキュリティー ・アップデートが適用されていない場合があります。 詳細については、公開されている構成情報を参照してください。 絶対的なセキュリティーを提供できる製品はありません。

性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。 SYSmark* や MobileMark* などの性能テストは、特定のコンピューター ・システム、コンポーネント、ソフトウェア、操作、機能に基づいて行ったものです。 結果はこれらの要因によって異なります。 製品の購入を検討される場合は、ほかの製品と組み合わせた場合の本製品の性能など、ほかの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。 性能やベンチマーク結果について、さらに詳しい情報をお知りになりたい場合は、http://www.intel.com/benchmarks/(英語) を参照してください。

インテル® テクノロジーの機能と利点はシステム構成によって異なり、対応するハードウェアやソフトウェア、またはサービスの有効化が必要となる場合があります。 実際の性能はシステム構成によって異なります。 絶対的なセキュリティーを提供できるコンピューター ・システムはありません。 詳細については、各システムメーカーまたは販売店にお問い合わせいただくか、http://www.intel.co.jp/ai/ を参照してください。

記載されているコスト削減シナリオは、指定の状況と構成で、特定のインテル ® プロセッサー搭載製品が今後のコストに及ぼす影響と、その製品によって実現される可能性のあるコスト削減の例を示すことを目的としています。 状況はさまざまであると考えられます。 インテルは、いかなるコストもコスト削減も保証いたしません。

Intel、インテル、Intel ロゴ、Intel Inside ロゴ、Arria、Intel Atom、Intel Core、Intel Optane、3D XPoint、OpenVINO、Xeon は、アメリカ合衆国および / またはその他の国における Intel Corporation またはその子会社の商標です。

* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。

OpenVX および OpenVX ロゴは、Khronos Group Inc. の商標です。

インテル株式会社 〒 100-0005 東京都千代田区丸の内 3-1-1 http://www.intel.co.jp/

©2018 Intel Corporation. 無断での引用、転載を禁じます。 2018 年 10 月

338209-001JAJPN/1810/PDF/SE/MKTG/YY