ディープラーニングとpascal gpu —計算工学へのインパクト— ·...

ディープラーニングと Pascal GPU—計算工学へのインパクト—

日本 GPU コンピューティングパートナーシップエヌビディア合同会社共催　ランチョンセミナー

第 21 回　計算工学講演会

計算工学にニューラルネットワークを応用する試みは数十年ほど前から行われており、すでに 1990 年代には多くの先駆的な研究がなされていました。当時はコンピュータの演算能力に制約があり、CAE の実務に広く普及するまでには至りませんでしたが、近年 GPU コンピューティングの技術が大きく発達したことに伴い、

《ディープラーニング》と呼ばれる《ニューラルネットワークの進化版》が多くの産業分野で実績をあげています。

本セミナーでは、ディープラーニングとそれを支える最新の GPU コンピューティング技術と、ディープラーニングが計算工学や CAE に与えるインパクトについてお話しさせて頂きます。また今年は、約 3 年半ぶりの新世代 GPU である《Pascal》が市場に投入されます。Pascal ではメモリバンド幅や GPU 間の通信性能が大きく向上し、マルチ GPU 計算におけるストロングスケーリングの実現を強く意識したアーキテクチャとなっています。これらの特徴から Pascal は計算工学の基礎となる HPC インフラに非連続的な飛躍をもたらすことが期待されます。この Pascal の最新情報についても併せてご紹介致します。

第 21 回計算工学講演会ランチョンセミナー

http://www.jsces.org/koenkai/21/lunch_on.html

2016. 6. 1 水藤澤智光（GDEPソリューションズ株式会社取締役会長）講演者

講演日時

講演会場

主催

WEB

12：00～13：00

朱鷺メッセ　新潟コンベンションセンター会場 A（3 階中会議室 301A）

（社）日本計算工学会

NVIDIA DGX-1 Delivers 56X More Performance

Performance in teraFLOPS0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170

NVIDIA DGX-1

CPU

170 TFLOPS

3 TFLOPS

お問い合わせ

DGX-1　Five Pascal の 5 つの技術でブレイクスルー

反復処理とイノベーションの高速化

世界初のDeepLearningスーパーコンピューター

21HALF PRECISIONteraFLOPS

3XMEMORYBANDWIDTH

12X TRAININGPERFORMANCE

15BTRANSISTORS

5XINTERCONNECTBANDWIDTH

※NVIDIA、NVIDIAロゴは、米国NVIDIA Corporationの米国およびその他の国における商標または登録商標です。※ 記載されている製品名等は各社の登録商標あるいは商標です。※ 記載されている情報はリリース時点のものです。予告なく仕様、価格を変更する場合や販売終了、延期となる場合があります。

CPUP is dual socket Intel Xeon E5-2697 v3. 170 TF is half precision or FP16.

NVIDIA DGX-1 Delivers 75X Faster Training

Relative Performance (Based on Time to Train)0 10X 20X 30X 40 6X 0X 80X50X 70X

NVIDIA DGX-1

CPU

2 Hours

150 Hours(6.25 Days)

DEEP LEARNING SYSTEM

人工知能（AI）のデータサイエンストや研究者は、深層学習の成功のために精度、シンプルさ、スピードを求めています。学習と反復速度の向上することで、技術革新と学習成果までの時間短縮が行われます。

NVIDIA DGX-1™は世界で初めてディープラーニングを想定して設計されたシステムであり、ハードウェアとソフトウェアが完全に統合され、迅速かつ容易に導入することができます。トレーニング時間を大幅に短縮する画期的な性能を携えて、単一筐体に収まる世界初のディープラーニング用スーパーコンピューター NVIDIA DGX-1™が誕生しました。

高性能なトレーニングにより、生産性が向上し、洞察を得るまでの時間と市場投入までの時間が短縮されます。

Pascal は、これまでにないパフォーマンスを備えたスーパーコンピュータへと変わります。Pascal ベースのシステムでディープラーニングを実行した場合、現在の世代のGPUアーキテクチャと比較して、ニューラルネットワークトレーニングのパフォーマンスが12倍に向上します。

Pascal アーキテクチャは、プロセッサとデータを 1つのパッケージに統合し、これまでにない計算効率を達成します。斬新なメモリ設計手法を取り入れた Chip on Wafer on Substrate（CoWoS）とHBM2 を使用することで、前世代のソリューションに比べ 3倍以上のメモリ帯域性能を実現できます。

Pascal は、ディープラーニングおよび他のコンピューティングワークロードに対して最高のパフォーマンスを提供するためあに、一から設計されました。新しい混合精度命令を活用することで、ディープラーニングに 21テラフロップス以上のピークパフォーマンスをもたらします。

Pascal は、革命的なNVIDIA NVLink™高速相互接続を初めて統合したアーキテクチャです。この相互接続の帯域幅において、現存するクラス最高のテクノロジに比べ 5倍のアクセラレーションを発揮し、複数のGPUにまたがるアプリケーション展開を支えます。

Pascalは、153億のトランジスタと3840個のNVIDIA®CUDA®コアを用いて、16 ナノメートルFinFET ファブリケーションテクノロジで特別に設計されたアーキテクチャです。

NVIDIA Pascal アーキテクチャは、5 つの技術的ブレイクスルーによって新しいコンピューティングプラットフォームを実現し、デスクトップにこだわる古い考え方をデータセンターを活用する方向へと変化させます。

DGX-1　システム仕様

GPUs 8x Tesla GP100

GPU Memory 16 GB per GPUCPU Dual 20-core Intel Xeon E5-2698 v4 2.2 GHzNVIDIA CUDA® Cores 28672System Memory 512 GB 2400 MHz DDR4 LRDIMMStorage 4x 1.92 TB SSD RAID 0Network Dual 10 GbE, 4 IB EDRSoftware Ubuntu Server Linux OS

DGX-1 Recommended GPU Driver System Weight 134 lbsSystem Dimensions 866 D x 444 W x 131 H (mm)Packing Dimensions 1180 D x 730 W x 284 H (mm)Maximum Power Requirements 3200WOperating Temperature Range 10 - 35 °C

TFLOPS (GPU FP16 / CPU FP32) 170

Note: Caffe benchmark with AlexNet, training 1.28M images with 90 epochs | CPU server uses 2x Xeon E5-2697 v3 CPUS.

※ 記載されている情報は2016年4月時点のものです。　予告なく仕様、価格を変更する場合場合があります。

TEL︓03-6803-0620 TEL︓03-5802-7050

ディープラーニングとpascal gpu —計算工学へのインパクト— ·...

Documents