ディープラーニングとpascal gpu —計算工学へのインパクト— ·...
TRANSCRIPT
ディープラーニングと Pascal GPU—計算工学へのインパクト—
日本 GPU コンピューティングパートナーシップエヌビディア合同会社 共催 ランチョンセミナー
第 21 回 計算工学講演会
計算工学にニューラルネットワークを応用する試みは数十年ほど前から行われており、すでに 1990 年代には多くの先駆的な研究がなされていました。当時はコンピュータの演算能力に制約があり、CAE の実務に広く普及するまでには至りませんでしたが、近年 GPU コンピューティングの技術が大きく発達したことに伴い、
《ディープラーニング》と呼ばれる《ニューラルネットワークの進化版》が多くの産業分野で実績をあげています。
本セミナーでは、ディープラーニングとそれを支える最新の GPU コンピューティング技術と、ディープラーニングが計算工学や CAE に与えるインパクトについてお話しさせて頂きます。また今年は、約 3 年半ぶりの新世代 GPU である《Pascal》が市場に投入されます。Pascal ではメモリバンド幅や GPU 間の通信性能が大きく向上し、マルチ GPU 計算におけるストロングスケーリングの実現を強く意識したアーキテクチャとなっています。これらの特徴から Pascal は計算工学の基礎となる HPC インフラに非連続的な飛躍をもたらすことが期待されます。この Pascal の最新情報についても併せてご紹介致します。
第 21 回 計算工学講演会 ランチョンセミナー
http://www.jsces.org/koenkai/21/lunch_on.html
2016. 6. 1 水藤澤 智光(GDEPソリューションズ株式会社 取締役会長)講演者
講演日時
講演会場
主催
WEB
12:00~13:00
朱鷺メッセ 新潟コンベンションセンター会場 A(3 階中会議室 301A)
(社)日本計算工学会
NVIDIA DGX-1 Delivers 56X More Performance
Performance in teraFLOPS0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170
NVIDIA DGX-1
CPU
170 TFLOPS
3 TFLOPS
お問い合わせ
DGX-1 Five Pascal の 5 つの技術でブレイクスルー
反復処理とイノベーションの高速化
世界初のDeepLearningスーパーコンピューター
21HALF PRECISIONteraFLOPS
3XMEMORYBANDWIDTH
12X TRAININGPERFORMANCE
15BTRANSISTORS
5XINTERCONNECTBANDWIDTH
※NVIDIA、NVIDIAロゴは、米国NVIDIA Corporationの米国およびその他の国における商標または登録商標です。※ 記載されている製品名等は各社の登録商標あるいは商標です。※ 記載されている情報はリリース時点のものです。予告なく仕様、価格を変更する場合や販売終了、延期となる場合があります。
CPUP is dual socket Intel Xeon E5-2697 v3. 170 TF is half precision or FP16.
NVIDIA DGX-1 Delivers 75X Faster Training
Relative Performance (Based on Time to Train)0 10X 20X 30X 40 6X 0X 80X50X 70X
NVIDIA DGX-1
CPU
2 Hours
150 Hours(6.25 Days)
DEEP LEARNING SYSTEM
人工知能(AI)のデータサイエンストや研究者は、深層学習の成功のために精度、シンプルさ、スピードを求めています。学習と反復速度の向上することで、技術革新と学習成果までの時間短縮が行われます。
NVIDIA DGX-1™は世界で初めてディープラーニングを想定して設計されたシステムであり、ハードウェアとソフトウェアが完全に統合され、迅速かつ容易に導入することができます。トレーニング時間を大幅に短縮する画期的な性能を携えて、単一筐体に収まる世界初のディープラーニング用スーパーコンピューター NVIDIA DGX-1™が誕生しました。
高性能なトレーニングにより、生産性が向上し、洞察を得るまでの時間と市場投入までの時間が短縮されます。
Pascal は、これまでにないパフォーマンスを備えたスーパーコンピュータへと変わります。Pascal ベースのシステムでディープラーニングを実行した場合、現在の世代のGPUアーキテクチャと比較して、ニューラルネットワークトレーニングのパフォーマンスが12倍に向上します。
Pascal アーキテクチャは、プロセッサとデータを 1つのパッケージに統合し、これまでにない計算効率を達成します。斬新なメモリ設計手法を取り入れた Chip on Wafer on Substrate(CoWoS)とHBM2 を使用することで、前世代のソリューションに比べ 3倍以上のメモリ帯域性能を実現できます。
Pascal は、ディープラーニングおよび他のコンピューティングワークロードに対して最高のパフォーマンスを提供するためあに、一から設計されました。新しい混合精度命令を活用することで、ディープラーニングに 21テラフロップス以上のピークパフォーマンスをもたらします。
Pascal は、革命的なNVIDIA NVLink™高速相互接続を初めて統合したアーキテクチャです。この相互接続の帯域幅において、現存するクラス最高のテクノロジに比べ 5倍のアクセラレーションを発揮し、複数のGPUにまたがるアプリケーション展開を支えます。
Pascalは、153億のトランジスタと3840個のNVIDIA®CUDA®コアを用いて、16 ナノメートルFinFET ファブリケーションテクノロジで特別に設計されたアーキテクチャです。
NVIDIA Pascal アーキテクチャは、5 つの技術的ブレイクスルーによって新しいコンピューティングプラットフォームを実現し、デスクトップにこだわる古い考え方をデータセンターを活用する方向へと変化させます。
DGX-1 システム仕様
GPUs 8x Tesla GP100
GPU Memory 16 GB per GPUCPU Dual 20-core Intel Xeon E5-2698 v4 2.2 GHzNVIDIA CUDA® Cores 28672System Memory 512 GB 2400 MHz DDR4 LRDIMMStorage 4x 1.92 TB SSD RAID 0Network Dual 10 GbE, 4 IB EDRSoftware Ubuntu Server Linux OS
DGX-1 Recommended GPU Driver System Weight 134 lbsSystem Dimensions 866 D x 444 W x 131 H (mm)Packing Dimensions 1180 D x 730 W x 284 H (mm)Maximum Power Requirements 3200WOperating Temperature Range 10 - 35 °C
TFLOPS (GPU FP16 / CPU FP32) 170
Note: Caffe benchmark with AlexNet, training 1.28M images with 90 epochs | CPU server uses 2x Xeon E5-2697 v3 CPUS.
※ 記載されている情報は2016年4月時点のものです。 予告なく仕様、価格を変更する場合場合があります。
TEL︓03-6803-0620 TEL︓03-5802-7050