itプラットフォーム事業部第三sl基盤統括部 萩原孝 · fortran/c/c++...

12
1 © NEC Corporation 2017 日本電気株式会社 ITプラットフォーム事業部 第三SL基盤統括部 萩原

Upload: others

Post on 24-Mar-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ITプラットフォーム事業部第三SL基盤統括部 萩原孝 · Fortran/C/C++ 標準プログラミング環境 実証済みのベクトルコンパイラによる自動ベ

1 © NEC Corporation 2017

日本電気株式会社

ITプラットフォーム事業部 第三SL基盤統括部

萩原 孝

Page 2: ITプラットフォーム事業部第三SL基盤統括部 萩原孝 · Fortran/C/C++ 標準プログラミング環境 実証済みのベクトルコンパイラによる自動ベ

2 © NEC Corporation 2017

HPC製品ロードマップ

Page 3: ITプラットフォーム事業部第三SL基盤統括部 萩原孝 · Fortran/C/C++ 標準プログラミング環境 実証済みのベクトルコンパイラによる自動ベ

3 © NEC Corporation 2017

新ベクトルスーパーコンピュータ

1.2TB/s / processor, 150GB/s / core

Fortran/C/C++, OpenMP, MPIなどの使い慣れたプログラミング環境自動ベクトル化・並列化コンパイラ

タワー型サーバからスパコン・システムまで幅広い製品ラインアップ空冷タイプ、水冷タイプ

Page 4: ITプラットフォーム事業部第三SL基盤統括部 萩原孝 · Fortran/C/C++ 標準プログラミング環境 実証済みのベクトルコンパイラによる自動ベ

4 © NEC Corporation 2017

新アーキテクチャ

Aurora:ベクトルエンジン(VE)カード + x86ノードx86/Linux環境下で、VEはアプケーション実行に特化

x86 サーバーベクトルエンジン

VE

ソフト

Aurora

Aurora 基本構成

ソフトウェア環境

x86 Linux OSFortran/C/C++ 標準プログラミング環境実証済みのベクトルコンパイラによる自動ベクトル化・自動並列化機能

インターコネクト

InfiniBand for MPI

ハードウェア製品

VE + x86 ノード(VH:ベクトルホスト)

x86ノード

LinuxOS

Page 5: ITプラットフォーム事業部第三SL基盤統括部 萩原孝 · Fortran/C/C++ 標準プログラミング環境 実証済みのベクトルコンパイラによる自動ベ

5 © NEC Corporation 2017

アプリケーションの実行形態

一部の処理

アクセラレータ(GPGPU)

x86ノード

Linux OS

アプリケーション

ベクトルエンジン

x86ノード

Linux OS

アプリケーション

アクセラレータ型

一部の処理

一部の処理

一部の処理

OSレス

Aurora型(AP丸ごと実行)

アプリケーションを丸ごと実行:アクセラレータ型の弱点を解消

x86にVEのOS機能をオフロード:OSジッター問題を解消

データ移送が頻発すると性能ボトルネックとなる

Page 6: ITプラットフォーム事業部第三SL基盤統括部 萩原孝 · Fortran/C/C++ 標準プログラミング環境 実証済みのベクトルコンパイラによる自動ベ

6 © NEC Corporation 2017

Core1 Core0

Core3 Core2

Core5 Core4

Core7 Core6

ベクトルプロセッサ

LLC

(sh

are

d)

LLC

(sh

are

d)

合計1.2TB/s

core数 8

core性能~307GF(DP)~614GF(SP)

CPU性能~2.45TF(DP)~4.91TF(SP)

cache 容量 16MB shared

メモリバンド幅

0.75 or 1.2TB/s

メモリ容量 24 or 48GB

主な諸元

MC

MC

MC

HB

M2

HB

M2

HB

M2M

CM

CM

C

HB

M2

HB

M2

HB

M2

SPUVPU

307GF

0.4TB/s

ベクトルプロセッサ

ベクトルプロセッサ内部構成・2x4メッシュ・ネットワーク・16MBの共有キャッシュ

DP: Double PrecisionSP: Single Precision

Page 7: ITプラットフォーム事業部第三SL基盤統括部 萩原孝 · Fortran/C/C++ 標準プログラミング環境 実証済みのベクトルコンパイラによる自動ベ

7 © NEC Corporation 2017

ベクトル命令の動作イメージ

D

A

32e

64

8e

256e

最大ベクトル長 = 256e (32e x 8 cycle)307.2GF = 32Flops/cycle x 2(FMA) x 3 x 1.6GHz

ベクトルレジスタ256e x 64(128kB)

B

C

32e/cycle

FMA演算器 x 3

Page 8: ITプラットフォーム事業部第三SL基盤統括部 萩原孝 · Fortran/C/C++ 標準プログラミング環境 実証済みのベクトルコンパイラによる自動ベ

8 © NEC Corporation 2017

Processor SKU

▌3種類の SKU: Type 10A/10B/10C- 周波数: 1.6GHz or 1.4GHz- メモリバンド幅: 1.2TB/s or 0.75TB/s- メモリ容量: 48GB or 24GB

VE TypeFreq.(GHz)

core processor

GF cores DP TF

Memory

BW size

TB/s GB

Type 10A 1.6 307

8

2.45

1.20 48

Type 10B

1.4 269 2.15

Type 10C 0.75 24

Page 9: ITプラットフォーム事業部第三SL基盤統括部 萩原孝 · Fortran/C/C++ 標準プログラミング環境 実証済みのベクトルコンパイラによる自動ベ

9 © NEC Corporation 2017

ベクトルエンジン

NECのベクトルプロセッサ開発技術・ノウハウをPCIカードに結集

標準的な x86サーバー ベクトルエンジン

標準 PCIe カード PCIe Gen.3 x16 Double height <300W

Page 10: ITプラットフォーム事業部第三SL基盤統括部 萩原孝 · Fortran/C/C++ 標準プログラミング環境 実証済みのベクトルコンパイラによる自動ベ

10 © NEC Corporation 2017

様々な用途に向けた豊富なラインアップ

A500シリーズ

A300シリーズ

A100シリーズ

スーパーコンピュータモデル(データセンタモデル) 大規模データセンタ向け 水冷(Hot Water Cooling対応DLCラック)

ラックマウントモデル(オンサイトモデル) 柔軟な構成、標準ラックに搭載可能 空冷(パッシブタイプ)

タワーモデル(エッジモデル) プログラム開発者向け 空冷(アクティブタイプ) 1VE搭載

2VE搭載 4VE搭載 8VE搭載

64VE搭載

SX-Aurora TSUBASA

ベクトルエンジンの超高性能を、デスクサイドタワーから、大規模データセンタ対応モデルまで幅広くご提供し、利用・適用範囲を大幅に拡大

Page 11: ITプラットフォーム事業部第三SL基盤統括部 萩原孝 · Fortran/C/C++ 標準プログラミング環境 実証済みのベクトルコンパイラによる自動ベ

11 © NEC Corporation 2017

エッジモデル オンサイトモデルデータセンタモデル

A100-1 A300-2 A300-4 A300-8 A500-64

製品イメージ

VE SKU C B,C A,B

搭載VE数 1 ~2 ~4 ~8 ~64

形状 タワー 1Uラックマウント 4Uラックマウント 専用ラック(DLC)

冷却方式 空冷 水冷

出荷開始 2018年2月 2018年度1Q 2018年度2Q

製品モデル

Page 12: ITプラットフォーム事業部第三SL基盤統括部 萩原孝 · Fortran/C/C++ 標準プログラミング環境 実証済みのベクトルコンパイラによる自動ベ

© 2017 NEC Corporation. All rights reserved. Specifications are subject to change without notice. NEC is a registered trademark of NEC Corporation. Intel and Xeon are trademarks of Intel Corporation or its subsidiaries in the U.S. and/or other countries. Linux is a trademark or registered trademark of Linus Torvalds in the United States of America and other countries. PCI Express, PCIe, and PCI-SIG are trademarks or registered trademarks of PCI-SIG. InfiniBand is a trademark and service mark of the InfiniBand Trade Association. All other trademarks mentioned here are the properties of their respective owners.