コンピュータアーキテクチャ研究の最新動向〜isca2015参加報告〜...
TRANSCRIPT
コンピュータアーキテクチャ研究の最新動向
~ISCA2015参加報告~
高前田 伸也
奈良先端科学技術大学院大学 情報科学研究科
E-mail: shinya_at_is_naist_jp
2015年8月2日 FPGAX #7 Lightning Talk
自己紹介 奈良で計算機の 研究をしています
「Python+FPGA」 が最近のテーマ
最近のプロダクト
Veriloggen PythonでHDLを 組み立てるLib
GitHubからどうぞ!
[github veriloggen] FPGAX#7 Shinya T-Y, NAIST 2
実行
Verilog HDL Python
IEEE/ACM ISCA (International Conference on Computer Architecture)
n コンピュータアーキテクチャのトップ国際会議 l 今年は米国ポートランドでPLDIやHPDC等と同時開催 (FCRC)
l MICRO, ASPLOS, HPCAを全部通すとグランドスラムらしい
n 今年の採択率: 19.0%(FPGA系よりもかなり難しい) l 投稿数: 305
l 採択論文数: 58
n 10のチュートリアル・13のワークショップ l 今後流行るテーマは本会議よりもワークショップに多い
n FCRC全体で数千人の参加者・ISCA単体で1000名近い l 企業展示がないCS系国際会議の中では結構大きいのでは?
l 日本からはISCAには10名強の参加(少ない・・・)
FPGAX#7 Shinya T-Y, NAIST 3
キーノート会場
FPGAX#7 Shinya T-Y, NAIST 4
ランチ会場
FPGAX#7 Shinya T-Y, NAIST 5
注目のワークショップ n ASBD: 5th WS on Architectures and Systems for Big data
l ニアデータ処理 (NDP) の発表が多数 • ビッグなデータは動かすだけで電力を馬鹿食いする
n CAMEL: 1st WS on Computer Architecture for Machine Learning l 機械学習のためのアーキテクチャに関するWS
n CARL: 4th WS on the Intersections of Computer Architecture and Reconfigurable Logic l FPGAシステムに関するWS
• 今年はIntel, Convey, IBM, MSRの企業のプレイヤーによる発表
n NeuroArch: 2nd WS on Neuromorphic Architectures l 楽しみにしていたのにキャンセルされた・・・
FPGAX#7 Shinya T-Y, NAIST 6
CARL2015
FPGAX#7 Shinya T-Y, NAIST 7
CARL2015 n メジャープレイヤーによる講演
l Intel: Xeon+FPGA • 詳しくは: http://qiita.com/kazunori279/items/3731e51c2987acb860ff
l Convey/Micron: Memcached and Imagemagick • Automata processing: FPGAのLUTをもっと賢くした感じ
l IBM: Text Analysis • Power+FPGA via CAPI
l Microsoft: Machine learning • Catapult
FPGAX#7 Shinya T-Y, NAIST 8
本会議のテーマ(一部)(1) n データセンターアーキテクチャ
l Machine learning as a service
l リソース管理
n 並列アーキテクチャ l 競合検出・一貫性管理
n 性能解析 l ハードウェアトランザクショナルメモリの性能解析
n GPUアーキテクチャ l Warp management
n アクセラレータ l In-memory processing
l データフローアーキテクチャ FPGAX#7 Shinya T-Y, NAIST 9
本会議のテーマ(一部)(2) n プロセッサ(CPU)アーキテクチャ
l コアアーキテクチャ:命令スケジューリング・投機実行
n メモリシステム l 仮想メモリ管理
l DRAMキャッシュ
l スクラッチパッドとキャッシュの共存
n ディペンダブルアーキテクチャ l メモリ上のデータ保護
n 組み込みシステム l IPコアベース設計手法
l 低消費電力インターコネクト
FPGAX#7 Shinya T-Y, NAIST 10
プロセッサアーキテクチャ n シングルのコアアーキテクチャの研究が元気!
l 少し前はマルチコア・メニーコアばかりだった • マルチコアもメニーコアも良いコアを並べたものなので結局 コアアーキテクチャの改良に行き着く
n LaZy Superscalar [Asilioglu+, ISCA'15] l 演算結果が必要になるまで計算しないスーパースカラ
n Branch Vanguard [McFarlin+, ISCA'15] l In-orderプロセッサで分岐命令を予測と解決に分解 コンパイラとの協調で高性能化(In-orderコアは電力効率高)
n DynaSpAM [Liu+, ISCA'15] l OoOコアの命令スケジューリング結果を使って密結合データフローアクセラレータに命令配置・効率的実行
FPGAX#7 Shinya T-Y, NAIST 11
DynaSpAM [Liu+, ISCA'15] n OoOコアの命令スケジューリング結果を使って密結合データフローアクセラレータに命令配置・効率的実行
n OoOコアの命令スケジューリング等に要する電力を削減 l 8-issue OoOと比較して1.42倍高速・23.9%消費電力を削減
FPGAX#7 Shinya T-Y, NAIST 12
ニア(メモリ・データ)プロセッシング n 半導体プロセス微細化によって、演算に要する電力よりもデータの移動に要する消費電力が相対的に増加
n ニアデータプロセッシング l SSDやメモリの近くで計算
n インメモリプロセッシング l メモリの「中」で計算する
FPGAX#7 Shinya T-Y, NAIST 13
Off-chip Memory (DRAM, etc.)
Memory Controller
NoC/LLC
L2 Cache L1 Cache
Core
L0 Cache NDP Core
一般的なコア ○キャッシュでの データ囲い込みで 高性能・高電力効率 × キャッシュミス時の レイテンシ大・消費電力大
NDPコア ○キャッシュミス時の レイテンシ小・省電力 × キャッシュによる データ囲い込みは不向き
データ移動距離 大
データ移動距離 小
[1] M. Anders,et.al.”High-Performance Energy-Efficient NoC Fabrics: Evolution and Future Challenges”, NOCS 2014
Tesseract [Ahn+, ISCA'15] n HMCの内部バンド幅が使えれば超高性能なのに・・・
l →HMC中にコアを入れちゃえ
FPGAX#7 Shinya T-Y, NAIST 14
PIM-Enabled Instructions [Ahn+, ISCA'15] n プロセッシングインメモリのためのISA・アーキ
l メモリ側で計算することで 性能と電力効率が改善する
n もちろん プログラミングが難しい l 次はプログラミングモデル がアツい!?
FPGAX#7 Shinya T-Y, NAIST 15
まとめ
n ISCA2015に行ってきました! l データセンターからプロセッサアーキテクチャ、 メモリシステムまで計算機アーキテクチャは幅広い
l FPGAへの注目は高いけどアーキテクチャはそれだけじゃない
l 一旦下火になったネタが復活することもある • プロセッサ(コア)アーキテクチャ
l データの近くで計算するのは今後もしばらく流行 • ニア・メモリ、ニア・ストレージ
• ニア・インターフェース(ネットワーク)
• イン・メモリ、イン・ストレージ
n コンピュータアーキテクチャ楽しいです(^p^)
FPGAX#7 Shinya T-Y, NAIST 16