コンピュータアーキテクチャ研究の最新動向〜isca2015参加報告〜...

コンピュータアーキテクチャ研究の最新動向

～ISCA2015参加報告～

高前田伸也

奈良先端科学技術大学院大学情報科学研究科

E-mail: shinya_at_is_naist_jp

2015年8月2日 FPGAX #7 Lightning Talk

自己紹介奈良で計算機の研究をしています

「Python+FPGA」が最近のテーマ

最近のプロダクト

Veriloggen PythonでHDLを組み立てるLib

GitHubからどうぞ！

[github veriloggen] FPGAX#7 Shinya T-Y, NAIST 2

実行

Verilog HDL Python

IEEE/ACM ISCA (International Conference on Computer Architecture)

n コンピュータアーキテクチャのトップ国際会議 l 今年は米国ポートランドでPLDIやHPDC等と同時開催 (FCRC)

l  MICRO, ASPLOS, HPCAを全部通すとグランドスラムらしい

n 今年の採択率: 19.0%（FPGA系よりもかなり難しい） l 投稿数: 305

l 採択論文数: 58

n  10のチュートリアル・13のワークショップ l 今後流行るテーマは本会議よりもワークショップに多い

n  FCRC全体で数千人の参加者・ISCA単体で1000名近い l 企業展示がないCS系国際会議の中では結構大きいのでは？

l 日本からはISCAには10名強の参加（少ない･･･）

FPGAX#7 Shinya T-Y, NAIST 3

キーノート会場


ランチ会場


注目のワークショップ n  ASBD: 5th WS on Architectures and Systems for Big data

l ニアデータ処理 (NDP) の発表が多数 •  ビッグなデータは動かすだけで電力を馬鹿食いする

n  CAMEL: 1st WS on Computer Architecture for Machine Learning l 機械学習のためのアーキテクチャに関するWS

n  CARL: 4th WS on the Intersections of Computer Architecture and Reconfigurable Logic l  FPGAシステムに関するWS

•  今年はIntel, Convey, IBM, MSRの企業のプレイヤーによる発表

n  NeuroArch: 2nd WS on Neuromorphic Architectures l 楽しみにしていたのにキャンセルされた･･･


CARL2015


CARL2015 n メジャープレイヤーによる講演

l  Intel: Xeon+FPGA •  詳しくは: http://qiita.com/kazunori279/items/3731e51c2987acb860ff

l  Convey/Micron: Memcached and Imagemagick •  Automata processing: FPGAのLUTをもっと賢くした感じ

l  IBM: Text Analysis •  Power+FPGA via CAPI

l  Microsoft: Machine learning •  Catapult


本会議のテーマ（一部）（１） n データセンターアーキテクチャ

l  Machine learning as a service

l リソース管理

n 並列アーキテクチャ l 競合検出・一貫性管理

n 性能解析 l ハードウェアトランザクショナルメモリの性能解析

n  GPUアーキテクチャ l  Warp management

n アクセラレータ l  In-memory processing

l データフローアーキテクチャ FPGAX#7 Shinya T-Y, NAIST 9

本会議のテーマ（一部）（２） n プロセッサ（CPU）アーキテクチャ

l コアアーキテクチャ：命令スケジューリング・投機実行

n メモリシステム l 仮想メモリ管理

l  DRAMキャッシュ

l スクラッチパッドとキャッシュの共存

n ディペンダブルアーキテクチャ l メモリ上のデータ保護

n 組み込みシステム l  IPコアベース設計手法

l 低消費電力インターコネクト


プロセッサアーキテクチャ n シングルのコアアーキテクチャの研究が元気！

l 少し前はマルチコア・メニーコアばかりだった •  マルチコアもメニーコアも良いコアを並べたものなので結局コアアーキテクチャの改良に行き着く

n  LaZy Superscalar [Asilioglu+, ISCA'15] l 演算結果が必要になるまで計算しないスーパースカラ

n  Branch Vanguard [McFarlin+, ISCA'15] l  In-orderプロセッサで分岐命令を予測と解決に分解コンパイラとの協調で高性能化（In-orderコアは電力効率高）

n  DynaSpAM [Liu+, ISCA'15] l  OoOコアの命令スケジューリング結果を使って密結合データフローアクセラレータに命令配置・効率的実行


DynaSpAM [Liu+, ISCA'15] n  OoOコアの命令スケジューリング結果を使って密結合データフローアクセラレータに命令配置・効率的実行

n  OoOコアの命令スケジューリング等に要する電力を削減 l  8-issue OoOと比較して1.42倍高速・23.9%消費電力を削減


ニア（メモリ・データ）プロセッシング n 半導体プロセス微細化によって、演算に要する電力よりもデータの移動に要する消費電力が相対的に増加

n ニアデータプロセッシング l  SSDやメモリの近くで計算

n インメモリプロセッシング l メモリの「中」で計算する


Off-chip Memory (DRAM, etc.)

Memory Controller

NoC/LLC

L2 Cache L1 Cache

Core

L0 Cache NDP Core

一般的なコア ○キャッシュでの　データ囲い込みで　高性能・高電力効率 × キャッシュミス時の　レイテンシ大・消費電力大

NDPコア ○キャッシュミス時の　レイテンシ小・省電力 × キャッシュによる　データ囲い込みは不向き

データ移動距離大

データ移動距離小

[1] M. Anders,et.al.”High-Performance Energy-Efficient NoC Fabrics: Evolution and Future Challenges”, NOCS 2014

Tesseract [Ahn+, ISCA'15] n  HMCの内部バンド幅が使えれば超高性能なのに･･･

l →HMC中にコアを入れちゃえ


PIM-Enabled Instructions [Ahn+, ISCA'15] n プロセッシングインメモリのためのISA・アーキ

l メモリ側で計算することで性能と電力効率が改善する

n もちろんプログラミングが難しい l 次はプログラミングモデルがアツい！？


まとめ

n  ISCA2015に行ってきました！ l データセンターからプロセッサアーキテクチャ、メモリシステムまで計算機アーキテクチャは幅広い

l  FPGAへの注目は高いけどアーキテクチャはそれだけじゃない

l 一旦下火になったネタが復活することもある •  プロセッサ（コア）アーキテクチャ

l データの近くで計算するのは今後もしばらく流行 •  ニア・メモリ、ニア・ストレージ

•  ニア・インターフェース（ネットワーク）

•  イン・メモリ、イン・ストレージ

n コンピュータアーキテクチャ楽しいです(^p^)


コンピュータアーキテクチャ研究の最新動向〜isca2015参加報告〜...

Technology