scalable approach to tackle increasing chip complexity · 第一世代 (2003年以降) 1 10億...

5
Scalable Approach to Tackle Increasing Chip Complexity ANSYS RedHawk-SCの概要 ansys.com/redhawk-intro Anton Rozen(イスラエル テルアビブ,Mellanox Technologies,バックエンド設計担当ディレクター) 高速ネットワーキングは,データセンターの接続性を支 える根幹です.次世代のデータセンターが,新しい AI, 5G,自律システムのデータの急増に効率的に対処するに は,超高帯域幅/超低遅延ネットワーキングソリューショ ンが不可欠です.こうしたネットワーキングの SoC 設 計を行う企業は,チップのサイズおよび複雑さという課 題に取り組みながら,市場投入期間短縮への圧力の高ま りにも対応しなければなりません.グリッドの複雑さと, ゲートの絶対数が年々急増しており,ネットワークICチー ムは,400 ~ 500mm またはそれを超えるチップの設計, 解析,テープアウトを行う必要があります. 消費電力や熱的信頼性などの様々なマルチフィジック ス効果が複雑に絡み合うことも増え,FinFET 設計の収 束に大きな課題を突き付けていま す.設計マージンが減少するとと もに,プロジェクトスケジュールが よりタイトになるなかで,これらの 課題を解決し,超大型で複雑な高消 費電力チップを設計するには,マルチ フィジックス解析が不可欠です. こうした複雑さに直面している設計チームには,デザ イン規模,柔軟性,スピード,精度に優れたソフトウェ アツールが必要です. これらの課題とトレードオフを身をもって体験してい るのが,サーバー,ストレージ,ハイパーコンバージ ドインフラストラクチャー向けのエンドツーエンドの InfiniBand および Ethernet インテリジェントインター コネクトソリューションとサービスを提供する大手企 業,Mellanox 社です.同社の設計チームは,計算リソー チップの複雑化に対するスケーラブルなアプローチ 設計の複雑さとマルチフィジックスの課題が増大したことで,システム オンチップ(SoC:System-on-Chip)の設計チームの生産性が 低下しており,エンジニアは,所要時間を短縮するだけでなく, 設計を注意深く調査して改善できる高い柔軟性も提供する電子設計 自動化ツールを求めています.Mellanox 社のエンジニアは, ビッグデータ技術と柔軟な計算リソースを活用してこの機能を 実現する新しいソリューションを利用しています. 48 I ANSYS ADVANTAGE ISSUE 3 | 2019 半導体

Upload: others

Post on 08-Aug-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Scalable Approach to Tackle Increasing Chip Complexity

ANSYS RedHawk-SCの概要ansys.com/redhawk-intro

Anton Rozen(イスラエル テルアビブ,Mellanox Technologies,バックエンド設計担当ディレクター)

高速ネットワーキングは,データセンターの接続性を支える根幹です.次世代のデータセンターが,新しい AI,5G,自律システムのデータの急増に効率的に対処するには,超高帯域幅 / 超低遅延ネットワーキングソリューションが不可欠です.こうしたネットワーキングの SoC 設計を行う企業は,チップのサイズおよび複雑さという課題に取り組みながら,市場投入期間短縮への圧力の高まりにも対応しなければなりません.グリッドの複雑さと,ゲートの絶対数が年々急増しており,ネットワーク IC チームは,400 ~ 500mm またはそれを超えるチップの設計,解析,テープアウトを行う必要があります.

消費電力や熱的信頼性などの様々なマルチフィジックス効果が複雑に絡み合うことも増え,FinFET 設計の収

束に大きな課題を突き付けています.設計マージンが減少するとと

もに,プロジェクトスケジュールがよりタイトになるなかで,これらの

課題を解決し,超大型で複雑な高消費電力チップを設計するには,マルチ

フィジックス解析が不可欠です.こうした複雑さに直面している設計チームには,デザ

イン規模,柔軟性,スピード,精度に優れたソフトウェアツールが必要です.

これらの課題とトレードオフを身をもって体験しているのが,サーバー,ストレージ,ハイパーコンバージドインフラストラクチャー向けのエンドツーエンドのInfiniBand および Ethernet インテリジェントインターコネクトソリューションとサービスを提供する大手企業,Mellanox 社です.同社の設計チームは,計算リソー

チップの複雑化に対するスケーラブルなアプローチ

設計の複雑さとマルチフィジックスの課題が増大したことで,システム

オンチップ(SoC:System-on-Chip)の設計チームの生産性が

低下しており,エンジニアは,所要時間を短縮するだけでなく,

設計を注意深く調査して改善できる高い柔軟性も提供する電子設計

自動化ツールを求めています.Mellanox 社のエンジニアは,

ビッグデータ技術と柔軟な計算リソースを活用してこの機能を

実現する新しいソリューションを利用しています.

48 I ANSYS ADVANTAGE ISSUE 3 | 2019

半導体

スとエンジニアリング時間を最大限に利用して,設計の管理と妥当性確認を行う必要があったため,ANSYS RedHawk-SC を導入しました.

可視性を追求Mellanox 社のチームが,非常に複雑なネットワークプロセッサのパワーインテグリティと信頼性の確保に取り組んだ際には,電圧降下を正確に求めて,所要時間を短縮しなければなりませんでした.それだけでなく,初期の頃に大規模で複雑性の高い他の設計で達成できなかった,解析の柔軟性とスピードを追求する必要もありました.Mellanox 社では,45nm ノードで 1 億個余りであったIC ネット数が 16nm ノードで約 3 億 5,000 万個へと増えてきた設計の進化を踏まえて,7nm ノードで約 4 億5,000 万個の IC ネットを実現しなければならないと考えています.

このような進化に対応するには,そのような規模に対応できるツールが必要です.プロセスノードが 45nm あたりであった 10 年前は,ツールのアーキテクチャの多くがモノリシックであったこともあり,チームは,一度に最大 10 億個の電源 / グランドノードに対応できる 1台のマシンのみを使用していました(ノードは,電源 /グランドネットワーク内の 2 つの抽出素子間の接続ポイントであり,これらの素子は,配線やこれに接続されるデバイスインスタンスピンの寄生抵抗,寄生インダクタンス,寄生容量として作用することがある.ノード数は,パワーインテグリティ解析を行って設計サイズを予測する際によく使用される指標であり,この解析に必要な所要時間とメモリ量に直接影響する).

当時問題になったのは,ツールの対応規模でした.その頃は,複数のパワーインテグリティ / 信頼性サインオフ解析を並列ではなく連続的に実施しており,1 回の解析に 24 時間以上かかることがありました.この方法で解析を終わらせるには,大規模なサーバーを使用するとともに,大量のリソースを割り当てる必要がありました.そればかりか,システムが複雑さに対処できず,クラッシュすることもありました.その場合は,解析を最初からやり直さなければなりません.

こうした複雑さについていける第二世代が登場しました.分散計算を利用するこの世代は,32 台のマシンまでスケールアップでき,最大 40 億個のノードに対応できました.IC がこれ以上複雑にならない限りは,このままで問題ありませんでした.

スケールアップしてビッグデータ要件に対応自社のチームが知見を活かして設計を最適化できるようにしたいと考えていた Mellanox 社では,ビッグデータのマイニングとアナリティクスに合わせてスケールアップできる柔軟性の高い大規模ソリューションを必要としていました.エンジニアが ANSYS RedHawk-SCを使い始めたのは 2018 年からです.RedHawk-SC は,ANSYS SeaScape(電子システムの設計およびシミュレーション用にカスタム設計された世界初のビッグデータアーキテクチャ)をベースにした最新の SoC パワーインテグリティ / 信頼性サインオフプラットフォームです.SeaScape は,コアごとのスケーラビリティ,設計データへの柔軟なアクセス,設計への瞬時のフィードバックなど様々な機能を備えています.

成功への鍵の 1 つは,RedHawk-SCのエラスティックコンピューティング機能にあります.エラスティックコンピューティング機能では,利用可能なCPU コア数に応じて,複数のシナリオを並列処理または順次処理することができます.

Mellanox 社では,超ディープサブミクロンノードへの移行を進めたことで,設計の複雑さが増し,その結果,より柔軟でスケーラブルな設計ツール ソリューションを導入する必要性が高まった.

アーキテクチャ (IRドロップ法) 設計の複雑さ IRドロップ解析の系譜 マシン数 対応できる最大ノード数 例

モノリシック 最大2億5,000万個のICネット

第一世代 (2003年以降)

1 10億ANSYS RedHawkおよびその他

分散 最大3億5,000万個のICネット

第二世代 (2013/14年)

32 40億ANSYS RedHawk-DMPおよびその他

エラスティック 3億5,000万個以上のICネット

第三世代 (2016/18年以降)

1,000コアを 超える スケーラビリティ

無制限でスケーラブル ANSYS RedHawk-SC

モノリシック 分散

フルチップのエラスティック コンピューティング

技術 28nm 16nm 16nm

チップサイズ (インスタンスのダイエリア,ゲートでのネット数)

1/4インチのフルチップICネットが9,600万個

フルチップICネットが2億2,500万個

フルチップICネットが 3億4,000万個

CPUコアの使用量/マシン 1台のマシンで1TB

4台のマシンで1.4TB

150個の作業で72GB

所要時間 60時間 72時間 24時間

スケーラビリティの比較 < ソフトウェアの進化により,複雑さを増す

SoCの設計にかかる時間が大幅に短縮された.

© 2019 ANSYS, INC. ANSYS ADVANTAGE I 49

エラスティックコンピューティング機能の中心にあるのが SeaScapeアーキテクチャです.データが様々な場所に分散している可能性がある

ことを想定したこのアーキテクチャは,分散データ / ファイルサービスをベースに構築されています.このサービスの上には,すべてのビッグデー

タアナリティクスの基本である MapReduce コンセプトに基づく分散データアナリティクスレイヤーがあります.この概念は,データをシャードと呼ば

れる小さな塊に分割(マッピング)してから各シャードの解析を行う,というものです.処理は,必要に応じて,利用可能な複数のサーバーに分散させる

ことができます.

消費電力の問題こうしたネットワークプロセッサには,総消費電力と総電力損失の問題がありま

す.バッテリー駆動の設計と異なり,Mellanox 社が取り組んでいるタイプの設計では,200W 以上の電力を消費する可能性があるため,エンジニアは,精度や,結

果を得るまでの時間を犠牲にすることなく,高消費電力を考慮しつつ設計の解析(パワーインテグリティ / 信頼性の高精度なインクリメンタル解析)を完璧に行う必要

があります.電源網ロールアップ手法を使用すれば,電源 / グランドネットワークの低・中層金

属層を抽象化して,フルチップ IR ドロップシミュレーションをより迅速に行えるようになります.こうした抽象化をフルチップシミュレーションに利用することにより,ユ

ニットレベルで作業を行ってから,最上位レベルにジャンプしてフルチップ設計の包括的な解析を実施できるようになります.

パワーインテグリティシミュレーションの例.この例では,電源網の低・中層金属層を抽象化してフルチップの インクリメンタル解析を迅速化するために,ANSYS RedHawk-SC のロールアップ手法が使用された.

IVDD

仮想電流シンク

M13 M13

M12 M12

M10

M11

M9

M1M1

IVSS

ANSYS RedHawk-SC

機械学習

データアナリティクス

Python

形状サービス グラフサービス マトリックスサービス

エラスティックな計算サービス

分散型データ/ファイルサービス

LEF/DEF Liberty FSDB オープンデータAPI

オープンソーススタック

ビルトインサービス

専用のビッグ データスタック

サードパーティデータの容易なインポート

ユーザー アプリケーション

ANSYS SeaScape のエラスティックなビッグデータ計算アーキテクチャ

50 I ANSYS ADVANTAGE ISSUE 3 | 2019

Scalable Approach (続き)

0.07

0.06

0.05

0.04

0.03

0.02

0.01

0.000.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07

Incr

emen

tal D

ata

Flat Data

動的電圧を比較した散布図

0.0175

0.0150

0.0125

0.0100

0.0075

0.0050

0.0025

0.00000.0000 0.0025 0.0050 0.0100 0.0125 0.0150 0.0175

Incr

emen

tal D

ata

Flat Data

静的電圧を比較した散布図

504540353025201510

10 15 20 25 30 35 40 45 50

Incr

emen

tal D

ata

Flat Data

信号EM違反を比較した散布図

信号 EM のフルチップのフラット解析とロールアップ手法の結果は,チップトップからのすべての信号ネットでよく一致した.

チップトップからのフラット解析 チップトップからのロールアップでの解析

界面領域における静的な電圧降下の 解析結果はよく一致している.

界面領域における動的な電圧降下の 解析結果はよく一致している.

界面領域における信号EM違反の 解析結果はよく一致している.

静的な電圧降下のフルチップのフラット解析とロールアップ手法の結果はよく一致した.

チップトップからのフラット解析 チップトップからのロールアップでの解析

チップトップからのフラット解析 チップトップからのロールアップでの解析

動的な電圧降下のフルチップのフラット解析とロールアップ手法の結果はよく一致した.

© 2019 ANSYS, INC. ANSYS ADVANTAGE I 51

フルチップのフラット解析は,大量のリソースと時間を消費します.設計者は,ビッグデータアナリティクスを採用した技術によって可能に

なったインクリメンタル解析を行うことで,特定のブロックの詳細ビューを作成し,その他のすべてのブロックを抽象化することができます.これに

より,解析を素早く行って,設計変更指示(ECO)修正を迅速かつ簡単に,しかも可視的に行えるようになります.エンジニアは,エラスティックコンピューティング機能とビッグデータ対応

のアナリティクスを搭載した ANSYS RedHawk-SC を使用したことで,従来の課題を克服する際に必要だった可視性を得ることができました.このチームは,

ジョブを監視して,失敗したジョブを更新する自律安定性を RedHawk-SC が備えていることを特に高く評価しました.また,このチームは,RedHawk-SC のエラスティックコンピューティング機能

と MapReduce 対応のアナリティクスを使用したことで,重要な知見を得ることもできました.MapReduce により,設計者は鳥瞰的な視点を持ってホットスポットを

非常にスムーズに特定することができます.RedHawk-SCは,GUIを表示してフルチップのデータベースを 2 分以内に検索したり,Google Maps の機能と同様に,様々なエ

リアをナビゲートしたりできるなど,強力な機能を備えています.RedHawk-SC は,極めて高い計算柔軟性も実現しています.RedHawk-SC のエラス

ティックなスケーラビリティにより,膨大な計算リソースを必要としていた大きなチップエリアを非常に小さな塊に分割して解析することができます.このアーキテクチャの特性

を活かせば,これらの要素を企業の計算リソース全体に分散させることができるため,ハードウェアリソースの使用率を最大限に高めつつ,コストを最小限に抑えることができます.

チップの複雑さに対応ネットワーキング IC 設計の複雑さが急激に増大したことで,フルチップのパワーインテグリ

ティ / 信頼性サインオフに対する新しいアプローチが求められています.これは,高並列計算コンセプトを利用して,大きなデータを解析し,可視性の向上,結果を得るまでの時間の短縮,

設計全体の生産性・効率アップを推進しなければならないことを意味します.Mellanox 社は,ANSYS RedHawk-SC のエラスティックな計算スケーラビリティおよびビッ

グデータアナリティクス技術を用いて,フルチップのパワーインテグリティ解析を行ったことで,大規模な設計を製造現場で実証済みの精度で極めて正確に 24 時間足らずで収束させることができ

ました.パワーインテグリティ / 信頼性と信号線のエレクトロマイグレーションのインクリメンタル解析の組み合わせにより,生産性を 3 倍に高めることもできました.

RESOURCECohen, R.; Rozen, A.; Abhijith, M.V.; Agarwal, R.; Ramachandran, S.; Johnson, S. “Fast and Accurate Incremental

Power and Signal Integrity Analysis.” www2.dac.com/56th/proceedings/posters/125_3.pdf (08/01/2019)

MELLANOX 社の経験によって裏打ちされた, ANSYS REDHAWK-SC の注目すべき特徴:

1. 対応デザイン規模 – 大規模な設計を収束させることができるだけでなく,設計を GUI で検索し, 可視化することも可能です.RedHawk-SC のエラスティックなスケーラビリティによって,

フルチップ解析が 24 時間以内に完了しました.

2. 柔軟性 – 計算リソースを柔軟に管理できる RedHawk-SC は,この業界での EDA ツールリソース活用において,新しいレベルの有効性を見出しています.

3. スピードと精度 – ビッグデータアナリティクス技術を利用することにより,精度を犠牲にすることなく,チップトップからの解析の高速化,ECO ループの時間短縮,ECO 修正の迅速化を図ることができ

ます.RedHawk-SC と実用的なアナリティクスにより,生産性を 3 倍に高めることもできます. というのも,チームが解析を並列に実行し,各ブロックの電圧降下の影響をフルチップレベルで 把握できるからです.

52 I ANSYS ADVANTAGE ISSUE 3 | 2019

Scalable Approach (続き)