コア数が加速するにつれて相互接続が脚光を浴びる

プラトン再発行

フォロワー： 0

より高機能、より高速、より小型、より低電力なシステムへの行進の中で、ムーアの法則により、純粋に半導体プロセスの進化のみに 30 年以上にわたってソフトウェアがただ乗りされてきました。コンピューティングハードウェアは、パフォーマンス/面積/電力のメトリクスを毎年向上させ、ソフトウェアの複雑さを拡張し、デメリットなしでより多くの機能を提供できるようになりました。その後、簡単に勝つことは簡単ではなくなりました。より高度なプロセスにより、単位面積あたりのゲート数は引き続き増加しましたが、パフォーマンスと消費電力の向上は横ばいになり始めました。イノベーションへの期待が止まらないため、ハードウェアアーキテクチャの進歩は、その余裕を取り戻す上でより重要になってきています。

注目を浴びる相互接続

コア数を増やすためのドライバー

この方向の初期のステップでは、マルチコア CPU を使用して、コア間で同時タスクの混合をスレッド化または仮想化することで合計スループットを加速し、アイドル状態または非アクティブなコアの電源をオフにすることで必要に応じて電力を削減しました。現在ではマルチコアが標準となっており、AWS、Azure、Alibaba などのクラウドプラットフォームで利用できるサーバーインスタンスオプションではメニーコア (チップ上のさらに多くの CPU) の傾向がすでに明らかです。

マルチ/メニーコアアーキテクチャは前進ですが、CPU クラスタによる並列処理は粒度が粗く、アムダールの法則により、独自のパフォーマンスと電力制限があります。アーキテクチャはより異種混合となり、画像、オーディオ、その他の特殊なニーズに対応するアクセラレータが追加されました。 AI アクセラレータはまた、きめ細かい並列処理を推進し、シストリックアレイやその他のドメイン固有の技術に移行しています。これは、ChatGPT が 175 億のパラメーターを備えて登場し、GPT-3 が 4 兆のパラメーターを備えた GPT-100 に進化するまでは非常にうまく機能していましたが、これは今日の AI システムよりも桁違いに複雑で、AI アクセラレーター内にさらに特化した加速機能が強制されています。

別の面では、自動車アプリケーションのマルチセンサーシステムは現在、環境認識の向上と PPA の向上のために単一の SoC に統合されています。ここで、自動車における新たなレベルの自律性は、2X、4X、または 8X で複製されるサブシステム内で、単一デバイス内の複数のセンサータイプからの入力を融合することにかかっています。

Michał Siwinski (Arteris の CMO) 氏によると、さまざまなアプリケーションにわたる複数の設計チームとの 1 か月にわたる議論のサンプリングにより、これらのチームが機能、パフォーマンス、電力の目標を達成するためにコア数の増加に積極的に取り組んでいることがわかります。同氏は、彼らもこの傾向が加速していると見ていると語った。プロセスの進歩は依然として SoC ゲート数の向上に役立ちますが、パフォーマンスと電力の目標を達成する責任はアーキテクトの手にしっかりと委ねられています。

より多くのコア、より多くの相互接続

チップ上のコアが増えると、それらのコア間のデータ接続が増えることになります。隣接する処理要素間のアクセラレータ内で、ローカルキャッシュに、スパース行列やその他の特殊な処理用のアクセラレータに。アクセラレータタイルとシステムレベルのバスの間に階層接続を追加します。オンチップの重量ストレージ、解凍、ブロードキャスト、収集、再圧縮のための接続を追加します。作業キャッシュ用の HBM 接続を追加します。必要に応じてフュージョンエンジンを追加します。

CPU ベースの制御クラスターは、これらの複製されたサブシステムのそれぞれと、必要に応じてコーデック、メモリ管理、セーフティアイランド、および信頼のルート、マルチチップレット実装の場合は UCIe、高帯域幅 I/O の場合は PCIe など、すべての通常の機能に接続する必要があります。、ネットワーク用のイーサネットまたはファイバー。

これは大量の相互接続であり、製品の市場性に直接影響します。 16nm 未満のプロセスでは、NoC インフラストラクチャが面積で 10 ～ 12% を占めるようになりました。さらに重要なのは、コア間の通信ハイウェイとして、パフォーマンスと電力に大きな影響を与える可能性があることです。最適化されていない実装では、期待されるアーキテクチャのパフォーマンスと電力ゲインが浪費され、さらに悪いことに、収束するために多数の再設計ループが発生するという現実の危険があります。しかし、複雑な SoC フロアプランで適切な実装を見つけるには、すでに厳しい設計スケジュールの中で最適化をゆっくりと試行錯誤する必要があります。複雑な NoC 階層からの完全なパフォーマンスと電力サポートを保証するには、物理的に認識した NoC 設計に移行する必要があり、これらの最適化を高速化する必要があります。

物理的に意識した NoC 設計によりムーアの法則を軌道に乗せます

ムーアの法則は死んだわけではないかもしれませんが、今日のパフォーマンスと消費電力の進歩は、プロセスではなくアーキテクチャと NoC インターコネクトによってもたらされています。アーキテクチャは、より多くのアクセラレータコア、より多くのアクセラレータ内のアクセラレータ、およびより多くのサブシステムレプリケーションをオンチップで推進しています。いずれもオンチップ相互接続の複雑さを増大させます。設計のコア数が増加し、16nm 以下のプロセスジオメトリに移行するにつれて、SoC とそのサブシステムにまたがる多数の NoC 相互接続は、物理的およびタイミングの制約に対して、物理的に認識されたネットワークを通じて最適に実装された場合にのみ、これらの複雑な設計の可能性を最大限にサポートできます。オンチップ設計。

これらの傾向についても心配している場合は、Arteris FlexNoC 5 IP テクノロジーについて詳しく学ぶことをお勧めします。こちら.

この投稿を共有する：

SEO を活用したコンテンツと PR 配信。今日増幅されます。
Platoblockchain。 Web3メタバースインテリジェンス。知識の増幅。こちらからアクセスしてください。
情報源： https://semiwiki.com/artificial-intelligence/326727-interconnect-under-the-spotlight-as-core-counts-accelerate/

タイムスタンプ： 2023 年 4 月 6 日

タイムスタンプ： 2023 年 10 月 19 日

HFSS メッシングのヒッチハイクガイド

ソースクラスター：

セミウィキ

ソースノード： 1885617

タイムスタンプ： 2022 年 1 月 26 日

MBIST の CDC: 誰が知っていたでしょうか?

ソースクラスター：

セミウィキ

ソースノード： 1459259

タイムスタンプ： 2021 年 11 月 9 日

CES 2024 と自転車に関するすべて – Semiwiki

ソースクラスター：

セミウィキ

ソースノード： 3057225

タイムスタンプ： 2024 年 1 月 11 日

自動車の機能安全の文脈における予知保全 – Semiwiki

ソースクラスター：

セミウィキ

ソースノード： 2840314

タイムスタンプ： 2023 年 8 月 23 日

コア数の増加に伴いスポットライトを浴びるインターコネクト

プラトン再発行

コア数を増やすためのドライバー

より多くのコア、より多くの相互接続

物理的に意識した NoC 設計によりムーアの法則を軌道に乗せます

より多くのセミウィキ

CEO インタビュー: Celera のパットブロケット – Semiwiki

Synopsys、Banias Labs のネットワーキング SoC のファーストパスシリコンの成功を加速

EUVリソグラフィー入門 – Semiwiki

ウェビナー: 新記録速度でのエミュレーションとプロトタイピング! – セミウィキ

MBIST の CDC: 誰が知っていたでしょうか?

自動車の機能安全の文脈における予知保全 – Semiwiki

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

コア数を増やすためのドライバー

より多くのコア、より多くの相互接続

物理的に意識した NoC 設計によりムーアの法則を軌道に乗せます

より多くの セミウィキ

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

より多くのセミウィキ