GDDR6 が AI/ML 推論のパフォーマンスを実現

プラトン再発行

フォロワー： 0

低電力-高パフォーマンス

意見

推論がデータセンターからネットワークエッジに移行するため、メモリのスループット速度と低遅延が重要です。

AI/ML は驚異的なペースで進化しています。現在、この分野で新しくエキサイティングな開発が行われない週はありません。ChatGPT のようなアプリケーションは、生成 AI 機能をしっかりと世間の注目を集めています。

AI/ML は実際には、トレーニングと推論という 2 つのアプリケーションです。それぞれがメモリのパフォーマンスに依存しており、それぞれに最適なメモリソリューションの選択を促す独自の一連の要件があります。

トレーニングでは、メモリ帯域幅と容量が重要な要件になります。年間 10 倍の速度で成長しているニューラルネットワークデータモデルのサイズと複雑さを考慮すると、これは特に当てはまります。ニューラルネットワークの精度は、トレーニングデータセット内のサンプルの質と量に依存します。つまり、膨大な量のデータ、つまりメモリ帯域幅と容量が必要になります。

トレーニングによって生み出される価値を考慮すると、トレーニングの実行をできるだけ早く完了するという強力なインセンティブが生まれます。トレーニングアプリケーションがデータセンターで実行されると、電力とスペースの制約がますます厳しくなり、電力効率と小型サイズを実現するソリューションが好まれます。これらすべての要件を考慮すると、HBM3 は AI トレーニングハードウェアにとって理想的なメモリソリューションです。優れた帯域幅と容量機能を提供します。

ニューラルネットワークトレーニングの出力は、広範囲に展開できる推論モデルです。このモデルを使用すると、推論デバイスはトレーニングデータの範囲外で入力を処理および解釈できます。推論では、特にリアルタイムアクションが必要な場合、メモリスループット速度と低遅延が重要です。 AI 推論がデータセンターの中心部からネットワークエッジに移行するにつれて、これらのメモリ機能はさらに重要になってきています。

設計者には AI/ML 推論用のメモリの選択肢が多数ありますが、帯域幅という重要なパラメータに関しては、GDDR6 メモリが真価を発揮します。 24 ギガビット/秒 (Gb/s) のデータレートと 32 ビット幅のインターフェイスにより、GDDR6 デバイスは 96 ギガバイト/秒 (GB/s) のメモリ帯域幅を提供できます。これは、代替 DDR または他のデバイスの 6 倍以上です。 LPDDR ソリューション。 GDDRXNUMX メモリは、AI/ML 推論、特にエッジでの推論において、速度、帯域幅、レイテンシのパフォーマンスの優れた組み合わせを提供します。

Rambus GDDR6 メモリインターフェイスサブシステムは、24 Gb/s のパフォーマンスを提供し、GDDR30 を高速で動作させるために重要な、6 年以上にわたる高速シグナルインテグリティおよびパワーインテグリティ (SI/PI) の専門知識の基盤に基づいて構築されています。 PHY とデジタルコントローラーで構成され、完全な GDDR6 メモリインターフェイスサブシステムを提供します。

今月の Rambus ウェビナーに参加してください。24G GDDR6 メモリによる高性能 AI/ML 推論」では、GDDR6 が AI/ML 推論ワークロードのメモリおよびパフォーマンス要件をどのようにサポートしているかを確認し、GDDR6 メモリインターフェイスサブシステムの主要な設計および実装に関する考慮事項について学びます。

＜ご参考＞