Samsung、HBM4E を改良して電力効率を 41% 向上
<本文>
TechPowerUp によると、Samsung は、次世代 AI チップにおける電力と熱の需要の増大に対処するために、HBM4E メモリ電力供給ネットワークを再設計しているとのことです。
この動きは、Samsung の最初の商用 HBM4 の初期展開に続くもので、HBM4 は 11.7 Gbps で動作し、最大 13 Gbps まで拡張できる可能性があります。 AI アクセラレータの消費電力が増大するにつれて、メモリ アーキテクチャは、より高い帯域幅での安定性と効率を維持するために進化する必要があります。
HBM4 から HBM4E へ: より強力に、より複雑に
HBM4 から HBM4E に移行すると、同じ物理フットプリント内での電力バンプの数が 13,682 から 14,457 に大幅に増加します。
配線の高密度化、細化により電流密度が増加し、電気抵抗が増加します。抵抗が増加すると、回路を通過する際に電圧が低下します。これは IR ドロップとして知られる現象です。抵抗が高くなると追加の熱も発生し、パフォーマンスと長期信頼性の両方に影響を与えるフィードバック ループが形成されます。
ベースダイ上の電源ネットワークの再設計
これらの課題に対処するために、Samsung は HBM4E の内部電源レイアウトを見直しました。
エンジニアは、以前は集中化されていた MET4 パワー ブロックをベース ダイ上にセグメント化しました。大きなハニカムスタイルの MET4 構造は、分配効率を向上させるために 4 つの小さなセクションに分割されました。
配線の混雑を軽減し、電力供給経路を短縮するために、上部の金属層も分割されました。サムスンは、これらの経路の距離と抵抗を最小限に抑えることで、電圧を安定させ、熱の蓄積を制限することを目指しました。
測定された改善点
Samsung は、HBM4E の再設計により大幅な利益が得られたと報告しています。
同社は、HBM4 と比較して金属回路の欠陥を 97% 削減することを達成しました。 IR ドロップ性能が 41% 向上し、メモリの電圧ヘッドルームが大きくなり、動作速度が向上しました。
これらの変更により、全体的な信頼性も向上します。これは、AI アクセラレータがより高い電力エンベロープとより大きなメモリ スタックに向けて拡張されるにつれて、ますます重要になります。
HBM4E の先を見据えて: メモリと GPU を分離する
サムスンは、より根本的なアーキテクチャの変更も検討しています。
研究中のコンセプトの 1 つは、高度な相互接続テクノロジを使用して HBM を GPU から物理的に分離することです。光伝送に基づくフォトニック相互接続により、テラビット/秒のデータ速度が可能になり、従来の銅線リンクよりも約 1,000 倍高速になる可能性があります。
基板配線の改善により、HBM コンポーネントと GPU コンポーネントを 5 センチメートル以上離して設置できる場合があります。より大きな分離により、熱密度が上昇し続ける AI 加速器システムの熱管理が劇的に改善される可能性があります。
サムスンの HBM4E 再設計は、高性能 AI インフラストラクチャの需要が加速する中、電力効率、拡張性、長期信頼性に焦点を当てた AI ハードウェア エンジニアリングの広範な変化を示唆しています。
他の開発では、SK Hynix と SanDisk が HBF メモリを導入し、従来の HBM 設計の潜在的な代替品として位置付けています。
同時に、次世代 AI GPU によってメモリ帯域幅と電力要件がさらに高まるため、NVIDIA の次期 Rubin アーキテクチャによって HBM4 の需要が加速すると広く予想されています。
*️⃣ 出典リンク:
TechPowerUp、Samsung の最初の商用 HBM4、SK Hynix および SanDisk は HBF メモリ、NVIDIA の今後の Rubin アーキテクチャを導入しました。