
何十年もの間、コンピューティング業界全体は次のような単純なパラダイムを中心に展開してきました。 論理は王様だ。CPU と GPU はシステムの中心でした。メモリは単なるサポートコンポーネントであり、プロセッサが実際の作業を行っている間にデータを一時的に保存する役割を担っていました。しかし現在、根本的な革命が進行中です。ロジック中心のコンピューティングの時代は終わりを迎えています。 メモリ中心のコンピューティング が到着しました。
この変化は段階的なものではなく、構造的なものです。AI、大規模言語モデル、クラウド コンピューティング、ハイパフォーマンス コンピューティングによって推進され、ロジックとメモリの間の力のバランスは完全に逆転しました。メモリはもはや周辺コンポーネントではありません。それは コアのボトルネック、主要なパフォーマンスのリミッター、そして真の価値の中心 現代のコンピューティング システムのこと。
長年にわたり、プロセッサのパフォーマンスはメモリの帯域幅や遅延よりもはるかに速い速度で向上してきました。この拡大するギャップは、 記憶の壁。従来のシステムでは:
AI モデルのパラメータが数十億から数兆に増加するにつれて、メモリの壁が致命的になってきました。システムは、ロジックとメモリの間で大量のデータを行き来する余裕がなくなりました。唯一の解決策: メモリを中心にアーキテクチャ全体を再構築する。
ロジック中心のアーキテクチャ
- コアとしての CPU/GPU
- 外部ストレージとしてのメモリ
- データは計算に移行します
- パフォーマンスは命令速度に依存します
- 支配的な PC と初期のクラウド コンピューティング
メモリ中心のアーキテクチャ
- システムコアとしてのメモリ
- 計算はデータに移行します
- 帯域幅と遅延がパフォーマンスを定義します
- データの移動に重点を置いたエネルギー効率
- AI と次世代コンピューティングの定義
違いは技術的な詳細ではなく、システム設計哲学の完全な逆転です。
1. ニアメモリコンピューティング (NMC)
コンピューティング エンジンをメモリの近くに配置し、データの移動を最小限に抑えます。遅延と電力を大幅に削減します。AI アクセラレータと DPU インフラストラクチャで広く採用されています。
2. インメモリコンピューティング (IMC)
メモリセル内で直接計算を実行し、データ転送を完全に排除します。AI 推論、エッジデバイス、低電力システムに最適です。長期的な究極のアーキテクチャと見なされています。
3. 3D メモリロジックスタッキング
ハイブリッド ボンディングと TSV を使用して、メモリをプロセッサの上に直接スタックします。コンピューティングとメモリの間に超高帯域幅を実現します。HBM、HBM3E、および 3D スタッキングは、最新の AI チップの基礎です。
大規模な言語モデルと生成 AI には、次のような独特の特徴があります。
AI システムでは、プロセッサはデータを待ってアイドル状態になることがよくあります。パフォーマンスはチップの計算速度によって制限されるのではなく、 どれくらい速くメモリにアクセスできるか。
このアーキテクチャの変化は業界の力を書き換えています。
メモリ アーキテクチャを制御する人がコンピューティングの未来を制御します。
ロジック主体のコンピューティングの時代は終わりました。私たちは新たな時代に入りました。 メモリはパフォーマンスを定義し、メモリはスケーリングを制限し、メモリはシステム値を決定します。
ロジック中心のアーキテクチャからメモリ中心のアーキテクチャへの移行は、単なる技術トレンドではなく、この半世紀におけるコンピューティングにおける最も根本的な変革です。今後10年間、 記憶が宇宙の中心になる。