HOME » セミコンポータルによる分析 » 技術分析 » 技術分析（半導体応用）

Nvidia、5nmプロセスのCPU、400GbpsのDPUなどデータセンター充実へ

2021年4月20日 | 技術分析（半導体応用）

Nvidiaが4月にGTC2021（図1）で発表した一連のチップは、巨大なデータセンターあるいは巨大なAI学習モデルに対応させようとする狙いがある。CPUであるGrace（コード名）を発表したのもCPUとGPUを超並列で使う巨大な計算システムを想定している。加えて、演算専用のCPUであるDPU（Data Processing Unit）のBlueField-3も発表した(参考資料1)。

図1　自宅のキッチンから講演するNvidia CEOのJensen Huang氏　出典：Nvidia主催GTC21でのスクリーンショットから

今回発表したのは、汎用的なCPUではなく、大量のGPUを超並列で動作させるためのCPUである。5nmプロセスで製造されたGraceチップは、ArmのCPUコアを集積したSoCとであるICといえそうだ。自然言語処理やAIスーパーコンピューティング、リコメンダーシステムなど演算性能とメモリの両方が必要な膨大なデータセットの分析に使う。図2のように、GPUと連動させて巨大なAIの学習モデルにも対応していく。

A NEW COMPUTING ARCHITECTURE FOR AI AND DATA SCIENCE

図2　Grace CPUの使い方　出典：Nvidia主催GTC21でのスクリーンショットから

現在最大のAIモデルには数十億のパラメータが含まれており、まるで初期のムーアの法則のように2ヵ月ごとに倍増している、とHuang氏は語っている。図2は、GPUおよびHBM2eメモリと緊密に結合しており、GraceはGPUを制御するためのCPUである。加えて、このCPUは、スイスの国立スーパーコンピューティングセンターと米国エネルギー省のロスアラモス国立研究所と共同で開発するスーパーコンピュータにも搭載されるとしている。

Nividiaが発表した、新しいDPUであるBlueField-3は、ソフトウエアでプログラムするマルチコアCPUであり、高速インターフェイスを持ち、GPUやCPUに高速にデータを転送するチップである（図3）。昨年発表した、BlueField-2と比べ、整数演算性能が42 SPECintと約4.7倍、AI性能は1.5TOPSと約2倍、高めた。

ANNOUNCING NVIDIA BLUEFIELD-3

図3　新しいDPUのBlueField-3チップ　220億トランジスタを集積している　出典：Nvidia主催GTC21でのスクリーンショットから

DPUは、CPUでありながら演算性能を優先したフレキシビリティのある新しいデータ演算専用CPUといってよいだろう。積和演算に特化しているため、AI演算にはGPUの方が向くが、セキュリティ機能を設けたり、通信速度を競ったりする用途ではDPUの方が威力を発揮する。システムではCPUが全体を制御しながら演算も行うのに対して、DPUはCPUと同様にソフトウエアでプログラムできるという柔軟性を持ちながら、演算を目的とする一種のアクセラレータに近い。DPUはやはり高性能が要求されるデータセンターやHPC（High Performance Computing）などでの用途を想定して、配線用スイッチ技術のSmartNICボードに組み込んで使うという。

BlueField-3は、Arm Cortex-A78を16コアと4つの暗号化アクセラレータを集積しており、400 GbEインターフェイスに対応している。集積したトランジスタ数は、220億個になる。さらに将来のロードマップとして、BlueField-4も計画しており、その性能は160 SPECint、1000TOPS、800Gbpsなど今回の新製品よりもさらに高めていく。

参考資料
1. GTC 2021

(2021/04/20)

HOME

Nvidia、5nmプロセスのCPU、400GbpsのDPUなどデータセンター充実へ

月別アーカイブ

キーワード

ブログ

セミコンポータルによる分析