NvidiaのGTC開発者会議で示されたロードマップ
先週、Nvidiaが自社主催の開発者向けイベントGTC(GPU Technology Conference)をサンノゼのSAPセンターで開催、日本時間3月19日の早朝2時からJensen Huang Nvidia CEOの基調講演から始まった。GPUの新しいロードマップを紹介し、サーバー用としてシリコンフォトニクスを利用した光ファイバ接続をコンピュータラック間、ラック内が来る時代を紹介した。

図1 Jensen Huang氏がGTCで示したNvidia製品のロードマップ
昨年発表した10 P(Peta)FLOPSの「Blackwell」GPUに続き、今回は15 PFLOPSのBlackwell Ultraを発表した。昨年のBlackwellと同様、1パッケージに2つのダイを並べて配置しており、各ダイの面積はBlackwellと同様、レチクルサイズめいっぱいの最大のダイである。2個のダイにHBM3eや周辺にPMICやコントローラなどを配置して1個のBlackwell Ultraとなる。このBlackwell Ultraを2個と「Grace」CPU、さらにコントローラやネットワークプロセッサなどを搭載した1枚のカードを作っている。
このカードを2枚使ったブレードコンピュータを縦方向に18台搭載したコンピュータラックを「Blackwell Ultra NVL72」と呼んでいる。Blackwell Ultra GPUは合計72個搭載され、72個のGPUは全てNV-Linkで接続されている。このラック1台でFP4(4ビット浮動小数点演算)推論性能は1.1Exa FLPSとAIスーパーコンピュータ並みになる。Blackwell Ultraは今年後半にリリースされる予定だ。
その後には、Rubinと呼ばれるGPUが控えている。Rubinも最大レチクルサイズのダイを2個、1パッケージにHBM4という新しいメモリと共に実装する。性能的にはBlackwellの5倍のFP4演算性能となる。HBM4はすでにSK Hynixが完成させており、Rubinに載せるHBM4はSK製品であろうと思われる。
さらにRubinシステムでは、CPUも従来のGraceから「Vera」に変える。VeraはArmのIPコアを88個集積し176スレッドを処理できる能力を持ち、CPU同士をやはりNV-Linkで接続する。Veraという名前は米国の女性宇宙技術者だったVera Rubin氏からとられたもの。彼女は銀河系の回転問題を解析した科学者であった。このVera Rubinを実装したラックは「Vera Rubin NVL144」と名付けられ、2026年後半にリリースされる予定だ。
そしてRubinを4ダイ1パッケージに実装したRubin Ultraがその次に続く。これもVeraと共に実装され、2027年後半にリリースされる予定だ。さらにその先の2028年リリース予定は、Feynmanと名付けられたGPUシステムだ。
このようなコンピュータシステムではラック間やラック内には光ファイバによるデータ転送が使われるが、スイッチや変調器など可能な限り光で処理することで高速性能を落とさす消費電力も増やさない方法としてシリコンフォトニクス技術がある。ここではシリコンはMEMS技術によって光導波路を作成するという役割を持つ。シリコンそのものは発光しないため、あくまでも受動的な光配線に使われる。NvidiaはTSMCなどとパートナーを組み、シリコンフォトニクスを集積した「Spectrum X」チップを開発、2025年後半にリリースする。さらに2026年後半には「Quantum-X」シリコンフォトニクスチップをリリースするとしている。
今回AI技術でも新たにオープンソースの推論用ソフトウエアとしてDynamo を発表した。このDynamoは、生成AIなどで結果を導き出す理由付けを促進するためのソフトウエア。これまでの生成AIでの間違いをもっと減らすために理由付けを加速するソフトウエアで、「将来のAI工場のOS(Operating System)のようなもの」とJensen Haung氏は語っている。AIの理由づけを求められるにつれ、AIモデルは大量のトークンを生成することになる。Dynamo ソフトウエアはモデルのAI理由付けに対してトークン生成をできるだけ最大にしようと設計されている。AI工場では、できるだけ低コストでトークン売上生成を最大にするために欠かせないという。