HOME » セミコンポータルによる分析 » 技術分析 » 技術分析（半導体製品）

Nvidia、ディープラーニングの総合力を見せつける

2018年5月 2日 | 技術分析（半導体製品）

Nvidiaは単なるファブレス半導体メーカーにとどまっていない。AI（ディープラーニング）やHPC（高性能コンピューティング）のマシンを設計するコンピュータメーカーでもある。最強のGPUであるTesla V100（図1）を使いこなす。AIでは学習だけではなく推論用にGPUを動かすための推論ソフトウエアTensorRTの新バージョンも開発した。自動運転用プラットフォーム、IoT用の推論アクセラレータも提供する。こんな姿が浮かび上がる。

図1　Nvidia最強のGPU「Tesla V100」は5000個以上のGPUコアを超並列に配置した210億トランジスタを集積している

こういった最新のNvidiaの実力を同社は2018年3月に米国のサンノゼで示したGTC 2018での発表内容を、4月下旬東京で開催されたNdivia Deep Learning Seminar 2018で公開した。ディープラーニングコンピュータとその仕組み、最新版の推論ソフトウエアTensorRT 4、実際の応用として自動運転用のシミュレータ「Drive Constellation」を発表した。さらに組み込みシステムやIoT端末でもAIを使うためのNvidiaのディープラーニングアーキテクチャ（NVDLA）を英Armの「Project Trillium」に組込むためArmとも提携した。ハイエンドコンピューティングでは、レイトレーシング（Ray Tracing）という光の陰影を実際の写真並みの品質で表現する手法をリアルタイムで実現するNvidia RTX技術も発表した。

世界に示したディープラーニング用サーバNvidia DGX-2では、従来1ラックに20台のサーバを搭載し、それを15ラック並べた広いデータセンターに匹敵するディープラーニング処理能力を持ちながら、1ラック分にも満たない5台のサーバで実現できるコンピュータシステムを開発した。サイズは1/60、電力効率は18倍という高性能なコンピュータとなった。これまでのコンピュータサーバーDGX-1は、最大8個のGPUを搭載していた。

このディープラーニング用サーバDGX-2では、最も強力なGPUであるNvidiaのTesla V100のメモリを従来の2倍の32GBに大容量化し、最大16個のGPUを搭載している。16個のGPUをどのように構成するか。これまでは4GPUを1組として、四角形の頂点に各GPUを配置する構成で互いに連結し行き来できるアーキテクチャであり、8個のGPUの場合はこれを2組で互いにデータを行き来できる構成を採っていた。しかし16GPUとなると、もはやこのアーキテクチャは使えないため、バス方式に似たファブリックNVLinkインターコネクトチップを新たに設計した（図2）。このチップにはクロスバースイッチを集積しており、18個のポートを持ち、最大900GB/sでデータ転送する。このチップだけでも20億トランジスタを集積している。

図2　16個のGPUをNVLinkインターコネクトで100%接続する

図2　16個のGPUをNVLinkインターコネクトで100%接続する

推論ソフトウエアTensorRT 4をGoogleのディープラーニング用フレームワークTensorFlow 1.7に統合し、推論アプリケーションをGPU上で実行しやすくした。学習済みのニューラルネットワークを迅速に最適化し、検証、展開するために利用する。Googleがこのソフトを使い別のGPUで実行した結果、TensorFlow内でGPU推論の速度はこのソフトを使わない場合と比べ8倍高速のスループットが得られたとしている。

自動運転のための物体認識に使うAI機能をシミュレーションするための車載シミュレーションプラットフォームNdivia Drive Constellationをリリースした。これは2台のサーバからなり、それぞれが専用のソフトウエアを搭載している。1番目のサーバにはNdivia DRIVE Simを搭載し、自動運転に必要なカメラとミリ波レーダー、Lidarなどのセンサをシミュレーションし、センサデータを生成する。もう1台のサーバにはAI車載コンピュータNvidia Drive Pegasusと、自動運転用のソフトウエアスタックが搭載され、あたかも実際の道路上を走行するクルマのセンサから得られたデータのように処理を行い、走行状況を指示し、シミュレータにフィードバックされる。このHIL（Hardware in the loop）は1秒間に30回シミュレーション動作できる。

シミュレーションソフトのDrive Simは、暴風雨や吹雪などの異常気象や、昼間の眩しい太陽光、夜間の暗い状況、ありとあらゆるタイプの路面や地形など、などさまざまなテスト環境を創り出すという。こういった状況の中でカメラ映像やレーダーの反射波形などのデータを取り込みシミュレーションする。

Nvidiaはまた、IoTのような軽いエッジデバイスにも推論用プロセッサを搭載できるようにするため、CPUコアベンダーのArmとも提携した。Nvidiaのディープラーニングアクセラレータ（NVDLA）アーキテクチャをArmの「Project Trillium」プラットフォームに組み込み、機械学習を実現するという。NvidiaのNVDLAは、SoCのXavierをベースとして、ディープラーニングの推論アクセラレータを設計する際の標準を目指す無料のオープンアーキテクチャである。推論ソフトウエアのTensorRTの最新版もサポートしている。

Nvidiaは、今や半導体GPUチップからコンピュータハードウエアとソフトウエアまで手掛ける演算に特化したコンピュータメーカーと言えるかもしれない。

(2018/05/02)

HOME

Nvidia、ディープラーニングの総合力を見せつける

月別アーカイブ

キーワード

ブログ

セミコンポータルによる分析