プリファードネットワークス、AI学習チップを顔見世

2018年12月18日｜技術分析（半導体製品）

ディープラーニングのフレームワークChainerを提供しているプリファードネットワークスが学習を短期間で可能にするためのチップを開発、セミコンジャパン2018の会場で発表した。学習可能なAI専用ICは、初めて。学習用ではこれまでのNvidiaの牙城を崩す初めての専用ICとなる。

図1　32.2mm×23.5mmの巨大なシリコンを4個搭載したAI用IC基板　出典：プリファードネットワークス

この学習用チップ「MN-Core」は、チップ面積32.2mm×23.5mmという巨大なシリコンチップを4個基板に装着し(図1)、Cu製のフタをしてパッケージングした(図2)。それを実装したボードとその上にファンと放熱フィンを取り付けたボード(図3)、ボードを4枚搭載したコンピュータ(図4)、そしてサーバーラック(図5)を見せた。

図2　AIダイ4個をパッケージングしたICをプリント基板に実装

図2　AIダイ4個をパッケージングしたICをプリント基板に実装

図3　AI用ICのパッケージ上に放熱フィンとモータのファンを搭載

図3　AI用ICのパッケージ上に放熱フィンとモータのファンを搭載

図4　AI用ICボードを4枚搭載したサーバ

図4　AI用ICボードを4枚搭載したサーバ

図5　コンピュータサーバを4台ラックに搭載

図5　コンピュータサーバを4台ラックに搭載

BGAパッケージに収容したAI用ICは、6456端子を持ち、基板にボンディングしている。チップの製造はTSMCの12nmプロセスを用いた。1パッケージの性能は単精度演算で131 TFLOPS（テラフロップス）と高く、半精度での性能は524 TFLOPSとなる。単精度での性能は1パッケージで0.26 TFLOPS/Wとなり、消費電力は500Wと見積もっている。

1チップで100Wを超えるため冷却は欠かせない。熱伝導率の高いCuを4チップ全面に使った上にその熱を逃がすための放熱フィンを付け、そのフィンの表面積を稼ぐために薄い金属板でフィンを作り、さらにモータのファンで風を送り冷却する。ボード1枚でAI用IC1個というぜいたくな構成だが、フィンのスペースを広くとらざるを得ないため、ボード1枚がAIプロセッサ1個という構成になる。

コンピュータサーバは、AI専用機であり、NANDフラッシュを使ったNVMeと、SATAに対応したストレージも搭載している。このための全体を制御するCPUも搭載している。

プリファードが学習用のAIプロセッサを開発したのは、ディープラーニングの学習プロセスの時間を短縮するためだ。従来なら1カ月かかる学習プロセスをせめて1週間に短縮したい。グラフィックス専用の汎用チップではなく、専用チップならニューロンのモデルのようにMAC（積和）演算とメモリをセットにして性能を上げることができる。

推論チップでは、16ビット精度を8ビットに落として性能をほとんど変えずに消費電力を半分以下にすることが可能だ。しかし、学習チップではニューラルネットワークを構成するニューロンの重みを学習のために変えていくバックプロパゲーション（誤差逆伝播学習）において、ほんのわずかでも精度を落とせないという。このため、行列演算コアの精度を、16ビット（半精度）、32ビット（単精度）、64ビット（倍精度）の3種類を用意した。

学習させるコードはアプリケーションごとに異なるが、ニューラルネットワーク向けのChainer（チェイナー）フレームワークをアップグレードしてもこのチップを使えるように設計しているという。まず、社内で実証実験（PoC）を行う計画だ。学習用のAIプロセッサでは消費電力をどこまで落とせるか、AIチップの課題はこれからだ。

(2018/12/18)

ご意見・ご感想

プリファードネットワークス、AI学習チップを顔見世

Breaking News

2024年9月のトップ10記事

キーワード

インサイダーズ