セミコンポータル
半導体・FPD・液晶・製造装置・材料・設計のポータルサイト

1ビットの推論AIチップのIPコアを国内ベンチャーLeapMindが一般販売

|

エッジやエンドポイントなどの端末でのAI推論機能を作り上げるのに、最優先されるのが低消費電力。端末はスマートフォンやハンディターミナルなどバッテリ駆動のデバイスが多いからだ。そこで顧客の学習モデルを再構成しながら分解能1ビット(バイナリ)でニューラルネットワークの重みを構成する技術 (図1)をIP化したスタートアップの日本のLeapMind(参考資料1)がこれまでの知見を元にIPコア新製品Efficiera(エフィシエラ)を発売した。

極小量子化ディープラーニング技術とは(映像)

図1 重み1ビット、データ活性化2ビットという最小のビット数でAIを実現 出典:LeapMind


2012年に創業した同社は、当初からできるだけ量子化ビット数を減らす機械学習の技術を開発してきた。AI(機械学習やディープラーニング)では、優れたアルゴリズムやCNN(畳み込みニューラルネットワーク)の技術を改良しても顧客の要望に合わなければ使い物にならない。このため、顧客と共同開発し、顧客の要望に沿ったモデル開発とCNNの量子化ビット数の最適化(消費電力との)を図ってきた。重みを1ビット、データの活性化に2ビットという最低限度の量子化ビット数でニューラルネットワークを実装する(図1)。

CNNを使った同社の推論向け1ビットIPコアEfficieraは、創業からこれまでのモデルの軽量化技術や回路設計などを開発してきたうえに、150案件を超えるさまざまな企業との共同開発で得られた知見を元に製品化にこぎつけた。2018年に開発したばかりのIPは残念ながら性能が不十分だった、と同社Blueoil事業部VP&GMの山崎勝利氏は述べており、その後改良を重ね、今回の製品化につながった。

元々、AIは、企業や組織と共同でモデル開発を行うようなコンサルティングビジネスが圧倒的に多い。汎用のAIでどの客にも使えるような技術ではない。だからこそ、さまざまな顧客との共同開発やモデル構築が重要となる。社内のエンジニアや顧客と課題について議論を重ねた結果、「良質な機械学習モデルの開発」と「高速で高効率なハードウエアIPの開発」というソフトとハードの両面からアプローチで課題を解決するという答えにたどり着いた、と同社CEOの松田総一氏は同社ホームページ上で述べている。

ただ、いつまでたっても顧客と1対1でゼロからモデルを開発していくコンサルティング的なビジネスでは発展性がない。そこで、LeapMindは、1ビットEfficieraに最適化した物体検出用の学習済みモデルを提供し、顧客のデータセットを組み合わせながらファインチューニングしカスタマイズするための、ファインチューニングツールも開発している(図2)。これによって顧客との共同開発期間が大幅に短縮できる。


同時提供の学習済みモデルについて

図2 Efficieraに適した学習モデルやファインチューニングツールも提供 出典:LeapMind


1ビットの推論向けIPコアEfficieraは、消費電力が低いだけではなく、Siチップに落とす場合のチップ面積が少なくて済む、すなわち低コストでできるというメリットがある。計算量が軽いために高速性も備えており、さらにIPを並列に並べていく拡張性もある。

しかも実装するFPGAの規模を少なくできる。例えば、125MHz動作で250 GOP/s (Giga Operations per second) を基本構成とする場合、論理エレメント数11万のIntelのFPGA内蔵SoC「Cyclone V」の約1/3(35%)のリソースで実装できる(図3)。さらに性能を2倍、4倍と拡張することもできる。1 TOPSの性能を実現する場合でも基本構成の69%の面積で済む。


ハードウェア設計の変更無くAI機能を追加可能

図3 FPGA内蔵SoCのCyclone Vの灰色部分がFPGAでEfficiera(濃い青色)はその1/3しか占めない 出典:LeapMind


1ビットのEfficieraはどのような顧客にも向くわけではないが、例えば、「画像や映像を解析する応用の一つで、鉄道の駅のホームドアの近くにカメラを設置し、ドアにモノが挟まっているかどうかをチェックする事例には使える」と山崎氏は言う。また、画像解析として食肉工場でどの部位なのかを1秒もかからず解析・判断する応用にも使えるとしている。


参考:Efficieraの性能スケーラビリティ

図4 1ビットの重みでもかなりの応用まで可能だ 出典:LeapMind


1〜2 TOPSだと接近しつある物体や人を60 FPS(フレーム/秒)で検出、介護施設や病院などでの見守り(スケルトン)などでは4〜8 TOPS必要だが、60 FPSで検出できる。さらに規模を拡張すれば、8〜12 TOPSで数千人規模の人数カウントや40〜50 TOPSでノイズ削減何度の画質改善にも応用できるとしている。

今後同社は、顧客が自分でファインチューニングできるようにツールの改善に加え、さらにメニューを増やしていく予定である。加えて、汎用性の高いIPコアも開発していく。世界シェアとして10%をとりたいと意欲的だ。

参考資料
1. LeapMindホームページ

(2020/11/26)

月別アーカイブ

セミコンポータルはこんなサービスを提供します