セミコンポータル
半導体・FPD・液晶・製造装置・材料・設計のポータルサイト

Arm マイコン用Cortex-M55と256MACのEthos-U55でAI推論性能を上げる

ArmがAI推論用の回路を組み込んだマイコン制御用IPと、ニューラルネットワーク向け機械学習プロセッサIPをリリースした。マイコン制御に使われてきたArm Cortex-MシリーズにニューラルプロセッサHeliumを組み込んだ最上位のCortex-M55と、最大256個のMAC(積和演算)回路を集積した新しいニューラルプロセッサEthos-U55である。

図1 Armがリリースした新しいAI推論用IPコア2種 Cortex-M55(右)とニューラルプロセッサEthos-U55(左) 出典:Arm

図1 Armがリリースした新しいAI推論用IPコア2種 Cortex-M55(右)とニューラルプロセッサEthos-U55(左) 出典:Arm


Arm Cortex-Mシリーズは低価格で制御命令が充実した32ビットマイコン用のCPUコアである。Cortex-M55は、低価格でしかも機械学習の推論機能を持たせられるようにするため、1年前に発表したニューラルプロセッサHeliumを集積している。簡単な学習だとCortex-M55だけでも推論できる。Heliumを搭載していない従来のCortex-M4やM7と比べて、1CPU当たりの演算速度は、最大15倍に達するという。

AIプロセッサチップは一般に、制御機能を設けていないため、CPUと一緒に使う、いわゆるアクセラレータが多い。低コストでAI推論機能をもっと高めたい場合には、Cortex-M55にEthos-U55をアクセラレータとして使えば効力がある。さらに32倍の演算能力が高まり、従来のCortex-M4/7と比べると理論的には480倍(15×32)の演算能力を持つことができるようになる。MAC演算の精度は8ビットとする。

Arm Ethos-U55は、顧客の要求によって、MAC演算器を32個から64個、128個、256個までその構成を変えることができる。重みを圧縮しているため、重みを即座に伸長したい場合には重みデコーダとDMA(Direct Memory Access)を利用する。このニューラルプロセッサはCortex-M55だけではなく、従来のCortex-M4/M7をはじめM33とも一緒にアクセラレータとして使える。

Arm Cortex-M55には、DSP(高精度な積和演算専用のマイクロプロセッサ)も集積しており、機械学習の前処理や後処理、新しいアルゴリズムの組み込みに使えるようになっている。Cortex-M55もEthos-U55も共にArmv8-M向けのセキュアな部屋(コンテナ)であるTrustZoneに対応している。

Cortex-M55とEthos-U55をボイスアシスタントに使う場合に、従来のCortex-M7と比べて推論のスピードは50倍に、エネルギー効率は25倍に高まるという。二つのIPを組み合わせる応用としては、音声認識に加えて、指紋認証などの生体認証やジェスチャー検出などに向くとしている(図2)。


Broadest Range of ML-optimized Processing Solutions

図2 ArmのIP資産はさまざまな用途のAI処理に使える 出典:Arm


さらに高度な物体分類やリアルタイム認識では、Cortex-AシリーズとGPUコアのMali、さらにEthos-Nシリーズのニューラルプロセッサを組み合わせると必要な性能(TOP/s)が得られるという。逆に軽い演算、例えば物体認識や異常検知、キーワード検出などにはCortex-M55や、振動検出やセンサフュージョンには従来のCortex-Mシリーズで十分だとしている。

これらのIPを集積したシリコンが登場する2021年はじめまでには、SoCを設計するためのCorstoneリファレンスデザインとソフトウエアも提供する。ソフトウエアの開発では、開発フローを1本化する予定だという。これまでは、Cortex-Mシリーズにはコードの組み込みやDSPにはDSPコード、ニューラルプロセッサにはニューラルネットワークモデルが必要だった。これらのヘテロコアのソフトウエアをまとめていきたいとしている。

(2020/02/13)

月別アーカイブ

セミコンポータルはこんなサービスを提供します