Arm、新世代のCPU,GPU,AIの各コアとカスタマイズコアCortex-Xを発表
Armが新時代のCPU、GPU、AIの各コア製品をリリースした。それぞれCortex-A78、Mali-G78、Ethos-E78という製品名だ。既存の最高のコア製品(A77、G77、E77)と比べ、電力効率で20%、性能で25%、単位面積当たりの推論性能で25%改善されている(図1)。性能や効率を上げることでイマーシブ(没入感)体験が増すという。カスタム化に対応するCPUコア、Cortex-Xも提供する。
図1 ArmのCPUコア、GPUコア、AIコアの最新製品 出典:Arm
CPUコアCortex-A78は、没入感のある5Gのグラフィックスに対応できる性能を持ちながら、電池動作は丸1日以上もつほどの低い消費電力を提供する。電力効率に加え、物理的な面積も現在のA77と比べ15%ほど小さくなっている。性能的には、A78はA77のクロック周波数2.6GHzを凌駕し、3.0GHzで動作する。A77で使われた8個のオクタコアのbig.LITTLEアーキテクチャは踏襲している。これは性能優先のCortex-A78コア4個と低消費電力のCortex-A55コア4個を集積したアーキテクチャで使われる(図2)。動作状態に応じて、コアの配分を変えていく。待機時のように消費電力を低く抑えたい場合は、小さなコアだけで動かす。
図2 Cortex-A78+Cortex-A55の8コアを使うbig.LITTLEアーキテクチャで電力効率・面積効率がA77よりも高い 出典:Arm
Mili-A78のGPUコアは、PCやコンソール型のゲーム、AR/VRのようなXR、さらに機械学習などに使う。煙った場面やガラスの多い場面、森林のような複雑な場面などを描画する時の性能改善に注力してきたという。いろいろなゲームの種類があるが、7種類のゲームに応用した場合、性能はG77と比べ6〜17%改善した。また、顔認証や動画・静止画など機械学習に応用した場合ではG77よりも15%改善したとしている。最大6コアから24コアまでサポートする。詳細は語らないが、非同期技術で消費電力を低減し、拡張性を改善したという。G78のGPUコアには、写真のような画像を提供するRay Tracing技術はまだ使われていないが、その動向をつかみながら開発を進めていく。
ゲーム開発者向けにPerformance Advisorと呼ぶフレーム解析ソフトも提供する。このソフトを使えば、動画のボトルネックを素早く検出するため、性能改善する時間が短縮できる。このソフトは、Arm Mobile Studioの一部として搭載される。
AIディープラーニングのニューラルネットワーク演算専用IPコアであるEthos-N78は、MAC(積和演算)回路の最大数を増やすことで、N77と比べピーク性能は2倍に増え、性能効率は25%上がった。DRAMバンド幅の効率はネットワークの種類によるが40%向上した。90通り以上の構成を変えられるという。
N78によって、これまでのパターン認識による検出と分類の作業だけではなく、音声認識も可能になり、用途はスマートフォンから写真のコンピュータ処理にいたるまで用途が広がった。
これらの汎用IPコアに加え、カスタム化できるCPUコアCortex-Xも今回、発表した。CPUは元々、共通のハードウエアプラットフォームであり、その上で走るソフトウエアで差別化を図るマシンである。しかし、性能を追求するなら、そのハードウエアもカスタム化する必要がある。この「Arm Cortex-X Custom」プログラムでは、Cortexアーキテクチャを使いながら従来の標準的なArm Cortex製品をカスタマイズし差別化を図ろうというサービスである。
図3 Cortex-A78コアを1個だけ性能優先のCortex-X1に交換すると性能は30%向上 出典:Arm
このサービスのきっかけは、キーパートナーから、汎用Cortexシリーズの特長である小型・低消費電力・性能を、性能を最優先するとどうなるかと問われ、CPUを再設計したという。例えば、今回発表したCortex-A78コアを4個含むbig.LITTLEアーキテクチャで4MBのL3キャッシュを使う場合には20%の性能向上で-15%の面積削減だったのが(図3)、Cortex-A78の一つをCortex-X1コアに変えた場合、共有メモリに8MB L3を使うと面積が15%増えるものの、性能は30%上がる。民生用途で動作を確認しているという。
現在、累計で1660億個の出荷された半導体チップがArmコアを使っており、従来の携帯機器からクルマのインフォテインメントやデータセンターなどへ、と今後は用途を広げていく。