Semiconductor Portal

» セミコンポータルによる分析 » 技術分析 » 技術分析(半導体製品)

AMD、完全なメモリコヒーレンシの最初のHSAアーキテクチャ製品を発売

AMDは、パソコンから組み込みシステムへの応用に力を入れており、高性能なRシリーズ新製品のAPU「Bald Eagle」(図1)、GPUの「Adelaar」を、セミコンポータルで昨秋報道したように(参考資料1)、予定通りサンプル出荷する。

図1 AMDの新型APU「Bald Eagle」 百円硬貨とほぼ同じ大きさ

図1 AMDの新型APU「Bald Eagle」 百円硬貨とほぼ同じ大きさ


ここで、APUはアプリケーションプロセッサ、GPUはグラフィックスプロセッサの略である。Bald Eagleの狙う用途は、アミューズメント(パチンコやパチスロ)、医療機器の画像処理、デジタルサイネージ、工業制御や自動化など、高性能なグラフィックス機能を要求される分野である。

性能は、これより微細な製品よりも高い。AMD Embedded Solutions部門Product Management & Marketing部ディレクタであるKamal Khouri氏(図2)は「3Dグラフィックス性能は競合するIntelのプロセッサHaswellよりも最大44%も高く、前世代の製品と比べると最大55%高い。同様に演算能力はHaswellと比べると最大46%、前世代製品とは最大66%高い」と述べる。


図2 AMD Embedded Solutions部門Product Management & Marketing部ディレクタであるKamal Khouri氏

図2 AMD Embedded Solutions部門Product Management & Marketing部ディレクタであるKamal Khouri氏


IntelのHaswellは22nmのFinFETプロセスで、AMDのBald Eagleは28nmバルクCMOSプロセスである。常識では微細化する方が性能は上がるはずだが、Khouri氏はHaswellよりも性能が高い理由を、HSA(Heterogeneous System Architecture)アーキテクチャ(参考資料2)を採り入れたため、と説明する。

HSAは、CPUとGPUを集積するAPUに向いたアーキテクチャであり、CPUとGPUのメモリは完全にコヒーレントに共有されている。例えばCPUでシリアルなジョブを、GPUでパラレルなジョブを実行させる場合には、メモリのコヒーレンシが完全にとれていなくては、途中で「待った」(ロック)をしなければならず、互いのやりとりに時間がかかってしまう。CPUとGPUがオンチップでもオフチップ(PCIバス)でもコヒーレンシは同様に重要だった。HSAでは、hUMAと呼ぶバスを利用する。すべてのメモリ空間でメモリの位置を指すポインタを使うことで、CPUとGPUへの振り分けをハードウエアがサポートするのだと、Khouri氏は述べる。

マルチコアやCPUとGPU、DSPなど異なるコア、同種のコアなども含めて全てのプロセッサコアがメモリを共有できる仕組みになっていることで、高速性能を得ている。さらに、HSAでは、OpenCLを使ってプログラミングする場合でも、メモリデータのロックを考えなくてもすむという。


図3 HSAアーキテクチャで完全なメモリコヒーレンシを実現 出典:AMD

図3 HSAアーキテクチャで完全なメモリコヒーレンシを実現 出典:AMD


AMDはこの製品のほかにもGPU単体のAdelaarもサンプル出荷する。さらに、低消費電力タイプのGシリーズAPU「Steppe Eagle」なども近いうちに発表を予定している。

参考資料
1. 組み込みシステムになびくAMD/IPextreme/Mentor〜EuroAsia2013から(2) (2013/11/06)
2. 複雑なSoCを簡単に設計するためのツールを標準化しよう−HSAが呼びかけ (2013/9/13)


(2014/05/21)

ご意見・ご感想