セミコンポータル
半導体・FPD・液晶・製造装置・材料・設計のポータルサイト
セミコンポータル

複雑なSoCを簡単に設計するためのツールを標準化しよう−HSAが呼びかけ

CPUやGPUなど複数のプロセッサを集積したSoCチップをもっと簡単・短期間に設計したい。SoCの普及を目的とした標準化団体HSA Foundationがこういった開発ツールを標準化するため2012年6月に誕生した。AMDやARM、Qualcommなどが創立メンバー(図1)となり、オープンな設計プラットフォームを作る活動に力を入れている。このほど電話記者会見で、その活動状況を明らかにした。

図1 HSA Foundationのメンバー企業

図1 HSA Foundationのメンバー企業


HSA(Heterogeneous System Architecture)Foundationは、CPUとGPUやDSPなど異なるプロセッサを集積するSoCを簡単に設計するために作られた。SoCあるいはシステムLSIが最近増えてきたことへの対応である。特にスマートフォンやタブレットなどのモバイル端末の心臓部となるアプリケーションプロセッサ(APU)や、高集積のSoCには、制御用CPU(例えばCortex-A7)と演算用CPU(Cortex-A9)、グラフィックス演算にはGPU(グラフィックスプロセッサ)が搭載されるようになってきた。特にQualcommやSamsung、nVidia、AppleなどのAPUプロセッサには異種のプロセッサコアが集積されている。最近発表されたAppleの新型スマホiPhone 5Sには、マルチコアGPUを集積した64ビットアプリケーションプロセッサA7が搭載されていた。プロセッサの歴史でいえば、シングルコアのプロセッサからマルチコアのプロセッサへとやってきて、今ヘテロプロセッサコアの時代に入ってきたと言える(図2)。


図2 ヘテロプロセッサコアを多数集積したシステムLSIの時代に入った 出典:HSA Foundation

図2 ヘテロプロセッサコアを多数集積したシステムLSIの時代に入った
出典:HSA Foundation


こういったプロセッサには、メモリへのアクセスの広いバンド幅の高速性能が求められ、さらにより短い開発期間、より低い消費電力も要求される。このためHSA Foundationでは、次の項目について定義している;

1)全てのプロセッサへのアドレッシングを統一
2)ページ形式のシステムメモリで動作
3)完全なメモリコヒーレンシを実現
4)ユーザモードのディスパッチ
5)構造化されたキューイング言語
6)GPUプロセッサの高位言語サポート
7)プリエンプションとコンテキストスイッチ

HSA Foundationは、これらを盛り込んだオープンなプラットフォームを作ろうという組織である。ここで入手できるのは、プログラマー用のリファレンスマニュアルと、システムアーキテクチャ仕様、ランタイムライブラリ。さらにロイヤルティフリーのIPと仕様書、APIも手に入る。この団体に参加するのは、ハードウエア企業に加え、OSメーカー、ツールメーカーやミドルウエアメーカーなど。

加えて、HSA Foundationはメモリモデルも提供する。マルチプロセッサのすべてのスレッド間における順序の可視化を定義する。C++11とJava、.NETのメモリモデルと互換性があるように設計される。また並列演算性能用のメモリモデルともほぼ一致している。

HSAアーキテクチャはOpenCL標準仕様に向けて最適化されたプラットフォームであるが、OpenCLに代わるものではない。HSA上でOpenCLを使えば次のようなメリットを受けられる;

1)無駄なコピーを避けられる
2)低レイテンシーのディスパッチ
3)改良されたメモリモデル
4)CPUとGPUの間で共有されるポインター

OpenCL 2.0はHSAアーキテクチャとかなり整合性がとれており、OpenCLの策定団体であるKhronosのメンバーになっている企業もHSAには多い。

基本構成要素であるプリミティブな並列処理ライブラリ「BOLT」は、OpenCLで動かすことができる。GPUコンピューティングの消費電力を下げるのに有効で、CPUとGPUの唯一のソースコードの基本となる。


図3 高性能でもコードは短い 出典:HSA Foundation

図3 高性能でもコードは短い 出典:HSA Foundation


プログラミングは簡単だという。従来なら、性能を上げようとすると、コードの行数も増えていくが、このプログラミング手法は性能を維持しながらコード行数を減らすことができる(図3)。OpenCL Cコードと比べると、行数は1/4〜1/5と少なく、OpenCL C++と比べても1/2.5、並列GPU処理向けのC++ AMPと比べても1/2ですむ。HSA FoundationプレジデントのPhil Rogers氏は、「アクセラレータのプログラミングを簡単にできるというメリットが大きく、並列GPUプロセッサから、スマホ用のAPU、スーパーコンピュータのHPC(High Performance Computing)の分野にも使える技術だ」と述べる。

このFoundationには日本メーカーが極めて少なく、図1の中にはソニーと、IPベンダーのDMPしか見当たらない。日本からの参加も期待している。

(2013/09/13)

月別アーカイブ

Copyright(C)2001-2024 Semiconductor Portal Inc., All Rights Reserved.