セミコンポータル
半導体・FPD・液晶・製造装置・材料・設計のポータルサイト

Amazon、専用半導体チップを続々開発中

|

Amazonのクラウドコンピューティング会社であるAWS(Amazon Web Service)が自社設計の半導体を拡大している。最新版マイクロプロセッサであるGraviton 2に加え、機械学習のチップAWS Inferentia、ハードウエアセキュリティチップNitro Security Chipをクラウドで利用しており、さらに学習チップAWS Trainiumを開発中だ。

Nitroシステム-マイクとサービスのコンセプトをハードウェアに拡張子、プラットフォームを再構築

図1 Nitroシステムをハードウエア化し他社と差別化する 出典:AWS


AWSのクラウドにおけるプラットフォームは仮想化を徹底しており、これまではサーバーの中で、仮想化コンピューテンングのカスタマインスタンスと、メモリとCPUを割り当てるハイパーバイザをサーバー全体の70%を占めていた。残りの30%はネットワーキングとストレージ、その他(管理やセキュリティなど)だった。これを前者の70%を100%サーバーに持たせ、残り30%を全て専用のハードウエアで構成しそれをNitro(ナイトロと発音)と呼んだ(図1)。つまり、ここにも半導体チップを自社開発していく。

コンピューティング仮想化部分は、IntelやAMDのx86アーキテクチャと、64ビットArm Neoverseコアを集積したGraviton 2プロセッサで構成する。自主設計のGraviton 2プロセッサは、x86アーキテクチャよりも40%コストフォーマンスが良いことを確認している。データセンターのプロセッサ部分でコストパフォーマンスが良いことは、仮想化コンピューティング能力を他のクラウドベンダーよりももっと増強できることにある。すなわち差別化できる。

Intelの新プロセスIntel 20AではGraviton 3を製造依頼する計画であり、Intelのファウンドリとしての能力への期待は大きい。今のところ、x86アーキテクチャとGravitonを共存させているが、将来に関しては言及していない。

AWSは、Nitroの導入によって、ネットワーウやストレージ、管理・セキュリティ関係をハードウエア化するためのチップ開発に力を注ぐことになる。セキュリティでは、インスタンスのハードウエアやファームウエア化を監視、保護する。セキュリティチップはRoot of Trust(信頼の基点)をハードウエアで実現したもの。このチップが、全ての不揮発性ストレージへのI/Oをトラップして制御する。そして不揮発性ストレージへの全ての書き込みをハードウエアでブロックする。起動時にはストレージ上のデータが書き換わっていないことを常に確認する。

AIの機械学習専用チップAWS Inferentia(図2)を開発したのは、ディープラーニングのラニングコストをGPUインスタンスと比べて30%削減でき、応答のレイテンシは25%に削減できるという。


機会学習推論用プロセッサ: AWS Inferentia

図2 AWSの推論用チップAWS Inferentia 出典:AWS

AWSは音声入力「Alexa」のような音声をテキストから生成するモデルをInferentiaに移行させることで、より高速なAlexa応答をもたらすことになる。

さらに今後は開発中の学習チップAWS Trainiumは、AWS Inferentiaで利用するAWS Neuron SDK(ソフトウエア開発キット)を使ってモデルをコンパイルできるという。最小限のコード変更でGPUベースのインスタンスからも移行可能だとしている。TensorFlowやPyTorchなど主要フレームワークをサポートしている。性能の詳細は発表していないがTFLOPSレベルであることは間違いなさそう。2021年末までには入手可能にする計画だ。

(2021/08/13)

月別アーカイブ