こんにちは。
てくさぽBLOGメンバーの佐藤です。
2022年7月20日に IBM より Power10 Scale Out Model の発表がありました。
既にリリースされている E1080モデルと比較して、リーズナブルな価格帯を実現してます。
今回は IBM Power の設計に注目し、どのような点が優れているのか?他社との違いは何か?にポイントを絞ってご紹介します。
Powerの3要素
Powerの設計は主に以下の3つの要素から形成されます。
- パフォーマンス
- 資産継承
- システム連続稼働(可用性 、セキュリティ)
1.パフォーマンス
Power9からPower10 の主だった進化ポイントは以下の通りです。
Power9 | Power10 | |
最大搭載コア数 | 12 | 15 |
L2キャッシュ | 512kB/Core | 2MB/Core |
L3キャッシュ | 120MB/チップ | 120MB/チップ |
PCle | Gen4 | Gen5 |
消費電力 | – | Power9の半分 |
また、次の点も進化しています。
- 新命令セットISAを追加(AIやセキュリティ対応)
- 実行ユニット 128Bit (整数/浮動小数対応) ×8/Core
- OMIメモリ 1024GB/s対応
以上の観点からもパフォーマンスUPされていることがわかりますが、ここではさらに代表的なx86CPUとの比較について、独自の視点でまとめてみました。
会社名 | IBM | INTEL | AMD |
CPU名称 | Power10 | Xeon SP 3rd | EPYC 7003 |
プロセスルール | Samsung 7nm | Intel 10nm | TSMC 7nm+GF 14nm |
ダイサイズ | 602㎟ | 非公開 | 8×81㎟+416㎟ |
トランジスタ数 | 180億 | 非公開 | 8 ×33.2億⁺84億 (パッケージ328億) |
コア数 | 15 | 40 | 64 |
1コアあたりのトランジスタ数 | 12億 | 非公開 | 5.125億 |
1コアあたりのスレッド数 | 8 | 2 | 2 |
L2キャッシュ/Core | 2MB | 1MB | 512KB |
L3キャッシュ(共有) | 120MB | 60MB | 32MB×8⁼256MB |
L3キャッシュ/Core | 8MB | 1.5MB | 4MB |
CPUクロック | 3.55GHz~4.0GHz | 2.3GHz~3.4GHz | 2.45GHz~3.5GHz |
メモリクロック | DDR4 3200MHz | DDR4 3200MHz | DDR4 3200MHz |
メモリチャンネル | 16ch(OMI) | 8ch(ダイレクト接続) | 8ch(ダイレクト接続) |
メモリ帯域 | 1024GB/s | 200GB/s | 200GB/s |
比較いただければわかると思いますが、Power10は非常に豪華な構成です。
1Coreあたりの資源投入量が多く、メモリ帯域も非常に高いです。
「クロック数が高い」「1Coreあたりのキャッシュが多い」「スレッド数が多い」となり、性能向上に対して妥協なく取り組んでいます。
Intel® 64 and IA-32 Architectures Optimization Reference Manual を参考により詳しく見ていきます。
Intel | Power | |
アーキテクチャ | Skylake | Power10 |
整数同時実行数 | 4 | 8 |
浮動小数同時実行数 | 3 | 8 |
512Bit行列演算同時実行数 | 2 | 4 |
Power10は、1Coreあたりの同時実行数が整数、浮動小数、行列演算すべてにおいて上回っています。
SMT8は、単純な水増しではなく、同時に8つの演算を並列して実行できるだけの構造になっていることがお判りいただけるかと思います。
同時にOMI (後ほど詳細を説明します) によってより多くのメモリ帯域を確保しています。
2.資産継承
Powerは互換性について重視しています。
通常、CPUのアーキテクチャ変更はOS側で吸収するというのが一般的ですが、OSとCPU両方開発しているIBMは違います(IBMのStrong Pointの1つです!)
PowerはCPU自体に互換モードを備えており、100%の互換性を担保します。
つまり、Power10ではPower9モード、Power8モードが利用可能ですので、従来の環境から一旦そのままで移行したいケースや、CPUの相性が心配といった場合でも互換モードを使うことによって安心して移行することが可能です。
ただし、互換性を最重視した結果、互換モードではPower10から新たに対応している命令セット、例えばMMA(Matirix Multiply Assist)命令は対応できない為、性能が十分に発揮できないケースがございます。
移行後はOSを最新化していただくのがおすすめです。
3.システム連続稼働(可用性、セキュリティ)
IBM Powerは非常に障害に強い、ダウンタイムが少ないプラットフォームというのは周知の事実かと思います。
では、どのようにしてこのような堅牢な環境になっているのでしょうか?
従来よりPowerはプロセッサー周りについては非常に堅牢なRAS機能を搭載しています。
これらの機能は引き続きPower10でも継承されています。
- First Failure Data Capture
- Processor Instruction Retry
- L2/L3 Cache ECC protections with cache line-delete
- Power and cooling monitor function integrated into processors’ on chip controllers
- CRC checked processor fabric bus retry with spare data lane
追加されたPower10のRAS機能とセキュリティ機能について解説します。
Power10では、主にプロセッサー外部のRASおよびセキュリティ機能が強化されています。
OMI (Open Memory Interface) :
本来パラレル転送であるDDR4メモリをシリアル転送化するメモリインターフェースです。
シリアル転送化により、より高速にするだけでなく、従来では不可能だったCPU-メモリ間のアクセスの障害についても帯域を半減させて縮退動作させることが可能になりました。
※Powr10プロセッサーはPower9プロセッサーと比べ4倍以上の帯域幅を確保により、高速処理を実現
Chipkill :
Chipkill は従来のECCメモリより高い可用性があり、RAIDパリティのような機能です。
DIMMの中に多数搭載されたメモリチップのうち一つが障害を起こしてもリカバリします。
スペアチップ :
RAIDのスペアドライブと同じでDIMM内にスペア用のメモリチップを用意することにより障害を起こしたチップを切り離し、容量を少なくすることなく代替メモリチップに切り替えます。
透過的メモリ暗号化:
メインメモリ上に展開されたパスワード等のデータは暗号化が難しいため常にセキュリティリスクにさらされています。
近年ではサイドチャネル攻撃により、別の仮想区画のデータを覗き見る手段が指摘されており、これらの攻撃に対しては、根本的な対抗策はメインメモリの暗号化となります。
Power10は専用の暗号化エンジンをDIMM上に配置することにより、パフォーマンス劣化なくメモリ暗号化を実現しています。
Power10が先駆けた性能改良、セキュリティを実装しているか、を解説いたしました。
おわりに
Power10は高速、高可用性、高いセキュリティとすべての要求に応えるプロセッサーとなります。
特にセキュリティについては、現状で攻撃が存在しないとしても悪意ある攻撃が登場するとゼロディ攻撃にさらされるため、対策が遅れがちになります。
さらに修正不可能なバグがあった場合は、明日サーバーを入れ替えるということも現実的にできないので、問題が発覚する前によりセキュアな機能を先んじて実装するというのが非常に大切です。
将来も安心して利用できるインフラ環境としてPower10を覚えていただければと思います。
今後Power10での提案活動が加速ていくことを期待してます。
お問い合わせ
この記事に関するご質問は下記までご連絡ください。
エヌアイシー・パートナーズ株式会社
E-Mail:voice_partners@niandc.co.jp
関連情報
- 出荷から半年、IBM Power10が市場に与えたインパクトとは? (インタビュー)
- 【10分で早わかり】インタビュー記事「Power10の真の価値とは」 (インタビュー)
- 早わかり!ここが進化したIBM Power10! (コラム)