2022.9.13

ブログ

【てくさぽBLOG】IBM Power10プロセッサーってどこが優れているの！？

こんにちは。
てくさぽBLOGメンバーの佐藤です。

2022年7月20日に IBM より Power10 Scale Out Model の発表がありました。
既にリリースされている E1080モデルと比較して、リーズナブルな価格帯を実現してます。

今回は IBM Power の設計に注目し、どのような点が優れているのか？他社との違いは何か？にポイントを絞ってご紹介します。

Powerの3要素

Powerの設計は主に以下の3つの要素から形成されます。

パフォーマンス
資産継承
システム連続稼働(可用性、セキュリティ)

1.パフォーマンス

Power9からPower10 の主だった進化ポイントは以下の通りです。

	Power9	Power10
最大搭載コア数	12	15
L2キャッシュ	512kB/Core	2MB/Core
L3キャッシュ	120MB/チップ	120MB/チップ
PCle	Gen4	Gen5
消費電力	–	Power9の半分

また、次の点も進化しています。

新命令セットISAを追加（AIやセキュリティ対応）
実行ユニット　128Bit (整数/浮動小数対応) ×8/Core
OMIメモリ 1024GB/s対応

以上の観点からもパフォーマンスUPされていることがわかりますが、ここではさらに代表的なx86CPUとの比較について、独自の視点でまとめてみました。

会社名	IBM	INTEL	AMD
CPU名称	Power10	Xeon SP 3rd	EPYC 7003
プロセスルール	Samsung 7nm	Intel 10nm	TSMC 7nm+GF 14nm
ダイサイズ	602㎟	非公開	8×81㎟＋416㎟
トランジスタ数	180億	非公開	8 ×33.2億⁺84億 (パッケージ328億)
コア数	15	40	64
1コアあたりのトランジスタ数	12億	非公開	5.125億
1コアあたりのスレッド数	8	2	2
L2キャッシュ/Core	2MB	1MB	512KB
L3キャッシュ(共有)	120MB	60MB	32MB×8⁼256MB
L3キャッシュ/Core	8MB	1.5MB	4MB
CPUクロック	3.55GHz～4.0GHz	2.3GHz~3.4GHz	2.45GHz~3.5GHz
メモリクロック	DDR4 3200MHz	DDR4 3200MHz	DDR4 3200MHz
メモリチャンネル	16ch(OMI）	8ch(ダイレクト接続)	8ch(ダイレクト接続)
メモリ帯域	1024GB/s	200GB/s	200GB/s

比較いただければわかると思いますが、Power10は非常に豪華な構成です。
1Coreあたりの資源投入量が多く、メモリ帯域も非常に高いです。
「クロック数が高い」「1Coreあたりのキャッシュが多い」「スレッド数が多い」となり、性能向上に対して妥協なく取り組んでいます。

Intel® 64 and IA-32 Architectures Optimization Reference Manual を参考により詳しく見ていきます。

	Intel	Power
アーキテクチャ	Skylake	Power10
整数同時実行数	4	8
浮動小数同時実行数	3	8
512Bit行列演算同時実行数	2	4

Power10は、1Coreあたりの同時実行数が整数、浮動小数、行列演算すべてにおいて上回っています。
SMT8は、単純な水増しではなく、同時に8つの演算を並列して実行できるだけの構造になっていることがお判りいただけるかと思います。

同時にOMI (後ほど詳細を説明します) によってより多くのメモリ帯域を確保しています。

2.資産継承

Powerは互換性について重視しています。

通常、CPUのアーキテクチャ変更はOS側で吸収するというのが一般的ですが、OSとCPU両方開発しているIBMは違います（IBMのStrong Pointの1つです！）

PowerはCPU自体に互換モードを備えており、100％の互換性を担保します。
つまり、Power10ではPower9モード、Power8モードが利用可能ですので、従来の環境から一旦そのままで移行したいケースや、CPUの相性が心配といった場合でも互換モードを使うことによって安心して移行することが可能です。

ただし、互換性を最重視した結果、互換モードではPower10から新たに対応している命令セット、例えばMMA（Matirix Multiply Assist）命令は対応できない為、性能が十分に発揮できないケースがございます。
移行後はOSを最新化していただくのがおすすめです。

3.システム連続稼働(可用性、セキュリティ）

IBM Powerは非常に障害に強い、ダウンタイムが少ないプラットフォームというのは周知の事実かと思います。
では、どのようにしてこのような堅牢な環境になっているのでしょうか？

従来よりPowerはプロセッサー周りについては非常に堅牢なRAS機能を搭載しています。
これらの機能は引き続きPower10でも継承されています。

First Failure Data Capture
Processor Instruction Retry
L2/L3 Cache ECC protections with cache line-delete
Power and cooling monitor function integrated into processors’ on chip controllers
CRC checked processor fabric bus retry with spare data lane

追加されたPower10のRAS機能とセキュリティ機能について解説します。
Power10では、主にプロセッサー外部のRASおよびセキュリティ機能が強化されています。

OMI (Open Memory Interface) :

本来パラレル転送であるDDR4メモリをシリアル転送化するメモリインターフェースです。
シリアル転送化により、より高速にするだけでなく、従来では不可能だったCPU-メモリ間のアクセスの障害についても帯域を半減させて縮退動作させることが可能になりました。

※Powr10プロセッサーはPower9プロセッサーと比べ4倍以上の帯域幅を確保により、高速処理を実現

Chipkill :

Chipkill は従来のECCメモリより高い可用性があり、RAIDパリティのような機能です。
DIMMの中に多数搭載されたメモリチップのうち一つが障害を起こしてもリカバリします。

スペアチップ :

RAIDのスペアドライブと同じでDIMM内にスペア用のメモリチップを用意することにより障害を起こしたチップを切り離し、容量を少なくすることなく代替メモリチップに切り替えます。

透過的メモリ暗号化:

メインメモリ上に展開されたパスワード等のデータは暗号化が難しいため常にセキュリティリスクにさらされています。

近年ではサイドチャネル攻撃により、別の仮想区画のデータを覗き見る手段が指摘されており、これらの攻撃に対しては、根本的な対抗策はメインメモリの暗号化となります。
Power10は専用の暗号化エンジンをDIMM上に配置することにより、パフォーマンス劣化なくメモリ暗号化を実現しています。

Power10が先駆けた性能改良、セキュリティを実装しているか、を解説いたしました。

おわりに

Power10は高速、高可用性、高いセキュリティとすべての要求に応えるプロセッサーとなります。

特にセキュリティについては、現状で攻撃が存在しないとしても悪意ある攻撃が登場するとゼロディ攻撃にさらされるため、対策が遅れがちになります。
さらに修正不可能なバグがあった場合は、明日サーバーを入れ替えるということも現実的にできないので、問題が発覚する前によりセキュアな機能を先んじて実装するというのが非常に大切です。

将来も安心して利用できるインフラ環境としてPower10を覚えていただければと思います。
今後Power10での提案活動が加速ていくことを期待してます。

お問い合わせ

この記事に関するご質問は下記までご連絡ください。

エヌアイシー・パートナーズ株式会社
E-Mail：voice_partners@niandc.co.jp

【てくさぽBLOG】IBM Power10プロセッサーってどこが優れているの！？

Powerの3要素

1.パフォーマンス

2.資産継承

3.システム連続稼働(可用性、セキュリティ）

OMI (Open Memory Interface) :

Chipkill :

スペアチップ :

透過的メモリ暗号化:

おわりに

お問い合わせ

関連情報

【てくさぽBLOG】IBM BobでRPG解析！複雑なロジックを一瞬で整理し、実務の即戦力に

ポストVMwareに有力な選択肢
OpenShiftと IBM Fusionで実現する次世代インフラ基盤

【参加レポート】「IBM TechXchange Summit Japan 2025」に参加してきた

水冷サーバーの違いとは？（レノボの水冷サーバー#2）

IBM Power Systems

Contact Us お問い合わせ