IBM Spectrum Scale

ストレージソリューション

IBM Spectrum Scale (旧称 GPFS:General Parallel File System)は、グローバル・スケールで大容量データへの高速アクセスを実現します。クラウドや アナリティクスに求められる優れたスケーラビリティーと俊敏性を備えています。

製品概要

IBM Spectrum Scale は 、データ 、ファイル 、オブジェクトを管理し、ボトルネックを発生させずにパフォーマンスと容量を拡張するように徹底して構築されます。データ、メタデータ、フラッシュの優れた拡張性を提供する実績ある高性能なソリューションです。最大8エクサバイト(800万テラバイト)のファイルシステムサイズをサポートします。ポリシーに基づく自動化階層管理機能により刻々と変わるデータの付加価値に基づく保管メディアの変更を定義します。時間の経過とニーズの変化に応じて、データをフラッシュ、ディスク、テープライブラリーといったストレージ階層間を全自動で移動させますが、ファイル所有者からのアクセスポイントは一つのファイルのため、データの実体がどの階層にあっても変わらず利用することができます。

また、並列に接続されている複数のフラッシュやディスク・ユニットを単一のアクセスポイント、ネームスペースから複数のルートでどこからでもデータに低遅延でアクセスできます。インターネットに接続された地球規模に分散されたプロジェクトにおいても、この単一のネームスペースから透過的にデータにアクセスできる機能は、必要なデータとリソースに常に接続できるようにして、地球規模のビジネスにおいても協業を支え、様々なビジネス・スケジュールの迅速化と生産性の向上を可能にします。

IBM Spectrum Scale は、OpenStack Swift オブジェクト・ストアへのアクセスや、aws、IBM Cloud 等のパブリック・クラウド環境でも、企業独自のオンプレのプライベート・クラウド環境でもインストールが可能であるので、イメージ画像やビデオ映像といったオブジェクトを簡単に管理できるようにします。

特長

Spectrum Scale は、IBM が1994年に発表した超並列演算用スーパーコンピューターである PowerSP2 上に実装するために、研究・開発を続けてきた GPFS (並列ファイルシステム)をベースにしています。多くの世界的なスーパーコンピューター・システム上の高速大容量、大規模サイズのファイルを扱ってきましたが、Hadoop をはじめとして発達したクラウドシステム上のデータアクセスや、高速分析計算を行うアナリティクス・ソリューションに求められる高パフォーマンス、スケーラビリティー性能を備え、インターネット接続による地球規模の共有アクセスを実現します。

  • データに関連したボトルネックを解消
    • サーバー拡張時に GPFS サーバー・クラスターをスケールアウトして性能を維持、また、Power および X86 の Linux 環境にて9620ノードまでの拡張が動作確認済み
    • 400 GB/s のスループットを実証(アルゴンヌ国立研究所の事例)
  • グローバルなコラボレーションを実現
    • 統一されたストレージとグローバル名前空間
    • 複数のサイトにわたって、HDFS、ファイル、オブジェクトを提供するデータ・レイク
  • コストとパフォーマンスを最適化
    • 自動化データ配置
    • 最大 90% のコスト削減と最大 6 倍のフラッシュ速度向上
  • データの可用性、保全性、セキュリティーを保証
    • Erasure Code (消失訂正符号)、複製、スナップショット、暗号化
    • エンドツーエンドのチェックサム、Spectrum Scale RAID 、NIST/FIPS 認定

 

利用方法

ソフトウェア・ソリューション サーバー・ソリューション ラウド・サービス
  • ほぼすべてのハードウェア・プラットフォームで実行でき、ほとんどすべてのブロック・ストレージ・デバイスをサポート
  • Linux、AIX、Windowsをベースとするシステムで稼働
  • ハードウェア、ソフトウェア、サービスがバンドルされたオファリングであり、インストールと、グラフィカル・ユーザー・インターフェースによる管理容易性を実現
  • Elastic Storage Server(ESS)は、卓越したエンドツーエンドのデータの可用性、信頼性、保全性を提供して、IBM Spectrum Scale RAID などの独自のテクノロジーを採用
  • IBM Cloud や aws 等のパブリッククラウド環境の仮想環境において、大量のデータとファイルを管理するための高性能で、スケーラブルなストレージ、統合されたデータ・ガバナンスを提供

 

分散ファイルシステムの比較

一般的なNAS
IBM Spectrum Scale

  • 同一ベンダー、同一モデルでの容量拡張となる
  • IO がコントローラーに集中する
  • コントローラーを拡張すると IPアドレスが増え、
    マウントポイントが増える

  • サーバー、ストレージ共にマルチベンダーで構成可能
  • IO はサーバー間で負荷分散される
  • サーバー、ストレージを追加しても単一のファイル システムで、
    マウントポイントはそのまま

 

要件に合わせて共有ストレージ、分散、アプライアンスなど様々な構成が可能

共有ディスク構成 ファイルサービス構成

基本の構成です

ファイルサーバー機能も製品の一部です

分散構成 Elastic Storage Server (アプライアンス)
サーバーの内蔵ディスクを使用する分散構成です
Hadoopのバックエンドでも利用可能です

ディスク障害時に高速に復旧できるSpectrum Scale Native RAIDや、
ソフトウェア単体では提供されないGUI管理ツールを使えます

 

さまざまなプロトコルに対応

サポートするプロトコル

サポートする認証方式

  • ファイル:LDAP (w/ Kerberose)、Active Directory、NIS
  • オブジェクト:OpenStack Keystone

 

導入効果

  • コモディティー・ハードウェアによって、初期コストや総保有コストを大幅削減
  • 読み取り専用のローカル・キャッシュにより、I/O パフォーマンスを高速化
  • ポリシーに基づくストレージ管理の自動化で、ストレージ・コストを削減
  • オンライン拡張可能なファイルシステムで、障害時にもシステムを止めずに運用できる高い可用性
  • POSIX、NFS、SMB、OpenStack Swift 、Amazon S3 に対応し、ファイルとオブジェクトのストレージ・アクセスを実現
  • Hadoop ワークロードと HDFS をサポートし、Hadoop コネクターにより複数の Spectrum Scale クラスターや別の HDFS リポジトリーを単一の HDFS インスタンスに統合、Hadoop、Apache Spark、関連パッケージのデプロイメントとワークフローを簡素化

 

 

参考情報

back to top