2020年09月

16

ハイブリッド/マルチクラウド時代だからこそIBMのストレージ

IBMの岡田です。

前回の「OpenShiftに代表されるコンテナ環境へのIBMストレージの対応」でも触れた通り、ここ数年の傾向として何でもかんでもクラウドに移行するという時代は過ぎ、従来型の IT インフラとクラウド環境とを上手く使い分け、あるいは連携しながら、目的の業務アプリケーションを動かしていく方向になりつつあります。いわゆるハイブリッドクラウドというものです。
そして、パブリッククラウド自体もそれぞれのサービスにより使い分ける風潮があり、今やパブリッククラウド・ユーザー企業の半分以上が、複数のパブリッククラウドを使っているのではないかと思われます。いわゆるマルチクラウドと呼べるものですね。

しかし、なかなか統合的に管理するというところにまでは至っておらず、クラウドを含めたサイロ化が起こっている状況です。
このような運用ではアプリケーションの適材適所はおろか、データさえ十分に使えていないことは明白です。

今回はこのようなハイブリッド/マルチクラウドの状況の中でデータを上手く連携し活用していくために、IBMのストレージにできるソリューションを紹介しましょう。

 

ハイブリッド/マルチクラウドの位置づけ

以下の図は、ハイブリッドクラウド、マルチクラウドを模式的に表したものです。
オンプレ環境のプライベートクラウドまで含んでマルチクラウドという人もいますし、従来型の物理サーバーや仮想化された VM 環境もハイブリッドクラウドのオンプレミス部分の一部と考える人もいます。人によっても会社によっても捉え方は色々ですが、ここでは敢えて従来型 IT もハイブリッドクラウドの一部として話をしたいと思います。

図1. ハイブリッドクラウドとマルチクラウド

 

IBM Spectrum Virtualize for Public Cloud とは!?

IBM Spectrum Virtualize for Public Cloud(SV4PC)は、第一回目第二回目のブログでも登場した IBM のメインストリームとなるブロックストレージ、FlashSystem にも搭載されている管理機能ソフトウェア、これをパブリッククラウドでも使えるようしたものです。
つまり、SV4PC はハイブリッドクラウドやマルチクラウドに対応したストレージ製品です。

SV4PC を知れば FlashSystem を知ることができますので、SV4PC の機能を紐解いていきましょう。

 

外部仮想化機能

2003年、この Spectrum Virtualize ファミリーの元となる製品が生まれました。SAN Volume Controller、通称 SVC です。
今でもこの製品は最新のテクノロジーを装備してファミリーの一員です。(IBM Spectrum Virtualize for Public Cloud も Spectrum Virtualize ファミリー製品です。)

そこから脈々と受け継がれた外部仮想化という機能は、IBM および他社ストレージ製品約500種類を配下に接続可能で、これを仮想化して自身のストレージとして扱うことができるものです。

図2 外部仮想化機能

もちろん、既存で使われているストレージのボリュームや保存されたデータを生かしたまま配下に収めることができるため、オンライン・データ移行はもちろん、コピーサービス(スナップショット等の機能)を持たないストレージにそういった機能を与える事もできます。

この機能を使う事で、FlashSystem では他社製品を含めた古い製品から簡単に最新のテクノロジーにデータを引っ越すことが可能です。

パブリッククラウド上では、SV4PCがプロバイダーが提供する基本的な機能しか持たないブロックストレージを配下に置くことができます。
これにより、最新のデータ削減機能の他、ブロックレベル自動階層化のEasy Tier(補足参照)、FlashCopyや筐体間コピーを含むコピーサービス(補足参照)、といったテクノロジーも使用可能となるわけです。

 

図3. データ移行のイメージ

 

様々なデータ削減機能

FlashSystem 5010 を除く Spectrum Virtualize ファミリーには、いくつかのデータ削減機能があります。
これらは DRP(Data Reduction Pool)というデータ削減にはなくてはならない機能を実装した Spectrum Virtualize ファミリー特有のストレージプール上で実現されます。また DRP での各処理単位はフラッシュ系デバイスに最適化されています。

図4.Data Reduction Pool

具体的には「リアルタイムデータ圧縮機能」「重複排除機能」「シン・プロビジョニング機能」がサポートされています(一部組合せによりサポートできないデバイスがあります)。
※詳しくは補足をご覧ください。

 

Spectrum Virtualizeファミリーのハイブリッドクラウド/マルチクラウド対応

触れてきた通り IBM の Spectrum Virtualize ファミリーであれば、オンプレミスの FlashSystem あるいは SVC とパブリッククラウド上の SV4PC とでデータ連携できるので、データの観点でハイブリッドクラウド対応ができます。
また、パブリッククラウド同士でデータ連携することもそれぞれに SV4PC を置くことで可能となり、マルチクラウド対応もできます(2020年7月時点、IBM Cloud と AWS に対応)。

図5. ハイブリッド/マルチクラウドのデータ連携

さらにこの方法を使えば、他社の既存データも活かすことができます。外部仮想化機能が使えるからです。

つまり IBM の Spectrum Virtualize ファミリーを使うと、他社ストレージ製品も含めてハイブリッドクラウド対応できる事になります。

では、データをハイブリッド/マルチクラウド連携できると何が嬉しいのでしょうか。

 

ハイブリッドクラウド/マルチクラウドの利点

グローバルでは、一番広く使われているのが災害対策用途です。
被災時に本番環境が使えなくなった際も、パブリッククラウド側で仮想サーバー、コンテナなどを使い業務を継続できるからです。

今求められるデータ活用としては AI/アナリティクスなどと言うものもあります。
オンプレミスで使えるものもありますが、手軽にやろうとすると各パブリッククラウド上で提供している AI サービスを使うのが早いですね。最初に触れた通りサイロ化されたデータをパブリッククラウドと連携するにもハイブリッドクラウドは有効です。

バックアップ先としてパブリッククラウドを使うと、いらぬ投資をすることなく遠隔保管が可能となります。
通常テープを使った遠隔保管ですと保管場所である拠点、定期的な搬送といった固定費が発生します。最悪の場合、本番業務側が被災した場合にもデータをリストアしなければならないことを考えると、保管場所にリストアする仕組みが必要となります。これも大きな投資となるでしょう。
パブリッククラウドをバックアップ先とした場合それだけで遠隔保管が実現でき、必要な場合のみ仮想サーバーも立てることができるため DR としての役割も果たせるのです。

また、クラウドに業務を移行するというケースもまだまだ発生しますね。
この際クラウドプロバイダーが提供している方法もありますが、移行対象となるデータが多量にあると、なかなか与えられた方法を用いて計画通りに移行することは困難な場合があります。特にプロバイダーから送られたハードウェアを仲介して行う方法は、移行の間は業務を止めて対応する必要があります。これではビジネス的なインパクトが発生します。
ハイブリッドクラウド形態でのクラウド・オンプレミス間のデータ同期であれば業務を止めずに対応でき、万が一クラウドに移行したことで何らかの不具合を生じた場合にも即座に元の環境に戻すことができます。

これらの有益なハイブリッドクラウドのデータ連携にマルチクラウドのデータ連携要素が加わると、更に有益なことがあります。
最近の風潮としては、パブリッククラウド上にデータを置く場合でもミッションクリティカルなものの場合には、AZ(アベイラビリティーゾーン)を跨ってレプリケーションを取ることが一般的になってきています。冗長性を保つという意味では、異なるパブリッククラウドにコピーを持つことも有効でしょう。
このような用途にもマルチクラウド・データ連携は役に立ちます。

またメジャーなパブリッククラウドは、基本的にグローバル展開をしております。
自身で海外にサイトを立ち上げる必要なく、容易に海外展開できるといった利点や、国内でも東阪の災対環境も手軽に築くことも可能です。

図6. ハイブリッド/マルチクラウドで実現できるソリューション

 

ハイブリッドクラウド・データ連携の具体例:クラウドへのデータ移行

パブリッククラウドに業務を移行する際に、ハイブリッドクラウドの接続形態を使うことで既存の業務を止めないオンラインデータ移行が可能です。(ただし既存ストレージの仮想化のための接続変更時は短時間ですが止める必要があります。)

図7. ハイブリッドクラウド活用例・クラウドへのデータ移行

オンプレミスとパブリッククラウド、あるいはパブリッククラウド同士でのレプリケーションは方向を変えることも可能ですので、もししばらく使ってみて移行先で業務がうまくいかないなどの不具合が生じた場合は、データをオンプレミス側に戻すことも可能です。

他の活用例も結局はこのレプリケーションを使って双方を連携させることによりますので、アイディア次第でお客様の用途に合わせて色々な活用方法が見つかるかもしれません。

 

クラウド上ではこんな使い方も

SV4PC だけでも面白い使い方ができます。

多くのパブリッククラウドの環境下では、その環境内で使える仮想ブロックストレージが用意されています。
プロバイダーにもよりますが、大雑把に言ってしまえばクラウドは大規模な物理リソースを小出しにして使っている都合上、様々な制約があったり、性能の低いリソースを使わないとコストがかかりすぎるなど難しい局面も持っています。

例えば一つの仮想ブロックストレージの上限容量です。あるプロバイダーでは 16TB までしか使えなかったり、IOPS の上限にひっかかったりします。
このように、デフォルトのままではパフォーマンス要件をこなせないような場合でも、SV4PC で仮想ブロックストレージを複数束ねることで、仮想サーバー側に提供するストレージをスケールアウトすることができるので解決できたりもします。

また、データがホットな時期は SSD、旬が過ぎると HDD レベルで充分なデータを扱う場合、そもそも一時的なパフォーマンスのために全データを同じ SSD に置いておくのは無駄があります。
このような場合、最小限必要な SSD と充分な HDD を SV4PC で束ねつつ、前述の Easy Tier のような自動階層化機能を使うと、意識することなくホットデータは SSD で処理、その後は HDD へ配置されるので、クラウド上のストレージコストを全体的に減らすことができたりもします。

さらに、SV4PC のシン・プロビジョニング機能を使えば効率の良いコスト削減が可能となります。
通常の場合、仮想ブロックストレージの払い出しは見込み容量を先に決めてからその分払い出すことになり、運用後の拡張の手間を考えると、あらかじめ余裕を持った容量を払い出しがちです。この場合、実際に使用していなくとも払い出した容量は課金対象となります。
これに対しシン・プロビジョニングは、実際に存在する容量以上のストレージ空間を切り出すことができるのと、後から不足しそうな容量分の仮想ブロックストレージをストレージプールに加えることもできるので、最小限の容量から始めることができ、容量課金を削減することができます。

図8. パブリッククラウド上でのSV4PCの活用

なお何度も言いますが、SV4PC は今後のコンテナ環境にも対応しております。
ここまで見てきた通り、SV4PC はクラウド全盛の今だからこその機能を備えた Software Define Storage ソリューションであることが分かると思います。

いかがでしたか?

ハードウェアはもちろん技術の塊ですが、ソフトウェアのみでも十分に使える IBM Spectrum Virtualize ファミリー、少しは興味を持っていただけたのではないでしょうか?

次回は「最新のデータのライフサイクル管理」ということで ESS、Sepctrum Scale、オブジェクトストレージ、そして Spectrum Discover といった製品に触れてみたいと思います。

乞うご期待!

 

補足

1)リアルタイムデータ圧縮

バッチ処理で圧縮するのではなく、データの書き込み時に圧縮処理をして記憶域に書き込む圧縮方法です。FlashSystem 5030 と SV4PC を除きハードウェア・アクセラレータを活用できます。
もちろん 5030 および SV4PC もコントローラのリソースのみの処理ですが暗号化機能を実現しています。
圧縮率は、対象となるデータの種類によって異なりますが、一般にデータベース、メール、仮想サーバーイメージなどのファイルが高いと言われています。
以前はオフィスデータなども高かったのですが、最近はすでにオリジナルのオフィスファイル自体で圧縮済みですので、あまり効果は期待できなくなっていると言われます。

更に DRP の機能とは別に、IBM 特有の FlashCore モジュール(略して FCM。FlashSystem 5100, 7200, 9200/R で使用可能)であれば、モジュールそのものにインライン・ハードウェア圧縮機能があります。これはモジュール内のハードウェア的なデータの通り道にワイヤードロジックによる圧縮機能を設けているため、性能に影響を与えません。
ちなみにこのワイヤードロジックには暗号化機能も盛り込まれており、同様に性能に影響のない暗号化を実現しています。

 

2)重複排除

データのなかに同じパターンを見つけて、冗長なデータを削減することで容量を節約する機能です。特に仮想サーバーイメージなどには有効な手法です。
以前は非常に負荷がかかる作業だったため、バックアップなどに限定して使われていた技術ですが、昨今は性能の向上により、通常のストレージでも当たり前に使われる技術となりました。
以下は非常に単純化したインラインで扱われる重複排除のイメージです。バックアップ等での処理はこの限りではありません。

図9. 重複排除

実際はこう単純ではありません。
書かれたデータのパターンに応じたフィンガープリントと呼ばれる代替え値をハッシュ関数により導き、新たに書かれるデータのハッシュ値がすでに存在するフィンガープリントと一致している場合は、データそのものは書き込まず、参照するフィンガープリントのポインターのみを管理テーブルに記録する。これによりデータを間引くことができ、書き込み容量を削減することができるのです。

DRP 上での重複排除の特徴はフィンガープリントを同一ボリューム内のみならず、同じ DRP で定義された別のボリュームも含めて参照していることです(※図4参照)。同じプール内でバックアップなどのボリュームが定義された場合などに効果を発揮できるからです。

図4.Data Reduction Pool

 

3)シン・プロビジョニング

こちらは、データ削減と言うよりはサーバーから見た際の話になります。
通常、ストレージ装置側で定義したボリュームをそのまま OS で認識させ使用することになります。その際の容量は、ストレージ装置のボリューム定義そのままの容量となります。

図10. シン・プロビジョニング

シン・プロビジョニングを使うと、その容量定義を物理的に存在しない容量も上乗せして定義することができます。この場合消費されるストレージ装置の容量は実際に書き込みが起こった時にそのデータ容量分ずつとなります。
もちろんその存在しない容量分に書き込みが発生するとエラーになりますので、そうなる前に物理容量を追加する必要があります。同じストレージプール内の複数のボリュームで、実際に存在する実効容量を共有して消費するといった使い方が効果的です。が、OS 側からは何も意識することがありません。

この方法は、実はパブリッククラウドのように払い出し容量で月額課金されるようなサービスでは、より有効な節約方法となります。

 

4)Easy Tier

Spectrum Virtualize ファミリーには、もう一つ特徴的な機能として自動階層化機能があります。
通常データの階層管理というと、ファイルレベルで実装するものをイメージされる方が多いのではないでしょうか?

Easy Tier はブロックレベルでありながらストレージの負荷情報を自ら学習し、アクセスの集中するホットなデータは Flash系のデバイス、アクセス頻度の低いデータは容量単価に優れる大容量・低速の HDD といった階層にデータを AI を使ってストレージの機能で動的に移動させる機能です。

図11. EasyTierの動作イメージ

この機能を使うと高価な半導体系のストレージデバイスの容量を節約し、安価なハードディスクを増やすことで、パフォーマンスを下げずに全体の容量単価を下げることができます。
オンプレミスの FlashSystem はもちろん、払い出し容量で月額課金されるパブリッククラウドでも有効な節約手段となります。

 

5)コピーサービス

今や多くの廉価なストレージ装置もスナップショット、レプリケーションといった機能は当たり前になっています。

図12. 様々な用途に使えるコピーサービスの数々

スナップショットなどの瞬間のボリュームイメージを切り取る機能は、一般的にポイント・イン・タイム・コピーと呼び、IBM の場合は FlashCopy と言われる機能になります。
こちらは通常ストレージ装置内で使われる機能です。バックアップを取るときなどアプリケーションや RDB などと連携して、静止点をとるのに有効な機能です。

これに対して、ストレージ装置間で関連づけたボリューム同士で同期を取り、それぞれのボリュームを常に同じデータで満たす方法がレプリケーションです。
スナップミラー、ボリュームミラー、リモート・ミラーあるいはリモート・コピーなど、メーカーによって呼び方は様々ですが、基本的には時間的ズレのない同期型のものと、多少の時間的ズレを容認する非同期のものとに大別されます。
前者は銀行など災害などでのデータ損失を認めないような要件で使われ、拠点を跨ぐ場合、それなりの高価な設備(ネットワーク設備であったり拠点設備であったり)と共に使われます。後者はデータの多少の損失は容認するか、または別の方法(ログデータとかとの併用など)で補うかして、むしろ、より遠隔にデータを退避することを優先するなどの目的で使われます。広域災害などへの対策が多いですね。

考慮すべき事項に、特にレプリケーションは同じストレージ装置同士であると言う大前提があります。メーカーごとに使っている技術が異なるからです。
IBM の場合、Spectrum Virtualize ファミリーであれば相互接続が可能です。つまりオンプレミスのFlashSystem または SVC とパブリッククラウド上の SV4PC との接続が可能なのです。これが IBM ストレージがハイブリットクラウドに対応できると言う一つの根拠です。
もちろん前回触れた通り CSI(Container Storage Interface)にも対応していますので、コンテナ環境にも対応可能です。

接続方法について以前は、ストレージ機器同士の同期ということでより早く安全な FCP(Fibre Channel Protocol)に頼っていましたが、今日では非同期を前提に充分に IP 接続でも対応できるようになりました。
また、帯域以上のデータ転送を余儀無くされる初期同期が問題になりますが、前述のシン・プロビジョニング・ボリュームを対象とすることでボリューム全転送を必要とせず差分だけで可能となったり、データそのものも効率的な圧縮・重複排除の活用で小さくなったというのも大きいですね。

 

 

この記事に関するお問合せ

エヌアイシー・パートナーズ株式会社
企画本部 事業企画部

この記事に関するお問い合せは、「こちら」からお願いします。

 

参考ページ

その他の記事

2021年01月13日

ハイブリッドクラウド、最大の課題となる「運用」をクリアする 「IBM Spectrum Virtualize for Public Cloud」の実力

社内システムのクラウド移行が着実に進むなか、全システムをクラウド移行するのではなく、オンプレミスと適材適所で使い分ける「ハイブリッドクラウド」を選択する企業が増えています。 オンプレミスとクラウド、それぞれのメリットを享受できる一方、データ連携や管理の効率化が課題になっています。 これらの課題を解決し、ハイブリッドクラウド運用の最適解としてお勧めなのが「IBM Spectrum Virtualize for Public Cloud」です。 クラウドへの移行からオンプレミスとのデータ連携、クラウド・ストレージの効率化などを実現し、様々なシーンで大きな効果を期待できます。 具体的に何ができるのか?その特長や活用法を紹介します。   クラウド移行と同時にオンプレミス回帰のトレンドも。 現実解は「ハイブリッドクラウド」 総務省の令和2年版情報通信白書によると、クラウドサービスを利用している企業は 64.7%(全社的に利用。一部の事業所、または部門で利用を含む)にのぼり、前年から 6.0ポイント上昇と、企業におけるクラウド利用が進んでいることが分かります。 AWS などに代表される IaaS の利用も増えていますが、IaaS では、用途によって得られる効果に大きな差が出ることも。 例えば、特定の期間だけ負荷が高まるシステムなどはコスト削減の効果が出やすいものの、常に一定のパフォーマンスで稼働し続けるシステムは割高になりがちです。 こういったことから、最近ではオンプレミス回帰の動きも多く見られるほか、「全システムをクラウドに移行するのは、無理がある」というケースも少なくなく、オンプレミスとクラウドを適材適所で使い分ける「ハイブリッドクラウド」が現実解として注目されています。   ストレージ管理機能に加えクラウド連携に対応する 「IBM Spectrum Virtualize for Public Cloud」 ハイブリッドクラウド環境の運用をサポートする「IBM Spectrum Virtualize for Public Cloud」ですが、具体的に、何ができるのでしょうか? そもそも「IBM Spectrum Virtualize」は、IBM のオールフラッシュストレージ「IBM FlashSystem」に搭載されているソフトウェアであり、リアルタイム圧縮や重複排除、シンプロビジョニングからデータのブロックレベル自動階層化など、ストレージの運用・管理に必要な機能を提供します。 さらに特長的なのが、ストレージ外部仮想化機能。これにより、IBM FlashSystem に接続した他社ベンダーのストレージまで含めた一元管理を可能にします。 そして、この IBM Spectrum Virtualize をパブリッククラウド上で利用できるようソフトウェア単体で提供しているのが、IBM Spectrum Virtualize for Public Cloud です。 IBM Spectrum Virtualize の機能に加えて、クラウド連携機能を搭載。オンプレミス環境の IBM FlashSystem と連携することで、オンプレミス・クラウド間で自由にデータを移動できるほか、複数クラウド間での連携も可能です(現在は、IBM Cloud、AWSに対応)。 オンプレミスからクラウドへの移行に関してはクラウド事業者などが様々なサービスやツールを提供していますが、クラウドからオンプレミスへの移行には対応していないケースがほとんど。 IBM Spectrum Virtualize for Public Cloud では双方向でのデータ移動が可能なため、状況やニーズにあわせて自由にデータを行き来させることができます。 また、ハイブリッドクラウド環境ではオンプレミスとクラウドをそれぞれ別のツールで管理しなければならず、管理負荷の増加が懸念されますが、IBM Spectrum Virtualize for Public Cloud と IBM FlashSystem であればクラウド環境もオンプレミス環境も同じ UI で管理可能。 複数の管理ツールの操作を覚える必要がなく、負担を最小限にハイブリッドクラウド環境を運用できるのです。   ハイブリッドクラウドでのDR対策からAWS環境のコスト削減まで、様々なシーンで有効 ハイブリッドクラウド・マルチクラウド環境において IBM Spectrum Virtualize for Public Cloud を活用することで、例えば以下のことが可能になります。 用途や状況にあわせた、オンプレミスとクラウドの使い分け(ワークロード最適化) DR対策、マルウェア対策としてのバックアップ環境としての利用 クラウド障害対策としてのマルチクラウド構成 データをクラウドにコピーし、開発や分析などに活用 このほか、AWS のクラウド環境単体で活用するケースでもコスト削減効果を期待できます。 IBM Spectrum Virtualize for Public Cloud は、AWS で稼働するシステム・アプリケーションで一般的に利用されるストレージサービス「Amazon EBS」の統合管理が可能。データ圧縮や重複排除により課金対象となるデータ容量を削減でき、コスト削減に。 さらに、複数の EBSボリュームをプール化して管理することで、システムやアプリケーションを停止させることなく拡張できます。事前に余裕をもった容量を確保する必要がなくなり、さらなるコスト削減が可能です。 そのほか、自動階層化や差分バックアップといった機能もコストの最適化に貢献します。   ハイブリッドクラウド・マルチクラウド環境の効率的な管理に クラウド移行のトレンドは今後も継続していくでしょう。 しかし「クラウドに移行すれば、すべて OK」というわけではなく、オンプレミスに戻す可能性や、ハイブリッドクラウド構成も視野に入れて検討する必要があります。 さらに、特定のクラウド基盤に依存することのリスクを避けるため、またクラウド基盤ごとの特性やメリットにあわせた使い分けなどから、マルチクラウド化も進むと考えられます。 こういった環境を効率的に管理するには、データ圧縮や重複排除といったストレージ管理の基本的な機能からデータレプリケーション、バックアップ、さらにクラウド連携までそろっている IBM Spectrum Virtualize for Public Cloud は、有力な選択肢と言えるでしょう。     この記事に関するお問合せ エヌアイシー・パートナーズ株式会社 企画本部 事業企画部 この記事に関するお問い合せは、「こちら」からお願いします。   参考情報 (製品情報) IBM Spectrum Virtualize for Public Cloud (製品情報) IBM ストレージ製品 (コラム)「壊れにくく、処理速度が落ちない」IBM FlashSystem の特長とラインナップを徹底解説 (ブログ) ハイブリッド/マルチクラウド時代だからこそIBMのストレージ  

2020年12月28日

Cisco UCSってなんだ?【2020年12月更新版】

皆さま、こんにちは。てくさぽBLOG メンバーの 岡田です。 エヌアイシー・パートナーズでは2016年からCisco Unified Computing System(以下、UCS)の取り扱いを始めています。 UCSが発表されてから既に10年以上経っておりますが、再びUCSが注目を浴びています。今回は、これからUCSを検討しようとお考えの皆さんに向けて、その特徴やメリットをお伝えします。   1. Cisco UCS とは ずばり、Cisco社製のIA(Intel Architecture)サーバです。 Intel製CPUが搭載されているので、Windows Server/Linux/VMware ESXiなどの、Intel CPU用のサーバOSがUCS上でも稼働します。 では、なぜネットワーク機器のベンダーであるCiscoがIAサーバを出したのでしょうか。 仮想化が一般化した現在のデータセンターでは、サーバ、ネットワーク、ストレージ、アプリケーションといった各構成要素を個別に構築、デザイン、最適化するサイロ型になっています。その結果として、各コンポーネント個別の管理となり、管理者間の連携の煩雑さや環境変更時の検討項目・調整・検証期間工数の増大が大きな課題となっています。 これらの問題を解決するために、UCS は、仮想環境やクラウド環境で利用されることを念頭に置き、すべてのコンポーネントを全体最適化されたアーキテクチャの下に統合することで、複雑さをなくし、リソース管理を容易にし、最適な仮想環境を実現しています。つまり、サーバやネットワークを大きな1つのリソースとして一元管理することにより、管理・運用がしやすくなるということです。 (UCSの全体最適化されたアーキテクチャ)   2.他社IAサーバとの違い では、UCSは他社IAサーバと比べて、どんなところが違うのでしょうか。UCSが他社IAサーバと異なるところは主に以下の3点になります。   ①ファブリックインターコネクト ユニファイドポートという1Gbまたは10Gbのイーサネットポート、またはファイバーチャネルポートのどちらにも設定できるスイッチポートを搭載したスイッチです。一般的なIAサーバでは、ネットワークスイッチとファイバーチャネルスイッチそれぞれに接続しますが、UCSサーバは基本的にこのファブリックインターコネクトとのみ接続します。   ②UCS Manager ファブリックインターコネクトに搭載された統合管理コンソールです。接続されたBladeサーバ、ラックサーバを一元管理します。   ③サービスプロファイル UCSでは、サーバのハードウェア各種設定情報をサービスプロファイルとして保持し、これを実際のハードウェアに関連付けることでサーバやネットワークの設定を行います。   ④Intersight Intersightはオンプレミスにある複数のCisco UCSやHCI製品のHyperFlexを統合的に管理するためのSaaSサービスです。地理的に離れた環境にある複数システムを一元管理できます。SaaSサービスなので管理サーバーを用意する必要がなく、管理者はどこからでも管理ダッシュボード画面にアクセスできます。 このような違いを持つUCSを選択すると、どのようなメリットがあるのでしょうか。   3.UCSのメリット シンプルな構成 UCSサーバはファブリックインターコネクトとのみ10Gbイーサネットケーブルで接続します。この10Gbイーサネットケーブルの中に、イーサネットとファイバーチャネルの両方のプロトコルが流れます。 これにより、ラック背面のケーブル本数が激減し、より適切なエアフローと低い消費電力を実現します。この結果として、データセンターのファシリティコスト、配線コスト、配線トラブルを削減できます。   管理ポイントの削減 UCSでは、サーバやBladeシャーシ毎に管理モジュールを持たず、ファブリックインターコネクト上にあるUCS Managerで一元管理されます。これにより、台数が増えても管理ポイントはUCS Manger1箇所のみのままですので、管理対象が増えません。これにより、個々の機器毎に管理する必要がなくなり、管理工数を削減できます。   シンプルな運用 サービスプロファイルを利用することで、構築時や障害発生における機器交換時において時間がかかっていたハードウェア設定作業を大幅に削減することが可能になります。他社IAサーバでは、サーバ導入時にさまざまな設定を個々に実施する必要がありますが、サービスプロファイルを利用するとハードウェアにプロファイルを割り当てるだけでハードウェア設定が完了します。また、機器が届く前にMAC アドレスなどの予約や、BIOS の設定を先にやっておくといったことも可能になります。   ラックマウントサーバの統合 ファブリックインターコネクト配下に接続することで、UCS Managerによる統合管理機能を、サーバ形状を問わずに一元管理可能になります。   このような特徴を持つUCSですが、エヌアイシー・パートナーズでは日本IBM社が取り扱う、IBM保守のUCSをお勧めしています。   4.IBM保守 UCSの特徴 IBM技術員によりオンサイト保守を実施します。 スペシャリストによりリモート問題判別支援をおこないます。 保守時間帯の選択が可能です。 UCSの運用を支援するオプション(交換したハードディスクのお渡しサービスと部品2時間配送サービス)を追加できます。   5.まとめ いかがでしたでしょうか。UCSはサーバメーカーとしては後発であることのメリットを活かして、これまでのIAサーバが抱えていた課題を解決できるソリューションを備えています。これにIBM保守を加えることで、ネットワーク機器からサーバまで保守をまとめてIBM社に一元化することができます。現在のデータセンター運用に課題を抱えたお客様にはぜひUCSをご検討ください。 また、エヌアイシー・パートナーズではUCSとIBMストレージ、ネットワークスイッチ等の複雑な組み合わせでの構成でも対応可能です。ご相談からお見積り依頼まで、遠慮無くお申し付けください。 最後に、弊社サイトのUCSページにてラインナップや支援内容などを記載していますので、こちらももぜひ御覧ください。 https://www.nicpartners.co.jp/products/72456/?from_category=category_all     【変更履歴】 2020/12 Intersight説明を追加。弊社サイトのUCSページへのリンクを修正。   この記事に関する、ご質問は下記までご連絡ください。 エヌアイシー・パートナーズ株式会社 技術支援本部 E-Mail:nicp_support@NIandC.co.jp 商標帰属 ・すべての名称ならびに商標は、それぞれの企業の商標または登録商標です。

2020年12月28日

AutoML(自動機械学習)の先駆者として ~第3次AIブームを牽引するH2O Driverless AI~

20世紀後半から2度のブームを経て、21世紀に入り、現在第3次ブームのなかにあるとされる AI(人工知能)。技術的には、ビッグデータを用いた機械学習にはじまり、特徴量をみずから習得するディープラーニングが登場し、現在に至ります。 こうしたなか、AI活用のハードルを下げ、データサイエンティストがいない企業にも道を開くものとして期待されているのが "AutoML" 機能を搭載した最新の AIソリューションです。 AutoML は、時間と手間のかかる機械学習のモデル作成・調整・最適化などを自動化するプロセスです。AutoML を利用することで劇的な業務効率化が期待できます。そして、AIソリューションの代表であり、先駆的存在として知られる H2O Driverless AI(以下 DAI)は、グローバルでの知名度はもとより、最近は国内でも注目されつつあります。 そこで本記事では、DAI を取り扱う国内 AIソリューションベンダーの1つである、日本アイ・ビー・エム株式会社 ハイブリッドクラウド&AIシステムズセンターの河井 裕 氏に、DAI を用いた AutoML への取り組みについてお聞きしました。   機械学習からのアーリーアダプターと DXで動き出したフォロワーが混在 近年、拡大成長傾向にある国内 AIシステム市場は、コロナ禍の影響が懸念される2020年以降も引き続き大幅な高成長が続くと予想されています。 こうしたなか、河井氏によると、AI導入についての問い合わせや相談をしてくる企業は大きく2パターンに分かれると言います。 1つは「AI活用の効率化を求めるアーリーアダプター」で、以前から機械学習に取り組んでいて社内に知見を有する人材もおり、AutoML による効率化メリットも理解している企業。もう1つは、「新規でAI活用を検討するフォロワー」で、DX を進めたいと焦るなかで AI活用に興味を持つが、知見を有する人材が少ない企業。 やりたいことと予算のギャップが大きく、導入にいたらないケースも多いとのことです。AutoML を搭載した AIソリューションの登場は、こうしたフォロワー企業にも AI活用の道を開くため、AIシステム市場の高成長を実現する上でもカギとなる存在と言えそうです。   OSSの先端AIソリューションであることが決め手 IBMコーポレートと DAI を提供する H2O.ai との間でパートナーシップが締結されたのは2017年7月。それを受け2018年7月からグローバルで DAI の販売を開始。日本国内でもはじめてとなります。 その後も日本アイ・ビー・エムからのリクエストが H2O.ai に採用され、日本語版の開発や Webマニュアルの日本語化など、同社が DAI の国内販売に大きく貢献しています。 ちなみに IBM の AIソリューションといえば「IBM Watson」が有名ですが、主としてオンプレミス環境で利用される DAI に対しこちらは主にクラウド型で提供されます。特に国内企業の "情報セキュリティの観点から、手元で機械学習をおこないたい" というニーズに応えるにはオンプレミスの方が向いており、顧客企業に多様な選択肢を提供する上でも、DAI の取り扱いは自然な流れだったと言えそうです。 数ある AIソリューションのなかから DAI が選ばれたのには、以下の4つの理由がありました。 知名度・実績 AutoML を搭載する AIソリューションの先駆けである DAI は、グローバルで圧倒的な知名度を誇ります。 データサイエンティストのスキルを必要とするモデル作成を自動化し、AI予測分析の効率を劇的に改善することから、FORTUNE 500 に名を連ねる企業222社を含む1万4000社以上が利用するなど、導入実績もトップクラスです。 オープンソースソフトウエア(以下OSS)として最先端を維持 DAI は OSS の機械学習エンジンを搭載し、そのソースはもちろん公開されています。 このため世界有数のデータサイエンティスト・コミュニティ「kaggle」との関係も深く、世界中のトップクラスのデータサイエンティストが開発に参加する形で日々ブラッシュアップされ、常に最先端を走りつづけています。 GPUを用いた高速性 AutoML で多数のモデルを効率よく作成する上で、ハードウェアの処理能力は高いにこしたことはありません。 DAI は他社の AIソリューションに先駆け、GPU の能力を最大限に引き出すことで処理を高速化することに成功。ビジネスのスピードアップを求める企業にとって最適なソリューションを提供します。 説明性・納得性 特徴量加工やパラメータチューニングの自動化によるモデル開発の効率化とならぶ提供価値と言えるのが、生成されたモデルについての優れた説明性です。 その部分がブラックボックスとなってしまう AIソリューションも多いなか、学習結果をきちんと説明している DAI の場合、モデルの意味を理解してスキルアップを図っていくことが可能です。   導入効果を最大化するハードウェアなど、多彩なオプションをフルスタックで取り揃え DAI を取り扱うベンダとして日本アイ・ビー・エムならではの強みと言えるのが、ユーザー企業の多様なニーズに応える製品やサービスのポートフォリオです。 ハードウェアについては、高速 GPU に加え、NVLink 対応の Power CPU を搭載する「IBM Power Systems AC922(以下AC922)」を提供。トライアンドエラーをスピード重視で繰り返す必要がある DAI環境として抜群の相性の良さを発揮し、AI活用の効率の最大化を実現します。 これらは、ソフトウェア・ハードウェアからクラウド基盤、さらにはサポートを含むソリューションまで、フルスタックで取り揃える IBM ならではの強みと言えます。加えて、環境構築はもちろん、活用フェーズにおいて個別企業のニーズにあわせた QAサービスを一定期間提供するなど、AI活用を確実に成功へと導く充実サポートについても提案しています。   <コラム:DAI on AC922を体験できる!セキュアなPoC環境をご用意> AC922 は、NVIDIA の高速 GPU「Tesla V100」を最大6枚搭載可能なほか、世界で唯一 NVLink2.0 のインターフェースを搭載する CPU Power9 を2基搭載。さらに、CAPI2.0+PCIe Gen4 などにより、圧倒的なパフォーマンスを実現しています。 実際に AC922 上で DAI を利用してそのパフォーマンスを試してみたい……という企業にぜひお勧めしたいのが、エヌアイシー・パートナーズの PoCサービスです。 下図スペックの環境を、インターネットVPN 経由でセキュアに利用できることから、製薬会社、製造業、通信会社など大手企業を中心に人気を集めています。AIツールとして、ここで紹介した DAI に加え、IBM Maximo Visual Inspection (旧 IBM Visual Insights)も搭載。数値データ分析だけでなく、画像データ分析のトライアルも可能です。 ハイスペック環境を無料で2週間お試しできるので、大量のデータを保有していて AI分析のための環境を検討中の企業は、お気軽にエヌアイシー・パートナーズに相談してみてはいかがでしょう。     この記事に関するお問合せ エヌアイシー・パートナーズ株式会社 企画本部 事業企画部 この記事に関するお問い合せは、「こちら」からお願いします。   参考情報 (ブログ)【やってみた】H2O DriverlessAIをIBM Power System AC922で動かして競馬予想する (その1) (コラム) AIによる需要予測は、どこまで使えるのか?成功と失敗の分岐点を解説 (コラム) 普及が進む、機械学習による異常検知。導入の課題はここまで解決している (製品資料) Driverless AI ご紹介資料 (事例) IBM AI ソリューションの事例ご紹介(IBM PowerAI Vison、Driverless AI) (IBMサイト)High Performance Computing (HPC) performance proof-points ※IBM Power System AC922 delivers 2.9X reduction in execution time of tested x86 systems  

2020年12月28日

データを守るということについて

IBM の岡田です。 いよいよシリーズ物、最後のテーマまでやってきました。 ここまでの内容はいかがでしたでしょうか?もう少しで完結しますので、最後までお付き合いいただければと思います。 さて、今回のテーマは「データを守ることについて」ということで、様々な脅威からどうやってデータを守るか、という内容でお届けします。   データを脅かす脅威とは 一昔前までは、データの脅威といえば人為的オペミス、装置の故障・障害、災害などが挙げられてました。しかし、最近はこれに加えサイバー攻撃といったものも加わってきております。 今まではサイバー攻撃というと、ネットワークあるいはサーバーにて対処すべきもの、という考え方が主流だったかと思います。これらはサイバーセキュリティという範疇の対策であり、今までも多くの製品やサービスによって培われてきた技術です。 しかし、昨今のサイバー攻撃はマルウェアが主流となっており、特にランサムウェアと呼ばれる攻撃が世間的にも目立ち始めてます。企業のデータを強制的に暗号化し解除するための身代金を要求するというものです。 確か最近ニュースで、日本での被害のとんでもない状況を目にした覚えがあります。調査対象の半数以上の企業は攻撃を受けた経験を持ち、実際に身代金を払った会社も調査対象の約3分の1あったということ、また、本当に支払われた身代金も平均が億を優に超える金額だったことに筆者も驚きました。 ということで、今回はストレージ技術にできるデータの保全について、従来の物理的な脅威から守ること、今日のサイバー攻撃から守ることの2つに分けてお話していきます。   物理的な脅威からデータを守る 止まらないシステムを構築するために、IT の世界では様々な対策が体系化し今日に至ってます。 全ての ITインフラを成す要素を冗長化するといったものはごく当たり前で、IT技術者なら必ず取っている対策ですね。機器自体も各パーツが冗長化されいつでもホットスワップでパーツ交換できるような仕組みになっているのが現在の IT機器です。 このように、シングルポイントになり得る構成をできる限り排除することで物理的な機器の障害や故障からシステムを守る、というのが今時当たり前のシステム設計なのはご存知の通りです。 データについてはどうでしょう。 システム構成の一部としてデータの通り道も冗長化されているのが昨今の設計ですが、データを貯める場所、つまりストレージについては過去より多くの技術が使われてきております。 パーツとしての HDD 等に用いられる磁気ディスクの盤面に書き込む際のフォーマットについては、ECC(Error Check and Correction)と呼ばれる技術、すなわちデータをビット化けや傷・汚れなどによるディスク上の脱落から計算により正しいデータを導くテクノロジーが用いられております。 さらに上のレイヤーでは、HDD や SSD などデイバイスの故障に対応するために、RAID といった技術が使われていることも多くの IT技術者はご存知でしょう。 最近は大容量下での再構成の長時間化などを改善するため、各社独自の RAID技術を駆使していたり、イレージャーコーディングといった、今まではディスク盤面などミクロな世界で行われていたような ECC をベースとした考え方を、装置・筐体といったレベルまで広げた技術などが使われ始めています。 最近のストレージ装置はユーザーに開放している論理ボリュームに対して、そのコピーを複数個筐体内に取って世代管理することもありますし、筐体間レプリケーションで別の安全な場所にコピーを取るということもできます。 そして、昔からあるオーソドックスな方法としては、ある時点のデータを静的に固めて安全な媒体に書き出して取っておく、所謂、バックアップが一番一般的ではないでしょうか? しかし、実はバックアップ技術も1990年代のような、ただテープ媒体などに静的データを単純にとれば良いという時代はとっくに終わっており、今やバックアップ先データ容量を極限まで抑える技術であったり、転送を効率的に行う技術であったり、いろいろな技術が併用されております。 少し簡単に紹介しましょう。以下にご紹介するのは IBM Spectrum Protect と呼ばれるバックアップソフトで使われている技術です。   1. 永久増分バックアップ 初回バックアップのみフルバックアップを取り、その後のバックアップは増分(差分)のみ。 こうすることでバックアップ先データに必要な容量を格段に節約することができますし、このデータを遠隔にレプリケーションする際もデータ量が少ないため、ネットワークに余計な負担をかけずに済みます。 図1. 永久増分バックアップ   2. 重複排除・圧縮技術 すでに枯れた技術で、ストレージ装置にも使われているものですが、特に重複排除については過去のバックアップデータとの重複もあるので、さらに効果が見込まれます。 また、VM などの仮想環境でも似たディスクイメージを扱うことで、重複排除率は格段に上がります。 図2. 重複排除   3. FASP技術 バックアップデータを DR 目的で遠隔に飛ばす際には、ネットワーク帯域を通常の TCP/IP より効率的に使用できる FASP(Fast Adaptive Secure Protocol)により、高速転送が可能となります。 図3. FASP転送   4. 今時のバックアップ先ストレージ バックアップのとり先といえば、昔はテープ、そしてディスクの時代があり、最近はまたテープが見直されてきています。 理由はもちろんビット単価であったり可搬性であったりが主ですが、後述するサイバー攻撃対策としても最近は注目されています。 最新技術活用という点では、クラウドのオブジェクトストレージにバックアップするというのも出てきています。その基本的な3形態を示したのが次の図です。 図4. バックアップ3形態   悪意のあるサイバー攻撃からデータを守る ここまでは、レガシーな考え方、つまり物理的な脅威への対策としての最新のバックアップ技術です。 ところが昨今はこう言った脅威のみならず、意図的なデータ破壊や改竄への脅威、つまりサイバー攻撃への対策というものが必要になってきています。 そもそも色々な技術の蓄積で現在のサイバーセキュリティ成り立っていますが、攻撃者とのいたちごっこであることは否めません。したがって、突破された際の対策というものも必要になります。 最近のデータによると、実際にハッカーあるいはマルウェア等に侵入されたことが発覚するまでの日数は数百日とも言われており、わかった時にはすでに多くのデータの破壊・改竄・漏洩がなされた後、ということになりかねません。 このうち、破壊・改竄はデータが失われる訳で、データを使った企業活動ができなくなるという致命的な結果になり得ます。ゆえに、破壊・改竄(ランサムウェアによる強制的暗号化も含む)への対策が必要となるわけです。 図5. サイバー攻撃の際、データが役に立たなくなる 多くの場合、ネットワーク越しにサイバー攻撃が行われます。つまり、バックアップがあるから大丈夫と思っていても同じネットワーク内にあれば同様に犯された使えないバックアップデータとなる可能性が出てきます。 そこで、覚えていただきたいキーワードがあります「エアギャップ」と「イミュータブル」。 サイバーレジリエンシーの基本的な考え方です。 図6. エアギャップ・イミュータブル 前者は、ネットワーク的なつながりのない場所・物・仕組みを指し、後者は、改竄できない場所・物・仕組みをさしています。 つまり、バックアップなどの最後の砦となりうるデータは、こういったエアギャップ対応、あるいはイミュータブル対応のなされたメディア・機器・場所・仕組みなどに置くことで、初めてサイバー攻撃からデータを守るということができるわけです。 もちろん RPO がゼロになるわけではないので失うものも若干ありますが、億単位の身代金を支払うことからは救われます。 RPO をゼロに近くするためには当然、検知能力を上げる他ありません。 サイバーセキュリティで 100%検知できればこのような不幸は起こりませんが、万一気づかずネットワーク内に攻撃が入ってしまった場合も、データ側の仕組みで検知することもできるかもしれません。以下に二つの検知技術を紹介します。 図7. IBM Spectrum Protect の検知機能 こちらは、定常状態と大きなデータの変化のあった状態との差からサイバー攻撃の可能性の有無をチェックする機構です。 データが暗号化されたり破壊されたりすると、直前のバックアップデータとは大きく異なるデータとなるため、当然の事ながら重複排除率は極端に低くなります。さらに、圧縮率やファイルの増加数など、定常時とは異なる変化が現れるでしょう。 そういった変化を検知することで、データに何か大きな変化があったこと、すなわち破壊・改竄の可能性をいち早く検知することができるわけです。 次に、例えば IBM の Spectrum Scale には File Audit Logging という機能があります。 これをサイバーセキュリティの仕組みで検知系に繋げてあげれば、いち早くおかしなデータから本番データを守ることができるわけです。 図8. IBM Spectrum ScaleとQradar によるサイバー攻撃の検知   サーバー攻撃と対策のいたちごっこは、これからも続いていくでしょう。 しかし、アンチウィルス系の対策のようにウィルス自体のシグネーチャーやパターンに頼った対策は、必ず後手となります。そういう意味で、定常状態との変化で検知する方法は非常に有効な手段かと思われます。 ぜひ有効な対策を打って、備えを万全にしていきましょう!   約半年にわたってブログを書かせていただきましたが、少しでも IT を担う皆様にお役に立つことができると幸いです。 ありがとうございました!     この記事に関するお問合せ エヌアイシー・パートナーズ株式会社 企画本部 事業企画部 この記事に関するお問い合せは、「こちら」からお願いします。   参考ページ IBMストレージ製品 全包囲網。。。最新 IBMストレージ 概要 OpenShiftに代表されるコンテナ環境へのIBMストレージの対応 ハイブリッド/マルチクラウド時代だからこそIBMのストレージ AI導入はどこまで現実的? 5大ハードルとその解決策を解説 普及が進む、機械学習による異常検知。導入の課題はここまで解決している (IBMサイト) データ・ファーストのハイブリッドクラウド基盤を実現するIBMストレージ (IBMサイト) ハイブリッドクラウドにおけるデータ連携の鍵を握るもの  

back to top