クラスタ構成とは

システムの高可用性(信頼性)を実現するための仕組み「HAクラスタ構成」について紹介します。

クラスタ構成とは

「クラスタ」の本来の意味としては、「群れを成す」や「房になる」というものがあります。

IT用語における「クラスタ構成」は、複数のサーバを連携させて利用者や他のサーバから、全体で1台のサーバであるかのように動作させる技術です。

また、クラスタ構成環境を構築することを「クラスタリング(クラスタ化)」といいます。

クラスタリングの目的

大きく2つに分類できます。

(1) 拡張性(スケーラビリティ)

接続するサーバ台数を増やして、負荷分散(ロードバランサー)により、システム全体の性能向上を図る。

(2) 高可用性(アベイラビリティ)

サーバに障害が発生して1台が停止しても、システム全体としてはダウンさせずにサービスを提供し続ける。システムの信頼性を高める。

※本記事では、(2)高可用性を実現するためのクラスタリング技術を紹介します。

HAクラスタ構成とは

高可用性を目的としたクラスタ構成は、「HA(High Availability)クラスタ構成」と呼ばれます。「冗長化構成」とも呼ばれます。

最大の目的は、一部で障害が発生してもシステムを止めずに、サービスを提供し続けることにあります。

基本的に、アクティブサーバ(1台)+バックアップサーバ(1台以上)で構成され、アクティブサーバに障害が発生した場合にその障害を即座に探知して、バックアップサーバにメイン処理を移行させて、システム全体のサービスを継続します。

HAクラスタ構成におけるストレージ型

(1)共有ディスク型

アクティブサーバとバックアップサーバは、すべて1つのストレージ(ディスク)にアクセスするスタイルです。アクティブサーバからバックアップサーバに処理が移行しても、同じストレージにアクセスします。

大規模なクラスタ構成に対応できるため、データベースサーバなどに利用されます。

ただし、ストレージ側もHA化しておく必要があります。

(2)データミラー型

アクティブサーバとバックアップサーバ間で、ローカルディスクのミラーリングを行う構成です。アクティブサーバからバックアップサーバに処理が移行した場合、バックアップサーバのローカルディスクは、アクティブサーバのローカルディスクと同一になっているため、そのままサービスを継続できます。

低コストで構築できるため、小規模クラスタ構成に向いており、Web/APサーバなどに利用されています。

HAクラスタ構成 平常時の動き

平常時は、アクティブサーバ(A)(1台)がサービスを提供していて、バックアップサーバ(B)(1台以上)はスタンバイ(待機)状態です。

この時、HAクラスタリングシステムは、特に表立ったアクションは行いません。裏側で、アクティブサーバ(A)正常稼働チェック、ネットワーク正常稼働チェック、アプリケーション正常稼働チェックなど、さまざまな部分に対して監視活動を行っています。

HAクラスタ構成 障害発生時のフェイルオーバー

HAクラスタリングシステムが、アクティブサーバ(A)の障害発生を検知した場合、アクティブサーバ(A)のアプリケーションを停止、仮想IPアドレスを開放させて、アクティブサーバから降格させます。

その後、代理となるバックアップサーバ(B)に仮想IPアドレスを付与して、アプリケーションを起動、バックアップサーバ(B)をアクティブサーバに昇格させます。

※このアクティブサーバを入れ替える処理のことを、「フェイルオーバー」といいます。

仮想IPアドレスとは

仮想IPアドレスとは、他のサーバ、サービス、クライアントなどからのアクセスを受け付ける論理的なIPアドレスのことです。この仮想IPアドレスを複数のサーバ間で付け替えることで、外部からは1台のサーバであるかのように認識させ、フェイルオーバーを実現させます。

HAクラスタ構成 フェイルオーバー後の状態

フェイルオーバーの実行により、バックアップサーバから昇格したアクティブサーバ(B)がサービスを継続させます。

HAクラスタ2台構成の場合、残りのバックアップサーバが存在しない状態です。万が一、稼働中のアクティブサーバ(B)に障害が発生するとシステムダウンとなり、サービスの提供が止まってしまいます。可用性が大幅に下がってしまった状態ですので、早急にHAクラスタ構成を復旧させる必要があります。

HAクラスタ構成 復旧手順

一般的な復旧手順として、まず故障原因の解析に必要となる、対象サーバ(A)のログなどの情報収集後、サーバを停止させてクラスタ構成から切り離します。対象サーバ(A)に復旧措置を行い動作確認後、HA構成に復帰させます。

障害が発生して復旧措置を行ったサーバ(A)をバックアップサーバとして、HA構成に復帰させます。そのまま、バックアップサーバとしておくパターンもあります。バックアップサーバ(A)を手動でアクティブサーバに昇格させるパターンもあります。

※手動で、アクティブサーバとバックアップサーバを入れ替えることを、「フェイルバック」といいます。

まとめ

大規模構成ではもちろんのこと、小規模構成でもシステムの可用性と信頼性を高めるHAクラスタ構成は必要不可欠なものになってきています。HAクラスタ構成の組み方には、さまざまなパターン、さまざまなHAクラスタソリューションがあるので、システム要件に応じて適切なシステム構成を組み上げる必要があります。

クラスタソフトとは

システムの高可用性を実現するための仕組みである「HAクラスタ構成」を制御するソフトウェア、「クラスタソフト(クラスタリングソフト)」について紹介します。

HAクラスタ構成とは

高可用性を目的としたクラスタ構成は、「HA(High Availability)クラスタ構成」と呼ばれます。「冗長化構成」とも呼ばれます。

最大の目的は、一部で障害が発生してもシステムを止めずに、サービスを提供し続けることにあります。

基本的に、アクティブサーバ(1台)+バックアップサーバ(1台以上)で構成され、アクティブサーバに障害が発生した場合に、その障害を即座に探知して、バックアップサーバにメイン処理を移行させて、システム全体のサービスを継続します。

HAクラスタソフトとは

HAクラスタ構成を管理/制御するソフトウェアのことを指します。

「一般的なハードウェア」と「HAクラスタソフト」を組み合わせることにより、特殊で大変高価なハードウェアによるクラスタ構成に迫るほどの高可用な構成を構築することができます。

HAクラスタソフト紹介(商用製品)

商用製品として代表的なNECの「CLUSTERPRO」を紹介します。

NECの「CLUSTERPRO(クラスタープロ)」は、日本を含むアジア・パシフィックで、数多くの導入実績があり、大きなシェアを誇る、HAクラスタリングソフトウェアです。

<特徴1:高度な障害検出機能>

スタンバイ系でも、常に、アクティブ系と同様の監視を行っているため、障害発生時にフェイルオーバーされない可能性を大幅に下げることができます。

<特徴2:堅牢なアーキテクチャデザイン>

CLUSTERPROは、クラスタ管理情報を共有ディスク上に配置せず、全サーバのローカルディスクへ冗長配置する構造となっています。そのため、最低でもどれか1台のサーバが起動できていれば、サービスを継続できる可能性を高めることができます。

<特徴3:動的ハートビート間隔調節機能>

システムやネットワークの高負荷状態によって、ハートビート受送信が間に合わず、誤ったフェイルオーバーを防ぐための機能です。

<特徴4:スプリットブレインの回避と対策>

スプリットブレインとは、ハートビート通信が全て切断され、システムとしては大変深刻な状態のことです。

Windows版、Linux版共に、スプリットブレインを回避するためのさまざまな対策が施されています。

<特徴5:多くの導入実績>

導入実績は相当な数となっており、CLUSTERPROに関する技術ドキュメントは豊富に揃っています。日本のベンダーがリリースしているHAクラスタリングソフトという点も、安心できるポイントです。

HAクラスタソフト紹介(オープンソース製品)

オープンソース製品として代表的な「Pacemaker+Corosync」を紹介します。

<Pacemakerとは>

Pacemakerプロジェクトが開発しているオープンソースソフトウェアです。Corosyncと協調動作して、HAクラスタ上で稼働するアプリケーション(サービス)の監視機能、起動&停止機能を有します。

<Corosyncとは>

高可用性の標準アプリケーションインターフェース仕様(AIS)を定めるOpenAISプロジェクトから派生したオープンソースクラスタ通信フレームワークです。「Heartbeat」の後継製品です。クラスタ構成の中でクラスタ通信層(クラスタ制御部)の管理を担当します。クラスタを構成している全サーバの個々の稼働状態を全サーバで共有します。

<Pacemaker+Corosync>

アプリケーションの稼働を制御する「Pacemaker」と、クラスタ通信を制御する「Corosync」を組み合わせることで、商用製品に匹敵するHAクラスタ構成を実現することができます。

<Pacemakerの特徴>

(1)監視対象(スクリプト)が豊富

監視対象となる、ファイルシステム、データベース、仮想IPアドレスなどリソースを監視/制御するスクリプトが豊富に揃えられています。

(2)リソース制御機能(フェイルカウント)

Pacemakerはリソース監視を行いながら、異常検知したタイミングでフェイルカウントをアップしていきます。事前に設定されているフェイルカウントの閾値を超えた場合にフェイルオーバーする仕組みとなっています。

(3)スプリットブレイン対策(フェンシング対応)

電源管理ツールと連携させることにより、スプリットブレイン発生時に強制電源OFFをすることができます。

(4)Throttle機能

CPUなどのリソース状態などを監視して、負荷状況に応じてジョブ実行数などに制限をかけることができます。

<Corosyncの特長>

(1)安定性

OpenAISプロジェクトから派生した代表的なクラスタ制御ソフトウェアであるため、実績面からしても安定性があります。

(2)可用性

障害検知速度が高く、スプリットブレイン回復時の動作も安定しているため、高い可用性があります。

(3)多ノード対応

ノード追加/削除時の処理が安定しており、起動時間も短く、多ノード構成にも対応できます。

まとめ

今回ご紹介した2本のクラスタソフト以外にも、多くのHAクラスタリングソフトが存在します。システム規模、システム要件、予算などの条件に合致する、ベストなクラスタリングソフトを選定することが求められます。

LifeKeeperとは

ミッションクリティカルシステムの高可用化を実現するHAクラスタソフトウェア「LifeKeeper」(ライフキーパー)について紹介します。

HAクラスタ構成とは

高可用性を目的としたクラスタ構成は、「HA(High Availability)クラスタ構成」と呼ばれます。「冗長化構成」とも呼ばれます。

最大の目的は、一部で障害が発生してもシステムを止めずに、サービスを提供し続けることにあります。

HAクラスタソフトとは

HAクラスタ構成を管理/制御するソフトウェアのことを指します。

「一般的なハードウェア」と「HAクラスタソフト」を組み合わせることにより、特殊で大変高価なハードウェアによるクラスタ構成に迫るほどの高可用な構成を構築できます。

LifeKeeperとは

LifeKeeperとは、サイオステクノロジー社が開発を行うHAクラスタソフトウェアです。ミッションクリティカルなシステムの高可用性を実現します。

システム障害を監視しアクティブサーバに障害が発生した場合に、スタンバイサーバに自動的に処理の切り替え(フェイルオーバー)を行うことでシステムダウンを回避します。万が一、システムダウンに陥った場合でも、システムダウンタイム時間を短縮し、ビジネス損失を最小限にできます。

ほとんどの操作をGUIベースで行えるため、操作性に優れ、ユーザフレンドリーな設計になっています。

LifeKeeperの導入メリット

LifeKeeperの導入により、システム可用性を大幅に向上させ、万が一のシステム障害に備えることができます。

  • 遠隔デュプリケーションによって、事故や自然災害が発生した場合でも業務を継続できます。
  • システムダウンタイムを極力短縮できます。
  • 定期バックアップのみではなく、サーバ障害発生直前までのデータを保護できます。

ARK(Application Recovery Kit)

ARKとは、リソース間の依存関係を自動設定する機能です。

対象アプリケーションがARKに対応している場合は、ARKとGUIツールの連動により、設定ウィザードに対して必要項目の入力を行うだけで、クラスタリソースの作成が可能です。すべての設定/変更をGUIで行えます。

ARKは自動的に構成条件チェックを行い、動作が不完全となるようなクラスタ設定はできない仕組みになっています。

設定変更時はアプリケーション(サービス)を稼働させたまま、動的な設定変更が可能です。

ARK+GUIツールの機能により、導入工数の大幅な削減が可能となっています。

Generic ARK

ARKが対応していないアプリケーションに対しても対応する仕組みとして、「Generic ARK」という機能が用意されています。アプリケーションを制御するための専用スクリプトを作成し、LifeKeeperに組み込みます。開発用ツールとして「Extender」という製品が用意されています。

また、ユーザ独自の仕様に基づいて、クラスタ処理をカスタマイズしたい場合にも非常に有効となります。

「Generic ARK」により、あらゆるアプリケーションのクラスタ化を行うことができます。

LifeKeeperの構成例

(1) 共有ディスク構成

外部ストレージを共有ディスクとする、一般的なHAクラスタシステム構成です。

高価な外部ストレージを使わずに、安価にHAクラスタシステムを構築できます。

(2) データレプリケーション構成

各サーバのローカルディスクをレプリケーションすることで、ミラーボリュームを作成します。距離的な制約がなくなるため、遠隔地へのフェイルオーバーも可能です。

こちらも、安価にクラスタシステムの構築が可能です。

LifeKeeperの適用シーン

(1) 物理環境

スタンバイ方式、相互スタンバイ方式、N対1(NxM)スタンバイ方式などの構成により、既存のシステム構成を発展させた高可用性の構築に対応できます。

(2) クラウド環境

クラウド環境に物理環境のバックアップを構築する場合や、リージョンをまたいだクラスタリングなども可能です。

(3) 仮想環境

物理環境をベースとした、段階的な仮想環境移行のプロセスに対しても、柔軟に対応可能です。

まとめ

以上のように、LifeKeeperは、さまざまなアプリケーション、ハードウェア、HAクラスタ構成方法をサポートします。物理環境、クラウド環境、仮想環境にも対応できます。そして、コスト削減にも寄与する高機能HAクラスタソフトウェアです。

CLUSTERPROとは

システム障害を監視し高可用性を実現する、日本No.1の商用HAクラスタリングソフトウェア、NEC「CLUSTERPRO(クラスタープロ)」を紹介します。

HAクラスタ構成とは

高可用性を目的としたクラスタ構成は、「HA(High Availability)クラスタ構成」と呼ばれます。「冗長化構成」とも呼ばれます。

最大の目的は、一部で障害が発生してもシステムを止めずに、サービスを提供し続けることにあります。

基本的に、アクティブサーバ(1台)+スタンバイサーバ(1台以上)で構成され、アクティブサーバに障害が発生した場合に、その障害を即座に探知して、スタンバイサーバにメイン処理を移行させて、システム全体のサービスを継続します。

HAクラスタソフト(クラスタリングソフト)とは

HAクラスタ構成を管理/制御するソフトウェアのことを指します。

「一般的なハードウェア」と「HAクラスタソフト」を組み合わせることにより、特殊で大変高価なハードウェアによるクラスタ構成に迫るほどの高可用な構成を構築することができます。

製品構成

CLUSTERPROの各製品は、3つのカテゴリで構成されています。

(1) HAクラスタリングソフト

ハードウェア/ソフトウェア監視機能により、高可用性クラスタシステムを実現します。

  • CLUSTERPRO D
  • CLUSTERPRO X

(2) OS標準クラスタ機能補強製品

OS標準クラスタ機能を補強/補完し、可用性向上と運用効率化を実現します。

  • CLUSTERPRO X OperationHelper for WFSC
  • CLUSTERPRO X OperationHelper for MSCS
  • CLUSTERPRO MCシリーズ [Linux/Windows]
  • CLUSTERPRO X HAシリーズ [HP-UX/Solaris]

(3) 単体サーバ向け高可用製品

単体サーバでの可用性向上を実現します。

  • CLUSTERPRO X SingleServerSafe

特徴

(1) 長年の歴史に裏付けられた高品質性

CLUSTERPROは、1996年にリリースを開始し、サーバ技術動向、市場ニーズを捉えて、長年に渡る技術やノウハウの蓄積を活かして新製品を市場に投入し続けています。

製品をリリースする前には、ハードウェア部門との共同で高負荷テスト/擬似障害発生テストを繰り返し行うことにより高品質を維持しています。

(2) 6年連続シェアNo.1(2016年時点)

CLUSTERPROは、日本はもとより日本を含むアジア/パシフィック地域で6年連続シェアNo.1を達成しており、圧倒的な実績を誇ります。

(3) 事業継続・災害対策

自然災害や人為的災害などの各種災害に対応し、事業継続に取り組み、社会的責任を果たしていかなければなりません。

CLUSTERPROのネットワークミラーリング機能により、資産である業務データを遠隔地へバックアップできます。さらに、業務アプリケーションの実行場所を災害地のサーバから遠隔地のサーバに切り替えることにより、サービスの継続も行えます。

(4) 仮想化環境の耐障害性強化

サーバを集約する仮想化環境が普及し広まってきていますが、集約の結果、一斉にシステムダウンするというリスクも増してきています。

CLUSTERPROは、耐障害性を向上させる多様な仕組みを提供します。仮想化環境に対してもクラスタリングすることによって耐障害性を強化します。

(5) バックアップソフトと組み合わせて可用性強化

CLUSTERPROとバックアップソフトを組み合わせると、システムの可用性をさらに向上させることができます。データ保護の観点において、堅牢なシステムを実現できます。

バックアップデータからシステム復旧が可能になることにより、冗長構成への復旧時間を大幅に短縮することができ、可用性を高めることができます。

(6) データベースの耐障害性強化

データベースサーバのダウンは、システム全体の停止に直結します。アプリケーション自体は正常に稼働していても、データベースの一部サービスがダウンすることもありえます。

CLUSTERPROは、ハードウェア障害監視、アプリケーション障害監視だけではなく、データベースの死活監視を定期的に行い、データベースの耐障害性を強化します。

(7) サーバの耐障害性強化

障害は、ハードウェア、OS(Windows/Linux/Solaris)、アプリケーション、サービス、ネットワーク機器など、さまざまな箇所で発生します。

CLUSTERPROは、対象となるすべての領域を広範囲に監視し、システム全体の可用性を向上させるさまざまな機能を提供します。

まとめ

CLUSTERPROは、サーバハードウェアの販売も行っているNECが開発しているため、ハードウェアの深い部分の検証まで行われています。長年の実績による高品質性と、日本企業であるという安心感もあります。

CLUSTERPROは、商用HAクラスタリングソフトの代表格であり、導入検討対象として外せない製品となっています。

ディザスタリカバリ 事例

分散ストレージシステム「DRBD」および「DRBD Proxy」を使用したディザスタリカバリシステム構築事例について2件紹介します。

「DRBD」と「DRBD Proxy」

紹介するディザスタリカバリシステム実現のために採用されたのが、「DRBD」と「DRBD Proxy」です。

「DRBD」は、オープンソース分散ストレージ製品です。

「DRBD Proxy」は、「DRBD」への商用アドオンで、「DRBD」専用WANアクセラレータとして機能します。

「DRBD Proxy」の特徴

  • 広域ネットワークを挟んで、大量データの同期が可能
  • 最大1ペタバイトのリアルタイムレプリケーション
  • パケット圧縮技術による効率的な転送速度
  • 異常発生(回線障害など)に対するリカバリの自動化
  • 広域ネットワーク(WAN)を挟んで、大量データの同期が可能

事例(1) 株式会社アイル

ポイント

  • 東京-大阪間で16テラバイトクラスのディザスタリカバリシステムを構築
  • 専用製品を上回るほどの機能を1/3の低コストで実現

導入のきっかけ

アイルでは、東京と大阪にそれぞれデータサーバがあり、災害に備えてのリモートバックアップは、同社にとっての課題でした。

2011年の東日本大震災が契機となり、ディザスタリカバリシステム導入プロジェクトがスタートしました。

導入の決め手

(1) 大容量ディスクの効率的運用

他の多くの製品は、1テラバイト程度に分割しなければならない制限があるため、キャッシュ用ディスク領域を要求されることが多々ありました。

しかし、「DRBD Proxy」は、最大1ペタバイトまで扱え、大きなキャッシュ用ディスク領域は不要となります。

(2) 圧倒的な低コスト

他製品の場合、機器のみで1,000万円を超える見積もありました。今回のシステムの導入コストは400万円以下で実現することができました。

導入効果

毎週末に、システムイメージのフルバックアップ(約100ギガバイト)をそれぞれのリモートバックアップシステムにコピーしています。「DRBD Proxy」のパケット圧縮技術のおかげで、ネットワークトラフィックは約半分の50ギガバイトに抑えられています。所要時間も4時間ほどで完了し、通常業務に支障をもたらさずにバックアップ運用を実現できています。

今後の展望

アイルの担当者の方は、「お客様にもこのシステムを紹介していきたい」とおっしゃっています。

事例(2) 岐阜女子大学

「DRBD Proxy」導入前の状態

旧バージョンの「DRBD」を使用したクラスタ構成で、学内LANでのバックアップが行われていました。しかし、同一敷地内にあるため遠隔地へのバックアップ要望がありました。

旧バージョンの「DRBD」ではWAN対応が完全ではなく、遠隔地へのリモートバックアップを行う場合、処理時間が極端に長くなってしまうという高いハードルがありました。

最新版「DRDB」と「DRBD Proxy」を導入

「DRDB」は、当初、WANへの対応が不十分な面がありましたが、バージョンアップした最新版では、十分に対応できるように改善されています。さらに、WANアクセラレータ「DRBD Proxy」を加えることにより、リモートバックアップが実現できました。

導入効果

「以前の学内LANでのクラスタ構成時」と「DRBD Proxyでの新システム」を比べた場合の導入効果として、

  • 接続開始の待ち時間が約10秒かかっていたところを1秒以下に大幅短縮
  • 50メガバイト程度のファイルコピー所要時間が1秒以下に短縮

など、以前のローカルバックアップよりも、新版のリモートバックアップのほうが高速化できています。

今後の方向性

岐阜女子大学の担当者の方は、「Windows系のシステムについても、今回のシステムを適用したい」とおっしゃっています。

まとめ

今回紹介した事例は、ごくごく一部ですが、「DRDB」+「DRBD Proxy」を使用したリモートバックアップシステムは、安価で高機能なディザスタリカバリシステムを実現できます。