ページの先頭行へ戻る
PRIMECLUSTER  導入運用手引書 4.7

M.2.3 クラスタの構築

Nutanix AHV環境でのPRIMECLUSTERのクラスタ構築手順は以下のようになります。

M.2.3.1 CF、CIPの設定

5.1.1 CF、CIPの設定”を参照し、ゲストOSでCF、CIPの設定を行ってください。

注意

  • クラスタインタコネクト用のサブネットで、IP Address Managementを有効にした場合は、CF over IPを使用する必要があります。また、RMSなどではクラスタ内のノード間通信のためにCIPを使用するため、CIPを設定する必要があります。CF over IP (IPインタコネクト)とCIPは異なる機能です。詳細は、“PRIMECLUSTER Cluster Foundation 導入運用手引書”の“1.1.1 CIPとCF over IP”を参照してください。

M.2.3.2 シャットダウン機構の設定

Nutanix AHV環境では、シャットダウンエージェントにSA_icmpを使用します。
生存優先度については、“5.1.2.1 生存優先度 ”を参照してください。

注意

下記の操作はすべてのゲストOSで実行してください。

  1. シャットダウンエージェントの設定

    シャットダウンエージェントを設定してください。
    クラスタを構成するすべてのゲストOS(ノード)で/etc/opt/SMAW/SMAWsf/SA_icmp.cfgを以下のような内容で作成します。

    TIME_OUT=value
    CFName:ip-address-of-node:NIC-name1,NIC-name2
    value              : ノードの生存を確認する時間(秒)を指定します。推奨値は5(秒)です。
    CFName             : CFノード名を指定します。
    ip-address-of-node : CFNameのノードの生存確認に使用する以下のいずれかのネットワークの
                         IPアドレスを指定します。
                         - クラスタインタコネクト (CIPのIPアドレス)
                         - 管理LAN
                         - 業務LAN
                         複数のネットワークを使用して生存確認することも可能です。その場合は、
                         使用するネットワークごとに行を追加します。
                         指定可能なアドレス形式は、IPv4アドレスおよびIPv6アドレスです。
                         IPv6のリンクローカルアドレスは使用できません。IPv6アドレスを指定する場合は、
                         各括弧[ ]で囲んでください。
                         (例 [1080:2090:30a0:40b0:50c0:60d0:70e0:80f0])
                         クラスタシステムを構成する全ゲストOS(ノード)について記載してください。
    
                         確認に使用するネットワークの構成によって、以下のように動作が異なりますので、
                         内容を精査の上、選択してください。
                         ・クラスタインタコネクトのみを設定する場合
                           クラスタインタコネクトで通信できない場合、運用ノードが稼働していたとしても、
                           即時に業務を自動切替えします。
                           なお、この設定では、I/Oフェンシング機能により共用ディスクへのI/Oは抑止しますが、
                           ネットワークのIPアドレスが一時的に重複する可能性があります。
                           旧運用系が停止するまで(約25秒)はIPアドレスの重複により、クライアントからの
                           アクセスが旧運用系に接続される可能性があります。
                         ・クラスタインタコネクト以外の経路1つのみ、もしくは複数の経路を設定する場合
                           設定された全ての経路で通信し生存確認を行います。
                           いずれの経路でもノードの稼働が確認できなかった場合、即時に業務を自動切替えします。
                           いずれかの経路でノードの稼働が確認できた場合(一時的な高負荷や通信路の間欠故障
                           など)、業務の自動切替えを抑止します(LEFTCLUSTER状態)。
                           この場合、オペレータが異常による業務への影響を確認後、LEFTCLUSTER状態を解消し、
                           必要に応じて業務の切替えを行います。
                           なお、LEFTCLUSTER状態の場合、以下の機能が動作せず、業務に影響を与える場合が
                           あります。速やかにLEFTCLUSTER状態を解消してください。
                         
                             (1) 一部のコマンド
                                 以下のコマンドが正常に実行できません。
                                  -クラスタノード間でコマンド実行(clexec)
                                  -クラスタノード間でファイル配布(clsyncfile)
                                  -オブジェクト(*1)の構成および状態情報の表示(sdxinfo)
                                   (*1) クラス、グループ、ディスク、ボリューム(スライス)が対象です。
                                   
                             (2) 共用ディスクに対する操作
                                 共用ディスクに対する操作を伴う以下が正常に実行できません。
                                  -Symfowareによるアーカイブログ監視/切替、DBスペース/監査ログの作成、
                                   リカバリコマンド、ダンプコマンド、ユーティリティコマンドの実行
                                  -等価性回復コピー(I/Oエラー発生後の自動復旧時に実行されます)
                                  -クラスタアプリケーションに含まれるGDSリソースのOnline/Offline操作
                                  -GUIによるGDS構成の表示、操作
                                  -GDSのコマンド実行
                                   ・クラス操作(sdxclass -R)
                                   ・ディスク操作(sdxdisk -M(*2), -R(*2), -C, -D)
                                   ・グループ操作(sdxgroup -C, -D, -R)
                                   ・ボリューム操作(sdxvolume -M, -R, -N, -F, -S)
                                   ・スライス操作(sdxslice -M, -R, -N, -F, -T)
                                   ・ディスク交換(sdxswap -O(*2), -I(*2))
                                   ・等価性回復コピー(sdxcopy -B, -C, -I, -P)
                                   ・故障したオブジェクトの復旧(sdxfix -C(*2), -D, -V)
                                   ・オブジェクトの属性値変更(sdxattr -C(*2), -G, -D, -V, -S)
                                   ・オブジェクト構成の操作(sdxconfig Remove(*2), Restore(*2), Backup)
                                   (*2) 共用ディスクを登録しているローカルクラスが対象です。
                                  -共用ディスクに対するI/Oエラー
    NIC-nameX          :ip-address-of-node に対して、ノードの生存確認に使用する自ゲストOS(ノード)の
                         ネットワークインタフェースを指定します。複数存在する場合は、「,」で区切ります。

    注意

    記載するネットワークインタフェースについて

    • GLSで二重化している場合、二重化方式に従い、下記のネットワークインタフェースを記載してください。

      • 高速切替方式、NIC切替方式、GS連携方式の場合、冗長化しているネットワークインタフェースをすべて記載してください。(例 ens3,ens4)

      • 仮想NIC方式の場合、仮想インタフェースを記載してください。(例 sha0)

    • NICをbondingしている場合は、bondingしているデバイスをIPアドレスの後に記載してください。(例 bond0)

    • クラスタインタコネクトを記載する場合は、クラスタインタコネクトの全パスで使用するネットワークインタフェースをすべて記載してください。(例 ens5,ens6)

    • 引継ぎIPアドレス(引継ぎ仮想インタフェース)は使用しないでください。

    複数のAHVホスト上のゲストOS間クラスタ(2ノード構成)の設定例を以下に示します。

    • クラスタインタコネクト(ens5,ens6)を設定した場合

      TIME_OUT=5
      node1:192.168.1.1:ens5,ens6
      node2:192.168.1.2:ens5,ens6
    • 業務LAN(GLSで2重化(ens3,ens4))と管理LAN(ens7)を設定した場合

      TIME_OUT=5
      node1:10.20.30.100:ens3,ens4
      node1:10.20.40.200:ens7
      node2:10.20.30.101:ens3,ens4
      node2:10.20.40.201:ens7
  2. シャットダウンデーモンの設定

    クラスタを構成するすべてのゲストOS(ノード)で/etc/opt/SMAW/SMAWsf/rcsd.cfgを以下のような内容で作成します。

    CFNameX,weight=weight,admIP=myadmIP:agent=SA_icmp,timeout=timeout
    CFNameX,weight=weight,admIP=myadmIP:agent=SA_icmp,timeout=timeout
    CFNameX       :クラスタホストのCFノード名を指定します。
    weight        :SFのノードの重みを指定します。
                    1:1運用待機運用する場合は無効のため、1を設定してください。
    myadmIPCFNameXの管理LANのIPアドレスを指定します。
                    指定可能なアドレス形式は、IPv4アドレスおよびIPv6アドレスです。
                    IPv6のリンクローカルアドレスは使用できません。
                    IPv6アドレスを指定する場合は、角括弧[ ]で囲んでください。
                     (例 [1080:2090:30a0:40b0:50c0:60d0:70e0:80f0])
                    ホスト名を指定する場合は、/etc/hostsに記載されていることを確認してください。
    timeout       :シャットダウンエージェントのタイムアウト時間(秒)を指定します。
                     以下の値を設定します。
                    (TIME_OUT + 2)×確認に使用する経路の数、または、20
                                               (値の大きな方を指定)
                    TIME_OUT はSA_icmp.cfgに記載したTIME_OUTの値を指します。
    
                         - 1経路(管理LAN 、業務LAN、クラスタインタコネクトから1つ)で生存確認する場合
                           (1) TIME_OUTが18以上の場合
                               TIME_OUT + 2
                           (2) TIME_OUTが18未満の場合
                               20
    
                         - 2経路(管理LAN、業務LAN、クラスタインタコネクトから2つ)で生存確認する場合
                           (1) TIME_OUTが8以上の場合
                               (TIME_OUT + 2)×2
                           (2) TIME_OUTが8未満の場合
                               20
    
                         - 3経路(管理LAN、業務LAN、クラスタインタコネクトから3つ)で生存確認する場合
                           (1) TIME_OUTが5以上の場合
                               (TIME_OUT + 2)×3
                           (2) TIME_OUTが5未満の場合
                               20 

    注意

    rcsd.cfgファイルの内容はすべてのゲストOS(ノード)で同一にしてください。同一でない場合誤動作します。

    2ノード構成(相互待機)、SA_icmp.cfgに記載したTIME_OUTの値が10、管理LANと業務LANで生存確認する場合の設定例を以下に記載します。

    node1,weight=10,admIP=192.168.100.1:agent=SA_icmp,timeout=24 (※)
    node2,weight=1,admIP=192.168.100.2:agent=SA_icmp,timeout=24 (※)
    ※ timeout = (10(TIME_OUT値) + 2) × 2(管理LAN,業務LAN) = 24
  3. シャットダウン機構の起動

    シャットダウン機構が起動済みか確認してください。

    # sdtool -s

    シャットダウン機構が起動済みの場合、以下を実行してシャットダウン機構を再起動してください。

    # sdtool -r

    シャットダウン機構が起動していない場合、以下を実行してシャットダウン機構を起動してください。

    # sdtool -b
  4. シャットダウン機構の状態確認

    シャットダウン機構の状態がInitWorked またはTestWorkedとなっているか確認してください。TestFailed またはInitFailed が表示された場合は、シャットダウンデーモンの設定に誤りがないか確認してください。

    # sdtool -s

M.2.3.3 クラスタリソース機構の初期設定

5.1.3 クラスタリソース管理機構の初期設定”を参照し、ゲストOSでクラスタリソース管理機構(以降、CRM)が管理するリソースデータベースを設定してください。

M.2.3.4 故障リソース特定とオペレータ介入要求の設定

5.2 故障リソース特定とオペレータ介入要求の設定”を参照し、故障リソース特定とオペレータ介入要求の設定を行ってください。