Nutanix AHV環境でのPRIMECLUSTERのクラスタ構築手順は以下のようになります。

“5.1.1 CF、CIPの設定”を参照し、ゲストOSでCF、CIPの設定を行ってください。
注意
クラスタインタコネクト用のサブネットで、IP Address Managementを有効にした場合は、CF over IPを使用する必要があります。また、RMSなどではクラスタ内のノード間通信のためにCIPを使用するため、CIPを設定する必要があります。CF over IP (IPインタコネクト)とCIPは異なる機能です。詳細は、“PRIMECLUSTER Cluster Foundation 導入運用手引書”の“1.1.1 CIPとCF over IP”を参照してください。
Nutanix AHV環境では、シャットダウンエージェントにSA_icmpを使用します。
生存優先度については、“5.1.2.1 生存優先度 ”を参照してください。
注意
下記の操作はすべてのゲストOSで実行してください。
シャットダウンエージェントの設定
シャットダウンエージェントを設定してください。
クラスタを構成するすべてのゲストOS(ノード)で/etc/opt/SMAW/SMAWsf/SA_icmp.cfgを以下のような内容で作成します。
TIME_OUT=value
CFName:ip-address-of-node:NIC-name1,NIC-name2
value : ノードの生存を確認する時間(秒)を指定します。推奨値は5(秒)です。 CFName : CFノード名を指定します。 ip-address-of-node : CFNameのノードの生存確認に使用する以下のいずれかのネットワークの IPアドレスを指定します。 - クラスタインタコネクト (CIPのIPアドレス) - 管理LAN - 業務LAN 複数のネットワークを使用して生存確認することも可能です。その場合は、 使用するネットワークごとに行を追加します。 指定可能なアドレス形式は、IPv4アドレスおよびIPv6アドレスです。 IPv6のリンクローカルアドレスは使用できません。IPv6アドレスを指定する場合は、 各括弧[ ]で囲んでください。 (例 [1080:2090:30a0:40b0:50c0:60d0:70e0:80f0]) クラスタシステムを構成する全ゲストOS(ノード)について記載してください。 確認に使用するネットワークの構成によって、以下のように動作が異なりますので、 内容を精査の上、選択してください。 ・クラスタインタコネクトのみを設定する場合 クラスタインタコネクトで通信できない場合、運用ノードが稼働していたとしても、 即時に業務を自動切替えします。 なお、この設定では、I/Oフェンシング機能により共用ディスクへのI/Oは抑止しますが、 ネットワークのIPアドレスが一時的に重複する可能性があります。 旧運用系が停止するまで(約25秒)はIPアドレスの重複により、クライアントからの アクセスが旧運用系に接続される可能性があります。 ・クラスタインタコネクト以外の経路1つのみ、もしくは複数の経路を設定する場合 設定された全ての経路で通信し生存確認を行います。 いずれの経路でもノードの稼働が確認できなかった場合、即時に業務を自動切替えします。 いずれかの経路でノードの稼働が確認できた場合(一時的な高負荷や通信路の間欠故障 など)、業務の自動切替えを抑止します(LEFTCLUSTER状態)。 この場合、オペレータが異常による業務への影響を確認後、LEFTCLUSTER状態を解消し、 必要に応じて業務の切替えを行います。 なお、LEFTCLUSTER状態の場合、以下の機能が動作せず、業務に影響を与える場合が あります。速やかにLEFTCLUSTER状態を解消してください。 (1) 一部のコマンド 以下のコマンドが正常に実行できません。 -クラスタノード間でコマンド実行(clexec) -クラスタノード間でファイル配布(clsyncfile) -オブジェクト(*1)の構成および状態情報の表示(sdxinfo) (*1) クラス、グループ、ディスク、ボリューム(スライス)が対象です。 (2) 共用ディスクに対する操作 共用ディスクに対する操作を伴う以下が正常に実行できません。 -Symfowareによるアーカイブログ監視/切替、DBスペース/監査ログの作成、 リカバリコマンド、ダンプコマンド、ユーティリティコマンドの実行 -等価性回復コピー(I/Oエラー発生後の自動復旧時に実行されます) -クラスタアプリケーションに含まれるGDSリソースのOnline/Offline操作 -GUIによるGDS構成の表示、操作 -GDSのコマンド実行 ・クラス操作(sdxclass -R) ・ディスク操作(sdxdisk -M(*2), -R(*2), -C, -D) ・グループ操作(sdxgroup -C, -D, -R) ・ボリューム操作(sdxvolume -M, -R, -N, -F, -S) ・スライス操作(sdxslice -M, -R, -N, -F, -T) ・ディスク交換(sdxswap -O(*2), -I(*2)) ・等価性回復コピー(sdxcopy -B, -C, -I, -P) ・故障したオブジェクトの復旧(sdxfix -C(*2), -D, -V) ・オブジェクトの属性値変更(sdxattr -C(*2), -G, -D, -V, -S) ・オブジェクト構成の操作(sdxconfig Remove(*2), Restore(*2), Backup) (*2) 共用ディスクを登録しているローカルクラスが対象です。 -共用ディスクに対するI/Oエラー NIC-nameX :ip-address-of-node に対して、ノードの生存確認に使用する自ゲストOS(ノード)の ネットワークインタフェースを指定します。複数存在する場合は、「,」で区切ります。
注意
記載するネットワークインタフェースについて
GLSで二重化している場合、二重化方式に従い、下記のネットワークインタフェースを記載してください。
高速切替方式、NIC切替方式、GS連携方式の場合、冗長化しているネットワークインタフェースをすべて記載してください。(例 ens3,ens4)
仮想NIC方式の場合、仮想インタフェースを記載してください。(例 sha0)
NICをbondingしている場合は、bondingしているデバイスをIPアドレスの後に記載してください。(例 bond0)
クラスタインタコネクトを記載する場合は、クラスタインタコネクトの全パスで使用するネットワークインタフェースをすべて記載してください。(例 ens5,ens6)
引継ぎIPアドレス(引継ぎ仮想インタフェース)は使用しないでください。
例
複数のAHVホスト上のゲストOS間クラスタ(2ノード構成)の設定例を以下に示します。
クラスタインタコネクト(ens5,ens6)を設定した場合
TIME_OUT=5 node1:192.168.1.1:ens5,ens6 node2:192.168.1.2:ens5,ens6
業務LAN(GLSで2重化(ens3,ens4))と管理LAN(ens7)を設定した場合
TIME_OUT=5 node1:10.20.30.100:ens3,ens4 node1:10.20.40.200:ens7 node2:10.20.30.101:ens3,ens4 node2:10.20.40.201:ens7
シャットダウンデーモンの設定
クラスタを構成するすべてのゲストOS(ノード)で/etc/opt/SMAW/SMAWsf/rcsd.cfgを以下のような内容で作成します。
CFNameX,weight=weight,admIP=myadmIP:agent=SA_icmp,timeout=timeout
CFNameX,weight=weight,admIP=myadmIP:agent=SA_icmp,timeout=timeout
CFNameX :クラスタホストのCFノード名を指定します。 weight :SFのノードの重みを指定します。 1:1運用待機運用する場合は無効のため、1を設定してください。 myadmIP :CFNameXの管理LANのIPアドレスを指定します。 指定可能なアドレス形式は、IPv4アドレスおよびIPv6アドレスです。 IPv6のリンクローカルアドレスは使用できません。 IPv6アドレスを指定する場合は、角括弧[ ]で囲んでください。 (例 [1080:2090:30a0:40b0:50c0:60d0:70e0:80f0]) ホスト名を指定する場合は、/etc/hostsに記載されていることを確認してください。 timeout :シャットダウンエージェントのタイムアウト時間(秒)を指定します。 以下の値を設定します。 (TIME_OUT + 2)×確認に使用する経路の数、または、20 (値の大きな方を指定) TIME_OUT はSA_icmp.cfgに記載したTIME_OUTの値を指します。 - 1経路(管理LAN 、業務LAN、クラスタインタコネクトから1つ)で生存確認する場合 (1) TIME_OUTが18以上の場合 TIME_OUT + 2 (2) TIME_OUTが18未満の場合 20 - 2経路(管理LAN、業務LAN、クラスタインタコネクトから2つ)で生存確認する場合 (1) TIME_OUTが8以上の場合 (TIME_OUT + 2)×2 (2) TIME_OUTが8未満の場合 20 - 3経路(管理LAN、業務LAN、クラスタインタコネクトから3つ)で生存確認する場合 (1) TIME_OUTが5以上の場合 (TIME_OUT + 2)×3 (2) TIME_OUTが5未満の場合 20
注意
rcsd.cfgファイルの内容はすべてのゲストOS(ノード)で同一にしてください。同一でない場合誤動作します。
例
2ノード構成(相互待機)、SA_icmp.cfgに記載したTIME_OUTの値が10、管理LANと業務LANで生存確認する場合の設定例を以下に記載します。
node1,weight=10,admIP=192.168.100.1:agent=SA_icmp,timeout=24 (※) node2,weight=1,admIP=192.168.100.2:agent=SA_icmp,timeout=24 (※)
※ timeout = (10(TIME_OUT値) + 2) × 2(管理LAN,業務LAN) = 24
シャットダウン機構の起動
シャットダウン機構が起動済みか確認してください。
# sdtool -s
シャットダウン機構が起動済みの場合、以下を実行してシャットダウン機構を再起動してください。
# sdtool -r
シャットダウン機構が起動していない場合、以下を実行してシャットダウン機構を起動してください。
# sdtool -b
シャットダウン機構の状態確認
シャットダウン機構の状態がInitWorked またはTestWorkedとなっているか確認してください。TestFailed またはInitFailed が表示された場合は、シャットダウンデーモンの設定に誤りがないか確認してください。
# sdtool -s
“5.1.3 クラスタリソース管理機構の初期設定”を参照し、ゲストOSでクラスタリソース管理機構(以降、CRM)が管理するリソースデータベースを設定してください。
“5.2 故障リソース特定とオペレータ介入要求の設定”を参照し、故障リソース特定とオペレータ介入要求の設定を行ってください。