前回の
リソースが故障した場合どうなるの?
Pacemakerで想定されるリソースの故障は,
表1 リソース故障時のon-fail動作一覧
on-fail設定値 | Pacemakerの動作 |
---|---|
block | 故障したリソースの管理を停止し, |
fence | リソース故障が発生したサーバをSTONITHによって再起動し, |
ignore | 何も処理を行いません。 |
stop | 故障したリソースを停止し, |
restart | 故障したリソースを他のサーバへフェイルオーバさせます。 |
ここでは,
故障を発生させてみよう
では,実際にリソース故障を発生させて,Pacemakerの動きを見てみましょう。今回はリソース故障を擬似的に起こすため,Pacemaker稼働中にhttpdを停止します。# /etc/init.d/httpd stop
httpd停止後crm_
Online: [ pm01 pm02 ] Resource Group: web vip (ocf::heartbeat:IPaddr2): Started pm02 httpd (ocf::heartbeat:apache): Started pm02 省略 Migration summary: Node pm01: httpd: migration-threshold=1 fail-count=1 * Node pm02: Failed actions: httpd_monitor_10000 (node=pm01, call=76, rc=7, status=complete): not running
このとき,
Mar 30 13:08:51 pm01 ERROR: Resource httpd does not work. (rc=7)
復旧してみよう
復旧では,
# crm resource cleanup httpd pm01 Cleaning up httpd on pm01 Waiting for 2 replies from the CRMd..
コマンド実行後のモニタ表示では,
Online: [ pm01 pm02 ] Resource Group: web vip (ocf::heartbeat:IPaddr2): Started pm02 httpd (ocf::heartbeat:apache): Started pm02 省略 Node Attributes: * Node pm01: + default_ping_set : 100 + pm02-eth1 : up + pm02-eth2 : up * Node pm02: + default_ping_set : 100 + pm01-eth1 : up + pm01-eth2 : up 省略 Migration summary: * Node pm01: * Node pm02:
リソースを稼動していたサーバに戻したい場合は,
# crm resource move web pm01 force
コマンド実行後のモニタ表示では,
Online: [ pm01 pm02 ] Resource Group: web vip (ocf::heartbeat:IPaddr2): Started pm01 httpd (ocf::heartbeat:apache): Started pm01
pm01でリソースが稼動していることを確認した上で,# crm resource unmove web