やっぱり悩ましいスプリット・ブレイン問題 Heartbeatに限った話ではありませんが、HAクラスタの運用に際して常に頭を悩ませる問題が、スプリット・ブレイン(第3回記事で紹介)です。 ここで再度簡単に説明しますと、スプリット・ブレインとは、ハートビート通信を行うネットワークに断線などの問題が発生した場合、ホストに障害が起こったと勘違いし、本来立ち上がってほしくないスタンバイ側のホストがアクティブになってしまうというものです。 特に、Heartbeatの場合厄介なことが1つあります。仮に、ネットワーク断線によってスプリット・ブレインが発生した場合、その状態でケーブルだけを交換しても、正常な状態に自動復旧してくれません。 そういった場合には、 問題となっているホストのうちどちらかを停止させる /var/lib/heartbeat/crm/から、「cibm.xml」「cib.xml.last」