我が家のメインの仮想化環境は、2台の物理マシン上で稼動する VMware ESXi 4.0 と VMware Server 2.0 だ。単に両方使いたいと言う理由で同居するこの 2製品は、DRBD + Heartbeat で HA クラスタリング構成とした仮想マシン (以下 VM) をそれぞれの上に乗せ、「なるべく止めたくない」 サービスの運用に一役買っている。 先日この HA クラスターの 1つのスタンバイ側 VM を過去のバックアップ・データから丸ごとリストアした際に、Heartbeat でペアを構成するノード間で正常に通信できない状態になった。Heartbeat は CentOS のパッケージで、バージョンは 2.1.3 (heartbeat-2.1.3-3.el5.centos)。HA の VM 2台はそれぞれ次のようなエラーを延々と吐き続け、当然フェイル・オーバーも機能しない。