ITエンジニアが最も出会いたくない出来事。一つはシステム開発プロジェクトにおける遅延。もう一つはシステム障害だ。特に緊急対応を迫られるのがシステム障害だろう。ひとたび障害が発生すれば,夜中であろうが早朝であろうが,原因の特定や復旧作業にあたらなければならない。障害によるシステム停止が長引けば,ビジネスにも大きな影響を与えることになる。 システム障害を回避するために,システムには「サーバーの2重化」「ネットワークの2重化」といった冗長構成をとることが多い。1台の機器が故障しても,もう1台の機器が処理を引き継いで,サービスを継続できるからだ。こうした対策は,1台の機器が故障してもシステムが完全に停止しないように予防しておく対策だと言える。 予防策を施しておけば,システム障害の発生確率は間違いなく低くなる。しかし,問題なのはこの確率を完全にゼロにすることはできないことだ。例えば,ソフトウエアのバ