米Facebook(フェイスブック)で2021年10月初めに、大規模なシステム障害が発生した。この障害に関する報告書を読んで感心したことがある。同社は普段からシステム障害に対応する訓練を繰り返しており、それが今回も役立ったというのだ。一方、みずほ銀行で頻発したシステム障害に目を転ずると、訓練を怠ったことがトラブルを深刻化させていた。両社の事例は多くの企業にとって教訓となるだろう。 まずはフェイスブックで2021年10月4日(米国時間)に発生したシステム障害を振り返ろう。FacebookやInstagram、WhatsAppなど同社の全サービスが7時間以上も停止するという大規模なトラブルだった。同社が世界中に配置するデータセンターやネットワーク接続設備(POP、Point of Presence)を結ぶ自前のバックボーンネットワークでルーターの設定を変更したところ、誤ってバックボーンネットワ