この連載を開始するに当たって、読者の方には「悪いニュース」と「いいニュース」を伝えなければなりません。まず悪いニュースですが、現在稼働しているシステムは、どんなに堅牢に作成されたシステムであっても障害が発生する可能性があります。そしていいニュースの方は、それらのシステム障害をあらかじめ予測して被害を最小限に食い止めることができるということです。 この連載では「システムには障害が発生する」ということを前提として、障害をいち早く検知する方法や、障害が発生した場合の対処方法などについて解説します。しかし、発生した障害への技術的な対応方法や、障害原因の切り分け方法などはもっと詳細なほかの技術解説記事に譲ることにして、ここでは「システムの障害時にスタッフはどのように行動するべきか」に注目してみることにしましょう。 ダウンしたときの痛手∝資産価値 システム障害を検知して対応するというのは「システムの運
![システム障害に対応する、とは?](https://cdn-ak-scissors.b.st-hatena.com/image/square/6e84fc6ab06f31b2e64248cbfc92fe06deb5bab5/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fimages%2Flogo%2F1200x630_500x500_ait.gif)