ITシステムの複雑化に伴い、年々速やかな検知が難しくなっているシステム障害。今回は障害をいち早く検知し、効率的に対処するためのポイントを紹介する。 「インシデント」と「障害」は別のこと 皆さん、こんにちは。前回までは「リリース管理」のようなITILっぽいお話もしましたが、今回はITILを離れておおまかに障害管理についてお話をすることにします(とはいえ、ときどきITILっぽいお話もしますのでご承知おきください。ただ、本連載は ITILを勉強することが目的ではないので、ITIL V2、V3のどちらを参照するか、ということまでは言及しません) さて今回は、第2回「インシデント管理=障害対応という誤解」の復習をしましょう。 第2回では、インシデントとは「利用者がやりたいと思ったことをやれない状態」のことだと定義しました。利用者が「やりたいことをやれない」原因として、最も多いのは「障害」ではないでし
![年々難しくなる「障害検知」のコツ](https://cdn-ak-scissors.b.st-hatena.com/image/square/15f5249625d32d41f19f592a0ed489d3b7a74c57/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fim%2Farticles%2F1005%2F19%2Fr4hyo460.jpg)