IT界隈でエンジニアしていると、よく出くわすのが障害対応です。できれば会いたくないという人が多いと思うんですが、僕はけっこう好きです。障害対応。どこに原因があるのか調査をして、バランス良くベターな対応をしたときの楽しさは、プログラミングとはまた違ったものがあります。探偵っぽい感じが面白いですよね。もちろん、障害が発生しない状況を作るのが一番です 弊社では数多くのWebサービス/アプリを運営しているので、過去様々な障害対応をしてきました。その際に、解決までどんな道筋を僕がたどるのかを振り返ってまとめてみました。これが大正解なんてことはなく、人や事象によって違うとは思いますが。 なお、障害検知手法とか、サーバのコマンドとか、コードのデバッグ手法とか、具体的なことは一切出てきません。手続きと思考プロセス的な話です。 障害対応フローチャート 一般的な感じだと思いますが、障害報告から対応完了までのフ
![システム障害と僕達はいかにして戦えば良いのか、障害対応について考えた - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/5c0b7b74f32d693d93842238e885e06d08d39600/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Fadvent-calendar-ogp-background-f625e957b80c4bd8dd47b724be996090.jpg%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9JUUzJTgyJUI3JUUzJTgyJUI5JUUzJTgzJTg2JUUzJTgzJUEwJUU5JTlBJTlDJUU1JUFFJUIzJUUzJTgxJUE4JUU1JTgzJTk1JUU5JTgxJTk0JUUzJTgxJUFGJUUzJTgxJTg0JUUzJTgxJThCJUUzJTgxJUFCJUUzJTgxJTk3JUUzJTgxJUE2JUU2JTg4JUE2JUUzJTgxJTg4JUUzJTgxJUIwJUU4JTg5JUFGJUUzJTgxJTg0JUUzJTgxJUFFJUUzJTgxJThCJUUzJTgwJTgxJUU5JTlBJTlDJUU1JUFFJUIzJUU1JUFGJUJFJUU1JUJGJTlDJUUzJTgxJUFCJUUzJTgxJUE0JUUzJTgxJTg0JUUzJTgxJUE2JUU4JTgwJTgzJUUzJTgxJTg4JUUzJTgxJTlGJnR4dC1jb2xvcj0lMjMzQTNDM0MmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkNtaWRkbGUmcz0wNWYxN2Y3NjY4ZWUyNGNlM2U0NmE4ZmVhZWFlOGEyMw%26mark-x%3D142%26mark-y%3D151%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwemFydSZ0eHQtY29sb3I9JTIzM0EzQzNDJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9YjA4ZDdhODI1YjM4MDliNGYwZTZhZDkzY2Y5NTc3M2M%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D3d56dca9974a231eee1282c35dea6df6)