こんにちは。Lorentzcaです。今年はたくさんキャンプに行けたので来年も継続していきたいです。 さて、最近深夜に障害が発生しました。その障害対応後にCTOからこんな問いかけがありました。 リモートからの障害対応、なるべくリアクションつけるとか状況確認しつこいくらいやれとかコツあるけど、それ新人さん共有できてるっけ? これを受けて、以前早朝に発生した障害でslack通話しながら対応をしたらいい感じだったことを思い出したので共有も兼ねてその話をします。技術的な話というより、心構え的な話となります。 早朝/深夜の障害対応はキツイ キツイ点は色々ありますが、特にキツイのは、 寝起きで頭が働いていない 障害でサービスが現在進行形で止まっていることに対する 焦り イレギュラーな事態に対する耐性がなく、 どうして良いかわからない (これは経験値にもよりそう…) と私は思っています。 通話しよう 通話