お疲れ様です。むぎです。 システムのバグ・障害を減らしたいけど減らせない。減らしたいけど原因が掴めない。何をしたらいいか分からない。 そんな悩みを抱える現場と向き合って、二年間、活動してきた内容を紹介しようと思います。 はじめに転職して、いざ現場に行ってみると、その日の会議で「本番障害を減らせ!確認・テストを怠るな!」というお達しが出たところでした。 この手の話は、どの現場でもある話ですよね。 何か気づくこともあるかなということで、まずは本番障害がどのように管理されているかを見てみることにしました。 障害管理表はあった…けど障害管理表はちゃんと管理されていました。運用フローなんかもきちんと整備されていました。 でも、記載レベルは人によってバラバラ。作文の様に長文を書いている人もいれば、一言で終わってる人もいました。 パッと見て、品質の善し悪しがわかりませんでした。 他にも、次のようなことが