話題の人気ブログ「おい、」シリーズの著者で、ソフトウェアエンジニアのnwiizoさんによる新連載「生産性を取り戻せ」。この連載では「仕事の生産性」をあらゆる角度からとらえ、チームで生産性を高めていくためのヒントを探っていきます。 第3回は「賢い人しかいないチームが、なぜミスを犯すのか?」を考えます。 はじめに 本番環境で障害が起きた。ユーザーへの影響は30分。復旧は終わっている。これから原因を分析し、再発防止策を決める。メンバーは5人。全員が優秀だった。 最初の10分は順調だった。タイムラインを確認し、直接原因を特定した。問題はここからだ。再発防止策の議論に入った瞬間、5人が5つの方向に走り始めた。 Aは「監視のしきい値を変えるべきだ」と言った。正しい。 Bは「カナリアリリース(一部のユーザーだけに先行公開する手法)を入れるべきだ」と言った。正しい。 Cは「そもそも基本設計の問題だ」と言っ

