エンジニアにとって、突発的な障害対応や不具合の解消 は避けて通れない業務のひとつです。 この記事では、トラブルシューティングのセオリーとして意識したい 7つのステップ をご紹介します。これらのステップを意識することで、問題解決の効率を上げ、より迅速かつ確実にトラブル対処することができるでしょう。 7ステップの全体像 事象を把握する 問題発生箇所を特定する 暫定対処を実施する 事象を再現し、発生条件を特定する 原因仮説を立てる 仮説を検証し、原因を特定する 恒久対処を実施する ステップ1:事象を把握する 最初のステップは、問題の全体像を正確に把握することです。 いつ、どこで、どのような影響が出ているのかを把握し、障害規模や対処の優先度を判断することが目的です。 次の3つの要素と収集し、時系列で整理しましょう。 技術データ 対象 ログ メトリクス ポイント ErrorやWarningレベルログ