これはSupership株式会社の 「データソリューションスタジオ」における社内勉強会の発表資料を外部公開向けに再編したものになります。 アジェンダ・どのような問題があったのか ・なぜエラー通知を見落とすのか ・どのようにして見落としを防ぐか ・「本当にまずい状態」とはなにか ・「本当にまずい状態を通知」するようにした結果 ・「本当にまずい状態の通知」をどのように実装したか どのような問題があったのか今回の改善を行ったログ転送・集計基盤では、Jenkinsを用いてログのプレ集計や運用担当者が見るレポートの集計、予算消化状況の管理などビジネスに直結する様々なジョブが実行されていました。 しかし、日々拡大していくビジネスに運用が追いついておらず、ジョブが増え続け、Slackやメールに通知されるJenkinsのエラーを見落とすというケースがありました。 そこで、「本当にまずい状態の通知」を「ステ

