はじめまして。開発部のid:guitarrapc_tech です。 今回、黒騎士と白の魔王を例にモニタリングをどのようにしているのか、どのように考えてサービス監視を行っているのか紹介したいと思います。 目次 目次 モニタリング モニタリングの不足 CBT で気づいたモニタリング不足 モニタリングサービスの要件と選定 モニタリングの分類 モニタリングをレイヤー分けして可視化する 1. サービスの全般的な状態 2. アプリケーションと相互関係にあるリソース状態 3. アプリケーションの詳細なメトリクス状態 4. 各ロールの詳細メトリクス イベント アラート まとめ 参考 モニタリング 「黒騎士と白の魔王」の開発からリリースにかけて、大きな課題であり続けたのが「どのようにサービスのモニタリングを行うか」でした。ここでいうモニタリングは、次の意味を持たせています。 役割 意味 現状把握 サービスが