こんにちは。ギフトモール Engineering Managerをやっている @nori0620 です。 はじめに Giftmallではサーバ監視、アラート送信の仕組みに Datadog を導入しています。 Datadogの各種インテグレーションを利用することでEC2, ECS, RDS, ALBといった様々なインフラリソースの監視に利用しており、何か問題の予兆があった際にはSlackに通知を送ってチームが把握できる体制を作っています。 ただ、システムを運用していく上で、インフラ/サーバだけでなく、アプリケーションに近いレイヤーでも監視を行いたいようなニーズがでてきました。例えば「ユーザがログインに失敗した総回数」をモニタリングしておいて不正なログインの試行などが行われていないかを監視するなどです。 このようなアプリケーションレイヤーにおけるモニタリングも既存のDatadogで監視している