SpeeeのDX事業本部にて、業務委託のエンジニアとしてお手伝いしている id:ayemos です。今回はSpeeeにおいて実践したアプリケーション監視の話をします。 アプリケーション監視とは メトリクスの収集による監視とは例えば、特定のEC2インスタンスのルートデータボリュームの空き容量が20%以下になったらアラートを上げる などの仕組みです。これにより、システムの異常を素早く検知、あるいは未然に防ぐことができます。 あるメトリクスがリリースなどの 変更に連動して変化 する可能性があり、そしてその 変化が異常と認められる ような場合、そのメトリクスは監視の対象とすべき有力な候補となります。例えば、ユーザーによるフォーム入力のバリデーション失敗数やスパムメール検知フィルタの検知数などのメトリクスはログやレコードには残らない場合があります。 この意味で、ホストやロードバランサ、nginxから