こんにちは、SREエンジニアのたっち(@TatchNicolas)です。これまではPythonによるサーバサイド開発を担当していましたが、SREエンジニアとしてプロダクトを横断して安定性・パフォーマンス改善に取り組む担当になりました。 ヘルスチェックしにくいバッチ系のECSタスク JX通信社では、ワークロードのほとんどをAWS LambdaまたはECSの上で動かしています。 Webサービス自体やAPIなどはALBやECSサービスのヘルスチェックを使って異常を検知したり、StatusCakeのようなサービスを使って外形監視をすることができます。 しかし、エンドポイントを持たないバッチ処理のようなタスクは、タスク自体が起動に失敗したり、途中で失敗した場合に上記の方法では検知することができません。 そこで、AWSの強力な機能の一つであるCloudWatch Eventsを使って、うまく動作しなか
![CloudWatch Eventsを使ってECSタスクを監視するツールをSAMで作る - JX通信社エンジニアブログ](https://cdn-ak-scissors.b.st-hatena.com/image/square/4fc6615e119f25623f829c404cc42a9644a1cdc9/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2FT%2FTatchNicolas%2F20190815%2F20190815142005.png)