こんにちは。グリーのmdoi(@m_doi)です。 今回は、グリーの監視システムについて説明したいと思います。以前、こちらの記事にて、リソース監視システムの説明をさせて頂きましたが、死活監視やログ監視については語られなかったので、気になっていた方も多いと思います。ということで、今回は、グリーのインフラにおける死活監視やログ監視、アラート通知システムを紹介したいと思います。 何を使っているの? グリーでは、死活監視にNagiosを使用していました。監視システムの中では、かなり有名なソフトウェアですから、監視システムの構築に使用したことがある方も多いのではないでしょうか。プラグインも豊富に存在するので、様々な監視を行うことができます。死活監視は、このNagiosの機能をそのまま利用し、ログ監視は、Nagiosと独自に作成したエージェント及びログフィルタを連携させて行っていました。 全体のシステ
![大規模インフラの監視システム その2 | GREE Engineering](https://cdn-ak-scissors.b.st-hatena.com/image/square/b1e492590b05d99d582af3d991fc8359db400498/height=288;version=1;width=512/https%3A%2F%2Flabs.gree.jp%2Fblog%2Fwp-content%2Fuploads%2F2019%2F03%2Fblog_ogp.jpg)