No one is an island. Learnings from fostering a developers community.
No one is an island. Learnings from fostering a developers community.
大量のアラートを、どうさばくか サーバやネットワークが正常に作動しているかどうか監視しつづけ、障害発生にすばやく対応するのは、運用担当者の大事な仕事です。IIJではネットワークだけでなく、アウトソーシングとしてお客様のシステムを多数運用していますが、それらの中にはオープンソースの統合監視ソフトウェア「Zabbix」を使っている案件もあります(もちろん、他の監視システムを使っている案件もあります)。Zabbixで対応しているアラート件数は、年間1000万件にのぼります。 これだけの数があると、ワーニングや単なるノーマルメッセージなど「対応不要」なアラートは最初から見たくありません。瞬間的にアラートが大量発生するときの「重複」も我慢できません。真に対応すべきものの選別すら、できれば人間の手を動かしたくはありません。 そこでIIJは、自分たちが使うための運用自動化ツールを開発しました。この自動化
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く