タグ

ブックマーク / ike-dai.hatenablog.com (3)

  • AWS障害状況をZabbixで監視 - ike-dai's blog

    AWSで発生している障害状況をモニタリングするには、AWS Health Dashboardというサイトがあります。 ここでは、各リージョンの各サービス毎に障害が発生していないかの情報を発信しています。 サービスが利用不可になっている状態のお知らせだけでなく、パフォーマンス劣化が発生している状況なども発信しています。 AWS上でサービス運用している方にとって、ここで公開される情報は結構重要です。 いち早く何が起こっているのかに気付くためにもこのサイトの情報は常にチェックしておきたいところです。 しかし、このサイトの最新情報を知るには、ブラウザでこのサイトを確認するか、RSSで配信される情報をチェックするしかありません。 何かあればプッシュ型で通知して欲しいところではないでしょうか。 そこで、このサイトの情報をZabbixで集約し、障害が発生した場合にアラートを上げれるようにしてみます。 実

    AWS障害状況をZabbixで監視 - ike-dai's blog
  • SLAをメールでレポート(ZabbixのITサービスの活用) - ike-dai's blog

    システム運用していて、SLA管理のためにサービスレベルを定期的にレポートしたい場合もあるかと思います。 ZabbixにはITサービス機能があり、サービスの稼働率を算出することができます。 例えば次のような形で設定できます。 サービスAとサービスBの監視をZabbixで監視 サービスAはWebサーバ3台、DBサーバ2台で構成 サービスBはWebサーバ2台、DBサーバ2台、認証サーバ2台で構成 サービスAが稼働継続するには少なくともWebサーバ、DBサーバが1台以上稼働している必要がある サービスBが稼働継続するには少なくともWebサーバ、DBサーバ、認証サーバが1台以上稼働している必要がある このような環境があった場合にそれぞれのサーバの稼働率からサービス自体の稼働率を算出することができます。 ZabbixのITサービスの機能を使うことで次のようにできます。 設定は「設定」→「ITサービス」

    SLAをメールでレポート(ZabbixのITサービスの活用) - ike-dai's blog
  • zabbixエージェント動作確認方法 - ike-dai's blog

    最近zabbixを触り始めました。 その中で知ったことをちょくちょく残していこうかと思います。 コマンドによるzabbixエージェントの動作確認方法 zabbixエージェントの監視が正しく行えているかどうか、 また、キーに対してどのような値が取得できるのかをコマンドラインから確認する方法です。 管理画面上に反映されるのを待っててもいいですが、コマンドで簡単にチェックできるので便利です。 利用するコマンドはzabbix_getコマンド。 コマンドの使い方は以下の通り。 zabbix_get -s 監視対象(エージェント導入済)サーバIP -p 監視対象サーバのエージェント起動ポート番号 -k キーの値 以下の例は、/var/log/messagesに文字列errorが含まれているかをチェックするコマンドです。 zabbix_get -s 192.168.xxx.xxx -p 10051 -k

    zabbixエージェント動作確認方法 - ike-dai's blog
  • 1