タグ

nagiosに関するtknzkのブックマーク (15)

  • プラスαなサーバ監視

    ちわっす!インフラ担当の池田(@mikeda)です。 今日はサーバ監視周りの話です。 まずNaviPlusでは、サーバ監視にNagiosとMuninを使っています。 普通ですね! 気をつけていることは、ちゃんとサービスも監視する(正常なHTTP応答、応答速度など)ということでしょうか。 まぁこのへんは今日の題ではないので別の機会に話します。 システム運用してると、こんな情報も見たいなーというのが出てきます。 例えば、今回紹介するのはこんなのです。 障害発生時(例えば昨日のXX時XX分)の全サーバのプロセスリスト 全サーバのリソース使用状況のザックリとしたレポート あのDBでXX時ごろに流れてたクエリはどんなのか 去年のセール時のアクセス数やサーバ負荷の状況が見たい 番サーバでtmuxを起動しっぱなしの人がいないか こういう既存ツール(うちだとNagios/Munin)にマッチしないもの

    プラスαなサーバ監視
  • nagira という Nagios RESTful API が便利そうな件 · takus's blog

    オートスケーリングみたいなことをしようとする場合、サービスインする前に監視が全て OK になっているかチェック しておきたいみたいな需要がありますが、みんな大好き Nagios でこれをやろうとするとちょっと面倒だったりします。 Nagios::StatusLog のようなものを使って status.dat をパースする方法がお手軽ですが、監視するホストが数千台みたいな環境だと status.dat が結構な大きさになってしまい、必要なたびにパースしてると Nagios が動いてるホストが結構なメモリを喰って swap に入ってしまったり、他のホストに転送してパースするにしてもそれなりに帯域喰ってしまうので、Nagios のホスト上で status.dat をパースして一定期間キャッシュし、HTTP でよしなに JSON を返してくれればいいなとか思っていたら、nagira でそれが実現で

    tknzk
    tknzk 2013/08/06
  • Monitoring Wonderland Survey - Nagios the Mighty Beast

    Controlling the tool everybody hates, but still uses This blog post mainly contains my findings on getting data in and out of Nagios. That data can be status information, performance information and notifications. At the end there are some pointers on ruby integration with Pingdom and Jira The idea is similar to my previous blogposting Monitoring Wonderland Survey - Metrics - API - Gateways: I wan

    tknzk
    tknzk 2013/07/11
  • ScaleOut | Supership

    2024年4月1日より、Supership株式会社は親会社であるSupershipホールディングス株式会社に吸収合併されました。 合併に伴い、存続会社であるSupershipホールディングスは社名をSupershipに変更し、新たな経営体制を発足しました。件に関する詳細は、プレスリリースをご確認ください。 2024年4月1日より、Supership株式会社は親会社であるSupershipホールディングス株式会社に吸収合併されました。 合併に伴い、存続会社であるSupershipホールディングスは社名をSupershipに変更し、新たな経営体制を発足しました。 件に関する詳細は、プレスリリースをご確認ください。

    ScaleOut | Supership
  • CLIでNagiosのアラートを停止する - mikedaの日記

    先日、こんなことをつぶやいたところ、 Nagiosで作業サーバのアラートを管理画面でポチポチ停止するのが超ダルいんだけど、コマンドラインとか設定ファイルでできないのかなぁ 2013-05-16 17:56:03 via web @hirose31さんから親切なアドバイスをいただきました。 @mikeda つ URL 2013-05-16 18:13:29 via atig.rb to @mikeda 使ってみるとなかなか便利だったので紹介しておきます! Nagiosの外部コマンド機能について 名前付きパイプにコマンドを書き込むことで、Nagiosに命令を送る機能があるようです。 『外部コマンド』 コマンドのリストや書式、設定については上記リンクで確認して下さい。 EPELからインストールしたNagiosだとデフォルトで有効化されていました。 # nagios.cfg check_exter

    tknzk
    tknzk 2013/05/27
  • Nagiosのcheck_snmpプラグインの --rate オプションを試す - blog.nomadscafe.jp

    Nagiosのプラグインで、データ転送速度など、変化量・差分を監視するには、プラグインでどこかファイルに監視結果を保存しておいて比較するという手が使えると2つ前のエントリ書きましたが、 check_snmpでもそれがサポートされていたので試してみました。恥ずかしながら知りませんでした。 check_snmpの「—rate」というオプションがそれ。 --rate Enable rate calculation. See 'Rate Calculation' below --rate-multiplier Converts rate per second. For example, set to 60 to convert to per minute Rate Calculation: In many places, SNMP returns counters that are only me

  • 数字を出力するコマンドを定期的に実行して、秒間の変化量を memcachedプロトコルで取れるサーバを書いた - blog.nomadscafe.jp

    Nagiosを使っていると、その瞬間の絶対値だけじゃなく、差分や変化量を取得してその数値を監視したくなりますよね。ならないとしたら、今すぐこの記事を読むのをやめて病院に行って下さい。 Nagiosで変化量を測定するには、プラグインの中で前の数値をどこかファイルにでも保存し、比較するという手があります。このcheck_bandwidthはその方法を取っているようです。 ただ、これだと汎用性があまりないので、監視対象サーバ側に定期的に指定したコマンドを実行して、その数値を外部から取得できるサーバを書いてみました。 CPAN: https://metacpan.org/release/App-derived *出てくるまで時間がかかるようです github: https://github.com/kazeburo/App-derived 使い方 インストールはcpanmで $ cpanm -n

  • IRCサーバを立てて色々連携してみたメモ - アルパカDiary Pro

    やっとこさ今の現場に znc / irc / ikachan という環境を構築し、 テンションが上がって勢いで作業したことをメモってみます。 正月休みにのんびりコーディングしてました。 やったこと一覧 fluentdでnginxのエラーログを監視してikachanに投げる nagiosからikachanに投げる gitリポジトリのpushを監視してikachanに投げる beproud_botの真似っ子bot unazu_kun bot syonago bot fluentdでnginxのエラーログを監視してikachanに投げる いまはnginxエラーログだけ監視してます。 <match nginx.error.**> type copy <store> type ikachan host xxxxxxxxxxxxxxxxxxxxx port 5979 channel nginx-not

    IRCサーバを立てて色々連携してみたメモ - アルパカDiary Pro
  • Nagios × boundioを使った鬱陶しいアラートの作り方 β

    fujya.shです。はじめての人は、はじめまして!そうじゃない人はお久しぶりです。 最近暑いですね。サーバールームの温度も少し上がってきたので、あぁ当の夏がやってきたんだなと実感できる今日この頃です。 今回はboundioというKDDIウェブコミュニケーションズが提供している電話APIサービスを使って少しもにょもにょしてみたいと思います。 ■アラートメールがジャンジャン来るとむしろ気づかない。じゃあ電話じゃない? 運用しているサービスが増えてきたり、サーバーの台数が増えてくるとアラートメールがジャンジャンきたりしますよね?来ならばそういった場合にアラートの原因をすぐさま対策するか、しきい値の変更を実施すれば良いのですが時間的な制約で次週へ持ち越し・・・なんて事も稀にある話です。 そんな時にメールボックスがパンクしてしまい、ほんとうに大事なアラートに気付けない事もあるって話を聞いたり聞

  • fluentdでNagiosアラートの集約 « ボーダーレスライフ

    RRDなどにメトリクスを書き込んでグラフを生成している場合、標準的なサーバだとCPUかHDDがボトルネックになって、Nagiosサーバ1台あたり持てるクライアントは、300台〜700台くらいが限度といったところでしょう。 数万台のサーバを管理する様な環境では、Nagiosサーバ単位で情報が分断されてしまうので、関連するシステム(特に他部署が管理している様な)の状況が把握しづらいことがよくあります。 全サーバの状況を横断して検索、リスティングができると、障害時の対応時間を短縮できるし、統計情報の取得ができるとメトリクスdrivenな運用&開発もしやすくなり、プロダクトの質も向上するだろうということでfluentdでやってみました。とは言ってもまだ始まったばかりなのですが、下の図の様な構成で、Nagios上のイベントログをfluentdがtailし、必要なイベントログをfluentd serv

  • percona-xtrabackup:start [Percona DokuWiki]

    Home Home Percona Monitoring and Management Percona Monitoring Plugins MySQL Software MongoDB Software PostgreSQL Software Kubernetes Operators Playback Reference Legacy documentation¶ You should upgrade to the most recent version for documentation support. The documentation for product versions that are either outdated or have reached their end-of-life is available in a PDF format. Outdated docum

    percona-xtrabackup:start [Percona DokuWiki]
  • Nagios で SSL 証明書の有効期限を監視する | バシャログ。

    こんにちは nakamura です。minami のアイコン が変わっている事にみなさんお気付きでしょうか?そりゃ暑いよね~。ヘルメットかぶるとサザエさんみたいになるらしいですよ。 まぁそんなことはどうでもよくって、SSL 証明書の管理ってなかなか面倒じゃないですか?CA から事前にメール通知されるはずですが、なぜか昔の担当者が個人のアドレスで登録していて、気が付いたら有効期限を 1 ヶ月以上過ぎてた!なんてのは人間生きていれば一度はあるはず。 てなわけで CA に頼らず自分でも SSL 証明書の有効期限を監視してメール通知するような仕組みを作りたいな~なんて思ってたら、Nagios でいとも簡単にできてしまったので今日はその方法をご紹介します。 設定方法 とはいうものの記事にするほどのボリュームもないぐらい簡単なんですけどね・・・。check_http というデフォルトで用意されているプ

    Nagios で SSL 証明書の有効期限を監視する | バシャログ。
    tknzk
    tknzk 2011/08/14
  • Teeny Nagios - Nagiosのスマートフォンビューを作ったよー - (ひ)メモ

    自分の場合、iPhoneでNagiosを見たい場合というのは、 アラートが飛んできたので状況を確認したい →ざっと状況をつかみたいので、一覧性の高いビューがいい 即時対応は必要なさそうなので、とりあえずアラートを止めたい →ホスト単位、またはサービス単位で「Schedule downtime」したい ぐらいなので、それに特化したスマートフォンビューを作りました。 プロジェクトホーム http://hirose31.github.com/teeny-nagios/ レポジトリ https://github.com/hirose31/teeny-nagios Mobile Safariで通常のNagiosのページを見てもいいんですが、操作性、一覧性がイマイチだなーと思ったのが作った動機です。 ホーム。ざっくり状況を確認するのに。 ホストの一覧。黄色はwarningが、赤色はcriticalが出

    Teeny Nagios - Nagiosのスマートフォンビューを作ったよー - (ひ)メモ
    tknzk
    tknzk 2011/06/10
  • memcachedに張られているコネクション数を監視するNagios pluginを作ってみた - (ひ)メモ

    夏休みが終わったので宿題しました。(小ネタはありません) http://github.com/hirose31/nagios-check_memcached_connections 要 libmemcached こんな感じで。 $ ./check_memcached_connections -H mc101 -w 3 -c 5 MEMCACHED WARNING: conn 5, 0.001 seconds あわせてよみたい mixi Engineers’ Blog » mixi大規模障害について その2

    memcachedに張られているコネクション数を監視するNagios pluginを作ってみた - (ひ)メモ
  • ウノウラボ Unoh Labs: PHPで暗号化・復号化あれこれ

    GT Nitro: Car Game Drag Raceは、典型的なカーゲームではありません。これはスピード、パワー、スキル全開のカーレースゲームです。ブレーキは忘れて、これはドラッグレース、ベイビー!古典的なクラシックから未来的なビーストまで、最もクールで速い車とカーレースできます。スティックシフトをマスターし、ニトロを賢く使って競争を打ち破る必要があります。このカーレースゲームはそのリアルな物理学と素晴らしいグラフィックスであなたの心を爆発させます。これまでプレイしたことのないようなものです。 GT Nitroは、リフレックスとタイミングを試すカーレースゲームです。正しい瞬間にギアをシフトし、ガスを思い切り踏む必要があります。また、大物たちと競いつつ、車のチューニングとアップグレードも行わなければなりません。世界中で最高のドライバーと車とカーレースに挑むことになり、ドラッグレースの王冠

    ウノウラボ Unoh Labs: PHPで暗号化・復号化あれこれ
  • 1