タグ

Nagiosに関するwasaiのブックマーク (16)

  • メモリ使用状況を監視するNagiosプラグインを書きました

    こんにちは。斎藤です。 ようやく、都心でも雪がほぼ無くなった今日この頃、皆様いかがお過ごしでしょうか。雪は、スキー場だけに降って欲しいなと思っています。 今日は、メジャーページフォルト(スワップイン)およびメモリ使用量を観測するNagiosプラグインを書きましたので、ご紹介します。お話は3点あり、「ぜひセットで使ってください!」「check_mpfの紹介」および「check_memfreetotalの紹介」について述べて行きます。 ※各種プラグインは、執筆当初のバージョンを元に説明しています。最新版は、それぞれのGitHubリポジトリをご覧ください。 ぜひセットで使ってください! 今回、「check_mpf」と「check_memfreetotal」を用意しました。目的は2点あります。 メジャーページフォルト数増加に伴うパフォーマンス低下を把握しやすくしたい。 メモリ全体の空き容量を確認し

    メモリ使用状況を監視するNagiosプラグインを書きました
  • CentOS 6.4にサーバ統合監視ツールのNagiosを使ってWEBサイトの死活監視する

    音はAWSのCloudWatchを使いたいんですが、今はAWSとそれ以外が混在している状態なのでしょうがない。 WEBサーバはApacheを使っていきます。 ブラウザで画面が見えるまで まずはnagiosとnagios-pluginsをインストールします。check_httpがプラグインとして提供されているので。

    CentOS 6.4にサーバ統合監視ツールのNagiosを使ってWEBサイトの死活監視する
  • http://paperboy-all.github.io/docs/nagios/learning.html

    http://paperboy-all.github.io/docs/nagios/learning.html
  • 監視ソフトをNagiosからSensuに切り替えて2ヶ月経ったのでまとめた - Glide Note

    新規サービス用の監視をNagiosからsensuに切り替えて2ヶ月経ったので、 導入時の調査で社内で公開してたissueと、投入して2ヶ月間運用した記録を公開しておこうと思う。 というか以前Sensuの事を書くと公言していたのに、すっかりサボっていて 昨日@ma0eさんのブログを見て下記のやり取りを思い出して急いで書いた… @ma0e We started using it. @glidenote will report the detail soon, I think. — kentaro (@kentaro) 2013, 10月 30 @kentaro @glidenote that would be nice — Mitsutoshi Aoe/maoe (@ma0e) 2013, 10月 30 導入環境はCentOS 6.4で、利用しているsensuのバージョンは0.12.1-1にな

  • 運用統合ソフトウェア「Hatohol(はとほる)」とは

    運用統合ソフトウェア「Hatohol」は開発中のモジュールであり、事前の告知なしに仕様、内容が変更される場合があります。 運用統合ソフトウェア「Hatohol(はとほる)」とは 運用統合ソフトウェア「Hatohol」は、複数のZabbixサーバ、およびNagiosサーバからデータを取得し、ZabbixサーバやNagiosサーバをまたいだ環境の一括監視を可能にする、表示専用のソフトウェアです。「Hatohol」によって将来的に見込まれる監視規模・拠点の拡大やハイブリッドクラウド環境の監視などの要望に応え、エンタープライズ環境での利用に十分対応できる監視システムを提供します。 運用統合ソフトウェア「Hatohol」の画面 *画像をクリックすると拡大図を表示します 「Hatohol」の主な特長 拡張性:独立した複数のZabbixサーバ、およびNagiosサーバを一元管理することで、監視対象規模に

  • Nagiosのアラート情報をSpreadSheetに自動で書き込む - mikedaの日記

    『WEB+DB PRESS Vol.75』の『継続的Webサービス改善ガイド』は良かったですね。 その記事に、「毎日、アクセスログを解析した結果をGoogle DocsのSpreadSheetにまとめている」ということが書かれていて、サンプルがgistに公開されていました。 puboo-performance-index.rb へー、SpreadSheetに自動でいろいろまとめるの、なかなか便利そう!ということで自分でもちょっとやってみました。 まずは試し rubySpreadSheetを操作するのはgoogle_driveを使うとすごく簡単でした。 #!/home/mikeda/.rbenv/shims/ruby # -*- coding: utf-8 -*- require 'google_drive' session = GoogleDrive.login("<user>@gmai

    Nagiosのアラート情報をSpreadSheetに自動で書き込む - mikedaの日記
  • ZabbixとNagiosの監視情報を一元的に表示する「Hatohol」

    ZabbixとNagiosの監視情報を一元的に表示する「Hatohol」:ミラクル・リナックスがオープンソースとして公開 ミラクル・リナックスは6月27日、オープンソースの統合監視ソフトウェア「Zabbix」と「Nagios」からデータを取得し、一元管理できるようにする統合ビューア「Hatohol」を開発し、オープンソースソフトウェアとして公開した。 ミラクル・リナックスは6月27日、オープンソースの統合監視ソフトウェア「Zabbix」と「Nagios」からデータを取得し、一元管理できるようにする統合ビューア「Hatohol」を開発し、オープンソースソフトウェアとして公開した。 ZabbixとNagiosは、サーバやプロセスの稼働状態の監視と障害検知を行い、システムの安定運用を支援するオープンソースソフトウェアで、ともに多くのシステムで採用されてきた。 Hatoholは、複数のZabbix

    ZabbixとNagiosの監視情報を一元的に表示する「Hatohol」
  • ScaleOut | Supership

    「ミライリアルの幸せを、デジタルの力で創る」ことを目指すSupershipグループの社内報です。日々の出来事、メンバーの働く様子や声、未来への想いなど、Supershipグループの”Be Super”なストーリーをみんなでシェアしていきます。

    ScaleOut | Supership
  • Nagiosのcheck_snmpプラグインの --rate オプションを試す - blog.nomadscafe.jp

    Nagiosのプラグインで、データ転送速度など、変化量・差分を監視するには、プラグインでどこかファイルに監視結果を保存しておいて比較するという手が使えると2つ前のエントリ書きましたが、 check_snmpでもそれがサポートされていたので試してみました。恥ずかしながら知りませんでした。 check_snmpの「—rate」というオプションがそれ。 --rate Enable rate calculation. See 'Rate Calculation' below --rate-multiplier Converts rate per second. For example, set to 60 to convert to per minute Rate Calculation: In many places, SNMP returns counters that are only me

    wasai
    wasai 2013/02/10
  • Plackを使ってApacheナシでNagiosをインストールする方法 - blog.nomadscafe.jp

    Plack上でPHP(php-cgi)を動かすモジュール、Plack::App::PHPCGIと任意のCGIも動かせるPlack::App::CGIBinを使ってApacheナシでNagiosをインストールする方法 まず、php-cgiをインストールする。CentOSの場合、php(53)?-cliというパッケージがあるのでそれを使います $ sudo yum install php53-cli #centos5。centos6だとphp-cli 次にnagiosを動かすユーザを作成します $ sudo /usr/sbin/adduser nagios nagios体とpluginをダウンロードしていれます。その際にApacheの設定はインストールしません $ wget http://prdownloads.sourceforge.net/sourceforge/nagios/nagio

  • fluentdでNagiosアラートの集約 « ボーダーレスライフ

  • 第2回 mixi.jpを支える運用監視 | gihyo.jp

    はじめに 株式会社ミクシィの小池知裕です。運用部でアプリ運用を担当しています。前回は年末年始や突発的な負荷に耐えられるシステムの改善について紹介しました。連載2回目となる今回は、mixi.jpを支える運用業務でどのようにシステムの監視と測定が行われているのか、紹介します。 監視/測定って? まず、前号からのおさらいになってしまいますが、筆者の所属する部署の「アプリ運用グループ」は mixi.jpのミドルウェア層以上の運用/維持管理/改善をおもに担当しています。 そこでは、「⁠システムが正常に稼働しているか」「⁠サーバの(CPUやメモリ、トラフィックなど)どういうリソースがどのくらい使われているのか」などを把握しておくことが非常に重要になってきます。 mixiでの監視/測定には大きく分けると2つあります。 死活監視/サービス監視 リソース監視 これらはそれぞれにシステムを運用し、改善するため

    第2回 mixi.jpを支える運用監視 | gihyo.jp
  • livedoor Techブログ : Eclipse初心者がAndroid開発する際に押さえるべきこと

    こんにちは! iPhone/Androidエンジニアのgaoohです! 好きなExceptionはUnsupportedOperationExceptionです! みなさん、Android開発ではエディタは何をつかってますか? やっぱJavaといえばEclipseですよね! 個人的にはEclipseが大好きっ子です。好きすぎてEclipseでPerlを書いてたらまわりから変な目でみられたけど、それにもめげずに今日もワークスペースを開きます。 そんなEclipse好きなので、Androidで開発するときに抑えておくべきことをまとめてYo! とリーダーにいわれたので、まとめてみました。 これだけはいれとけ! 必須plugin ADT 当たり前ですが、これをいれないと話になりません。 http://developer.android.com/sdk/eclipse-adt.html EGit G

    wasai
    wasai 2011/01/25
    これは参考になるな
  • 第3回 memcachedの監視とCloudForecastによるモニタリング | gihyo.jp

    安定したWebサービスを提供するためには欠かすことができないのが監視です。監視を行うことで障害をいち早く検知し、対応を行うことでダウンタイムを最小限にできます。また負荷の掛かり具合やサーバリソースの消費度合いを明らかにすることでいつ、どのタイミングでサーバやインフラを増強するか、またアプリケーションの改善を行うのかを判断できます。Webサービスの稼働やリソースの「見える化」を実現することで、個人の経験や勘、また根性だけに頼らない運用が可能となり、より的確なタイミングでのシステムの改善、増強を行えます。 稼働監視とリソースモニタリング Webサービスのシステムの監視には大きく分けて2種類の監視があります。1つ目は稼働監視、2つ目はリソースのモニタリングです。稼働監視では監視を行ったタイミングで対象システムに例外があれば、メールを送信するなどのアラートを発生させます。稼働監視に於ける例外とは、

    第3回 memcachedの監視とCloudForecastによるモニタリング | gihyo.jp
    wasai
    wasai 2010/09/08
    そのうち試したいのでチェック
  • kumofsの死活監視はこんな感じでNagiosでやってます - (ひ)メモ

    分散Key-Valueストア「kumofs」を公開しました! - 古橋貞之の日記 \(^o^)/ kumofsは、弊社のフォトストレージサービス Ficia で現在大絶賛モリモリ稼働中なんですが、その死活監視は自家製の Nagios プラグインで行っています。 というわけで、kumofsをサービスで使いたい人の一助になればと思い、ぼくが実際に行っている kumofs の監視について紹介したいと思います。 サーバノードとマネージャノード サーバノードとマネージャノードの監視には、それぞれのノードに対してステータスを問い合わせるコマンドを発行して、その応答で死活を判断するスクリプトを書いて使っています。 kumofs公開記念ということでgithubにpushっておきました。 http://github.com/etolabo/nagios-check_kumofs 問い合わせの処理は、管理用コ

    kumofsの死活監視はこんな感じでNagiosでやってます - (ひ)メモ
    wasai
    wasai 2010/01/20
    これは参考になりそうなのでチェックしておきましょう
  • 4種の統合監視ツールの情報収集機能を比較!

    連載においても、上記の5つの機能に関して比較を行っていきます。今回は1つ目の機能である「情報収集機能」について比較を行ないます。 情報収集機能の比較 情報収集機能については、監視対象の状態を収集する機能に加え、情報収集の設定や収集したデータの保存形式を対象として比較を行ないました。各比較項目の説明を以下に示します。 情報収集機能 リソース監視:専用エージェントを用いたCPU/メモリ/ディスク/ネットワークなどの内部リソース監視が可能かどうか ネットワーク監視:ping監視、ポート監視などのネットワーク越しの状態監視が可能かどうか SNMP監視:SNMPを利用したポーリング/トラップ監視を行なえるかどうか 情報収集設定 設定方法:情報収集の設定変更を行なう方法/ツール 保存形式:情報収集の設定が保存される形式 設定変更後の再起動:情報収集の設定を行なった後にサービスを再起動する必要があるか

  • 1