タグ

*監視に関するmasa_matyaのブックマーク (86)

  • カジュアルに MySQL を監視する方法 | Carpe Diem

    このエントリーは、MySQL Casual Advent Calendar 2011 – MySQL Casual の第 19 日目のエントリーです。 皆さんこんにちは、n0ts こと、Naoya Nakazawa です。 今日は、みなさん日頃からカジュアルに MySQL を運用して、日々生活されていることと思います。MySQL は、非常に安定したオープンソースソフトウェアだと思いますが、どんなものでもときにはおかしくなったりするものです。 「備えあれば憂いなし」ということで、僕は日頃から Nagios というオープンソースソフトウェアを利用して、MySQL がおかしくなっていかいか日々カジュアルに監視しています。 今日は、カジュアルに MySQL を Nagios を使って監視する方法を紹介したいと思います。なお、今回は CentOS 5.7 x86_64 というカジュアルな Linux

  • ライブドア様xKLab合同勉強会 システムモニタリングツール「Ganglia」の紹介

    1. Copyright © KLab Inc. All rights reserved. KLab 株式会社 ライブドア様×KLab 合同勉強会 システムモニタリングツール「Ganglia」の紹介 第弐開発部 横川 和哉 ~なんでもデータを取ってグラフ化しよう!~ 2. Copyright © KLab Inc. All rights reserved. 2  自己紹介 目次  Ganglia の特徴  システムモニタリングツールとは  DSAS での利用例  ganglia のおかげで...  まとめ

    ライブドア様xKLab合同勉強会 システムモニタリングツール「Ganglia」の紹介
  • Metrics Collection and Display via Graphite | AppNexus Tech Blog

    masa_matya
    masa_matya 2011/09/24
    Graphiteを使ってmetrics収集
  • 大規模インフラの監視システム その2 | GREE Engineering

    こんにちは。グリーのmdoi(@m_doi)です。 今回は、グリーの監視システムについて説明したいと思います。以前、こちらの記事にて、リソース監視システムの説明をさせて頂きましたが、死活監視やログ監視については語られなかったので、気になっていた方も多いと思います。ということで、今回は、グリーのインフラにおける死活監視やログ監視、アラート通知システムを紹介したいと思います。 何を使っているの? グリーでは、死活監視にNagiosを使用していました。監視システムの中では、かなり有名なソフトウェアですから、監視システムの構築に使用したことがある方も多いのではないでしょうか。プラグインも豊富に存在するので、様々な監視を行うことができます。死活監視は、このNagiosの機能をそのまま利用し、ログ監視は、Nagiosと独自に作成したエージェント及びログフィルタを連携させて行っていました。 全体のシステ

    大規模インフラの監視システム その2 | GREE Engineering
    masa_matya
    masa_matya 2011/01/27
    nagiosでは厳しくなったのでAWACSを使っている
  • dfltweb1.onamae.com – このドメインはお名前.comで取得されています。

    このドメインは、お名前.comで取得されています。 お名前.comのトップページへ Copyright © 2020 GMO Internet, Inc. All Rights Reserved.

    masa_matya
    masa_matya 2010/12/31
    apacheのLogformatの%Dや、tcpdumpでrequest->responseの時間把握。DBの監視項目。ネットワークレイテンシなど
  • 簡単サーバー監視ツールを書いてみた - kaeruspoon

    #!/usr/local/bin/ruby require 'ping' require 'net/smtp' require 'net/http' unless Ping.pingecho("www.server.com", 3, "80") Net::SMTP.start('mail.server.com', 25) {|s| s.send_mail "Subject:Server Down!!(L3)", 'kanshi-24@mail.server.com', 'oishi@example.com'} end begin Net::HTTP.start("www.server.com") rescue Net::SMTP.start('mail.server.com', 25) {|s| s.send_mail "Subject:Server Down!!(L7)", 'kansh

  • 運用におけるエラーログの重要性もしくはLog::Minimalってモジュール書いた話 - blog.nomadscafe.jp

    追記 CPANにアップしました http://search.cpan.org/dist/Log-Minimal/ /追記 アプリケーションサーバでエラーが起きていたり、レスポンスが遅かったりする場合に、Operation Engineer(インフラエンジニア)がまず見るのは、エラーログです。エラーログにでているメッセージを手がかりに原因を探ります。 サーバでエラーが起きている時には、データベースに接続ができなかったり、外部のAPIからレスポンスが得られない、またプログラムのBugが原因となっている場合もあるでしょう。またエラーにならなくても、複数台あるデータベースのスレーブサーバうち一台が落ちて接続をretryしていたり、APIのレスポンスが遅い際にはサーバ全体のパフォーマンスが低下します。 エラーログに障害の原因を探る情報があれば、Operation Engineerは素早く対応を開始で

  • ソーシャルアプリ向けシステム監視運用の勘所

    Tatsuro Hisamori from DeNA Co., Ltd. discusses mbga OpenPlatform and summarizes techniques for optimizing database and application performance including using tcpdump, Wireshark, and mk-query-digest to analyze SQL queries and network traffic. He also provides examples of optimizing resources and response times by distributing applications across virtual machines and monitoring CPU usage, database

    ソーシャルアプリ向けシステム監視運用の勘所
  • 大規模インフラの監視システム | GREE Engineers' Blog

    こんにちは。インフラチームの ebisawa です。 今回はグリーのインフラにおける各種機器の監視がどのように行われているのかご紹介させていただきたいと思います。一般にサーバの監視というと、システムダウンを検出するための死活監視を意味する場合と、ネットワークトラフィック等のモニタリングのことを意味する場合とがあります。今回の監視は特に後者についてのお話です。大規模なインフラの監視には、やはり特有の課題があります。 どんなツールを使っているのか グリーではサーバの各種リソース使用状況をモニタリングしてグラフ化するためのツールとして、Cacti を利用しています。Cacti は、大変有名なツールなので皆様ご存知かと思いますが、バックエンドの RRDtool で作成したグラフを閲覧するための使いやすいユーザーインターフェイスを備えています。 http://www.cacti.net/ ツールの使

    大規模インフラの監視システム | GREE Engineers' Blog
    masa_matya
    masa_matya 2010/10/08
    cacti使ってる
  • hbstudy#06

    3. 誰?  坂口利樹 ( さかぐちとしき )  twitter : tsakaguchi  Mail : sakaguchi.toshiki@gmail.com  インフラエンジニアエンジニア歴 2 年半 ( しんそつ )  PostgreSQL Confarence 2009 Tokyo/Fall  実行委員 4. インフラエンジニアのお仕事 定例業務 定例業務 非定例業務 設計、アーキテクト ● 管理 ● ● ボトルネックの解析・ログ解析 ● 機器・設定情報の管理 高負荷プロセスの分析 ● リソース管理 ● 運用方法・監視方法の検討・提案 ● バックアップ ● 権限・セキュリティ管理 選定 ● ● ネットワーク・サーバ 監視 ● OS ・アプリケーション ● システム・機器の稼働状況、 iDC ・回線等の選定 リソース状況・ログ出力、改竄検知 ● 負荷テスト ● 障害

    hbstudy#06
  • Linux等でのログのモニタリングで簡単にアラートをキャッチするワンライナー - 元RX-7乗りの適当な日々

    昔、『「ping -a」で音が鳴る!』なエントリでも書いたのですが、何らかをリアルタイムにチェック/監視したい時に、視覚だけではなくアラート音が一緒に出ると、モニタリングしやすいものです。 というわけで、Linuxなんかで、とあるログファイルの出力から、ある文字列が検出された際に、ビープ音を鳴らすワンライナーは以下。 $ tail -f ログファイル | sed -e 's/\(対象文字列\)/\1^G/'上記を実行中に、指定ログファイルに対象文字列が出力されるとビープ(Beep)音が鳴るはず。 「^G」(0x07)の部分が、ASCIIのBELキャラクタのリテラルです。 $ echo -n "^G"などとしてやれば、ベル(ビープ音)が鳴りますよね。 ちなみに、「^G」は、[Ctrl-V] ⇒ [Ctrl-G] の順に入力してやればOK。emacsだと[Ctrl-Q] ⇒ [Ctrl-G]か

    Linux等でのログのモニタリングで簡単にアラートをキャッチするワンライナー - 元RX-7乗りの適当な日々
  • Kernel 2.6 はディスク I/O情報が /proc/diskstat へ移動

    新サーバの設定でパフォーマンス監視のために使っていたMRTG をやめて、より高性能で Web インタフェースで管理もできる Cacti ってのに移行を試みていたのですが、どうにもグラフが真っ白のまま更新されず、諦めて MRTG に戻ることにしました。RRDTool 経由で SNMP の情報を MySQL までデータ格納できていることまでは確認済みなのですが・・・ ※ 誰か教えて!m(_ _)m MRTG も一筋縄ではいかず。設定しているのですが、ディスクI/O 情報が取得できなくなってしまいました。原因を調べると /proc/stat から /proc/diskstats へ情報が移動したようです。 これにあわせて、MRTG で設定しているディスク I/O 取得用のスクリプトも更新しなくてはなりません。 kernel 2.4 までは、こんな感じで上手くいっていると思います。 mrtg.cf

    masa_matya
    masa_matya 2010/08/25
    Disk IO監視は /proc/diskstatを参考に
  • Muninのグラフを動的生成にする - かみぽわーる

    通常だとMuninは5分毎に対象ホストの全てのグラフを生成するんだけど、Debianにはmunin-cgi-graphというCGIが付いていて、オンデマンドに参照してるグラフだけを生成することができる。 やり方はmunin.confに graph_strategy cgiと書くとバッチ処理で生成されるhtmlのグラフのパスがCGIになり、バッチ処理でグラフが生成されないようになる。 あとはapacheを使ってるならhttpd.confに ScriptAlias /cgi-bin/munin-cgi-graph /usr/lib/cgi-bin/munin-cgi-graphと書けば参照時にCGIでグラフが生成されるようになる。 CGIのためだけにapache使いたくない自分のためにCGIをコピペしてPSGI化したのでここに置いておきますね! 参考 CgiHowto - Munin - Tr

    Muninのグラフを動的生成にする - かみぽわーる
  • CloudForecastでmemcachedのコネクション数をモニタリング - blog.nomadscafe.jp

    先週のmixiの大規模な障害は、memcachedに対する接続が非常に多いところから発生したようなので、CloudForecastでその接続数をモニタリングできるようにしてみました。 (mixiではたぶんおそらくmemcachedは専用のサーバとなっているので、通常のTCP Established数がそのんままコネクション数になるはず) グラフは以下のように出力されます 赤いラインが起動時に指定した -c の値。 ところで、このmemcachedの起動オプションを取得する方法は今までないものだと思っていたのですが、memcached 1.4以降なら「stats settings」というコマンドで取得できるようです。 % telnet localhost 11211 Trying ::1... Connected to localhost. Escape character is '^]'.

    masa_matya
    masa_matya 2010/08/16
    memcachedコネクション数の監視。TCP Establishedの数がそのままそれに当たる。
  • net-snmpのC10K問題(後編)

    最強の看板を下ろしたミラーサーバftp.jaist.ac.jpの管理者の一人が、 このサーバにまつわるよしなしごとを語ります。 English versions of some posts on another blog. なぜsnmpdがリクエストに答えないのか突き止めるべく、まずprstat (topみたいなやつ)で様子を見てみたら、snmpdが3%以上のCPU使用率でトップに君臨していました。この使用率は32CPUで計算されているので、当は8コアのUltraSPARC T1にはかなりの重荷です。 いったい何をそんなに忙しくしているのかとtrussで追ってみたら、ひたすらファイル記述子6番からgetmsgでメッセージを読んでいました。このメッセージの読み込みが忙しくてリクエストに答えるひまがないようです。 こんなときはlsofがあると簡単なんですが、インストールしていなかったので

    masa_matya
    masa_matya 2010/08/12
    c10k問題とsnmpd
  • サーバ監視ソフトウェア「ganglia」を使ってみる

    DoRuby! (ドルビー!) はKBMJで働くエンジニアによる、主にRubyに関する様々な実践ノウハウを集めたブログ集です。 こんにちわ、uです。最近、社内で良い監視ツールが無いか色々試しています。先日、その一つとしてgangliaというサーバ監視ソフトウェアを試しに入れてみましたので簡易的ですが、インストールメモを残しときます。 ■導入環境 OS: 64bit Centos 5.1  ■Installation 184 yum -y --enablerepo=rpmforge install rrdtool perl-rrdtool 186 cd /usr/local/src/ 187 rpmbuild --rebuild ganglia-3.0.7-1.src.rpm 188 yum -y --enablerepo=rpmforge install libpng-devel liba

    masa_matya
    masa_matya 2010/07/12
    gangliaの使用感 >、複数台のサーバの特定の値を一度に表示させる時は非常に便利です。ただし、ざっと使ってみた感じでは、先日の記事munin程の詳細な情報は取得できないみたいです。
  • MySQLのスロークエリログを別サーバに転送する - (ひ)メモ

    複数台あるMySQLのスロークエリログを、いちいちDBサーバにログインして読むのがめんどうくさい log_output = FILE,TABLE としてテーブルに入れてリモートからSELECTできるようにするのは? → テーブルに入れた場合、query timeとlock timeの型がTIME型になり精度が秒になってしまうのでダメ ファイルに出力したものをログサーバーにどうにかして飛ばす 10分おきとかにscpする →これでできるのはわかるけど、他にいい方法ないかなぁ syslogで飛ばすのはどうか (id:stanaka++) →srd!! スロークエリログに限らず、追記されるファイル全般に適用できると思います。 rsyslogの方がいけてるそうですが、自分が使ってるのは syslog-ng 2.0.9 なのでそ の設定例です。 DBサーバ # follow_freq(180) で 3

    MySQLのスロークエリログを別サーバに転送する - (ひ)メモ
  • mysqlsnifferでMySQLのプロトコルをキャプチャリング

    MySQLで接続関係の問題、具体的に言うとAborted_clientsやAborted_connectionsというステータス変数が増え続けてしまうような現象に遭遇することがある。MySQLは、そういったネットワーク関係の問題をあまりたくさんログに記録しないようになっている。DoS攻撃などでログが溢れかえってしまわないようにするためだ。そんなとき、試して頂きたいのがmysqlsniffer。 mysqlsnifferとは。http://hackmysql.com/mysqlsniffer mysqlsnifferは、tcpdumpのようにネットワークインターフェイスからパケットをキャプチャするプログラムだが、tcpdumpとはMySQLのプロトコルを理解するという点で異なる。というかMySQLのプロトコル専門のキャプチャプログラムだ。OSのroot権限さえあれば、MySQLサーバーに対し

    mysqlsnifferでMySQLのプロトコルをキャプチャリング
    masa_matya
    masa_matya 2010/04/26
    mysql専用のパケットキャプチャ。Aborted_clientsやAborted_connectionsというステータス変数が出てきたらこちらを使ってみる。
  • Cisco Feature Navigator

  • Nagiosでログ監視!

    ですが、今回はNagiosでのログ監視について見て行きたいと思います。 まずは NagiosExchangeからcheck_logs.plをダウンロードし、インストールします。 (check_logs.plはperlで実行されるため、要perlです。) そして、実行権を付けましょう! これで、ひとまず ログ監視を実行できるようになりました。 さて、実行できたは良いものの ・どのファイルを読むのか ・どのエラーが発生した時に、メールを飛ばすようにするのか 等が設定できていないため、このままでは監視になりません。 ということで、次は「どのファイルを読み」、「どのエラーを拾うか」の設定をしていきます。 まずは、xxx.cfgというログ監視設定ファイルを作成し、/etc/nagios/check_logs/等、適当な場所へ配置します。 以下、設定ファイルの例です。 $seek_file_temp

    masa_matya
    masa_matya 2010/03/09
    seek_file_templateで既にcheckした行数を記録。reg_expで拾うエラーを指定。いらないものは、neg_reg_exp