[B! *監視] masa_matyaのブックマーク

カジュアルに MySQL を監視する方法 | Carpe Diem

このエントリーは、MySQL Casual Advent Calendar 2011 – MySQL Casual の第 19 日目のエントリーです。皆さんこんにちは、n0ts こと、Naoya Nakazawa です。今日は、みなさん日頃からカジュアルに MySQL を運用して、日々生活されていることと思います。MySQL は、非常に安定したオープンソースソフトウェアだと思いますが、どんなものでもときにはおかしくなったりするものです。「備えあれば憂いなし」ということで、僕は日頃から Nagios というオープンソースソフトウェアを利用して、MySQL がおかしくなっていかいか日々カジュアルに監視しています。今日は、カジュアルに MySQL を Nagios を使って監視する方法を紹介したいと思います。なお、今回は CentOS 5.7 x86_64 というカジュアルな Linux

masa_matya 2012/08/17

リンク

ライブドア様ｘKLab合同勉強会システムモニタリングツール「Ganglia」の紹介

1. Copyright © KLab Inc. All rights reserved. KLab 株式会社ライブドア様×KLab 合同勉強会システムモニタリングツール「Ganglia」の紹介第弐開発部横川和哉～なんでもデータを取ってグラフ化しよう！～ 2. Copyright © KLab Inc. All rights reserved. 2  自己紹介目次  Ganglia の特徴  システムモニタリングツールとは  DSAS での利用例  ganglia のおかげで．．．  まとめ

masa_matya 2011/11/08

リンク

Metrics Collection and Display via Graphite | AppNexus Tech Blog

masa_matya 2011/09/24

Graphiteを使ってmetrics収集

リンク

大規模インフラの監視システムその2 | GREE Engineering

こんにちは。グリーのmdoi(@m_doi)です。今回は、グリーの監視システムについて説明したいと思います。以前、こちらの記事にて、リソース監視システムの説明をさせて頂きましたが、死活監視やログ監視については語られなかったので、気になっていた方も多いと思います。ということで、今回は、グリーのインフラにおける死活監視やログ監視、アラート通知システムを紹介したいと思います。何を使っているの？グリーでは、死活監視にNagiosを使用していました。監視システムの中では、かなり有名なソフトウェアですから、監視システムの構築に使用したことがある方も多いのではないでしょうか。プラグインも豊富に存在するので、様々な監視を行うことができます。死活監視は、このNagiosの機能をそのまま利用し、ログ監視は、Nagiosと独自に作成したエージェント及びログフィルタを連携させて行っていました。全体のシステ

masa_matya 2011/01/27

nagiosでは厳しくなったのでAWACSを使っている

リンク

dfltweb1.onamae.com – このドメインはお名前.comで取得されています。

masa_matya 2010/12/31

apacheのLogformatの%Dや、tcpdumpでrequest->responseの時間把握。DBの監視項目。ネットワークレイテンシなど

リンク

簡単サーバー監視ツールを書いてみた - kaeruspoon

#!/usr/local/bin/ruby require 'ping' require 'net/smtp' require 'net/http' unless Ping.pingecho("www.server.com", 3, "80") Net::SMTP.start('mail.server.com', 25) {|s| s.send_mail "Subject:Server Down!!(L3)", 'kanshi-24@mail.server.com', 'oishi@example.com'} end begin Net::HTTP.start("www.server.com") rescue Net::SMTP.start('mail.server.com', 25) {|s| s.send_mail "Subject:Server Down!!(L7)", 'kansh

masa_matya 2010/12/27

リンク

運用におけるエラーログの重要性もしくはLog::Minimalってモジュール書いた話 - blog.nomadscafe.jp

追記 CPANにアップしました http://search.cpan.org/dist/Log-Minimal/ /追記アプリケーションサーバでエラーが起きていたり、レスポンスが遅かったりする場合に、Operation Engineer(インフラエンジニア)がまず見るのは、エラーログです。エラーログにでているメッセージを手がかりに原因を探ります。サーバでエラーが起きている時には、データベースに接続ができなかったり、外部のAPIからレスポンスが得られない、またプログラムのBugが原因となっている場合もあるでしょう。またエラーにならなくても、複数台あるデータベースのスレーブサーバうち一台が落ちて接続をretryしていたり、APIのレスポンスが遅い際にはサーバ全体のパフォーマンスが低下します。エラーログに障害の原因を探る情報があれば、Operation Engineerは素早く対応を開始で

masa_matya 2010/10/21

リンク

ソーシャルアプリ向けシステム監視運用の勘所

Tatsuro Hisamori from DeNA Co., Ltd. discusses mbga OpenPlatform and summarizes techniques for optimizing database and application performance including using tcpdump, Wireshark, and mk-query-digest to analyze SQL queries and network traffic. He also provides examples of optimizing resources and response times by distributing applications across virtual machines and monitoring CPU usage, database

masa_matya 2010/10/18

リンク

大規模インフラの監視システム | GREE Engineers' Blog

こんにちは。インフラチームの ebisawa です。今回はグリーのインフラにおける各種機器の監視がどのように行われているのかご紹介させていただきたいと思います。一般にサーバの監視というと、システムダウンを検出するための死活監視を意味する場合と、ネットワークトラフィック等のモニタリングのことを意味する場合とがあります。今回の監視は特に後者についてのお話です。大規模なインフラの監視には、やはり特有の課題があります。どんなツールを使っているのかグリーではサーバの各種リソース使用状況をモニタリングしてグラフ化するためのツールとして、Cacti を利用しています。Cacti は、大変有名なツールなので皆様ご存知かと思いますが、バックエンドの RRDtool で作成したグラフを閲覧するための使いやすいユーザーインターフェイスを備えています。 http://www.cacti.net/ ツールの使

masa_matya 2010/10/08

cacti使ってる

*監視
gree

リンク

hbstudy#06

3. 誰？  坂口利樹 ( さかぐちとしき )  twitter ： tsakaguchi  Mail ： sakaguchi.toshiki@gmail.com  インフラエンジニア  エンジニア歴 2 年半 ( しんそつ )  PostgreSQL Confarence 2009 Tokyo/Fall 実行委員 4. インフラエンジニアのお仕事定例業務定例業務非定例業務設計、アーキテクト ● 管理 ● ● ボトルネックの解析・ログ解析 ● 機器・設定情報の管理高負荷プロセスの分析 ● リソース管理 ● 運用方法・監視方法の検討・提案 ● バックアップ ● 権限・セキュリティ管理選定 ● ● ネットワーク・サーバ監視 ● OS ・アプリケーション ● システム・機器の稼働状況、 iDC ・回線等の選定リソース状況・ログ出力、改竄検知 ● 負荷テスト ● 障害

masa_matya 2010/09/03

リンク

Linux等でのログのモニタリングで簡単にアラートをキャッチするワンライナー - 元RX-7乗りの適当な日々

昔、『「ping -a」で音が鳴る！』なエントリでも書いたのですが、何らかをリアルタイムにチェック/監視したい時に、視覚だけではなくアラート音が一緒に出ると、モニタリングしやすいものです。というわけで、Linuxなんかで、とあるログファイルの出力から、ある文字列が検出された際に、ビープ音を鳴らすワンライナーは以下。 $ tail -f ログファイル | sed -e 's/$対象文字列$/\1^G/'上記を実行中に、指定ログファイルに対象文字列が出力されるとビープ(Beep)音が鳴るはず。「^G」(0x07)の部分が、ASCIIのBELキャラクタのリテラルです。 $ echo -n "^G"などとしてやれば、ベル(ビープ音)が鳴りますよね。ちなみに、「^G」は、[Ctrl-V] ⇒ [Ctrl-G] の順に入力してやればOK。emacsだと[Ctrl-Q] ⇒ [Ctrl-G]か

masa_matya 2010/08/28

素敵

リンク

Kernel 2.6 はディスク I/O情報が /proc/diskstat へ移動

新サーバの設定でパフォーマンス監視のために使っていたMRTG をやめて、より高性能で Web インタフェースで管理もできる Cacti ってのに移行を試みていたのですが、どうにもグラフが真っ白のまま更新されず、諦めて MRTG に戻ることにしました。RRDTool 経由で SNMP の情報を MySQL までデータ格納できていることまでは確認済みなのですが・・・ ※　誰か教えて！m(_ _)m MRTG も一筋縄ではいかず。設定しているのですが、ディスクI/O 情報が取得できなくなってしまいました。原因を調べると /proc/stat から /proc/diskstats へ情報が移動したようです。これにあわせて、MRTG で設定しているディスク I/O 取得用のスクリプトも更新しなくてはなりません。 kernel 2.4 までは、こんな感じで上手くいっていると思います。 mrtg.cf

masa_matya 2010/08/25

Disk IO監視は /proc/diskstatを参考に

リンク

Muninのグラフを動的生成にする - かみぽわーる

通常だとMuninは5分毎に対象ホストの全てのグラフを生成するんだけど、Debianにはmunin-cgi-graphというCGIが付いていて、オンデマンドに参照してるグラフだけを生成することができる。やり方はmunin.confに graph_strategy cgiと書くとバッチ処理で生成されるhtmlのグラフのパスがCGIになり、バッチ処理でグラフが生成されないようになる。あとはapacheを使ってるならhttpd.confに ScriptAlias /cgi-bin/munin-cgi-graph /usr/lib/cgi-bin/munin-cgi-graphと書けば参照時にCGIでグラフが生成されるようになる。 CGIのためだけにapache使いたくない自分のためにCGIをコピペしてPSGI化したのでここに置いておきますね！参考 CgiHowto - Munin - Tr

masa_matya 2010/08/17

リンク

CloudForecastでmemcachedのコネクション数をモニタリング - blog.nomadscafe.jp

先週のmixiの大規模な障害は、memcachedに対する接続が非常に多いところから発生したようなので、CloudForecastでその接続数をモニタリングできるようにしてみました。（mixiではたぶんおそらくmemcachedは専用のサーバとなっているので、通常のTCP Established数がそのんままコネクション数になるはず）グラフは以下のように出力されます赤いラインが起動時に指定した -c の値。ところで、このmemcachedの起動オプションを取得する方法は今までないものだと思っていたのですが、memcached 1.4以降なら「stats settings」というコマンドで取得できるようです。 % telnet localhost 11211 Trying ::1... Connected to localhost. Escape character is '^]'.

masa_matya 2010/08/16

memcachedコネクション数の監視。TCP Establishedの数がそのままそれに当たる。

*監視

リンク

net-snmpのC10K問題(後編)

日本最強の看板を下ろしたミラーサーバftp.jaist.ac.jpの管理者の一人が、このサーバにまつわるよしなしごとを語ります。 English versions of some posts on another blog. なぜsnmpdがリクエストに答えないのか突き止めるべく、まずprstat (topみたいなやつ)で様子を見てみたら、snmpdが3%以上のCPU使用率でトップに君臨していました。この使用率は32CPUで計算されているので、本当は8コアのUltraSPARC T1にはかなりの重荷です。いったい何をそんなに忙しくしているのかとtrussで追ってみたら、ひたすらファイル記述子6番からgetmsgでメッセージを読んでいました。このメッセージの読み込みが忙しくてリクエストに答えるひまがないようです。こんなときはlsofがあると簡単なんですが、インストールしていなかったので

masa_matya 2010/08/12

c10k問題とsnmpd

*監視

リンク

サーバ監視ソフトウェア「ganglia」を使ってみる

DoRuby! (ドルビー!) はKBMJで働くエンジニアによる、主にRubyに関する様々な実践ノウハウを集めたブログ集です。こんにちわ、uです。最近、社内で良い監視ツールが無いか色々試しています。先日、その一つとしてgangliaというサーバ監視ソフトウェアを試しに入れてみましたので簡易的ですが、インストールメモを残しときます。 ■導入環境 OS: 64bit Centos 5.1 ■Installation 184 yum -y --enablerepo=rpmforge install rrdtool perl-rrdtool 186 cd /usr/local/src/ 187 rpm build --rebuild ganglia-3.0.7-1.src.rpm 188 yum -y --enablerepo=rpmforge install libpng-devel liba

masa_matya 2010/07/12

gangliaの使用感 >、複数台のサーバの特定の値を一度に表示させる時は非常に便利です。ただし、ざっと使ってみた感じでは、先日の記事munin程の詳細な情報は取得できないみたいです。

リンク

MySQLのスロークエリログを別サーバに転送する - （ひ）メモ

複数台あるMySQLのスロークエリログを、いちいちDBサーバにログインして読むのがめんどうくさい log_output = FILE,TABLE としてテーブルに入れてリモートからSELECTできるようにするのは？ → テーブルに入れた場合、query timeとlock timeの型がTIME型になり精度が秒になってしまうのでダメファイルに出力したものをログサーバーにどうにかして飛ばす 10分おきとかにscpする →これでできるのはわかるけど、他にいい方法ないかなぁ syslogで飛ばすのはどうか (id:stanaka++) →srd!! スロークエリログに限らず、追記されるファイル全般に適用できると思います。 rsyslogの方がいけてるそうですが、自分が使ってるのは syslog-ng 2.0.9 なのでその設定例です。 DBサーバ # follow_freq(180) で 3

masa_matya 2010/05/20

リンク

mysqlsnifferでMySQLのプロトコルをキャプチャリング

MySQLで接続関係の問題、具体的に言うとAborted_clientsやAborted_connectionsというステータス変数が増え続けてしまうような現象に遭遇することがある。MySQLは、そういったネットワーク関係の問題をあまりたくさんログに記録しないようになっている。DoS攻撃などでログが溢れかえってしまわないようにするためだ。そんなとき、試して頂きたいのがmysqlsniffer。 mysqlsnifferとは。http://hackmysql.com/mysqlsniffer mysqlsnifferは、tcpdumpのようにネットワークインターフェイスからパケットをキャプチャするプログラムだが、tcpdumpとはMySQLのプロトコルを理解するという点で異なる。というかMySQLのプロトコル専門のキャプチャプログラムだ。OSのroot権限さえあれば、MySQLサーバーに対し

masa_matya 2010/04/26

mysql専用のパケットキャプチャ。Aborted_clientsやAborted_connectionsというステータス変数が出てきたらこちらを使ってみる。

リンク

Cisco Feature Navigator

masa_matya 2010/03/26

リンク

Nagiosでログ監視！

ですが、今回はNagiosでのログ監視について見て行きたいと思います。まずは NagiosExchangeからcheck_logs.plをダウンロードし、インストールします。（check_logs.plはperlで実行されるため、要perlです。）そして、実行権を付けましょう！これで、ひとまずログ監視を実行できるようになりました。さて、実行できたは良いものの・どのファイルを読むのか・どのエラーが発生した時に、メールを飛ばすようにするのか等が設定できていないため、このままでは監視になりません。ということで、次は「どのファイルを読み」、「どのエラーを拾うか」の設定をしていきます。まずは、xxx.cfgというログ監視設定ファイルを作成し、/etc/nagios/check_logs/等、適当な場所へ配置します。以下、設定ファイルの例です。 $seek_file_temp

masa_matya 2010/03/09

seek_file_templateで既にcheckした行数を記録。reg_expで拾うエラーを指定。いらないものは、neg_reg_exp

リンク

はてなブックマーク

タグ

関連タグで絞り込む (36)

*監視に関するmasa_matyaのブックマーク (86)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス