「システム運用担当者は,活躍する場が無いことが活躍しているってことなんだよ」 昔,システム運用経験の長い先輩によく言われたものである。システム運用担当というと,システムに障害が発生した瞬間に急に元気になり,徹夜もいとわず対処に没頭する技術者たちというイメージがある。だが,本来システム運用担当の業務とは,システムに故障などが発生してもサービスの停止などが発生することの無いように,障害対策を練ったり日々のメンテナンスを行なったりすることにある。先輩の言葉は,どんな障害が発生しても,あらかじめ用意されている対応手順に従って淡々と対応できるよう,日々の準備を怠ってはいけない,ということを意味しているのである。 これから書く内容は,運用担当チームがシステムの監視に使用しているメール・サーバーで発生した障害とその対応の話である。筆者が障害対応担当者として直接かかわったものだ。対応の経過とともに,発生し
障害発生に対して安心感を持っていただくために、サーバ監視を標準でご提供します。 また障害発生時には監視アラームに応じて一次対応を実施するサービスも標準でご提供します。 主な監視項目は次の通りです。
さて、今日も先日に引き続き、muninの設定を行います。 今日設定する項目は以下の通りです。 sensors_fan のアラートを消す ping プラグインの追加 複数のグラフを1つにまとめる sensors_fan のアラートを消す sensors プラグインは、珍しいことに、各計測値に warn値 や crit値が設定されています。そのため、問題のある値が出ていたら、HTML表示の一部が赤字になるなどして、目を引く警告表示を行なってくれます。 ところが、私のLinux箱では、ファンコンでファンを止めていたりするので、この警告表示は余計です。 この警告の基準となる warn 値や crit 値は、sensors コマンドが表示する、ファンの最低回転数を元に設定されていますので、lm_sensors の方を調整します。 (最初に設定した時のエントリはこちら) diff -u -r1.2 /
munin いじってると、たまに動かなくなったり、プラグイン追加したかったのに、なんかできなかったり、いろいろ予想外の事態にはまることがあったりします... まあ、munin とっても便利なんですが... で、いろいろ調べてみると munin-node-configure なんてものあったんですね。 これが、かなり便利そうなツールなのでメモ。 まずは、--suggest プラグインが動かない、どのプラグインが使えるのかわからない、とか言った時は、これを実行すれば解決するかも。 手動ですでにプラグインをロードさせた状態 (/etc/munin/plugins に symlink がある状態) だとだめなので、一度消しましょう。 # munin-node-configure -suggest Plugin | Used | Suggestions ------ | ---- | -----
統合監視ツールにもオープンソース採用を、4社が推進協議会 各社はそれぞれ、オープンソースの統合監視ツールを開発、提供している。NTTデータは、システム管理/ジョブ管理機能を備える「Hinemos」、サン・マイクロシステムズは、オープンソースのデータベース「MySQL」の監視を行う「MySQL Enterprise Monitor」、富士通SSLは、「Nagios」をベースとしたサーバやネットワークの監視ソフトウェア「GroundWork Monitor」を、ミラクル・リナックスはSNMPなどに対応した統合監視ソフトウェア「ZABBIX」を提供している。 * 赤字部分は明らかな誤りであるため、修正しました。 ○penViewが高すぎるのとか○ps Managerの使い勝手が悪すぎるのに業を煮やしただけのように思えます。 ところで、GroupWork MonitorはNagiosベースの監
このドメインは お名前.com から取得されました。 お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 日本のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年5月時点の調査。
SF.JP Magazineで「Webインタフェースでマシンを監視する4つの方法」という記事が掲載されています。Webインタフェースを持つ4つのサーバ監視ツール(collectd、Cacti、Monitorix、Munin)の特徴をそれぞれ解説した記事で、筆者は記事の末尾で以下のように述べています。 データをじっくりと分析する場合や、管理者以外のユーザからもシステムの統計情報を参照できるようにする場合は、最初にCactiをあたるのがよさそうだ。すでに十分な負荷がかかっているシステムで情報収集を行うなら、システムに与える影響の小さいcollectdを試せばよい。また、多数のノードで個別のアプリケーションパッケージを使って情報を集めるMuninは、同じようなマシンで構成される小規模なグループの監視に向いており、1台しかないサーバの状態を手っとり早く把握したければ、とりあえずCactiかMoni
インターネットで公開されているサーバーやネットワーク機器を24時間無料監視するサービスです。 より安定した監視を行うため、監視回線二重化&監視サーバー二重化を行っています。 2021/08/31 NEW 弊社を偽装したメールが確認されております。メールの送信元やメールに記載されているURLを十分にご確認ください。 弊社からログインを促すメールを送信することはございません。 無料サーバー監視/ネットワーク監視サービス ご案内 インターネット経由でご登録のサーバやネットワーク機器を死活監視するサービスです。 監視間隔は5分毎となり、監視品質を高めるため2つのキャリア回線で交互に監視しています。 サービス概要 インターネットに接続されているサーバやネットワーク機器の死活チェックを無料(Free)で行うサービスです。 当サイトでご登録いただく必要はございますが、ソフトウエアのインストールを行う必要
「DATAHOTEL PATROL」サービスからのアラートメール誤配信のお知らせ(2019年4月3日) 2019.04.03 平素は大変お世話になっております。 掲題の通り、既にサービス提供を終了しております、「DATAHOTEL PATROL」 サービスにおきまして、3月30日から31日にかけて、以前ご利用のお客様のメールアドレス に対してアラートメールが誤って配信されました。 メールを受信された皆様には、ご迷惑お掛けしまして、大変申し訳ありませんでした。 本事象の原因は、サーバ撤去時の誤作動により、誤って監視が再開され、アラートメールが 配信されたことによるものでございます。 該当サーバは既に撤去及びデータ消去を実施済みのため、メールは配信されないよう 対応させて頂いております。 お客様におかれましてはご不便をお掛けいたしましたことをお詫び申し上げます。 今後とも弊社をご愛顧くださいま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く