Mackerel Meetup #8 Tokyo の発表スライドです。
Mackerel Meetup #8 Tokyo の発表スライドです。
Zabbix Advent Calendar 2016の24日目の記事です。 カスタマーサポート課の伊藤です。 サーバーワークスZabbixスペシャリスト 九龍として、今回は 初心にかえってZabbixの基礎をお伝えします。 「どこから設定すれば良いのか分からない」と言った疑問の解決の助けになれば幸いです。 用語集 まずはじめに、Zabbixの中で出てくる用語について解説します。 用語 解説 ホスト 監視対象 アイテム ホストから収集する監視項目、独自エージェントのほか、SNMP,IPMI,SSL,TELNET,ODBC,JMX,WMIによるデータ収集,ポート接続,ICMP応答,の収集が可能、収集済みアイテムに対する四則演算・アイテム同士の演算も可能 アイテムタイプ アイテムの取得方式の種類 ヒストリ アイテムの収集間隔ごとに収集される実データ トレンド ヒストリデータを1時間ごとに集計し
Percona Monitoring Plugins for Zabbixは、テンプレートやZabbixエージェントへのUserParameter追加だけでなく、スクリプトを利用してデータを取得しています。 そのため、以下のような特徴があります。 MySQL(派生含む)データベースの監視用 監視データはZabbixエージェントでスクリプト(シェル及びPHP)を実行して取得 取得したデータはキャッシュファイルに保存され、DB接続や負荷を最小限に抑えている 190以上のアイテムに加えて、トリガー、グラフやスクリーンのテンプレートを設定済み レプリケーションの監視にも対応 Zabbix2.0以降に対応
Home Home Percona Monitoring and Management Percona Monitoring Plugins MySQL Software MongoDB Software PostgreSQL Software Kubernetes Operators Playback Reference Legacy documentation¶ You should upgrade to the most recent version for documentation support. The documentation for product versions that are either outdated or have reached their end-of-life is available in a PDF format. Outdated docum
Zabbixのログ監視にて、規定秒数内に特定文字列が発生した場合 ↓のURLにて、countで確認すれば良い、とあるが いざ実際に試した所、はまってしまった箇所があった為のメモ http://www.zabbix.jp/node/1904 条件 「/var/log/messages」の中で文字列"error"を10分間で5回以上検知した場合にイベント発生 上記URLには以下のように記述されている {Template OS Linux:log[/var/log/messages,,,,skip].count(600,"error")}>4 and {Template OS Linux:log[/var/log/messages,,,,skip].nodata(30)}=0 実際に使っているのは以下 {Template OS Linux:log[/var/log/messages,,,,ski
初めまして今年入社した長谷川です。 新入社員として最初の仕事である、Zabbixサーバの負荷を下げた話を書きたいと思います。 実はこのプロジェクトは、まだ新人研修を行っている入社1ヶ月目の時に、Rubyが得意?という理由でアサインされ、1週間で構築と実装しました。以上自慢です。 構築したシステムは、CloudWatch経由でしか監視ができないRDSやSQSなどのサービスのメトリクス(監視データ)を大量にZabbix取り込む場合の解決方法の一つだと思います。今後同じ問題に直面した方々の参考になれば幸いです。 従来のシステムの状況 従来のシステムは、Zabbixサーバがインストールされている1台のEC2インスタンスが、CloudWatchから値を取得しているだけのシンプルな構成でした。 ZabbixサーバーはCloudWatchから各サービスのメトリクスを取得するRubyスクリプトを実行し、そ
AWS上で監視システムにZabbixを動かしておられる方も多いかと思います。AWSとZabbixは相性が良いので今後も増えていくと予想されます。しかしZabbix単体では冗長構成をとる機能が無い為、Zabbixが停止すると監視も止まります。「ちょっとくらい監視がとまっても業務は止まらないから良い。」と割り切れる場合はOKですが、監視が止まったら困るケースもあります。監視をサービス提供している場合は特にそうなります。じゃあ冗長化しましょうという事になりますが、商用のクラスタソフトはなかなかお高く手が出しづらい状況です。そこでオープンソースのツールを使って冗長化します。 Pacemaker(Heartbeat)で無料でZabbixを冗長化 Linuxでは古くからLinux-HAというプロジェクトがありHeartbeatというツールがあります。HeartbeatV1→V2→V3と進化してミドルウ
障害対応・運用におけるトリアージ的対応とZabbixの活用 Zabbix Conference Japan 2015 発表資料 http://www.zabbix.com/jp/conference_japan_2015.php 日時:2015年11月20日(金) 会場:パレスサイトビル マイナビルーム #zabconfjp2015Read less
Zabbix+Pacemaker+Fluentd+Norikra+Jenkinsで監視、クラスタリング、ログ収集/解析、バックアップ:Elasticsearch+Hadoopベースの大規模検索基盤大解剖(終)(1/2 ページ) リクルートの事例を基に、大規模BtoCサービスに求められる検索基盤はどう構築されるものなのか、どんな技術が採用されているのか、運用はどうなっているのかなどについて解説する連載。最終回は、監視、クラスタリング、ログ収集/解析、バックアップに使っているOSS技術と、その使いどころを紹介する。 連載目次 リクルートの全社検索基盤「Qass」の事例を基に、大規模BtoCサービスに求められる検索基盤はどう構築されるものなのか、どんな技術が採用されているのか、運用はどうなっているのかなどについて解説する本連載。 最終回となる今回は、前回の「AWS+オンプレのハイブリッドクラウド
こんにちは。インフラストラクチャー部の加藤(@EugeneK)です。 今回はWebサービスを運用する上で欠かせない、モニタリングをクックパッドでどうしているかという話をします。 死活監視と性能監視 Webサービスを運用している以上、そのサービスを稼働しているサーバがあり、サーバには故障やトラブルが発生します。 また、どれくらいのパフォーマンスが出ているか、リソースをどのくらい消費しているかなどのトレンドを把握することは、成長するサービスを支えていく上で欠かせません。 故障やトラブルにいち早く気づくための仕組みを死活監視と言います。 また、サーバリソースの時系列での推移を知るために、グラフとしてトレンドを可視化する仕組みを性能監視と言います。 ポーリング監視の限界とZabbixのアクティブ監視 クックパッドでは死活監視にNagios、性能監視にMuninを使用してきましたが、サーバ台数の増加
October 17, 2013 千里眼、どんなメリットがあるのか見えないとのことなので もう少し詳細に書きます。 demo:http://un.kenjiskywalker.org/senrigan/ 動きます。 screen shot こんな感じのZabbixのグラフを取得してきて一覧で表示してくれるものです。 何のために? グラフの一覧を表示するためなら、Zabbixのスクリーンを利用するのが良いですね。 しかし、スクリーンが案件毎やグループ毎に分かれていた場合、 横断的にCPU使用率を確認しようとすると、全てのスクリーンへ アクセスしなければならない。世に云うZabbix画面右上プルダウン地獄です。 案件担当者であれば、特定のスクリーンだけ見ておけば問題ないかもしれませんが システム全域に目を通さなければならない運用者にとって このZabbixプルダウン地獄はそこそこストレスになり
4月から劇団サーバーワークスに加わりました。伊藤です。 社内ではくりゅーと呼ばれております。 AWS環境では、わずか数クリックでサーバーができたり、AutoScalingで自動的にサーバーが増えたり、 オンプレミスの監視運用のスピードでは全く追いつけません。 そこで、今回はAuto Scalingなどで監視対象のインスタンスが自動で増えたり減ったりしても、Zabbixで常に対象インスタンスを自動登録し、監視対象にする方法をご紹介します。 自動構成ツールなどには依存しないので、どんな方法で(マネージメントコンソール、SDK、CLI、API、Elastic Beanstalk等々)構築、運用していても適用できます。 監視対象インスタンスのAgent側設定 zabbix_agentd.confにおいて、以下の点を設定します。 Server=127.0.0.1 #Zabbix-serverのIPも
さらに、EC2インスタンスや仮想マシンへのSSH接続も、Zabbixのダッシュボードから統合して実施できます。何か障害があった場合に、複数のコンソールを立ち上げるのではなく、Zabbixのダッシュボードから直接各環境に接続してオペレーションすることが可能です。 現在HyClopsが対応しているのは、AWSおよびVMwareのみですが、今後、OpenStackやCloudStackなどへの対応も検討しています。 活用例2:より動的に環境構成が変わるシーン AWSのAutoScalingやVMwareのvMotionおよびDRSによるオートスケールなどを有効にしている環境では、システムの負荷状況に応じて自動的に仮想マシンが増減します。 しかし、例えばAWSの場合、Amazon VPC(Virtual Private Cloud)やEIP(Elastic IP Address)を使っている場合は
「ZabbixのAPIを使って運用を楽しくする話」 'Serf orchestration with ZABBIX APIs' Serf the Liberator - 始まりの物語 ---- 1. ZABBIX API 超入門 ・シェルで始める ZABBIX API (言語知識不要) 2. Serf と Zabbix の連携 ・Serf とは? ・API を使えば、こんな事が簡単にできるよ! 3. 仕事は楽しいかね? ・ Serf the Liberator 【叛逆の物語】 ---- 第6回 ZABBIX-JP勉強会 http://atnd.org/events/48954 Masahito Zembutsu Apr 12, 2014 , Osaki Tokyo ZABBIX-JP 6th meetup #zabbix_jp
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く