タグ

Prometheusに関するwate_wateのブックマーク (13)

  • Prometheusで本番環境の監視をして3か月経ちました - WILLGATE TECH BLOG

    番環境の監視をZABBIXからPrometheusに切り替えてから3か月程度経過しました。 今回は Prometheus 導入に関してハマったところ 現在のPrometheus活用状況 といった所を紹介したいと思います。 「Prometheusって何?」という方はこちらをご覧ください。 tech.willgate.co.jp Prometheus導入でハマったところ メール送信設定 Rプロキシ経由にする 現在のPrometheus活用状況 現在の構成 ECインスタンスの監視 設定のバージョン管理 種類豊富なexporter 柔軟なPromQL Grafanaとの組み合わせ まとめ その後の取り組み(2019/11/12 追記) Prometheus導入でハマったところ 紹介するところ以外でも色んなところでハマったのですが、代表的なところを紹介します。 メール送信設定 Alertmanag

    Prometheusで本番環境の監視をして3か月経ちました - WILLGATE TECH BLOG
  • 入門 Prometheus / Introduction to Prometheus

    Prometheus Tokyo Meetup #2 - 2019/6/3

    入門 Prometheus / Introduction to Prometheus
  • 【運用監視ツール比較】ZABBIXからPrometheusへの移行を開始しました - WILLGATE TECH BLOG

    概要 運用監視ツールの比較検討をして、ZABBIXからPrometheusへ移行することにしました。 その経緯を書きます。 現状 弊社ではAWSやさくらのクラウド、ConoHaのクラウドなど様々なIaaS/VPSを使って暮らしニスタやMillyなどのサービスを展開しています。 監視対象VM数は170台程度です。 抱えていた課題 重い 監視対象が増えるにつれて重くなってきて、素早く情報を見たい時にストレスになっていました。 ZABBIXのDBMySQLを使っていましたがパラメータチューニングが必要で、運用に手間がかかっていました。 サポート切れ ZABBIXサーバのバージョンが2.2で、サポート期限の終了が2019年8月と近づいてきていました。 (詳細は公式情報をご覧になってください) スクリーン作成の難しさ ZABBIXはグラフをまとめたものをスクリーンと呼んでいるのですが、スクリーン作

    【運用監視ツール比較】ZABBIXからPrometheusへの移行を開始しました - WILLGATE TECH BLOG
  • Micrometer/Prometheusによる大規模システムモニタリング #jsug #sf_26

    「Spring Fest 2018」で発表した資料です。 http://springfest2018.springframework.jp/ Read less

    Micrometer/Prometheusによる大規模システムモニタリング #jsug #sf_26
  • GrafanaとPrometheusとTwilioを使ってサーバー監視システムを構築する - オウチーノ開発者ブログ

    オウチーノのSREチームの尾形です。 今回はオウチーノのサーバー監視の仕組みについてご紹介したいと思います。 経営方針が変わる前のオウチーノのサーバー監視は全て外部会社にお願いしていまして、その時は個別の依頼ベースで監視対象を追加・削除してもらっていました。自分達で管理していない状態なので、監視項目に漏れがあったり柔軟な設定が出来ない、Opsへの認識が薄くなるなどの問題がありました。そこで自分達のシステムは自分達で面倒を見ようということで去年から監視をする仕組みを構築し始めました。外部会社ではZabbixを利用していたので、その設定をそのまま頂くことも出来たのですが秘伝のタレを頂いても管理が出来ないということでゼロから構築することを決めました。 SREチーム以外にも見てもらえるグラフを表示出来るツールということでGrafana+Prometheusで構築しました。オウチーノではAWSを利用

    GrafanaとPrometheusとTwilioを使ってサーバー監視システムを構築する - オウチーノ開発者ブログ
  • Prometheusでのさまざまな監視データ取得法 | さくらのナレッジ

    Prometheusでは、Prometheus Serverが監視対象にアクセスしてデータを収集するアーキテクチャを採用している。このデータ収集のためのアクセス先(エンドポイント)は「exporter」と呼ばれており、さまざまなソフトウェアやハードウェア向けのものが提供されている。今回はこのexporterについて、独自のデータ取得方法なども含めて紹介する。 公式exporterとサードパーティによるexporter Prometheusのアーキテクチャは前々回の記事で詳しく紹介しているが、Prometheus Serverが監視対象にアクセスしてデータを収集するような構成(Pull型アーキテクチャ)となっている(図1)。このようなアーキテクチャにおいては、監視対象ごとにPrometheus Serverにデータを渡すためのexporterを用意する必要がある。 図1 Prometheus

    Prometheusでのさまざまな監視データ取得法 | さくらのナレッジ
  • PrometheusとGrafanaを組み合わせて監視用ダッシュボードを作る | さくらのナレッジ

    Prometheusには簡易的なグラフ作成機能が用意されているが、これには必要最低限の機能しか実装されていない。そこでおすすめしたいのが監視用コンソールを提供するソフトウェア「Grafana」だ。以下ではPrometheusとGrafanaを組み合わせて利用する流れを紹介する。 多機能な監視画面を作成できるGrafanaとの連携 Prometheus Serverには、取得したデータをグラフ化して表示する機能が用意されている。クエリ機能や関数を駆使することでさまざまなデータを表示できるものの、この機能では基的には折れ線グラフでの表示のみしか行えない。また、複数のグラフを同時に表示することはできるが、異なるデータを1つのグラフにまとめたり、グラフの体裁を調整する機能についてはあまり十分ではなく、一覧性や見やすさにはやや欠ける。そこでPrometheusと併用したいのが、高度なグラフ表示を実

    PrometheusとGrafanaを組み合わせて監視用ダッシュボードを作る | さくらのナレッジ
  • prometheus/alertmanagerのwebhook_configsでアラート起きたらJIRAチケットを作る - Qiita

    はじめに アラートが鳴るならそれをトリガーに自動的に何かしたい。 アラートをJIRAでチケット管理したり 詳細情報をさらに取得してslackなどへの通知をリッチにしたり Auto Healのための何かスクリプトなど叩いたり なので「アラートをJIRAでチケット管理したい」をalertmanagerのwebhook_configsを使ってやってみた。 alertmanagerのwebhook_configsとは? configurationのwebhook_configに公式説明があるが、任意のwebhook接続先へアラート情報を送信できるものです。(実際にはwebhook_configsだが公式だとsがない...) 送られるアラート情報例としては以下のようなJSONがalertmangerからwebhook_configで指定した接続先にPOSTされる。 { "receiver": "we

    prometheus/alertmanagerのwebhook_configsでアラート起きたらJIRAチケットを作る - Qiita
  • prometheusとgrafanaを入れたみたが、どうグラフとか出すといいのか? - Qiita

    はじめに prometheusでこんなmetricsとって、grafanaでこんなquery指定すると、こう見えるよの紹介。 始めたばかりで環境準備できたはいいが、ぱぱっとそれっぽいグラフとか出したい人向け。 とりまサーバの状態がいろいろ見えるダッシュボードができるまでの説明を詳しめにします。 notes 環境前提にとりま以下入ってること (今回はubuntu on EC2 1つにごちゃ入れした) prometheus 1.8.2(2.0でないが同様かと) First steps Getting started grafana 4.6.2、prometheusをdata source登録済み Installing Grafana Creating a Prometheus data source node_exporter 0.15.1 (↑のFirst stepsに手順あり) サーバの状

    prometheusとgrafanaを入れたみたが、どうグラフとか出すといいのか? - Qiita
  • SNMP Exporter の generatorを使う - Qiita

    Prometheus Advent Calendar 2017 2日目 の記事です。 SNMP Exporterで何かというネタです。 SNMP Exporterとは Prometheusを利用して、SNMPで得られる情報をモニタリングしようというときに利用するExporterです。 既存のSNMPマネージャからPrometheusに移行したいと言うときに利用します。 機能は単純で、リクエストが来ると、SNMPを利用して情報を集め、表示するだけのものです。 SNMP Exporterの設定 SNMP Exporterの設定は、 SNMPを利用して何を(どうやって)収集するのか?という1点です。 SNMP Exporterでは、モジュールという単位で何を収集するのかを設定します。 設定ファイルには、多数のモジュールが並列して記載されています。 下記に例をあげます if_mibというモジュール

    SNMP Exporter の generatorを使う - Qiita
  • Prometheus 実践入門 #hbstudy 79 / introduction-to-prometheus-practice

    #hbstudy 79 で Prometheus の話をしました

    Prometheus 実践入門 #hbstudy 79 / introduction-to-prometheus-practice
  • Prometheusのクエリ機能とアラート機能 | さくらのナレッジ

    演算子とクエリ関数を組み合わせた複雑な統計処理を実行することも可能だ。たとえば次のクエリは、1分単位でのCPUのidle率を表示するものとなっている(図10)。 sum(delta(node_cpu{mode="idle"}[1m])) / sum(delta(node_cpu[1m])) 図10 CPUのidle率を表示した例 ここでは、指定した時間でのデータの変化量を返す「delta()」関数を使い、まず「delte(node_cpu{mode="idle"}[1m])」で各CPUのidle時間の1分間での変化量を取得し、sum()関数でそれを合計したものを、各CPUの各時間の1分間での変化量の合計(「sum(delta(node_cpu[1m]))」)で割ることでidle時間の割合を求めている。 取得したデータの値をそのまま見たい場合、「Graph」タブではなく「Console」タブ

  • インフラ・サービス監視ツールの新顔「Prometheus」入門 | さくらのナレッジ

    サーバーやインフラなどの監視ツールの1つとして最近注目されているのが「Prometheus」だ。Prometheusはインストールや設定が容易で、かつ十分な機能を持ち管理しやすいという特徴を持つ。記事ではこのPrometheusの導入方法、基的な監視設定の流れを紹介する。 クラウド時代の監視管理ツール ネットサービスを運営する場合、そのサービスを運営するソフトウェアやサーバー、ネットワーク機器などの状況を監視する手段を用意するのが一般的だ。監視を行い、意図しない状況になったら自動的にメールなどで通知を行うシステムを構築することで、問題をいち早く解決できるようになる。さらに、サービスやマシンの稼働ログを適切に記録することで潜在的な問題を事前に見つけたり、最適化に向けた分析を行うといったことも可能になる。 監視や問題発覚時の通知などを行うオープンソースのツールとしては、過去にElastic

  • 1