[B! Prometheus] wate_wateのブックマーク

Prometheusで本番環境の監視をして3か月経ちました - WILLGATE TECH BLOG

本番環境の監視をZABBIXからPrometheusに切り替えてから3か月程度経過しました。今回は Prometheus 導入に関してハマったところ現在のPrometheus活用状況といった所を紹介したいと思います。「Prometheusって何？」という方はこちらをご覧ください。 tech.willgate.co.jp Prometheus導入でハマったところメール送信設定 Rプロキシ経由にする現在のPrometheus活用状況現在の構成 ECインスタンスの監視設定のバージョン管理種類豊富なexporter 柔軟なPromQL Grafanaとの組み合わせまとめその後の取り組み（2019/11/12 追記） Prometheus導入でハマったところ紹介するところ以外でも色んなところでハマったのですが、代表的なところを紹介します。メール送信設定 Alertmanag

wate_wate 2019/07/13

Prometheus

リンク

入門 Prometheus / Introduction to Prometheus

Prometheus Tokyo Meetup #2 - 2019/6/3

wate_wate 2019/06/04

Prometheus

リンク

【運用監視ツール比較】ZABBIXからPrometheusへの移行を開始しました - WILLGATE TECH BLOG

概要運用監視ツールの比較検討をして、ZABBIXからPrometheusへ移行することにしました。その経緯を書きます。現状弊社ではAWSやさくらのクラウド、ConoHaのクラウドなど様々なIaaS/VPSを使って暮らしニスタやMillyなどのサービスを展開しています。監視対象VM数は170台程度です。抱えていた課題重い監視対象が増えるにつれて重くなってきて、素早く情報を見たい時にストレスになっていました。 ZABBIXのDBはMySQLを使っていましたがパラメータチューニングが必要で、運用に手間がかかっていました。サポート切れ ZABBIXサーバのバージョンが2.2で、サポート期限の終了が2019年8月と近づいてきていました。（詳細は公式情報をご覧になってください）スクリーン作成の難しさ ZABBIXはグラフをまとめたものをスクリーンと呼んでいるのですが、スクリーン作

wate_wate 2019/03/26

リンク

Micrometer/Prometheusによる大規模システムモニタリング #jsug #sf_26

「Spring Fest 2018」で発表した資料です。 http://springfest2018.springframework.jp/

wate_wate 2018/11/18

Prometheus

リンク

GrafanaとPrometheusとTwilioを使ってサーバー監視システムを構築する - オウチーノ開発者ブログ

オウチーノのSREチームの尾形です。今回はオウチーノのサーバー監視の仕組みについてご紹介したいと思います。経営方針が変わる前のオウチーノのサーバー監視は全て外部会社にお願いしていまして、その時は個別の依頼ベースで監視対象を追加・削除してもらっていました。自分達で管理していない状態なので、監視項目に漏れがあったり柔軟な設定が出来ない、Opsへの認識が薄くなるなどの問題がありました。そこで自分達のシステムは自分達で面倒を見ようということで去年から監視をする仕組みを構築し始めました。外部会社ではZabbixを利用していたので、その設定をそのまま頂くことも出来たのですが秘伝のタレを頂いても管理が出来ないということでゼロから構築することを決めました。 SREチーム以外にも見てもらえるグラフを表示出来るツールということでGrafana+Prometheusで構築しました。オウチーノではAWSを利用

wate_wate 2018/09/28

リンク

Prometheusでのさまざまな監視データ取得法 | さくらのナレッジ

Prometheusでは、Prometheus Serverが監視対象にアクセスしてデータを収集するアーキテクチャを採用している。このデータ収集のためのアクセス先（エンドポイント）は「exporter」と呼ばれており、さまざまなソフトウェアやハードウェア向けのものが提供されている。今回はこのexporterについて、独自のデータ取得方法なども含めて紹介する。公式exporterとサードパーティによるexporter Prometheusのアーキテクチャは前々回の記事で詳しく紹介しているが、Prometheus Serverが監視対象にアクセスしてデータを収集するような構成（Pull型アーキテクチャ）となっている（図1）。このようなアーキテクチャにおいては、監視対象ごとにPrometheus Serverにデータを渡すためのexporterを用意する必要がある。図1 Prometheus

wate_wate 2017/12/27

Prometheus

リンク

PrometheusとGrafanaを組み合わせて監視用ダッシュボードを作る | さくらのナレッジ

Prometheusには簡易的なグラフ作成機能が用意されているが、これには必要最低限の機能しか実装されていない。そこでおすすめしたいのが監視用コンソールを提供するソフトウェア「Grafana」だ。以下ではPrometheusとGrafanaを組み合わせて利用する流れを紹介する。多機能な監視画面を作成できるGrafanaとの連携 Prometheus Serverには、取得したデータをグラフ化して表示する機能が用意されている。クエリ機能や関数を駆使することでさまざまなデータを表示できるものの、この機能では基本的には折れ線グラフでの表示のみしか行えない。また、複数のグラフを同時に表示することはできるが、異なるデータを1つのグラフにまとめたり、グラフの体裁を調整する機能についてはあまり十分ではなく、一覧性や見やすさにはやや欠ける。そこでPrometheusと併用したいのが、高度なグラフ表示を実

wate_wate 2017/12/27

リンク

prometheus/alertmanagerのwebhook_configsでアラート起きたらJIRAチケットを作る - Qiita

はじめにアラートが鳴るならそれをトリガーに自動的に何かしたい。アラートをJIRAでチケット管理したり詳細情報をさらに取得してslackなどへの通知をリッチにしたり Auto Healのための何かスクリプトなど叩いたりなので「アラートをJIRAでチケット管理したい」をalertmanagerのwebhook_configsを使ってやってみた。 alertmanagerのwebhook_configsとは? configurationのwebhook_configに公式説明があるが、任意のwebhook接続先へアラート情報を送信できるものです。(実際にはwebhook_configsだが公式だとsがない...) 送られるアラート情報例としては以下のようなJSONがalertmangerからwebhook_configで指定した接続先にPOSTされる。 { "receiver": "we

wate_wate 2017/12/11

Prometheus

リンク

prometheusとgrafanaを入れたみたが、どうグラフとか出すといいのか? - Qiita

はじめに prometheusでこんなmetricsとって、grafanaでこんなquery指定すると、こう見えるよの紹介。始めたばかりで環境準備できたはいいが、ぱぱっとそれっぽいグラフとか出したい人向け。とりまサーバの状態がいろいろ見えるダッシュボードができるまでの説明を詳しめにします。 notes 環境前提にとりま以下入ってること (今回はubuntu on EC2 1つにごちゃ入れした) prometheus 1.8.2(2.0でないが同様かと) First steps Getting started grafana 4.6.2、prometheusをdata source登録済み Installing Grafana Creating a Prometheus data source node_exporter 0.15.1 (↑のFirst stepsに手順あり) サーバの状

wate_wate 2017/12/05

リンク

SNMP Exporter の generatorを使う - Qiita

Prometheus Advent Calendar 2017 2日目の記事です。 SNMP Exporterで何かというネタです。 SNMP Exporterとは Prometheusを利用して、SNMPで得られる情報をモニタリングしようというときに利用するExporterです。既存のSNMPマネージャからPrometheusに移行したいと言うときに利用します。機能は単純で、リクエストが来ると、SNMPを利用して情報を集め、表示するだけのものです。 SNMP Exporterの設定 SNMP Exporterの設定は、 SNMPを利用して何を(どうやって)収集するのか？という１点です。 SNMP Exporterでは、モジュールという単位で何を収集するのかを設定します。設定ファイルには、多数のモジュールが並列して記載されています。下記に例をあげます if_mibというモジュール

wate_wate 2017/12/02

Prometheus

リンク

Prometheus 実践入門 #hbstudy 79 / introduction-to-prometheus-practice

#hbstudy 79 で Prometheus の話をしました

wate_wate 2017/11/21

Prometheus

リンク

Prometheusのクエリ機能とアラート機能 | さくらのナレッジ

演算子とクエリ関数を組み合わせた複雑な統計処理を実行することも可能だ。たとえば次のクエリは、1分単位でのCPUのidle率を表示するものとなっている（図10）。 sum(delta(node_cpu{mode="idle"}[1m])) / sum(delta(node_cpu[1m])) 図10 CPUのidle率を表示した例ここでは、指定した時間でのデータの変化量を返す「delta()」関数を使い、まず「delte(node_cpu{mode="idle"}[1m]）」で各CPUのidle時間の1分間での変化量を取得し、sum()関数でそれを合計したものを、各CPUの各時間の1分間での変化量の合計（「sum(delta(node_cpu[1m]))」）で割ることでidle時間の割合を求めている。取得したデータの値をそのまま見たい場合、「Graph」タブではなく「Console」タブ

wate_wate 2017/11/20

Prometheus

リンク

インフラ・サービス監視ツールの新顔「Prometheus」入門 | さくらのナレッジ

サーバーやインフラなどの監視ツールの1つとして最近注目されているのが「Prometheus」だ。Prometheusはインストールや設定が容易で、かつ十分な機能を持ち管理しやすいという特徴を持つ。本記事ではこのPrometheusの導入方法、基本的な監視設定の流れを紹介する。クラウド時代の監視管理ツールネットサービスを運営する場合、そのサービスを運営するソフトウェアやサーバー、ネットワーク機器などの状況を監視する手段を用意するのが一般的だ。監視を行い、意図しない状況になったら自動的にメールなどで通知を行うシステムを構築することで、問題をいち早く解決できるようになる。さらに、サービスやマシンの稼働ログを適切に記録することで潜在的な問題を事前に見つけたり、最適化に向けた分析を行うといったことも可能になる。監視や問題発覚時の通知などを行うオープンソースのツールとしては、過去にElastic

wate_wate 2017/11/20

Prometheus

リンク

はてなブックマーク

タグ

関連タグで絞り込む (3)

Prometheusに関するwate_wateのブックマーク (13)

お知らせ

今週のはてなブックマーク数ランキング（2025年8月第1週）

月間はてなブックマーク数ランキング（2025年7月）

今週のはてなブックマーク数ランキング（2025年7月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス