はじめに Prometheus でアプリケーションの構築をしているとどうしてもこの値が取りたいのに... と思うことが多々ある。Pushgateway も選択肢として上げられるが今回は選択肢を増やしてほしいという意味でもExporterの実装方法について検討していきます。ExporterはPrometheusのpull モデルに適合し、監視対象のライフサイクルと一貫性があり、スケーラビリティと自動検出の利点を享受できるため、Pushgatewayよりも推奨される方法です。ただし、特定のユースケース(サービスレベルのバッチジョブなど)では、Pushgatewayの使用が適切な場合もあります。Pushgatewayを使う際には以下の問題点があるので注意が必要です。 複数のインスタンスを1つのPushgatewayで監視すると、単一障害点とボトルネックが発生する可能性がある。 Prometheu
Have you ever fallen asleep to the sounds of your on-call team in a Zoom call? If you’ve had the misfortune to sympathize with this experience, you likely understand the problem of Alert Fatigue firsthand. During an active incident, it can be exhausting to tease the upstream root cause from downstream noise while you’re context switching between your terminal and your alerts. This is where Alertma
3-shake SRE Tech Talk #4 (https://3-shake.connpass.com/event/253028/) の登壇資料です。LT です。
Prometheus 2.37 is out and brings exciting news: this is the first long-term supported release. It’ll be supported for at least six months. Why is Long-Term Support (LTS) so significant? Previous to this release, each Prometheus version had a six-week life-cycle. That means that if you wanted to stay up-to-date with the latest features and bug fixes, you needed to update your Prometheus server eve
今回はKubernetesクラスターをPrometheusとcAdvisorで監視してみるのを試してみようと思います。 Kubernetesの監視にPrometheusとGrafanaを使うのはメジャーな方法です。 久しぶりにセットアップしてみたら、Kubernetesのバージョンアップデートに伴って仕様変更など色々あり、旧来のやり方でうまくいきませんでした。 コンテナー基盤のクラスター監視は重要だと思うので、現時点(2020年5月9日)の動作確認した手順をここにまとめておきたいと思います。ちなみにKubernetesはmicrok8sを使って構築した環境で確認していますが、他の方法でセットアップしたKubernetesでも動くと思います。バージョンは1.17.5を用いましたが、おそらく1.18でも同様かと思います(後日確認します)。 想定する構成 本例では次の2台を想定しますが、Prom
この記事では、Prometheusを用いてKubernetesクラスターを監視するための10個の実用的なクエリー例を紹介し、PromQLの書き方に不慣れな方々をサポートします。 これらのクエリーはSysdigの経験に基づき、クラスターのヘルスチェック、リソースの使用状況、オーバーコミットの警告など、運用に役立つ情報を提供します。 例えば、クラスターやネームスペースごとのポッド数、CPUやメモリのリミットが設定されていないコンテナの検出、再起動しているポッドの把握、CPUやメモリのオーバーコミットの検出などが含まれます。 これらのクエリーは、クラスター運用の効率化やトラブルシューティングの初期段階に役立ちます。 また、Sysdig MonitorのPromQLライブラリーを参照することで、さらに多くのクエリー例を見つけることができ、PromQLの理解を深めることが可能です。 詳細はこちら S
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。ヤフーのクラウドプラットフォーム本部に所属している北田、馬場、高橋です。 私たちのチームは社内向けに IaaS 環境を提供しており、その品質を管理・維持するために監視システムを導入しています。 システムの部分的な障害や冗長性などを監視する目的で、私たちはこれまで Sensu を使っていましたが、その EOL をきっかけに Prometheus へ移行することにしました。 この記事では、Sensu の移行先として Prometheus を選んだ理由、Prometheus を利用した監視システムの構成、そして、Prometheus を導入した際の工夫などを紹介します。 ヤフーの IaaS 環境の監視状況 私たちのチームが社
概要 Metric types | Prometheus で定義されているようにPrometheusでは大きく4つのメトリクスタイプがあります。 Counter Gauge Summary Histogram 今回はGoのPrometheusクライアントライブラリを用いて各メトリクスを独自で用意する方法を説明します。 環境 Prometheus 2.11.1 Golang 1.12.7 prometheus/client_golang 1.0.0 expose まずはPrometheusが監視対象のメトリクスをPullできるよう/metricsのエンドポイントを用意します。 公式クライアントとしてpromhttpというライブラリが提供されているのでそれを使います。 package main import ( "log" "net/http" "github.com/prometheus/c
はじめに 1/15、今回で 3 回目となる Prometheus Meetup Tokyo が開催されたため参加してきました。 今回のテーマは「Prometheus を取り巻くエコシステム達」ということで、Thanos や Victoria Metrics、Grafana Loki など、Prometheus の機能を拡張するソリューションやその事例について熱いプレゼンテーションが行われました。 会場は東京・田町駅から徒歩圏内にある、 NTT ソフトウェアイノベーションセンタさまのイベントスペースでした。こちらの会場は OSS に関する非営利イベントであれば貸し出せるとのことです。 「Prometheus Meetup Tokyo」の会場準備完了!あとはみなさんが来るのを待つだけ!今日は、Prometheus のエコシステム回なので楽しみ?https://t.co/M8WOgemcRO #
The Prometheus Operator provides Kubernetes native deployment and management of Prometheus and related monitoring components. The purpose of this project is to simplify and automate the configuration of a Prometheus based monitoring stack for Kubernetes clusters. The Prometheus operator includes, but is not limited to, the following features: Kubernetes Custom Resources: Use Kubernetes custom reso
Note that everything is experimental and may change significantly at any time. This repository collects Kubernetes manifests, Grafana dashboards, and Prometheus rules combined with documentation and scripts to provide easy to operate end-to-end Kubernetes cluster monitoring with Prometheus using the Prometheus Operator. The content of this project is written in jsonnet. This project could both be
6/3 渋谷で行われた Prometheus Tokyo Meetup #2 をレポートします。 Prometheus といえば「クラウドネイティブ」というキーワードの中で語られることの多いインフラ監視・モニタリングソリューションですが、本ミートアップではクックパッド社やヤフー社の事例など、 Prometheus ヘビーユーザの方々により特徴や活用事例が語られる、非常に興味深いものでした。 Prometheus Tokyo Meetup #2 - connpass Prometheus Tokyo Meetup #2 - 資料一覧 - connpass なお、本ミートアップはサイバーエージェント殿協力の下、渋谷の Abema Towers にて行われました。 動画 Prometheus Tokyo Meetup #2 - YouTube 入門 Prometheus スピーカー : Kazu
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く