サーバーやインフラなどの監視ツールの1つとして最近注目されているのが「Prometheus」だ。Prometheusはインストールや設定が容易で、かつ十分な機能を持ち管理しやすいという特徴を持つ。本記事ではこのPrometheusの導入方法、基本的な監視設定の流れを紹介する。 クラウド時代の監視管理ツール ネットサービスを運営する場合、そのサービスを運営するソフトウェアやサーバー、ネットワーク機器などの状況を監視する手段を用意するのが一般的だ。監視を行い、意図しない状況になったら自動的にメールなどで通知を行うシステムを構築することで、問題をいち早く解決できるようになる。さらに、サービスやマシンの稼働ログを適切に記録することで潜在的な問題を事前に見つけたり、最適化に向けた分析を行うといったことも可能になる。 監視や問題発覚時の通知などを行うオープンソースのツールとしては、過去にElastic
秋の夜長のモニタリング勉強会。自社サービスの運用監視についてガッツリ学んだ、10月のGeeks Who Drink@福岡の様子をレポート! ヌーラボ 福岡本社と東京事務所で定期的に開催されている Geeks Who Drinkは、エンジニアやプログラマーに向けた技術に関する交流会イベントです。IT企業のエンジニアやデザイナーをゲストスピーカーに招いて、自社サービスで活用されている技術を解説する、キーノートスピーチも行っています。 今回は「モニタリング勉強会 Edition」と題し、自社サービスの運用監視について福岡で学び合いました。MackerelのCREであるそーだいさんが東京から参戦してくださり、5名のスピーカーによるセッション&飛び入りLTも続出!という盛りだくさんな夜になりました。早速レポートしていきます! イベントレポート Geeks Who Drink には、イベントのハッシュ
インフラの反田 (@mtanda) です。 GREEでは、多くのサービスをAWS環境で運用しており、それらサービスのモニタリングシステムとしてPrometheusを利用しています。 Prometheusを導入してから約2年がたち、1台のPrometheusで数百台規模のインスタンスをモニタリングするなかで、さまざまな問題に直面しました。 それら問題の原因を分析し、設定や利用の仕方を改善することで、ある程度安定して運用できるようになりました。 これらの知見が少しでもお役に立てばと思い、ここで共有いたします。 なお、対象とするPrometheusのバージョンは1.xです。Prometheus 2.0では、これら問題のほぼ全てに対して改善されています。そのため、2.0でどういった点が改善されているかを知るためにも有用だと思います。 Prometheusのストレージ実装の基礎知識 Promethe
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く