タグ

監視に関するyogasaのブックマーク (27)

  • 障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開

    クラウド対応のログ可視化ツールとして知られる「Grafana」や監視システム「Prometheus」などを開発し提供するGrafana Labsは、障害発生時に担当者へのオンコールを自動化できるオンコールマネジメントソフトウェア「Grafana OnCall」をオープンソースで公開したことを明らかにしました。 Introducing the newest member of our open source family: Grafana OnCall OSS brings on-call management to the open source community #grafanaconline #oncallmanagement https://t.co/Nkq8frQx2r — Grafana (@grafana) June 14, 2022 Grafana OnCallは、昨年(2

    障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開
  • 入門 入門 監視 / reading-practical-monitoring

    「入門 監視」を読んだので、自分たちのチームに当てはめて考えてみる

    入門 入門 監視 / reading-practical-monitoring
  • 書籍「Webエンジニアのための監視システム実装ガイド」発売!

    システム監視の入門書籍を書きました わたしが執筆したWebエンジニアのための監視システム実装ガイドが2020/3/24に発売されますました。 予約受付中です。 物理書籍・Kindle共に販売中です。 PDF版なら検索もできちゃいます。 ※このエントリを書いている時点でまだ表紙がfixしていませんが、黒バックにウミガメ写真になる予定です 運用監視の会社でCTOとして勤続12年の知見を詰め込んだ、システム監視について幅広く取り扱った実践的な入門書です。 読者の方に体系的な知識と価値基準を獲得してもらえるよう努めました。 監視テクノロジの歴史や特徴、監視システムの基動作と動作方式ごとの特徴、時系列データベース、DevOpsやSREなどのWebシステム運用の文化、SLO、SLI、Availability、Observability、自己修復システム、Chaos Engineering、監視方式の

  • アプリケーションは全員で監視する - 「入門 監視」を読んだ - $shibayu36->blog;

    最近話題になっていた「入門 監視」を読んだ。アプリケーションの監視をするための実践的なノウハウが詰まっていて非常に参考になる書籍だった。 入門 監視 ―モダンなモニタリングのためのデザインパターン 作者:Mike Julianオライリー・ジャパンAmazon このでは、アプリケーションを監視するための骨格となる考え方や、様々な層(フロントエンドからOSのメトリックまで)での監視の入れ方の実践的なノウハウ、さらには障害対応をスムーズに行うためのフローや障害の根対応をチームで行えるようにするためのやり方まで書かれている。実践的なすぐに取り入れられるような内容が多く、「アプリケーションをどう監視したら良いか分からない!」「障害対応をもっとうまくやる方法はないのだろうか?」と思う人には参考になる部分が多いと思う。 個人的にこのの中で一番良いなと思ったのは、 SREだけでなくアプリケーションエ

    アプリケーションは全員で監視する - 「入門 監視」を読んだ - $shibayu36->blog;
  • エンジニア3人で支える月間10億PV

    ・2年で月間10億PVを支えるまで成長した
ZenClerkの運用上の工夫を紹介 ・AWSのTipsとあるある話の共有

    エンジニア3人で支える月間10億PV
  • 第 2 回 基本的な監視を試してみよう(前編) - SRA OSS, Inc. 日本支社

  • PostgreSQL monitoring template for Zabbix (pg_monz)

    【注意】 pg_monzはZabbix 5.0には対応せず、Zabbix 4.0のフルサポート終了2021年10月31日をもってメンテナンスを終了しました。 PostgreSQL監視はZabbix 5.0以降では標準テンプレートの利用を推奨します。 pg_monz とは PostgreSQL monitoring template for Zabbix (pg_monz) は、ZabbixでPostgreSQLの各種監視を行うためのテンプレートです。 pg_monzの目的 pg_monzを導入することで、PostgreSQLの死活監視、リソース監視、性能監視などが行えます。 PostgreSQL単体で稼働するシングル構成の状態、PostgreSQLのStreaming Replicationを使った冗長構成の状態、pgpool-IIを使った負荷分散構成の状態の監視を行うことができ、Post

  • 完璧な監視システムの作り方 in cybozu.com - Cybozu Inside Out | サイボウズエンジニアのブログ

    こんにちは、Hazama チームの萩原(@hagifoo)です。 ハードウェアは故障し、ソフトウェアにはバグがあり、運用ではミスがおきるもの。もちろん、障害が発生しないのが理想ですが人間が作ったものに完璧はありません。そこで、障害の前兆や発生を捉え、その詳細を運用チームに知らせるための監視システムが必要となります。cybozu.com でも以下のようにありとあらゆるものを監視するシステムを構築し日夜監視を行なっています。 今回は、そんな cybozu.com の監視(モニタリング)システムについてお話しします。 cybozu.com と障害 監視システムの設計 3つの監視 外形監視 症状監視・リソース監視 ログ監視 その他の監視 モニタリングフレームワーク 誰が監視者を監視するのか? まとめ cybozu.com と障害 まずは、監視対象である cybzou.com について説明します。

    完璧な監視システムの作り方 in cybozu.com - Cybozu Inside Out | サイボウズエンジニアのブログ
  • DevOps実践に有用なZabbixの機能~自動化機能で運用負荷削減

    DevOps実践に有用なZabbixの機能~自動化機能で運用負荷削減:クラウド&DevOps時代の運用をZabbixで(3)(1/2 ページ) ますますクラウド化が進む環境において、システムにはより迅速な対応が求められるようになっています。変化の早いシステムを適切に運用していくためにはどうすればいいのでしょうか? この記事では、クラウドやDevOpsを前提としたITシステムの「運用」に求められることを整理し、そういった運用に対して、オープンソースの統合監視ツール「Zabbix」がどのように有効活用できるかを紹介します。 前回の記事「DevOps実践に有用なZabbixの機能~開発と運用を近づける監視」では、DevOpsを実践するに当たって、開発者と運用者をZabbixを通じてより近づける方法について紹介しました。第3回目の記事では、運用面にフォーカスを絞り、Zabbixの自動化機能を活用

    DevOps実践に有用なZabbixの機能~自動化機能で運用負荷削減
  • これだけ見れば大丈夫!ーMySQLパフォーマンス監視のツボ(システム編)|技術ブログ|北海道札幌市・宮城県仙台市のVR・ゲーム・システム開発 インフィニットループ

    これだけ見れば大丈夫!ーMySQLパフォーマンス監視のツボ(システム編) こんにちは nob です。 前編 これだけ見れば大丈夫!ーMySQLパフォーマンス監視のツボ(クエリ編) の記事から1年半が経過してしまいました。ちょっと長いお休みでしたが、その間に蓄えた MySQL パフォーマンス監視の実戦経験を(システム編)としてお届けいたします! 今回の(システム編)で紹介するツボは 4 つです。(クエリ編)のツボに加えて、この4つに注目して頂ければ MySQL のパフォーマンス監視もバッチリです。 (ツボ1)Load Average < (1 + (cpu数-1)/3) (ツボ2)Checkpoint Age が水平線になったら要注意 (ツボ3)MyISAM は無いよね監視 (ツボ4)万能選手スローログ なお前編と同様この記事では監視ツールとして Cacti と Percona MySQL

    これだけ見れば大丈夫!ーMySQLパフォーマンス監視のツボ(システム編)|技術ブログ|北海道札幌市・宮城県仙台市のVR・ゲーム・システム開発 インフィニットループ
  • サーバ監視項目でよく使う SNMP の MIB オブジェクト ID まとめ

    サーバの監視において SNMP は必須技術なわけですが、MRTG や自前スクリプトは一度設定してしまうと、サーバが増減でもしない限り、設定ファイルを見直すことってほとんどありませんよね。 でもって、久々に改めて設定ファイルを見直してみると、設定してある MIB の OID が意味不明・・・なんだっけコレ?ってことが良くあります。※少なくとも僕の場合は、毎回調べ直してる気がする・・・ なので、よく使う MIB オブジェクト ID をまとめておこう・・・と考えました。これでこれからは迷わない。 ・・・と思ったらエントリを書き始めたらビックリ仰天!SNMP の知識すら忘れてます・・・再度お勉強です・・・ヽ(τωヽ)ノ SNMPによるネットワークシステムの監視第01回:第1回:SNMPの基礎 SNMPではマネージャ(NMS:Network Management Station)という管理機器がその

  • 【ZABBIX】やっぱりLLD(ローレベルディスカバリ)は最高だぜ! | Pocketstudio.jp log3

    ZABBIX 2.0 の新機能、ローレベルディスカバリ(Low Level Discovery、以下 LLD)は、自動的にアイテム・トリガ・グラフを生成してくれるもの。サーバ内の状況に応じ、動的に監視対象を変化させる事ができます。 記事は、LLD の概要と、実際に設定を行うチュートリアルで構成しました。既に公式ドキュメントを読まれた方には、不要かと思います。自分が理解に時間がかかってしまったので、、これから LLD を始める方が迷わないようにと、チュートリアル形式で記事をまとめてみました(SNMP の効率的な OID データ収集に関しては、途中記事を飛ばして読んでいただいて構いません。) 記事の概要 Zabbix 2.0 からローレベルディスカバリ機能(LLD)が使えるようになった。 検出用の標準キーは3種類(vfs.fs.discovery=ファイルシステム検出、net.if.di

  • Zabbixを使ったクラウド環境監視のオートメーション化@JulyTechFesta2013

    https://devlove-kansai.doorkeeper.jp/events/36650 「インフラエンジニアの現場における仕事文化」のDiff

    Zabbixを使ったクラウド環境監視のオートメーション化@JulyTechFesta2013
  • ZabbixとNagiosを一括監視する「Hatohol」、ミラクル・リナックスがOSSとして公開

    ミラクル・リナックスは2013年6月27日、オープンソースの統合監視ソフトウエアである「Zabbix」と「Nagios」を利用した複数の監視サーバーを一括監視する「Hatohol(はとほる)」をオープンソースソフトウエアとして公開した。また、Hatoholの開発などを行うコミュニティ「Project Hatohol」を設立した。 Hatoholはミラクル・リナックスが独自に開発したもの。複数のZabbixサーバーを一元管理することで、監視対象の規模に応じてZabbixサーバーを拡張できるとしている。またそれぞれの独立したZabbixサーバーで動作しているため、いずれかのZabbixサーバーで障害が発生しても他のZabbixサーバーに影響を与えないという。

    ZabbixとNagiosを一括監視する「Hatohol」、ミラクル・リナックスがOSSとして公開
  • 全自動Zabbix

    3.  Zabbixでの監視は便利です。  HW監視、死活監視、リソース監視、グラフ表示  でも、監視対象を登録するのはめんどくさいです。  じゃぁ自動化しちゃいましょう。  もちろんZabbixの機能で!(スクリプトとか作らずに) 趣旨 2013/5/53 5.  Agent自動登録  Zabbixエージェントを起動すると、アクティブチェックの 項目を確認するために、Agent→Serverという通信が 発生します。  このときにAgentは自分のホスト名をZabbixサーバに 通知して、Zabbixエージェント(アクティブ)のアイテム一 覧を取得します。  このときに通知されたホスト名がZabbixサーバに登録さ れていないときに自動的にホスト登録するのがAgent自 動登録です。 2種類の自動登録(Agent) 2013/5/55 6.  Zabbixサーバは指定

    全自動Zabbix
  • ScaleOut | Supership

    2024年4月1日より、Supership株式会社は親会社であるSupershipホールディングス株式会社に吸収合併されました。 合併に伴い、存続会社であるSupershipホールディングスは社名をSupershipに変更し、新たな経営体制を発足しました。件に関する詳細は、プレスリリースをご確認ください。 2024年4月1日より、Supership株式会社は親会社であるSupershipホールディングス株式会社に吸収合併されました。 合併に伴い、存続会社であるSupershipホールディングスは社名をSupershipに変更し、新たな経営体制を発足しました。 件に関する詳細は、プレスリリースをご確認ください。

    ScaleOut | Supership
  • 第5回 図解で知るSNMP――MIB情報のすべて

    第5回 図解で知るSNMP――MIB情報のすべて:SNMPによるネットワークモニタリング「第2版」(1/8 ページ) サーバやネットワーク機器を監視するSNMPを扱う上で重要なものの1つが“MIB”情報の把握である。機器にアクセスする場合には、このMIB情報を基に問い合わせを行い、モニタリングを行う。 第4回目「SNMPとv3セキュリティ」で説明したように、SNMPエージェントは、現在の状態値(管理情報)をもつオブジェクトを備え外部へと公開する。 それぞれのオブジェクトは固有のOID(Object IDentifier)をもっており、snmpwalkやsnmpgetをはじめとするSNMPマネージャコマンドを用いて、その状態値を取得できるのだ。 このとき問題となるのは、どのOIDをもつオブジェクトが、どんな情報を持っているのかという点だ。例えば、「トラフィック総バイト数」「CPU負荷」「メモ

    第5回 図解で知るSNMP――MIB情報のすべて
  • Nagios と derived でMySQLのスロークエリの量を監視する - blog.nomadscafe.jp

    新しい機能をリリースした際に、MySQLに対して効率的ではないクエリが発行されてしまって、それが積もってサービス全体に影響が出てしまう前に発見してアラートをあげたい。 発見する手立てとしてはCPU使用率やInnoDBのROW OPERATIONSが考えられるところですが、今回はスロークエリが発生した回数を監視することにした。ちなみにいつものことながら対象とするMySQLは4.0系。long_query_timeがオンラインで変更できません。。。はい MySQLのスロークエリが発生した回数は、show status のSlow_queriesという項目でみることができて mysql> show status like 'Slow_queries'; +---------------+-------+ | Variable_name | Value | +---------------+---

  • DevOps時代の開発者のためのOSSクラウド運用管理ツール5選まとめ

    DevOps時代の開発者のためのOSSクラウド運用管理ツール5選まとめ:ユカイ、ツーカイ、カイハツ環境!(30)(1/3 ページ) DevOpsという観点で、クラウドに使えるオープンソースの運用管理ツールとして、Zabbix、Hinemos、Hyperic HQ、Scalr、Aeolusの特徴をまとめて紹介します。 開発者も“運用”管理の時代 アジャイル開発の注目とともにクラウドによるインフラ構築の効率化、さらにはDevOpsといった開発・運用の継続的な改善とリリースの自動化による短期リリースの実現が注目を浴びています。 クラウドを利用した場合、クラウド体の運用・管理機能を利用して環境構築やシステムの監視、負荷状況に合わせたスケールアウトができます。 しかしながら、各クラウド固有の機能を利用してしまうと、そのクラウドにロックインされてしまい、将来、より安いクラウドが登場したときの乗り換え

    DevOps時代の開発者のためのOSSクラウド運用管理ツール5選まとめ
  • 私がMuninに恋する理由 - インフラエンジニアでも監視がしたい! -

    7. \ / 私は誰? \ 丶 i. | / ./ / \ ヽ i. .| / / / \ ヽ i | / / / \ -‐ Zembutsu Masahito ー __ わ た し で す -- • 前佛 雅人 @zembutsu 二 / ̄\ = 二  ̄. | ^o^ |  ̄ -‐ \_/ ‐- – Solutions Engineer ( 萌えるSE ) / • インフラエンジニア的な仕事メイン / ヽ \ • 株式会社リンク at+link サービス開発部 ( http://www.at-link.ad.jp/ ) / • “技術者に安心と休息を” 提供するサービス追求(運用/監視/自動化) 丶 \ / / / | i, 丶 \ / / / | i, 丶 \ – オープンソース系・クラウド系コミュニティ活動 • http://pocketstudio.jp/log3/ – 主な職歴

    私がMuninに恋する理由 - インフラエンジニアでも監視がしたい! -