[B! 監視] naoto408のブックマーク

naoto408 id:naoto408

監視に関するnaoto408のブックマーク (14)

なぜベテラン運用者は「しきい値超えのアラート」を静観できるのか　ブロードリーフが考える“アラートへの向き合い方”
なぜベテラン運用者は「しきい値超えのアラート」を静観できるのか　ブロードリーフが考える“アラートへの向き合い方”：「Cloud Operator Days Tokyo 2022」セミナーレポート＃5 Cloud Operator Days Tokyo 2022のセッション「効果的なアラートを再考する『メモリ使用率が80%になりました。』んで、どうすればいいん？」にてブロードリーフの左近充裕樹氏は、監視の基礎である「アラート」に対する向き合い方や対処方法を解説した。
naoto408 2022/08/22
・手順書には「Playbook」「Runbook」といったように幾つかの種類がある。・Runbookは「レシピ」、Playbookは「イベントを進行するためのガイドブック」。・大まかな流れはPlaybookに記載し、細かい手順はRunbookに記載する。

運用

監視

ドキュメント

手順書
リンク
Downdetector
© 2012-2024 Ookla, LLC., a Ziff Davis company. All Rights Reserved. Downdetector® is among the federally registered trademarks of Ookla® and may not be used by third parties without express written permission.
naoto408 2018/12/03
便利ツール

ツール

監視
リンク
ソニーネットワークコミュニケーションズ、アマゾンウェブサービスジャパン　AWS入門セミナー～社内のクラウド反対派も説得できるAWSメリットを学ぼう！～ | マネージドクラウド with AWS
各種サービスについてご質問やお見積りを受け付けております。お問い合わせ・お見積もり電話とインターネットを使って、サービス資料をご覧いただきながらご説明いたします。オンライン商談予約サービスや提供エリアに関するご質問等お気軽にお問い合わせください。チャットで質問お電話でのお問い合わせ 9:30〜18:00（土日祝、年末年始を除く）各種サービスのパンフレットをダウンロードいただけます。資料ダウンロード NURO Bizサービスを法人さまへご紹介、販売いただけるパートナー様を募集しております。ビジネスパートナーについて問い合わせる
naoto408 2018/07/11
監視

運用

Mackerel

Amazon Web Services
リンク
ThousandEyes で NW 装置 monitoring を Free Try - kakkotetsu はてなブログ
はじめにやること構成概要・環境情報参考資料動かす環境準備 ThousandEye Free Try 登録 ThousandEye Enterprise Agents 取得～ GNS3にインポートして起動～初期設定 SNMP + LLDP が動く NW 機器を GNS3 で動かすダッシュボードで色々やる Devices の登録 Views で Device Layer を眺める通知系設定おしまいはじめにやること ShowNet 2018 で「ネットワーク可視化 SaaS」として使われていた ThousandEyes を試用します(Free Try で)。見る機能は「SNMP 対応 NW 装置から情報収集してインターネット経由で SaaS 環境に投げ込む probe 的な Enterprise Agents を動かして様子を見る(Devices 機能)」部分に絞りま
naoto408 2018/06/19
ThousandEye

ネットワーク

監視

GNS3
リンク
Linuxのloadavgが約7時間ごとに上昇する現象の原因 - Mackerel お知らせ #mackerelio
Mackerelチームのエンジニアのid:itchynyです。「mackerel-agentを入れるとloadavgが7時間ごとに上昇する」先日、このような問い合わせを複数のお客さまから受けました。私も実験してみたところ、確かに再現しました。EC2 t2.microにmackerel-agentを入れて簡単なログ監視とプロセス監視を設定し、数日放置しました。確かに、約7時間ごとにloadavgが上昇しています。この周期のcronの設定はしておらず、またmackerel-agent内部でも7時間ごとに行う処理はありません。しかし、プラグインを多く入れるほどloadavgのピーク値も上がります。本エントリーでは、この現象の原因について説明します。 loadavgが上昇する原因を調べるには、まずloadavg自体がどう計算されているかを知る必要があります。まずは、Linuxがloada
naoto408 2018/06/13
おもしろい

監視

Mackerel

linux
リンク
いい加減メモリ監視をできるようになりたい - Qiita
いつまでもunix系のコマンドが使えないのはダサいので、メモも兼ねて書く。 topコマンド実行「shift+m」でメモリ順にソート「m」（またはmからのm）でグラフィカルに見れる！これでメモリの使用率がグラフィカルに確認できる！
naoto408 2017/12/29
監視
リンク
I/O負荷の正確な状況はiowaitでは分かりません - Qiita
さくらインターネットのアドベントカレンダー9日目として、サーバ屋らしく、運用に関するコマンドの使い方を紹介します。サーバの負荷が高まってきたときに、vmstatやtopなどのコマンドで調査する事が出来ますが、I/O負荷をwa(iowait)によって判断する人も多いと思います。ただ、結論から言うと、iowaitは正確にI/Oの負荷を表しているわけではありません。これらを、実際に演習をしながら見ていきたいと思います。 iowaitとidle iowaitとはあくまでも、CPUが空いているのにI/Oがボトルネックになっているプロセスを示しているだけで、CPUの利用率が高いときにはI/Oがボトルネックになっていてもiowaitが上がりません。同様に勘違いされがちなのが、id(idle)はCPUの空きを示しているというものですが、idleは必ずしもCPUの空き時間を示しているものではありませ
naoto408 2017/12/11
CPU

監視

IT関連

プログラミング
リンク
Down For Everyone Or Just Me - Check if a website or site is down.
If you can’t load or login to Facebook you can check if Facebook is down here and we will tell you. This can be helpful to know if everyone is having the probl em, or it's just you. Streaming 9anime AnimeSuge BBC iPlayer CBS All Access CBS Sports Crunchyroll DirectTV Now Discovery Plus Dish Network Disney Plus ESPN Funimation Go goanime HBO Max Hulu Mobdro Netflix NFL Network Paramount Plus Peacock
naoto408 2017/11/27
ツール

便利ツール

あとで読む
リンク
インフラ・サービス監視ツールの新顔「Prometheus」入門 | さくらのナレッジ
サーバーやインフラなどの監視ツールの1つとして最近注目されているのが「Prometheus」だ。Prometheusはインストールや設定が容易で、かつ十分な機能を持ち管理しやすいという特徴を持つ。本記事ではこのPrometheusの導入方法、基本的な監視設定の流れを紹介する。クラウド時代の監視管理ツールネットサービスを運営する場合、そのサービスを運営するソフトウェアやサーバー、ネットワーク機器などの状況を監視する手段を用意するのが一般的だ。監視を行い、意図しない状況になったら自動的にメールなどで通知を行うシステムを構築することで、問題をいち早く解決できるようになる。さらに、サービスやマシンの稼働ログを適切に記録することで潜在的な問題を事前に見つけたり、最適化に向けた分析を行うといったことも可能になる。監視や問題発覚時の通知などを行うオープンソースのツールとしては、過去にElastic
naoto408 2017/11/21
インフラ

IT関連

ツール

ネットワーク

監視

Prometheus
リンク
サーバ「管理」ツールとしてのMackerelの起源 - ゆううきブログ
この記事は、SaaSのサーバ監視サービスMackerelを起源を遡り、そこから現在の姿に至った経緯をはてな社内のエンジニアに共有するためのものです。なお、ここに書かれていることは、Mackerel開発チームの公式見解ではありません。概要 Mackerelは、もともとは2007年ごろに開発されたはてなの社内のサーバ管理ツールであり、動的なインフラストラクチャに対応するために、現在でいうところのInfrastructure As Codeを目指したものです。そこから2013年にSaaSのサービスとして開発され、コードベースとアーキテクチャは全く新しくなり、監視機能を備え、サーバ「監視」サービスと呼ばれるようになりました。しかし、はてな社内では、プログラマブルなAPIを備えたサーバ「管理」サービスとして、Mackerelを中心にしたインフラストラクチャを構築しています。 Mackerel
naoto408 2017/11/09
Mackerel

監視

IT関連

インフラ

Infrastructure as Code

はてな
リンク
秋の夜長のモニタリング勉強会。自社サービスの運用監視についてガッツリ学んだ、10月のGeeks Who Drink@福岡の様子をレポート！ | 株式会社ヌーラボ(Nulab inc.)
秋の夜長のモニタリング勉強会。自社サービスの運用監視についてガッツリ学んだ、10月のGeeks Who Drink@福岡の様子をレポート！ヌーラボ福岡本社と東京事務所で定期的に開催されている Geeks Who Drinkは、エンジニアやプログラマーに向けた技術に関する交流会イベントです。IT企業のエンジニアやデザイナーをゲストスピーカーに招いて、自社サービスで活用されている技術を解説する、キーノートスピーチも行っています。今回は「モニタリング勉強会 Edition」と題し、自社サービスの運用監視について福岡で学び合いました。MackerelのCREであるそーだいさんが東京から参戦してくださり、5名のスピーカーによるセッション&飛び入りLTも続出！という盛りだくさんな夜になりました。早速レポートしていきます！イベントレポート Geeks Who Drink には、イベントのハッシュ
naoto408 2017/11/08
Backlog

prometheus

LINE

IT関連

ツール

監視

あとで読む
リンク
サーバレスアーキテクチャによる時系列データベースの構築と監視 / Serverlessconf Tokyo 2017
サーバレスアーキテクチャによる時系列データベースの構築と監視
naoto408 2017/11/04
監視

IT関連

Mackerel

あとで読む
リンク
Backlog の運用監視 / Operational Monitoring of Backlog - Speaker Deck
2017年10月30日(月)に行われたGeeks Who Drink in福岡モニタリング勉強会edition でヌーラボの松浦が発表した、「Backlogの運用監視」の資料です。
naoto408 2017/11/02
Backlog

IT関連

インフラ

監視

あとで読む
リンク
Prometheusによる数百台規模のモニタリングで直面した問題について | GREE Engineering
インフラの反田 (@mtanda) です。 GREEでは、多くのサービスをAWS環境で運用しており、それらサービスのモニタリングシステムとしてPrometheusを利用しています。 Prometheusを導入してから約2年がたち、1台のPrometheusで数百台規模のインスタンスをモニタリングするなかで、さまざまな問題に直面しました。それら問題の原因を分析し、設定や利用の仕方を改善することで、ある程度安定して運用できるようになりました。これらの知見が少しでもお役に立てばと思い、ここで共有いたします。なお、対象とするPrometheusのバージョンは1.xです。Prometheus 2.0では、これら問題のほぼ全てに対して改善されています。そのため、2.0でどういった点が改善されているかを知るためにも有用だと思います。 Prometheusのストレージ実装の基礎知識 Promethe
naoto408 2017/10/24
prometheus

IT関連

インフラ

監視
リンク
1