なぜベテラン運用者は「しきい値超えのアラート」を静観できるのか ブロードリーフが考える“アラートへの向き合い方”:「Cloud Operator Days Tokyo 2022」セミナーレポート#5 Cloud Operator Days Tokyo 2022のセッション「効果的なアラートを再考する『メモリ使用率が80%になりました。』んで、どうすればいいん?」にてブロードリーフの左近充 裕樹氏は、監視の基礎である「アラート」に対する向き合い方や対処方法を解説した。
各種サービスについてご質問やお見積りを 受け付けております。 お問い合わせ・お見積もり 電話とインターネットを使って、サービス資料を ご覧いただきながらご説明いたします。 オンライン商談予約 サービスや提供エリアに関するご質問等 お気軽にお問い合わせください。 チャットで質問 お電話でのお問い合わせ 9:30〜18:00(土日祝、年末年始を除く) 各種サービスの パンフレットをダウンロードいただけます。 資料ダウンロード NURO Bizサービスを法人さまへ ご紹介、販売いただけるパートナー様を募集しております。 ビジネスパートナーについて 問い合わせる
はじめに やること 構成概要・環境情報 参考資料 動かす 環境準備 ThousandEye Free Try 登録 ThousandEye Enterprise Agents 取得 ~ GNS3にインポートして起動 ~ 初期設定 SNMP + LLDP が動く NW 機器を GNS3 で動かす ダッシュボードで色々やる Devices の登録 Views で Device Layer を眺める 通知系設定 おしまい はじめに やること ShowNet 2018 で「ネットワーク可視化 SaaS」として使われていた ThousandEyes を試用します(Free Try で)。 見る機能は「SNMP 対応 NW 装置から情報収集してインターネット経由で SaaS 環境に投げ込む probe 的な Enterprise Agents を動かして様子を見る(Devices 機能)」部分に絞りま
Mackerelチームのエンジニアのid:itchynyです。 「mackerel-agentを入れるとloadavgが7時間ごとに上昇する」 先日、このような問い合わせを複数のお客さまから受けました。私も実験してみたところ、確かに再現しました。EC2 t2.microにmackerel-agentを入れて簡単なログ監視とプロセス監視を設定し、数日放置しました。 確かに、約7時間ごとにloadavgが上昇しています。この周期のcronの設定はしておらず、またmackerel-agent内部でも7時間ごとに行う処理はありません。しかし、プラグインを多く入れるほどloadavgのピーク値も上がります。 本エントリーでは、この現象の原因について説明します。 loadavgが上昇する原因を調べるには、まずloadavg自体がどう計算されているかを知る必要があります。 まずは、Linuxがloada
いつまでもunix系のコマンドが使えないのはダサいので、メモも兼ねて書く。 topコマンド実行 「shift+m」でメモリ順にソート 「m」(またはmからのm)でグラフィカルに見れる! これでメモリの使用率がグラフィカルに確認できる!
さくらインターネットのアドベントカレンダー9日目として、サーバ屋らしく、運用に関するコマンドの使い方を紹介します。 サーバの負荷が高まってきたときに、vmstatやtopなどのコマンドで調査する事が出来ますが、I/O負荷をwa(iowait)によって判断する人も多いと思います。 ただ、結論から言うと、iowaitは正確にI/Oの負荷を表しているわけではありません。 これらを、実際に演習をしながら見ていきたいと思います。 iowaitとidle iowaitとはあくまでも、CPUが空いているのにI/Oがボトルネックになっているプロセスを示しているだけで、CPUの利用率が高いときにはI/Oがボトルネックになっていてもiowaitが上がりません。 同様に勘違いされがちなのが、id(idle)はCPUの空きを示しているというものですが、idleは必ずしもCPUの空き時間を示しているものではありませ
If you can’t load or login to Facebook you can check if Facebook is down here and we will tell you. This can be helpful to know if everyone is having the problem, or it's just you. Streaming 9anime AnimeSuge BBC iPlayer CBS All Access CBS Sports Crunchyroll DirectTV Now Discovery Plus Dish Network Disney Plus ESPN Funimation Gogoanime HBO Max Hulu Mobdro Netflix NFL Network Paramount Plus Peacock
サーバーやインフラなどの監視ツールの1つとして最近注目されているのが「Prometheus」だ。Prometheusはインストールや設定が容易で、かつ十分な機能を持ち管理しやすいという特徴を持つ。本記事ではこのPrometheusの導入方法、基本的な監視設定の流れを紹介する。 クラウド時代の監視管理ツール ネットサービスを運営する場合、そのサービスを運営するソフトウェアやサーバー、ネットワーク機器などの状況を監視する手段を用意するのが一般的だ。監視を行い、意図しない状況になったら自動的にメールなどで通知を行うシステムを構築することで、問題をいち早く解決できるようになる。さらに、サービスやマシンの稼働ログを適切に記録することで潜在的な問題を事前に見つけたり、最適化に向けた分析を行うといったことも可能になる。 監視や問題発覚時の通知などを行うオープンソースのツールとしては、過去にElastic
この記事は、SaaSのサーバ監視サービスMackerelを起源を遡り、そこから現在の姿に至った経緯をはてな社内のエンジニアに共有するためのものです。 なお、ここに書かれていることは、Mackerel開発チームの公式見解ではありません。 概要 Mackerelは、もともとは2007年ごろに開発されたはてなの社内のサーバ管理ツールであり、動的なインフラストラクチャに対応するために、現在でいうところのInfrastructure As Codeを目指したものです。 そこから2013年にSaaSのサービスとして開発され、コードベースとアーキテクチャは全く新しくなり、監視機能を備え、サーバ「監視」サービスと呼ばれるようになりました。 しかし、はてな社内では、プログラマブルなAPIを備えたサーバ「管理」サービスとして、Mackerelを中心にしたインフラストラクチャを構築しています。 Mackerel
秋の夜長のモニタリング勉強会。自社サービスの運用監視についてガッツリ学んだ、10月のGeeks Who Drink@福岡の様子をレポート! ヌーラボ 福岡本社と東京事務所で定期的に開催されている Geeks Who Drinkは、エンジニアやプログラマーに向けた技術に関する交流会イベントです。IT企業のエンジニアやデザイナーをゲストスピーカーに招いて、自社サービスで活用されている技術を解説する、キーノートスピーチも行っています。 今回は「モニタリング勉強会 Edition」と題し、自社サービスの運用監視について福岡で学び合いました。MackerelのCREであるそーだいさんが東京から参戦してくださり、5名のスピーカーによるセッション&飛び入りLTも続出!という盛りだくさんな夜になりました。早速レポートしていきます! イベントレポート Geeks Who Drink には、イベントのハッシュ
インフラの反田 (@mtanda) です。 GREEでは、多くのサービスをAWS環境で運用しており、それらサービスのモニタリングシステムとしてPrometheusを利用しています。 Prometheusを導入してから約2年がたち、1台のPrometheusで数百台規模のインスタンスをモニタリングするなかで、さまざまな問題に直面しました。 それら問題の原因を分析し、設定や利用の仕方を改善することで、ある程度安定して運用できるようになりました。 これらの知見が少しでもお役に立てばと思い、ここで共有いたします。 なお、対象とするPrometheusのバージョンは1.xです。Prometheus 2.0では、これら問題のほぼ全てに対して改善されています。そのため、2.0でどういった点が改善されているかを知るためにも有用だと思います。 Prometheusのストレージ実装の基礎知識 Promethe
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く