タグ

監視に関するstrskのブックマーク (47)

  • 運用監視に必要な知識はOS、コマンド、そしてプログラミング~ゼロからの運用監視設計(後編)。July Tech Festa 2016

    運用監視に必要な知識はOS、コマンド、そしてプログラミング~ゼロからの運用監視設計(後編)。July Tech Festa 2016 運用監視の自動化は、複雑化するアプリケーションやサービスに対して効率的かつ確実な運用監視を実現する上で、またコスト削減の意味でも重要な要素になってきています。しかし運用監視の自動化は、どのように考えて実現していけばいいのでしょうか。 (記事は「正しく運用されているかを評価するのが監視である~ゼロからの運用監視設計(前編)。July Tech Festa 2016」の続きです。) ゼロからの監視設計 ひとつはサービスレベルの定義、もうひとつは非機能要件としてのシステム監視ですね。こういうことは以外と職場でも学校でも教えてくれなかったことです。 なぜかというと、だいたい担当部署によってみているレイヤが違うわけです。物理層を見ているところ、ネットワーク層、あるい

    運用監視に必要な知識はOS、コマンド、そしてプログラミング~ゼロからの運用監視設計(後編)。July Tech Festa 2016
    strsk
    strsk 2016/10/23
    機能要件、非機能要件、あと精度も重要
  • ログ環境とDevOps ~一休.comでの事例~

    Retty Tech Cafe#7 インフラ/DevOps

    ログ環境とDevOps ~一休.comでの事例~
  • 第12回 MongoDBの監視 | gihyo.jp

    はじめに 前回からMongoDBの非機能面に着目していますが、今回はMongoDBの監視について説明します。まず、MongoDBの監視で使うことができる機能やツールを紹介し、その後、これらのツールを用いてどのようにMongoDBを監視するかについて一般的な考え方を紹介します。MongoDBは最新バージョンの2.4を対象としています。 コマンド表記について$ : コマンドラインで実行するコマンド 監視機能の紹介 ロギング 最初に監視の基ともいえる、ロギングについて説明します。MongoDBでは何も指定しないと標準出力にログが出力されますが、ファイルに出力する場合は「 --logpath 」オプションにてログの出力先を指定します。 $ mongod --logpath=/var/log/mongodb.log このままだと、次回起動時にログはローテーションされてしまいます。ログをローテーショ

    第12回 MongoDBの監視 | gihyo.jp
  • [徹底解説] MongoDBの監視やバックアップができるMMS(MongoDB Management Service)の使い方 - Qiita

    [徹底解説] MongoDBの監視やバックアップができるMMS(MongoDB Management Service)の使い方MongoDBMMS MMSの概要 MMSの機能 MMS(MongoDB管理サービス)はMongoDBの自動運用管理をしてくれるサービスであり、主に以下の機能があります。 監視 MongoDBの各種統計情報収集、グラフ化、監視 閾値を指定して超えたらアラートメール送付 バックアップ スナップショット取得・リカバリ 差分バックアップ ポイントインタイムリカバリ(時間指定リカバリ) オートメーション(2014/5現在、公開予定) 無停止バージョンアップ ワンクリック環境構築 MMSとMMSエージェントの役割分担 MongoDB単体ではMMSを利用できません。MMSエージェントを導入して、MMSと接続する必要があります。 MMSエージェントには監視を行う監視エージェントと

    [徹底解説] MongoDBの監視やバックアップができるMMS(MongoDB Management Service)の使い方 - Qiita
  • cAdvisor, InfluxDB, GrafanaでDockerコンテナのリソース監視 - Qiita

    はじめに 1台のDockerホスト上のコンテナのリソース監視はcAdvisorが一般的になっているような気がします。 それでは複数台のDockerホスト上のコンテナのリソース監視はどうするのかなと調べてみると、以下のような方法があるようです。 cAdvisorで直接InfluxDBに保存し、Grafanaで可視化 HeapsterでcAdvisorから情報を収集してInfluxDBに保存し、Grafanaで可視化 cAdvisorからfluentでInfluxDBに保存し、Grafanaで可視化 この記事では一つ目の方法を試してみようと思います。 とりあえず今出てきた登場人物の簡単な紹介とリンク紹介を。 なお、この記事はだいたい3月中旬に書いた内容です。 Dockerコンテナのリソースモニタリングツール Kuberenetesで使うために主にGoogle社が開発したオープンソースソフトウェ

    cAdvisor, InfluxDB, GrafanaでDockerコンテナのリソース監視 - Qiita
  • muninグラフの読み方と意味 | シーズクリエイターズブログ

    サーバー監視ツール「munin」の各グラフの意味と読み方。 muninをインストールすると標準でたくさんのグラフが出力されます。中には聞いた事もない単語のグラフもあり、 「いったいこれは何なのか」と疑問に思っていたので調べてみました。 グラフはすべてplugin (/etc/munin/plugins) の内容から出力されていて、さらにそのほとんどが単なるperlスクリプトやシェルスクリプトでした。このpluginが実際はどのようなコマンドを使った結果なのかを確認しながら調べました。プログラムにはあまり明るくない&英語が苦手、なので意味違いしている可能性がありますのでお気づきの点がありましたらコメントを頂けると嬉しいです。 使用したmuninバージョンは1.4.5です。 ほとんどの値は /proc/以下から参照されているようで以下のページがとても役に立ちました。 Man page o

    muninグラフの読み方と意味 | シーズクリエイターズブログ
  • WEB系各社で使われている監視ツールまとめ - mikedaの日記

    次世代 Web カンファレンスで監視について話すことになったので、ネタとしてWEB系各社で使っている監視ツールを調査中。 うちはこれ使ってるよ!!!ってのがあったら@mikedaにメンションください! Cookpad Zabbix 昔はNagios+muninだけど台数増えて性能的に破綻した ビューはそのままじゃ辛いのでmunin風に表示するのを自作 StatusCake DataDog。サービス系、サーバに紐付かない系の監視に。DashBoard便利 waker。通知用。PagerDuty高い、と言ってryot_a_raiが秒で作ったらしい Kibana imon。独自のリアルタイムなサービス稼働状況表示ツール NewRelic 試し中なもの Real-User Monitoring : JSでbeacon飛ばしてfluentd -> BigQuery。Google SpreadShee

    WEB系各社で使われている監視ツールまとめ - mikedaの日記
  • 訳:ELB:評価方法のベストプラクティス - aws memo

    Best Practices in Evaluating Elastic Load Balancing : Articles & Tutorials : Amazon Web Services http://aws.amazon.com/articles/1636185810492479 ==== 概要 ELBを最もよく評価するには、ELBのアーキテクチャを理解する必要がある。稿は、AWS ELBの機能と独特なアーキテクチャについて述べる。ベストプラクティスを提供することで、ELBをテスト・評価する際に一般的な落とし穴(pitfall)から避けられるようになる。このホワイトペーパーが対象としている読者は、ELBの経験が少ないが、過去にH/W,S/Wのロードバランサを使ったことがあるような開発者である。 ELBの概要 ELBは、複数のEC2インスタンスへ、自動的にトラフィックを分散する。単

    訳:ELB:評価方法のベストプラクティス - aws memo
  • クックパッドにおけるサーバ監視と運用の工夫 - クックパッド開発者ブログ

    こんにちは。インフラストラクチャー部の加藤(@EugeneK)です。 今回はWebサービスを運用する上で欠かせない、モニタリングをクックパッドでどうしているかという話をします。 死活監視と性能監視 Webサービスを運用している以上、そのサービスを稼働しているサーバがあり、サーバには故障やトラブルが発生します。 また、どれくらいのパフォーマンスが出ているか、リソースをどのくらい消費しているかなどのトレンドを把握することは、成長するサービスを支えていく上で欠かせません。 故障やトラブルにいち早く気づくための仕組みを死活監視と言います。 また、サーバリソースの時系列での推移を知るために、グラフとしてトレンドを可視化する仕組みを性能監視と言います。 ポーリング監視の限界とZabbixのアクティブ監視 クックパッドでは死活監視にNagios、性能監視にMuninを使用してきましたが、サーバ台数の増加

    クックパッドにおけるサーバ監視と運用の工夫 - クックパッド開発者ブログ
  • ZabbixのAPIを使って運用を楽しくする話

    「ZabbixのAPIを使って運用を楽しくする話」 'Serf orchestration with ZABBIX APIs' Serf the Liberator - 始まりの物語 ---- 1. ZABBIX API 超入門 ・シェルで始める ZABBIX API (言語知識不要) 2. Serf と Zabbix の連携 ・Serf とは? ・API を使えば、こんな事が簡単にできるよ! 3. 仕事は楽しいかね? ・ Serf the Liberator 【叛逆の物語】 ---- 第6回 ZABBIX-JP勉強会 http://atnd.org/events/48954 Masahito Zembutsu Apr 12, 2014 , Osaki Tokyo ZABBIX-JP 6th meetup #zabbix_jp

    ZabbixのAPIを使って運用を楽しくする話
  • 監視システムをSensuに刷新した | Ore no homepage

    データベースが落ち着いているので、その間に別のことに着手。 チームの監視システムがmonっつー超レガシーシステム。知っている人もいるかもしれないが、monはperl製のシンプルな監視システム。古くからあるものなんだけど「mon perl」で検索すると「もしかして: man perl」とgoogle様にも何だっけソレ?と言われてしまうかわいそうな奴(「mon monitoring tool」だとちゃんと出てくる)。なのでまあこの際だから俺が葬り去ってやる。導入したSensuのバージョンは0.12.6。GW前くらいから運用しているが今んとこ問題ない。まだ運用期間短いね。 割と長文になっちまったので、目次をば。 0. sensu概要 1. なぜsensu? 2. インストール 3. コンフィグの配置 4. プラグインについて 5. API 6. デバッグ 7. 今後の展望 0. sensu概要

    監視システムをSensuに刷新した | Ore no homepage
  • Sensuの監視の設定 · さよならインターネット

    May 3, 2014 Sensu導入と初期設定についての続きのエントリーになります。 pluginの書き方 http://sensuapp.org/docs/0.12/checks http://sensuapp.org/docs/0.12/adding_a_check 上記ドキュメントを参考にして頂くとわかる通り status code が0であればOK status code が1であればWARNING status code が2であればCRITICAL status code が3であればUNKNOWN という方法で監視を行います。 コミュニティプラグインを確認すると、そのほとんどが require 'sensu-plugin/check/cli'を呼び出していることがわかります。 https://github.com/sensu/sensu-plugin check用のメソッド

  • 第361回 Sensuでサーバーのリソースを可視化しよう | gihyo.jp

    (読者がじゃぶじゃぶ可視化したくなるようなメトリクス心を煽りまくるリードテキスト。) 迫り来るクライシスに備えて Recipeの第359回では水野さんが「Muninでサーバーのリソースを可視化しよう」と題して、継続的なメトリクスの収集と可視化もまた、障害の予防や振り返りにとって重要であることを説いてくれました。 ロードアベレージやメモリ・ディスクの使用量など数値化でき、その時間変化が重要な情報に対して、Muninはとても便利なツールです。しかし世の中にある監視したいものすべてが数値化できるとは限りません。サービスの死活、ファイルのチェックサム、ハードウェアのステータス、うつろいやすい彼女[1]の気持ち。その一瞬の輝きが重要な定性的な情報を、継続的に監視したい場合もあるでしょう[2]⁠。 さらに最近はクラウド上に何台ものインスタンスを立ち上げたり、そのインタンス上でもDockerLXCで複

    第361回 Sensuでサーバーのリソースを可視化しよう | gihyo.jp
  • Sensu と Graphite による大規模インフラの監視

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog サイトオペレーション部の渡邉です。 サイトオペレーション部はデータセンタ・ネットワーク・サーバー・OS・ストレージといった全社的なインフラの管理運用や調査検証などを担当しています。 今回は、2013年に全社のプライベートクラウドとして導入した OpenStack の監視基盤として、OSS の Sensu と Graphite を採用した事例についてご紹介したいと思います。 採用に至るまで サイトオペレーション部では、もともと 2011 年から内製のプライベートクラウドを開発運用していました。 プライベートクラウドでは VM のホストとなるハイパーバイザを大量に運用する必要がありますが、その監視基盤として社内で一般的に利用され

    Sensu と Graphite による大規模インフラの監視
  • Sensu Deep Talks #1

    Kaizen Platform, Inc.の監視の話

    Sensu Deep Talks #1
  • AWSで構築した環境にありがちなシェルスクリプトたち まとめ | DevelopersIO

    AWSでサーバを運用する際にはEC2からAWS CLIを使って他のAWSのサービスと連携したりすることがあると思いますが、AWS環境ならではのシェルスクリプトを集めてみました。AWS CLIのバージョンは1.7.13、Pythonのバージョンは2.6.9を使っています。私はAmazon Linuxで動作を確認しています。 目次 準備する AWS CLIのインストール AWS CLIのアップデート aws configureでセットアップする IAM roles for EC2 instancesに関して 監視系 CloudWatchでカスタムメトリクスを設定する ZabbixからCloudWatchの値を取得する プロセス監視する バックアップ系 AMIとEBSのバックアップを作成する RDSのスナップショットを作成する S3のフォルダを削除する 便利スクリプト系 Route53の自動登録

    AWSで構築した環境にありがちなシェルスクリプトたち まとめ | DevelopersIO
    strsk
    strsk 2015/03/12
  • 【入門】PrometheusでサーバやDockerコンテナのリソース監視 | Pocketstudio.jp log3

    新しい監視ツールとして開発途上の Prometheus 概要と、インストール・設定方法、そして複数サーバのCPUやメモリ情報を参照したり、Docker コンテナ情報の取得方法、そしてアラートの確認の仕方を調べました。実際使い始めるまで少々とまどった所もあり、Prometheus を知りたい方、使いたい方向けに、ここで共有します。 ■ Prometheus とは? Prometheus(プロメテウス)は、オープンソースのサービス監視システムと時系列データベースであり、要は監視ツールです。先月末にバージョン 0.1.0 が公開され、目下開発が進んでいます。開発は、音楽のソーシャル・プラットフォームを展開しているSoundCloud社によって2012年から行われ、数千ものサーバを管理することが目的でした。現在はGitHub上で公開されています。開発言語は Go です。 ■ これまでの監視ツールと

    【入門】PrometheusでサーバやDockerコンテナのリソース監視 | Pocketstudio.jp log3
  • Amazon ElastiCache (Redis OSS) とは - Amazon ElastiCache (Redis OSS)

    Amazon ElastiCache は、Redis OSS エンジンと Memcached エンジンの両方で動作します。関心のあるエンジンのガイドを使用してください。必要なエンジンがわからない場合は、このガイドの「Memcached と Redis OSS の独自設計型キャッシュの比較」を参照してください。 サーバーレスキャッシュ ElastiCache (Redis OSS) はサーバーレスキャッシュを提供するため、アプリケーションの Redis ベースのキャッシュの追加と操作が簡素化されます。 ElastiCache (Redis OSS) Serverless を使用すると、可用性の高いキャッシュを 1 分以内に作成でき、インスタンスのプロビジョニングやノードやクラスターの設定が不要になります。デベロッパーは、 ElastiCache コンソール、SDK、または CLI を使用して

  • ZabbixでAWS/CloudWatchの値を取得してみた | Developers.IO

    CloudWatchの値をZabbix側でも見られるようにしたので、その手順を共有します。 CloudWatchの値をZabbixで取りたい理由 Zabbixでは最初から非常に多くの項目を監視できるのですが、AWS等のクラウドを利用していると、必要だけど監視できない項目が出てきます。RDSやELB等のフルマネッジドサービスのリソース状況はもちろんのこと、EC2のCPU使用率といった一見Zabbixで監視できそうなリソースも、実は正確な値は取れていません。 一方、CloudWatchはEC2内部の情報、例えばロードアベレージやプロセスの監視はできません。また、データの保持期間が14日間なので古い情報は見られません。 そこで、CloudWatchの情報をZabbixに貯めるようにすれば、、両方を一元的に管理できるし、情報の保持期間も好きなように設定できるようになります。 Zabbixの外部チェ

    ZabbixでAWS/CloudWatchの値を取得してみた | Developers.IO
  • muninをちょっぱやにする方法 - ぶていのログでぶログ

    この記事は、Pepabo Advent Calendar 2014の14日目の記事です。 昨日は、 としやさんのマネージャーができるサービス監視 でした。 マネージャーがサービス監視をしていると、障害発生時の ヤバさ がすぐに伝わっていいですね! 過去に、障害時のオペレーションをしている時に役員の方々全員が仁王立ちしているなんてことがありました。。(ペパボ入社前の話です) 今年2月にペパボに入社して、もう年末なんて時の流れは早いですね。 去年の今頃はニートしつつ艦コレしつつあんちぽサンタをみつつ、 次の職場どうするかなぁ〜なんて考えてました。 そんな私も入社してからmuninばかりいじっていたら、社内ではmunin職人と呼ばれるようになりました(ドヤッ 今まで、muninネタを幾つか書いてきたのですが、今回はちょっぱやにする方法を書きたいと思います。 (※ なお、効果には個人差があります)

    muninをちょっぱやにする方法 - ぶていのログでぶログ