[B! 監視] gologo13のブックマーク

gologo13 id:gologo13

監視に関するgologo13のブックマーク (9)

負荷低すぎはもはや障害じゃないのか - mikedaの日記
前のブログの続きで、もにかじ7で話した小ネタその2。実際にサービスでなんかやったというのじゃなく、こういうこと考えてるんだけどみんなどうしてます？って話です。まずオンプレ時代はサーバのスペックダウンはけっこう大変だったし、頑張ってメモリやCPU引っこ抜いてもそんなに節約にならなかった。 ※CPUやメモリはサーバ価格の一部でしかないし、ラック費用(消費電力)もあるし。でもクラウド前提だとスペックダウンはとても簡単で、スペック半分にすると価格も半分になる。そうすると、『イベントで一時的にc4.4xlarge(8万/月)にして、そのまま最大CPU使用率10%とかで数ヶ月放置されている』みたいなのはビジネス的な損失という意味で明らかに障害で、監視すべきじゃないだろうか？みんななんかやってますか？というようなことを参加者に聞いてみました。参加者の中では、AutoScalingしてい
gologo13 2015/02/01
ec2

AWS

監視

business
リンク
Sensu と Graphite による大規模インフラの監視
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog サイトオペレーション本部の渡邉です。サイトオペレーション本部はデータセンタ・ネットワーク・サーバー・OS・ストレージといった全社的なインフラの管理運用や調査検証などを担当しています。今回は、2013年に全社のプライベートクラウドとして導入した OpenStack の監視基盤として、OSS の Sensu と Graphite を採用した事例についてご紹介したいと思います。採用に至るまでサイトオペレーション本部では、もともと 2011 年から内製のプライベートクラウドを開発運用していました。プライベートクラウドでは VM のホストとなるハイパーバイザを大量に運用する必要がありますが、その監視基盤として社内で一般的に利用され
gologo13 2014/12/11
Nagios

graphite

architecture

monitoring

sensu

監視
リンク
監視アーキテクチャ(Sensu,Pingdom,Mackerel,StatusPage.io,PagerDuty)についてまとめてみる(2014年12月版) - Glide Note
Sensu Advent Calendarに便乗して、Kaizen Platform, Inc.の2014年12月現在の監視アーキテクチャの話をちょっとしてみようと思う。モニタリング領域サービスを監視している領域 Pingdom Pingdom - Website Monitoring 外部ネットワークからのサービスの死活監視。アメリカ、ヨーロッパ、アジアなどの拠点からサービスの死活監視が出来るため、特定の地域からアクセス出来ない場合なのが検知出来る。後述するstatuspage.ioとの連携で、障害を検知すると、サービスのステータス状況が自動で変わるようになっている Sensu Sensu | The open source monitoring framework. 監視フレームワークサーバを内部ネットワークから監視するために利用サーバのプロセス監視、サーバ間の疎通監視、エラ
gologo13 2014/12/04
楽しそう。費用が気になる。

kaizen

monitoring

監視

sensu

mackerel
リンク
ご注文は監視自動化ですか？
『ご注文は監視自動化ですか？』 Serf と Consul を使って運用を楽しくする話 Serf とか Consul とか聞くけど、イマイチわからん！という疑問はありませんか。どのような働きをするのかや、使いどころを、皆さんと共有したいなと思っています。 1. はじめに 2. 基本編・ Serf ・ Consul ・ envconsul 3. 実践編・ API 連携 4. まとめ July Tech Festa 2014 June 22, 2014, @ AITT Shinagawa, Tokyo, Japan #techfesta #jtf2014 Read less
gologo13 2014/06/24
munin

monitoring

slideshare

監視

運用

serf

consul
リンク
Sensuについて - maoeのブログ
最近Sensuというモニタリングフレームワークを試している。見ての通り公式はオサレで今時な感じで、Nagiosのような古くささやZabbixのようなエンタープライズ臭はない。 Sensuの特徴は何かと考えると、こんな感じのことが浮かぶ。監視とメトリクス収集を一つの仕組みで行える。ただし収集したデータの可視化はしない。設定がlightweight 所定のディレクトリにJSONファイルをつっこんでおくと勝手にdeep mergeされるのでinclude指定とかいらないし、ポチポチやってデータベースに設定値を入れる必要もない。キーがかぶったときにどうなるかとかは知らないので、設定がシンプルとは言わない。 JSONなのでコメントは書けない。コメントはChefのレシピ側に書こうという発想。クライアント一覧は自動的に作られるので自分で能動的に登録する必要もない。 Chefで設定するためのco
gologo13 2014/04/12
chef

sensu

Monitoring

監視
リンク
Sensuを使って自由度の高い監視システムの構築を行う方法
SensuとはSensuはhttp://sensuapp.org/で公開されているオープンソース(MITライセンス)のモニタリングフレームワークです。特徴以下のような特徴があります（公式サイトの記述を整理）シンプルで融通が効き拡張性があるモニタリングフレームワークエージェント、メッセージバス、イベントプロセッサーの機能を提供要件にあわせて他のツールとの組み合わせが可能クラウドを意識して開発自動でクライアント(監視対象）を登録コミュニティが活発RubyのEventMachineを使って作られているコードはGitHubでホストされ、テストコードは高いカバレージ。TravisCIで継続的インテグレーションを実施Nagiosのプラグインを再利用可能設定はすべてJSONファイルで行うRabbitMQを使ったメッセージ型のアーキテクチャーオムニバスインストーラーを提供個人的な見解としては、Sens
gologo13 2014/04/12
監視

Sensu

monitoring
リンク
監視ソフトをNagiosからSensuに切り替えて2ヶ月経ったのでまとめた - Glide Note
新規サービス用の監視をNagiosからsensuに切り替えて2ヶ月経ったので、導入時の調査で社内で公開してたissueと、投入して2ヶ月間運用した記録を公開しておこうと思う。というか以前Sensuの事を書くと公言していたのに、すっかりサボっていて昨日@ma0eさんのブログを見て下記のやり取りを思い出して急いで書いた… @ma0e We started using it. @glidenote will report the detail soon, I think. — kentaro (@kentaro) 2013, 10月 30 @kentaro @glidenote that would be nice — Mitsutoshi Aoe/maoe (@ma0e) 2013, 10月 30 導入環境はCentOS 6.4で、利用しているsensuのバージョンは0.12.1-1にな
gologo13 2014/04/12
sensu

monitoring

監視
リンク
muninとZabbixで大規模サーバー群を監視
muninとは muninはサーバーリソース管理ツールです。とにかく、ひたすらグラフ化、可視化、見える化するツールです。名前の由来は、北欧神話の神オーディンに世界中の情報を収集して伝達するワタリガラスです。RRDtoolとPerlで作られています。こんなグラフを生成してサーバーのリソースをほぼリアルタイム（約5分おき）に伝えてくれます。私のサーバーのMuninは以下のアドレスで閲覧できます（自宅サーバーなので大規模ではないですが）。自宅サーバー http://www.testvps.info/munin/saito/geek.saito/index.html さくらVPS（1GB SSDプラン） http://www.testvps.info/munin/saito/testvps.saito/index.html Muninで監視できること Muninは以下のようなものをグ
gologo13 2014/04/06
Zabbix

munin

監視

サーバー監視
リンク
サーバ監視に超使える〜topコマンドのまとめ:phpspot開発日誌
サーバ監視に超使える〜topコマンドのまとめサーバを運用しているとよく使うtopコマンドですが、標準のtop以外にも色々便利なものがあるのでまとめてみました。ボトルネックといえば、ネットワーク、ディスクIO、スワップ、CPU、メモリといったものが関連しますが、ツールで視覚化することでより分かりやすい対策がとれますね。 htop こちらも、通常のtopよりもさらに多数の情報を表示してくれるツール。 CPUやメモリの状態が視覚的にグラフで表示されていたり、複数CPUがある場合もそれぞれに利用率を表示してくれてわかりやすいです。 pstreeで表示するようなツリー+topコマンドのような表示も t を押せば切り替えられます。公式サイト上にある128コア積んだマシンのhtop結果が面白い。次のようにすべてグラフで表示されているため、128コアあったとしても瞬時に負荷が把握できますね。 io
gologo13 2010/12/03
top

command

サーバ管理

サーバ監視

監視
リンク
1