[B! 監視] maecchiのブックマーク

maecchi id:maecchi

監視に関するmaecchiのブックマーク (4)

入門入門監視 / reading-practical-monitoring
「入門監視」を読んだので、自分たちのチームに当てはめて考えてみる
maecchi 2021/02/21
アラート設定をがちがちにすると、見たけどアクションしなかったものが多くなって結局対応しなくなってしまうのが多くなるから気をつけたい。

監視

運用
リンク
障害対応時にまずはissueを作ると良い - そーだいなるらくがき帳
先日のAmazon SQSの障害には色々と肝を冷やした人も多いのではないでしょうか。 classmethod.jp 今回のようなケースとは別に障害は大小あれど、みなさん日々戦っていることだと思います。障害対応はエンジニアの花形であるものの、サービスに対する知識やソフトウェアの知識など経験と技術の両方が必要です。そのため、どうしてもトラブルシューティングはエースエンジニアなどの一部の人に依存してしまう…などの問題が発生しがちです。そこで今日は私の経験から障害対応のいろはを書いて行きたいと思います。今回のスコープの外実際に障害時の具体的な対応、例えば障害切り分けやRDBMSのボトルネックの探し方などの話はしません。まずissueを作ると良い本題です。トラブルを認知したらまずはissueを作りましょう。 issueを作るときはtemplateが事前に設定されていると便利です。 g
maecchi 2020/04/30
障害履歴を残すためにもIssue作成はかなり大事

監視

障害
リンク
書評「入門　監視」雰囲気で監視をやっているすべての人にオススメ | DevelopersIO
監視という一種マニアックな領域を真正面から解説した貴重な本です。監視で悩む人のみならずシステム開発に携わるすべての人にオススメ。「全然わからない。俺たちは雰囲気で監視をやっている」自分はAWS事業本部コンサルティング部所属ということもあって、いろんなお客様にAWSインフラのコンサルティングしてます。最初のインフラ構成設計時に監視の話をすることも非常に多いんですが、「どうしましょう。CloudWatchでいけますかね？」「MackerelとかDatadogとかもありますが、どうしましょ。マネージドとの違いは〜」「とりあえず、ディスク使用率80%でしきい値設定しておきましょうか。みんなそうしてますよ」とか言っていた昔の自分に見せつけたい本、それが今回紹介する「入門　監視」。監視設計の原則がよくわかんないメトリクスのしきい値決めるところから監視を考えてしまいがちよく考えずに、い
maecchi 2019/01/21
まだ読み途中だけど、ちょくちょくNagiosさんが名指しでディスられている

監視

本
リンク
サーバ運用の現場でひたすら監視し続けるエンジニアの手の内のすべて
2013年3月19日 Tokyo Linux Study #5 #tlstudy の発表スライドです。 ZABBIX(赤) × Munin(緑) 。どうして両方を使う事になったのか？という話しがメイン。サブタイトル「@zembutsuがホスティングサービスの監視パワーを強化しようとするけどとんでもないことになる話」 Read less
maecchi 2013/03/21
運用

エンジニア

監視
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx