2020年1月2日のブックマーク (3件)

  • なぜ日本の運用業務はつらいのか /20190910-most-important-for-operation

    運用現場が「つらい」のはなぜかについて説明した簡単な資料です。 運用自動化や運用改善をする前に、一度じっくりと考えるための土台として作成しました。 (2019-09-12更新) - 「ダイジェスト」を追加しました。 - 「参考: 処方箋としての資料」セクションを追加しました。 (2019-09-11更新) - 「運用のつらさ」を説明するスライドを追加しました。 - 「海外仕事のやり方 (運用業務を含む)」セクションを追加しました。 (運用設計ラボ合同会社 波田野裕一)

    なぜ日本の運用業務はつらいのか /20190910-most-important-for-operation
  • 2018-2019年のサービス障害を振り返る - # cat /var/log/stereocat | tail -n3

    ときどき思い出したように書いている障害事例まとめです。こういうのをやるならせめて年1回くらいはまとめないとダメだね……。昔の記事だと経緯や内容を覚えていないし、ニュース記事 (特に新聞社の記事や企業の障害に関するリリース記事) が消えてしまっていたりする。年末にまとめてドカッと振り返るのはしんどい。 2016-2017年のサービス障害を振り返る - # cat /var/log/stereocat | tail -n3 「なぜ障害事例をまとめているのか」についてはこっちに書いた内容そのままなのでこちらを参照してください。 DC/クラウド/通信事業者サービスの障害事例よせあつめ - # cat /var/log/stereocat | tail -n3 2010-2016あたりまでのメジャーな障害事例のまとめ 基的には自分がブックマーク等でクリップしたものをもとにまとめています。主要なニュ

    2018-2019年のサービス障害を振り返る - # cat /var/log/stereocat | tail -n3
  • 今日からできる。初めての障害対応ガイド | DevelopersIO

    はじめに こむろ@札幌です。 今年もまた大きなプロジェクトのサービス運用を担当し、サービス運用経験者としていろんなところに顔を出したりことの多い1年でした。自分自身が障害対応の前線に立つだけでなく、ほかの人の障害対応の手伝いをするなど、いろんな視点で運用の現場に関わってきました。 元々サービスのまともな運用経験ゼロの私が、多様な技術的負債や自分があまりかかわっていないサービスの運用を紆余曲折の結果、抱えるようになって数年経過し、サービス運用にまつわる様々な知見が蓄積しました。2019年の締めにそれらをまとめて文章にしておこうと思います。 今回のターゲットは開発をメインでやっているエンジニアです。運用を経験したことがない人にとっては、障害対応時にどのように立ち回ってよいのかがわからず、なんとなく行動した結果、サービス利用者への障害が長引いてしまう、状況をより悪化させてしまう、といった状態を招

    今日からできる。初めての障害対応ガイド | DevelopersIO