タグ

ブックマーク / developer.smartnews.com (1)

  • スマートニュースにおける Incident との向き合い方 - SmartNews Engineering Blog

    はじめに Site Reliability Engineering チームの Engineering Manager 尾形(@nobu666)です。考えてみたら SRE チームに関してこの Blog でネタにしたことがなかったことに今更気づいてしまいました。UZABASE さん主催の SRE Lounge #3 でも少し触れたのですが、今回は Incident への対応から、Report の書き方、そしてその Review について紹介しようと思います。 Incident Incident Review は障害の振り返り会のことを指します。ポストモーテムということもあります。その前に、そもそも Incident とはなんでしょうか。会社によって定義は様々だと思いますが、弊社においては「ユーザ、あるいは顧客(広告主であったり媒体社であったり)に直接的な影響が出た障害」を Incident と

    スマートニュースにおける Incident との向き合い方 - SmartNews Engineering Blog
    ot2sy39
    ot2sy39 2018/07/19
    レポートを書く事象の発生頻度を知りたい。個人的には、対策が増えてきたときのリファクタリングが欠かせないと考えている。
  • 1