はじめに Site Reliability Engineering チームの Engineering Manager 尾形(@nobu666)です。考えてみたら SRE チームに関してこの Blog でネタにしたことがなかったことに今更気づいてしまいました。UZABASE さん主催の SRE Lounge #3 でも少し触れたのですが、今回は Incident への対応から、Report の書き方、そしてその Review について紹介しようと思います。 Incident Incident Review は障害の振り返り会のことを指します。ポストモーテムということもあります。その前に、そもそも Incident とはなんでしょうか。会社によって定義は様々だと思いますが、弊社においては「ユーザ、あるいは顧客(広告主であったり媒体社であったり)に直接的な影響が出た障害」を Incident と
![スマートニュースにおける Incident との向き合い方 - SmartNews Engineering Blog](https://cdn-ak-scissors.b.st-hatena.com/image/square/9919a4c95bcbf92f1996a749b095337edea2b62d/height=288;version=1;width=512/https%3A%2F%2Fdeveloper.smartnews.com%2Fblog%2Fimages%2F2018%2F07%2Fincident_review%2F5aeccb28-e7d2-d915-f84e-10bf87b9dd08.png)