はじめに はじめまして、 strsbn です。 私は SREチームの一員として もしくは Infraチームの一員として、業務委託契約を複数社と交しインフラレイヤーの業務を行なっております。 本日一つの発見と共に、自分としてしっくり来た感じがしたので考えを記載しておこうと思います。 SRE とは。 SRE とは Google が提唱すr(以下略 ありふれた概要なので飛ばします。 主たる概念 SLOの採用 SLOに基づくアラート設定 エラーバジェットの採用 Toil計測/撲滅 派生して 自動化 ≒ Infrastructure as Code モニタリング ≒ 監視システム オンコール ≒ インフラレイヤの障害 ポストモーテム 負荷の管理 結論 SREチームとは、インフラレイヤを設計管理開発運用するインフラチーム改め、SREチームです!ではなく、 SRE の 考え方 概念 を伝搬し、 SREの