近年注目を集めるSRE(Site Reliability Engineering)。その実践には、Observability(可観測性)や設計の他、組織づくりや文化の醸成などが重要なカギを握るとされ、各々の組織に合う形で導入・運用されることが望ましいとされる。株式会社はてなでも、サーバー監視サービス「Mackerel」の開発チームで2019年より実践が開始され、組織全体に展開されてきた。その導入の背景や、DevOpsを達成するためのチーム編成などの経緯について、Mackerelチーム リードSREの古川雅大氏が経験を踏まえつつ紹介した。 株式会社はてな Mackerelチーム リードSRE 古川雅大氏 SREの第一歩は非エンジニアも含めた「SREの理解」から Googleが提唱した「SRE」は、いわばDevOpsの実践法であり、ツールや考え方の共通化、チーム構成などによって組織のサイロを減