SREの@biosugar0です。 SREチームでは、スマートマットクラウド、スマートマットライトの信頼性を維持、向上するために2つのプロダクトを横断してシステムの安定性と開発者体験の向上に取り組んでいます。 今回は、最近始めたAsanaを用いたSREの運用負荷の計測とトラッキングについて紹介します。 SREとトイルSREがサイト信頼性エンジニアリングに取り組んでいく際に重要な概念のひとつに、 トイル があります。 トイルとはSREが日々行うタスクのうち、手作業であり、繰り返され、自動化が可能であり、計画されたものではなく割り込みで始まり、長期的な価値を産まず、サービスの成長に対して比例して追加で作業が必要になるようなタスクを指します。 SREの発祥のGoogleと同じく、弊社のSREチームでも運用業務(つまりはトイル)を、各人の作業時間の50%以下に抑えるという原則が掲げられています。
![トイルの計測とトラッキングを始めました | スマートショッピング](https://cdn-ak-scissors.b.st-hatena.com/image/square/4db5b3deac54538fc415f1cb1ad5ac426ea925e5/height=288;version=1;width=512/https%3A%2F%2Fimages.ctfassets.net%2Ff7w8g4ojl1wx%2F35mYrCWoyjerHlPBIN07KD%2F3d507341fcdb8e8741b73e284416f704%2Fkaichu_dokei.png)