こんにちは。SRE チームの清水です。 普段は GKE ベースのアプリケーション基盤 Vessel の開発や、メトリクス収集基盤の整備、GCP の社内セキュリティ対策などに関わっています。 SRE チームでは、全社横断のアプリケーション基盤として Vessel を開発・運用しています。 詳細は 日経の次世代アプリケーション基盤「Vessel」の紹介 も併せて御覧ください。 Vessel では様々な障害に備え、月次で障害訓練を実施しています。 これにより、障害に対する Vessel の開発チームメンバの知識の向上、対応力の強化を目指しています。 本記事では、Vessel における障害訓練のフレームワークのほか、GKE クラスタにおける障害注入の事例も紹介します。 みなさまの GKE クラスタ運用や障害訓練の参考になれば幸いです。 Vesselにおける障害訓練のフレームワーク はじめに Ves