コンテナ化されたアプリケーションの複雑さを解消するとして定評を得ているKubernetes。サービスを検出し、負荷分散を組み込み、リソースの健全性をチェックする他、コンテナを自動的に再起動しアプリケーションの自己修復を可能にするなど、多くの強みを持つ。その一方で、運用と可観測性においては、課題ももたらす。 Kubernetesによりアプリケーションのデプロイ/スケーリング/管理は簡素化されるが、インストールや構成、管理は複雑化する。またリカバリーが“機能しすぎる”ことにより、問題発生時に根本原因を探せなくなることもある。これらを回避するには、SRE(Site Reliability Engineer)と開発者の双方が、アプリケーションとそれが実行されるKubernetes環境との“依存関係”を理解する必要がある。 そこで活用したいのが、モダンアプリケーションの監視/可観測性/分析が必要な企