エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Splunkの導入により、本番環境で発生する信頼性の問題を簡単に解決できるように
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Splunkの導入により、本番環境で発生する信頼性の問題を簡単に解決できるように
導入背景導入前の状況・課題 Splunk導入以前からGoogle CloudのCloud LoggingでトレースIDに紐づくログ... 導入背景導入前の状況・課題 Splunk導入以前からGoogle CloudのCloud LoggingでトレースIDに紐づくログを収集しており、必要に応じてログからシステムの挙動を読み取ることはできていました。また、サービス全体のSLOのアラートは設定されていました。 しかし、ログからシステムの挙動を読み取ることは可能であるものの、スキルが必要で、問題の発生時にはシステムに詳しい有識者しか原因箇所を特定できませんでした。加えて、SLOのアラートはシステム全体でしか設定できておらず、問題発生時に原因箇所の特定に時間が掛かっていたのが課題でした。 目指していた状態 本番環境で信頼性の問題が発生し、SLO (Service Level Objective) を達成できない可能性があるときに、誰でも簡単に原因箇所を絞り込み、早期に解決できる状態を目指していました。 また、システム全体だけでなく、