2024.3.22(金) SRE観点での技術負債 懺悔会 2024 https://mixi.connpass.com/event/312191/
2024.3.22(金) SRE観点での技術負債 懺悔会 2024 https://mixi.connpass.com/event/312191/
はじめに こんにちは、情報システム部 SRE 橋本です。 普段はクラウドエンジニア(SRE)としてチームリードをしています。興味関心がインフラ、Observability、SRE、Security、Golangといった分野であり、 Japan Google Cloud Usergroup for Enterprise(Jagu’e’r ジャガーと読みます)でObservability/SRE分科会のオーナーを担当させていただいております。その縁もあって先日Innovators Hive at Cloud Next 2022でコミュニティ運営についてお話をさせていただきました。 この記事では現在チームリードをしていてビルドアップ中でもあるSREチームについて考えていることをお話したいと思います。 また、このSREチームについてのインタビュー記事も掲載いたしました。メンバーやチームの雰囲気を伝
岩崎です。自分はギターを弾くのが趣味なんですが、最近はよく晴れた日に河原で練習したりして楽しんでいます。島岡さんのベースに触発されてというわけではないのですが、音楽は楽しいですね(^^) さて、今回はCAMPFIRE SREにおける指標の可視化について書きたいと思います。 サービスレベル目標SREにおいて、サービスレベルの定義は重要です。サービスレベルを指標化し目標を定義することによって初めてエラーバジェットの策定や効果的な改善が可能になります。SLA(サービスレベルアグリーメント)を設定するかはサービスによって異なるでしょうが、SLI(サービスレベル指標)とSLO(サービスレベル目標)はサービスの種類に関わらず設定するべきでしょう。 CAMPFIREではサービスレベル目標に可用性を設定しており、サービスレベル指標にはMackerelのアラートを置いています。アラートの設定はCPUやメモリ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く