タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

sreに関するninininninninのブックマーク (2)

  • MackerelでSLOとエラーバジェットを運用するためのツール shimesaba - KAYAC engineers' blog

    この記事はMackerel Advent Calendar 2021の7日目です。 こんにちは、SREチーム所属の@mashiikeです。 皆様はSLOとエラーバジェットという言葉を聞いたことはありますか? サービスの信頼性を保証することを目標するSRE(Site Reliability Engineer/Site Reliability Engineering)の領域に携わってる方なら聞いたことがあると思います。 今回は、SLOとエラーバジェットに関して、Mackerelを用いてサービス/サーバー監視をしている際に便利なツールとして shimesaba というものを作った話をします。 github.com はじめに 題に入る前に、SLIやSLO, エラーバジェットという言葉について触れておきます。 これらの言葉は、ざっくりと説明すると以下のようになります。 SLI(Service Le

    MackerelでSLOとエラーバジェットを運用するためのツール shimesaba - KAYAC engineers' blog
  • バーンレートアラート

    概要SLO バーンレートアラートは、SLO エラーバジェットの消費率が指定した閾値を超え、それが特定の期間継続した場合に通知されます。たとえば、SLO の 30 日間目標に対して、過去 5 分間で過去 1 時間に 14.4 以上のバーンレートが測定された場合にアラートを設定できます。また、アラートが必要な閾値より少し低い閾値、例えば 7.2 以上のバーンレートが観測された場合にオプションで警告を出すように設定することができます。 注: バーンレートアラートは、メトリクスモニターの種類(メトリクス、インテグレーション、APM メトリクス、異常検知、予測値、外れ値モニター)のみで構成されたメトリクスベースの SLO またはモニターベースの SLO でのみ利用可能です。 バーンレートアラートの仕組みバーンレートとは、Google の造語で、SLO の目標長に対してエラーバジェットがどの程度速く消

    バーンレートアラート
  • 1