タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

datadogとSREに関するthaimのブックマーク (1)

  • LAPRASにおけるSLO運用状況 | LAPRAS株式会社

    こんにちは、SRE(Site Reliability Enginner) の @showwin です。前回の LAPRASインフラチームで避難訓練を行いました の記事に引き継ぎ、今回もSREチームの取り組みの紹介です。 概要2021年2月からSLI, SLOを定めた運用を開始し、約半年が経過しました。導入の背景や、運用開始までの流れ、実際に運用してみて気付いたことをまとめました。 体制としては、SREチームはフルタイム1名、適宜手伝っていただけるメンバー2名で構成されており、アプリケーションエンジニアが9名です。また、サービスの利用者に対してはSLAを提示しておりません。このような状況下において運用されているという前提で読み進めていただけたら幸いです。 SLO導入に至った経緯前任のインフラエンジニア退職により、2020年9月より私がその役割を引き継いだのですが、なんとなくカッコ良さそうと

    LAPRASにおけるSLO運用状況 | LAPRAS株式会社
    thaim
    thaim 2021/10/06
    1人SREでここまでSLI/SLOの設計・運用ができるのすごい(適宜がどの程度かにもよるが)。datadogの時系列を可視化するのにRedashを使うのは、やりたくないけどやはりそうなるか。
  • 1