タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

SREに関するuchida75cmのブックマーク (3)

  • 開発メンバーの保守運用スキルを上げるため実施している朝当番制度の紹介 - Classi開発者ブログ

    こんにちは、開発支援部基盤インフラチームの kenryooo です。 Classiでは過去の高負荷によるアクセス障害での反省を踏まえ、エンジニア向けに保守運用スキルを高める施策として、朝当番という制度を運用しています。今回はその紹介をします。 目的 朝当番制度は、下記を目的に運用しています。 Classiのピークタイム(毎朝8:00 - 9:30)に問題が起きた場合、社内向けにスムーズな情報連携を行う サービス品質の継続的な改善 パフォーマンスや監視内容に異常があった場合や、依存している外部接続システムやSaaSのメンテナンス情報などを担当チームへ共有する 担当エンジニアの育成 Classiシステムの全体像の理解 担当外のアプリケーション(リポジトリ)の理解 システム監視の入門(Datadog) インシデントハンドリングの入門 背景と課題 朝当番制度は、下記の背景と課題感からスタートしてい

    開発メンバーの保守運用スキルを上げるため実施している朝当番制度の紹介 - Classi開発者ブログ
  • 今更だけど、SREとは何かについてまとめる - Qiita

    バズワード化して何やらふわっと そういう感じ という扱いになっているSREというものについて、何をする人なのかわかりやすく説明したいと思います。 ※概ねSREに書いてあるままですが、Googleの中の人とSREについて話をしたり、色々した結果得られた個人的な見解です。 TL;DR SREとは - ソフトウェアエンジニアに運用チームの設計を依頼したときにできあがるもの - 運用業務とその自動化や全体的な効率化をする人たち よくある誤解 SREは運用自体はしないんでしょ? 違います。ソフトウェアエンジニアであり、運用をする人です。 Continuous Deliveryにあるように自動化のためにも運用をする必要があります。 SREはインフラエンジニアのことでしょ? 違います。ソフトウェアエンジニアであり、運用をする人です。 SREは運用するだけでしょ? 違います。半分以上の時間をソフトウェア

    今更だけど、SREとは何かについてまとめる - Qiita
  • Books For Site Reliability Engineering

    By: Heather Adkins, Betsy Beyer, Paul Blankinship, Ana Oprea, Piotr Lewandowski, Adam Stubblefield Can a system be considered truly reliable if it isn't fundamentally secure? Or can it be considered secure if it's unreliable? Security is crucial to the design and operation of scalable systems in production, as it plays an important part in product quality, performance, and availability. In this bo

  • 1