タグ

SREに関するpamucatのブックマーク (7)

  • Google、SRE本の第三弾「Building Secure and Reliable Systems」を無料公開

    Google、SREの第三弾「Building Secure and Reliable Systems」を無料公開 GoogleはSite Reliability Engineering(SRE)に関連する書籍として、これまで「Site Reliability Engineering」「The Site Reliability Workbook」の2冊を無料で公開してきました。 このSREの第三弾として、Googleは「Building Secure and Reliable Systems」の無料公開を開始しました。 「Site Reliability Engineering」(SRE)とは、GoogleのシニアVPであるBen Treynor氏が提唱した、高い信頼性や性能を発揮するシステムインフラを実現し、改善していくアプローチのひとつです。 そしてこのアプローチは、前述の通り20

    Google、SRE本の第三弾「Building Secure and Reliable Systems」を無料公開
  • 【SRE Next 2020】発表資料まとめ - Qiita

    Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationYou can use dark themeWhat you can do with signing up

    【SRE Next 2020】発表資料まとめ - Qiita
    pamucat
    pamucat 2020/01/28
  • インシデント指揮官トレーニングの手引き | Yakst

    [SRE]原文 An Incident Command Training Handbook – Dan Slimmon (English) 原文著者 Dan Slimmon 原文公開日 2019-06-24 翻訳依頼者 翻訳者 meiq 翻訳レビュアー doublemarket 原著者への翻訳報告 1723日前 Twitterで報告済み 編集 私が Hashicorp で担った最初の仕事のひとつは、社内向けのインシデント指揮官のトレーニング資料を作ることでした。 これは私自身がインシデントへの対処にあたりながら何年ものあいだ肌身に感じてきた、あらゆる類の考えをまとめ上げる良い機会となり、最高に面白いタスクでした。 以下は私の書いたトレーニング資料、ほぼそのままです。 あなたがインシデントレスポンスのポリシーを定義するにせよ、即興でインシデントレスポンスを行うにせよ、お役に立てたら幸いです。

  • PagerDuty Incident Response Documentation

    Home Being On-Call Before an Incident During an Incident After an Incident Crisis Response Training Additional Resources Getting Started On-Call Being On-Call Who's On-Call? Alerting Principles Before an Incident What is an Incident? Severity Levels Different Roles Call Etiquette Complex Incidents During an Incident During an Incident External Communication Guidelines Security Incident After an In

    PagerDuty Incident Response Documentation
  • Webパフォーマンス虎の巻

    Webパフォーマンス向上施策のために、今更ながら超速1を読んだので、今までの自分の知見と合わせてまとめてみます。 なるべく柔らかく、改善施策ってまず何をどうすればいいの?という疑問を持った人に向けて書いています。 ▪️格言 そもそもWebは速い。遅くしているのは我々です。大抵は技術の問題ではなくて、人の問題。 引用元: テクニックではなく、今、気で取り組むべきWebパフォーマンス (html5jパフォーマンス部 部長 竹洞さん) 心得 パフォーマンス向上に対する施策は大別すると以下の2通り 軽量化 (単純にやりとりするデータ容量を小さくすること) 圧縮 削除 最適化 (その時に最も適している実装・実行をとること) 経路・順番の変更 非同期 もっとも遅くしている原因を探して、それを対策するのが原則。「対効果」が絶対的正義である。手段から入るのは愚策。まず先に原因を知ることが重要。 ▪️1

    Webパフォーマンス虎の巻
  • インフラチーム改め Site Reliability Engineering (SRE) チームになりました

    インフラチーム改め Site Reliability Engineering (SRE) チームになりました Organization Author: kazeburo インフラチーム改めSite Reliability Engineering チームの @kazeburo です。この記事ではまだ馴染みの薄い Site Reliability Engineer とは何かについて紹介したいと思います。 SREとGoogleのSRE Site Reliability Engineerは日語にすると「サイト信頼性エンジニア」となりますが、あまりキャッチーではないので普段は略語の「SRE」を使用しています。SREという職種は日ではあまり聞く事はありませんが、FacebookやAirbnb、Dropboxなどの企業でSREが募集され、それぞれのサービスを支える重要な役割を担っていると思われます。

    インフラチーム改め Site Reliability Engineering (SRE) チームになりました
  • DevOps が好きですか?SRE をお待ちください | Atlassian

    サイト信頼性エンジニアリング (SRE) ― これはあなたが一度も耳にしたことのない、最も重要な頭字語かもしれません。以下、その理由をお話します。 Google という名の会社のことは、恐らくご存知でしょう。同社は、無人運転者や宇宙エレベーターといったカッコいいものを発明してます。それから Gmail、Google Docs、そして Google Maps といった、大成功を収めたアプリケーションも開発しています。成功を収めるアプリケーション開発に関して、かなりのことを理解している会社だといって間違いないでしょう。 また、彼らはサイト信頼性エンジニアリング (SRE) というムーブメントを始めたパイオニアでもあります。SRE は、開発と運営が大昔から続けてきた争いを見事に終結してくれます。製品の信頼性、アカウンタビリティ、イノベーションを奨励しながらも、ゴチャゴチャとした争いを伴わなくて済

    DevOps が好きですか?SRE をお待ちください | Atlassian
  • 1