並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 642件

新着順 人気順

SREの検索結果201 - 240 件 / 642件

  • SRE NEXT 2023で「Runbookに何を書き、どのようにアラートを振り分けるか?」というお話をしました - ださろぐ@はてな

    登壇&参加記事です 今までのあらすじ(ずっとアラートの話してる気がする) 今回の発表まわりの蛇足 セッション ギークがイオンに飛び込んだ結果がやばい〜Reliabilityと経営〜 LINEスタンプのSREing事例集:大量のスパイクアクセスを捌くためのSREing エンジニアのためのSRE論文への招待 【コミュニティコラボ企画】パネルディスカッション 〜信頼性に関わる、ご近所さんが集まりました〜 ブルームバーグのセントラル・テレメトリー・システムが業務にもたらす価値 開発者とともに作る Site Reliability Engineering 信頼性目標とシステムアーキテクチャー セッション以外 今後について 今までのあらすじ(ずっとアラートの話してる気がする) 2020 dasalog.hatenablog.jp 2022 dasalog.hatenablog.jp 開発者とともに作る

      SRE NEXT 2023で「Runbookに何を書き、どのようにアラートを振り分けるか?」というお話をしました - ださろぐ@はてな
    • SREがセキュアなWebシステムを構築、維持するためにやれることはなにか / What can SRE do to build and maintain a secure Web system?

      SRE NEXT 2020 2020.1.25 "セキュリティ専門のエンジニアが組織にいない場合、古くなったソフトウェアのメンテナンス、鍵の管理、ファイアウォールの管理を誰が行うのか。それが曖昧な状況が長く続くとサービスが脆弱となり、やがて問題を引き起こすことでしょう。 サービスとシステムの信…

        SREがセキュアなWebシステムを構築、維持するためにやれることはなにか / What can SRE do to build and maintain a secure Web system?
      • SRE Practices in Mercari Microservices

        This is a slide for SRE NEXT 2020 (https://sre-next.dev/). Mercari Microservices Platform Team is building a platform for backend developers to buil…

          SRE Practices in Mercari Microservices
        • Amazon ElastiCache / Google Cloud Memorystore スペック変更時のダウンタイム比較 [DeNA インフラ SRE] | BLOG - DeNA Engineering

          2023.02.07 技術記事 Amazon ElastiCache / Google Cloud Memorystore スペック変更時のダウンタイム比較 [DeNA インフラ SRE] by Tomonori Hirata #infrastructure #ElastiCache #Memorystore #AWS #GCP #technical-verification はじめに こんにちは。インフラエンジニアの平田です。 IT 基盤部に所属し、全世界向けのゲームタイトルのインフラ運用を担当しています。 今回は、マネージドのインメモリキャッシューサービスである Amazon ElastiCache for Redis (以降 ElastiCache) と Google Cloud Memorystore for Redis (以降 Memorystore) のそれぞれについて、スペッ

            Amazon ElastiCache / Google Cloud Memorystore スペック変更時のダウンタイム比較 [DeNA インフラ SRE] | BLOG - DeNA Engineering
          • SRE for single-tiered software applications | Google Cloud Blog

            In cloud operations, we often hear about the benefits of microservices over monolithic architecture. Indeed, microservices help manage hardware being abstracted away and push developers towards resilient, distributed designs. However, many enterprises still have monolithic architectures which they need to maintain. For this post, we’ll use Wikipedia’s definition of a monolith: “A single-tiered sof

              SRE for single-tiered software applications | Google Cloud Blog
            • アジャイルなSREチームの運用

              LAPRAS株式会社でSREをしているyktakaha4と申します🐧 弊社のSREチームで最近運用をはじめた見積もりやふりかえりの手法について書きたいと思います 大規模な立ち上がり済みの組織向けでなく、今ひとりで仕事をしている人が2人目のSREを迎え入れたときの一事例としてご覧ください 経緯 弊社は2016年に創業して以来、ソフトウェアエンジニアとして入社した社員がアプリケーションからクラウドまでプロダクト全体を開発・運用するというスタイルが取られていましたが、 エンジニア組織の拡大に伴い、2021年頃からプロダクトの信頼性や可用性の向上を責務とする専任のSREを立ててシステムの改善をおこなってきました 以下は、弊社で導入しているホラクラシーに基づいて定義された Site Reliabilityサークル のロールの一覧です 原則として、ロールは誰であっても自由に負うことができるので、主務

                アジャイルなSREチームの運用
              • 日経電子版SREチーム立ち上げ中

                日経電子版を支えるSREチームが2019/1に発足しました。メディアとして安定したサービスを実現し、いつでもニュースをユーザーに届けられるようにすることは重要だと考えています。しかし、開発チームの体制は電子版を構成するシステムごとに分かれており、電子版全体の可用性、信頼性、アーキテクチャに責任を負うチー…

                  日経電子版SREチーム立ち上げ中
                • SRE Classroom: The Art of SLOs - Google

                  The Art of SLOsは、GoogleのCustomer Reliability Engineeringチームによって開発されたワークショップです。このワークショップの目的は、Googleがサービスの信頼性を計測する方法 サービスレベル指標(SLI) とサービスレベル目標 (SLO)を参加者に紹介し、実際にこれらの計測方法を作成することを体験してもらうことです。これらは重要で土台となる概念です。サービスの信頼性を客観的に測定する方法があれば、サービスの信頼性について有意義な会話をすることがはるかに簡単になります。 ワークショップの理論編では、開発チームと運用チームの間でしばしば生じる組織的な緊張を、サービスの望ましい信頼性を表す目標値を設定することで解決する方法を学びます。また、SLOとエラーバジェットを使って、データ駆動で、客観的、かつユーザー重視の方法でサービスの信頼性を測定・

                  • Google SRE Book Updates, by Topic

                    SRE Book Updates, by Topic Click on a chapter thumbnail to see relevant publications, conference talks, and workshops by Google SREs.

                    • 2021 年の SRE チームの活動について - Gunosy Tech Blog

                      はじめに SRE 部の茂木です。 こちらの記事は Gunosy Advent Calendar 2021 - Adventar の 21 日目の記事となります。 前回の記事はサンドバーグさんの 改めてドライブレコーダーを作ってみた - Gunosy Tech Blog でした。 かなりマニアックな内容となっていましたね。 さて、2017 年頃から 「SRE」という単語が世の中に出回ってから、数多くの実践が各企業で行われてきました。ですがその業務内容を詳細に公表している企業はそう多くはありません。 私は Gunosy に来てから正式な SRE チームに所属することになりましたが、 常にSRE の定義とは、難しいものがあるなと日々感じています(各社によって責任範囲や求められることがかなり違うため) 。 そこで今回は、 2021 年の Gunosy のSRE チームがどのような活動をしてきたかを

                        2021 年の SRE チームの活動について - Gunosy Tech Blog
                      • テックタッチに入社後1ヶ月でSRE部隊を作った話 - Techtouch Developers Blog

                        こんにちは、この記事はテックタッチアドベントカレンダー20日目を担当するエンジニアリングマネージャーの小林こと Kobaan です。 毎年クリスマスはフライドチキンをいろんなところから購入してます。去年は某コンビニのチキンを購入してましたが、今年はなんとコロナの影響からか品不足で、近隣の店舗では予約できなくなってました。残念。 今年は某フライドチキン専門店のチキンでクリスマスを祝おうと思います。 まずはエンジニアリングマネージャーの業務 主に二つのチームマネジメントとデリバリーマネジメントの業務を持っています。 この二つのチームの内訳としては下記となっています。 プロダクト機能開発チーム SREチーム 今回はその一つである SRE ( Site Reliability Engineering )チームについてお話しさせてください。 当初は保守対応部隊が存在しなかった 当初プロダクトサイドと

                          テックタッチに入社後1ヶ月でSRE部隊を作った話 - Techtouch Developers Blog
                        • SREエンジニアが目指すGKE共通デプロイ基盤の完成形 - ぐるなびをちょっと良くするエンジニアブログ

                          こんにちは。開発部門 開発部 Data AI Strategyセクション データ基盤 Unitの小野です。 2020年8月に入社してから早3年。SREエンジニアとして、日々業務改善に励んでいます。 ここ一年ほど、DAOという組織改善プロジェクトを推進していく中で、Google Kubernetes Engine (GKE)を使ったGKE共通デプロイ基盤の整備も進めてきました。 ※ DAOについての詳細はSREエンジニアが組織改善プロジェクトを立ち上げてみたを参照ください SREエンジニアの責務の一つは、プロダクトのリリースサイクルを極限まで短くし、次々と新しいサービスを世の中にリリースすることです。ChatGPTのような誰でも簡単に扱えるAIモデルが誕生したことで、プロダクト開発競争は今後ますます激しくなっていくと予想しており、SREエンジニアの責務の重要性をヒシヒシと感じています。 そう

                            SREエンジニアが目指すGKE共通デプロイ基盤の完成形 - ぐるなびをちょっと良くするエンジニアブログ
                          • チームでサービスの運用をうまく支えていくための取り組みについて ~SREを添えて~ | 株式会社ヌーラボ(Nulab inc.)

                            発表資料について 当時の発表資料とNuCon Mini 2022 Springで登壇した際の動画のリンクを埋め込んでおきますので、もしよろしければ御覧ください。 発表資料 「チームでサービスの運用をうまく支えていくための取り組み ~SREと共に~」 ちなみにこちらの動画では発表前にジョジョネタを盛り込んでいます。もしジョジョが好きな方がいましたら何部のセリフが使われているか当ててみてください。答えは当記事の最後にあります。 過去のGit Teamの体制と課題 Git Team誕生前 BacklogのSRE課にBacklogのGit機能の開発するメンバー1名を包含していました。メンバーはアプリケーションの開発・保守をメインで担当し、BacklogのGit機能に関連するサーバーの保守(kernel updateなど)はWebOperationが担当するという作業分担をしていました。 WebOp

                              チームでサービスの運用をうまく支えていくための取り組みについて ~SREを添えて~ | 株式会社ヌーラボ(Nulab inc.)
                            • みてねのSREによるグローバルサービスの体験を向上させる技術 | gihyo.jp

                              株式会社MIXIで『家族アルバム みてね』(⁠以下みてね)のSREグループに所属している尾関です。 みてねは2017年より海外でもサービス展開していまして、1,500万人を超えるユーザに175の国と地域でサービスを提供しています。そのうち3割以上が海外ユーザになります(2022年8月現在⁠)⁠。 事業としても市場規模の大きさから海外ユーザをもっと伸ばしていくことに注力しており、その中でSREグループは「世界中の家族が快適かつ安心に使えるサービスを提供する。」をミッションに掲げてきました。 本記事では、世界中の家族が快適に使うために行ってきたことの一部を紹介させていただきます。 これまでの改善の歴史 2017年:海外展開スタート 2015年のサービスリリース当時、みてねのバックエンドインフラはAWSの東京リージョンで構築していました。 そして2017年より海外展開を開始しましたが、当時はまだ

                                みてねのSREによるグローバルサービスの体験を向上させる技術 | gihyo.jp
                              • クラシルのSREをチーム化するときに意識した3つのことと半年間の実績 - dely Tech Blog

                                こちらは、「dely Advent Calendar 2021」21日目の記事です。 昨日は、PdM櫻本さんの「とりあえずやってみる。精神について」という記事でした。 何か新しいことにチャレンジしてみたいと思っている方は、ぜひ読んでみてください! はじめに こんにちは、クラシル開発部SREチームの松嶋です。 今年の10月に「SREがプロダクトの価値を最大化するためにチームとして取り組んできたこと」と題して、私たちが足元課題解決型の体制から脱却し、チームとして効果的に機能するために取り組んできたことについて5つ紹介しました。 tech.dely.jp こちらの記事で紹介している取り組みは、クラシルというプロダクトの成長を加速させていくために私たちは何をすべきなのか議論し、必要なことを地道に取り組んできただけなので、「これをやれば上手くいく!」というような銀の弾丸になるアクションは特にありませ

                                  クラシルのSREをチーム化するときに意識した3つのことと半年間の実績 - dely Tech Blog
                                • インフラの整備、SLIとSLOの設定、セール対策 Railsアプリケーションのユーザ体験を支えるSREの取り組み

                                  オリジナルグッズ作成・販売サービス「SUZURI byGMOペパボ」に関わるエンジニアメンバーや事業部長が登壇し、SUZURIの開発の今や、現在の課題・今後の取り組みについて話す「43万人超のクリエイターの表現活動を支える!ECプラットフォームSUZURIの開発の裏側」。ここでモバイル/Webアプリケーションエンジニアの時田氏が登壇。SRE活動として行っていることを紹介します。 自己紹介と今日話すこと 時田理氏(以下、時田):「SUZURIにおけるSREの取り組み」というタイトルで発表します。よろしくお願いします。自己紹介です。「SUZURI」というサービスのモバイルと、Webアプリケーションエンジニアをやっています。 今日話すことです。すみません、最初におことわりなんですけど、最初の仮のタイトルではFlutterに関する登壇をする予定だったんですが、今日はちょっとFlutterの話はしな

                                    インフラの整備、SLIとSLOの設定、セール対策 Railsアプリケーションのユーザ体験を支えるSREの取り組み
                                  • アソビューにおけるSREとは?4,000万人のアクセスに耐えられるインフラと高い信頼性を目指して - asoview! Tech Blog

                                    この記事は、アソビュー! Advent Calendar 2022の12日目です。(裏面です) アソビューでSREユニットに所属をしている三森です。この記事では弊社のSREについて紹介をしようと思います。 アソビューでのSREとは? SREの指針とは? 信頼性 全体最適 DevSecOps こういうことやってるよ! 最後に アソビューでのSREとは? アソビューでのSREとはGoogleが提唱した「Site Reliability Engineering」の考え方を基本にしておりますが、インフラ/運用の上に乗るサービス、その先に居る顧客までを見据えて改善活動を積み上げるチームとしています。 www.wantedly.com SREの指針とは? アソビューはビジョンとして、「2025年までに、4000万もの人々に遊びを通じて、素敵な思い出をお届けする」を掲げています。 このビジョンの実現する

                                      アソビューにおけるSREとは?4,000万人のアクセスに耐えられるインフラと高い信頼性を目指して - asoview! Tech Blog
                                    • これからはじめる 実践SRE / SLO の監視をやってみよう

                                      SRE がアツいですね。 昨年は以前に増して SRE 関連のイベントも増え、SRE 人材への注目も更に高まっていると感じた 1 年でした。私も Google Cloud の Customer Engineer として、お客様へ SRE のお話をする機会が増えてきています。 ご存知の通り、SRE は Google から生まれた運用プラクティス、またはそのロール自体を指す言葉です。 詳細は無料で読むことができる書籍を御覧ください。 “Site Reliability Engineering” 及び “The Site Reliability Workbook” (右上の右2つ)は HTML 形式 なので、Google Chrome で右クリックして 翻訳を選択するという簡単な手順で日本語でも読むことができます。(書籍がよい方は日本語版も購入できます。) 今回のテーマは SLO (Service

                                        これからはじめる 実践SRE / SLO の監視をやってみよう
                                      • marnie0301 on Twitter: "EurekaでSREっていう職責を会社で担って数年、扱ってきたものが多すぎて頭を一回整理したくて、雑にSREのpracticeのMindMapを作ってみた。黎明期に色々扱ったものやデータ周りを除外して、組織が成熟して各種専任チーム… https://t.co/WWWQvj45ee"

                                        EurekaでSREっていう職責を会社で担って数年、扱ってきたものが多すぎて頭を一回整理したくて、雑にSREのpracticeのMindMapを作ってみた。黎明期に色々扱ったものやデータ周りを除外して、組織が成熟して各種専任チーム… https://t.co/WWWQvj45ee

                                          marnie0301 on Twitter: "EurekaでSREっていう職責を会社で担って数年、扱ってきたものが多すぎて頭を一回整理したくて、雑にSREのpracticeのMindMapを作ってみた。黎明期に色々扱ったものやデータ周りを除外して、組織が成熟して各種専任チーム… https://t.co/WWWQvj45ee"
                                        • SRE と Developer のコラボレーションを支える仕組み - スタディサプリ Product Team Blog

                                          こんにちは。SRE の @int128 です。 Quipper の SRE チームでは、Platform の安定運用や改善だけでなく、Platform を利用する Developer のサポートも重要な仕事と位置付けています。 SRE チームで工夫していることを紹介します。 Issue に記録を残す SRE チームでは課題や疑問などを気軽に相談してほしいと考えています。 そのため、Slack で気軽に SRE にメンションしてもらえる文化を作るように心がけています。 Slack で相談している例 一方で、同時に多くのメンションを受け取った場合、経緯の把握に時間がかかる、対応状況が分からなくなるといった課題があります。 例えば、Slack のやり取りを通して、ちょっと設定変更すればできるかも、検証してみようという話になることがよくあります。 Slack のスレッドだけでは、具体的な検証作業に

                                            SRE と Developer のコラボレーションを支える仕組み - スタディサプリ Product Team Blog
                                          • SREチーム立ち上げ3年目、Embeddedやってみた実践と気づき/the practice of embeddedSRE

                                            Tech Brew in 東京「Embedded SRE 現場に寄り添うアプローチ」( https://findy.connpass.com/event/323099/ ) での発表資料です。

                                              SREチーム立ち上げ3年目、Embeddedやってみた実践と気づき/the practice of embeddedSRE
                                            • SREとDevOpsの違いはなにか | sreake.com | 株式会社スリーシェイク

                                              SREとDevOpsの違いDevOpsとはSREとはDevOpsの実装としてのSRE継続的な改善の必要性組織を超えたコラボレーション変更管理と自動化計測の重要性非難のない文化開発速度の改善SREのことなら弊社にお任せください Webサービスの信頼性や価値の向上に用いられるアプローチ方法としてSRE(Site Reliability Engineering)というものがあります。システム開発側と運用側の溝を埋めるために生まれたこの手法ですが、従来のDevOpsとはどのような違いがあるのでしょうか。 本記事ではSREとDevOpsの違いについて見ていきます。 関連記事:「SREとインフラエンジニアの違いについて」 SREとDevOpsの違い SREとDevOpsの違いや関係性を知るには、Googleが提唱している「class SRE implements DevOps」の考えが最も明解でしょう

                                                SREとDevOpsの違いはなにか | sreake.com | 株式会社スリーシェイク
                                              • SREとは? Google Cloudがその基本を説明、JCBも導入/実践経験を紹介 (1/5)

                                                グーグル・クラウド・ジャパン(Google Cloud)は2022年8月29日、グーグルが提唱する「SRE(Site Reliability Engineering、サイト信頼性エンジニアリング)」に関する記者説明会を開催した。グーグルからSREの基本な考え方が説明されたほか、ゲストとして実際にSREチームを組成しているジェーシービー(JCB)も出席し、SRE導入と実践の経験を紹介した。 SREとは? システム運用チームとSREチームとはどう違うのか? グーグル シニアデベロッパーリレーションズ エンジニアの山口能迪氏はまず、SREとは「本番システムを信頼性高く開発/運用するための一連のプラクティスと心構え、および職務を指す」言葉だと説明する。現在のような変化の多い時代においては、頻繁なサービス開発/リリースや、ユーザーニーズの変動に応じた急なスケール変更などが求められる。ただし、それらは

                                                  SREとは? Google Cloudがその基本を説明、JCBも導入/実践経験を紹介 (1/5)
                                                • SREはインフラ担当だけでなくチーム全体で取り組んでいくもの | はてなで働く cohalz にアンケート [#9] - Hatena Developer Blog

                                                  こんにちは、Hatena Developer Blog編集部です。「はてなで働くエンジニアにアンケート」シリーズ、今回ははてなブログチームのSRE、id:cohalzに話を聞きました。 id:cohalzにアンケート はてなidとその由来を教えてください いつどんなきっかけで入社しましたか? 現在の仕事を教えてください チーム内の立ち位置を教えてください 1日の仕事の流れを教えてください 最近うまくいったことは何ですか? 最近うまくいってないことは何ですか? 普段大切にしていることは何ですか? はてなはどんな会社ですか? id:cohalzにアンケート はてなidとその由来を教えてください 読みは「こはる」と呼ばれることを想定しています。 読みとしては日本語としてありふれた名前にしつつも、idとしては被らないものにしたいという意図を持っています。 idはco + hal + zの3つの要素

                                                    SREはインフラ担当だけでなくチーム全体で取り組んでいくもの | はてなで働く cohalz にアンケート [#9] - Hatena Developer Blog
                                                  • 最近のSREチームと業務について - BASEプロダクトチームブログ

                                                    こんにちは!! BASE株式会社 SRE Group Managerの富塚(@tomy103rider)です。 以前、以下のSREの求人票についての記事を公開してから多くの方とカジュアル面談でお話をさせていただく機会が増え、カジュアル面談の中でも「求人票ブログの記事見ました!」という声をいただき嬉しい限りです。ありがとうございます。 devblog.thebase.in そんなカジュアル面談の中でよくいただく質問があり、今回はその中から最近のSREチームについて、 チームで大事にしていることは? チームの働き方は? チームの業務は? この3つについて紹介したいと思います。 チームで大事にしていることは? 現在SREチームでは、 「信頼性=ユーザの期待値を超え続けること」としてこれを維持し続ける BASEの機能等々の価値を高めるための時間を多く作っていけるようにする が大事であると考えていま

                                                      最近のSREチームと業務について - BASEプロダクトチームブログ
                                                    • 「ホットペッパービューティー」美容クリニックでのSRE活動

                                                      美容クリニックは新規体制用の少人数体制で開発を行っており、その内の約 7 割がアプリ開発をしているエンジニアとなっています。 一方で、SRE は全体の約 1 割の人数しかいないという状況にあります。 この SRE の人数が少ないかどうかは扱っているシステムの規模や課題によって評価が変わるかと思いますが、美容クリニックが現在抱えている課題の量に対しては少ない人数だと感じています。 では、このように限られた人数の中でどのようにして SRE 活動を行ってきたのかを紹介していきます。 SRE チームの組閣 美容クリニックのリリース以前から SRE チームは存在していたのですが、リリース前後でその責務は変わってきます。 例えばリリース前はインフラの初期構築がメインの責務となってきますが、リリース後(エンハンス開発)にはインフラの保守運用がメインの責務となります。 さらに、メンバーの変動などにより当初

                                                        「ホットペッパービューティー」美容クリニックでのSRE活動
                                                      • SRE関連Issue、7年分を振り返る - BASEプロダクトチームブログ

                                                        この記事は、BASE Advent Calendar 2022の18日目の記事(その2)です。 SRE Group の ngsw です。 先日ネットショップ作成サービス「BASE」は10周年を迎えました。 「BASE」サービスリリース10周年 ~「好きが、売れる。」をコアメッセージに特設Webサイトの公開とクーポンキャンペーンを開始~ | BASE, Inc. 10th Anniversaryクーポンキャンペーン は現在すでに終了しています 好きが、売れる。BASE・10周年特設サイト せっかくの10周年です。ちなんだ記事を書けたら面白いかなとSRE関連のIssuesを振り返っていたのがこの記事のはじまりでした。 BASEの10年分のシステムの課題を読者の皆さんと共有できたならば面白いかな、というのが(後付けの)動機です。 SRE関連のIssuesはGitHub移行後の2016年より存在し

                                                          SRE関連Issue、7年分を振り返る - BASEプロダクトチームブログ
                                                        • メルカリ ハロ立ち上げ時のSRE | メルカリエンジニアリング

                                                          はじめに こんにちは。メルカリ ハロでSRE TLをしている@nakaです。連載:Mercari Hallo, world! -メルカリ ハロ 開発の裏側- の3回目を担当させていただきます。 この記事では、メルカリの新規事業立ち上げにおけるSREの働きや役割に関して、紹介します。 メルカリでは、Platform Engineeringが提供するツールや仕組みを活用して、サービスを立ち上げていきます。新規事業立ち上げのチームだけで、完結するわけではありません。今回は、Platform Engineering時代の新規サービス立ち上げにおけるSREの役割と具体的な動きを、メルカリ ハロを例に取り上げて紹介します。SREが、Platform Engineeringとプロダクト開発チームと一丸となって「All For One」に動いてきた取り組みが少しでも臨場感を持って伝えられればと思います。

                                                            メルカリ ハロ立ち上げ時のSRE | メルカリエンジニアリング
                                                          • Incident Metrics in SRE

                                                            Štěpán Davidovič Incident Metrics in SRE Critically Evaluating MTTR and Friends Boston Farnham Sebastopol Tokyo Beijing Boston Farnham Sebastopol Tokyo Beijing 978-1-098-10313-2 [LSI] Incident Metrics in SRE by Štěpán Davidovič Copyright © 2021 O’Reilly Media, Inc. All rights reserved. Printed in the United States of America. Published by O’Reilly Media, Inc., 1005 Gravenstein Highway North, Sebas

                                                            • カヤックのSREチームは「SREに関することなら何に使ってもいい時間」がある - KAYAC Engineers' Blog

                                                              SREチームの長田です。 SREsとしての業務がメインではあるのですが、実はSREチームの人事リソース管理を担当していたりします。 今回はそんな立場から「SRE活動用のリソース」について紹介してみようと思います。 SREなのに「SRE活動用」リソース? カヤックのSREは、担当プロダクトチームのメンバーとして動く、いわゆるEmbedded SREです。 社内の予算計画の話になってしまうのですが、プロダクトを持つ事業部がSREメンバーのリソース配分を期ごとに確保する形式となっています。 例えばあるメンバーのリソース(100%)のうち、50%分をTonamel(ゲームコミュニティ事業部)に、 30%分をまちのコイン(ちいき資本主義事業部)に割り振った場合、 各割合分のリソースを各プロダクトが属する事業部が負担する形です *1。 Embedded SREの活動とは別に、プロダクトとは直接関係のな

                                                                カヤックのSREチームは「SREに関することなら何に使ってもいい時間」がある - KAYAC Engineers' Blog
                                                              • はてな「Mackerel」のSREに学ぶ、開発パフォーマンスと信頼性のベストバランスとは?【デブサミ2021夏】

                                                                近年注目を集めるSRE(Site Reliability Engineering)。その実践には、Observability(可観測性)や設計の他、組織づくりや文化の醸成などが重要なカギを握るとされ、各々の組織に合う形で導入・運用されることが望ましいとされる。株式会社はてなでも、サーバー監視サービス「Mackerel」の開発チームで2019年より実践が開始され、組織全体に展開されてきた。その導入の背景や、DevOpsを達成するためのチーム編成などの経緯について、Mackerelチーム リードSREの古川雅大氏が経験を踏まえつつ紹介した。 株式会社はてな Mackerelチーム リードSRE 古川雅大氏 SREの第一歩は非エンジニアも含めた「SREの理解」から Googleが提唱した「SRE」は、いわばDevOpsの実践法であり、ツールや考え方の共通化、チーム構成などによって組織のサイロを減

                                                                  はてな「Mackerel」のSREに学ぶ、開発パフォーマンスと信頼性のベストバランスとは?【デブサミ2021夏】
                                                                • How to Build Software like an SRE

                                                                  I’ve been doing this “reliability” stuff for a little while now (~5 years), at companies ranging from about 20 developers to over 2,000. I’ve always cared primarily about the software elements I describe as living “outside” the application – like, how does it get its configuration? What kinds of instances does it run on, and are those the best kinds to use? What steps does it take on its path from

                                                                  • 絶え間なく変化するメルカリ・メルペイにおけるSREの組織と成長 / SRE Next 2020

                                                                    SRENext 2020において、メルカリの m4buyaと一緒に発表しました

                                                                      絶え間なく変化するメルカリ・メルペイにおけるSREの組織と成長 / SRE Next 2020
                                                                    • Platform Engineering Kaigi 2024 〜SRE課ふりかえり〜 - RAKUS Developers Blog | ラクス エンジニアブログ

                                                                      SRE課の飯野です。 去る2024/7/9(火)、『Platform Engineering Kaigi 2024』(以下PEK)が開催されました。 弊社からは7名(SRE課6名+インフラ部長)が現地参加し、登壇企業の皆さまの熱量あふれるセッションを肌で体感してきました。 本ブログでは、PEK参加後にSRE課メンバーで実施した社内でのふりかえりの内容をお届けします。 目次 PEKとは? 当日の様子 ふりかえりやってみよう 総括 PEKとは? 『Platform Engineering Kaigi 2024』は、プラットフォームエンジニアリングをテーマにしたテックカンファレンスです。 もともと『Platform Engineering Meetup』という勉強会を主催していたコミュニティが「一般社団法人クラウドネイティブイノベーターズ協会」という団体を立ち上げ、その団体が今回日本で初めとなる

                                                                        Platform Engineering Kaigi 2024 〜SRE課ふりかえり〜 - RAKUS Developers Blog | ラクス エンジニアブログ
                                                                      • 開発者と協働できるメトリクスダッシュボードを作ろう!/SRE Lounge 2023

                                                                        SRE Lounge #14 登壇資料(2023/1/30) 『開発者と協働できるメトリクスダッシュボードを作ろう!』 https://sre-lounge.connpass.com/event/270369/ ========================================…

                                                                          開発者と協働できるメトリクスダッシュボードを作ろう!/SRE Lounge 2023
                                                                        • The SRE Report 2023 | Catchpoint

                                                                          Complete, actionable insights and visibility into your entire digital user experience.

                                                                            The SRE Report 2023 | Catchpoint
                                                                          • ZOZO、サイバーエージェント、さくらインターネット、イオン、大規模サービスにおけるSRE導入で得られた実際の変化とは | AEON TECH HUB 開催レポート Session#2 |AEON TECH HUB

                                                                            2024年4月23日に開催されたAEON TECH HUB #3のイベント開催レポートです。「大企業経営におけるSREの重要性」と題した本イベントでは、ZOZOの瀬尾 直利さん、さくらインターネットの坪内 佑樹さん、サイバーエージェントの柘植 翔太さん、また、イオン/イオンスマートテクノロジー CTOの山﨑 賢にも登壇いただきました。各社のSRE領域における取り組みや運用時に大切にしていること、現場で意識していることを共有する場となりました。今回は3回に分けてお届けする開催レポートの2本目であり、パネルディスカッションの様子をお伝えします。

                                                                              ZOZO、サイバーエージェント、さくらインターネット、イオン、大規模サービスにおけるSRE導入で得られた実際の変化とは | AEON TECH HUB 開催レポート Session#2 |AEON TECH HUB
                                                                            • SREチームはDevOpsに向き合い、開発を加速させる

                                                                              この記事は、開発生産性 Advent Calendar 2022の24日目の記事です。 株式会社スマートショッピングでSREをしているbiosugar0です。 今回はSREが現在DevOpsに向き合い、開発を加速させるために取り組んでいることについて紹介します。 開発を加速させるDevOpsという考え方 DevOpsは、開発チームと運用チームが協力し、よりスムーズに高品質なサービスを作り上げるという考え方です。 歴史的に、企業は複雑なシステムを開発運用していくために「開発」と「運用」という別々のチームにそれぞれの仕事を任せてきました。 このアプローチに伴う開発/運用の分断には、多くの問題がありました。 その中でも大きい問題は、2つのチームの目標が対立関係に陥りやすいことです。 開発者は新しい機能や改修をスピード感をもって開発してリリースしたい、運用者はシステムをより安定させるためにシステム

                                                                                SREチームはDevOpsに向き合い、開発を加速させる
                                                                              • "SRE" doesn't seem to mean anything useful any more

                                                                                This seems to be a thing now: someone finds out that you worked as an SRE ("site reliability engineer", something from the big G back in the day) somewhere, and now all you're good for is "devops" - that is, you're going to be the "ops bitch" for the "real" programmers. You are the consumer. They are the producer. They squeeze one out and you have to make it sing and dance. You keep things running

                                                                                • 【感想戦】SRE NEXT 2023にラクスSRE課で参加しました - RAKUS Developers Blog | ラクス エンジニアブログ

                                                                                  SRE課の飯野です。 去る2023/9/29(金)、『SRE NEXT 2023』が開催されました。 弊社SRE課からも6名が現地参加し、熱量あふれるたくさんのセッションを肌で体感してきました。 本ブログでは、SRE NEXT参加後にメンバーで実施した感想戦の内容をお届けします。 目次 SRE NEXTとは? 当日の様子 感想戦やってみよう 総括 SRE NEXTとは? SREに関わるトピックを扱う日本国内の大型カンファレンスです。 今年は約3年半ぶりにオフラインでも開催され(オンライン配信もありのハイブリッド方式)、東京・九段下の九段会館テラスにて行われました。 信頼性に関するプラクティスに深い関心を持つエンジニアのためのカンファレンスです。 同じくコミュニティベースのSRE勉強会である「SRE Lounge」のメンバーが中心となり運営・開催されます。 SRE NEXT 2023は「In

                                                                                    【感想戦】SRE NEXT 2023にラクスSRE課で参加しました - RAKUS Developers Blog | ラクス エンジニアブログ