2020/11/7に行われたJJUG CCC 2020 Fallでのスポンサーセッションの登壇資料です。 https://ccc2020fall.java-users.jp/
2019年2月27日、恵比寿ガーデンプレイスザ・ガーデンホールにて、「Cookpad TechConf 2019」が開催されました。Cookpadのエンジニアやデザイナーがどのようにサービス開発に取り組んでいるのか、またその過程で得た技術的知見について公開します。プレゼンテーション「Challenges for Global Service from a Perspective of SRE 2nd season」に登壇したのは、クックパッド株式会社技術部SREグループエンジニアの渡辺喬之氏。講演資料はこちら クックパッドSREが語るグローバルサービスへの挑戦 渡辺喬之氏(以下、渡辺):それでは発表をはじめます。よろしくお願いします。今日の発表内容ですが、まずクックパッドの海外展開について、ご存じない方がいらっしゃると思いますので、ご紹介いたします。その後、クックパッドにおけるSREの役割
もうだいぶ日が経ってしましたが、1/18(金)に SRE Loungeのイベントに参加してきました!すでに7回目の開催ですが、はじめて参加してきました。 SREチームを部署内で立ち上げてみて半年以上が過ぎ、これまでの活動のまとめ・自分の引き継ぎ(産休のため)・来期の計画/活動方針などを考えるタイミングだったので、他社の取り組みを聞いたり、SREs/SREに興味のある方と交流できたのはとても良かったです。 sre-lounge.connpass.com 個人の感想が多分に入ったレポートに仕上がってしまいました(ノ≧ڡ≦) SRE Loungeとは SRE Lounge は、UZABASE のSRE チームが中心となり、発足した勉強会です。 http://tech.uzabase.com/entry/2018/01/26/200021 もともとは、クローズドで少人数な勉強会運営をしておりました
僕は去年の8月にヌーラボに入社して、そこから Backlog の SRE として働いています。 SRE としての経験は約1年なのですが、ちょうどサービスが成長し、会社もエンジニアを積極的に採用して拡大している時期だったこともあり、色々な経験ができました。そのなかで、SRE の難しさ、SRE の組織の問題にも直面してきました。 このあたりの経緯を整理して話すだけでも SRE にとって面白い話になるのではないか、と思い、今回の SRE Lounge #5 では「Backlog における SRE の事例 〜プロダクトの成長のために SRE はなにをすべきか〜」というタイトルで発表させていただきました。 sre-lounge.connpass.com 発表スライドはこちらです。 発表のときは冒頭で説明したのですが、これがベストプラクティスと言うつもりは全然ありません。僕らもまだ悩んでいる最中の問題
2. 自己紹介 名前 澤田 武男 Twitter @SawadaTakeo 2013 - 2014 Ads Backend SRE @Google HQ Display Ads Backend など 2014 - 2017 Source SRE @ Google NY Piper (Google のプロプライエタリなソースコン トロールシステム) Git (Android, Chrome, code.google.com, Cloud Source Repositories) ローンチ調整エンジニア (LCE, SRE 本 27 章) SLO の策定、モニタリング、障害対応、 PRR(SRE 本 32 章) など 2017 - Build SRE @ Dropbox Changes (内製の CI ツール) Bazel クラスタ
GoogleのCRE(Customer Reliability Engineer)であるStephen Thorne氏が先日のDevOps Enterprise Summit Londonで講演し、SRE(Site Reliability Engineering)とは何か、その基本的な前提とメリットを理解できていない組織がいかに多いか、などについて解説した[スライドのPDF]。氏がこれまでに他の組織で見たおもな誤解は、早期の障害検出に重点を置いたSLO(Service Level Objective)や、あるいは過去のインシデントの金銭的保証に使用するSLA(Service Level Agreement)との混同、エラー予算を執行しない、SREチームの活動の少なくとも50パーセントをシステムやツールの改善に費やさず、“消防活動”という名の運用上の苦役に没頭させる、といったものだ。 SLO
8/9 に FiNC 社で開催された Microservices Meetup vol.2 で、マイクロサービスと SRECon という話をしました。
このエントリは、サーバー監視サービス・Mackerel の中の人であり、Mackerel 大好き人間でもある私・ id:a-know がお届けしています。 Evernote や Dropbox paper など、世の中には様々なメモのためのアプリケーションがあるけれど、僕は個人用のメモをつけるための道具として、 kibela と esa の両方をユースケースに応じて使い分けている。いずれも所属ユーザーは僕一人しかいない、ひとりチームとしての利用なのだけど。 kibela https://kibe.la/ja 日々の生活におけるメモ。日記とか。 日記は2017年3月から毎日書き続けている......。。 esa https://esa.io/ プライベート開発用。 開発関連作業においての副産物として生まれるもののメモやコード片など。 僕の使い方としてはこんなかんじ。どちらも、企業内で情報共有
こんにちは、つるべーです。 先日、福岡のインフラ界隈のエンジニアの方々がやっているSRE本の輪読会に参加し、発表をさせていただいたので、その時の内容をまとめます。 私は、10章の「時系列データからの実践的なアラート」を担当させてもらいました。 はじめに なぜ「時系列データからの実践的なアラート」が必要かを考えてみた。 Webサービスの大規模化や複雑化に伴い、サーバ台数の増加やシステム構成の複雑化が進んだことで、サーバのメトリクス等の情報を高解像度かつ長期間保持したいという要望が高まっている。また、サーバのメトリクスをより統計的に解析し、アラーティングの精度を向上させたいといったシーンも増え、時系列データベースに溜め込んだデータを用いた柔軟なアラーティングの需要が高まっているのではないだろうか。 概要 10章ではBorgmonと呼ばれるGoogleの内部システムについての話が中心だが、「アラ
Read it now on the O’Reilly learning platform with a 10-day free trial. O’Reilly members get unlimited access to books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers. In 2016, Googleâ??s Site Reliability Engineering book ignited an industry discussion on what it means to run production services todayâ??and why reliability considerations are fundamen
GitHub Current Job Openings Design Staff Design Manager, Brand and Marketing Design Remote - United States Staff Design Manager, Brand and Marketing Design Remote - Canada Engineering Staff Engineering Manager, Dependency Graph Remote - United States Operations Director, Revenue Compensation Remote - United States Product Senior Director, Open Source Funding Remote - United States Sales Corporate
A message from our sponsor, FireHydrant: If the entire team is on a Zoom bridge during an incident – how do you know what really happened and when? We added real-time Zoom/Google Meet transcripts to make sure your incident timeline has every detail. https://firehydrant.com/ai/ There are quite a few pitfalls waiting for you if you try to implement SLOs for your mobile app. This article explains and
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く