Google Cloud Platform (Google App Engine, Compute Engine, BigQuery や Container Engine など)の情報の日本公式ブログ
![Google の新しい専門職 : CRE が必要な理由](https://cdn-ak-scissors.b.st-hatena.com/image/square/832e1ee57367511106911167fde597eb46a6b3b5/height=288;version=1;width=512/http%3A%2F%2F3.bp.blogspot.com%2F-m90zG1Qb7vc%2FVel5wAn_isI%2FAAAAAAAARGE%2FiSOuuYWUXUA%2Fs1600-r%2FCloudPlatform_128px_Retina.png)
運用本部長を務めている山本泰宇です。 運用本部は社内の情報システムを担当する情報システム部と cybozu.com など自社クラウドサービスを運用するサービス運用部からなる部門です。 本日、サービス運用部にて SRE チームを設立しました。この記事ではチーム設立にいたった経緯と今後の活動計画を紹介いたします。 Site Reliability Engineering (SRE) とは 今年の 3 月に O'Reilly から出版された "Site Reliability Engineering" で有名になりましたが、Google のプロダクトやサイトを安定運用するための活動やその活動に従事する人・チームを指します。特徴としては基本的にソフトウェアエンジニアからなる集まりで、自律的な仕組みや自動化を日常的に行っていることです。 サイボウズでも 5 月から社内で SRE 本の輪講を開催し、理
本記事は2016年7月25日(月)に開催された SRE Tech Talks #1〜Site Reliability Engineeringにまつわるエトセトラ)〜 のレポート記事です。 SREは”Site Reliability Engineering”の略です。SREの概念を広めたGoogleでSREチームを作った Ben Treynor Sloss は SRE のことを次のように定義しています。 "Fundamentally, it's what happens when you ask a software engineer to design an operations function” https://landing.google.com/sre/ 日本で SRE の名前が広まったのは Mercari の2015年11月18日の次のブログがきっかけとよく言われます。 インフラ
SRE Tech Talks ( http://connpass.com/event/34825/ ) でお話した際の資料です
Recent posts: 24 Mar 2024 » Linux Crisis Tools 17 Mar 2024 » The Return of the Frame Pointers 10 Mar 2024 » eBPF Documentary 28 Apr 2023 » eBPF Observability Tools Are Not Security Tools 01 Mar 2023 » USENIX SREcon APAC 2022: Computing Performance: What's on the Horizon 17 Feb 2023 » USENIX SREcon APAC 2023: CFP 02 May 2022 » Brendan@Intel.com 15 Apr 2022 » Netflix End of Series 1 09 Apr 2022 » Te
Building Secure & Reliable Systems Can a system be considered truly reliable if it isn't fundamentally secure? Or can it be considered secure if it's unreliable? Security is crucial to the design and operation of scalable systems in production, as it plays an important part in product quality, performance, and availability. In this book, experts from Google share best practices to help your organi
どうも、セクションナイン の 吉田真吾(@yoshidashingo)です。 はじめに メルカリにおけるSite Reliability Engineering(SRE)チーム メルカリSREの定義 メルカリでのSREチームの導入経緯 メルカリでのSREチームの業務 メルカリSREに求める人材像 感想:カスタマー目線なチーム Google SRE Site Reliability Engineeringブログ RedditでのGoogle SREたちによるAMA インタビュー : Site Reliability Engineerは世界で最も強烈なピットクルー インタビュー : Site Reliability Engineerは最も面白い問題を解いている サンタモニカのSREチームの発表 他社の採用情報 Facebook Netflix sysadmin to SRE まとめ はじめに
注意 現在X(旧Twitter)でのソーシャルログインができない事象を確認しています。事前にX(旧Twitter)側で再ログインした上でconnpassのソーシャルログインを行うか、 「ユーザー名(またはメールアドレス)」と「パスワード」の組み合わせでのログインをお試しください。合わせてFAQもご確認ください。 お知らせ 2024年9月1日よりconnpassサービスサイトへのスクレイピングを禁止とし、利用規約に禁止事項として明記します。 9月1日以降のconnpassの情報取得につきましては イベントサーチAPI の利用をご検討ください。 お知らせ connpassではさらなる価値のあるデータを提供するため、イベントサーチAPIの提供方法の見直しを決定しました。2024年5月23日(木)より 「企業・法人」「コミュニティ及び個人」向けの2プランを提供開始いたします。ご利用にあたっては利用
Recent posts: 24 Mar 2024 » Linux Crisis Tools 17 Mar 2024 » The Return of the Frame Pointers 10 Mar 2024 » eBPF Documentary 28 Apr 2023 » eBPF Observability Tools Are Not Security Tools 01 Mar 2023 » USENIX SREcon APAC 2022: Computing Performance: What's on the Horizon 17 Feb 2023 » USENIX SREcon APAC 2023: CFP 02 May 2022 » Brendan@Intel.com 15 Apr 2022 » Netflix End of Series 1 09 Apr 2022 » Te
What is Site Reliability Engineering (SRE)? SRE is what you get when you treat operations as if it’s a software problem. Our mission is to protect, provide for, and progress the software and systems behind all of Google’s public services — Google Search, Ads, Gmail, Android, YouTube, and App Engine, to name just a few — with an ever-watchful eye on their availability, latency, performance, and cap
Thanks to everyone who joined us in Santa Clara, CA, for SREcon16. SREcon16 took place on April 7–8, 2016, in Santa Clara, CA. The program included: Thursday keynote address from Rachel Kroll, Facebook, on "The Realities of the Job of Delivering Reliability" Thursday closing address from Charity Majors, Hound, on "A Young Lady's Illustrated Primer to Technical Decision-Making" Friday keynote addre
Mercari has continuously improved its site reliability and performance to handle rising traffic and data volumes. Improvements included introducing dedicated servers and load balancers, partitioning databases and search servers, optimizing code, and moving to a scheduled automated deployment process. The site reliability engineering team is responsible for ensuring high availability, performance,
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く