並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 23 件 / 23件

新着順 人気順

SREの検索結果1 - 23 件 / 23件

  • 初めてのSREから3年半でやったことの振り返り

    レバテック開発部DevOps推進グループSREチームの蒲生です。 このたびレバテックを退職することになりました。 今までやってきたことを振り返ることで、お前普段なんもやってなかったやろと思っている方への説明とまだまだやらなアカンことあるけど許してねって気持ちを吐き出したいなと思います。 初めてSREとして働き始めてからレバテック事業でのSREチーム結成、活動していくまでで「やってよかったな」と思ったことを紹介していきます。(僕個人ではなくチームでの取り組み) 「こうしておけばよかったな」という懺悔も混ぜておきます。 1. 監視体制作り 初めてのSREだったので定石通り、こちらのピラミッド通りにプラクティスを実践しました。 (O’Reilly Site Reliability Engineeringより) 簡単な状況 監視設定はCloudWatch CDKでリソースのCPUやメモリ、スレッド

      初めてのSREから3年半でやったことの振り返り
    • 『SREをはじめよう』という本が出版されました #becoming_sre - YAMAGUCHI::weblog

      はじめに こんにちは、Google Cloudのオブザーバビリティ/SRE担当者です。私が翻訳しました『SREをはじめよう―個人と組織による信頼性獲得への第一歩』という書籍がオライリー・ジャパン社より出版されました。書店ならびに各社オンラインストアでご購入いただけます。 www.oreilly.co.jp SREをはじめよう ―個人と組織による信頼性獲得への第一歩 作者:David N. Blank-Edelmanオーム社Amazon 『SREをはじめよう』はどんな本か 本書は『SREの探求』のようにGoogle以外の組織を含めた、より一般的な文脈でのSREの実践を、オムニバスなエッセイの形でなく、概論の形で捉えたい人には最適の書籍です。すでに原著の『Becoming SRE』の日本語の感想などもいくつかの記事で見かけていますが、本書はまとめを読んで理解する、という書籍ではなく、本書と対話

        『SREをはじめよう』という本が出版されました #becoming_sre - YAMAGUCHI::weblog
      • もしもいま、クラウドインフラをイチから学び直すとしたら? 株式会社esite SRE・徳原さんに聞く学習ロードマップ - Findy Engineer Lab

        株式会社estieでSRE/Platfrom Engineeringをしている徳原です。 テック転生ということで、今イチからインフラを学び直すならということで記事を書かせていただきます。 自分が社会人になった頃はまだオンプレミスが主流だった時代です。仮想環境は開発環境としては使えそうだけど本番環境では使えないねというのが世間一般の捉え方だったと記憶してます。社会人最初の数年はデータセンターにいって検証環境を作ったり、大量にあるネットワーク機器に接続するためのteratermのマクロ組んだりと、大量の物理機器を如何に効率よく運用するかみたいなことをやったので、学習環境としても機器を触るようにしていました。秋葉原で中古のネットワーク機器と安いサーバを購入して自宅ラック勢とまではいかないまでも、そこそこの台数で検証環境を組んで遊んでいました。ただ、LoadBalancerやFirewallといっ

          もしもいま、クラウドインフラをイチから学び直すとしたら? 株式会社esite SRE・徳原さんに聞く学習ロードマップ - Findy Engineer Lab
        • SREで進化するイオン、Terraform・New Relic・PagerDutyを「三種の神器」に

          SREツールの活用は、文化醸成に影響する外部発信に向いている イオングループには、ダイエーやカスミ、ウエルシア、ミニストップなど、多くの小売チェーンが参画している。従業員数は60万人を超え、営業収益は10兆円に達する国内最大手の小売事業グループだ。また、イオンは持株会社であり、同社事業を300社ほどの子会社がそれぞれ担当している。 そして、それらグループ企業のデジタル戦略を技術面で推進しているのがイオンスマートテクノロジー(以下、AST)だ。同社は「イオングループのすべてのビジネスをテクノロジーの力で進化させる」というミッションのもと、デジタルシフトを戦略的に進めている。たとえば、イオングループの店舗と顧客をつなぐプラットフォームとして、暮らしに関連する多様なアプリやサービスを共通IDで提供する「iAEON」の開発や、従業員向けシステムの構築、さらにはイオングループ全体のDX推進を手掛けて

            SREで進化するイオン、Terraform・New Relic・PagerDutyを「三種の神器」に
          • SRE Kaigi 2025

            SRE Kaigi 2025は、「More SRE !」をテーマに開催される、SREを中心として知見の共有と参加者との交流を楽しむ技術カンファレンスです。 SREは世界的に注目され続けている領域であり、現場によって抱える課題や取り組みはそれぞれ異なります。 そうした多様な事例から得られた知見を共有する場は、まだまだ不足している現状です。 「さらにSREに関わる技術者の活躍の場を増やすため」 「さらにSREを理解し、興味を持っていただける技術者を増やすため」 この2つの“More”を目指し、参加者の皆様とコミュニティをより盛り上げていけたらと思います。 SREに関わる技術者の皆様、またSREに興味を持っている技術者の皆様、ぜひこの機会にSRE Kaigi 2025にご参加ください! 開催に関しての最新の情報は、Xの @srekaigi で発信していきますので、ぜひフォローしてください!

              SRE Kaigi 2025
            • SLO策定とアラート対応の最適化 DeNA インフラ/SRE MEET UP #9 (2024/11/08 19:00〜)

              イベント概要 SLO策定とアラート対応の最適化 DeNA インフラ/SRE MEET UP #9を開催します! 今回は DeNA のインフラ組織の運用・監視における取り組みをご紹介いたします。 SLI・SLO 策定の過程とアラート対応の効率化・自動化についてお話しします。 DeNA のインフラ組織が SRE をどのように実践しているかに興味がある方はぜひご参加ください! 過去の開催内容 ・SRE MEET UP #1 インフラチームのマネージャーがモバゲークラウド移行の裏側の技術的な工夫や、 南場がAWS Summit Onlineで語っていたクラウドコストチューニングの詳細についてお話しいたしました。 モバゲーをオンプレからクラウドに移行した裏側 ・SRE MEET UP #3 新卒2年目と3年目のエンジニアが、若手社員目線での大規模システムの運用方法と 次世代データベースの検証の過程と

                SLO策定とアラート対応の最適化 DeNA インフラ/SRE MEET UP #9 (2024/11/08 19:00〜)
              • 【IVRy入社エントリ】SREやPlatform Engineeringの考えを活かして自分が気に入ったサービスと組織の成長を当事者として支えたい|abnoumaru

                【IVRy入社エントリ】SREやPlatform Engineeringの考えを活かして自分が気に入ったサービスと組織の成長を当事者として支えたい はじめに2024年10月からIVRyで働いてるabe(@abnoumaru)です! 前職ではSREの考えをベースにお客様のサービスを主にITインフラ領域から支える仕事をしてきました。今回は、これまでの経験や転職に至る経緯、そして「SREに関心がある人間がIVRyを選んで今どういう気持ちであるか?」を書いていきます。 経歴大学とアルバイトと新卒入社長野県で生まれて一浪して、大学進学を機に上京しました。そこで運良くMSP事業でアルバイトをしている先輩たちと知り合い、株式会社ハートビーツで働かせていただくことになりました。 ハートビーツはインフラエンジニアを育てる教育制度が充実した会社でした。本当に手厚くサポートいただき、オペレーションエンジニア/イ

                  【IVRy入社エントリ】SREやPlatform Engineeringの考えを活かして自分が気に入ったサービスと組織の成長を当事者として支えたい|abnoumaru
                • 2年半のSRE業で行ってきた事の整理

                  直近2年半くらいの間にSREチームのリーダー(マネージャー)、ならびにシニアエンジニア(スタッフエンジニア)としてSRE業を行ってきました。 私は過去にSRE専業の経験はなく、この会社にもSREとして入ったはずではなかったのですが、なし崩し的に入社時の取り決めとは異なる職につくことになりました。 とはいえ、今までのキャリアはサーバーサイドエンジニア・バックエンドエンジニア中心ということもあり、アプリケーションの開発にあわせてシステムの構築や監視などもずっとやってきたので、SRE的なスキルは具備していたと思います。Datadogも何気に使いはじめて10年以上経ってます。 2年半の間、客観的に見て大したことはやってきてないですが、自分のこれまでとこれからを見通すための備忘録として、やってきたことをまとめてみたいと思います。 会社 会社は創業10年くらいの中小企業で、BtoC系。ビジネス規模とし

                    2年半のSRE業で行ってきた事の整理
                  • とあるSREの一日

                    とあるSREの一日 こんにちは。あおい(@_a0i)です!株式会社リクルートでSREをやっています。私は心身共に女性ですが、エンジニア業界そしてとりわけSREは女性比率が非常に少ないです。なぜ冒頭から性別の話を出したかというと、今回寄稿するにあたり、「SREが普段どういう仕事をしているか紹介したい」以外にも「女性のSREも存在し、楽しく働いていることを示したい」という二つの目的を掲げてこの記事を書くことに決めたからです。 わざわざ女であると明言していますが、このあと綴られる日常としてマイノリティである大変さや女性身体における苦労のような話は含まれていません。私はチームメンバーに恵まれたこともあって、自分の性別を日常的に気にすることなく楽しく働けています。 じゃあどう働いているの?ということで「とあるSREの一日」と題して、私が一日を通してどんな仕事をしているかご紹介できればと思います! ま

                      とあるSREの一日
                    • Embedded SREが負荷試験を進める上で学んだ、押さえておくべきポイント

                      1. SREと負荷試験 信頼性を向上させるためには、システムの可用性を確保することが重要です。SREの役割は、システムが安定して動作し、予期せぬ障害が発生しないようにすることです。特にデプロイの際には、リスクが伴います。デプロイが複雑になるほど、その影響は大きくなり、障害の規模も拡大する傾向にあります。Testimの記事では、デプロイの複雑性が増すと、手順が増えたり、多くの人が関与することで、問題が発生する確率が高まると述べられています 6 Deployment Risks and How To Mitigate Them プロダクトのリリース前には、動作確認を行うことが必要ですが、負荷試験を実施せずに本番環境に移行してしまうと、予期せぬ障害が発生する可能性があります。これによってサービスが停止することは、ビジネスにとって致命的な損失となり得ます。Microsoftもまた、デプロイに際して

                        Embedded SREが負荷試験を進める上で学んだ、押さえておくべきポイント
                      • SRE 式プロジェクト管理: プロジェクトと本番環境のニーズをうまく満たす方法 | Google Cloud 公式ブログ

                        Karan AnandTechnical Program Manager, Site Reliability Engineering ※この投稿は米国時間 2024 年 9 月 28 日に、Google Cloud blog に投稿されたものの抄訳です。 おそらく皆さんも、定められた期限にプロジェクトが間に合わず、イライラした経験があることでしょう。プロジェクトのスタッフやコンピューティング リソースが優先順位の高いプロジェクトに再配分されたこともあるかもしれません。こうした不確実性の中でプロジェクトを期限内に終わらせることは至難の業です。 サイト信頼性エンジニアリング(SRE)チームの場合、これは特に当てはまります。プロジェクト管理の原則は役に立ちますが、IT 分野の多くのプロジェクト管理フレームワークは、ソフトウェア開発チームのような重点が一つのみのチームを対象としています。 Goog

                          SRE 式プロジェクト管理: プロジェクトと本番環境のニーズをうまく満たす方法 | Google Cloud 公式ブログ
                        • hacomonoにSRE文化を取り入れる為にSLOダッシュボードを創設した話 - hacomono TECH BLOG

                          はじめに 初めまして。SRE部のiwachan(@Diwamoto_)です。 hacomonoには2024年の1月に入社しました。もう半年過ぎてて時間が早く感じます。 最近は5ヶ月になった娘を絶賛溺愛しています。 徒歩0分で娘の顔を見れる点はリモートワークの利点の一つですね。 また、Xで溢れている地面師ネタを理解したく、やっとNetflixに加入して「地面師たち」を全部見ました。ひとまず今年1番面白かったです。 TL;DR SLO文化を醸成するためにダッシュボードを展開したよ そのおかげで潜在的なバグを発見したよ かなり安くできたよ ここまで来るのにSLO本が本当に助けになったからみんなも読んでみてね 想定読者 SRE本を読んで、組織に導入したいと検討している方 SRE文化の醸成に興味がある方 SLOの実装に興味がある方 なぜやりたかったのか hacomonoではマルチテナントの監視にDa

                            hacomonoにSRE文化を取り入れる為にSLOダッシュボードを創設した話 - hacomono TECH BLOG
                          • SRE NEXT 2024に参加してきました! - エス・エム・エス エンジニア テックブログ

                            こんにちは、プロダクト推進本部人事のふかしろ(@fkc_hr)です。 8月2日、3日に開催されたSRE NEXT 2024に、エス・エム・エスのメンバーが参加してきました&弊社もGOLDスポンサーとして協賛いたしました。 sre-next.dev この記事では、メンバーの印象に残ったセッションの紹介・感想とブースの振り返りをお届けします! みんなのイベント感想 山口(全社SRE) 全社SREの山口(@yamaguchi_tk)です。 SRE NEXT 2024のコアスタッフをしていました&Snykさんのスポンサーセッションで登壇(DevSecOpsの内回りと外回りで考える持続可能なセキュリティ対策)しました。(2日目のイベントの撤収時という疲労がピークの時に資料をアップしたのでURL設定をミスってしまい同じ資料が2つアップされています) speakerdeck.com SRE NEXT 2

                              SRE NEXT 2024に参加してきました! - エス・エム・エス エンジニア テックブログ
                            • SREって何?GoogleCloudと日々の業務で考えてみた! - NRIネットコムBlog

                              本記事は Google Cloudウィーク 3日目の記事です。 💻☁ 2日目 ▶▶ 本記事 ▶▶ 4日目 ☁💻 はじめに SREとは GoogleCloudの関連サービス 業務にあてはめると(サービス面) 業務にあてはめると(障害発生時) まとめ はじめに こんにちは、木下です。Google Cloud ウィークということで、ネットコムテックブログ2回目の執筆機会がやってきました。 弊社ではGoogleCloud(GCP)を扱う比率はまだ低いですが、私が担当しているシステムではGoogleCloudを利用しています。 今回は日々の業務視点も含め、SREについて記載していきます。 GoogleCloudを使っていない方もSREの考え方は業務に活かせる点があると思いますので、ぜひ最後まで読んでいただけると嬉しいです。 SREとは SRE (Site Reliability Engineer

                                SREって何?GoogleCloudと日々の業務で考えてみた! - NRIネットコムBlog
                              • SRE になるために役立つシステム エンジニアリングのシラバスのご紹介 | Google Cloud 公式ブログ

                                Gemini 1.5 モデル をお試しください。Vertex AI からアクセスできる、Google のもっとも先進的なマルチモーダル モデルです。 試す ※この投稿は米国時間 2024 年 6 月 14 日に、Google Cloud blog に投稿されたものの抄訳です。 Google のサイト信頼性エンジニア(SRE)が広く用いているシステム エンジニアリングの規範は、信頼性の高いシステム(コード、インフラストラクチャなどあらゆるもの)の作成と実装を通して形成されたものです。システム エンジニアリングの詳細とベスト プラクティスの実践方法を学んでいただけるよう、スタートガイドとなるリソースをいくつかまとめてみました。 The Systems Engineering Side of Site Reliability Engineering(USENIX の論文)システム エンジニアとは

                                  SRE になるために役立つシステム エンジニアリングのシラバスのご紹介 | Google Cloud 公式ブログ
                                • 【家族アルバム みてね】SRE(Site Reliability Engineer) - MIXI GROUP RECRUIT

                                  『家族アルバム みてね』について 『家族アルバム みてね』は「世界中の家族のこころのインフラをつくる」をミッションに掲げ、2015年にリリースした、家族向けアルバムサービスです。 世界中の家族にサービスを展開し、現在では利用者数2,000万人を突破(※iOS・Android™ アプリ登録者数、ブラウザ版登録者数の合計)しました。 「みてね」は写真・動画の家族内での共有とコミュニケーションはもちろん、サブスクリプションモデルの「みてね プレミアム」や蓄積した家族の写真や動画を使うことができる「写真プリント」「フォトブック」「DVD」などのバリエーション豊かな商品を展開してお客様にお届けしています。 また、“FamilyAlbum” という名称で世界展開もしており、7言語・175の国と地域に対応して世界中でユーザーを増やし続けています。 仕事内容 みてねのサービスの信頼性向上と開発者の生産性向

                                    【家族アルバム みてね】SRE(Site Reliability Engineer) - MIXI GROUP RECRUIT
                                  • SREをはじめよう ―個人と組織による信頼性獲得への第一歩~ Forkwell Library#70 (2024/10/17 12:00〜)

                                    📝 開催概要 「つぎの一歩が見つかる、気づきと学びの場」 Forkwell Library シリーズ 第70弾 これまで Forkwell のイベントで登壇されたエキスパートの方々は、先達が記した書籍から「気づき」を得て実践し、振り返り、再現性のある「学び」として身に付けていく中で、実績を築いてこられました。 しかし、日々限られた時間の中で知識や情報をアップデートし続けるのはそう簡単ではありません。 Forkwell Library では、著者・訳者・実践者らを登壇者として招き、そんな思いを抱えた開発者の皆さまが「学びのきっかけ」を得られる勉強会を目指します。 第70回目では『SREをはじめよう ―個人と組織による信頼性獲得への第一歩』を取り上げます。 「SREとはどのようなものか」「SREになるには何をすればよいのか」「SREを導入するにはどのように始めればいいのか」「するべきこと、避

                                      SREをはじめよう ―個人と組織による信頼性獲得への第一歩~ Forkwell Library#70 (2024/10/17 12:00〜)
                                    • 新人SREが0から始めるGKE上でのArgoCDによるWordPressデプロイ | sreake.com | 株式会社スリーシェイク

                                      これらのタスクに加えて、一貫して必要になってくることとして、「セキュリティや機密情報の取扱いに注意して構築すること」が重要になってきます。例として、以下のようなものがあげられます。 外部公開するリソースやアプリケーションは関係者のみが利用できるように特定のIPアドレス下のアクセスに制限するパスワードや認証情報の設定が必要な場合はハードコードせずに暗号化して保存 以下が今回作成した課題前半の大まかなアーキテクチャ図になります。UserがWordpressアプリケーションの使用者、ArgoCD AdminがArgoCDを利用してアプリケーションをデプロイする開発者、Cloud Developerがクラウド基盤を構築している開発者になります。 ※ 以下の図がベストプラクティスというわけではありません。課題の条件に合わせてどうすればよいかを考えていく必要があります。 研修前半で構築したアーキテクチ

                                        新人SREが0から始めるGKE上でのArgoCDによるWordPressデプロイ | sreake.com | 株式会社スリーシェイク
                                      • グリー、スマートニュースの急成長を支えたSREマネージャーが、kubellのインフラの未来を描く。 |kubell days

                                        自分らしく働けている。この会社だからこそ、この後のキャリアに納得できる答えが出せる|尾形 暢俊|kubell daysはkubellグループの日々をとどけるメディアです

                                          グリー、スマートニュースの急成長を支えたSREマネージャーが、kubellのインフラの未来を描く。 |kubell days
                                        • 『SREをはじめよう』(オライリー・ジャパン)を献本いただきました | Marginalia

                                          量的構成(部ごとのページ比率) 序文にも書かれていますが、この本の主題は2つの問い、「私(個人)はどのようにSREをはじめればよいのか?」と「私の組織はどのようにSREをはじめればよいのか?」です。それがそれぞれ第Ⅱ部と第Ⅲ部で30%以上書かれており、それらの前提となるSREの入門的な内容も約20%とそれなりの分量で占めているのがわかります。そして際立つのは付録の多さで、全体の12%が付録です。 章ごとに見ると、だいたいどの章も同じボリュームであることがわかります。少し長いのは10章「失敗から学習する」と13章「ビジネス観点からのSRE」ですが、それでも章ごとに読んでいけば均等なリズムで読み進められそうです。 量的構成(章ごとのページ比率) この本の問い先にも書いたように、この本は2つの大きな問いに読者が取り組むために書かれています。それは「私(個人)はどのようにSREをはじめればよいのか

                                            『SREをはじめよう』(オライリー・ジャパン)を献本いただきました | Marginalia
                                          • SRE 式プロジェクト管理: プロジェクトと本番環境のニーズをうまく満たす方法 | Google Cloud 公式ブログ

                                            Karan AnandTechnical Program Manager, Site Reliability Engineering ※この投稿は米国時間 2024 年 9 月 28 日に、Google Cloud blog に投稿されたものの抄訳です。 おそらく皆さんも、定められた期限にプロジェクトが間に合わず、イライラした経験があることでしょう。プロジェクトのスタッフやコンピューティング リソースが優先順位の高いプロジェクトに再配分されたこともあるかもしれません。こうした不確実性の中でプロジェクトを期限内に終わらせることは至難の業です。 サイト信頼性エンジニアリング(SRE)チームの場合、これは特に当てはまります。プロジェクト管理の原則は役に立ちますが、IT 分野の多くのプロジェクト管理フレームワークは、ソフトウェア開発チームのような重点が一つのみのチームを対象としています。 Goog

                                              SRE 式プロジェクト管理: プロジェクトと本番環境のニーズをうまく満たす方法 | Google Cloud 公式ブログ
                                            • SRE Kaigi 2025の公式サイトを公開しました! - SRE Kaigi スタッフブログ

                                              皆さん、こんにちは!SRE Kaigi 2025実行委員会 広報担当です。 この度、SRE Kaigi 2025の公式サイトを公開いたしましたことをお知らせいたします! 2025.srekaigi.net 公式サイトでは、以下の情報を確認いただけます。 イベントの概要と開催日程 スポンサー様 コアスタッフ 行動規範・プライバシーポリシー 今後も、登壇者やセッション情報・チケット情報などを随時更新予定ですので、ぜひ定期的にチェックしてみてください!

                                                SRE Kaigi 2025の公式サイトを公開しました! - SRE Kaigi スタッフブログ
                                              • Wantedly Tech Night 〜サービスを支えるインフラ/SRE技術〜 (2024/11/20 19:00〜)

                                                ※当日予告なく変更になる可能性がございます。 発表者 巨畠 和樹 @donkomura_ Infra Squad / インフラエンジニア 出版・インターネット領域でクラウドネイティブなシステムの運用・開発に従事した後、2024年9月にウォンテッドリー株式会社に入社。Kubernetes を中心としたインフラ基盤や監視基盤の運用・開発を行っている。 Wantedly Profile : https://www.wantedly.com/id/obata_kazuki 登壇タイトル:ウォンテッドリーのインフラチームに加わってみて 登壇内容:ウォンテッドリー株式会社に join して2ヶ月半が経過した私の経験を踏まえて、外からみた Wantedly と内側からみた Wantedly の違いや技術的な課題についてお話します。特に直近で取り組んだ SLO におけるバーンレート急増への対応やオブザーバ

                                                  Wantedly Tech Night 〜サービスを支えるインフラ/SRE技術〜 (2024/11/20 19:00〜)
                                                1