並び順

ブックマーク数

期間指定

  • から
  • まで

681 - 720 件 / 1084件

新着順 人気順

SREの検索結果681 - 720 件 / 1084件

  • 自由研究には向かないウェブオペレーション

    自由研究には向かないウェブオペレーション サイト運用管理を取り巻く環境の変化 Cloud Native時代に考えるLinux オペレーション というタイトルで登壇してきました。 2023年2月18日 【今更聞けない】Linuxのしくみ - Forkwell Library #16 https://forkwell.connpass.com/event/273179/ あとがき 『自由研究には向かないウェブオペレーション』というタイトルで登壇しました。 https://syu-m-5151.hatenablog.com/entry/2023/02/18/201252

      自由研究には向かないウェブオペレーション 
    • delyのCTOを引き継ぎました|井上崇嗣 / dely

      delyで何をしてきたか delyには2018年5月にSREとして入社し、約3年半在籍していることになります。やってきたことはざっくり分けると4種類です。 ・SREとしてのエンジニアリング業務 ・エンジニア採用/マネジメント ・サーバサイド含むバックエンド全般の技術改善のリード ・ID基盤開発やTRILLリプレイスなどの長期プロジェクトのリードSREとして入社していますが、後半になるほどSREとしての業務の割合は減っていきました。というより減らさざるをえなかったという感じです。 入社から半年後の2018年11月にサーバサイドメンバーのマネジメントをすることになり、2019年9月から開発部の部長として本格的に採用に関わるようになったため、SREとマネジメントを兼務する形となっていました。 マネジメントへの取り組みに関しては当時SELECKさんに記事にして頂きました。 SREの人員が潤沢だった

        delyのCTOを引き継ぎました|井上崇嗣 / dely
      • インシデントコマンダーやってみた

        「ゆるSRE勉強会 #4」の LT 資料です。 https://yuru-sre.connpass.com/event/306649/

          インシデントコマンダーやってみた
        • Operating a Large, Distributed System in a Reliable Way: Practices I Learned

          For the past few years, I've been building and operating a large distributed system: the payments system at Uber. I've learned a lot about distributed architecture concepts during this time and seen first-hand how high-load and high-availability systems are challenging not just to build, but to operate as well. Building the system itself is a fun job. Planning how the system will handle 10x/100x t

            Operating a Large, Distributed System in a Reliable Way: Practices I Learned
          • Hatena Engineer Seminar #20「AWS Renovation 編」をオンラインで開催しました #hatenatech - Hatena Developer Blog

            2022年6月7日(火)に、 Hatena Engineer Seminar #20 をオンライン開催しました。ご参加いただいたみなさま、ありがとうございました。 このエントリーでは、当日のアーカイブ動画や公開資料をご紹介します。 Hatena Engineer Seminar #20 について 発表概要と資料 Amazon Aurora の v1 が EOL になるので10クラスタアップグレードして出てきたノウハウ - by id:dekokun はてなフォトライフをECSに移行した話 - by id:cohalz Amazon EKS マルチテナントクラスターにおけるArgoCDを利用したデプロイフローの話 - by id:masayosu AWS Organizations 組織を移動する時に考えること100連発 (AWS Control Tower への組み込みを添えて) - by

              Hatena Engineer Seminar #20「AWS Renovation 編」をオンラインで開催しました #hatenatech - Hatena Developer Blog
            • プロダクトオーナーとしてのSLOへの向き合い方 - Mackerel Meetup復活記念連載 #5 - Mackerel お知らせ #mackerelio

              こんにちは。Mackerel プロデューサーの id:wtatsuru です。最近、世界的にSLOが流行していますね。『SLO サービスレベル目標』 という本がもうすぐオライリー・ジャパン社から刊行されるようなので、私も楽しみにしています。そんなSLOに寄せての記事です。 SLO(Service Level Objective)とは、可用性やエラー率などのサービスレベル指標(SLI, Service Level Indicator)について定める目標で、SREの考え方に基づいた運用で使う考え方の1つです。最近では、SLOに基づいた運用の事例も増えてきました。Mackerelチームでも実際にSLOを定めて運用し、Mackerel自体の開発にも活かしています。Mackerelを使った実装や、実際の運用状況については以下の記事をご覧ください。 mackerel.io mackerel.io 私は

                プロダクトオーナーとしてのSLOへの向き合い方 - Mackerel Meetup復活記念連載 #5 - Mackerel お知らせ #mackerelio
              • オブザーバビリティの始め方 - 予期せぬトラブルをスピーディに解決するために

                本記事は、TechFeed Experts Night#17 〜 事例で学ぶSRE 〜 ツール、プラクティスから組織づくりまでのセッション書き起こし記事になります。 イベントページのタイムテーブルから、その他のセッションに関する記事もお読み頂けますので、一度アクセスしてみてください。 本セッションの登壇者 セッション動画 株式会社MIXIの清水勲と申します。 2011年に株式会社MIXIに入社し、現在は家族アルバム みてねのSREをしています。 オブザーバビリティとは? オブザーバビリティはSREにとって非常に重要なテーマです。GoogleのSREに関する書籍「Site Reliability Engineering」にはサービスの信頼性の階層を説明した図(Service Reliability Hierarchy)が掲載されています。その最下層にはモニタリングが定義されており、モニタリン

                  オブザーバビリティの始め方 - 予期せぬトラブルをスピーディに解決するために
                • 0から作るメルカリShopsのCSオペレーション基盤 | メルカリエンジニアリング

                  こんにちは。ソウゾウのSoftware Engineerの @naopr です。 連載:「メルカリShops」プレオープンまでの開発の裏側 の5日目を担当します。 はじめに このエントリでは、メルカリShopsを構成するシステムの中でもお客さまの目に直接触れることのないCS(Customer Service/Success)オペレーション用のシステムについてご紹介します。 CSオペレーション用のシステムをメルカリグループでは CSツール と呼んでいるため、このエントリでもその呼称を使うこととします。 はじめにメルカリShopsのCSオペレーションの概要についてご説明したあと、システムのアーキテクチャと技術スタックについてご紹介します。そして、CSツールの基盤機能と各オペレーション用の機能について、実際の画面をご覧いただきながらご説明します。 ※画面は開発環境のものでありテストデータを表示し

                    0から作るメルカリShopsのCSオペレーション基盤 | メルカリエンジニアリング
                  • SREが明かす!システム監視における動的閾値設定の適応例 / 開発者向けブログ・イベント | GMO Developers

                    お疲れ様です。技術ブログを久しぶりに投稿します。SREチームのキム・ドンヒョンです。 SREチームは、信頼性の高いシステムを提供するため、様々な活動を通じてシステムをサポートしています。その中でもシステムの監視と通知活動は、SREチームの重要な業務の一つです。今回は、サービスの安定性を確保するための重要な活動の一つである閾値設定について詳しく説明します。 基本的な監視と閾値設定 基本的なシステムの監視は、システムのパフォーマンスが特定の閾値を超えたり下回ったりしたときに警告を発することです。こうした監視により、システムは自己フィードバックを受けて安定した正常状態を保つことができます。例えば、エアコンのように室内温度を一定に保つ必要があるシステムでは、温度が一定の範囲を外れるとイベントを発生させたり、必要な動作を行ったりしてシステムの安定性を維持します。このような閾値設定は、システムの特性に

                    • 1400 行の一枚岩な .gitlab-ci.yml を分割して CI を高速化した - 弁護士ドットコム株式会社 Creators’ blog

                      こんにちは。弁護士ドットコム クラウドサイン事業本部で SRE をしています、大内と申します。 クラウドサイン事業本部の SRE ではサービスの可用性、信頼性の向上や開発の高速化、省力化を目指した開発を日々行っています。 クラウドサイン事業本部では本体アプリケーション(以下本体)のソースコード管理を GitLab で行っています。 そして、本体とその関連サービス、バッチなどを 1 つのリポジトリで管理するモノレポ構成を取っています。 今回は、そんなモノレポ構成のリポジトリの GitLab CI パイプラインを分割し、開発速度を大きく改善した話をご紹介します。 CI 分割以前の CI 構成 モノレポ構成プロダクトの CI が抱えていた課題 他のテストの待ち時間の影響を受けて待ち時間が伸びる テストが失敗するとすべてのデプロイがブロックされる .gitlab-ci.yml の肥大化による、コー

                        1400 行の一枚岩な .gitlab-ci.yml を分割して CI を高速化した - 弁護士ドットコム株式会社 Creators’ blog
                      • DX事業本部インフラの3年分の進化 (2019 ~ 2022) - Speee DEVELOPER BLOG

                        お疲れさまです。SREの西田和史(@k_bigwheel)です。 僕が所属するDX事業本部の開発基盤グループは主にインフラが安定して高いパフォーマンスで動くことに責務を持っています。 今DX事業本部には3つの事業部があり、その中ではイエウール、ヌリカエ、ケアスル介護などのサービスを展開していますので、僕らはそれらのだいたい10サービス前後のインフラを日々増築・改善しています。 僕がSpeeeにジョインしたのが3年前の2019年11月なのですが、それからDX事業本部のインフラは様々なことが進化しました。3年前から変わらず残っているインフラコンポーネントは永続化層1ぐらいといえる程です。ここではその差分を振り返ってこんな良いインフラになったぞ!という部分を書いていきたいと思います。 レガシーインフラの脱却 いきなりですが、3年前に使っていたツール・サービスと今使っているツール・サービスの対応表

                          DX事業本部インフラの3年分の進化 (2019 ~ 2022) - Speee DEVELOPER BLOG
                        • 「CSM」と「CRE」の2職種を新たに設けた背景や舞台裏 |Autifyブログ

                          こんにちは!カスタマーサクセスエンジニア改め、カスタマーサクセスマネージャーの井上です。Autify には昨年・2021年3月の入社で1年ちょっと在籍しているのですが、こちらのブログでは初めまして!となります。ちなみに前職では、サーバーモニタリングSaaSの「カスタマーリライアビリティエンジニア」としてお仕事をしていました 😃 このたび Autify では、これまでの「カスタマーサクセスエンジニア」職を「カスタマーサクセスマネージャー(CSM)」と「カスタマーリライアビリティエンジニア(CRE)」という2つの職種に生まれ変わらせる、という決定をしました。今日はその背景や舞台裏のようなお話を、こちらでご紹介します。 「カスタマーサクセスエンジニア」とはどのような職種だったのか 「カスタマーサクセスエンジニア」職だった私達は、主に以下のような業務に取り組んでいました。 カスタマーサクセス業務

                            「CSM」と「CRE」の2職種を新たに設けた背景や舞台裏 |Autifyブログ
                          • セキュリティの「衞り」の全国大会 Hardening II SU に出場してきたよ - Mercari Engineering Blog

                            こんにちは、メルペイでバックエンドエンジニアをしている id:koemu です。 去る2019/07/04〜05の間、私を含めたメルカリグループ3名のエンジニアが、セキュリティの「衛り」の全国大会 Hardening II SU に参加してきましたので、報告します。 TL;DR セキュリティの「衛り」の技術を競う大会に参加してきた 自走できるレベルの高いメンバーが集まりOSSをはじめ成果物もできた 惨敗だったがセキュリティの衛りの知見をたくさん得ることができた Hardening とは Hardening とは、セキュリティの衛りの技術を競う大会です。日本各地で開催されており、この Hardening Project が主催する Hardening II SU (以下、本競技)は最も規模が大きく、競技の複雑度も高くなっています。 本競技において、セキュリティに関するソフトウェア技術は衛りの

                              セキュリティの「衞り」の全国大会 Hardening II SU に出場してきたよ - Mercari Engineering Blog
                            • SLO の監視に Burn Rate Monitoring を導入してみた話 - スタディサプリ Product Team Blog

                              こんにちは。スタディサプリ小中高 / Quipper SREの@kyontanです。 この記事は Recruit Engineers Advent Calendar 2022 の1日目の記事です。 開発チームが事実に基づいて(= fact-basedな)意思決定をできるようにするための一助として、SREチームではSLO (Service Level Objective)が設定されていることをサービス公開時の要件としています。 スタディサプリ小中高におけるSLOの運用については、以前弊チームの@chaspyが SRE NEXT 2020 で「SLO Review」というタイトルで登壇しました #srenext という記事を書いているので、こちらもご参照ください。 本記事では、これまでしきい値によるアラートを設定していたSLOについて、Burn Rateによるモニタリングを試してみたので、ざっ

                                SLO の監視に Burn Rate Monitoring を導入してみた話 - スタディサプリ Product Team Blog
                              • ヘンリーにおける可観測性獲得への取り組み

                                OpenTelemetry Meetup 2023-10 https://opentelemetry.connpass.com/event/296353/

                                  ヘンリーにおける可観測性獲得への取り組み
                                • Hatena Developer Blog 編集部の活動の紹介 - Hatena Developer Blog

                                  この記事は「はてなエンジニア Advent Calendar 2021」の24日目の記事です。 qiita.com はてなで SRE をやっている id:nabeop です。普段の業務とは別にはてなのアウトプットを大いに盛り上げる団 (HOO 団) としてエンジニアのアウトプットを支援することもしています。 今回は HOO 団の活動の一環として Hatena Developer Blog で定常的にエントリが公開できるように活動する Hatena Developer Blog 編集部 (HDB 編集部) があります。今回は HDB 編集部の活動の紹介をしようと思います。 HDB 編集部の活動の概要 HDB 編集部経由でのエントリが公開されるまで 公開時の工夫 エントリ公開後 まとめ HDB 編集部の活動の概要 Hatena Developer Blog で公開されるエントリの全てに HDB

                                    Hatena Developer Blog 編集部の活動の紹介 - Hatena Developer Blog
                                  • SREエンジニアのスキルアップ方法 / How to improve SRE skills

                                    2023年8月28日にスタディスト社オフィスにて開催された「ゆるSRE勉強会 #1」で、「SREエンジニアのスキルアップ方法」についてお話してきました。 ゆるSRE勉強会 #1 https://yuru-sre.connpass.com/event/292063/

                                      SREエンジニアのスキルアップ方法 / How to improve SRE skills
                                    • 「理論と実践からSREを再考する」というイベントで司会進行とパネルディスカッションのモデレーターをやる #SREGaps - じゃあ、おうちで学べる

                                      はじめに 本日、2021年9月9日19時30分より『SRE Gaps「理論と実践からSREを再考する」』というイベントがあります。私、nwiizoはそこでパネルディスカッションのモデレーターを行うことになりました。 forkwell.connpass.com 500名以上も参加登録されていてかなり注目されていると思います。SRE という概念を導入する日本企業の開発組織も増えてSREの考え方は多くの場所で取り入れられ、実践されています。 しかし、SRE の実践方法はプロダクトの性質や組織の規模、チーム構成によって異なるほか、 文化としても各企業それぞれ異なる解釈をしている場合が多く存在しており有効に活用されていない現状が見られます。とりあえず、流行っているので「インフラエンジニア」という役職名だけ「SRE」にしており実務としては変わらないままみたいなことが聞こえてきて悲しいです。SREはya

                                        「理論と実践からSREを再考する」というイベントで司会進行とパネルディスカッションのモデレーターをやる #SREGaps - じゃあ、おうちで学べる
                                      • ジョブメドレー SRE Unit の業務を円滑に行う取り組みについて | MEDLEY Developer Portal

                                        2023-08-31ジョブメドレー SRE Unit の業務を円滑に行う取り組みについてはじめにこんにちは。 人材プラットフォーム本部プロダクト開発室第一開発グループの阪本です。 毎日夕方になっても 30 度を超えるような猛暑が続く中、皆さんはいかがお過ごしでしょうか? 今まで何度も紹介させていただきましたが、私は阪神タイガースのファンです。 今年は第二次岡田政権の 1 年目、開幕からの好調を維持し交流戦までは首位独走。交流戦明けに一時的に首位を明け渡す事態になりましたが、8 月に入り破竹の 2 桁連勝で首位奪還どころか独走状態という最高のシーズンを迎えております。 投手は元々良いチームではありましたが、今年は課題であった守備と出塁率に改善が見られ 普通にやれば勝てる チームに近づいたというのが大きいのではないでしょうか。 この記事が公開される頃には優勝マジックが点灯し、18 年振りの「あ

                                          ジョブメドレー SRE Unit の業務を円滑に行う取り組みについて | MEDLEY Developer Portal
                                        • Infra Study Meetup #1「Infrastructure as Code」 (2020/04/24 19:25〜)

                                          新しい配信用URLはこちらです。 https://youtu.be/_bLzgd_UlbU #InfraStudy #forkwell 本イベントは、複数回にわたりインフラ技術の各分野に精通した講師をお招きし、インフラ技術の「これまで」と「これから」を網羅的に学ぶことを趣旨として開催いたします。 オンライン会場 ライブ配信用 YoutubeチャンネルURLを公開いたしました! 下記リンクからチャンネル登録とライブ配信のリマインダー通知設定をお願いします。 技術書プレゼント企画! 参加者1600人を記念してプレゼント企画を実施します! 基調講演の感想をイベント開催中に #InfraStudy Forkwell 付きで投稿した方から抽選で10人に mizzyさんの著書「Serverspec」または監訳書「Infrastructure as Code」のいずれか1冊をプレゼントします。 当日は一

                                            Infra Study Meetup #1「Infrastructure as Code」 (2020/04/24 19:25〜)
                                          • 「コスト削減」というパワーワードに負けずにコストコントロールを素早く進めたい

                                            この記事は株式会社 X-Tech5 CTOの、ばば(netmarkjp)が書きました。 事業でのコストコントロールは永遠の課題ですね。クラウドサービスのコストコントロールは昨年あたりから特に大きく取り上げられている印象です。 キーワードとしては「コスト削減」や「コスト最適化」がよく使われます。ここではまるっとコストコントロールと呼びます。 わたしはお仕事で色々な会社のSREの実践や体制構築をお手伝いするSREサービスや、SRE/オブザーバビリティの導入・定着支援をしています。 各種クラウドサービスのコストコントロールの機会も多々あるので、その中で得たクラウドサービスのコストコントロールにスムーズに取り組むためのヒントを共有します。 同じ成果なら支出は少ないほうが嬉しい 何をいまさら、という感じかもしれませんが、支出は少ないほうが嬉しいですよね。それはそう。 ただ、この「同じ成果なら」という

                                              「コスト削減」というパワーワードに負けずにコストコントロールを素早く進めたい
                                            • 自分の「やりたいこと」を会社の「やるべきこと」に結び付けてWin-Winに。SRE課でGitの改善に取り組む渡邉さんのお話 #ヌーラバーになりませんか | 株式会社ヌーラボ(Nulab inc.)

                                              ヌーラボのインタビュー企画第19回目。今日はこれからヌーラボが強化していきたいBacklogのSREを担当するチームの中でもGit機能の改善・強化を担っているチームからなべさん (vvatanabe) のお話を伺います。 昨年はGoCon Sendaiで登壇するなど大活躍!Goという強みを持つなべさんに、今後のGitチームとしての取り組みについてインタビューしてみました! 今日のInterviewee サービス開発部 SRE課 渡邉 祐一 2015年、ヌーラボにバックエンドエンジニアとして入社。現在はBacklogのGitホスティングにおける機能やミドルウェアに関する開発を担当。Goでの開発を得意としGo関連のイベントなど多数の登壇や技術誌への寄稿の実績あり。 東京から福岡へのUターン — なべさんは東京で働かれたあと、Uターンで福岡に戻ってこられたんですよね!ヌーラボに入社してもう何年で

                                                自分の「やりたいこと」を会社の「やるべきこと」に結び付けてWin-Winに。SRE課でGitの改善に取り組む渡邉さんのお話 #ヌーラバーになりませんか | 株式会社ヌーラボ(Nulab inc.)
                                              • ざっくり理解するPrometheusを使った監視システム #1 - WILLGATE TECH BLOG

                                                こんにちは、ウィルゲートで開発室開発基盤ユニットのマネージャーをしている池添(@for__3)です。 ウィルゲートでは2019年に監視システムをPrometheusに移行して運用して来ました。 tech.willgate.co.jp tech.willgate.co.jp ですが、社内のメンバーの入れ替わりとともにPrometheusの設定や運用を理解しているメンバーも減ってきていました。 そこで、改めてPrometheusのできることやPrometheusを使った監視の仕組みについての社内勉強会を行いました。 今回はその際の資料の一部をブログ用に修正しました。 監視システム全体の構成 Prometheus Exporter node_exporter blackbox_exporter nginx_vts_exporter proxy_exporter まとめ 監視システム全体の構成 『

                                                  ざっくり理解するPrometheusを使った監視システム #1 - WILLGATE TECH BLOG
                                                • 西海岸のスタートアップとカジュアル面談をやってみた話 - inductor's blog

                                                  はじめに Launchableの共同創業者の1人で、Jenkinsの父としても知られる川口耕介さんとMSでアドボケイトをされている寺田佳央さんのご紹介で、西海岸サンタクララにヘッドクオーターを置くShipa.ioというスタートアップのカジュアル面談を受けてみました。日本でプロダクト開発をするエンジニアを募集したいとのことで、紹介の意味も込めて創業者の1人であるVivek Pandeyとカジュアル面談をしたときの内容や感想を書いてみます。 はじめに Shipa.ioについて Shipa.ioは日本でのエンジニア部隊を立ち上げたい どんな人を探している? Shipaのチームメンバーは世界中にいる 英語話せないときついんじゃないの さいごに Shipa.ioについて Shipaはエンジニアの開発からデプロイまでを支援するプロダクトで、SREがポリシーを定めるところから開発者がデプロイをするまでを

                                                    西海岸のスタートアップとカジュアル面談をやってみた話 - inductor's blog
                                                  • SREチームに転職してみて - BASEプロダクトチームブログ

                                                    この記事はBASE Advent Calendar 2021の8日目の記事です。 こんにちは Slackの好きなショートカットはShift + Escの横山です。 SRE Groupに加わって4ヶ月が経ちました。 こちらの記事が書かれてからも4ヶ月が経ちました。 devblog.thebase.in ↑を未読の方がいましたらぜひぜひ読んでください。 同じ4ヶ月という事で振り返ってみたいと思います。 ちなみにこの記事を読む前に入社を決めていますがカジュアル面談の時に同じように説明して頂けました。 チームで大事にしていることは? ・「信頼性=ユーザの期待値を超え続けること」としてこれを維持し続ける ・BASEの機能等々の価値を高めるための時間を多く作っていけるようにする この2つを大事にしていると書いてあります。 私はOKRを決めるのが苦手なので、このようにチームで大事にしているものがわかって

                                                      SREチームに転職してみて - BASEプロダクトチームブログ
                                                    • Chapter 12 - Introducing Non-Abstract Large System Design, Google SRE Book

                                                      Introducing Non-Abstract Large System Design By Salim Virji, James Youngman, Henry Robertson, Stephen Thorne, Dave Rensin, and Zoltan Egyed with Richard Bondi With responsibilities that span production operations and product engineering, SRE is in a unique position to align business case requirements and operational costs. Product engineering teams may not be aware of the maintenance cost of syste

                                                      • MIXIにおけるクラウドコスト最適化術 〜 10年選手の現SREマネージャー 2名に訊く 〜

                                                        ユーザーの増加を喜んでいたら、いつの間にかクラウドコストが高額になっていた!という経験や、コスト削減の結果、安定したサービス運営に必要な部分まで削ってしまわないか不安になった経験はありませんか? 多くの事業にとって、クラウドサービスは欠かせないものになりましたが、何も気にせずに使っているとクラウドコストは右肩上がりで高くなってしまいます。 今や『コスト最適化の知恵』は誰しもが持っていて損が無いもの。ですが、養うのは中々難しい。 こんな時は詳しい人に聞くしかない!ということで、酸いも甘いも知るベテラン SRE のおふたりに、クラウドコスト最適化術について聞いてみました。 クラウドコスト削減のアイデアが欲しい闇雲にコスト削減を目指すのではなく、『コスト最適化』の考え方が知りたい方は、ぜひご覧ください。 ※この記事は「MIXI DEVELOPERS Advent Calendar 2022 」

                                                          MIXIにおけるクラウドコスト最適化術 〜 10年選手の現SREマネージャー 2名に訊く 〜
                                                        • SREは運用チームだけの問題? 開発者のメリットをGoogle×スリーシェイクがプラクティスとともに解説!

                                                          もともとSREはGoogleがサイトの信頼性を高めるために、新しい部署を作り、ゼロから作りあげたものだ。今回はGoogleでオブザーバビリティ領域を担当する山口能迪氏とともに、SREの歴史や原則を確認し、アプリケーション開発者にも恩恵がある部分について語り合ってもらった。 株式会社スリーシェイク Sreake事業部 部長 手塚卓也氏 信頼性向上のためにGoogleが作りあげたSRE、その現在地とは ――まずはこれまでのご経歴や現在の役割について簡単にお聞かせください。 手塚:2016年にインフラ系ベンチャー企業に就職しインフラエンジニアとしてキャリアをスタート、スリーシェイクには2018年に入社し顧客企業へのSRE立ち上げ支援などを行ってきました。現在はSRE総合支援やセキュリティサービスを展開しているSreake事業部の部長としてチーム全体を見ています。 山口:前職は外資系パッケージベン

                                                            SREは運用チームだけの問題? 開発者のメリットをGoogle×スリーシェイクがプラクティスとともに解説!
                                                          • 不可能に見えても諦めない。納得できるまで追求すれば、いつか技術は血肉になる。 - Repro culture

                                                            日々当たり前のように動くプロダクトの裏側で欠かせない役割を担っているチームがある。今回は、サービスの信頼性向上をミッションとして働くSRE(サイト・リライアビリティ・エンジニア)の一人 荒引 健に話を伺った。予測不能な事態や成功プロセスが明確でない状況でも、粘り強く問題解決をし続けるSREの裏側に迫る。 レビューしたコードは、自分のコード −現在行なっている業務内容を教えてください。 主に基盤刷新や機能開発に取り組んでいますが、他にもミドルウェアの運用・パフォーマンスチューニングもしますし、オンコール対応なども行なっています。社内からはSRE[※1]と呼ばれています。 幅広く業務を行なっているように見えるかもしれませんが、シンプルにまとめると「サービスの信頼性向上」「Reproの強みになる基盤構築」が求められている業務ですね。 SRE[※1] →Site Reliability Engin

                                                              不可能に見えても諦めない。納得できるまで追求すれば、いつか技術は血肉になる。 - Repro culture
                                                            • カイポケリニューアルでの SREチームの活動の一部の紹介:認証基盤選定と OpenTelemetry周辺ツール調査 - エス・エム・エス エンジニア テックブログ

                                                              こんにちは、SREをやっている@okazu_dmです。 経歴としては、サーバサイドエンジニアからセキュリティエンジニアを経て、エス・エム・エスではサービス横断で技術的な課題を解決しています。 基本的には組織に必要なことと自分ができることや、やりたいことが交わるポイントで仕事をしており、現在はSREとして働いています。 今回は、過去の記事 とは違い、既存SREチームとは別に、介護事業者向け経営支援サービス「カイポケ」のリニューアルプロジェクトにスコープを絞って新しく立ち上げたSREチームとしての活動を紹介します。 リリース前のプロダクトのSREなので、一般的なSREの定義とは乖離する内容もある点ご留意ください。 リニューアルプロジェクトの概要 昨年末に出したフロントエンドの技術選定に関する記事 での説明と内容的な差分はありませんが、SREの業務の説明の前にこちらでも改めて触れておきます。 イ

                                                                カイポケリニューアルでの SREチームの活動の一部の紹介:認証基盤選定と OpenTelemetry周辺ツール調査 - エス・エム・エス エンジニア テックブログ
                                                              • KyashのServersideにまつわる新しい挑戦について話すKyash Tech Talkをやります - Kyash Product Blog

                                                                Kyashの @convto です。 普段はサーバーサイドの開発をゴリゴリ頑張っていますが、お祭り事も好きなので開催予定のmeetupの運営についてもガッツリ関わっております。 2022/9/12(月) の13時から Kyash TechTalk #4 - Serversideと新しい挑戦 - connpass を開催するので、より広く知ってもらうために告知しつつ、YouTube Liveでお昼開催!などのチャレンジもしているので、そのあたりの狙いや背景を紹介できればなと思います! kyash.connpass.com 開催の経緯 今年の4月ごろに Kyash TechTalk #2 - Serversideのシステム構成とアーキテクチャ - connpass を実施しました。 とてもありがたいことに多くのかたにご参加いただきKyashの取り組みを知っていただけました。ご参加いただいた皆様

                                                                  KyashのServersideにまつわる新しい挑戦について話すKyash Tech Talkをやります - Kyash Product Blog
                                                                • 頑張らなくていいチームだからこそ自分の強みを増やしていきたい | はてなで働く do-su-0805 にアンケート [#8] - Hatena Developer Blog

                                                                  こんにちは、Hatena Developer Blog編集部です。「はてなで働くエンジニアにアンケート」シリーズ、今回はシステムプラットフォーム部のSREであるid:do-su-0805に話を聞きました。 id:do-su-0805にアンケート はてなidとその由来を教えてください いつどんなきっかけで入社されましたか? 現在の仕事を教えてください チーム内の立ち位置を教えてください 1日の仕事の流れを教えてください 最近うまくいったことは何ですか? 最近うまくいってないことは何ですか? 普段大切にしていることは何ですか? はてなはどんな会社ですか? id:do-su-0805にアンケート はてなidとその由来を教えてください 会社用のはてなid は do-su-0805 で、サブアカウントとして運用しています。普段使いのはてなidは do_su_0805 です。 由来としては、いずれもコ

                                                                    頑張らなくていいチームだからこそ自分の強みを増やしていきたい | はてなで働く do-su-0805 にアンケート [#8] - Hatena Developer Blog
                                                                  • Table 1. System performance comparison for old and new architectures.

                                                                    Infrastructure Processing billions of events in real time at Twitter At Twitter, we process approximately 400 billion events in real time and generate petabyte (PB) scale data every day. There are various event sources we consume data from, and they are produced in different platforms and storage systems, such as Hadoop, Vertica, Manhattan distributed databases, Kafka, Twitter Eventbus, GCS, BigQu

                                                                      Table 1. System performance comparison for old and new architectures.
                                                                    • SRE チームで Engineering Manager になって二ヶ月経っての心境など - ツナワタリマイライフ

                                                                      この記事は前任 EM の yuya-takeyama の記事へのアンサーソングであり、 blog.yuyat.jp Engineering Manager Advent Calendar 2021 その2 2日目の記事として寄稿します。 qiita.com 背景 僕は引用記事の SRE チームの Software Enginner でした。ひょんなことから前任が別のミッションを担うことになり、このチームの後任としてどうか、となり 2021年10月より同チームの Engineering Manager をやっています。 以下、引用したりしなかったりしてこの2ヶ月の心境などを語っていきます。 Engineering Manager として置かれている状況 先ほど言った経緯に引き続き、情報的な話でいうと 自分含め7人のチーム もともと中途採用をしていた会社でもあり、自走可能なメンバーで構成されて

                                                                        SRE チームで Engineering Manager になって二ヶ月経っての心境など - ツナワタリマイライフ
                                                                      • Ubie SRE グローバル化の道のり 2023

                                                                        この記事はUbie Engineering Advent Calendar 2023の24日目です。主にInfra/Security/Reliabilityを担当している @sakajunquality がお届けします。胃腸炎により投稿が遅くなりました。胃腸のReliabilityは低めです。根クリスマスから年末にかけて体調を崩すと仕事もプライベートも大変ということが学びです。 さて本題ですが、今回は弊社チームのグローバル化について少しまとめてみたいと思います。 なぜグローバル化するのか?Short Answer: 社長の久保が「ん〜エンジニアのグローバル化したいな〜SREから!」と言ったので。 冗談です。それ自体は一つのきっかけに過ぎません。Ubie はJPだけでなくUSにも事業を展開しており、すでにグローバルチームが存在しています。しかしインフラや基盤のプラットフォームについてはグロー

                                                                          Ubie SRE グローバル化の道のり 2023
                                                                        • モバイルチームの「エリートDevOps チーム」への道のり(我々のFour Keysも公開しちゃうよ) - Uzabase for Engineers

                                                                          概要 どうやって指標を確認しているの? NewsPicksのFour Keysはどんな感じ? 改善前はどんな感じ? 改善のために何をした? 終わりに 概要 NewsPicksは「最高の開発体験の追求」をしている会社です。エンジニア向けのサイトの1ページでも謳っており、そこから弊社高山の記事に辿れるので、こちらも読んで頂けると幸いです。 そして、これはサーバーサイドだけの話しではなく、モバイルチームでも同じように開発者体験向上を目指し、Four Keysを追っています。 Four Keys とは、ソフトウェア開発チームのパフォーマンスを計測する4つの指標です。Four Keys 指標を用いることで、ソフトウェアデリバリの「スピード」と「安定性」を測定できます。 いわゆる組織の開発生産性が可視化できるということですね。 私が所属するモバイルチームもさまざまな改善をすることで、Four Keys

                                                                            モバイルチームの「エリートDevOps チーム」への道のり(我々のFour Keysも公開しちゃうよ) - Uzabase for Engineers
                                                                          • 「家族アルバム みてね」のSREチームの紹介と取り組み

                                                                            こんにちは、みてね事業部 開発グループ SREチームの清水 @isaoshimizu です。 この記事では、「家族アルバム みてね(以下みてね)」を支えるSREチームはどんなチームで、普段どんなことをやっているのかを紹介していきたいと思います。チームの行動は頻繁にアップデートされていくので、定期的にブログ記事にできたらと思っています。 みてねのSREチームはこんなチームまずは、みてねのSREチームの紹介と毎日の仕事の流れについて紹介したいと思います。 ちなみに、SREチームは2018年2月1日に作られました。この時のチームメンバーは3名でした。 SREチーム用のSlackチャンネルが作られたときここから徐々にメンバーが増え、2021年6月時点でのSREチームメンバーは5名となっています。 SREチームが作られてから3年以上経過し、当初からスクラムというスタイルで変わらず運用していますが、1

                                                                              「家族アルバム みてね」のSREチームの紹介と取り組み
                                                                            • ホストのプロビジョニングを Chef から mitamae へ移行した - KAYAC engineers' blog

                                                                              SRE チームの藤原です。Tech KAYAC Advent Calendar 2019 Upgrade/Migration track 6日目の記事です。 今日は長らく EC2 などのホストのプロビジョニングに利用していた Chef を、mitamae に移行したお話です。 Chef とその管理 Chef といえば、Infrastructure as a Code という概念を広めた先駆者ともいえるソフトウェアです。Ruby DSL でホスト上のファイルやパッケージなどの様々なリソースを宣言的にプロビジョニングできる、界隈では大変おなじみの奴ですね。 カヤックでも自分が入社した2011年から Chef によるプロビジョニングを行ってきて、もう8年になります。 多くのプロジェクトではアプリケーションとは切り離した、その名も "chef" という名前の GitHub リポジトリにコードや設定

                                                                                ホストのプロビジョニングを Chef から mitamae へ移行した - KAYAC engineers' blog
                                                                              • SRE Kaigi 2025を開催します! - SRE Kaigi スタッフブログ

                                                                                はじめに SRE Kaigi 2025 実行委員会 委員長の井上(@syossan27)です。 この度、SRE KaigiというSite Reliability Engineering(SRE)に関するカンファレンスを立ち上げました。そして、来年の2025年にSRE Kaigi 2025を開催致します! 詳しい開催日は2025/01/26(日)で、会場は中野セントラルパーク カンファレンスにて開催いたします。開催形式についてはオフライン開催を考えておりまして、どのようなカンファレンスにするかは色々と思案中でございます。Twitter(現:X)や、当ブログでの続報をご期待ください! 何故、このようなカンファレンスを立ち上げたのか?などの経緯や、カンファレンスに対する想いを書いていきます。 何故立ち上げたのか? SREに関するカンファレンスといえばSRE NEXTという大きな先駆者がいます。

                                                                                  SRE Kaigi 2025を開催します! - SRE Kaigi スタッフブログ
                                                                                • Poolにおける足を止めないシステム基盤構築

                                                                                  バッチ resource "aws_sfn_state_machine" "xxx" { name = "xxx" role_arn = aws_iam_role.state_machine.arn definition = jsonencode({ StartAt = "Run ECS Task", States = { "Run ECS Task" = { Type = "Task" Resource = "arn:aws:states:::ecs:runTask.sync" Parameters = { LaunchType = "FARGATE" EnableExecuteCommand = true NetworkConfiguration = { ... } Cluster = ... TaskDefinition = ... Overrides = { ContainerOv

                                                                                    Poolにおける足を止めないシステム基盤構築