並び順

ブックマーク数

期間指定

  • から
  • まで

481 - 520 件 / 810件

新着順 人気順

SREの検索結果481 - 520 件 / 810件

  • Google Cloud Next'24 にて Google Cloudの生成 AI エコシステムはなぜ良いのか?について発表しました|吉田 拓真 / スリーシェイク

    Google Cloud Next'24 にて Google Cloudの生成 AI エコシステムはなぜ良いのか?について発表しました Google Cloud Next'24のJapan Sessionにて、生成AIがエンジニアリングだけでなく、エンジニアリングがコアになるビジネス(SIer, ISVベンダー,SaaSベンダー)自体をどう変えていくのかについて登壇してきましたので、その話をしたいと思います。 生成AIはエンジニア不足を解消し、新しいビジネスモデルを提供する生成AIは予想以上に我々の日々の業務を変えようとしています。 例えばGemini単体だけでなく、Gemini Code AssistやGemini in Databasesなどを併用していくことで少人数で複雑なプロジェクトを短期間で回してく体制を構築し、更に早期にエンジニアを育成していくスキームが構築することができますね

      Google Cloud Next'24 にて Google Cloudの生成 AI エコシステムはなぜ良いのか?について発表しました|吉田 拓真 / スリーシェイク
    • 巻頭言:Four keysの"Change lead time"をちょっと深堀る

      ありがたいことに第2号も発刊できました。ご協力いただけました皆様にここで感謝申し上げます。 今回の巻頭言は、Four keysの"Change lead time"についてちょっと深堀りしてみた話を書いていきます。 Four keysとは “State of DevOps Report"という、毎年DORA(Devops Research And Assessment)社によって発刊されている、DevOpsに関わるエンジニアのアンケートを元に統計を取り、考察・研究されたレポートがあります。 Four keysはその2014年度に発刊されたレポートで発表され、「ITパフォーマンスを測る指標」というものでした。(ITパフォーマンスってザックリした言葉ですね) そんなFour keysは以下の4つの指標で構成されています。 Deployment frequency(デプロイ頻度) Lead ti

        巻頭言:Four keysの"Change lead time"をちょっと深堀る
      • リクルートにおける Platform Engineering / SRE の事例共有

        2023/12/06に、 Platform Engineering Meetup で発表した菅沼の資料です。

          リクルートにおける Platform Engineering / SRE の事例共有
        • 大企業経営におけるSREの重要性 | AEON TECH HUB #3 (2024/04/23 19:00〜)

          開催概要 SREを経営の重要項目としている大企業の考え方に迫るパネルディスカッション SREは安定的な事業・サービス提供において重要な部隊です。特に大企業においてはサービスの停止や障害発生が事業・経営に与える影響も計り知れません。本イベントを主催するイオンにおいても、SREを経営レベルでも重要視しており、SRE部隊の強化を目指しています。今回は同様に経営においてSREを重要視している各社のCTOやSREのプロフェッショナルな方々をお招きし、SRE組織で大切にしていることや、経営層とどのようなコミュニケーションをしているのかなど、現場の話から経営の話まで幅広く語っていただきます。 内容 SRE組織の組成から拡大 経営においてSREの重要性の理解してもらうコミュニケーション こんな方におすすめ SRE組織の組成や拡大、マネジメントに関わる方 CTO・VPoE・EMなどの経営層にSREを理解して

            大企業経営におけるSREの重要性 | AEON TECH HUB #3 (2024/04/23 19:00〜)
          • terraform stateの再設計に取り組んだ話 - freee Developers Hub

            こんにちは!freee enabling sre teamに所属しているhamaa(濵田雄太)です。 この記事はfreee Developers Advent Calendar 2023 - Adventar 1日目です。 自分はfreeeにjoinし、おおよそ1年がたちました。この1年間で主にterraform state再設計、移行について取り組んでいました。 今回はterraform project, stateをどのような観点を元に設計するのかについて記事を書いていこうと思います! 対象読者 これからterraform stateを設計、再設計する人 terraform stateをリファクタリングを考えている人 話さないこと terraform stateの基礎的な話 話の結論 terraform stateは以下の観点で設計することが必要と考えています。 ステークホルダー、設計

              terraform stateの再設計に取り組んだ話 - freee Developers Hub
            • メールサービスの信頼性を支えるSREの取り組み

              AWS Step Functions と Amazon Bedrock で構築する 可用性の高いAIサービス / Awarefy-AI-AWS-Bedrock-Step-Functions

                メールサービスの信頼性を支えるSREの取り組み
              • オンプレPostgreSQLをAmazon Aurora PostgreSQLへ移行しようとしてINDEX作成にハマりました - Oisix ra daichi Creator's Blog(オイシックス・ラ・大地クリエイターズブログ)

                SREの林 aka もりはやです。 先日オンプレで稼働していたとあるPostgreSQLのDBを、Amazon Aurora PostgreSQL(以後はAurora)に移行を行ったところ CREATE INDEX が以下のエラーで作成できない問題に苦労させられたため、解決策と合わせて公開します。 これがベストな対応かは自信がないため、より良い方法をご存知の方はお気軽に教えてください。 以下はDBのリストア中に CREATE INDEX で発生したエラーです。 pg_restore: error: could not execute query: ERROR: could not write to file "base/pgsql_tmp/pgsql_tmp19647.47.fileset/1.2": No space left on device CONTEXT: parallel wo

                  オンプレPostgreSQLをAmazon Aurora PostgreSQLへ移行しようとしてINDEX作成にハマりました - Oisix ra daichi Creator's Blog(オイシックス・ラ・大地クリエイターズブログ)
                • Kubernetes Jobでサイドカーを動かす際の問題と解決策 - でこてっくろぐ ねお

                  UbieでSREをしているdekokunです。この記事は Ubie Engineering Advent Calendar 2023 の 21 日目の記事です。 導入 Kubernetes (k8s) のワンショットのJobにサイドカーを組み合わせると、様々な問題が生じることがあります。Ubie社には、複数の言語で書かれた多数のマイクロサービスが存在します。そしてご多分にもれず、複数マイクロサービスの共通課題をインフラレイヤで管理するためにIstioやCloud SQL Proxy、AlloyDB Auth Proxyなどを使用しています。 この記事では、それらサイドカーをJobと共に使用する際に直面する問題と、世の中でよく語られている解決策、および条件付きながら私たちがどのようにこれらの問題を解決しているのかについて解説します。 k8s Job + サイドカーで発生する問題 かつての私は

                    Kubernetes Jobでサイドカーを動かす際の問題と解決策 - でこてっくろぐ ねお
                  • しんどくないSLI/SLOプラクティスをNew Relicで?

                    はじめに こんにちは、情報システム部 SRE 橋本です。 今回はQiitaのNew Relic Advent Calendar 2023の14日めの記事として書きました。 担当しているシステムでサービス監視やSLI/SLOを用いて、どのようにしてサービスの健全性を知るのか?というのを考えていく中でNew Relicが課題解決に繋がるかもしれないと思い、直近でチームで評価を行いました。 この記事では、どのような課題感を持っていたのかというのと、その課題感に対して当該プロダクトがどう刺さったのかを簡単にお話したいと思います。 サービスとその信頼性 BtoBやBtoCなどで違いはあると思いますが、サービスがあり(中央)、サービスの提供者(下)、サービスを利用するお客様などの利用者(上)という3つの関係性で整理できます。 この関係性の中で、我々は利用者が正常にサービスを利用できているかを知りたいと

                      しんどくないSLI/SLOプラクティスをNew Relicで?
                    • 全銀システム障害の詳細を報告、64ビット化でテーブルサイズが増えて作業領域が不足 | IT Leaders

                      IT Leaders トップ > テクノロジー一覧 > システム構築/プロジェクトマネジメント > 市場動向 > 全銀システム障害の詳細を報告、64ビット化でテーブルサイズが増えて作業領域が不足 システム構築/プロジェクトマネジメント システム構築/プロジェクトマネジメント記事一覧へ [市場動向] 全銀システム障害の詳細を報告、64ビット化でテーブルサイズが増えて作業領域が不足 2023年12月1日(金)日川 佳三(IT Leaders編集部) リスト 一般社団法人全国銀行資金決済ネットワーク(全銀ネット)とNTTデータは2023年12月1日、共同会見を行い、同年10月10日に全国銀行データ通信システム(全銀システム)で発生したシステム障害について経緯、原因、再発防止策を報告した。原因については詳細を明らかにした。システムが32ビット環境から64ビット環境に変わったことで金融機関名テーブル

                        全銀システム障害の詳細を報告、64ビット化でテーブルサイズが増えて作業領域が不足 | IT Leaders
                      • 【雑記】「事業会社のセキュリティマネージャ」というキャリア - 2LoD.sec

                        Xでセキュリティのキャリアについて何名かの方とやりとりする機会があったので、私が名乗っている「セキュリティマネージャ」とは何なのか。を書いてみることにしました。 前置き 一般的なセキュリティマネージャの定義 (私の組織における)セキュリティマネージャのお仕事 必要なスキル 3. 組織のビジネス、システム環境や文化に関する知識 4. ソフトスキル、コンピテンシ、性質 2. セキュリティのマネジメントに関するスキル 1. ITとセキュリティの技術に関するスキル セキュリティマネージャというキャリア 今、技術的に未経験なんですが 今、セキュリティエンジニアの道にいるんですが さいごに 前置き 最初にお断りとして、セキュリティマネジメントの姿は組織によって異なります。 その組織の種類(事業会社かセキュリティベンダか等)、システムの規模、セキュリティ担当の人員数、予算、経営層のセキュリティ意識など様

                          【雑記】「事業会社のセキュリティマネージャ」というキャリア - 2LoD.sec
                        • ソフトウェアエンジニア4年目 - ぽよメモ

                          はじめに TL; DR お仕事 今のポジション お仕事内容もう少し詳しく 今後のキャリアに関する所感 キャリアのために意識してやっていること 他の人の手助けをする 意見を述べる・質問をする 仕事を任せられる人を増やす 多様な情報にアンテナを張る 次にやろうと思っていること メンバーの成果をアピールする チームに入りやすく、そして出やすくする 終わりに はじめに これはあくあたん工房 Advent Calendar 2023 10日目の記事です。 あくあたん工房という団体を設立してから6回目のAdvent Calendarらしいです。なんだかんだ長く続いていて正直ただただ驚いています。後輩たちの努力が凄い。 もうすぐ社会人5年目というところで、自分の仕事とキャリアに関する所感を書いておこうかなと思っています。それなりにちゃんと仕事をし、それなりに大きなタスクを任せられるようになり、社内でのプ

                            ソフトウェアエンジニア4年目 - ぽよメモ
                          • LINEの「あけおめLINE」過負荷対策(3) ― 「発生可能性の低減」におけるキャパシティプランニング | gihyo.jp

                            第1回ではリスクマネジメントの全体像、そして「発生可能性の低減」に関する全般的な説明をし、第2回ではその「発生可能性の低減」のなかでもボトルネックの設計について紹介しました。今回は引き続き「発生可能性の低減」のための施策としてキャパシティプランニングを採り上げ、私たちが実際に行なっている方法をご紹介します。 キャパシティプランニングを行うには、最低でも3つの変数を求める必要があります。1つ目は1サーバーあたりのクエリ/秒上限。2つ目は予測されるアクセス需要。3つ目は安全マージンです。「⁠1サーバーあたりのクエリ/秒上限」については第2回で算出できていますので、今回はアクセス需要の予測方法と安全マージンの求め方について紹介します。 1サーバーあたりのクエリ/秒上限 * サーバー台数 * 安全マージン > アクセス数 必要とされるアクセス需要の予測精度は、サーバー予算と過負荷障害時の影響度に大

                              LINEの「あけおめLINE」過負荷対策(3) ― 「発生可能性の低減」におけるキャパシティプランニング | gihyo.jp
                            • Software Design 2024年6月号 連載「レガシーシステム攻略のプロセス」第2回 ZOZOTOWNリプレイスにおけるIaCやCI/CD関連の取り組み - ZOZO TECH BLOG

                              はじめに 技術評論社様より発刊されているSoftware Designの2024年5月号より「レガシーシステム攻略のプロセス」と題した全8回の連載が始まりました。 本連載では、ZOZOTOWNリプレイスプロジェクトについて紹介します。2020年に再始動したZOZOTOWNリプレイスでは、「マイクロサービス化」が大きなカギとなりました。今回は、SRE部が行った、リプレイス方針の決定から導入ツールの選定、マイクロサービスのリリース方法の改善までを紹介していきます。 目次 はじめに 目次 ZOZOTOWNリプレイスにおけるSRE部の方針 IaCの導入 IaCとは プラットフォーム基盤におけるIaC CI/CDの導入 CI/CDとは GitHub Actions 変更のあるインフラリソースのみをCIの対象とする工夫 Canary Releaseの導入 Canary Releaseとは ZOZO A

                                Software Design 2024年6月号 連載「レガシーシステム攻略のプロセス」第2回 ZOZOTOWNリプレイスにおけるIaCやCI/CD関連の取り組み - ZOZO TECH BLOG
                              • 1,800万人が利用する『家族アルバム みてね』におけるK8s基盤のアップグレード戦略と継続的改善 / 杉本 浩平

                                本記事は、2023年9月29日に開催された SRE NEXT 2023 に登壇させていただいた みてねプロダクト開発部 基盤開発グループ SREチーム 杉本(@kohbis)のセッションを、文字起こしをベースにブログ記事にまとめたものです。 セッションについてタイトル1,800万人が利用する『家族アルバム みてね』におけるK8s基盤のアップグレード戦略と継続的改善 セッション概要『家族アルバム みてね』(以下、『みてね』)のインフラは、2021年始めにAWS OpsWorksからAmazon EKSのマネージドK8s基盤へと移行しました。K8sの採用は大きな恩恵がある一方で「運用コストが高くなる」と一般的に言われています。その理由としてあげられやすい4ヶ月に一回のマイナーリリースへの追従については、K8sクラスタの運用経験のある方であれば少なからず苦労した思い出があるのではないでしょうか。

                                  1,800万人が利用する『家族アルバム みてね』におけるK8s基盤のアップグレード戦略と継続的改善 / 杉本 浩平
                                • AWSのベストプラクティスを適応していくために ENECHANGEがセキュリティ対策の見直しを行ったきっかけ

                                  渡辺氏の自己紹介と、サイバーセキュリティクラウドの紹介 渡辺洋司氏(以下、渡辺):みなさま、こんばんは。まずはSession1を始めたいと思います。まずタイトルですね。「AWSで持続可能なサービスを支える“セキュリティ”の重要性」というところで、今回参加してくださっているみなさんは、自社のサービスをAWSで運用されているみなさんです。実際にセキュリティ対策を進めてきて、いろいろな歴史を持っている方たちかと思います。 弊社でもサービスをやっていますが「じゃあ実際にどういうふうにやったらいいんだろうな」とか「みなさんはどんなふうにやっているんだろうな」みたいなところを聞けたら、みなさんにも「なるほど!」と思ってもらえるのかと思っているので、みなさんにいろいろと質問したいなと思っています。 では、さっそく私から自己紹介をしたいと思います。サイバーセキュリティクラウドの代表取締役CTOをしている、

                                    AWSのベストプラクティスを適応していくために ENECHANGEがセキュリティ対策の見直しを行ったきっかけ
                                  • 職能を越えた連携で「目先の数字に囚われないSQLチューニング」を実現する

                                    即戦力人材と企業をつなぐ転職サイト「ビズリーチ」でプロダクトマネージャーを担当している原田と申します。 「ビズリーチ」は、採用企業様、ヘッドハンター様、求職者様それぞれに特化した機能を提供しています。私はこのうち採用企業様向けの領域を担当しております。 この記事では、採用企業様向け領域において、機能、利用者、データ等の急速な拡大に比して顕在化する「表示速度・処理速度上の問題」を解決するために、クロスファンクショナルなチームが協力しあい、本質的な課題に優先度をつけ、大きな改善を果たしたプロセスをご紹介します。 背景 | 「表示速度」の課題 「ビズリーチ」は累計27,000社以上の企業様に導入いただいており(2023年10月末時点)、急成長を続けています。 これに伴い、データ量の増加とシステムの負荷が増大しており、お客様からのフィードバックと自らが利用した経験を通じて、この「表示速度が遅い」と

                                      職能を越えた連携で「目先の数字に囚われないSQLチューニング」を実現する
                                    • 「SRE(サイト信頼性エンジニアリング)」とは?〜DevOpsとの関係・実践ポイントを解説〜|インシデント管理プラットフォーム│PagerDuty

                                      ユーザーニーズの変化が激しい現代において、アジャイル開発を導入するなどして開発スピードを向上させることが重要です。しかし、スピーディーな開発をめざす一方で、システムの安定性の維持が難しいと悩んでいる方もいるのではないでしょうか。そこで注目されているのが、開発の高速化とシステムの安定性を両立するための方法論である「SRE(Site Reliability Engineering・サイト信頼性エンジニアリング)」です。この記事では、SREの基本を知りたい方に向け「概要」「主要な指標」「DevOpsとの違い」「SRE実践におけるポイント」といったポイントをわかりやすくご紹介します。 SREとは 「SRE(Site Reliability Engineering)」とはシステム運用方法の一つで、日本語では「サイト信頼性エンジニアリング」と言います。Webサイトの安定的な運用を支えるための方法論とし

                                        「SRE(サイト信頼性エンジニアリング)」とは?〜DevOpsとの関係・実践ポイントを解説〜|インシデント管理プラットフォーム│PagerDuty
                                      • BUYMAの開発体制・新エンジニア組織について紹介します! - エニグモ開発者ブログ

                                        エニグモのエンジニア採用担当の廣島です。 エンジニア組織が昨期から新体制になりました。今回は、エンジニア組織のトップが全社会議で新体制について説明した内容をまとめた記事となります。 エニグモはCtoCグローバルECのBUYMAというサービスを運営していますが、どういう体制で開発しているのかというお話です。 ぜひご覧ください! 目次 Committeeとは? 新組織体制、新チーム、新ロールの概要 「Squad」「Domain」「Chapter」体制について Squad(スクワッド)とは Domain(ドメイン)とは Chapter(チャプター)とは 開発組織を支える5つのチーム あるプロジェクトの編成例 新体制の狙い この体制のメリット/Squad、Chapterの導入が納期短縮になる理由 まとめ Committeeとは? Committee Headの木村です。現在、BUYMAのエンジニア

                                          BUYMAの開発体制・新エンジニア組織について紹介します! - エニグモ開発者ブログ
                                        • Customer Reliability Engineeringとはなんだったのか - 弁護士ドットコム株式会社 Creators’ blog

                                          この記事は弁護士ドットコム Advent Calendar 2023の9日目の記事です。 前日は @RINYU_DRVO さんの「Go html templateで書くhtmlメールのハマりどころと対処法」でした。 クラウドサインのサービスから送信されるメールに絡む出来事は、私もいろいろ目にしてきたため、ダイナミックに頷きながら読ませていただきました。 @RINYU_DRVO さんは何事にも貪欲にチャレンジされていて、いつも尊敬しています。 こんにちは。クラウドサインでCustomer Reliability Engineer(CRE)をやっている谷(@taaag51)です。 ストレイテナーというバンドを推し、愛し、人生を捧げている者です。 私は2021年に弁護士ドットコムへ入社し、早いもので来年で4年目に突入します。 CREからクリエイターズブログに寄稿するのが初ということもあり、CRE

                                            Customer Reliability Engineeringとはなんだったのか - 弁護士ドットコム株式会社 Creators’ blog
                                          • 経営層を、開発者体験向上にコミットさせる方法論

                                            これは「Developer eXperience Day 2024」のLightningTalk枠での登壇内容について、 口頭で話したことを補足しつつ、その他話せなかったこと含めてドキュメントにまとめたものです。 余談ですがDXD2024は初日のトラックレコードさんとログラスさんのワークショップがイチオシでした。 DXD参加の皆様、運営の皆様、お疲れ様でした。来年も楽しみです。 TL;DR コミットできる経営層を巻き込み、開発組織に信頼を輸入するとよい Who:巻き込む狙い目→「目標の時間軸が長い人」 How:①知識 + ②可視化 + ③追体験 = コミット 自己紹介 レバテックでDevRel責任者をしているヤマモトヒロキと申します。 キャリアとしてはBiz畑から来ており、その後PdMを経て、 現在は事業企画の責任者として、経営戦略の策定や全社課題解決の推進をしています。 1年ほど前から、

                                              経営層を、開発者体験向上にコミットさせる方法論
                                            • Runbookに何を書き、どのようにアラートを振り分けるか?

                                              SREのプラクティスにおいてアラートに対応するRunbookを備えることは推奨されています。しかしながら記載する内容についてはしばしば議論の対象となり、短期的な対応手順にフォーカスするのか、ハイレベルな情報にフォーカスするのか、メンテナンスのコストとのバランスをどのように取るか、むしろRunbookに時間を費やすべきではないのではないか、といったことまで様々な意見があります。 グリーではいわゆる障害対応の手順書は古くから運用されていましたが、それらは基本的に一次対応にフォーカスしており、根本的な原因調査のヒントがない、アラートの背景を伝えられていない、検索性が悪いなどの課題がありました。 本セッションでは一つの解として、これらの課題を解決するために新たにアラートに対応するRunbookの仕組みを整備し、新規に運用を開始した事例についてお話します。 また、合わせてアラートをより有効に機能させ

                                                Runbookに何を書き、どのようにアラートを振り分けるか?
                                              • AWS Lambda のアクセス許可を紐解く - KAYAC engineers' blog

                                                SREチームの橋本です。SRE連載の11月号になります。 AWSの多くのリソースはIAMでアクセスを一元管理されていますが、Lambdaではユーザーが実行したり他のAWSサービスから実行されたりする都合上、様々なポリシーが絡んでいます。 特に「Lambdaを呼び出す許可」についてはID(アイデンティティ)ベースのポリシーとリソースベースのポリシーで内容が被るため、どちらで設定するか混乱しているケースも見られます。 本記事ではこうしたポリシー事情をterraformの例と共に整理し、権限設定のベストプラクティスも検討します。 そもそもIAMのポリシーについて ドキュメントによればAWSのポリシーは実に6種類ものタイプがありますが、「使用頻度の高いものから」とあるように最初のIDベースが非常に多くのサービスで共通して使われており、次いで2番目のリソースベースが一部サービスで必要になるでしょう。

                                                  AWS Lambda のアクセス許可を紐解く - KAYAC engineers' blog
                                                • 2023年 crowdworks.jp の SRE チームでやったこと - クラウドワークス エンジニアブログ

                                                  この記事は クラウドワークス Advent Calendar 2023 シリーズ1 6日目の記事です。 こんにちは。crowdworks.jp SRE チームの田中(@kangaechu)です。 この記事では crowdworks.jp の SRE チームが2023年にやったことを記載していきます。 やっていることは色々で、まとまりはありませんが、そこら辺はご容赦ください。 2022年の振り返り 2023年にやったこと CircleCI インシデント対応 RundeckのECS化 Railsで使用しているMemcachedをRedisに寄せる 課題 1. Memcachedでは停止時にデータが揮発する 2. Memcached単体ではマルチAZ構成でデータのレプリケーションができない 3. Memcached/Redisともにバージョンアップをしていない 4. MemcachedとRedi

                                                    2023年 crowdworks.jp の SRE チームでやったこと - クラウドワークス エンジニアブログ
                                                  • 予期せぬアクセス急増、その謎に迫る :私たちの対応と解決策

                                                    加藤 俊弥(@maruloop) LINE株式会社 Communication & Service integration室 SRE, TechLeads LINEスタンプ / 着せかえ / 絵文字 / ウォレットタブ / ホームタブ

                                                      予期せぬアクセス急増、その謎に迫る :私たちの対応と解決策
                                                    • ADRはじめました - エス・エム・エス エンジニア テックブログ

                                                      こんにちは!夏ですね。@kimukei です。 今回は、弊プロジェクトのカイポケリニューアルで ADR を導入しましたというお話です。 ADRとは、「Architecture Decision Record」または、「Architectural Decision Records」の略でアーキテクチャ上で重要な決定を記録するドキュメントです。 詳しくは「DOCUMENTING ARCHITECTURE DECISIONS」 や「Architectural Decision Records」をご覧ください。 また ADR については、以前弊社の酒井が登壇したイベントでも触れられておりますので、こちらの記事もあわせて読んでみてください。 tech.bm-sms.co.jp ADR を導入しましたってエントリは巷には溢れかえっているので、今回はちょっと趣向を変えて実際に私たちが運用している ADR

                                                        ADRはじめました - エス・エム・エス エンジニア テックブログ
                                                      • Percona XtraBackup: 高性能DBバックアップツール [DeNA インフラ SRE] | BLOG - DeNA Engineering

                                                        2024.02.27 技術記事 Percona XtraBackup: 高性能DBバックアップツール [DeNA インフラ SRE] by Kohei Okazaki #infra-quality #infra-delivery #stabilization #technical-verification #datastore #portability #pxb #mysql はじめに こんにちは、IT基盤部にてインターンとして活動している岡崎です。現在、私はパブリッククラウドチーム (以下、PCA)に所属しており、いくつかの施策に携わっています。 現代のビジネス環境において、クラウドリソースの柔軟な移動と管理は、事業継続性と革新性の両立に不可欠です。この重要なニーズに応えるべく、私たちPCAチームでは、クラウドリソースのポータビリティに関する総合的な施策を進めています。これは、アプリケー

                                                          Percona XtraBackup: 高性能DBバックアップツール [DeNA インフラ SRE] | BLOG - DeNA Engineering
                                                        • 仕様と実装で学ぶOpenTelemetry

                                                          Pepabo Tech Conference #22 春のSREまつり~ OpenTelemetry活用全て見せます 〜 で発表したスライドです。 https://pepabo.connpass.com/event/314411/

                                                            仕様と実装で学ぶOpenTelemetry
                                                          • Kubernetes のインスタンスコストを 0.6x した話 - 10X Product Blog

                                                            10X の Kubernetes おじさん兼娘ちゃん好き好きおじさんこと SRE の @tapih です。 この記事は 10X プロダクトアドベントカレンダー2023 の 8 日目の記事です。昨日は PdM の @enaminnn さんの記事でした。 note.com 本記事では、 2023 年 1 月頃に行っていたインフラコスト削減の施策についての話をご紹介します。 施策を行った背景 Goals / Non Goals Node pool の命名規則 Pod の移行 AOT コンパイル リソース設定 振り返り インスタンスコスト削減 CronJob 実行時間の短縮 リソース使用の安定化 今後について マニフェストレポジトリの統一と自動化 Re-architecture の機運 Wrap up 施策を行った背景 弊社が提供している Stailer では、サービスローンチ当初から Kuber

                                                              Kubernetes のインスタンスコストを 0.6x した話 - 10X Product Blog
                                                            • Lessons learned from two decades of Site Reliability Engineering

                                                              Lessons Learned from Twenty Years of Site Reliability Engineering Or, Eleven things we have learned as Site Reliability Engineers at Google Authors Adrienne Walcer, Kavita Guliani, Mikel Ward, Sunny Hsiao, and Vrai Stacey Contributors Ali Biber, Guy Nadler, Luisa Fearnside, Thomas Holdschick, and Trevor Mattson-Hamilton Foreword A lot can happen in twenty years, especially when you're busy growing

                                                              • 募集要項刷新の副業で見えたEM・事業部CTOの役割 - estie inside blog

                                                                こんにちは、estie (エスティ) で副業をしている新田 (しんでん) です。エンジニアは様々な働き方が広がり副業の人でも会社のブログを書くことも増えてきたように感じますが、副業の人が会社の募集要項を書くことは珍しいと思うので、ブログを書くことになりました! この記事では2つのことをお伝えしたいと思います。 外部の人が募集要項を書くことで分かった発見 募集要項のCTOやEMの職の定義を深堀りした中での独自の解釈 仕事の依頼 私はキャリアブレイク中です。現在は未就業で、次の仕事で何をしたいかを検討する期間を取っています。とは言え収入が0なのも心配ですし、副業を通して良い会社を知る切っ掛けになるかもしれないと考え、短時間の副業案件を募集していました。そのタイミングで estie CTOのNariさんが毎月開催している会があり、CTOやEMなどのエンジニアが集まって、事前トピックはなしでその場

                                                                  募集要項刷新の副業で見えたEM・事業部CTOの役割 - estie inside blog
                                                                • SRE NEXT 2024 の CFP についてのご案内 - SRE NEXT Staff Blog

                                                                  こんにちは。SRE NEXT 2024 のスタッフでCfPチームを担当している川崎(@yuta_k0911)です。 CFPの公開について 今回で 4回目 の開催となる SRE NEXT 2024 ですが、過去の回と同様に広く発表を募集します。 この記事ではプロポーザルの応募にあたって感じる疑問点や不安をできるだけ解決できるよう、イベントの概要から、プロポーザルの応募方法、そしてプロポーザルが採択された場合の参加方法まで詳しくご説明します。 どのような発表を募集しているか まずは SRE NEXT 2024 Co-Chair の 菱田さん(@kenta_hi))の SRE NEXT 2024開催宣言のブログ記事 をご一読ください。 前回の SRE NEXT 2023 でも 「SRE DIVERSITY」がテーマでした。 そこで掲げた「Interactivity」「Diversity」「Emp

                                                                    SRE NEXT 2024 の CFP についてのご案内 - SRE NEXT Staff Blog
                                                                  • Enabling SREの現在地点 - Money Forward Developers Blog

                                                                    この記事は Money Forward Engineering 2 Advent Calendar 2023 の記事です。 こんにちは!tatsuo48 です。 マネーフォワードのサービス基盤本部には私が所属する Enabling SRE というチームがあります。 この記事では、以前に紹介された組織に SRE の文化を作り上げていく Enabling SREの内容にも触れながら、Enabling SRE の現在地点と今後の方向性について詳しくお話ししていきます。 Enabling SRE とは Enabling SRE の目的は組織に SRE の文化を作り上げていく Enabling SRE にある通り、以下のギャップを埋めていくことにあります。 各プロダクトの開発チームは、自分たちで開発のサイクルを回し、非機能面も含めて見るべきだと考えている。しかしながら、権限を渡されても非機能面を見て

                                                                      Enabling SREの現在地点 - Money Forward Developers Blog
                                                                    • 【イベントレポート】フロントエンドの技術選定 ~2023を振り返る~ - Findy Tools

                                                                      公開日 2024/02/26更新日 2024/02/26【イベントレポート】フロントエンドの技術選定 ~2023を振り返る~ フロントエンドフレームワークは日々進化しており、トレンドの移り変わりも激しい領域です。2023年にはNext.js 13.4がリリースされAppRouterがStableとなったことで、AppRouterを採用したり、Pages Routerに戻したり、Remixに移行したりと、各社でさまざまな動きがありました。 そこでファインディでは「フロントエンドの技術選定 ~ 2023を振り返る ~ Lunch LT」と題したイベントを開催。株式会社モニクルのなかざんさん、株式会社ヘンリーのsumirenさん、株式会社一休の恩田さん、株式会社LayerXのizumin5210さんをお招きし、技術選定について語っていただきました。 パネリスト なかざんさん / @Nkzn 株式

                                                                        【イベントレポート】フロントエンドの技術選定 ~2023を振り返る~ - Findy Tools
                                                                      • SRE Career Bar〜注目の3社のこれからのキャリアに迫る〜 (2024/08/06 19:30〜)

                                                                        注意 現在X(旧Twitter)でのソーシャルログインができない事象を確認しています。事前にX(旧Twitter)側で再ログインした上でconnpassのソーシャルログインを行うか、 「ユーザー名(またはメールアドレス)」と「パスワード」の組み合わせでのログインをお試しください。合わせてFAQもご確認ください。 お知らせ 2024年9月1日よりconnpassサービスサイトへのスクレイピングを禁止とし、利用規約に禁止事項として明記します。 9月1日以降のconnpassの情報取得につきましては イベントサーチAPI の利用をご検討ください。 お知らせ connpassではさらなる価値のあるデータを提供するため、イベントサーチAPIの提供方法の見直しを決定しました。2024年5月23日(木)より 「企業・法人」「コミュニティ及び個人」向けの2プランを提供開始いたします。ご利用にあたっては利用

                                                                          SRE Career Bar〜注目の3社のこれからのキャリアに迫る〜 (2024/08/06 19:30〜)
                                                                        • note株式会社を退職しました|Subaru Nakamura(varu3)

                                                                          varu3です。 この記事はいわゆる退職noteになります。 先日の3月15日(金)をもって最終出社となり、note株式会社を今月いっぱいで退職することになりました。 在職中お世話になった方々は数えきれず、貴重な経験をさせていただいて本当にありがとうございました。 お前、誰?varu3といいます。note株式会社には2020年9月から入社し、およそ3年と半年くらい在籍していました。 SREチームのエンジニアとして色々なプロジェクトに携わっていました。 気に入ってるこのアイコンも元同僚に描いてもったやつです。ありがたや noteでの思い出noteのインフラのサービス式年遷宮3年半の在籍期間のうち2年くらいはこのプロジェクトを進めていました。何をやったか?についての詳しくは CNDT2023 にてお話しさせていただきました。 およそ40P超のスライドなんですが自分がnoteでやっとことのほぼす

                                                                            note株式会社を退職しました|Subaru Nakamura(varu3)
                                                                          • 会社主催の勉強会を継続的に運営する

                                                                            はじめに 株式会社ナレッジワーク Enablement Groupの上田(@tenntenn)です。 ナレッジワークでは、2023年3月から社外向けにソフトウェアエンジニアや学生向けイベントをはじめ、2023年12月までに25回のイベントを開催しました。また、多くの方に参加頂き、connpassグループの登録者は2200名を超えました。 その中でもEncraftシリーズは、「できる喜びが巡る日々を届ける」というミッションのとおり、技術にこだわりを持つ人々が集まって互いに知見を交換し、できることを増やしていく場を提供すべく開催しています。Encraftは”Enablement”(ひとりひとりの成果・能力の向上)とナレッジワーク社員が取るべきスタイルの1つである”Craftmanship”(こだわりを持って)を合わせた造語となっています。 Encraftは月に1回のペースで3月から11月まで、

                                                                              会社主催の勉強会を継続的に運営する
                                                                            • “会社の認知度ゼロ”状態から開発組織の立ち上げが始まった 会社の特徴を活かしたグループ企業横断の組織づくり

                                                                              さまざまな会社のCTO・PM・エンジニアを招き、パネルディスカッションやLTを通して知見や技術を学ぶイベント「MIDAS TECH STUDY」。今回登壇したのは、株式会社GENDA ・VPoEの荒井勇輔氏。グループ会社を横断したエンジニア組織の立ち上げについて発表しました。(情報は2023年02月16日時点のもの) GENDA社・VPoEの荒井勇輔氏が組織・体制づくり、採用戦略の事例を紹介 荒井勇輔氏(以下、荒井):それでは、「グループ会社を横断したエンジニア組織の立ち上げと挑戦」というタイトルで、GENDAの荒井が発表します。よろしくお願いいたします。 本日の構成です。本日は組織・体制づくり、採用戦略の事例を紹介しようと思っています。はじめにGENDAについて説明させていただき、その後に開発組織立ち上げの背景を紹介いたします。背景を説明後に、立ち上げにおける課題を紹介して、その後、具体

                                                                                “会社の認知度ゼロ”状態から開発組織の立ち上げが始まった 会社の特徴を活かしたグループ企業横断の組織づくり
                                                                              • Road to SRE NEXT@福岡に参加してきたのと、LT発表しました #srenext - stefafafan の fa は3つです

                                                                                Mackerel Drink Up 出張版@福岡に参加してきた #mackerelio - stefafafan の fa は3つです に続いて、翌日福岡で開催されたRoad to SRE NEXT@福岡に参加しました。 sre-lounge.connpass.com Road to SRE NEXT とは? 元々SRE NEXTという東京で開催されている大きめのイベントがありますが(自分はまだ参加したことはありません)、東京にとどまらず地方のSREコミュニティも活性化したいというものだそうです。 blog.sre-next.dev 「Road to SRE NEXT」は、SREの普及とコミュニティの活性化を目的としたイベントシリーズです。このイベントは、SRE NEXT 2024の運営メンバーによって計画されています。イベントの主な目的は、地方におけるSREコミュニティの発掘と支援、SR

                                                                                  Road to SRE NEXT@福岡に参加してきたのと、LT発表しました #srenext - stefafafan の fa は3つです
                                                                                • 「名前のない仕事」にチームで取り組む–WOLとトラッキングツールの活用- / The SRE team's approach to unnamed work

                                                                                  横断組織としてのSREチームの「名前のない仕事」に対する取り組みについて、リブセンスの@mom0tomoがまとめました。「名前のない仕事」にはトイルと名前がないだけの重要課題の2種類があり、インフラグループでは、Working Out Loud(WOL)とトラッキングツール(Toggl・Clockify)の活用を通じて、チームで課題に取り組んでいます。 【リンク集】 - エンジニアブログ: https://made.livesense.co.jp/ - Engineering Handbook: https://livesense-inc.gitbook.io/livesense-engineering-handbook/ - Working Out Loud(WOL)の取り組みと振り返り: https://made.livesense.co.jp/entry/2023/06/14/080

                                                                                    「名前のない仕事」にチームで取り組む–WOLとトラッキングツールの活用- / The SRE team's approach to unnamed work