並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 16 件 / 16件

新着順 人気順

SREの検索結果1 - 16 件 / 16件

  • 大公開!バッチアプリケーションの品質を高めるZOZOの『バッチ開発ガイドライン』 - ZOZO TECH BLOG

    こんにちは。MA部の田島です。 弊社では開発ガイドラインというものを用いて、システムの品質を担保しています。今回私がテックリードを務めているということもあり、バッチアプリケーションを開発するためのガイドラインを作成しました。本記事では「開発ガイドライン」と「バッチ開発ガイドライン」を紹介します。 バッチアプリケーション開発に限定したTipsはまとまっているものが多くないため参考にしていただければと思います。 開発ガイドラインについての紹介 冒頭でも紹介した通り弊社では、開発ガイドラインというものを用いてシステムの品質を担保しています。バッチ開発ガイドラインを紹介する前に、まず開発ガイドラインを紹介します。 開発ガイドラインの種類 開発ガイドラインは現在、以下の種類が存在します。 共通 Android iOS Frontend Backend Infra API Batch DB(Datab

      大公開!バッチアプリケーションの品質を高めるZOZOの『バッチ開発ガイドライン』 - ZOZO TECH BLOG
    • 不要な DNS リソースレコードは消そう / Delete unused DNS records

      https://yuru-sre.connpass.com/event/317749/ の LT 資料です

        不要な DNS リソースレコードは消そう / Delete unused DNS records
      • 「システム運用の基本と戦略」についてただまとめる

        23卒でバックエンドエンジニアをしているたかしゅんです。(@1341Shun) 先日、株式会社サイバーエージェントAI事業本部の2024年度 エンジニア新卒研修でシステム運用に関する講義を行いました。 そこで話した内容とスライドを完全公開したので、内容について解説します。 90分の内容のため、かなり長いですが、個人的にぜひ一読して欲しい内容になっています。 実際の資料はこちらになります↓ 自己紹介 こんにちは、たかしゅんと言います。2023年度入社で今年で2年目になります。株式会社サイバーエージェントのAIオペレーション室で新規立ち上げをやっております。 入社して最初に広告プロダクトに配属し、PipeCDの導入などのDevOps業務を中心に行なっておりました。 記事もあるのでもしよろしければ、ご覧ください。 2月中旬からAIオペレーション室に移動し、新規立ち上げのインフラ環境の構築からCI

          「システム運用の基本と戦略」についてただまとめる
        • GitHub Actionsにおける脅威と対策まとめ

          はじめに こんにちは、サイボウズ24卒の@yuasaです。 サイボウズでは開発・運用系チームに所属する予定の新卒社員が研修の一環として、2週間を1タームとして3チームの体験に行きます。新卒社員の私が生産性向上チームの体験に行った際に、チーム内でGitHub Actionsを利用する際の脅威と対策について調査を行い、ドキュメント化した上で社内への共有を行いました。本記事では、そのドキュメントの一部を公開します。 対象読者 本記事の主な対象読者としては、以下のような方を想定しています。 GitHub Actionsを組織で利用しているが、特にセキュリティ対策を実施していない方 GitHub Actionsを組織で利用しており、部分的にセキュリティ対策を実施しているが、対策が十分かどうか分からない方 本記事がGitHub Actionsのセキュリティ対策を検討する上で参考になれば幸いです。 本記

            GitHub Actionsにおける脅威と対策まとめ
          • 開発チームとともに進めるインフラセキュリティの継続的な改善 / SRE Lounge 17

            2024年7月2日に開催された SRE Lounge #17 の発表資料です。 SRE Lounge #17(ハイブリッド開催) - connpass https://sre-lounge.connpass.com/event/321335/ このプレゼンの技術的な詳細は、過去のブログ記事…

              開発チームとともに進めるインフラセキュリティの継続的な改善 / SRE Lounge 17
            • Datadog→New Relicの移行を決めた際のADRを公開します!

              はじめに レバテック開発部、SREチームに所属している金澤です。 弊社開発部では、Datadogで行っていた監視からNewrelicを用いたオブザーバビリティへの移行を行う決定をしました。 そして、なぜオブザーバビリティを採用したのか、DatadogからNewrelicへ移行したのかといった意思決定をADRとして記録し、社内に展開しています。 今回はこのADRの内容を公開します! ※本記事はNewrelic、Datadogを肯定、否定するものではございません。 ADR コンテキスト 事業軸 レバテックの事業戦略は事業ポートフォリオ構想に従っている 既存の事業を拡大させながら新規サービスを生み出し続ける 事業ポートフォリオ構想 開発軸 事業領域の大きさ、深さが拡大し必要なドメイン知識が肥大化 スケーラビリティとアジリティの担保が困難になってきた バグ、障害の発生 レビュー工数の増加 新規参画

                Datadog→New Relicの移行を決めた際のADRを公開します!
              • SLO Docsのすゝめ

                技術部プラットフォームグループ 2021年 中途入社 2 自己紹介 渡部 龍一 Watanabe Ryuichi • SNS: @ryuichi_1208 • GMOペパボでSRE • 好きなこと: EOL対応、障害対応

                  SLO Docsのすゝめ
                • 分散トレーシングを使ってパフォーマンス改善をやってみたら、レスポンスタイムを2割近く改善できたお話 - Tabelog Tech Blog

                  目次 目次 はじめに そもそもシステム運用改善チームとは何か? なぜアプリAPIのパフォーマンス改善が必要になったのか? どうやって改善箇所を見つけるのか? 分散トレーシングを使って、店舗詳細APIを細かく分析する 計測結果の見方 計測結果から分かったこと 計測結果から見つけたポイントに改善を実施していく コースに紐づくクーポンの取得 口コミを取得する処理と公開画像数のカウント ユーザーごとの公開口コミ投稿数の合計数カウント 全体での改善効果はどうだったか? パフォーマンス改善の影響 ユーザー体験が向上した 今後の食べログ成長に備えたシステム上の余裕ができた 食べログの分散トレーシングを使って改善を実施してみてよかったこと おわりに はじめに こんにちは。食べログ開発本部 ウェブ開発1部 システム運用改善チームの @4palace です。 今回は、私の所属するシステム運用改善チームが食べロ

                    分散トレーシングを使ってパフォーマンス改善をやってみたら、レスポンスタイムを2割近く改善できたお話 - Tabelog Tech Blog
                  • [TimeTree] Aurora から Spanner への 移行の決断と背景

                    TimeTree の SRE が海外展開においてやったこと&やってないこと by【TimeTree × みてね勉強会】 グローバル対応への挑戦 〜SRE/インフラ編〜

                      [TimeTree] Aurora から Spanner への 移行の決断と背景
                    • 「ユーザー検知で障害に気づいたら、SREとして負け」元AWSエンジニアが感じたイオンネクストが目指すレベルの高さ|エンジニアインタビュー  |AEON TECH HUB

                      イオンスマートネクスト SREチームの荒井のインタビューです。AWSやフリーランスなどを経て、組織改善に貢献したいという想いで2023年にイオンへ入社。信頼性に関わることは何でもやるSREチームにて求められる役割やレベルに応えるべく、荒井が取り組むチームの土台作りやチームの理想について語ってくれました。

                        「ユーザー検知で障害に気づいたら、SREとして負け」元AWSエンジニアが感じたイオンネクストが目指すレベルの高さ|エンジニアインタビュー  |AEON TECH HUB
                      • ゆるっと話すSLI/SLOを設定してよかったこと出来ていないこと

                        https://yuru-sre.connpass.com/event/317749/ 登壇資料

                          ゆるっと話すSLI/SLOを設定してよかったこと出来ていないこと
                        • SRE Kaigi 2025を開催します! - SRE Kaigi スタッフブログ

                          はじめに SRE Kaigi 2025 実行委員会 委員長の井上(@syossan27)です。 この度、SRE KaigiというSite Reliability Engineering(SRE)に関するカンファレンスを立ち上げました。そして、来年の2025年にSRE Kaigi 2025を開催致します! 詳しい開催日は2025/01/26(日)で、会場は中野セントラルパーク カンファレンスにて開催いたします。開催形式についてはオフライン開催を考えておりまして、どのようなカンファレンスにするかは色々と思案中でございます。Twitter(現:X)や、当ブログでの続報をご期待ください! 何故、このようなカンファレンスを立ち上げたのか?などの経緯や、カンファレンスに対する想いを書いていきます。 何故立ち上げたのか? SREに関するカンファレンスといえばSRE NEXTという大きな先駆者がいます。

                            SRE Kaigi 2025を開催します! - SRE Kaigi スタッフブログ
                          • オブザーバビリティ再入門 - 大切さと高め方を知ろう!を開催しました! - Mackerel ブログ #mackerelio

                            こんにちは! Mackerel CREチームでカスタマーサクセスマネージャー(CSM)をやっているid:chizniiです。 2024年6月5日(水)に「オブザーバビリティ再入門 - 大切さと高め方を知ろう!」をはてな 東京オフィスにて開催しました。本記事ではイベントのレポートを行いつつ、発表資料や配信動画のアーカイブを掲載いたします。 オブザーバビリティ再入門 - 大切さと高め方を知ろう! オブザーバビリティ再入門 - 大切さと高め方を知ろう!とは 今回もイベントのライブ配信を行いました コミュニケーションを促進するための仕組みとして名札を用意 盛りだくさんのトーク内容 可観測性ガイダンス by @nwiizoさん メトリクス、ログ、トレースをうまく使い分けて可観測性を高めよう! by id:masayoshi OpenTelemetry デモを使って Mackerel のメトリック探索

                              オブザーバビリティ再入門 - 大切さと高め方を知ろう!を開催しました! - Mackerel ブログ #mackerelio
                            • 手動作成AWSリソースをIaC化するモブプロ「cdk import day」を定期開催している話 - Uzabase for Engineers

                              はじめに 「私…全ての手動作成AWSリソースを生まれる前に消し去りたい。全ての宇宙、過去と未来の全ての手動作成AWSリソースを…この手で!」 そんなことを思われた経験はないでしょうか?私は常に思っています。 こんにちは。ソーシャル経済メディア「NewsPicks」のSREチームの安藤です。 先日の JAWS-UG CDK支部 #14 にて、テーマが「IaC Generator祭り」だったこともあり、以下のタイトルでLT発表させていただきました。 www.docswell.com 上記の発表はAWS CDKのコミュニティのライトニングトークということもあり簡単なTIPS紹介が中心だったので、本記事では改めて背景と概要について紹介します。 背景 NewsPicksというサービスは10年以上の歴史があり、サービス開始当初からAWSを利用していました。 現在は、Infrastructure as

                                手動作成AWSリソースをIaC化するモブプロ「cdk import day」を定期開催している話 - Uzabase for Engineers
                              • CloudNative Days Summer 2024 に参加しました!! - freee Developers Hub

                                はじめに こんにちは! 6/15 に札幌で開催された CloudNative Days Summer 2024 (CNDS) に参加してきたので、その様子をお伝えします! freee からは SRE Platform Delivery チームの akito と tetora が参加しました。 会場:札幌コンベンションセンター 前夜祭の様子・当日会場の雰囲気など CNDS の前夜祭が催されていたので、それにも参加してきました。 ジンギスカンの食べ放題で最高に美味しかったです! 同じテーブルに CNDS のスポンサーでもある GitLab のソリューションアーキテクトの方が2名おられ、SRE や開発生産性についてなど、いろんなことをお聞きかせいただきとても勉強になりました。 面白かったのは、 GitLab の方が当日質問する予告をしてくださり、予告通り質問されていたことです。 予告通り質問を受

                                  CloudNative Days Summer 2024 に参加しました!! - freee Developers Hub
                                • リリース品質を高めるポストモーテムとは / 開発者向けブログ・イベント | GMO Developers

                                  SREにおけるポストモーテムとは 近年、システムの複雑化と規模拡大に伴い、システム障害やインシデントの発生リスクが高まっています。こうした問題を未然に防ぎ、システムの信頼性を向上させるために、SRE(Site Reliability Engineering)では、ポストモーテムと呼ばれる取り組みが重要視されています。 ポストモーテムとは、システム障害やインシデントが発生した後に、その原因を徹底的に調査し、再発防止策を立案することで、システムの信頼性を向上させるための活動です。失敗を非難するのではなく、失敗から学び、組織全体の学習と成長を促進することを目的としています。 リリース管理でポストモーテムを行う理由 ポストモーテムは、サービスインパクトのあったシステム障害について実施することが一般的です。私たちはこれに加えて、リリース時に発生した問題についてもポストモーテムを行うことにしました。そ

                                    リリース品質を高めるポストモーテムとは / 開発者向けブログ・イベント | GMO Developers
                                  1