並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 16 件 / 16件

新着順 人気順

SREの検索結果1 - 16 件 / 16件

  • 大公開!バッチアプリケーションの品質を高めるZOZOの『バッチ開発ガイドライン』 - ZOZO TECH BLOG

    こんにちは。MA部の田島です。 弊社では開発ガイドラインというものを用いて、システムの品質を担保しています。今回私がテックリードを務めているということもあり、バッチアプリケーションを開発するためのガイドラインを作成しました。本記事では「開発ガイドライン」と「バッチ開発ガイドライン」を紹介します。 バッチアプリケーション開発に限定したTipsはまとまっているものが多くないため参考にしていただければと思います。 開発ガイドラインについての紹介 冒頭でも紹介した通り弊社では、開発ガイドラインというものを用いてシステムの品質を担保しています。バッチ開発ガイドラインを紹介する前に、まず開発ガイドラインを紹介します。 開発ガイドラインの種類 開発ガイドラインは現在、以下の種類が存在します。 共通 Android iOS Frontend Backend Infra API Batch DB(Datab

      大公開!バッチアプリケーションの品質を高めるZOZOの『バッチ開発ガイドライン』 - ZOZO TECH BLOG
    • 不要な DNS リソースレコードは消そう / Delete unused DNS records

      https://yuru-sre.connpass.com/event/317749/ の LT 資料です

        不要な DNS リソースレコードは消そう / Delete unused DNS records
      • 「システム運用の基本と戦略」についてただまとめる

        23卒でバックエンドエンジニアをしているたかしゅんです。(@1341Shun) 先日、株式会社サイバーエージェントAI事業本部の2024年度 エンジニア新卒研修でシステム運用に関する講義を行いました。 そこで話した内容とスライドを完全公開したので、内容について解説します。 90分の内容のため、かなり長いですが、個人的にぜひ一読して欲しい内容になっています。 実際の資料はこちらになります↓ 自己紹介 こんにちは、たかしゅんと言います。2023年度入社で今年で2年目になります。株式会社サイバーエージェントのAIオペレーション室で新規立ち上げをやっております。 入社して最初に広告プロダクトに配属し、PipeCDの導入などのDevOps業務を中心に行なっておりました。 記事もあるのでもしよろしければ、ご覧ください。 2月中旬からAIオペレーション室に移動し、新規立ち上げのインフラ環境の構築からCI

          「システム運用の基本と戦略」についてただまとめる
        • AWSコスト異常検知を導入したら、『人にお願いする』トイルが発生したのでSlackBotを作って解消した - KAYAC engineers' blog

          SREチームの池田(@mashiike)です。SRE連載の5月号になります。 AWSのコストについては、多くの方がすごく気にしていると思います。 カヤックでもAWSのコストの変動に関しては敏感に気にしています。 そんな方々の心のお供になる機能が、 AWSコスト異常検知(AWS Cost Anomaly Detection) です。 今回は、このコスト異常検知にまつわるトイル削減の取り組みを紹介します。 背景 AWSコスト異常検知は、AWS マネジメントコンソールの中では『Billing and Cost Management』配下にある機能になります。 この機能を使うことでAWSで発生したコストに関して、通常とは異なるコストの発生を検知することができます。 コスト異常検知自体については、CureApp テックブログ様のZennの記事がわかりやすくまとまっているので、そちらを参照いただければ

            AWSコスト異常検知を導入したら、『人にお願いする』トイルが発生したのでSlackBotを作って解消した - KAYAC engineers' blog
          • GitHub Actionsにおける脅威と対策まとめ

            はじめに こんにちは、サイボウズ24卒の@yuasaです。 サイボウズでは開発・運用系チームに所属する予定の新卒社員が研修の一環として、2週間を1タームとして3チームの体験に行きます。新卒社員の私が生産性向上チームの体験に行った際に、チーム内でGitHub Actionsを利用する際の脅威と対策について調査を行い、ドキュメント化した上で社内への共有を行いました。本記事では、そのドキュメントの一部を公開します。 対象読者 本記事の主な対象読者としては、以下のような方を想定しています。 GitHub Actionsを組織で利用しているが、特にセキュリティ対策を実施していない方 GitHub Actionsを組織で利用しており、部分的にセキュリティ対策を実施しているが、対策が十分かどうか分からない方 本記事がGitHub Actionsのセキュリティ対策を検討する上で参考になれば幸いです。 本記

              GitHub Actionsにおける脅威と対策まとめ
            • Datadog→New Relicの移行を決めた際のADRを公開します!

              はじめに レバテック開発部、SREチームに所属している金澤です。 弊社開発部では、Datadogで行っていた監視からNewrelicを用いたオブザーバビリティへの移行を行う決定をしました。 そして、なぜオブザーバビリティを採用したのか、DatadogからNewrelicへ移行したのかといった意思決定をADRとして記録し、社内に展開しています。 今回はこのADRの内容を公開します! ※本記事はNewrelic、Datadogを肯定、否定するものではございません。 ADR コンテキスト 事業軸 レバテックの事業戦略は事業ポートフォリオ構想に従っている 既存の事業を拡大させながら新規サービスを生み出し続ける 事業ポートフォリオ構想 開発軸 事業領域の大きさ、深さが拡大し必要なドメイン知識が肥大化 スケーラビリティとアジリティの担保が困難になってきた バグ、障害の発生 レビュー工数の増加 新規参画

                Datadog→New Relicの移行を決めた際のADRを公開します!
              • SLO Docsのすゝめ

                技術部プラットフォームグループ 2021年 中途入社 2 自己紹介 渡部 龍一 Watanabe Ryuichi • SNS: @ryuichi_1208 • GMOペパボでSRE • 好きなこと: EOL対応、障害対応

                  SLO Docsのすゝめ
                • 意義から考えるObservability入門 #srenext

                  Road to SRE NEXT@福岡(ハイブリッド開催) でLTした時の資料です。

                    意義から考えるObservability入門 #srenext
                  • [TimeTree] Aurora から Spanner への 移行の決断と背景

                    TimeTree の SRE が海外展開においてやったこと&やってないこと by【TimeTree × みてね勉強会】 グローバル対応への挑戦 〜SRE/インフラ編〜

                      [TimeTree] Aurora から Spanner への 移行の決断と背景
                    • 「ユーザー検知で障害に気づいたら、SREとして負け」元AWSエンジニアが感じたイオンネクストが目指すレベルの高さ|エンジニアインタビュー  |AEON TECH HUB

                      イオンスマートネクスト SREチームの荒井のインタビューです。AWSやフリーランスなどを経て、組織改善に貢献したいという想いで2023年にイオンへ入社。信頼性に関わることは何でもやるSREチームにて求められる役割やレベルに応えるべく、荒井が取り組むチームの土台作りやチームの理想について語ってくれました。

                        「ユーザー検知で障害に気づいたら、SREとして負け」元AWSエンジニアが感じたイオンネクストが目指すレベルの高さ|エンジニアインタビュー  |AEON TECH HUB
                      • ゆるっと話すSLI/SLOを設定してよかったこと出来ていないこと

                        https://yuru-sre.connpass.com/event/317749/ 登壇資料

                          ゆるっと話すSLI/SLOを設定してよかったこと出来ていないこと
                        • SRE Kaigi 2025を開催します! - SRE Kaigi スタッフブログ

                          はじめに SRE Kaigi 2025 実行委員会 委員長の井上(@syossan27)です。 この度、SRE KaigiというSite Reliability Engineering(SRE)に関するカンファレンスを立ち上げました。そして、来年の2025年にSRE Kaigi 2025を開催致します! 詳しい開催日は2025/01/26(日)で、会場は中野セントラルパーク カンファレンスにて開催いたします。開催形式についてはオフライン開催を考えておりまして、どのようなカンファレンスにするかは色々と思案中でございます。Twitter(現:X)や、当ブログでの続報をご期待ください! 何故、このようなカンファレンスを立ち上げたのか?などの経緯や、カンファレンスに対する想いを書いていきます。 何故立ち上げたのか? SREに関するカンファレンスといえばSRE NEXTという大きな先駆者がいます。

                            SRE Kaigi 2025を開催します! - SRE Kaigi スタッフブログ
                          • オブザーバビリティ再入門 - 大切さと高め方を知ろう!を開催しました! - Mackerel ブログ #mackerelio

                            こんにちは! Mackerel CREチームでカスタマーサクセスマネージャー(CSM)をやっているid:chizniiです。 2024年6月5日(水)に「オブザーバビリティ再入門 - 大切さと高め方を知ろう!」をはてな 東京オフィスにて開催しました。本記事ではイベントのレポートを行いつつ、発表資料や配信動画のアーカイブを掲載いたします。 オブザーバビリティ再入門 - 大切さと高め方を知ろう! オブザーバビリティ再入門 - 大切さと高め方を知ろう!とは 今回もイベントのライブ配信を行いました コミュニケーションを促進するための仕組みとして名札を用意 盛りだくさんのトーク内容 可観測性ガイダンス by @nwiizoさん メトリクス、ログ、トレースをうまく使い分けて可観測性を高めよう! by id:masayoshi OpenTelemetry デモを使って Mackerel のメトリック探索

                              オブザーバビリティ再入門 - 大切さと高め方を知ろう!を開催しました! - Mackerel ブログ #mackerelio
                            • 手動作成AWSリソースをIaC化するモブプロ「cdk import day」を定期開催している話 - Uzabase for Engineers

                              はじめに 「私…全ての手動作成AWSリソースを生まれる前に消し去りたい。全ての宇宙、過去と未来の全ての手動作成AWSリソースを…この手で!」 そんなことを思われた経験はないでしょうか?私は常に思っています。 こんにちは。ソーシャル経済メディア「NewsPicks」のSREチームの安藤です。 先日の JAWS-UG CDK支部 #14 にて、テーマが「IaC Generator祭り」だったこともあり、以下のタイトルでLT発表させていただきました。 www.docswell.com 上記の発表はAWS CDKのコミュニティのライトニングトークということもあり簡単なTIPS紹介が中心だったので、本記事では改めて背景と概要について紹介します。 背景 NewsPicksというサービスは10年以上の歴史があり、サービス開始当初からAWSを利用していました。 現在は、Infrastructure as

                                手動作成AWSリソースをIaC化するモブプロ「cdk import day」を定期開催している話 - Uzabase for Engineers
                              • SREに求められるスキルと心構え | sreake.com | 株式会社スリーシェイク

                                はじめに こんにちは、最近の私の人生はキックボクシングとコーディングの2つの活動に極端に偏りつつあります。nwiizoです。一見正反対のようなこの2つの活動ですが、共通する本質があります。それは、頭で考えるだけでなく、実際に体を動かして実践することで新しい発見や気づきを得ていくプロセスです。 キックボクシングでは、理論だけでは表現できない”技”を体で覚えていきます。理論上の動作はスムーズに行えても、実際にパンチやキックを繰り出す際には、さまざまな戦略を一瞬のうちに計算し、機動的に対応しなければなりません。そこでは思考するよりも先に、体が自然と反応するよう繰り返し訓練を重ねていきます。 一方のコーディングにおいても、書籍から得た知識を単に暗記しているだけでは意味がありません。実際にコードを書きながら、試行錯誤を重ね、バグに出くわし、その都度解決策を見出していく中で、本当の理解が深まっていきま

                                  SREに求められるスキルと心構え | sreake.com | 株式会社スリーシェイク
                                • 教科書を読んだだけでは分からないSRE推進の取り組みを公開!──SHIFT・X-Tech5・NTTデータのエンジニアが語った事例も紹介 - TECH PLAY Magazine

                                  Google社が提唱したITシステムの構築や運用のアプローチ方法であるSRE。導入する企業も増えてきた一方で、期待する効果が得られていない企業も少なくない。そこで今回は、SHIFT、X-Tech5、NTTデータのエンジニアに、導入事例を交えながら、SREの推進・定着・効果などについて語ってもらった。 SREsのためのSRE定着ガイド──X-Tech5 株式会社X-Tech5 取締役CTO 馬場 俊彰氏 最初に登壇したのは、X-Tech5の馬場俊彰氏だ。システムの運用フェーズに携わること、特にモニタリング、オブザーバビリティ、パフォーマンスチューニングが大好きだというCTO馬場氏。iCARE社の技術顧問も務め、専門領域に関する著書を多数上梓している。 馬場氏はまず「SRE(Site Reliability Engineering)とは何か」を関連本を紹介しながら、こう述べた。 「SREはDe

                                    教科書を読んだだけでは分からないSRE推進の取り組みを公開!──SHIFT・X-Tech5・NTTデータのエンジニアが語った事例も紹介 - TECH PLAY Magazine
                                  1