並び順

ブックマーク数

期間指定

  • から
  • まで

521 - 560 件 / 3716件

新着順 人気順

SREの検索結果521 - 560 件 / 3716件

  • カヤックのSREチームについて - KAYAC engineers' blog

    SREチームの長田です。 今回は私が所属している「カヤックのSREチーム」について紹介します。 SREとは Site Reliability Engineering の略です。 「サイト信頼性エンジニアリング」と訳されることが多いようです。 同名の書籍(いわゆるSRE本)が出版されたことから、SREという言葉が一般的に使われるようになったようです。 www.oreilly.co.jp この記事ではSREそのものについての説明は省きます。 ざっくり一言で説明すると、「サイト(サービス)の信頼性を技術の力で担保すること」のようになるでしょうか。 SREの何たるかのより詳しい説明については上記のSRE本や、提唱元であるGoogleのサイト(英語)を参照してください。 sre.google カヤックのSREチーム カヤックのSREチームは2018年に発足しました。 当初は3名体制でしたが、メンバー

      カヤックのSREチームについて - KAYAC engineers' blog
    • 私が仕事を任せる(委譲する)時の3つのポイント

      こんにちは、NE会社に勤めますきんじょう(@o0h_)がお送りします。 突然ですが、皆さんは「権限委譲」やっていますか?[1] 「権限委譲」というのが大げさであれば、「自分の持っていた仕事を他の人に任せる」くらいの感覚で、読み替えてみても良いかも知れません。 いかがでしょう? 業務負荷の集中を避けたり、後進の育成を目的として取り組んでいる人も多そうにも思います。 ただ、実際にやってみると「意外に難しい」とも感じる場面があるのではないでしょうか。 あるいは、「やりたいけどやれていない」という難しさもあるかも知れません。 私はマネージャー業に就いてから、あるいは自分より「若手」の多い職場に所属したことで、色々な場面で「仕事を預ける・任せる・委譲する」という経験をしてきました。 また、上司などの他の人から「仕事を受け取る」側の立場になったことも、もちろんあります。 そんな実践の中で、自分なりに気

        私が仕事を任せる(委譲する)時の3つのポイント
      • AWS Transit Gateway はじめました - Hatena Developer Blog

        AWS Transit Gateway とは? 構成検討 構成変更手順 事前作業 使用する TGW を作成する TGW に接続する VPN と VPC をアタッチする AWS VPC に TGW を参照する Route Table を作成する 当日作業 AWS VPN を TGW の Route Table にプロパゲートする VPC を TGW の Route Table にプロパゲートする VPC の Route Table に TGW 向けの経路を設定する AWS Classic VPN の VPN トンネルを落とす AWS Transit Gateway で知っていると良いこと AWS Transit Gateway をクロスアカウントで使う時に気をつけるポイント AWS Transit Gateway における Attach / Propagate / Associate という

          AWS Transit Gateway はじめました - Hatena Developer Blog
        • 1年間のポストモーテム運用とそこから生まれたツール sre-advisor / SRE NEXT 2022

          SRE NEXT 2022 2022-05-14 14:45〜15:15 https://sre-next.dev/2022/schedule#jp15

            1年間のポストモーテム運用とそこから生まれたツール sre-advisor / SRE NEXT 2022
          • SRE on AWSのことはじめ / SRE on AWS

            サーバーレスファーストで考えるクレジットカードビジネスの最適化 / Business Optimization for Credit Card by Serverless

              SRE on AWSのことはじめ / SRE on AWS
            • Rails6の複数データベースの仕組みと実装時にハマったところ - dely Tech Blog

              こんにちは、開発部の高橋です。 本記事はdely Advent Calendar 2019の14日目の記事です。 昨日はミカサ(acke_red)さんの「デザイン負債を返済する - クラシルのデザインの展望2020」という記事でした。 note.com 目次 目次 はじめに 複数データベースの仕組み 複数データベースに関連するActiveRecordの全体像 1. master/slave構成 利用方法 DatabaseSelectorの利用方法 2. 複数のデータベースの利用 利用方法 アプリケーションでの実際の実装 開発時にハマった箇所 POSTのあとのGETでの更新処理で競合が発生 readingロールに対して更新していることがテストで気付きにくい まとめ 最後に はじめに 10月の半ば辺りにRails6の複数機能を利用し、master/slave構成に対応した新規アプリケーションを

                Rails6の複数データベースの仕組みと実装時にハマったところ - dely Tech Blog
              • 転職します(Cookpad → Ubie) - ある研究者の手記

                https://github.com/m-mizutani/m-mizutani/commit/067a421f3e3e8405cba870bb461446c545128a2e 2021年7月30日を最終出社日として現職のCookpadを退職し、9月からUbieという医療系のスタートアップに入社します。 Cookpadでのこれまで 2017年11月に入社したので、在籍期間は4年弱でした。この間、組織変更に伴う部署異動はありましたが、ずっと情報セキュリティに関わる業務をやってきました。 システムのセキュリティ対策 主な業務は「インフラや社内システム、開発サービスに対するセキュリティの機能をエンジニアリングによって向上させること」でした。 製品やサービスをそのまま導入することもありますが、自分たちの必要に応じて既存ツールを拡張したり、全く新しいシステムを自作することもありました。 例えば以下が

                  転職します(Cookpad → Ubie) - ある研究者の手記
                • AWSが初心者向けプログラムを提供開始 「最短1年」でクラウド技術者を育成

                  クラウド技術者の不足は企業の重要課題の一つとなっており、モダナイゼーションが進まない要因の一つでもある。AWSが提供を開始する新しいトレーニングプログラムは人手不足を解消する一手となるだろうか。 IT人材不足の中でもクラウド技術者の不足は特に深刻で、クラウド大手Amazon Web Services(AWS)によると約500万人分のポストが空いているという。こうした中、同社が新しいトレーニングプログラムの提供を開始した。これまでの同社のプログラムと異なり、ITの分野における勤務経験のない初心者向けであることが特徴だ。 初心者が受講可能 人材不足解決の一手となるか AWSは最短1年で初級レベルのクラウド技術者になるための12コースのクラウドスキルトレーニングプログラム「AWS Cloud Institute」を公開したと2023年10月10日(現地時間)に発表した(注1)。 同プログラムのカ

                    AWSが初心者向けプログラムを提供開始 「最短1年」でクラウド技術者を育成
                  • N予備校のデータ分析基盤構築に向けた取り組み - ドワンゴ教育サービス開発者ブログ

                    はじめに 昨今Webに限らずあらゆる事業領域において、蓄積されたデータの活用は必要不可欠、やっていて当たり前なものになってきているかと思います。これまでこのブログではあまりそういう話題に触れてこなかったこともあり、本稿では改めてドワンゴ教育サービスにおけるデータの活用に関する取り組みについて、概要レベルにはなりますがご紹介したいと思います。 はじめに N予備校における従来のデータの取り扱い 現在の取り組み 本番環境のデータのBigQueryへの蓄積 データ活用のプロトタイピング そのほかのデータ活用に関連する取り組みや展望 N予備校のアーキテクチャ・パイプラインの検討 分析対象のデータ拡充 データの管理体制 機械学習技術等の活用 おわりに We are hiring! N予備校における従来のデータの取り扱い まず従来から行われているN予備校におけるデータ活用の取り組みについて紹介します。現

                      N予備校のデータ分析基盤構築に向けた取り組み - ドワンゴ教育サービス開発者ブログ
                    • Amazon S3の誤った公開に気づく! 通知の仕組み - ANDPAD Tech Blog

                      こちらは ANDPAD Advent Calendar 2022 の19日目の記事です。 こんにちは。 アンドパッドSREの宜野座です。 今回はアドベントカレンダーということで、Amazon S3の公開を検知してSlackに通知する仕組みをシンプルに行う方法に関して書こうと思います。 Amazon S3の重要性 S3バケットの公開を防ぐには S3の公開検知の例 AWS Config を利用する方法 Lambdaの作成 AWS Configでマネージドルールを有効化 Event Bridgeを作成する 動作確認 小ネタ: AWS Configで任意のタイミングでルールの評価を行う方法 Amazon Guard Dutyを利用する方法 まとめ 終わりに Amazon S3の重要性 ※ 以降、本文中ではAmazon S3をS3と短縮表記します。 AWSを利用されている場合、S3はさまざまなデータ

                        Amazon S3の誤った公開に気づく! 通知の仕組み - ANDPAD Tech Blog
                      • SREがプロダクトの価値を最大化するためにチームとして取り組んできたこと - dely Tech Blog

                        こんにちは、プロダクト開発本部SREチームの松嶋です。 delyのSREチームは、2020年末頃まで最大2人体制の少数で奮闘してきましたが、嬉しいことにこの1年でメンバーが4人と倍増しました。 それまでは、リソース不足であったため足元にある緊急度の高い課題を解決していくことがSREのメインイシューで、長期的に取り組んでいく必要のある改善業務に着手することが困難な状態でした。 しかし、SREのプラクティスを何も実践できていなかった訳ではなく、想定外の複雑さを減らし、今以上に増やさないための文化づくりを意識的にしてきたので、サービスの信頼性が大きく下がることはほとんどなく、アラート対応に追われる状況に陥ることは防げていたと思います。 実際どのように想定外の複雑さを減らす取り組みをしていたのかは、現CTOの井上が「SRE NEXT 2020」にて発表しているので、興味のある方はこちらの記事をご覧

                          SREがプロダクトの価値を最大化するためにチームとして取り組んできたこと - dely Tech Blog
                        • クラウドネイティブ アーキテクチャ、5 つの原則 | Google Cloud 公式ブログ

                          ※この投稿は米国時間 2019 年 6 月 20 日に Google Cloud blog に投稿されたものの抄訳です。 私たち Google Cloud は、Google Cloud Platform(GCP)上に移行もしくは構築されるアプリケーションの最終目標として、よく「クラウドネイティブ アーキテクチャ」という言葉を使います。では、クラウドネイティブとは正確にはどういう意味なのでしょうか。そして、そのようなシステムはどうすれば設計できるのでしょうか。 大まかに言えば、クラウドネイティブとは、クラウドによってもたらされる、従来のオンプレミスにはない新しい可能性に適応することを意味します(アーキテクチャ上の制約も従来とは大きく異なるため、それにも適応)。ソフトウェア アーキテクトとして私たちが考慮するよう訓練を受けている高レベルの要素について考えてみましょう。 システムの機能要素(何を

                            クラウドネイティブ アーキテクチャ、5 つの原則 | Google Cloud 公式ブログ
                          • Kubernetes初学者が担当したGKE移行プロセスの全貌 - Gaudiy Tech Blog

                            はじめまして。Gaudiyでエンジニアをしているあんどう(@Andoobomber)です。 クラウドネイティブ全盛の世の波に乗り、この度 Gaudiy では Cloud Run から Google Kubernetes Engine (GKE) への移行を行いました。 この記事では、その移行プロセスの全体像を共有し、得られた教訓と今後の展望を探ってみたいと思います。 1. Before After: 移行の概観 1-1. Before 1-2. After 2. なぜGKE環境に移行したのか 3. 移行のプロセス 3-1. Kubernetesを学ぶ (1週間: 2023/10/01~) 3-2. Dev on GKE環境作成 (2-3週間) 3-3. Staging on GKE環境作成 (2日) 3-4. Private Clusterへの移行 (1-2週間) 3-5. Prod on

                              Kubernetes初学者が担当したGKE移行プロセスの全貌 - Gaudiy Tech Blog
                            • 「進化し続けるインフラ」でありたい リクルートのAWS基盤チームによるマルチアカウント管理

                              AWSマルチアカウント事例祭りとは、AWSを活用する複数社が集まりお話しする祭典です。株式会社リクルートの須藤氏からは基盤の権限設定からコスト配賦、リアルタイム監視まで、マルチアカウント管理に必要なことについて共有されました。 クラウドの恩恵をプロダクトに届けることをミッションに 須藤悠氏(以下、須藤):では『「進化し続けるインフラ」のためのマルチアカウント管理』について発表いたします。私、須藤と申しまして、好きなAWSのサービスはFargateとOrganizationsです。ただOrganizationsは使い倒すっていうほど使いこなせてはいない状況です。 HashiCorpのプロダクトが好きでして、TerraformとかTerraform Enterpriseがとても好きです。あと猫とかピザが好きで、猫とピザの、(着ているTシャツを指し)このおもしろTシャツを着てたりします。 所属は

                                「進化し続けるインフラ」でありたい リクルートのAWS基盤チームによるマルチアカウント管理
                              • コスト削減成功!Amazon Auroraの監査ログをS3に保存する仕組みを構築した話 - Classi開発者ブログ

                                こんにちは。プロダクト本部Growth部でエンジニアをしている id:ruru8net です。 前回はこちらの記事を書かせていただきました。 tech.classi.jp 今日は前述したSRE留学中にやったことの中の「Amazon Auroraの監査ログをCloudWatch Logsを経由せずS3に保存する」を紹介したいと思います。 前提 前掲の記事にもある通り、弊社のAWSにかかっているコストを調査したところCloudWatch Logsの特にAmazon RDSの監査ログの保存にコストがかかっていることがわかりました。今回は弊社で最も使用しているAmazon AuroraのMySQLのみを対象として、監査ログをCloudWatch Logsを経由せずS3に保存する仕組みを作成しました。 作成した仕組み こちらのオープンソースの仕組みを参考に構築、またLambdaのソースを使いました。

                                  コスト削減成功!Amazon Auroraの監査ログをS3に保存する仕組みを構築した話 - Classi開発者ブログ
                                • 2019年ふりかえり - しゅみは人間の分析です

                                  同人誌を生産する生活 同人誌制作が生活の中心だった。妻が同人活動を始め、それに振り回された一年といえる。妻はもともと絵を描く人だったが、ある日突然漫画も描くようになった。配偶者とはいえ、ひとの趣味なので始めは放置していた。だが、どうも雲行きが怪しい。スケジュールが破綻していたのだ。新刊が落ちるかもしれない、そんな状況で2019年を迎えた。年末年始の休暇をすべて費やし、私はスケジュール管理とアシスタントをすることになった。妻は1日に4ページの作画をこなし、私がベタとトーンを塗る。正月も休むことなく作業をし、締切前日には当然のように徹夜をした。 同人誌を作るのは文化祭の準備と似ている。あらゆる手段を使って完成させ、イベントで頒布しないといけない。本を用意できたら対面販売の喜びが得られる。インターネットで得られるただの数字とは違って、目の前の人が本を買ってくれるのだ。狭いスペースに何時間もいるの

                                    2019年ふりかえり - しゅみは人間の分析です
                                  • 技術戦略策定のための Fact 収集術 - スタディサプリ Product Team Blog

                                    こんにちは。@chaspy です。プロダクト開発部の技術戦略グループのマネージャをしています。 技術戦略グループでは、日頃開発する上での課題の投げ込みや議論、解決するための計画をボトムアップで行っています。技術戦略グループの活動については過去のアウトプットもご覧ください。 blog.studysapuri.jp また、本稿のテーマである、組織やシステムの状況を把握するための Fact 収集については技術戦略 DevOps WG が担当しています。以前発表した資料もご覧ください。 このように、技術戦略グループではエンジニア1人1人が課題だと思うことを表明、宣言し、その課題をトリアージすること、および課題を評価するための Fact の発見・提供を行う仕組みが組織としてボトムアップで行える状態になっています。一方、開発部長として、事業戦略と結びつける形で技術戦略を策定する際には、現場のエンジニア

                                      技術戦略策定のための Fact 収集術 - スタディサプリ Product Team Blog
                                    • 「はてラボ」のサービスも利用しているEKSクラスタの構成と運用について - Hatena Developer Blog

                                      プラットフォームチームでSREをしている id:masayosu です。 プラットフォームチームでは、はてなのサービスの基盤となるサービスを開発・運用しています。 さらに、はてラボ(はてなアンテナ、はてな匿名ダイアリーなど)も担当しています。 これらはAmazon EKS(Elastic Kubernetes Service)というマネージドコンテナサービス上で、マルチテナントなクラスタとして運用されています。 EKSは2年前から運用を始め、現在は30近いサービスがクラスタ上で動作しています。 この記事ではEKS周辺の構成と、EKSを維持する運用について紹介します。 EKSクラスタの全体構成 EKS全体の構成は、以下の図のようになっています。 図の登場人物について簡単に説明します。 AWS EKS AWSのAmazon EKSは、マネージドなKubernetesサービスです。 Kubern

                                        「はてラボ」のサービスも利用しているEKSクラスタの構成と運用について - Hatena Developer Blog
                                      • サービスと組織の拡大を支えるEmbedded SREs

                                        SRE Lounge #13 での発表資料です。 https://sre-lounge.connpass.com/event/227250/

                                          サービスと組織の拡大を支えるEmbedded SREs
                                        • 物理サーバのセットアップをon-the-fly ISO patchingで自動化した話 | メルカリエンジニアリング

                                          メルカリSREの@kazです。 今日は、メルカリの所有する物理サーバのセットアップと設定配布の自動化をどのように実現したかをお話します。 メルカリのデータセンタ 本題に入る前に、メルカリが現在構築している自社データセンタ(東京DC)についてご紹介します。 メルカリでは現在、基幹システムのMicroservice化を進めています。各Microservicesの開発においては、そのサービスの特性などを鑑みて、チームの裁量で柔軟にインフラを選択することが可能です。その結果として、メルカリはさくらインターネット、GCP、AWSなど複数のクラウドにまたがって運用される状況となりました。 こうした中、SREチームが問題視したのは「各クラウドデータセンタ間の物理的距離」です。メルカリでは、コストダウン・低災害リスクの観点から、主にさくらインターネットの石狩リージョンを利用しています。一方で、GCPやAW

                                            物理サーバのセットアップをon-the-fly ISO patchingで自動化した話 | メルカリエンジニアリング
                                          • レガシーなフロントエンド環境をリプレースするためにチームでやっていること|食べログ フロントエンドエンジニアブログ

                                            はじめに はじめまして!食べログFE(フロントエンド)チームの金野と申します。 普段は、食べログフロントエンドの設計・開発や、新規事業・食べログテイクアウトの技術サポートなどを行っています。 食べログテイクアウトについては、Nuxt.js + TypeScriptの開発について記事を書いているので、興味がある方はぜひ御覧ください。 さて、以前の記事でご紹介したように、食べログFEチームではレガシーシステムのリプレースをReact/TypeScriptで行っています。 今回は、新しいシステムについてもう少し詳しい技術スタックや、どのようなプロセスで開発しているのかを紹介します。 開発効率化のための取り組みリプレースのお仕事はただひたすら実装するだけではありません。 「壊れにくいアプリケーション」「メンテナビリティが高いアプリケーション」にするために、アーキテクチャや採用する周辺技術について、

                                              レガシーなフロントエンド環境をリプレースするためにチームでやっていること|食べログ フロントエンドエンジニアブログ
                                            • SREの民主化とクラウド移行 - エムスリーテックブログ

                                              あけましておめでとうございます。今日から02/05までの平日にエムスリーのSREでブログリレーを開催します。その初日の投稿を担当させていただくエムスリーエンジニアリンググループの岩佐です。グループリーダーという立場でSREチーム、基盤チーム、セキュリティチーム、Unit4(m3.com/サイトプロモ)を担当しています。 私からはエムスリーでSREを拡大しようと推進している経緯/流れについて一筆認めさせていただこうかと思います。 要約、早速だけど 経緯、メンバーに敬意を、チームに契機を 方針、状況に合わせて更新 計画、そして軽快に改革 まとめ、ちょっとまともに 要約、早速だけど SREを短期的に大量に採用するのは不可能、じゃないかのう? オンプレミス環境で拡大していくサービス群をSREチームのみが運用していくのは難しい。こんなん困難では?はー、どうしよう 権限の移譲、DevOpsの推進をする

                                                SREの民主化とクラウド移行 - エムスリーテックブログ
                                              • デーモン管理をdaemontoolsからsystemdに移行させる - KAYAC engineers' blog

                                                SREチームの竹田です。Tech Kayac Advent Calendar Migration Track 9日目の記事になります。 カヤック社内では デーモン管理ツールとしてdaemontoolsが愛用されてきました。 ソフトウェアとして枯れており、 自動起動や各シグナルを送ることができるので大変重宝されています。 経緯 AmazonLinux1のEOLに伴い、稼働中のアプリケーションを移行させる必要がでてきました。 最近はコンテナ(ECS)へ移行させる事がほとんどですが、運用やアプリケーションの都合上AmazonLinux2へ移行させる場合もあります。 デーモン管理としてdaemontoolsを利用する事も考えましたが、ドキュメントの整備状況やインストールに難があることもあり、systemdに変更する事にしました。 設定 systemdの詳しい説明は省きますが、 以下のような設定ファ

                                                  デーモン管理をdaemontoolsからsystemdに移行させる - KAYAC engineers' blog
                                                • ZOZOTOWNのネットワークをDirect Connect 10Gから100Gに移行した話 - ZOZO TECH BLOG

                                                  はじめに こんにちは、技術本部SRE部フロントSREブロックの柳田です。オンプレミスとクラウドの構築・運用に携わっています。 ZOZOTOWNでは、既存システムのリプレイスプロジェクトを進行中です。リプレイス過渡期の現在、オンプレミスのネットワークとAWSのデータセンターを直接専用線で接続し、安定した高速通信を実現するDirect Connect(以降、DX)を利用しています。各サービスのマイクロサービス化に伴い、オンプレミスとクラウド間の通信量が増えた為、DX10Gの回線が逼迫する問題に直面しました。 本記事では、この回線逼迫の課題をどのように解決したかについて紹介します。 目次 はじめに 目次 回線逼迫の課題 ZOZOTOWNへのアクセスが困難 今後のリプレイスプロジェクトが遅延する可能性 DX10GからDX100Gへの移行 ステップ1:DX100Gの利用申請(クラウド) ステップ2:

                                                    ZOZOTOWNのネットワークをDirect Connect 10Gから100Gに移行した話 - ZOZO TECH BLOG
                                                  • Aurora MySQL version 3でTempTable溢れの振り返り

                                                    9/11に開催された、【Chatwork × みてね勉強会】EKS&Aurora最新ノウハウでお話させていただいた、みてねSREの伊東の登壇資料です。

                                                      Aurora MySQL version 3でTempTable溢れの振り返り
                                                    • やっぱり難易度の高い在宅勤務をちょっとでもうまくやるために心がけていること | DevelopersIO

                                                      事業開発部の塩谷 (@kwappa) です。今日はオフィスに用があるので、通勤ラッシュを避けて出社しました。 この子は新メンバーのさめくんです。在宅勤務が推奨されているのでオフィスが閑散としており、すこしさみしそうです。 リモートワークは人類には早すぎた さて、連日の報道でご存知の通り、新型コロナウイルスの感染が拡大しています。クラスメソッドでも全社員に在宅勤務を推奨し、感染予防につとめています。 個人的にはいままでほぼ毎日オフィスに出勤し、ときどき生産性をあげるための気分転換としてリモートワークを活用してきました。ところが今回は目的が「感染防止」ですから、連日自宅で業務にあたることになります。 すでにリモートワークを使いこなしている先輩社員はいつもと変わらない生産性を発揮していますが、不慣れなぼくはなかなかペースがつかめませんでした。今回はそんな中で行った自宅環境の整備と、得られた知見に

                                                        やっぱり難易度の高い在宅勤務をちょっとでもうまくやるために心がけていること | DevelopersIO
                                                      • クックパッド、CTOに星北斗が就任

                                                        ■就任の背景 1997年に日本で設立したクックパッド株式会社は、「毎日の料理を楽しみにする」というミッションのもと、日本を含む世界74カ国・地域、32言語で展開する料理レシピ投稿・検索サービス「クックパッド」、生鮮食品EC「クックパッドマート」をはじめとする事業を展開しています。 このたび、各事業のさらなる拡大ステージを見据え、新卒入社以来、SREやセキュリティ、コーポレートエンジニアリングなど幅広い領域でクックパッドに貢献してきた経歴を持ち、イギリスのグローバル本社での勤務経験もある星がCTOに就任することになりました。星を責任者とする新体制によって、国内外の事業において開発組織および技術力の強化を実現し、「毎日の料理を楽しみにする」という当社のミッション達成を目指します。 なお2010年に当社に入社し、2016年からは執行役CTOとして技術面でクックパッドの成長を牽引してきた前CTOの

                                                          クックパッド、CTOに星北斗が就任
                                                        • CircleCI 2.0を支える2つの コンテナクラスターとSRE

                                                          CNDT 2019の登壇資料

                                                            CircleCI 2.0を支える2つの コンテナクラスターとSRE
                                                          • Webサービス業界・界隈のシステム開発・運用におけるエンジニアの振る舞いや役割分担(2020正月)

                                                            こんにちは。CTOの馬場( @netmarkjp )です。 新年らしい仕事をしてみよう、ということで、 現時点と今後のエンジニア界隈の展望をまとめました。 毎月やっている社内勉強会でも話しましたが、 自社の今後の戦略について考えるネタにするのと、 直近で SRE NEXT 2020 などのイベントがあり、 エンジニアとしてのポジショニングや振る舞いについて考える機会が多そうなので、 そのベースラインとして整理したという意図もあります。 観測範囲や観測者の立ち位置によってわたしと全く異なる見解になる方もいると思うので、 ぜひ情報交換させてください。 最近のWebサービス業界・界隈に関する所感 DevOps以来の「すべて同じ人がプライマリの責任を持つ」流れが極まってきている。 開発も運用も同じ人 というやつ フロントエンド領域 / バックエンド領域 / DBMS領域(RDB、KVS、Docum

                                                              Webサービス業界・界隈のシステム開発・運用におけるエンジニアの振る舞いや役割分担(2020正月)
                                                            • SRE成熟度評価におけるポストモーテムLv.3ガイドライン

                                                              ポストモーテムLT会!「SRE成熟度評価」「社内共有会」カルチャーを醸成するためにやったこと https://findy.connpass.com/event/294084/ □ Slide内資料リンク SRG Portal https://ca-srg.dev/ Developer Experts制度 https://www.cyberagent.co.jp/techinfo/info/detail/id=23823 データで見るサイバーエージェントグループのSREと横断的なSRE推進の取り組み https://speakerdeck.com/shotatsuge/ca-sre-promotion SRE Technology Map https://www.cyberagent.co.jp/techinfo/info/detail/id=28998 サイバーエージェントグループ エンジ

                                                                SRE成熟度評価におけるポストモーテムLv.3ガイドライン
                                                              • Lobiの画像変換サーバーをImageFlux+Lambda@Edgeで置き換えたはなし - KAYAC engineers' blog

                                                                SREチームの長田です。 先日Lobiの画像変換サーバーをImageFluxに移行したので、その過程を紹介します。 画像変換って? Lobiはチャットを主軸としたコミュニティサービスです。 ユーザーはチャットメッセージに画像を添付することができます。 また、ユーザーアイコンやチャットグループの壁紙などもスマホやPCからアップロードして設定することができます。 アップロードされた画像は利用箇所に応じて適切なサイズ・フォーマットに変換する必要があります。 投稿画像のプレビューでは表示速度と通信量削減を優先して解像度低めの画像を、 拡大表示する場合はオリジナルサイズの画像を表示します。 複数サイズの画像を用意する手段として、Lobiでは内製画像変換アプリケーションであるmagcian1を運用していました。 Amazon EC2上で動作するNodeJS製のアプリケーションで、AWS CloudFr

                                                                  Lobiの画像変換サーバーをImageFlux+Lambda@Edgeで置き換えたはなし - KAYAC engineers' blog
                                                                • デブサミ2020で「礼節から育てるチームの健康と信頼性」という話をしました #devsumi #devsumic | DevelopersIO

                                                                  事業開発部の塩谷 (@kwappa) です。 2020年2月13, 14日、目黒雅叙園でDevelopers Summit 2020(通称「デブサミ」)が開催されています。その初日である2/13、 13-C-6 という枠をいただいて「礼節から育てるチームの健康と信頼性」という話をしました。 スライド セッション 昨年10月から継続してしゃべっている、チーム・心理的安全性・礼節についての総集編を目指してつくりました。過去のセッションから大きく変えてはいませんが、登壇を重ねるたびに自分でも理解が深まったように思います。 公式サイトの事前予約では「満席」の表示があり、実際のセッションもちらほら立ち見の方が出るぐらいの入場がありました。公募に通ったのも不思議なぐらいのふわっとしたタイトルでしたが、たくさんの方に聞いていてだけてとても光栄ですし、話し甲斐もありました。 聴いてくださったかたのツイート

                                                                    デブサミ2020で「礼節から育てるチームの健康と信頼性」という話をしました #devsumi #devsumic | DevelopersIO
                                                                  • Grafana の scripted dashboards を利用してダッシュボードを自動生成する - クックパッド開発者ブログ

                                                                    技術部 SRE グループの鈴木 (id:eagletmt) です。 去年クックパッド開発者ブログでも紹介した hako-console の延長として、メトリクス表示に Grafana の scripted dashboards を利用するようにしているのでその紹介をしようと思います。 アプリケーション毎のダッシュボード クックパッドではダッシュボードの作成に Grafana を利用しており、主に Amazon CloudWatch と Prometheus に保存されているメトリクスを Grafana で可視化しています。それ以外にも一部開発用のメトリクスは InfluxDB に保存しており、その可視化にも Grafana が利用されています。 Grafana の variables 機能を利用すればリソースの種類毎にダッシュボードを作成することは簡単です。 ELB のロードバランサー名、

                                                                      Grafana の scripted dashboards を利用してダッシュボードを自動生成する - クックパッド開発者ブログ
                                                                    • 自動運転を支えるWeb技術 - 信頼性への取り組み (SRE編) - TIER IV Tech Blog

                                                                      こんにちは、ティアフォーでSREを担当している宇津井です。 2019年9月にSite Reliability Engineering(SRE)として入社して以来行ってきたことをざっと振り返った上で、自動運転の社会実装においてWeb系のエンジニアには何が求められるのかという答えを探っていきたいと思います。スタートアップ企業でどのようにSREの文化を作っていくのかという面でも何かの参考になるのではないかと考え筆を取っています。 と言いつつも重要なことなので最初に書いておきますが、ティアフォーのSREは私が一人目で入社して以来専任としてはずーっと一人でその役割を担ってきました。ようやく一緒に働く方を募集できる状態になりました。そのような背景もあってこのエントリーを書いています。もしご興味がある方は以下のCareersページからご連絡をお待ちしております。 tier4.jp ※SRE編とタイトルに

                                                                        自動運転を支えるWeb技術 - 信頼性への取り組み (SRE編) - TIER IV Tech Blog
                                                                      • 「急激な円安で心の休まらない日々」――NewsPicksのSREが明かす、AWSコスト20%削減術

                                                                        円安による26%ものコスト増。SREチームにのしかかるコスト最適化の重圧 ニューズピックスが提供するソーシャル経済メディアの「NewsPicks」は、経済ニュースを中心に、記事に対して専門家や読者のコメントを添え、理解を深められるアプリやWebサイトを提供している。安藤氏は、同サービスのSRE(Site Reliability Engineering)チームでプレイングマネージャーを務め、JAWS-UGのSRE支部の運営にも携わっている。 2013年9月にサービスを開始したNewsPicksは、2022年7月時点で登録ユーザー718万人、プレミアム会員19.3万人と順調に成長してきた。プラットフォームのインフラにはAmazon Web Services(AWS)を使用している。 安藤氏が所属するSREチームは「誰もが安全かつ高速に開発できるインフラを提供することで、ニューズピックスの企業価

                                                                          「急激な円安で心の休まらない日々」――NewsPicksのSREが明かす、AWSコスト20%削減術
                                                                        • SREからPlatform Engineerへの拡大

                                                                          SREからPlatform Engineerへの拡大 というタイトルで登壇してきました Cloud Operator Days Tokyo 2023 運用の新時代 〜Effortless Operation〜 https://cloudopsdays.com/ クラウドインフラ運用技術者のための年次イベント「Cloud Operator Days Tokyo 2023」の見所を紹介 https://cloud.watch.impress.co.jp/docs/news/1518302.html SREからPlatform Engineerへの拡大 というタイトルで登壇しました - じゃあ、おうちで学べる https://syu-m-5151.hatenablog.com/entry/2023/08/10/150412 登壇しかないので20分しかないのでギュッとしてしまいました。

                                                                            SREからPlatform Engineerへの拡大
                                                                          • AWSコスト倍になっちゃった!〜削減への道のり〜 - freee Developers Hub

                                                                            こんにちは、DevBrandingのellyです。5月20日に配信した「AWSコスト倍になっちゃった!〜削減への道のり〜」の様子をご紹介します。 今回はITストラテジーチームとSREチームから2人のゲストを招いて、freeeで実際に起きたAWSコスト増加の事例をもとに、気がつけば増えるインフラ費用の無駄をどのように見つけ、コスト削減していったのか、実話のストーリーを話してもらいました。 登壇者集合写真 miry:写真左上。2015年入社。ITストラテジー。全社のITツールのコスト管理やIT戦略の策定を担当。 nakagawa:写真右上。2020年5月入社。SREチームエンジニア。基盤の更改やクラスタ管理効率化を担当。 のぶじゃす (@noblejasper): 写真右下。ラジオパーソナリティ、2017年に中途入社。mixi、ソーシャルゲーム企業でソフトウェアエンジニアを経験し freee

                                                                              AWSコスト倍になっちゃった!〜削減への道のり〜 - freee Developers Hub
                                                                            • 実践超入門・自炊 〜在宅勤務の食事を楽にカイゼンする手羽野菜スープの設計と実装〜 | DevelopersIO

                                                                              事業開発部の塩谷 (@kwappa) です。 新型コロナウイルスの感染は引き続き拡大傾向で、クラスメソッドでも基本的に全社員が在宅勤務を継続しています。 在宅勤務が長くなると聞こえてくるのが、コミュニケーションの問題、運動不足の問題、さらには公立小中高の休校に伴う育児の問題などです。もちろんこれらも解決すべき課題なのですが、「食事の問題」についてもよく聞くようになってきました。 クラスメソッドのSlackでも、 #misc-lunch というチャンネルが作られて毎日のお昼ご飯写真を投稿したり、家庭料理について話す #misc-home-cookingが盛り上がったりしています(ちなみに社内ルールで雑談チャンネルには misc のプレフィクスをつけるようになっています)。 「食事の問題」といってもメニューから手間からいろいろありますが、今回は自炊の経験がない、もしくはあまり積極的にやらない人

                                                                                実践超入門・自炊 〜在宅勤務の食事を楽にカイゼンする手羽野菜スープの設計と実装〜 | DevelopersIO
                                                                              • SRE伝道師としてMicroservices SRE チームが取り組んでいる事例 | メルカリエンジニアリング

                                                                                ※この記事は、"Blog Series of Introduction of Developer Productivity Engineering at Mercari" の一環で書かれています。 著者: Microservices SREチーム @k-oguma(ktykogm) 本記事の内容は、前日の記事である "Embedded SRE at Mercari "の具体的な事例等の紹介となります。私自身が実際にEmbedded SREsとしてプロダクトチームに参加し、その中で発見したプロダクトチームの課題とそれに対して行った取り組みをいくつか紹介したいと思います。最後に具体的な活動を通して見えてきたEmbedded SREsのメリットなどについてまとめます。 本記事内の用語 SRE Site Reliability Engineering の略 信頼性における方法論、概念、ベストプラク

                                                                                  SRE伝道師としてMicroservices SRE チームが取り組んでいる事例 | メルカリエンジニアリング
                                                                                • すぐに始められる!GitHubコミュニケーションでチームの情報共有コストを下げよう - Money Forward Developers Blog

                                                                                  こんにちは。あるいはこんばんは <VTRyo>です。 2022年6月に一人Product SREだった僕もようやくメンバーが増え、チームとしてコミュニケーションを成立させねばという気持ちになってきました。 タスク管理ツールといったチームに閉じているものは基本的にチーム単位で選定できるのがマネーフォワードの良いところです。 我々マネーフォワードクラウドHRソリューションのSREグループ(以降SREグループと表記)では、GitHubを使って以下のことをしています。 チームの概要情報(ミッション、責任範囲、スキルスタックなど) タスク管理 メンバー間の情報共有 所有するコードの管理(issue template、GitHub Actionsなど) 今回は、社員の方からこんな声を頂いたことをきっかけに執筆しています! なぜ、チームコミュニケーションをGitHubに寄せたのか 最も強いモチベーション

                                                                                    すぐに始められる!GitHubコミュニケーションでチームの情報共有コストを下げよう - Money Forward Developers Blog