本文「SRE」を検索 - はてなブックマーク

321 - 360 件 / 3716件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

SREの検索結果321 - 360 件 / 3716件

プラットフォームエンジニアリングに関する 5 つの誤解: プラットフォームエンジニアリングとは一体なのか | Google Cloud 公式ブログ
- 111 users
- cloud.google.com
- テクノロジー
- 2024/06/12
Darren EvansEMEA Practice Solutions Lead, Application Platform ※この投稿は米国時間 2024 年 5 月 30 日に、Google Cloud blog に投稿されたものの抄訳です。なぜ新しいトピックに対して否定的になってしまう人がいるのか、その理由は、群盲象を評すの寓話からわかります。その人自身の視点からのみで物事を見てしまうと、その全体像を見失ってしまうということです。プラットフォームエンジニアリングはソフトウェアデリバリーの比較的新しい手法です。現在、IT 組織やソフトウェアエンジニアのチームの多くがプラットフォームエンジニアリングについて検討している段階にあるのですが、プラットフォームエンジニアリングとは何なのか、プラットフォームエンジニアリングで何ができるのか、プラットフォームエンジニアリングを導入す
- devops
- あとで読む
- cloud
- サービス
- 資料
データ基盤のメタデータを継続的に管理できる仕組みを作る - Hatena Developer Blog
- 110 users
- developer.hatenastaff.com
- テクノロジー
- 2020/04/16
こんにちは。MackerelチームでCRE(Customer Reliability Engineer)をしているid:syou6162です。 CREチームではカスタマーサクセスを進めるため、最近データ分析により力を入れています(参考1, 参考2)。データ分析を正確に行なうためには、データに関する正確な知識が必要です。今回はより正確なデータ分析を支えるためのメタデータを継続的に管理する仕組みについて書いてみます。データに対する知識: メタデータデータ分析を正確に行なうためには、データ自身に関する知識(=メタデータ)が必要です。例えば、Mackerelのデータ分析タスクでは以下のような知識が必要とされることが多いです。このテーブル / カラムは何のためのテーブルなのか似たようなカラムとの違い集計条件の違い、などデータがどのような値を取り得るか SELECT column, COU
「信頼性」を保ちつつ大規模サービスをリニューアルする / cookpad-tech-kitchen-service-embedded-sres
- 110 users
- speakerdeck.com/rrreeeyyy
- テクノロジー
- 2020/08/21
Cookpad Tech Kitchen #24 5800万人が使うサービスのリニューアルとその技術 ( https://cookpad.connpass.com/event/183385/ ) で、"「信頼性」を保ちつつ大規模サービスをリニューアルする" というタイトルで発表した際の資料です。スライド内のリンクは次のとおりです。 - How SRE teams are organized, and how to get started: https://cloud.google.com/blog/products/devops-sre/how-sre-teams-are-organized-and-how-to-get-started - Design Docs at Google: https://www.industrialempathy.com/posts/design-docs
- SRE
- あとで読む
- cookpad
- サービス
- 開発
- 負荷試験
- slide
- programming
ZOZOTOWNを支えるリアルタイムデータ連携基盤 - ZOZO TECH BLOG
- 109 users
- techblog.zozo.com
- テクノロジー
- 2020/08/27
こんにちは、SRE部MA基盤チームの谷口（case-k）です。私達のチームでは、データ連携基盤の開発・運用をしています。データ基盤には大きく分けて2種類あり、日次でデータ連携してるものとリアルタイムにデータ連携しているものがあります。本記事ではリアルタイムデータ連携基盤についてご紹介します。既存のデータ連携基盤の紹介リアルタイムデータ連携基盤の紹介なぜ必要なのか活用事例の紹介データ連携の仕組みと課題リプレイス後のリアルタイムデータ連携基盤 SQL Serverの差分データの取り方を検討アーキテクチャ概要と処理の流れ Fluentdのプラグインを使った差分データの取得 Dataflowでメッセージの重複を排除 Dataflowで動的にBigQueryの各テーブルに出力 Pub/Subのメッセージ管理イベントログ収集基盤個人情報の取り扱いビルド・デプロイ戦略監視データ
- fluentd
- BigQuery
- あとで読む
- データ
- cloud
- クラウド
- ZOZO
- google
- GCP
- data
Pull Requestのレビュー負荷を軽減し、開発生産性を向上するためにチームで取り組んだこと - ZOZO TECH BLOG
- 109 users
- techblog.zozo.com
- テクノロジー
- 2024/03/22
はじめにこんにちは。WEARフロントエンド部Webチームの藤井です。私たちのチームでは、WEARのWebサイトのリプレイスと新規機能の開発を並行して進めています。これらの開発を推進する中で、Pull Requestのレビュー負荷を軽減し、開発生産性を向上させるための取り組みを行なってきました。本記事では、その中で効果的だった取り組みについてご紹介します。目次はじめに目次背景と課題レビューの体制の薄さスコープの広さ仕様把握の負担対応内容についての説明不足処理の複雑性仕様の抜け漏れ動作確認の手間課題解決に向けた取り組みレビュー体制の見直し Pull Requestを小さくする Issueを小さくする Pull Requestの粒度について明文化する機械的なチェックの拡充 ESLintルールの拡充 Visual Regression Testの拡充 Pull Req
Trello、Asana、GitHub、Jira。チームによって管理ツールがバラバラな理由 - エス・エム・エスエンジニアテックブログ
- 109 users
- tech.bm-sms.co.jp
- テクノロジー
- 2021/04/27
タスク管理は、チームで仕事をしていく上で欠かせない一方で、永遠にカイゼンし続ける必要があるものです。チームごとに、どんなツールを選んでいるのか、それをどう利用しているのでしょうか。エス・エム・エスでは、タスク管理の仕方もチームごとに裁量が与えられています。どのようなツールを利用してタスク管理をしているのか。「カイポケ」「カイゴジョブ」「ハピすむ」など、各サービスの開発チームに聞いてみました！ツールの選定基準、利用の仕方、利用ツールのメリット・デメリットなど、開発チームによってどのような違いがあるのかを紹介していきます。エンジニアチームごとに異なるタスク管理ツール今回、話を聞いたのは、カイゴジョブ、ハピすむ、カイポケGengar、カイポケ障害、カイポケKSEE、カイポケSRE、カイポケ訪看など7つの開発チームのエンジニアメンバー。それぞれのチームで使っているツールやチームのメンバー
スクラムを導入してチーム状態を可視化し持続可能なチームを目指す - ZOZO TECH BLOG
- 109 users
- techblog.zozo.com
- テクノロジー
- 2023/04/05
こんにちは、計測プラットフォーム開発本部システム部SREブロックの市橋です。2021年4月に新たに発足したチームで未経験ながらリーダーを任され、気づけば約2年が経過していました。これまでを振り返ってみると、まっさらな状態から安定したチームができてきたと感じています。今回は新米リーダーとして試行錯誤する中で、チーム状態を可視化して健全なチーム運営を目指した話を紹介します。チーム状態の可視化を考えたきっかけリーダーを任された当初、チーム運営上の課題が色々あるのは認識していましたが、どこから手をつけるべきかが自分の中で判然としませんでした。メンバーの時に一個人として感じていた課題も、チーム全体を俯瞰して見た時にどれから優先的に取り組むべきか自信を持って判断できませんでした。まるで大海原のど真ん中にいきなり放り出された感覚でした。そんな悩みを抱えていた時、全社に導入されているWevoxのアン
- スクラム
- あとで読む
- SRE
- scrum
- team
- アジャイル
- チーム
- 開発
ZOZOテクに入社してもうすぐ1年半になるので、リアルな話をしたい - inductor's blog
- 109 users
- blog.inductor.me
- テクノロジー
- 2019/09/04
はじめにタイトルは釣りです（テンプレ）はじめましての方ははじめまして。特にこの記事がバズるとも思ってないんですが、なんとなく新しく僕のことを知っていただいた方のために自己紹介しておきます。 ZOZOテクノロジーズ開発部に所属するインフラエンジニアのようなことをやっている者です。チーム的にはMLOpsチームという組織にいます。Dockerが好きです。社内では本名の太田さん、pchan、いんだくたーさん、こうちゃんなどと呼ばれています (Ref: @sonots) 自分のことを知っている方はご存知だと思いますが、自分語り満載のエントリーになる予定です。だるいと思った方はスルーしてもらって大丈夫です！入社の経緯とかそもそもの入社のきっかけは、前職で働いていた頃に遡ります。前職では小さな(?)Web制作会社で受託案件のPHPを書いたりAndroidアプリ(Java)の保守などをメインに担
物流支援サービスを支えるAWSサーバーレスアーキテクチャ戦略 - ZOZO TECH BLOG
- 109 users
- techblog.zozo.com
- テクノロジー
- 2020/11/05
はじめにこんにちは。SRE部BtoBチームの蔭山です。Fulfillment by ZOZO（以下FBZ）で提供しているAPIシステムの運用及び監視を担当しております。 FBZではAWS Lambdaを主軸としてAWSが提供しているフルマネージドサービスのみを利用するサーバーレスアーキテクチャを採用し、構築・運用してきました。今回は実際にどのようにサーバーレスアーキテクチャを活用してサービスを構築・運用・監視しているかご紹介します。これからサーバーレスアーキテクチャを活用してサービスを構築されようとしている方の参考になれば幸いです。なぜサーバーレスを採用したのか FBZはZOZOTOWNとブランド様が運営されている自社ECサイト間でリアルタイムに在庫情報を連携し、ZOZOTOWNと自社ECサイトでの在庫の一元管理を実現するAPIサービスです。そのため、マスタであるZOZOTOWNの在
組織規模とCTOの求められる役割の変化に関する雑記｜Matsumoto Yuki
- 107 users
- note.com/y_matsuwitter
- テクノロジー
- 2020/12/01
CTOA Advent Calendar 1日目のバトンを受け取りましたので、1日目となる今回は、CTOに求められる役割の変化について、自分のこれまでの振り返りを兼ねて記事を書いてみようと思います。ちなみに今週はマガジンの連載をこちらの記事に代えさせていただければと。普段はこちらのマガジンでソフトウェアと経営についてつらつらと書いています。ご興味ある方、年末の時間のあるときにでもご一読いただければ幸いです。はじめにこの10年、エンジニアとしてのキャリアをスタートして今に至るまで、一桁人のスタートアップから1000人近い規模の開発組織を抱えた大企業まで様々な規模の組織のCTOを経験してきました。おおよその流れとしては、学生時代に小さなスタートアップを3社、その後Gunosyにて一桁人から60人前後の開発組織、現在はDMMのグループにて合計1000人弱の開発組織にてCTOをしています。 C
SRE Practices in Organizations
- 106 users
- speakerdeck.com/nari_ex
- テクノロジー
- 2021/11/16
Infra Study 2nd #7「SREと組織」の登壇資料です。 https://forkwell.connpass.com/event/228038/
- SRE
- あとで読む
モダンなシステムにSLI/SLOを設定するときのベストプラクティス
- 105 users
- newrelic.com
- テクノロジー
- 2020/03/31
New RelicではどのようにSLI/SLOを定義し、SREを実践しているか。その経験から、SLI/SLOについて解説した記事 Best Practices for Setting SLOs and SLIs For Modern, Complex Systems の翻訳です。 -- New Relicのサイト信頼性VPであるMatthew Flamingも、この記事に貢献しています。この記事はサンフランシスコその他で行ったFutreStack18での講演「SLOs and SLIs In The Real World: A Deep Dive.」をもとに作られています。 New Relicでは、サービスレベル指標（Service Level Indicator: SLI）とサービスレベル目標（Service Level Objective: SLO）を定義したり設定したりことが、サイト
- SRE
- sli
- monitoring
- slo
- あとで読む
- インフラ
- システム
- サービス
ヘルスケアデータをGrafanaで見たくない…？〜健康 Reliability Engineering〜
- 105 users
- zenn.dev/miketako3
- テクノロジー
- 2024/01/18
Blueskyのフォローお願いします！はじめにまずはこちらをご覧ください。これは私のApple Watchで計測されたヘルスケアデータです。Apple Watchをつけていると、心拍数や歩数、睡眠時間などのデータが自動的にiPhone内に記録されます。 SREなら健康を維持するためにもSLIとSLOを設定して可視化するべきですよね？ SREなら健康エラーバジェットが無くなりそうだったら「今すぐ寝ましょう！」と架電が来て欲しいですよね？普通にやるとiOSアプリを用いて直接ヘルスケアデータを確認することになりますが、Web系のSRE的なエンジニアとしてはやはり業界標準の技術で可視化したいところです。また、iOSアプリを開発するのは専門知識が必要となり非常に骨が折れる作業です。そもそもMacがないとできないですし。そこで、今回は Apple Watchのヘルスケアデータを全自動で良
ゆずたそ流スライドデザインTips集 - 下町柚子黄昏記 by @yuzutas0
- 105 users
- yuzutas0.hatenablog.com
- 学び
- 2022/01/07
この記事の趣旨筆者（@yuzutas0）がプレゼンテーション資料作成をアシスタントに代行してもらうにあたって「こういう点に注意してほしい」という項目を列挙した。自分のために書いた記事ではあるが、筆者と関わりがない方も、ぜひスライド作成の参考にしていただけると幸いだ。もくじこの記事の趣旨もくじ背景免責・参考資料必読書 Tips 01: キーメッセージ Tips 02: コンセプト Tips 03: アウトライン Tips 04: PREP法 Tips 05: 免責事項 Tips 06: 自己紹介 Tips 07: 1スライド・1メッセージ Tips 08: 余白とグルーピング Tips 09: 余計な要素を削ぎ落とす Tips 09: 箇条書きではなく図や表にする Tips 10: x軸とy軸の慣習に従う Tips 10: カラーの慣習に従う Tips 11: カラーは6色ま
メドピアのECSデプロイ方法の変遷 - メドピア開発者ブログ
- 105 users
- tech.medpeer.co.jp
- テクノロジー
- 2020/11/24
CTO室SREの侘美です。好きなLinuxディストリビューションはLinux Mintです。メドピアでは現在多数のサービスを運用しており、そのほとんどがAmazon ECSを構成の中核として利用しています。 ECSに対してデプロイを行う方法としては、CodeDeploy、CodePipeline、Copilot（ecs-cli）等があり、CloudFormationやTerraform等のIaCツールで何をどこまで管理するかも合わせて検討する必要があります。どの方法にもメリット・デメリットがあり、Twitterや技術ブログを観測している範囲ではデファクトスタンダードと呼べる方法は未だに無いように思われます。メドピアで最初にECSを利用し始めたのは2018年ころであり、これまで試行錯誤しながらECSのデプロイ方法とタスク定義の管理方法を模索してきました。今回はメドピア社内で試してきた
- ecs
- aws
- デプロイ
- rails
- terraform
- あとで読む
- 開発
SRE座談会 - 株式会社はてな
- 104 users
- hatena.co.jp
- テクノロジー
- 2023/11/15
はてなでは、さまざまなチームのSRE（Site Reliability Engineer）が横断的に集まり、技術的な標準化を通じて社内の各チームのSREを支える活動を行っています。チームごとの具体的な取り組みについて、CTOのid:motemenと、SREのid:masayosu、id:taxintt、id:cohalzの3人に語ってもらいました。はてなのSREが取り組む社内技術の標準化とはまずはみなさんの自己紹介、チームでの役割を教えてください。
- sre
- あとで読む
- hatena
- はてな
GoとKinesis Data Firehoseで非同期の検索基盤を構築─モノリス化した「カオナビ」はアーキテクチャ改善にどう取り組み始めたか - はてなニュース
- 104 users
- hatenanews.com
- テクノロジー
- 2023/01/19
社員の個性・才能を発掘し、戦略人事を加速させるタレントマネジメントシステム「カオナビ」を提供する株式会社カオナビでは、SaaS移行にあわせてクラウドを全面的に採用し、インフラの自動化などにAWSのマネージドサービスを積極活用しています。とはいえ10年近い運用で、サービス開発におけるシステムのモノリス化が課題となってきました。こういった全社的な課題は、2020年からCTOを務める松下雅和（@matsukaz）さんを中心にCTO室で対応しています。モノリスなシステムは、全体のモジュラモノリス化を前提に、とくにボトルネックとなる検索処理を非同期の基盤サービスとして切り出しています。この検索基盤の設計と実装を通して、カオナビはシステムのアーキテクチャ改善をどのように進めようとしているのか。非同期である必要性や、デプロイの工夫、開発組織の文化まで含めて、CTO室の千葉峻秀さんとインフラグループの
「システム運用の基本と戦略」についてただまとめる
- 103 users
- zenn.dev/moko_poi
- テクノロジー
- 2024/06/07
23卒でバックエンドエンジニアをしているたかしゅんです。（@1341Shun）先日、株式会社サイバーエージェントAI事業本部の2024年度エンジニア新卒研修でシステム運用に関する講義を行いました。そこで話した内容とスライドを完全公開したので、内容について解説します。 90分の内容のため、かなり長いですが、個人的にぜひ一読して欲しい内容になっています。実際の資料はこちらになります↓ 自己紹介こんにちは、たかしゅんと言います。2023年度入社で今年で２年目になります。株式会社サイバーエージェントのAIオペレーション室で新規立ち上げをやっております。入社して最初に広告プロダクトに配属し、PipeCDの導入などのDevOps業務を中心に行なっておりました。記事もあるのでもしよろしければ、ご覧ください。 2月中旬からAIオペレーション室に移動し、新規立ち上げのインフラ環境の構築からCI
- SRE
- あとで読む
- 監視
- 運用
- 資料
- システム運用
- development
- 開発
クローラー運用を楽にするためのクラウドサービス比較 - ZOZO TECH BLOG
- 103 users
- techblog.zozo.com
- テクノロジー
- 2020/05/15
こんにちは！最近気になるニュースはスピノサウルスの尻尾の化石が発見されたこと1な、SRE部エンジニアの塩崎です。ZOZOテクノロジーズの前身となった会社の1つであるVASILYでは数多くのクローラーの開発・運用の担当をしてきました。今回はその知見を生かして、クローラーを楽に運用するためのクラウドサービスを紹介します。概要データ解析を円滑に進めるためには、CSVやWeb APIなどの構造化されたデータが必要です。しかし全てのWebサイトにあるデータが構造化データを提供しているとは限りません。むしろ提供していないケースの方がはるかに多いです。そのため、Webクローラーを作成して構造化されていないWebページを解析し、構造化データを生成する必要があります。しかし、Webクローラーの運用には数多くの「つらみ」があります。特に大量のWebページを1日1回などの頻度で定期的にクロールする際には
10分で完成！WEBサイトパフォーマンス計測基盤 ver.2019 - dely Tech Blog
- 102 users
- tech.dely.jp
- テクノロジー
- 2019/12/15
はじめに本記事は dely Advent Calendar 2019 の15日目の記事です。昨日は開発部サーバサイドエンジニアの高橋くんが「Rails6の複数データベースの仕組みと実装時にハマったところ」という記事を書きましたので是非読んでみてください。 tech.dely.jp こんにちは！dely開発部SREの井上です。本記事ではWEBサイトのパフォーマンスを定期的に計測する仕組みについて紹介をしたいと思います。実は去年のAdvent Calendarでも同じような記事を書いたのですが、時代背景に沿って計測するツールをsitespeed.ioからLighthouseに変更したので理由も含めて紹介させてください。基盤の構築においては下記のサービスやツールを利用しています。 AWS CodeBuild S3 Athena Terraform Lighthouse 前置きはいいから
- パフォーマンス
- performance
- web
- lighthouse
- あとで読む
- 設定
- サイト
- aws
効率的なGo
- 102 users
- www.oreilly.co.jp
- テクノロジー
- 2024/01/30
本書は、Goアプリケーションの効率やスケーリングに関する疑問に対して、実用的な答えを与えてくれる書籍です。レイテンシー、CPU、メモリ資源についての知識、またOSやGoがそれらを抽象化している方法について、またソフトウェアの効率に関わるデータ駆動な意思決定を行う事の意味や、計算量解析の手法、最適化状況の例など、実用的なソフトウェアを開発する中での「効率」に関する知識を紹介します。 Goやその他のモダンな言語で書かれたプログラムを設計、作成、変更するソフトウェア開発者、また誰かが書いたソフトウェアを主に運用するDevOpsエンジニア、SRE、シスアド、プラットフォームチームなどの読者が、いつ、どのように効率最適化を適用するかという問いに答えるための知識を身に付けることができるでしょう。関連ファイル原著者による本書のサンプルリポジトリ正誤表ここで紹介する正誤表には、書籍発行後に気づい
スクラムを1年回して SREと開発組織がどう変わったのか
- 102 users
- speakerdeck.com/licht110
- テクノロジー
- 2020/01/26
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
- SRE
- あとで読む
- スクラム
- scrum
- アジャイル
- 組織
- 開発
東証がSREによるレジリエンス向上に挑む理由。過去のシステム障害から何を学んだのか？（後編）ソフトウェア品質シンポジウム2022
- 102 users
- www.publickey1.jp
- テクノロジー
- 2022/09/28
東証がSREによるレジリエンス向上に挑む理由。過去のシステム障害から何を学んだのか？（後編）ソフトウェア品質シンポジウム2022 9月22日と23日の2日間、一般財団法人日本科学技術連盟主催のイベント「ソフトウェア品質シンポジウム2022」がオンラインで開催され、その特別講演として株式会社日本取引所グループ専務執行役横山隆介氏による「日本取引所グループシステム部門の取組み～システムトラブルからの学びと今後の挑戦～」が行われました。現在、日本取引所グループ傘下の東京証券取引所（以下、東証）は、過去に何度か大きなシステムトラブルを経験し、それを教訓として組織とシステムの改善を続けています。そこで今回、シンポジウム企画委員会からの要望を受けて行われた特別講演で、東証がこれまでのシステム障害から何を学び、そこから何を変化あるいは進化させてきたのか。わずか2年前のNASのハードウェア障害
SREチームがNew Relicを使って AWSコスト最適化に貢献した話 | ドクセル
- 101 users
- www.docswell.com
- テクノロジー
- 2023/06/27
SREチームがNew Relicを使って AWSコスト最適化に貢献した話株式会社ニューズピックス安藤裕紀 NRUG (New Relic User Group) SRE支部 Vol.3 - 2023.6.27(Tue)
クエリログを使ったPostgreSQLの負荷テスト - カンムテックブログ
- 101 users
- tech.kanmu.co.jp
- テクノロジー
- 2022/12/04
SREの菅原です。この記事はカンム Advent Calendar 2022の４日目の記事になります。少し前にサービスで使っているPostgreSQLをRDSからAuroraに移行しました。 Auroraに移行するため色々と作業を行ったのですが、その中でAuroraの性能を測るために行った負荷テストについて書きます。 pgbench まず最初にpgbenchを使って、単純なワークロードでのRDSをAuroraの性能差を測ってみました。*1 以下がその結果です。 MySQLで同様のテストをmysqlslapを使って行ったことがあって、そのときは概ねAuroraのほうが性能が高かったので、同様の結果になると考えていたのですが、RDSのほうが性能が高い結果になったのは予想外でした。ただAuroraのアーキテクチャを考えると、pgbenchのような細かすぎるトランザクションの場合はRDSのほ
- postgresql
- 負荷テスト
- あとで読む
- db
- テスト
- Aurora
- SRE
- benchmark
- mysql
なぜCDKを使う「べき」なのだろう? - Uzabase for Engineers
- 100 users
- tech.uzabase.com
- テクノロジー
- 2024/03/29
はじめに皆様こんにちは、ソーシャル経済メディア「NewsPicks」(Media Infrastructureチーム)エンジニアの北見です。現在、私は弊社サービスの一部のインフラ刷新を行なっている最中で、ここ数ヶ月 AWS CDKを触っておりました。前職では Infrastructure as Code として Terraform を使ったことがあるのですが、少なくともAWS を使うという条件においては CDKを使うべきという結論に辿り着きました。今回はそのように考えるようになった理由について説明していこうと思います。前提 Terraform はパブリッククラウドにおける Infrastructure as Code の走りとして様々な現場に導入実績があり、それに対するリスペクトは持つべきです。しかしよくある「AvsB」というメリデメの構図で「どっちでもいいよ、好みだよ」と投
- cdk
- aws
- あとで読む
- web
SRE Technology Map
- 99 users
- www.cyberagent.co.jp
- テクノロジー
- 2023/06/29
サイバーエージェントは創業来、インターネット産業の拡大とともに事業成長を続けてきました。またそれと同時に、SRE領域へも注力してきました。SRE Technology Mapは、サイバーエージェントのSREチームの取り組みを知ってもらうことを期待して製作しています。 Developer Experts of SRE 柘植翔太 Shota Tsuge サイバーエージェントが提供する幅広い事業サービスの信頼性向上に、私達SREsは日々取り組んでいます。事業領域や事業フェーズ、組織規模が異なれば、SREsのアプローチも違ってきます。それぞれのSRE組織が、様々な課題解決に取り組んだことによって得られた知見や考え方などを多くの人に知ってもらいたいと考え、「SRE Technology Map」を作成しました。「SRE Technology Map」を通して、少しでもサイバーエージェントに興味を
- SRE
- あとで読む
- cyberagent
- 技術
- business
DevOpsトポロジー
- 99 users
- www.ryuzee.com
- テクノロジー
- 2022/04/11
みなさんこんにちは。@ryuzeeです。 2021年12月1日に発売した『チームトポロジー価値あるソフトウェアをすばやく届ける適応型組織設計』ですが、おかげさまで多くの方に読んでいただき感謝しています。チームトポロジー価値あるソフトウェアをすばやく届ける適応型組織設計著者／訳者：マシュー・スケルトン、マニュエル・パイス、原田騎郎、永瀬美穂、吉羽龍太郎出版社：日本能率協会マネジメントセンター発売日：2021-12-01単行本：280ページISBN-13：9784820729631ASIN：4820729632 今日はこの「チームトポロジー」の元となったDevOpsトポロジーについて紹介します。このアイデアは2013年に著者の1人であるマシュー・スケルトンが自身のブログに書いた記事をまとめたものです。 2013年頃といえばDevOpsが流行しはじめた時期だと思いますが、こ
- devops
- あとで読む
- SRE
- チーム
- 組織
- 開発
- Blog
チームをスケールさせるのに近道はない。でもやるしかないんだ。 - Money Forward Developers Blog
- 99 users
- moneyforward-dev.jp
- テクノロジー
- 2022/07/20
マネーフォワードビジネスカンパニークラウドERP本部会計Plus開発部の西村です。エンジニアリングマネジャーとしてクラウド会計Plus の開発に携わっています。(執筆時) 本記事ではユニコーン企業のひみつ ―Spotifyで学んだソフトウェアづくりと働き方を何度も読んだ私が toB 向けのプロダクト開発において経験し､考えたことを紹介します｡私は2021年1月にソフトウェアエンジニアとして入社し､グループリーダーを経て､エンジニアリングマネジャーとしてマネジメントに従事しているという立ち位置です｡もちろん1人でなしとげたことではなく､チームで考えて､学んで､成長してきた記録です｡ https://www.oreilly.co.jp/books/9784873119465/ この本はインセプションデッキなどを紹介したアジャイルサムライのジョナサン・ラスマセンの新作。著者が
自宅の回線が時間によってめちゃくちゃ遅くなるのをMackerelとSpeedtest CLIで可視化した | DevelopersIO
- 98 users
- dev.classmethod.jp
- テクノロジー
- 2021/10/15
結果こうなりました（結論からさらすスタイル）。いまの御時世の固定回線で下り 3Mbps って何ですかね？？？というのは実は本題ではなくて、このようなグラフを作ることがこの記事の本題です。背景状況については冒頭の概要に書いたとおりなのですが、とにかく自宅のネットワーク回線を定期的に測定して可視化することを試みました。ちなみに我が家は古い賃貸集合住宅で VDSL なので、上限は 100Mbps になります。それでもそこそこ快適で、特に不満もなかったのですが1、今月に入った辺りから急に回線状況の悪い時間帯に出くわすようになってしまいました。改善策をとるまえにまずは計測、ということで、今回の試みとなったわけです。仕組みざっくりいうと、自宅の Windows PC に Hyper-V で Linux を動作させその Ubuntu にmackerel-agentを導入し 10
- network
- Mackerel
- あとで読む
- 速度
- テスト
- CLI
- Ubuntu
- ネットワーク
Datadogの活用ノウハウを一挙に公開・それを支える全社管理者の工夫とは #datadog_japan_meetup - ZOZO TECH BLOG
- 98 users
- techblog.zozo.com
- テクノロジー
- 2022/07/29
こんにちは。ECプラットフォーム基盤SREブロックの高塚と巣立（@tmrekk_）です。 ZOZOTOWNはクラウド化・マイクロサービス化を進める中で、監視SaaSのDatadogを採用しました。この数年で多くの知見が蓄積され、今では様々なシーンでDatadogを活用しています。この記事ではそのノウハウを惜しみなく公開します。 ※本記事は、先日開催されたDatadog Japan Meetup 2022 Summerにて発表した内容を書き起こして再構成したものです。当日の発表資料 speakerdeck.com 目次当日の発表資料目次はじめにマイクロサービス基盤に必要な監視の要件第1部 ZOZOTOWNにおけるDatadogの活用 1. どこで障害が起こっているのか分からない → APM 2. アラートやダッシュボードや外形監視が欲しい → Monitors, Dashboar
- Datadog
- 監視
- ZOZO
- あとで読む
- monitoring
- api
- aws
- article
開発/Stg環境のための本番DBマスキングと継続的リストアの仕組みを作りました | ランサーズ（Lancers）エンジニアブログ
- 98 users
- engineer.blog.lancers.jp
- テクノロジー
- 2021/09/06
SREチームの安達(@adachin0817)です。今回はMENTA、Lancers Creative、Lancers Agencyでマスキングした本番環境のデータをStgや開発環境のMySQLコンテナへ毎週リストアする仕組みを実装しました。実際にここらへんは運用をしていく中で一苦労されている方も多いのではないでしょうか。それではまず背景と、実装するに当たっての活動含めてご紹介できればと思います。背景今回はMENTAを例にしています。各サービスの開発環境はDockerを利用しており、本番とStg環境はTerraformで管理しています。カラム追加ではマイグレーションを実行することでサンプルのスキーマファイルを投入して開発をしているのですが、たまに開発環境で動いていたソースがStgや本番で動かないといったことで開発効率が下がることが見受けられます。開発メンバーにとってはより本番環境に近い
- DB
- あとで読む
- database
- MySQL
- aws
- Development
- Docker
- 開発
ソフトウェア開発における人的リソースの理想的な配分
- 98 users
- blog.tady.jp
- テクノロジー
- 2021/07/26
背景SRE という概念が生まれてから数多くの開発チームで「ソフトウェアエンジニアリングの手法で運用を改善する営み」が行われてきた。同時に、技術的負債が経営レベルで認知されるようになり、日常の会話の中でも長期・短期のトレードオフを念頭に置いたプロジェクト推進がやりやすくなったのは言うまでもない。しかし、スタートアップでは Dev と Ops が別れていることは稀で、「全員が全てに対応する」ような状況になってしまうことがしばしばある。これは小さい組織だけの問題ではなく、例えば大企業の中の新しいプロダクト開発チームでも同じことが言える。 SRE を念頭に置き、技術的負債の主導権を握るために必要なチーム体制とはどういうものなのだろうか？タスクの分解小さな組織のソフトウェアエンジニアは日々数多くのタスクを与えられている。場合によっては数名のメンバーで新規機能開発から日々の不具合修正、そして S
- 開発
- 組織
- あとで読む
- SRE
- CircleCI
- チーム
- development
- マネジメント
- management
Aurora Serverless v2を本番導入した話〜検討や導入時のポイント・得られた効果について〜 - ZOZO TECH BLOG
- 97 users
- techblog.zozo.com
- テクノロジー
- 2023/03/16
はじめにこんにちは。SRE部ECプラットフォーム基盤SREブロックの石田です。本記事では、Aurora Serverless v2を本番導入するにあたってどのような検討をし、どのように導入していったか、また導入後に得られた効果について紹介します。はじめに Aurora Serverless とは背景比較検討比較内容方針の決定アーキテクチャ導入 1. Aurora Serverless v2を手動で構築 2. AWS CloudFormationでProvisioned型Aurora MySQLバージョン3を再構築 3. AWS CloudFormationでAurora Serverless v2に移行 4. 負荷試験・障害試験負荷試験障害試験導入により得られた効果柔軟なスケーリングインフラコスト最後に Aurora Serverless とは Aurora
- aws
- aurora
- あとで読む
- serverless
- MySQL
SRE/DevOps/Kubernetesを追いかけてきた2020年をふりかえる - 運び屋 (A carrier(forwarder) changed his career to an engineer)
- 97 users
- hakobiya.hatenablog.com
- テクノロジー
- 2020/12/20
ここで話すことここで話さないこと SRE/DevOps/Kubernetesをテーマにブログを書き始めた理由気をつけていることオススメWebページ7選 The Blameless Blog Netflix Technology Blog Facebook Engineering Datadog blog The GitHub Blog Julia Evans The Kubernetes Podcast from Google ブログによる変化反響やってみて思ったこと異動による変化(2020年4月) コミュニティー活動による変化今後の目標＆告知これはエーピーコミュニケーションズ Advent Calendar 2020 の20日目の記事です。自身の中で多くの変化があった2020年をふりかえりつつ、タイトルにあるテーマ(SRE/DevOps/Kubernetes)を追いか
- SRE
- あとで読む
- kubernetes
- DevOps
- 考察
- programming
メールシステムのリバースプロキシに Nginx を使っているのでご紹介 - Pepabo Tech Portal
- 97 users
- tech.pepabo.com
- テクノロジー
- 2023/05/19
こんにちは。最近、ピストのチェーンを和泉チエン TOUGH GUARD に替えて、ご機嫌な原口です。ホスティング事業部の MRE（Messaging Reliability Engineering ＊ペパボの造語です）というチームで、 SRE ような取り組みを、DNS やメールなどのメッセージングサービスに対して実施しています。今回は、弊社のホスティングサービスで提供しているメールシステムについてご紹介いたします。メールシステム構成弊社のホスティングサービスで提供しているメールシステムは、運用効率化やメールサーバーリプレイス時のダウンタイム削減のため、リバースプロキシを導入しています。このリバースプロキシについては、過去、dovecot や Courier-IMAP などを利用していましたが、現在は Nginx に変更しています。メールシステムで Nginx を利用している
- nginx
- mail
- あとで読む
- メール
- 認証
- サーバ
- システム
- web制作
意識低い系エンジニアは被害者？人材不足のIT業界でさえ「気軽に退職したら次はない」 - エンジニアtype | 転職type
- 97 users
- type.jp
- テクノロジー
- 2024/06/27
〝流しのEM〟として、複数企業の採用・組織・制度づくりに関わる久松剛さんが、エンジニアの採用やキャリア、働き方に関するHOTなトピックスについて、独自の考察をもとに解説。仕事観やキャリア観のアップデートにつながるヒントをお届けしていきます！この春、話題になった「退職代行サービス」。IT業界でも利用した人・された人は少なくないだろう。やむにやまれぬ事情で利用する人の陰に隠れて、すっかり辞めグセをこじらせてしまった人もいるかもしれない。社内での出世はおろかエンジニアとしての成長意欲にも乏しく、居心地が悪くなったら転職を繰り返す……そんな「意識低い系エンジニア」に対し警鐘を鳴らすのが久松剛さんだ。彼らにどんな末路が待っているのか聞いてみた。博士（慶應SFC、IT）合同会社エンジニアリングマネージメント社長久松剛さん（@makaibito） 2000年より慶應義塾大学村井純教授に師事
- 転職
- あとで読む
- キャリア
- 考え方
- 仕事
- 感想
- エンジニア
- IT
これでよいのか: SRE チームの成熟度評価について考える | Google Cloud 公式ブログ
- 97 users
- cloud.google.com
- テクノロジー
- 2021/07/01
※この投稿は米国時間 2021 年 6 月 19 日に、Google Cloud blog に投稿されたものの抄訳です。 Google の顧客信頼性エンジニアは、Google Cloud のお客様の組織で実践を支援するよう選任された、Google サイト信頼性エンジニア（SRE）です。その仕事の一つに、運用の成熟度を高めるために行う経営陣や SRE チームへのアドバイスがあります。Google はそのディスカッションの多くで、「今やっていることは『SRE の仕事』でしょうか？」あるいは、もう少し実存的不安の響きがする「自分たちを SRE と呼んでもいいでしょうか？」という質問を何度も受けています。この質問には、すでに、SRE ワークブックの実践リストで答えています。しかし、このリストは「SRE とは何か」については詳しいですが、その理由について詳しく述べていないため、SRE とは何かとい
- SRE
- あとで読む
- google
- cloud
- blog
ZOZOTOWNの基幹データベースをリプレースした話 - ZOZO TECH BLOG
- 97 users
- techblog.zozo.com
- テクノロジー
- 2023/03/29
はじめにこんにちは、技術本部SRE部ZOZOSREチームの堀口です。普段はZOZOTOWNのオンプレミスとクラウドの構築・運用に携わっています。またDBREとしてZOZOTOWNのデータベース全般の運用・保守も兼務しております。 ZOZOTOWNではSQL Serverを中心とした各種DBMSが稼働しています。その中でZOZOTOWNサービスの根幹となるいわゆる基幹データベース（以下、基幹DBと呼ぶ）を5年ぶりにリプレースしました。基幹DB群は、商品情報、在庫情報、注文情報、会員様情報、ブランド様情報、配送管理、キャンペーン情報、分析系情報などZOZOTOWNサービスにおけるほぼ全ての情報を管理しているものとなります。リプレースのモチベーションは5年のハードウェア（以下、HWと呼ぶ）保守期限終了およびSQL ServerのEnd Of Life（以下、EOLと呼ぶ）を迎えるため、HW
- db
- あとで読む
- SQL
- database
- ZOZO
- sqlserver
- 運用
- データベース
- サーバ
データエンジニア / Analytics Engineer向けの権限管理のためのTerraform紹介 - yasuhisa's blog
- 96 users
- www.yasuhisay.info
- テクノロジー
- 2023/03/09
これは何? 背景: 権限管理とTerraform 権限管理の対象誰に権限を付与するのかどのスコープで権限を付与するのかどの強さで権限を付与するのか Terraformについて Terraformの概要: 権限管理でTerraformを使うと何がうれしいのか例: roles/bigquery.jobUserを付与してみるコラム: どこでTerraformを実行するか Terraformでの権限管理の例例: データセットの作成例: データセットに対する権限付与サービスアカウントの管理 iam_member関連の注意点: AdditiveとAuthorativeを意識する Terraformで管理されていなかったリソースをTerraform管理下に置く: terraform import Terraformの登場人物 terraform planやterraform applyの
- Terraform
- あとで読む
- bigquery
- iam
- gcp
- データ