[6ページ] SREの人気記事 234件 - はてなブックマーク

201 - 234 件 / 234件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

SREの検索結果201 - 234 件 / 234件

SRE Magazine - 001号（2024/04/01）
- 124 users
- sre-magazine.net
- テクノロジー
- 2024/04/01
巻頭言：SRE Magazineを始めました書いた人：しょっさん（ @syossan27 ） SRE Magazineの発刊についての想いなどを書いてます。ばばさんがお勧めする「SRE入門」と「SRE入門の入門」に効く書籍や文章書いた人：ばば/netmarkjp さん（ @netmarkjp ） SRE入門に効く書籍や文章を紹介しています。非常時の可用性をフィーチャーフラグで保つアイディア書いた人：iwamot さん（ @iwamot ）アクセス急増などの非常時でも可用性を保つ手法に「緊急レバー」があります。この記事では、緊急レバーの実装にフィーチャーフラグを用いるアイディアを提示します。 SIEMってサイトの信頼性向上に寄与するの？書いた人：Yuta Kawasaki（ゆーた）さん（ @yuta_k0911 ） SIEM on Amazon OpenSearch Servi
- SRE
- あとで読む
- チーム
- インフラ
- media
Summary of June 8 outage
- 122 users
- www.fastly.com
- テクノロジー
- 2021/06/09
Summary of June 8 outageWe experienced a global outage due to an undiscovered software bug that surfaced on June 8 when it was triggered by a valid customer configuration change. We detected the disruption within one minute, then identified and isolated the cause, and disabled the configuration. Within 49 minutes, 95% of our network was operating as normal. This outage was broad and severe, and we
- fastly
- incident
- 障害
- あとで読む
- cloud
- trouble
- network
インシデントレスポンスを自動化で支援する Slack Bot で人機一体なセキュリティ対策を実現する
- 122 users
- speakerdeck.com/hiboma
- テクノロジー
- 2021/11/04
インシデントレスポンスを自動化で支援する Slack Bot で人機一体なセキュリティ対策を実現する https://event.cloudnativedays.jp/cndt2021/talks/1260
- sre
- slack
- security
- あとで読む
- management
- 運用
- セキュリティ
- incident
- bot
Four Keysを用いた改善活動のアンチパターンと、本質的な改善のために必要な「なぜ？」 - Agile Journey
- 121 users
- agilejourney.uzabase.com
- テクノロジー
- 2023/09/28
Agile Journeyをご覧のみなさん、はじめまして。株式会社リンクアンドモチベーションの川津（@KawatsuYusuke）です。こちらの記事では主に私たちがFour Keys メトリクスを元に、開発生産性向上を目指した活動に関する話題についてお伝えします。と言っても、『LeanとDevOpsの科学』をはじめ、Four Keysの運用に関するトピックはすでに多く語られています。また、Four Keysは便利なメトリクスであるがゆえに、ときに「Four Keysを改善する」という手段が目的化してしまうことがあります。本稿では主にこれから開発生産性向上に取り組もうとしている方に向けて、私たちの取り組みと、体験したアンチパターンをもとに、「Four Keys改善の取り組みには "なぜ？" が大事」についてお伝えします。私たちの開発生産性向上のはじまりと、目指すべき状態の設定 Four
- devops
- あとで読む
- SRE
- agile
- 開発
- テスト
- management
- data
AWS リソース管理の Terraform 移行 - クックパッド開発者ブログ
- 121 users
- techlife.cookpad.com
- テクノロジー
- 2020/02/28
技術部 SRE グループの鈴木 (id:eagletmt) です。クックパッドでは Codenize.tools を用いて様々なリソースをコードで管理してきましたが、現在では大部分が Terraform へと移行しています。Terraform の使い方等については既に沢山のドキュメントや紹介記事があるので本エントリでは触れず、なぜ Terraform へと移行しているのか、どのように Terraform を利用しているのかについて書いていきます。 Terraform 移行の理由クックパッドでは自分と同じく SRE グループに所属している菅原 (id:winebarrel) によって開発された Codenize.tools のツール群を利用して IAM、Route 53、CloudWatch Alarm、CloudWatch Events 等をコードで管理し、いわゆる GitOps を実践
- terraform
- aws
- cookpad
- あとで読む
- sre
- Amazon Web Services
- DevOps
- インフラ
- MySQL
Aurora MySQL 5.7とRailsで実現する全文検索機能 - dely Tech Blog
- 119 users
- tech.dely.jp
- テクノロジー
- 2023/06/23
こんにちは。クラシル開発部、バックエンドエンジニアの松嶋です。 delyに入社してから約3年間、私はSREチームに所属していましたが、昨年10月にバックエンドに転向しました。バックエンドに転向してからは、主にクラシルアプリの公式レシピおよびCGMコンテンツの検索機能に関する開発・改善に取り組んでいます。クラシルは、2016年2月にサービスを開始してから、管理栄養士監修の「誰でも安全に・おいしい料理を作ることができるレシピ動画」を5万件以上提供してきました。昨年12月には、クラシルのブランドリニューアルを行い、今後はシェフや料理研究家を中心としたクリエイターとともに多様化したユーザーの食の好みや課題解決に応えられるよう、幅広い食のコンテンツを提供するプラットフォームを目指しています。ブランドリニューアルの詳細に関しては、こちらを御覧ください。 www.kurashiru.com この
- MySQL
- あとで読む
- 検索
- Rails
- Aurora
- webサービス
AWSのAZ障害でもサービスを継続させる技術 - ABEJA Tech Blog
- 119 users
- tech-blog.abeja.asia
- テクノロジー
- 2019/12/11
こんにちは。ABEJAのインフラ管理してる村主 @rwle1221 です。本ブログは ABEJA Advent Calendar 2019 の11日目です。今日は、みなさん記憶に新しい2019年8月末に発生した AWS の東京リージョンの AZ 障害について、どのようにしていればサービス影響を与えずにシステムを稼働させられたのか。という話をしたいと思います。振り返り障害の詳細報告はこちら aws.amazon.com 有志によるまとめはこちらから piyolog.hatenadiary.jp 基本は「AZレベルで冗長化していれば問題ない」中の人に聞くと「AZレベルで冗長化していれば問題ない」とのことでした。しかし、2番目の方の記事を見ると有名どころのサービスが割と止まっていました。じゃあ上で紹介されていたような会社がAZレベルの冗長化が出来ていなかったのか。 ※ ALB/WA
- aws
- あとで読む
- 運用
- 障害
- Amazon Web Services
- 機械学習
- trouble
- 技術
[書評]「New Relic 実践入門監視からオブザーバビリティへの変革」は可観測性を学び実践するための一冊 | DevelopersIO
- 117 users
- dev.classmethod.jp
- テクノロジー
- 2021/10/24
こんにちは、臼田です。みなさん、よりよい運用してますか？(挨拶今回は2021年9月15日に発売された書籍「New Relic 実践入門監視からオブザーバビリティへの変革」の書評です。オブザーバビリティ(可観測性)について概念的にも実践的にもわかりやすい図とともに理解でき、特にNew Relicを活用して、単純な監視ではない、ビジネスに貢献するための運用の実践ができる一冊でした。この記事ではこの書籍を読んで感じた、どんな人に向いているか、特に良かったところなどを書いていきます。どんな人に向いているか一言でいうと、「これからNew Relicを触る人、あるいは触り始めた人が活用できる書籍」です。「New Relic実践入門」というタイトルそのままですね。逆に言えば、関連するオブザーバビリティについて理解を深めたい、あるいはNew Relicに限らない監視や運用の考え方を学びたいだ
- 監視
- あとで読む
- DevOps
- 運用
- monitoring
- 書籍
- 入門
- 本
Gitのコミットログに詳細を書く習慣をつけている - freee Developers Hub
- 115 users
- developers.freee.co.jp
- テクノロジー
- 2021/12/16
おはこんばんちは、SREの橋本です。この記事は、freee Developers Advent Calendar 2021の16日め記事となります。わたしがソフトウェアエンジニアとして仕事をするうえで、コミットログを詳細に記述する習慣づけがあり、この機会にその具体例をあえて共有してみます*1。以降はとくに明示しない限り、組織全体でルールがあるわけではなく、あくまでわたしの一個人の意見である点に注意してください。モチベーション freeeでは、Webサービスからインフラ基盤およびその監視設定を含めてコードで管理されており、GitHub上でのPull Requestでのレビューを必須としています。わたし自身は社内の立候補制異動制度*2によってWeb開発の現場とSREを行き来してきましたが、どちらもリファクタリングのためにゼロベースでコードを書き直すこともあれば、機能追加やバグフィックスのた
不要な DNS リソースレコードは消そう / Delete unused DNS records
- 115 users
- speakerdeck.com/wa6sn
- テクノロジー
- 2024/06/07
https://yuru-sre.connpass.com/event/317749/ の LT 資料です
- DNS
- あとで読む
- security
- SRE
- ネットワーク
- セキュリティ
- Network
- 資料
SRE の原則に沿ったトイルの洗い出しとトラッキング | Google Cloud 公式ブログ
- 115 users
- cloud.google.com
- テクノロジー
- 2020/02/21
※この投稿は米国時間 2020 年 2 月 1 日に、Google Cloud blog に投稿されたものの抄訳です。作業効率を検証するために Google のサイト信頼性エンジニア（SRE）が使用している主な測定指標の一つが、日々の時間の使い方です。長期間のエンジニアリングプロジェクトのために時間を確保する必要がありますが、エンジニアには Google のサービスを稼働し続ける責任もあり、そこにも手作業が生じることがあります。Google の SRE は、いわゆる「トイル」に費やされる時間を勤務時間の 50% 未満にすることを目指しています。では、トイルとは何でしょうか。トイルに邪魔されずに開発スピードを維持するには何をすべきでしょうか。本稿ではこれらの問いについて見ていきます。まずトイルの定義ですが、『Site Reliability Engineering』の第 5 章には次の
- SRE
- あとで読む
- google
- cloud
- WEBサービス
- blog
監視からオブザーバビリティへ〜オブザーバビリティの成熟度/From Monitoring to Observability - Maturity of Observability
- 115 users
- speakerdeck.com/newrelic2023
- テクノロジー
- 2023/07/21
2023/5/23開催「オブザーバビリティ最前線〜事例LTから学ぶ、オブザーバビリティの成熟度〜」
- monitoring
- 監視
- あとで読む
- observability
- SRE
- Slide
STORESを支える「運用週」という仕組み - STORES Product Blog
- 115 users
- product.st.inc
- テクノロジー
- 2020/11/30
みなさんは「保守・運用」と聞くとどのようなイメージをお持ちでしょうか？もしかしたら良いイメージをお持ちでない方もいらっしゃるかもしれません。しかし、売り上げを生み出している既存コードの保守運用はビジネス上、新規機能開発と同等かそれ以上に重要な存在です。保守運用は歴史あるサービスでは欠かせない作業ですが、STORESもその例外ではありません。 STORESの最初のコードが書かれてから、8年の歳月が経ちました。今となってはコードの量も多く、今年(2020年)の8月に入社した私(@zakky)も全体を把握しきれてはいません。 STORESにジョインした最初の1ヶ月間、「商品の在庫数を一括で更新する機能」の開発に私は専念しており、その他の機能のコードを触る機会がほとんどありませんでした。目の前のチケットを消化していくのに必死で、周りを見る余裕が無かったとも言えます。「運用週」との出会い
インフラ構成ツールの「Pulumi 3.0」正式リリース。APIでPulumiを呼び出し可能、クラウドのアップデートに即時対応など
- 114 users
- www.publickey1.jp
- テクノロジー
- 2021/04/22
インフラ構成ツールの「Pulumi 3.0」正式リリース。APIでPulumiを呼び出し可能、クラウドのアップデートに即時対応などコードを用いてクラウドをはじめとするITインフラの構成を定義できる、いわゆるInfrastructure as Codeツールの「Pulumi」が、最新版となる「Pulumi 3.0」として正式リリースされました。 Announcing our new #CloudEngineering Platform (Pulumi 3.0)! Native providers with 100% API coverage Pulumi Packages to share #cloud components Automation API for programmatically deploying infrastructure from code Enterprise-g
スタディサプリENGLISHの基盤をECSからEKSに移行しました | Recruit Tech Blog
- 114 users
- blog.recruit.co.jp
- テクノロジー
- 2020/10/22
こんにちは、スタディサプリ ENGLISH SREグループの大島です。オンライン英語学習サービスであるスタディサプリ ENGLISHは2015年10月のリリース1)当時は英語サプリという名前でリリースしていましたから5年が経ち、おかげさまでサービスを拡充させることができています。リリース当初からインフラにはコンテナを採用し、長い間AWSのコンテナオーケストレーションサービスのAmazon Elastic Container Service（以下、ECS）で運用してきましたが、この度ECSからAmazon Elastic Kubernetes Service（以下、EKS）に移行しました。今回の記事では、その歴史の変遷となぜEKSにしたのかというところを書いていきたいと思います。コンテナと歩んできた5年間まず、ECSからEKSに移行しようと思ったきっかけの前に、インフラの歴史を少し振
- ecs
- eks
- kubernetes
- aws
- あとで読む
- コンテナ
- インフラ
- SRE
カード業界の厳しいセキュリティと開発スピードをどう両立？ Kyashに学ぶAWS活用
- 114 users
- codezine.jp
- テクノロジー
- 2020/08/24
急成長中のスタートアップ企業は、多様なAWSサービスをどう選択・活用し、ビジネス課題を解決しているのでしょうか。本連載では、スタートアップ企業の中でエンジニアリングをリードしている担当者がそのアーキテクチャをひも解き、AWS活用術を紹介していきます。第5回はKyashでSREを担当する上原佑介氏が担当、テーマは「セキュリティ」です。記事の最後には、SAによるポイント解説もあります。（編集部）はじめに株式会社KyashでSREを担当する上原佑介と申します。新卒でインフラエンジニアとしてサーバー構築・運用を経験したのち、Webサービスの運営企業を数社経て、Kyashへ入社しました。現在はサービス全体の信頼性向上を目指して、システム基盤や運用面の改善に取り組んでいます。 Kyashについて Kyashはスマートフォンアプリと連動するVisaカードです。コンビニなどから現金をチャージして使え
- aws
- あとで読む
- kyash
- SRE
- セキュリティ
- 開発
- security
「信頼性」を保ちつつ大規模サービスをリニューアルする / cookpad-tech-kitchen-service-embedded-sres
- 110 users
- speakerdeck.com/rrreeeyyy
- テクノロジー
- 2020/08/21
Cookpad Tech Kitchen #24 5800万人が使うサービスのリニューアルとその技術 ( https://cookpad.connpass.com/event/183385/ ) で、"「信頼性」を保ちつつ大規模サービスをリニューアルする" というタイトルで発表した際の資料です。スライド内のリンクは次のとおりです。 - How SRE teams are organized, and how to get started: https://cloud.google.com/blog/products/devops-sre/how-sre-teams-are-organized-and-how-to-get-started - Design Docs at Google: https://www.industrialempathy.com/posts/design-docs
- SRE
- あとで読む
- cookpad
- サービス
- 開発
- 負荷試験
- slide
- programming
ZOZOTOWNを支えるリアルタイムデータ連携基盤 - ZOZO TECH BLOG
- 109 users
- techblog.zozo.com
- テクノロジー
- 2020/08/27
こんにちは、SRE部MA基盤チームの谷口（case-k）です。私達のチームでは、データ連携基盤の開発・運用をしています。データ基盤には大きく分けて2種類あり、日次でデータ連携してるものとリアルタイムにデータ連携しているものがあります。本記事ではリアルタイムデータ連携基盤についてご紹介します。既存のデータ連携基盤の紹介リアルタイムデータ連携基盤の紹介なぜ必要なのか活用事例の紹介データ連携の仕組みと課題リプレイス後のリアルタイムデータ連携基盤 SQL Serverの差分データの取り方を検討アーキテクチャ概要と処理の流れ Fluentdのプラグインを使った差分データの取得 Dataflowでメッセージの重複を排除 Dataflowで動的にBigQueryの各テーブルに出力 Pub/Subのメッセージ管理イベントログ収集基盤個人情報の取り扱いビルド・デプロイ戦略監視データ
- fluentd
- BigQuery
- あとで読む
- データ
- cloud
- クラウド
- ZOZO
- google
- GCP
- data
スクラムを導入してチーム状態を可視化し持続可能なチームを目指す - ZOZO TECH BLOG
- 109 users
- techblog.zozo.com
- テクノロジー
- 2023/04/05
こんにちは、計測プラットフォーム開発本部システム部SREブロックの市橋です。2021年4月に新たに発足したチームで未経験ながらリーダーを任され、気づけば約2年が経過していました。これまでを振り返ってみると、まっさらな状態から安定したチームができてきたと感じています。今回は新米リーダーとして試行錯誤する中で、チーム状態を可視化して健全なチーム運営を目指した話を紹介します。チーム状態の可視化を考えたきっかけリーダーを任された当初、チーム運営上の課題が色々あるのは認識していましたが、どこから手をつけるべきかが自分の中で判然としませんでした。メンバーの時に一個人として感じていた課題も、チーム全体を俯瞰して見た時にどれから優先的に取り組むべきか自信を持って判断できませんでした。まるで大海原のど真ん中にいきなり放り出された感覚でした。そんな悩みを抱えていた時、全社に導入されているWevoxのアン
- スクラム
- あとで読む
- SRE
- scrum
- team
- アジャイル
- チーム
- 開発
SRE Practices in Organizations
- 106 users
- speakerdeck.com/nari_ex
- テクノロジー
- 2021/11/16
Infra Study 2nd #7「SREと組織」の登壇資料です。 https://forkwell.connpass.com/event/228038/
- SRE
- あとで読む
モダンなシステムにSLI/SLOを設定するときのベストプラクティス
- 105 users
- newrelic.com
- テクノロジー
- 2020/03/31
New RelicではどのようにSLI/SLOを定義し、SREを実践しているか。その経験から、SLI/SLOについて解説した記事 Best Practices for Setting SLOs and SLIs For Modern, Complex Systems の翻訳です。 -- New Relicのサイト信頼性VPであるMatthew Flamingも、この記事に貢献しています。この記事はサンフランシスコその他で行ったFutreStack18での講演「SLOs and SLIs In The Real World: A Deep Dive.」をもとに作られています。 New Relicでは、サービスレベル指標（Service Level Indicator: SLI）とサービスレベル目標（Service Level Objective: SLO）を定義したり設定したりことが、サイト
- SRE
- sli
- monitoring
- slo
- あとで読む
- インフラ
- システム
- サービス
ヘルスケアデータをGrafanaで見たくない…？〜健康 Reliability Engineering〜
- 105 users
- zenn.dev/miketako3
- テクノロジー
- 2024/01/18
Blueskyのフォローお願いします！はじめにまずはこちらをご覧ください。これは私のApple Watchで計測されたヘルスケアデータです。Apple Watchをつけていると、心拍数や歩数、睡眠時間などのデータが自動的にiPhone内に記録されます。 SREなら健康を維持するためにもSLIとSLOを設定して可視化するべきですよね？ SREなら健康エラーバジェットが無くなりそうだったら「今すぐ寝ましょう！」と架電が来て欲しいですよね？普通にやるとiOSアプリを用いて直接ヘルスケアデータを確認することになりますが、Web系のSRE的なエンジニアとしてはやはり業界標準の技術で可視化したいところです。また、iOSアプリを開発するのは専門知識が必要となり非常に骨が折れる作業です。そもそもMacがないとできないですし。そこで、今回は Apple Watchのヘルスケアデータを全自動で良
メドピアのECSデプロイ方法の変遷 - メドピア開発者ブログ
- 105 users
- tech.medpeer.co.jp
- テクノロジー
- 2020/11/24
CTO室SREの侘美です。好きなLinuxディストリビューションはLinux Mintです。メドピアでは現在多数のサービスを運用しており、そのほとんどがAmazon ECSを構成の中核として利用しています。 ECSに対してデプロイを行う方法としては、CodeDeploy、CodePipeline、Copilot（ecs-cli）等があり、CloudFormationやTerraform等のIaCツールで何をどこまで管理するかも合わせて検討する必要があります。どの方法にもメリット・デメリットがあり、Twitterや技術ブログを観測している範囲ではデファクトスタンダードと呼べる方法は未だに無いように思われます。メドピアで最初にECSを利用し始めたのは2018年ころであり、これまで試行錯誤しながらECSのデプロイ方法とタスク定義の管理方法を模索してきました。今回はメドピア社内で試してきた
- ecs
- aws
- デプロイ
- rails
- terraform
- あとで読む
- 開発
「システム運用の基本と戦略」についてただまとめる
- 104 users
- zenn.dev/moko_poi
- テクノロジー
- 2024/06/07
23卒でバックエンドエンジニアをしているたかしゅんです。（@1341Shun）先日、株式会社サイバーエージェントAI事業本部の2024年度エンジニア新卒研修でシステム運用に関する講義を行いました。そこで話した内容とスライドを完全公開したので、内容について解説します。 90分の内容のため、かなり長いですが、個人的にぜひ一読して欲しい内容になっています。実際の資料はこちらになります↓ 自己紹介こんにちは、たかしゅんと言います。2023年度入社で今年で２年目になります。株式会社サイバーエージェントのAIオペレーション室で新規立ち上げをやっております。入社して最初に広告プロダクトに配属し、PipeCDの導入などのDevOps業務を中心に行なっておりました。記事もあるのでもしよろしければ、ご覧ください。 2月中旬からAIオペレーション室に移動し、新規立ち上げのインフラ環境の構築からCI
- SRE
- あとで読む
- 監視
- 運用
- 資料
- システム運用
- devops
- development
- 開発
SRE座談会 - 株式会社はてな
- 104 users
- hatena.co.jp
- テクノロジー
- 2023/11/15
はてなでは、さまざまなチームのSRE（Site Reliability Engineer）が横断的に集まり、技術的な標準化を通じて社内の各チームのSREを支える活動を行っています。チームごとの具体的な取り組みについて、CTOのid:motemenと、SREのid:masayosu、id:taxintt、id:cohalzの3人に語ってもらいました。はてなのSREが取り組む社内技術の標準化とはまずはみなさんの自己紹介、チームでの役割を教えてください。
- sre
- あとで読む
- hatena
- はてな
k6による負荷試験入門から実践まで
- 104 users
- speakerdeck.com/fujiwara3
- テクノロジー
- 2023/06/07
https://techfeed.io/events/techfeed-experts-night-20 TechFeed Experts Night#20 〜 Webパフォーマンス・チューニング最前線 : 前編（概要、モニタリング、負荷テスト編）
Data Management Guide - 事業成長を支えるデータ基盤のDev&Ops #TechMar / 20211210
- 103 users
- speakerdeck.com/yuzutas0
- テクノロジー
- 2021/12/10
---------------------------------------------------------------------------------------- 【PR】一緒に働きましょう！ https://kazaneya.com/kdec ---------------------------------------------------------------------------------------- 「Tech × Marketing Conference 2021 #データマネジメント」基調講演の登壇資料です。 https://techxmarketing.connpass.com/event/229173/ データ活用やDXが注目されている一方で、実際にプロジェクトを進めようとすると「必要なデータが入力されていない」「用途を実現できるほどデータ品質が高
メルペイにおけるマイクロサービス運用の苦労と改善 / CloudNative Days Tokyo2020
- 103 users
- speakerdeck.com/tjun
- テクノロジー
- 2020/09/08
2020.09.08 に CloudNative Days Tokyo2020 で発表した内容です。メルペイの1年半におけるマイクロサービス運用の経験と苦労した事例について紹介しました。
効率的なGo
- 102 users
- www.oreilly.co.jp
- テクノロジー
- 2024/01/30
本書は、Goアプリケーションの効率やスケーリングに関する疑問に対して、実用的な答えを与えてくれる書籍です。レイテンシー、CPU、メモリ資源についての知識、またOSやGoがそれらを抽象化している方法について、またソフトウェアの効率に関わるデータ駆動な意思決定を行う事の意味や、計算量解析の手法、最適化状況の例など、実用的なソフトウェアを開発する中での「効率」に関する知識を紹介します。 Goやその他のモダンな言語で書かれたプログラムを設計、作成、変更するソフトウェア開発者、また誰かが書いたソフトウェアを主に運用するDevOpsエンジニア、SRE、シスアド、プラットフォームチームなどの読者が、いつ、どのように効率最適化を適用するかという問いに答えるための知識を身に付けることができるでしょう。関連ファイル原著者による本書のサンプルリポジトリ正誤表ここで紹介する正誤表には、書籍発行後に気づい
スクラムを1年回して SREと開発組織がどう変わったのか
- 102 users
- speakerdeck.com/licht110
- テクノロジー
- 2020/01/26
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
- SRE
- あとで読む
- スクラム
- scrum
- アジャイル
- 組織
- 開発
東証がSREによるレジリエンス向上に挑む理由。過去のシステム障害から何を学んだのか？（後編）ソフトウェア品質シンポジウム2022
- 102 users
- www.publickey1.jp
- テクノロジー
- 2022/09/28
東証がSREによるレジリエンス向上に挑む理由。過去のシステム障害から何を学んだのか？（後編）ソフトウェア品質シンポジウム2022 9月22日と23日の2日間、一般財団法人日本科学技術連盟主催のイベント「ソフトウェア品質シンポジウム2022」がオンラインで開催され、その特別講演として株式会社日本取引所グループ専務執行役横山隆介氏による「日本取引所グループシステム部門の取組み～システムトラブルからの学びと今後の挑戦～」が行われました。現在、日本取引所グループ傘下の東京証券取引所（以下、東証）は、過去に何度か大きなシステムトラブルを経験し、それを教訓として組織とシステムの改善を続けています。そこで今回、シンポジウム企画委員会からの要望を受けて行われた特別講演で、東証がこれまでのシステム障害から何を学び、そこから何を変化あるいは進化させてきたのか。わずか2年前のNASのハードウェア障害
SREチームがNew Relicを使って AWSコスト最適化に貢献した話 | ドクセル
- 101 users
- www.docswell.com
- テクノロジー
- 2023/06/27
SREチームがNew Relicを使って AWSコスト最適化に貢献した話株式会社ニューズピックス安藤裕紀 NRUG (New Relic User Group) SRE支部 Vol.3 - 2023.6.27(Tue)
クエリログを使ったPostgreSQLの負荷テスト - カンムテックブログ
- 101 users
- tech.kanmu.co.jp
- テクノロジー
- 2022/12/04
SREの菅原です。この記事はカンム Advent Calendar 2022の４日目の記事になります。少し前にサービスで使っているPostgreSQLをRDSからAuroraに移行しました。 Auroraに移行するため色々と作業を行ったのですが、その中でAuroraの性能を測るために行った負荷テストについて書きます。 pgbench まず最初にpgbenchを使って、単純なワークロードでのRDSをAuroraの性能差を測ってみました。*1 以下がその結果です。 MySQLで同様のテストをmysqlslapを使って行ったことがあって、そのときは概ねAuroraのほうが性能が高かったので、同様の結果になると考えていたのですが、RDSのほうが性能が高い結果になったのは予想外でした。ただAuroraのアーキテクチャを考えると、pgbenchのような細かすぎるトランザクションの場合はRDSのほ
- postgresql
- 負荷テスト
- あとで読む
- db
- テスト
- Aurora
- SRE
- benchmark
- mysql
ISUCON入門以前_ISUNARABE_LT#1
- 101 users
- speakerdeck.com/sadnessojisan
- テクノロジー
- 2024/03/13
Babylon.jsと色々なものを組み合わせる：ブラウザのAPIやガジェットや2D描画ライブラリなど / Babylon.js 勉強会 vol.3
- isucon
- あとで読む
- tech
- aws
- web
- performance