SREの人気記事 8件 - はてなブックマーク

1 - 8 件 / 8件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

SREの検索結果1 - 8 件 / 8件

翻訳記事 -「インフラ基盤部門は本当に必要か」に関する議論 - CyberAgent SRG #ca_srg
- 231 users
- ca-srg.dev
- テクノロジー
- 2024/08/04
メディア統括本部サービスリライアビリティグループ（SRG）の石川雲（@ishikawa_kumo）です。 #SRG（Service Reliability Group）は、主に弊社メディアサービスのインフラ周りを横断的にサポートしており、既存サービスの改善や新規立ち上げ、OSS貢献などを行っているグループです。本記
- インフラ
- あとで読む
- oss
- 翻訳
- tech
- IT
- business
- システム
- service
- サービス
はてなで最近実施しているSRE研修の紹介 - Hatena Developer Blog
- 193 users
- developer.hatenastaff.com
- テクノロジー
- 2024/07/31
システムプラットフォームチームで SRE をしている id:masayoshi です。この記事は、はてなの SRE が毎月交代で書いている SRE 連載の7月号です。先月は id:chaya2z さんの AWS ECS で実行するバッチ処理を Cluster Auto Scaling を使ってコスト最適化するでした。今月は、社内で最近始めたSREへの研修についてお伝えします。 SREの研修 SREの研修は新卒入社のSREや、中途採用でインフラエンジニアやアプリケーションエンジニアからSREにジョブチェンジした方を対象に実施しています。 SREの研修は主に以下の2つに分かれます。 SREの原理原則やSLI/SLOに関する研修インフラ構築、運用、CI/CD環境の構築に関する研修基本的にはどちらも受けてもらうことになりますが、受講者の経験によってはどちらかだけになることもあります。ま
- SRE
- あとで読む
- 研修
- 運用
- はてな
- システム
- サーバ管理
- チーム
- hatena
- 開発
今日から始める「システム監視」。大量トラフィックのシステムを安定して運用する知見をアソビューのSREに学ぶ - Findy Tools
- 183 users
- findy-tools.io
- テクノロジー
- 2024/08/16
公開日 2024/08/16更新日 2024/08/15今日から始める「システム監視」。大量トラフィックのシステムを安定して運用する知見をアソビューのSREに学ぶはじめにアソビュー株式会社では、アソビュー！という電子チケットを販売するサイトを運営しています。システムを安定稼働させるためには、日常的にシステムの状態を監視して、問題があれば調整するというプロセスを繰り返すことが必要不可欠です。本記事では、アソビュー株式会社において、どのような体制でこの安定稼働を実現しているかということを書くことによって、同じようにシステムを安定稼働させたいと日々考えておられる方々を想定読者として、そのノウハウを共有しようと思います。安定稼働をするために必要な要素人間の健康管理のために必要なことシステムを安定稼働するために必要なことというのは、人間が健康に生きていくためにやっておいたほうがいいことと共通
- 監視
- 運用
- あとで読む
- サーバ管理
- SRE
- サーバ
- システム
- monitoring
- テスト
障害対応を属人化させない。「全員インシデントコマンダー」体制を根付かせた、山本五十六の格言【NewsPicks SRE 安藤裕紀】 | レバテックラボ（レバテックLAB）
- 146 users
- levtech.jp
- テクノロジー
- 2024/08/26
TOPインタビュー障害対応を属人化させない。「全員インシデントコマンダー」体制を根付かせた、山本五十六の格言【NewsPicks SRE 安藤裕紀】障害対応を属人化させない。「全員インシデントコマンダー」体制を根付かせた、山本五十六の格言【NewsPicks SRE 安藤裕紀】 2024年8月26日ユーザベース NewsPicks事業 SREチームリーダー安藤裕紀大手SIerで10年半エンジニア/アーキテクトとしてアプリケーション開発、インフラ構築、クラウド活用コンサルティングなど大企業の技術支援を行った後、2021年10月に株式会社ユーザベースに入社。プロダクト開発組織のSREチームでインフラや開発基盤を担当。シニアエンジニア、テックリードを経て、チームリーダーに。2024年からはプラットフォームエンジニアリングのグループマネージャーも兼務。 X Docswell GitHub
- 障害
- あとで読む
- エンジニア
- sre
- incident
- 開発
- ドキュメント
- 運用
- IT
Terraform担当大臣 - laiso
- 135 users
- laiso.hatenablog.com
- テクノロジー
- 2024/08/21
“Platform Engineering”という私的よく見かけるが意味を調べたことのない用語No.1のトピックについて書かれた本がO'Reillyからearly releaseされているので読んでる。まだ第一部しか公開されてない。 learning.oreilly.com その中に出てくるアプリケーションチームがTerraformコードを管理することで起きがちな問題について共感したので紹介するアプリケーションエンジニアリングチームがIaaSクラウドのあらゆるものを求めるようになったとき、多くの企業は、各チームに独自のクラウドインフラストラクチャを独自の構成でプロビジョニングする権限と責任を与えることが、摩擦の少ない方法だと判断しました。実際には、これは、構成管理とインフラストラクチャプロビジョニングに精通した、兼業のクラウドエンジニアリングチームになることを意味していました。繰り返
- terraform
- あとで読む
- IaC
- インフラ
- book
- development
- 開発
SLI、SLO、エラーバジェット導入の前に知っておきたいこと | sreake.com | 株式会社スリーシェイク
- 130 users
- sreake.com
- テクノロジー
- 2024/07/30
1. はじめにこんにちは、「信頼性は可用性ではない」を標語にしているnwiizoです。近年、サービスの信頼性向上に向けた取り組みとして、SLI（Service Level Indicator）、SLO（Service Level Objective）、エラーバジェットという概念が注目を集めています。これらは、Google発祥のSRE（Site Reliability Engineering）プラクティスの中核をなす考え方であり、多くの組織がこのアプローチを採用し始めています。また、関連するツールも成熟し始めており、実践的な導入がより容易になってきています。本ガイドでは、SLI、SLO、エラーバジェットを導入する前に知っておくべき重要なポイントについて詳細に解説します。各概念の定義から実践的な導入ステップ、さらには組織文化の変革まで、包括的な情報を提供します。 2. SREにおける基本
- SRE
- あとで読む
- SLO
- サービス
- web
- *あとで読む
500万人が利用する「友達と遊べるたまり場アプリパラレル」におけるデータベース基盤の継続的改善
- 124 users
- speakerdeck.com/yoheimuta
- テクノロジー
- 2024/08/04
SRE NEXT 2024 の発表資料です。 https://sre-next.dev/2024/schedule/#jp041 『友達と遊べるたまり場アプリパラレル』では、クラウドベンダーによる不定期メンテナンスや季節イベントによるアクセス急増によってデータベースが不安定になり、最終的にサー…
- db
- あとで読む
- mysql
- データベース
- SRE
- パフォーマンス
- アプリ
- 感想
- performance
工学としてのSRE再訪 / Revisiting SRE as Engineering
- 112 users
- speakerdeck.com/yuukit
- テクノロジー
- 2024/08/03
SRE NEXT 2024 IN TOKYO.