ssmjp ssmonline #38 "第四回はたのさん祭 オンライン"( https://ssmjp.connpass.com/event/307397/ )での発表資料です。 (運用設計ラボ合同会社 波田野裕一)
DevOpsの導入によって、開発エンジニアがサービスの信頼性と可用性に対する責任を負い、オンコール対応に携わるようになりました。オンコールは重要な職務ですが、精神的な負荷が大きいため不安を感じる方も多く、いわゆる「燃え尽き症候群」に陥る方も生じます。 そこで今回は、PagerDutyコミュニティのメンバーから寄せられた、オンコール対応の不安を取り除く方法や、オンコールローテーションに臨む際のアドバイスをご紹介します。ぜひ、今後の参考にしてください! インシデント管理における「オンコール対応の重要性」オンコールとは、勤務時間外を含めて緊急対応が必要なインシデントに対応できるように、対応者や担当時間を決めておく仕組みです。 現在は、24時間365日稼働が前提となるシステムが多いなか、サービスの信頼性を守るには迅速なインシデント対応が求められます。仮にサービスが停止することになれば、機会喪失や顧
技術本部Strategic Products Engineering Unit Contract One Devグループの伊藤です。契約データベース「Contract One」の開発に携わっています。 Contract Oneでは、GPTを活用した機能をいくつか提供しています。 今回は、Contract OneのGPTを活用した機能開発のために、LLMOpsの取り組みの一環としてLangfuseを導入し始めた話をします。 なお、本記事は【Strategic Products Engineering Unitブログリレー】という連載記事のひとつです。 buildersbox.corp-sansan.com はじめに Contract Oneでは、GPTを活用した文書内検索 *1 と要約機能 *2 を約1年前にリリースし、現在も提供しています。 GPTは自然言語形式の入力をAPI形式で処理でき
髙橋洋一vsChatGPTはメンバーシップで配信中! 入会は以下よりお願いします。 https://www.youtube.com/channel/UCECfnRv8lSbn90zCAJWC7cg/join メンバー企画「悩み相談」募集中です。 以下のURLよりぜひどうぞ! https://forms.gle/11fnCxEaLNUmYnj68 サブチャンネル 映画の話チャンネル https://www.youtube.com/channel/UC96k9Yf5CFVlIY1i_JaEsGw?guided_help_flow=3 ニコニコ ーーーーーーーーーーーーーーーーーーー ▼髙橋洋一ライブチャンネル https://ch.nicovideo.jp/takahashiyoichi ▼チャンネルの入会はこちら! https://ch.nicovideo.jp/takahashiy
信頼性の追求というのは、決して完璧を求めることではありません。完璧な可用性を追求するのではなく、ユーザーの満足と、限りあるリソースのバランスを取ることこそが重要です。このバランスを取るための一つのツールが、SLO(Service Level Objectives)です。 はじめに 「Implementing Service Level Objectives」は、現代のソフトウェアサービス管理において不可欠な概念の一つであるSLO(Service Level Objectives)の実装と運用に関する包括的なガイドブックです。本書は、SLOの基本概念から実践的な導入方法、組織文化への浸透まで、幅広いトピックをカバーしています。このSRE本がすごい!2024年版でも紹介しているようにSREやインフラエンジニアの方が必読の一冊だと思います。 Implementing Service Level
社内のITシステムやネットワークを安定的に稼働させ、日々の業務を滞りなく行うためには、システム運用設計が必要です。とはいえ、『運用設計』とひとことで言っても、何をやれば良いのか、そもそもなぜ運用設計を行うべきなのかなどが分からず、手がついていないといったこともあるでしょう。そこで、本記事ではシステム運用設計の種類や行う理由、運用設計の流れやポイントについて解説します。 運用設計とは 運用設計とは、システムを安定して運用していけるよう、日常的に行うべき業務や運用ルール・運用方法、障害が起こったときの対応などをあらかじめ決めておくことです。システムが正常に動いているかをどう監視するのか、定期的にチェックする方法、インシデントを検知したときどんな手順で対処するか、どの部署や外部業者に連絡するか、などが該当します。 全体の流れを見ながら運用設計を進めることで、システムの定常的な安定稼働を助けます。
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く