並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 13 件 / 13件

新着順 人気順

監視の検索結果1 - 13 件 / 13件

  • オブザーバビリティ研修実践編

    株式会社サイバーエージェント AI事業本部 2024年度エンジニア新卒研修 オブザーバビリティ研修実践編(一部社内向けの内容)

      オブザーバビリティ研修実践編
    • メトリクス、ログ、トレースをうまく使い分けて可観測性を高めよう!

      イベント名: オブザーバビリティ再入門 - 大切さと高め方を知ろう! イベントURL: https://mackerelio.connpass.com/event/316449/ 概要: 可観測性の概念を理解し、OpenTelemetryなどの実装に必要な道具があっても、自分たちのプロダクトやチームにどう適用させていけばよいのかは、自分たちで考え、設計しなければなりません。開発チームがメトリクス、ログ、トレースをどういった基準で採用していくかについて、具体例を用いながらお話します。

        メトリクス、ログ、トレースをうまく使い分けて可観測性を高めよう!
      • Postfixのログ監視で注意すべきSMTPのステータス仕様について - Hatena Developer Blog

        システムプラットフォームチーム SREのid:MysticDollです。 この記事は、はてなの SRE が毎月交代で書いている SRE 連載の5月号です。先月分は id:heleeen さんの Mackerel で行った障害対応演習を紹介します でした。 先月 Platform Engineering Meetup #8 にて 「はてなにおけるメール基盤とDMARC対応」というタイトルで登壇させて頂きました。 speakerdeck.com この記事では資料では紹介しきれなかった、メール送信基盤の監視で気をつけるべきSMTPのステータスの仕様とそれらを踏まえた監視方法について紹介します。 メールのステータス形式 SMTP Reply Code 1桁目 2桁目 3桁目 DSN 1つ目 2つ目 3つ目 Postfixのログからのエラーのメトリクス化 まとめ メールのステータス形式 SMTPにお

          Postfixのログ監視で注意すべきSMTPのステータス仕様について - Hatena Developer Blog
        • 「システム運用の基本と戦略」についてただまとめる

          23卒でバックエンドエンジニアをしているたかしゅんです。(@1341Shun) 先日、株式会社サイバーエージェントAI事業本部の2024年度 エンジニア新卒研修でシステム運用に関する講義を行いました。 そこで話した内容とスライドを完全公開したので、内容について解説します。 90分の内容のため、かなり長いですが、個人的にぜひ一読して欲しい内容になっています。 実際の資料はこちらになります↓ 自己紹介 こんにちは、たかしゅんと言います。2023年度入社で今年で2年目になります。株式会社サイバーエージェントのAIオペレーション室で新規立ち上げをやっております。 入社して最初に広告プロダクトに配属し、PipeCDの導入などのDevOps業務を中心に行なっておりました。 記事もあるのでもしよろしければ、ご覧ください。 2月中旬からAIオペレーション室に移動し、新規立ち上げのインフラ環境の構築からCI

            「システム運用の基本と戦略」についてただまとめる
          • オブザーバビリティの最前線 OpenTelemetryで下げる認知負荷~活用事例4選~ - Findy Tools

            公開日 2024/05/29更新日 2024/06/06オブザーバビリティの最前線 OpenTelemetryで下げる認知負荷~活用事例4選~ 近年マイクロサービスアーキテクチャの普及やクラウドネイティブの普及が進み、システムの複雑性は増す一方です。システムの動作を正確に把握することはますます困難になっており、そのような状況の中で、オブザーバビリティはシステムを安定的に運用するために必要不可欠な要素になってきています。 そして、オブザーバビリティの重要性の認知が高まるにつれて、多くの企業でオブザーバビリティに関するツールの導入も進み始めています。 そのような潮流の中、オブザーバビリティ分野でさらなる大きな可能性を持つプロジェクトがOpenTelemetryになります。 本記事では、OpenTelemetryとは一体どんなものなのか、そして実際にOpenTelemetryの導入・活用に成功し

              オブザーバビリティの最前線 OpenTelemetryで下げる認知負荷~活用事例4選~ - Findy Tools
            • EUデジタル市場法:ビッグテックからの返答「クソくらえ」 | p2ptk[.]org

              以下の文章は、電子フロンティア財団の「Big Tech to EU: “Drop Dead”」という記事を翻訳したものである。 Electronic Frontier Foundation 欧州連合の新しいデジタル市場法(DMA)は複雑で多面的な規制だが、その本質は、一般市民がテクノロジーをコントロールしやすくすることにある。 DMAは、大手の「ゲートキーパー」テック企業に対し、サードパーティのアプリストアを認めるよう義務づけている。つまり、端末の所有者であるユーザは、端末にインストールするソフトウェアの提供者を自分で決められるようになるのだ。 別のルールでは、テックゲートキーパーが他のプラットフォームと相互運用可能なゲートウェイを提供することを義務づけている。これにより、あるチャットサービスの利用を止めて競合サービスに乗り換えても、以前のサービス上の人々とのつながりを維持できる(将来的に

                EUデジタル市場法:ビッグテックからの返答「クソくらえ」 | p2ptk[.]org
              • Datadog でアラート通知の質を向上させるための取り組み

                この記事は毎週必ず記事がでるテックブログ "Loglass Tech Blog Sprint" 44 週目の記事です!1 年間連続達成まで残り 9 週となりました! はじめに はじめまして、2024 年 4 月にログラスにジョインしたエンジニアの石畑です。 まだまだドメインやシステムについて学んでいる最中なのですが、その中でアラート監視・運用周りをより良くできそうだったので、試行錯誤したことをまとめたいと思います。 どんな課題があったのか? ログラスではフロントエンドからバックエンド、インフラに至る全てのログ・メトリクスが Datadog に集約され、横断的に分析・監視できる仕組みが整っています。アラートも Datadog でモニタリングを作成し、「Slack に通知 → ローテションのオンコール担当が対応」という体制が作れています。 しかし、歴史的に積み重なったモニタリングが過剰にアラー

                  Datadog でアラート通知の質を向上させるための取り組み
                • Datadogのグラフにデプロイタイミングを表示する方法 - 世界中の羊をかき集めて

                  Datadogのグラフをみていると、いつアプリケーションがデプロイされたのか気になることがあります。 「レスポンスタイムが急に悪くなってるけどデプロイ影響?」「エラーレートが跳ねるタイミングがあるけどデプロイ影響?」など。 そこでDatadogのグラフにデプロイタイミングを表示する方法を紹介します。 1, Event Overlays機能を使う docs.datadoghq.com 以下の画面のように、表示したいDatadog Eventのクエリを入力します。 するとEvent発生日時がグラフ上に縦線で表示されます。 シンプルな方法ですが、デプロイするタイミングでDatadogにEventを送信する必要があります。 デプロイフローに追加が必要なのでできればDatadog内で完結したいです。 2, Show Overlays機能を使う docs.datadoghq.com ※これを使うにはA

                    Datadogのグラフにデプロイタイミングを表示する方法 - 世界中の羊をかき集めて
                  • SREが明かす!システム監視における動的閾値設定の適応例 / 開発者向けブログ・イベント | GMO Developers

                    お疲れ様です。技術ブログを久しぶりに投稿します。SREチームのキム・ドンヒョンです。 SREチームは、信頼性の高いシステムを提供するため、様々な活動を通じてシステムをサポートしています。その中でもシステムの監視と通知活動は、SREチームの重要な業務の一つです。今回は、サービスの安定性を確保するための重要な活動の一つである閾値設定について詳しく説明します。 基本的な監視と閾値設定 基本的なシステムの監視は、システムのパフォーマンスが特定の閾値を超えたり下回ったりしたときに警告を発することです。こうした監視により、システムは自己フィードバックを受けて安定した正常状態を保つことができます。例えば、エアコンのように室内温度を一定に保つ必要があるシステムでは、温度が一定の範囲を外れるとイベントを発生させたり、必要な動作を行ったりしてシステムの安定性を維持します。このような閾値設定は、システムの特性に

                    • Ruby のクラス拡張を利用して監視の実装をうまく軽量化した話(現場での実装方式検討の例つき) - NTT Communications Engineers' Blog

                      この記事では、Ruby の非同期処理ライブラリである Sidekiq を使って定期実行処理を行う Sidekiq-Cron の監視方法について、チームでの方式検討の様子を交えながらご紹介します。 目次 目次 はじめに Sidekiq-Cron について Sidekiq-Cron の cron job の status の監視 既存の status 監視の問題点 既存の監視の仕組みの問題点 負荷が低い監視の仕組みの検討 案1:全 cron job の status を定期的にダンプし、ダンプ結果を読み取って監視する 案2:Redis を直接参照して cron job の status を読み取る 案3:Sidekiq の GUI の html ページの内容をパースして status を取得 [採用] 案4:Sidekiq の GUI に新しいエンドポイントを実装して、そのエンドポイントから

                        Ruby のクラス拡張を利用して監視の実装をうまく軽量化した話(現場での実装方式検討の例つき) - NTT Communications Engineers' Blog
                      • ネットワーク/システム運用の DX を促進する「性能評価レポート」サービス ‐IBC の 21 年間のノウハウに基づく評価基準でランクを自動判定- | ITシステム性能監視のアイビーシー株式会社(IBC)

                        — ニュース — ネットワーク/システム運用の DX を促進する「性能評価レポート」サービス ‐IBC の 21 年間のノウハウに基づく評価基準でランクを自動判定- アイビーシー株式会社(本社:東京都中央区、代表取締役社長:加藤 裕之、以下 IBC)は、IBC が開発・販売するシステム情報管理ソフトウェア「 System Answer G3 」(以下 G3)のデータを用いて性能評価ランクを付与した「性能評価レポート」サービスを、2024 年 6 月 12 日より提供開始いたしますのでお知らせいたします。本サービスは、同日リリース予定の G3 新バージョン Ver.03.30-01 よりご利用いただけます。 2030 年には日本のIT人材は約 80 万人も不足すると言われ、昨年の平均有効求人倍率1.3倍に対し、IT技術専門職種は 3.8 倍であり、いま現在も深刻な人材不足に陥っており、多くの

                          ネットワーク/システム運用の DX を促進する「性能評価レポート」サービス ‐IBC の 21 年間のノウハウに基づく評価基準でランクを自動判定- | ITシステム性能監視のアイビーシー株式会社(IBC)
                        • IBC、ネットワーク/システム運用の「性能評価レポート」サービスを提供

                            IBC、ネットワーク/システム運用の「性能評価レポート」サービスを提供
                          • サーバー監視ツール「DataDog」について理解する [特徴・機能・メリット] | sreake.com | 株式会社スリーシェイク

                            「DataDog」はSaaS型の運用監視サービスです。可視性の高さ、横断的なモニタリングであらゆるWebサービスの内部状態を監視してくれます。SREの導入時に検討する企業様も多く、近年注目されているサーバー監視ツールのひとつです。 本記事ではサーバー監視ツールとはどんなものなのか、DataDogの強みや特徴、導入するメリットについて解説していきます。 関連記事:インシデント管理ツール「PagerDuty」とは? サーバー監視ツールとは?DataDogの特徴と導入メリットについてDataDogの特徴DataDogを導入するメリットDataDogの導入支援もお任せください サーバー監視ツールとは? サーバー監視ツールはWebサービスの運用において、サーバーを安定的に稼働させるために必要な指標を監視する製品です。サーバー管理ツールを正しく用いることで、サーバーの可用性を担保することを目的とします

                              サーバー監視ツール「DataDog」について理解する [特徴・機能・メリット] | sreake.com | 株式会社スリーシェイク
                            1