タグ

gcpとobservabilityに関するlufiabbのブックマーク (3)

  • 原因ではなく症状に注目する理由 | Google Cloud 公式ブログ

    ※この投稿は米国時間 2022 年 12 月 17 日に、Google Cloud blog に投稿されたものの抄訳です。 「ユーザーの関心は、動作していない理由ではなく、動作していないことにある。」 もしこれが真実だと考えるなら、なぜユーザーが関心を持っていることをモニタリングしないのでしょうか?どのような経緯で現状にたどり着いたのでしょうか? まず、オペレーション担当者がインフラストラクチャに集中していて、問題が発生しているというお客様からの連絡を待つ従来のモデルを見ていきましょう。最初のうちは、合理的な推測と価値観によって、以下の考え方が直感的に理解できます。 確実さはあいまいさに勝るため、直接的に一番理解していること、つまりインフラストラクチャに焦点を当てたい。 目的は、問題の原因がオペレーション担当者の責任なのか、それとも他にあるのかを把握することである。 インフラストラクチャに

    原因ではなく症状に注目する理由 | Google Cloud 公式ブログ
  • Tail Sampling Processorを使ってAPMの使用量を効率化しよう - YAMAGUCHI::weblog

    はじめに こんにちは、Google Cloudでオブザーバビリティの担当をしているものです。このエントリーはOpenTelemetry Advent Calendar 2022の2日目の記事です。1日目は @katzchang の「OpenTelemetry Collectorでログファイルの更新を取り込む」でした。 さて、みなさんは分散トレースを活用しているでしょうか。分散トレースはマイクロサービスアーキテクチャのみならず、モノリスなシステムにおいてもレイテンシーのボトルネックを発見する上で有用なテレメトリーです。まだ活用されていないという方はぜひ活用していきましょう! 分散トレースのサンプリング 活用されているみなさまにおかれましては、分散トレースの取得において、トレースのサンプリング方法について頭を悩ませていることと思います。テスト環境などではサンプリングレートを100%にして、あら

    Tail Sampling Processorを使ってAPMの使用量を効率化しよう - YAMAGUCHI::weblog
  • Cloud Ops でオブザーバビリティを向上させる 21 の新しい方法 | Google Cloud 公式ブログ

    ※この投稿は米国時間 2020 年 8 月 13 日に、Google Cloud blog に投稿されたものの抄訳です。 Google Cloud で確実にアプリケーションを運用してインフラストラクチャを実行することがどれほど重要であるかについて、お客様からさまざまな声が寄せられています。とりわけ、オブザーバビリティは信頼性のある運用のために欠かせない要素です。Google Cloud 環境の分析情報をすばやく得られるよう、今年に入ってリリースしたオブザーバビリティ スイートである Cloud Operations に 21 の新機能を追加しました。これにより、Google Cloud Console からすべてのオペレーション機能に直接アクセスできます。今日ご案内する新機能では、お使いの環境が Google Cloud、その他のクラウド、オンプレミス、またはその組み合わせのいずれであって

    Cloud Ops でオブザーバビリティを向上させる 21 の新しい方法 | Google Cloud 公式ブログ
  • 1