並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 207件

新着順 人気順

DataDogの検索結果41 - 80 件 / 207件

  • Datadog を使った KARTE 管理画面パフォーマンス改善の取り組み

    KARTE 管理画面のパフォーマンスの監視をするにあたって考えたことや Datadog の活用のポイント、改善で取り組んだことについて紹介します。

    • モニタリングツール「Datadog」で障害 政府向け除く全リージョンで セキュリティ監視・ログ管理などに影響

      モニタリングサービス「Datadog」で、3月8日午後3時半ごろから障害が起こっている。米国やヨーロッパなど、政府向けを除く全リージョンで問題が発生。セキュリティ監視やログ管理機能などに遅延・エラーが見られるという。 関連記事 ChatGPTにKubernetesのアラート対応を教えてもらえる 監視ツールとAIをつなげる「Kubernetes ChatGPT Bot」登場 Kubernetesのモニタリングツールと「ChatGPT」を統合した「Kubernetes ChatGPT Bot」が登場。発生したアラートの内容を自動的に受け取り、対処方法をAIがチャットで教えてくれるという。 Google CloudのPrometheusマネージドサービスが正式版に 6京5000兆のポイントを保持するバックエンド上に構築、事実上無限の指標に対応可能 Google Cloud上で動作する運用監視ツー

        モニタリングツール「Datadog」で障害 政府向け除く全リージョンで セキュリティ監視・ログ管理などに影響
      • セキュリティを後回しにできない――、Datadog JapanがDevSecOpsを実現する3つの新製品を紹介

          セキュリティを後回しにできない――、Datadog JapanがDevSecOpsを実現する3つの新製品を紹介
        • 開発者でも取り組める!発展期のサービスこそ、SLOやDatadogダッシュボードで状態を可視化してメンバーに安心を届けよう - Money Forward Developers Blog

          こんにちは。 2021年10月からマネーフォワード クラウド勤怠の開発チームでSREとして働いています、VTRyo です。 入社2週間経過ブログを書いて以来の登場です。 https://moneyforward.com/engineers_blog/2021/10/28/mf-on-boarding/ 現在の僕は、チーム一人目のSREとして活動しています。せっかくなので、SRE立ち上げ記を綴っていきます。 第1話は 「サービスの状態を可視化して、まずはチームメンバーに安心を与えていこうな」 という話をします。 話さないこと SREそのものについて 具体的な作業ログ 経緯 10月某日。入社オリエンや開発オリエンが終わって徐々にSRE活動を始めることになりました。 必要なチャンネルに一通り招待され、どんなやり取りが発生するかを把握していきます。 そこで、真っ先に気になったのはモニタリングに関す

            開発者でも取り組める!発展期のサービスこそ、SLOやDatadogダッシュボードで状態を可視化してメンバーに安心を届けよう - Money Forward Developers Blog
          • Datadogマニアック機能活用術

            実践事例から学ぶ!あなたの知らないDatadogの世界 登壇資料 https://findy.connpass.com/event/326864/

              Datadogマニアック機能活用術
            • Datadog APMで実現するサーバーレスアーキテクチャの分散トレーシング - ZOZO TECH BLOG

              はじめに こんにちは。ブランドソリューション開発部 プロダクト開発チームの杉田です。Fulfillment by ZOZO(以下、FBZ)が提供するAPIシステムの開発・運用を担当しています。 本記事では、サーバーレスアーキテクチャを採用しているFBZのAPIを例に、Datadog APMを使った分散トレーシングの導入手順と運用する際のポイントを紹介します。 「サーバーレスアーキテクチャを採用しているけど分散トレーシングを導入していない」という方や、「既にDatadogは活用しているけどAPMの機能は使っていない」という方に読んでいただけると幸いです。 FBZにおけるサービス監視 FBZでは、CloudWatchメトリクスやAWS Lambda、API Gatewayのログを解析し、PagerDutyやDatadogなどの外部サービスに連携して監視をしています。最近では、Lambda De

                Datadog APMで実現するサーバーレスアーキテクチャの分散トレーシング - ZOZO TECH BLOG
              • Datadog Dashboard at Scale w/ Terraform | Mercari Engineering

                こんにちは。株式会社メルペイSREチームの@kekeです。 Merpay Advent Calendar の9日目の記事です。 本記事ではスケーラブルなDatadogモニタリングシステムをTerraformによって実現した方法を紹介します。 はじめに すでに多くの発表があるのでご存知の方も多いのではないかと思いますが、メルペイではマイクロサービスアーキテクチャを採用しています。 マイクロサービスアーキテクチャの略図 各マイクロサービスのデベロッパーは責任を持ってそれぞれのサービスを開発・運用しています。 SRE(Site Reliability Engineering)チームはシステムの信頼性を失うことなく高い開発速度を実現できるような仕組みづくりに取り組み、それをデベロッパーに提供しています。メルペイという金融事業の、高い信頼性の実現のためにサービスを横断的にモニタリングをしています。可

                • CREがエンジニアリングで業務効率化をおこなった話 〜Datadogから異常に重いリクエスト数を自動集計〜 - ANDPAD Tech Blog

                  こんにちは。CREの山本です。 今回はCREがエンジニアリングで業務効率化をおこなった話について書こうと思います! 私は誰か 今回初めてブログを書きますので簡単に自己紹介させてください! 2022年にアンドパッドへ入社し約1年半の間、ANDPAD施工管理を担当しています。 前職では自社開発のデータベースの監査アプリケーションやデータベース移行補助ツールなどのテクニカルサポートをおこなっていました。 常日頃「プロダクトと顧客」の間に立つものとして、課題に対して技術的に向き合っています。 大工一筋の父親のもとで育ちましたので、私なりに建築・建設業界の役に立ちたいとアンドパッドで充実した日々と共に業務に励んでいます! 前提 アンドパッドのCREは、外形監視として利用しているDatadogを活用して異常に重いリクエストの確認、集計を行なっています。 そして検知回数、遭遇ユーザー数、全体のログ数など

                    CREがエンジニアリングで業務効率化をおこなった話 〜Datadogから異常に重いリクエスト数を自動集計〜 - ANDPAD Tech Blog
                  • DatadogでECS Fargate TaskのCPU利用率が100%を超えて表示されていたので調べてみた - Classi開発者ブログ

                    こんにちは。開発本部の遠藤です。 ClassiではAmazon ECSをアプリケーション実行環境として利用しています。 ECSの各種メトリクスをDatadogを使ってモニタリングしながら、日々安定稼働しているかどうかをチェックしています。 そのうちの一つの重要なメトリクスとして、ECSのFargate TaskのCPU利用率が過度に高まっていないか、があるのですが、ある時期、CPU利用率が100%を超えてしまっていて「一体なにが起きてるんだ??」と疑問を持ちました。 今回はそれについて深堀りしてみたので、ニッチなトピックですが紹介したいと思います。 ECS Fargate TaskのCPU利用率が100%を超えて表示されている こちらが実際にCPU利用率が100%を超えてしまったときのグラフです。 Datadogのメトリクスは ecs.fargate.cpu.percent です。なお、c

                      DatadogでECS Fargate TaskのCPU利用率が100%を超えて表示されていたので調べてみた - Classi開発者ブログ
                    • DataDog APM を Go の HTTP アプリケーションにフレキシブルに適用する - Nature Engineering Blog

                      ソフトウェアエンジニアの北原です。 Nature ではモニタリングサービスとして DataDog を使用しています。また、DataDog APM を利用し、HTTPアプリケーションとしてのメトリクスの収集を行っています。 DataDog APM として、どのようなことができるかは、クラスメソッドさんの記事も参考になります。 今回は、Nature の API サーバに DataDog APM を適用するにあたり、オフィシャルのライブラリである github.com/DataDog/dd-trace-go パッケージにプルリクエストを出しマージ、リリースされたのでその説明をします。 github.com github.com まず dd-trace-go では、net/http, Gin, Gorilla Mux, Gorm などメジャーなパッケージに対し簡単に導入できるよう準備がされています

                        DataDog APM を Go の HTTP アプリケーションにフレキシブルに適用する - Nature Engineering Blog
                      • DatadogでAPI毎のSQL発行数を可視化してN+1を改善! - Nealle Developer's Blog

                        こんにちはSREチームの宮後(@miya10kei)です。最近、スマートホーム化にハマっていていろいろと買い漁っています🛒 N+1問題を検知するのって結構大変ですよね? 今回はDatadogを使ってN+1問題を可視化し、パフォーマンス改善につなげた話を紹介したいと思います。 ※ 2024/05/29に開催されたJapan Datadog User Group Meetup#4 でもLTしてきました🎤 speakerdeck.com N+1問題とは? N+1問題は主にデータベースへのクエリーを扱う際に出くわすパフォーマンス上の問題です。1つのクエリーでN件のデータを取得した後にそれぞれのデータに対して追加でクエリーが発行されることでパフォーマンスを大幅に低下させます。(1 + N問題と呼んだ方がしっくりくる気がしますが...🤫) 背景 この取り組みを始めた経緯は、システムへのリクエスト

                          DatadogでAPI毎のSQL発行数を可視化してN+1を改善! - Nealle Developer's Blog
                        • Amazon EventBridge(CloudWatch Events)で動かしているバッチをDatadogで監視する仕組みを構築した話 - Classi開発者ブログ

                          開発本部 認証連携チームでエンジニアをしている、id:ruru8net です。 これはClassi developers Advent Calendar 2021の9日目の記事です。 昨日の記事はこちらです。 Hardening 2021 Active Fault 参加レポート - 桐生あんずです 以前のClassi Advent Calender 2019では新卒が入社半年で社内サービスをリリースしてエンジニア楽しいってなったお話を書かせていただきましたが、あれから2年の間に業務の中で様々な経験をし、さらに知識やスキルを身につけていくことができました。 今日はその中でも自分が担当しているサービスの、バッチ監視の仕組みを考えたので紹介させてください。 背景 担当チームでは毎日深夜2時にDBからデータを削除するバッチを動かしています。 他にも社内では様々なバッチが動いていますが、これらを監視

                            Amazon EventBridge(CloudWatch Events)で動かしているバッチをDatadogで監視する仕組みを構築した話 - Classi開発者ブログ
                          • ArgoCDからDatadogに送るログを削減するテクニックと、苦労したこと - LIVESENSE ENGINEER BLOG

                            はじめに ArgoCDを構成するコンポーネントについて ArgoCDのログ量問題に直面した背景 ロギングライブラリが複数あることによる苦労 ログレベルを調整した結果 おわりに はじめに インフラストラクチャーグループの @mom0tomo です。普段はマッハバイトのクラウド移行に取り組んだり、コーポレートサイトのCSS/JSと格闘したりしています。最近、少しずつ転職会議のKubernetes運用にも関わるようになりました。 転職会議では、KubernetesクラスターへのCI/CDツールとしてArgoCDを利用しています。 made.livesense.co.jp ArgoCDにはGUIがあるためアプリケーション開発者も親しみやすいなど利点が多いのですが、デフォルトで出力されるログが多く、必要以上にログデータを生成してしまうと言う問題がありました。とくにDatadogのようなログ分析ツール

                              ArgoCDからDatadogに送るログを削減するテクニックと、苦労したこと - LIVESENSE ENGINEER BLOG
                            • Datadog Continuous Profiler を用いて、ボトルネックが Ruby の GVL であることを発見した

                              Datadog Continuous Profiler を用いて、ボトルネックが Ruby の GVL であることを発見した こんにちは、terandard です。 弊社では Datadog を用いてアプリケーションやサーバーの監視を行っています。 以前からリクエストがスパイクした際にアプリケーション全体が遅延する問題があったので、Datadog Continuous Profiler を使用して調査したことについて紹介します。 背景 リクエストがスパイクするとアプリケーション全体が遅延する問題がありました。 リクエスト全体のリクエスト数とレイテンシー 特に処理に時間がかかっていたリクエストについて Datadog APM で状況を確認すると、下図のように空白期間があったり mysql2 や faraday の実行時間が長いことがわかりました。 例1: 謎の空白期間がある 例2: mysq

                                Datadog Continuous Profiler を用いて、ボトルネックが Ruby の GVL であることを発見した
                              • なぜか遅いAPIをDatadog Continuous Profilerで調べて高速化した話 - LIVESENSE ENGINEER BLOG

                                こんにちは、かたいなかです。 みなさんが関わっているシステムでなぜか遅くて悩まされている処理はないでしょうか? 最近、遅いAPIをDatadog Continuous Profilerを使用して調べました。どのように問題解決までつなげたかを記事にまとめます。 www.datadoghq.com TL;DR 特定のAPIが遅い問題が発覚 Continous Profiler導入 Continuous Profilerで計測してみると・・・ 問題修正 実際のところ まとめ 参考 TL;DR 遅い処理を改善しようと思ったらまずは計測してみること。 計測することで実は単純な問題であったことに気付けるケースがたくさんあります。また、的はずれな推測を元にでたらめな変更を繰り返してしまう事態を防げます。 通常のDatadog APMで原因がわからない場合には、Continuous Profilerで可視

                                  なぜか遅いAPIをDatadog Continuous Profilerで調べて高速化した話 - LIVESENSE ENGINEER BLOG
                                • Datadog、日本に新しいデータセンターを開設 | Datadog

                                  製品 { this.openCategory = category; const productMenu = document.querySelector('.product-menu'); window.DD_RUM.onReady(function() { if (productMenu.classList.contains('show')) { window.DD_RUM.addAction(`Product Category ${category} Hover`) } }) }, 160); }, clearCategory() { clearTimeout(this.timeoutID); } }" x-init=" const menu = document.querySelector('.product-menu'); var observer = new MutationO

                                    Datadog、日本に新しいデータセンターを開設 | Datadog
                                  • Datadog を Kubernetes 上で運用するときのカーディナリティ設定 - たんぶろぐ

                                    先月あたりからこんな事象に悩まされていた。 before この画像は、Kubernetes 上の Deployment に対して一定の負荷 (50 req/s) をかけながら、レプリカ数を変化させたときのグラフである。 Deployment がどのくらいの負荷を受けているのかを見たかったのだが、グラフ化したときに意図した通りにならずモヤモヤしていた。この実験は一定負荷なのでレプリカ数を変えても Deployment 全体で受けている負荷は変わらないはず。それなのにレプリカ数を増やすとなぜか負荷が減っているように表示されてしまう。どうして。 TL;DR Datadog Agent の環境変数 DD_CHECKS_TAG_CARDINALITY に orchestrator を設定すれば解決する。 続き これを最初見たとき、Aggregator 設定をミスっているのかと疑ったが、ちゃんと su

                                      Datadog を Kubernetes 上で運用するときのカーディナリティ設定 - たんぶろぐ
                                    • Rails アプリの重い処理を Datadog APM で改善した話

                                      Leaner 開発チームの黒曜(@kokuyouwind)です。 この記事は Datadog Advent Calendar 2022 の 22 日目です。いよいよクリスマスが近づいてきましたね。 今回は Datadog APM のトレース機能を利用したパフォーマンスチューニングを実施したため、その内容をまとめます。 パフォーマンスチューニングの背景 今回パフォーマンスチューニングの対象にしたのは、外部サービスの商品を横断的に検索する「商品検索 API」です。この API では外部サービスごとに API を呼び出しており、取得したデータの加工や集約などを行っています。 機能を使ってみて確かに重いことはわかっているのですが、どの処理に時間がかかっているのかは判別できていませんでした。このため自分を含むメンバー全員が「外部サービス API 呼び出しが大半を占めており改善はできないだろう」と推測

                                        Rails アプリの重い処理を Datadog APM で改善した話
                                      • サーバレスはAWSの顧客の7割以上、Google Cloudの顧客の6割以上が利用、Datadogの調査結果

                                        サーバレスはAWSの顧客の7割以上、Google Cloudの顧客の6割以上が利用、Datadogの調査結果 モニタリングサービスをSaaSとして提供しているDatadogは、同社のサービスを通じてサーバレスを監視している2万以上の顧客のデータを基にしたサーバレスに関する調査結果を発表しました。 ここでは調査結果の主なポイントを見ていきましょう。 AWSの顧客の7割以上がサーバレスを利用 クラウドを利用している顧客のうち、何パーセントがサーバレスを利用しているかについての調査では、AWSの顧客の70%以上、Google Cloudの顧客の60%が1つ以上のサーバーレスソリューションを使用しており、Azureは49%と僅差で続いています。 サーバレスのプラットフォームには、AWS LambdaやGoogle Cloud Functionsなど、クラウド側であらかじめマネージドなランタイムが提

                                          サーバレスはAWSの顧客の7割以上、Google Cloudの顧客の6割以上が利用、Datadogの調査結果
                                        • 自然言語からインフラ構成コードを自動生成してくれる「Pulumi AI」発表。AWS、Azure、Cloudflare、Kubernetes、Datadogなど130以上に対応 | テクノエッジ TechnoEdge

                                          ITジャーナリスト/Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。 クラウドをはじめとするITインフラの構成をコードで定義する、いわゆるInfrastructure as Codeツール「Pulumi」を提供するPulumi社は、自然言語からインフラ構成コードを自動生成する「Pulumi AI」を含む、AIを活用した新サービス群「Pulumi Insights」を発表しました。 PulumiはTypeScriptやPython、Go、Javaといった一般的なプログラミング言語を使ってインフラの構成コードを記述できるのが大きな特徴です。Pulumi Insightsは、そのPulumiをベースにした拡張機能です。 AIが130以上のインフラやサービスの構成コードを生成Pulumi Insightsの目玉機能が

                                            自然言語からインフラ構成コードを自動生成してくれる「Pulumi AI」発表。AWS、Azure、Cloudflare、Kubernetes、Datadogなど130以上に対応 | テクノエッジ TechnoEdge
                                          • オンプレミスKubernetes環境でのDatadogのデータ欠損を解消した話 - pixiv inside

                                            はじめに こんにちは。インフラ部のlyluckです。 この記事ではオンプレミスKubernetesクラスター環境のデータがDatadogへ送りきれず欠損した現象と、その解消方法について紹介します。 背景 ピクシブでは2023年からオンプレミスKubernetesクラスターが稼働し始めました。 徐々にクラスター上で稼働するサービスが増えつつあります。今では10ノードほどの規模のクラスター上で10程度のサービスが稼働しており、常に300台ほどのPodが起動しています。 クラスターやクラスター上のリソースの監視にはDatadogを利用していましたが、時間帯によっては監視データが欠損することが問題になりました。 リソースの監視に支障をきたしたり、意図しないアラートのトリガーが発生してしまったりしたため、この問題に対応することになりました。 まとめ クラスターチェックランナーを使ってKubernet

                                              オンプレミスKubernetes環境でのDatadogのデータ欠損を解消した話 - pixiv inside
                                            • Datadog Log Management でアプリケーション稼働モニタリング - 一休.com Developers Blog

                                              こんにちは。 システム本部CTO室のakasakasです。 今回は、Datadog Log Management を使ってアプリケーション稼働モニタリングをしている話をしたいと思います。 一休のモニタリング周りの話 インフラのリソースモニタリング 外形監視 モニタリング観点で一休が抱えていた課題 Datadog Log Management Datadog Log Management からダッシュボード作成 Datadog Log Management からアラート作成 必要なメトリクスはカスタムメトリクスを作る graph_snapshot API を使って、デイリーレポート まとめ 最後に 一休のモニタリング周りの話 Datadog Log Management とアプリケーション稼働モニタリングの話をする前に、一休でどのような監視をしているのか?という話を簡単にします。 一休ではD

                                                Datadog Log Management でアプリケーション稼働モニタリング - 一休.com Developers Blog
                                              • Datadog を利用して SLO を管理しよう! #datadog | DevelopersIO

                                                個人的には、この考え方はとても興味深いものです。 SLO は 100% に近いほど良いもので、「目指せ 100% !!」 と考えがちですが、そうではなく障害などによる未達部分を除いた時間を余力・機会とし、本番環境でのリリース作業や改善を施すことが出来る数値的な目安とすることは、関係者間(開発者・運用者・ビジネスサイド)での合意形成をスムーズにさせてくれるはずです。 やってみる Web サービスからの レスポンスタイムを SLI とし、平均 5ms が 1ヶ月で 99.5% 満たすことを SLO とします。 Datadog Synthetics 作成 Synthetics API Test を利用して対象となる Web サービスを外形監視します。(手順は割愛します) Datadog Monitor 作成 SLO を利用するには、Monitor の作成が必要となります。 Monitors >

                                                  Datadog を利用して SLO を管理しよう! #datadog | DevelopersIO
                                                • Postmaster Toolsの迷惑メール率をDatadogで監視する - クラウドワークス エンジニアブログ

                                                  こんにちは。エンジニアの砂川です。 2023年10月頃にGoogle・Yahoo!から新しいメール送信者ガイドラインが出されました。 該当するメール送信者は、ガイドラインに沿っているか確認をし、沿っていない場合は対応する必要があります。 blog.google support.google.com 対応完了しきった皆様、お疲れ様でした。 絶賛対応中の方々、頑張っていきましょう。 ところで皆さんGmailのPostmaster Toolsの迷惑メール率の監視はいかがでしょうか? クラウドワークスではGmailガイドラインで定めているPostmaster Toolsの迷惑メール率を監視し、閾値を超えるとアラートを通知するような仕組みを作り、運用をしています。 この記事では、その仕組みをご紹介します。 なぜ作ったのか 定期的にPostmaster Toolsにログインして監視するのが面倒 (サブ

                                                    Postmaster Toolsの迷惑メール率をDatadogで監視する - クラウドワークス エンジニアブログ
                                                  • The OpenSSL punycode vulnerability (CVE-2022-3602): Overview, detection, exploitation, and remediation | Datadog Security Labs

                                                    emerging vulnerabilities The OpenSSL punycode vulnerability (CVE-2022-3602): Overview, detection, exploitation, and remediation November 1, 2022 emerging vulnerability On November 1, 2022, the OpenSSL Project released a security advisory detailing a high-severity vulnerability in the OpenSSL library. Deployments of OpenSSL from 3.0.0 to 3.0.6 (included) are vulnerable and are fixed in version 3.0.

                                                      The OpenSSL punycode vulnerability (CVE-2022-3602): Overview, detection, exploitation, and remediation | Datadog Security Labs
                                                    • Datadogによるクラウドネイティブなモニタリングの実践 - DMM inside

                                                      Single NodeのDocker Swarmを利用してオンプレミスにデプロイされるGraphQLサーバを安全にローリングアップデートさせている話

                                                        Datadogによるクラウドネイティブなモニタリングの実践 - DMM inside
                                                      • 決済基盤の Observability を向上するための Datadog Dashboard の進化 | メルカリエンジニアリング

                                                        この記事は Merpay Advent Calendar 2023 の 20 日目の記事です。 こんにちは。メルペイの Payment Core チームでバックエンドエンジニアをしている komatsu です。 普段はメルカリ・メルペイが提供するさまざまな決済機能を支えるための決済基盤の開発・運用をしています。 この記事では、我々が開発している決済基盤マイクロサービスである Payment Service を適切に監視するために、Datadog の Dashboard を大きく刷新した背景や方法について紹介します。 Observability と Datadog Dashboards 本題に入る前に、Observability と Datadog Dashboards について簡単に説明します。 Observability はシステムの内部状態を適切に監視し、外部から可視化することでシステ

                                                          決済基盤の Observability を向上するための Datadog Dashboard の進化 | メルカリエンジニアリング
                                                        • DatadogのモニターをTerraformerでインポートして感じたことなど - エニグモ開発者ブログ

                                                          この記事は Enigmo Advent Calendar 2022 の13日目の記事となります。 お疲れさまです。インフラチームの山口です。 弊社では一部インフラリソースのモニタリングにDatadogを利用しています。 その中で、今回はDatadogの利用開始当初にGUIで作成されたモニターをTerraformerとTerraformを使用して構成管理した際の事例について報告します。 同様の技術スタックを使用したインポートや構成管理における具体的なテンプレート等の事例には事欠かないと思いますので、作業計画を中心に説明します。 要は、TerraformerやTerraformの使い方は様々良い資料があると思うため、今回固有の対応をした点を注力して説明します。 本稿の構成を以下に記載します。まず、対象とするモニターの状態などの前提を説明します。次に、作業の流れを概説し、Terraformのディ

                                                            DatadogのモニターをTerraformerでインポートして感じたことなど - エニグモ開発者ブログ
                                                          • 監視SaaSのDatadogをAWSマーケットプレイスで契約してみた | DevelopersIO

                                                            AWSチームのすずきです。 AWSマーケットプレイス で 提供されている AMI や SaaS (Software-as-a-Service) は、 AWS経由で ソフトウェア利用費を支払う事が可能です。 今回、AWSマーケットプレイスで 「Datadog Pro (Pay-As-You-Go)」 を契約し、 月々のAWS利用費と合算する形で、Datadog の 有償ライセンスを必要とする機能(ログ監視)を利用する機会がありましたので、紹介させていただきます。 手順 AWS Marketpace AWSコンソールにログインを済ませたブラウザで、 AWS Marketpace を開き、 検索フォームを利用して「Datadog」を検索します。 プラン選択 「Datadog Pro (Pay-As-You-Go)」 を選択しました。 「Pay-As-You-Go」は前払い料金なし、従量課金でDa

                                                              監視SaaSのDatadogをAWSマーケットプレイスで契約してみた | DevelopersIO
                                                            • Datadog Synthetic Monitoring API Tests で 20 を超えるドメインの SSL を監視した - every Tech Blog

                                                              エブリーで小売業界向き合いの開発を行っている @kosukeohmura です。 昨年、エブリーではネットスーパーの事業を株式会社ベクトルワン様から引き継ぎました。引き継いだシステムを運用していく中で、ネットスーパーの各種サイトや API に使用している 20 個超の SSL 証明書の有効期限を切らさないように更新していく必要があり、そのために監視を導入したお話をします。 引き継ぎ作業の概観については以前公開しました ゼロからはじめるシステム引き継ぎ - every Tech Blog に書きましたので、合わせて御覧ください。 背景とモチベーション システムを引き継いだ時点では SSL 証明書の更新の運用は素朴なものでした。具体的にはエンジニアが有効期限を切らさないようにたまにそれぞれのサイトの有効期限をチェックし、有効期限が近づいたものを発見次第手動で更新作業を行うというものです。抜け漏

                                                                Datadog Synthetic Monitoring API Tests で 20 を超えるドメインの SSL を監視した - every Tech Blog
                                                              • GitHub - SigNoz/signoz: SigNoz is an open-source observability platform native to OpenTelemetry with logs, traces and metrics in a single application. An open-source alternative to DataDog, NewRelic, etc. 🔥 🖥. 👉 Open source Application Performance Moni

                                                                Unified UI for metrics, traces and logs. No need to switch from Prometheus to Jaeger to debug issues, or use a logs tool like Elastic separate from your metrics and traces stack. Application overview metrics like RPS, 50th/90th/99th Percentile latencies, and Error Rate Slowest endpoints in your application See exact request trace to figure out issues in downstream services, slow DB queries, call t

                                                                  GitHub - SigNoz/signoz: SigNoz is an open-source observability platform native to OpenTelemetry with logs, traces and metrics in a single application. An open-source alternative to DataDog, NewRelic, etc. 🔥 🖥. 👉 Open source Application Performance Moni
                                                                • オブザーバビリティ市場の淘汰が進む中、Datadogが成長を続ける理由 (1/2)

                                                                  2023年9月にはCiscoがSplunkの買収を発表、11月には投資ファンドのFrancisco PartnersとTPGがNew Relicの買収完了を発表した。オブザーバビリティ市場における淘汰が進みつつある中、Datadogの今期第3四半期における売上は約20億1000万ドル、前年度比31%増と、独立ベンダーとして順調に成長を続ける。 就任から約4年を経たDatadog Japanのカントリーマネージャー 国本明善氏に、Datadogの成長を支える強みと、日本市場の今後の展開について聞いた。 DatadogのCEOが年次イベントで“ビジョン”を語らないわけ Datadogは、2010年にニューヨークにて創業。現在、グローバルで従業員数は5000名以上となり、ユーザー企業数も2万7000社を超えた。最初はインフラ監視からビジネスを開始し、クラウドの流行に合わせて成長を重ねた。転機とな

                                                                    オブザーバビリティ市場の淘汰が進む中、Datadogが成長を続ける理由 (1/2)
                                                                  • ログ基盤をEFKスタックからDatadog Logsに安全に移行する工夫と効果

                                                                    はじめに 採用管理システム「HRMOS採用」は、企業の採用活動の効率化や採用データの可視化・分析により、採用決定数の向上につなげることができるクラウドサービスです。 この度、HRMOS採用のSREチームでは、技術負債解消のためにログ運用基盤のDatadog Logsへの移行を行いました。その取り組み内容を紹介します。 計画以前のログ基盤構成と課題 サービス開始以降、ログの運用管理はEFKスタック1で構築された基盤を利用していました。サービスが成長にするにつれログ増加などの環境変化も伴い、時間経過とともに様々な課題が生まれてきました。 なお、トラフィックの規模感としては数百万件/日(平日)、数十億件/月ほどログ件数があります。 移行以前のログ基盤の構成イメージを以下に示します。 課題1 インフラの運用負荷が高い OpenSearch の運用負荷 Amazon OpenSearch Servi

                                                                      ログ基盤をEFKスタックからDatadog Logsに安全に移行する工夫と効果
                                                                    • Datadog、東京にデータセンターを開設し、日本リージョンが利用可能に

                                                                        Datadog、東京にデータセンターを開設し、日本リージョンが利用可能に
                                                                      • 退職後にitamae-plugin-recipe-datadog gemのリポジトリを譲り受けました - takanamitoのブログ

                                                                        Speeeで働いている時に作ったgemのリポジトリを退職後に譲り受け、さらにitamae-pluginsのメンテナの方々にowner権限をお譲りしました。 けっこう珍しい話だと思うので経緯を残しておきます。 github.com きっかけはDocker移行 退職者に対するOSSの権限問題 メンテナ探し まとめ きっかけはDocker移行 itamae-plugin-recipe-datadogはdatadog agentをインストールするitamae用のレシピgemです。 自分がSpeeeで働いてた時にAWS EC2でRailsアプリケーションを運用していたので、EC2上でdatadog agentを動かすために作りました。 (自分が初めてリリースしたgemだったので感動した記憶があります) 2016年のリリースから時は経って、数回gemのアップデートをしましたが Docker時代の到来と

                                                                          退職後にitamae-plugin-recipe-datadog gemのリポジトリを譲り受けました - takanamitoのブログ
                                                                        • Javaは他のプログラミング言語と比較してどのくらい危険なのか? Datadog調査

                                                                          Datadogは2024年4月17日(現地時間)に、「State of DevSecOps 2024」と題された分析レポートを公開した。同レポートは、数千のアプリケーションやコンテナイメージ、クラウド環境のセキュリティ評価をまとめたものだ。 Javaは他のプログラミング言語と比較してどのくらいリスクがあるのか? 同レポートによって、Javaアプリケーションは他のプログラミング言語に比べてサードパーティーの脆弱(ぜいじゃく)性の影響を受けやすいことや自動セキュリティスキャナーによって実行されるサイバー攻撃の大部分は無害であることなどが明らかになった。 Datadogが発表したレポートの概要は以下の通りだ。 Javaアプリケーションは、サードパーティーの脆弱性の影響を最も受けている。Javaサービスの90%がサードパーティーのライブラリーによってもたらされた1つ以上の重大または深刻度の高い脆弱

                                                                            Javaは他のプログラミング言語と比較してどのくらい危険なのか? Datadog調査
                                                                          • Datadog使っているけど、Sentryによるエラートラッキング機能が便利という話 - pospomeのプログラミング日記

                                                                            DMMプラットフォームではアラートモニタリングにDatadogを利用しているが、 最近Sentryを導入しようと思っている(自分のチームだけ2年前くらいから先行して導入しているけど、良さそうなので組織全体で利用しようと思っている)。 この記事はDMMプラットフォームのエンジニアにSentryを紹介した際のドキュメントを加筆修正したものである。 Sentryとは? なぜSentryを導入するのか? Sentryの機能紹介 エラートラッキング機能 1. エラーをグルーピングしてくれる 2. グルーピングしたエラーごとに対応優先度を決めることができる 3. グルーピングしたエラーごとにリクエスト情報、クライアント情報を可視化してくれる 4. エラーごとに対応記録(Activity)を管理することができる 5.Datadogでは補足しづらいエラーを可視化することができる アプリケーションモニタリン

                                                                              Datadog使っているけど、Sentryによるエラートラッキング機能が便利という話 - pospomeのプログラミング日記
                                                                            • DataDog カスタムメトリクスを利用したアプリケーションの異常監視 - Giftmall Inside Blog

                                                                              こんにちは。ギフトモール Engineering Managerをやっている @nori0620 です。 はじめに Giftmallではサーバ監視、アラート送信の仕組みに Datadog を導入しています。 Datadogの各種インテグレーションを利用することでEC2, ECS, RDS, ALBといった様々なインフラリソースの監視に利用しており、何か問題の予兆があった際にはSlackに通知を送ってチームが把握できる体制を作っています。 ただ、システムを運用していく上で、インフラ/サーバだけでなく、アプリケーションに近いレイヤーでも監視を行いたいようなニーズがでてきました。例えば「ユーザがログインに失敗した総回数」をモニタリングしておいて不正なログインの試行などが行われていないかを監視するなどです。 このようなアプリケーションレイヤーにおけるモニタリングも既存のDatadogで監視している

                                                                                DataDog カスタムメトリクスを利用したアプリケーションの異常監視 - Giftmall Inside Blog
                                                                              • DogStatsDを使った独自メトリクスのDatadog取り込み検証をローカル環境で実施する - Money Forward Developers Blog

                                                                                クラウド勤怠とクラウド給与で一人プロダクトSREをしているVTRyoです。いつの間にかプロダクトを兼任していて人手が足りません、助けてください。 Datadogに独自メトリクスを取り込むために最初はStaging環境などで検証しようとしたのですが、動くかわからないもののためにエンジニアのコードレビュー時間を取っても勿体ないです。 ローカルでDogStatsDを検証する方法があったので紹介します。 前提 Datadog側が提供している既存のメトリクスでは取得できない、アプリケーション独自のメトリクスを集計する必要がありました。 プロダクト固有の問題に寄り添ったSLIを設定するためには、もはや必須の条件です。 独自のメトリクスをDatadogに送信する方法はいくつかあります。 カスタムAgentチェック DogStatsD PowerShell DatadogのHTTP API 今回はDogS

                                                                                  DogStatsDを使った独自メトリクスのDatadog取り込み検証をローカル環境で実施する - Money Forward Developers Blog
                                                                                • Yakumoのモニタリングとコンテナ時代のDataDog活用例 - Cybozu Inside Out | サイボウズエンジニアのブログ

                                                                                  こんにちは、Yakumoチームの@ueokandeです。 秋といえばモニタリングですよね。 本日はYakumoプロジェクトにおけるモニタリングの取り組みについて紹介します。 YakumoはUS市場にKintoneを展開することをゴールとしたプロジェクトで、その一環として国内のデータセンターで提供しているKintoneをAmazon Web Service (AWS)に移行しています。 つい先日、Yakumoで開発・運用してるKintoneがリリースされました。 本記事では、Yakumoにおけるモニタリングと、YakumoチームでのDataDogの活用例について紹介します。 再入門・監視 監視とは、メトリクス、ログ、アラート、オンコール、障害対応などたくさんのことを扱います。 その中でもメトリクスのモニタリングは、サービスの健康状態を知るための大事な手がかりです。 Webサービスにおけるメト

                                                                                    Yakumoのモニタリングとコンテナ時代のDataDog活用例 - Cybozu Inside Out | サイボウズエンジニアのブログ