A new tool that blends your everyday work apps into one. It's the all-in-one workspace for you and your team
みなさん、監視作ってますか? システムを作ったら、そのシステムを監視していく必要がありますよね。どうやったら「いい監視」が作れるのでしょうか。「いい監視」とそうでない監視との違いとは、いったいなんでしょうか。 今の時代、「監視」ではなくて「可観測性」、 Observability (o11y) の時代になっていて、良いプラクティスや考え方が色々とあります。 この記事は、監視や o11y についての考え方を社内に共有するため書いたものを、社外共有用に調整し直したものです。新しい Observability の時代を、一緒に生きていきましょう。 監視を作ろう あなたはシステムを作りました。そのシステムに「監視」をつけようと思ったとき、最初にすることはなんでしょうか? まずは、システムを何らかのツールで監視するところから始めましょう。やらなきゃはじまらない。 Nagios, Cacti, Mun
What's new in Zabbix 6.0 LTS The release delivers additional value to Business Service providers, DevOps, and ITOps teams, improves the overall monitoring workflow, and provides new insights on many different levels. Get a quick overview of the most notable features available in Zabbix 6.0. ビジネスサービス監視の機能拡張 これまであった「サービス」機能の大幅な機能拡張により、サービス監視を利用してビジネスレベルの監視を実現できます。ビジネスサービス監視機能(BSM)は、サーバークラスタ、ロードバランサー
概要 こんにちは、@sshota0809 です。 本記事は Uzabase Advent Calendar 2021 の 7 日目の記事となります。 昨今、SRE の文化を取り入れたり組織を新たに作ったりと様々なチャレンジをする会社が増えていると思います。 また、その中で SLA/SLI/SLO といったサービスに対する指標の策定、運用にチャレンジをする方たちも多いと思います。 今回は、SLI/SLO を定義及び運用するプラクティスの 1 つとして GCP の Cloud Monitoring を使った方法を紹介します。 TL;DR GCP の Cloud Monitoring には SLI/SLO を定義できる機能がある ドキュメント 定義した指標に対してエラーバジェットのバーンレートベースのアラートも定義することができる 各種設定は Terraform のモジュール を使うと簡単 GC
本当にサービスの運用できてますか!?運用監視を学べるAWS Observability Workshopを開催しました! 技術本部 サービスリライアビリティグループ(SRG)の柘植(@shotaTsuge)です。 #SRG(Service Reliability Group)は、主に弊社メディアサービスのインフラ周りを横断的にサポートしており、既存サービスの改善や新規立ち上げ、OSS貢献などを行っているグループです。 本記事は、サイバーエージェントグループと他複数社向けに特別開催したAWS Observability Workshopの開催レポートになります。本記事を通して、運用とは何なのかを改めて考えるきっかけとなれば幸いです。 Day1 Day1では、「サービスを動かし続けるために何が必要か」というタイトルで、 運用とは何なのか Amazonでの運用例 AWS環境では、どのように運用す
はじめに こんにちは。BtoB開発チームの中島です。Fulfillment by ZOZO(以下、FBZ)で提供しているAPIシステムの開発・運用を担当しています。 FBZの運用では、エラーログ発生時にアラートを通知させ、エラー内容をチェックして対応要否を判断しています。しかし、アラート通知が多すぎると運用負荷が高くなったり、重要なアラートを見落とすリスクもあるため、適切な量で通知することが重要になってきます。 本記事では、FBZで実施した例を紹介しながらアラート通知の最適化について解説します。 FBZにおけるサービス監視 FBZでは、ログ解析によるサービス監視を実施しています。 AWS Lambda(以下、Lambda)から出力されたログを解析し、外部サービスのPagerDutyやDatadogに連携して監視しています。必要に応じてフィルタリングを行い、ログの通知量を都度調整しながら運用
Zabbix では4.0以降 スクリーンではなくダッシュボードへの新機能追加が行われるようになっています。 ダッシュボードのグラフウィジェットなら、これまでZabbixのテンプレートで設定していたグラフでは出来なかったような様々な分析が行えるようになりました。 クラシックグラフ 以前から存在するホストやテンプレートに紐付くグラフはクラシックグラフと呼ばれます。 クラシックグラフでは具体的にアイテムを指定してグラフを作成します。 なお、グラフの中でワーキングタイムを表示する機能はクラシックグラフのみの機能となります。新しいグラフウィジェットではワーキングタイムの設定は反映されないので、ダッシュボードでクラシックグラフとグラフウィジェットを縦に並べるのをお勧めします。 Zabbix 4.0以降のダッシュボードウィジェット Zabbix 4.0から新しくスクリーンではなく、ダッシュボードというグ
クックパッドでデータにまつわるあれやこれやをずっとやってる佐藤です。分析・調査に仮説検証にデータパイプラインにと色々やってました。ちなみに先日はCyberpunk2077休暇をとるなどという呑気なことをしていたら、この記事でやりたかったことがほぼできそうなサービスがAWSから発表されて頭を抱えながら書いています。 そのログはどこまで信頼できるのか クックパッドではサービス改善のためにWebサイトやアプリからログを収集して開発を行っています。これらのログは集計された後、ダッシュボードの形で可視化されてサービス開発者たちの意思決定を支えています。 クックパッドのログ基盤はログ送信側(クライアントサイド)もログ格納側(DWHサイド)も十分に整っており、いつでも必要であれば簡単にログを送信・集計するだけの仕組みができあがっています。 アプリログにおける大雑把なログ収集の図 (注:例として上図を載せ
Tempus, a genomic testing and data analysis company started by Eric Lefkofsky, who previously founded Groupon, debuted on Nasdaq on Friday, rising about 15% on the opening. The company priced… The tech layoff wave is still going strong in 2024. Following significant workforce reductions in 2022 and 2023, this year has already seen 60,000 job cuts across 254 companies, according to independent lay
エンジニアの鎗水です。 ABEJA Platformの機能は様々なAPIによって支えられています。 今回はそれらのAPIに対し行っている外形監視について紹介します。 今回紹介する外形監視は、ユーザーの利用シナリオに沿って行われます。 ABEJA Platform上の特定のresourceの作成、更新、削除といった一連の作業をユーザーが正しく行えるかという視点でテストを行います。 1. 構成 AWS Step Functions AWS Step Functionsは、複数のLambdaを組み合わせてワークフローを組むことができるサービスです。 ワークフローはAmazon States LanguageというDSLを使って記述し、実行するLambdaの定義やLambdaのリトライ、Lambda間の遷移条件や待ち時間などを設定することができます。 Serverless Serverless F
5. おもな特長 • クラウド特化したモニタニング SaaSの一つ • AWS CloudWatch, Slack などの数多くのインテグ レーション対応 • 時系列でさまざまなメトリクスのグラフが描画で きる • 自分好みのダッシュボードをいつでも作成できる 7. 価格 ($) - 3種類 • Free(無料枠) • ホスト5台まで • 1日のデータのみ • カスタムメトリクス&イベントを利用可能 • Pro(プロ枠)※このプランが基本となります • ホスト500台まで、$15/1host(事前に基本となる制約ホストを申請する必要あり、月の最大稼働台数での課金) • 13ヶ月のデータのみ • すべての機能が利用可能 • Email サポート付き • Enterprise(エンタープライズ枠) 8. 価格 ($) 補足 • AWS インテグレーションを有効にした場合 • デフォルトの場合だ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く