[B! monitoring] ktykogmのブックマーク

ktykogm id:ktykogm

monitoringに関するktykogmのブックマーク (17)

Observability Cloud documentation
ktykogm 2024/07/01
Observability

monitoring

system

tool

SRE
リンク
GitHub Actions料金 Datadogによる可視化と削減のヒント - KAKEHASHI Tech Blog
開発コストのうちGitHub Actions料金が占める割合は小さい傾向にありますが、組織規模によっては削減の必要があるでしょう。この記事では、主にDatadogを利用した可視化による特定方法と、一般的なコスト削減のヒントを述べます。前提：パフォーマンスを改善する従量課金のアプリケーションではパフォーマンス ≒ コストです。まずは実行時間から改善しましょう。カケハシでは以下のような事例があります。以下の記事も観点洗い出しができるのでおすすめです。この記事では実行時間以外のコスト観点で解説します。実行時間と課金時間の違いを学ぶ GitHub Actionsの最低課金時間(billable time)は1分です。 1秒実行(Run time)でも1分分の料金になりますし、1分2秒なら課金時間は2分です。実行時間が長いものに料金がかかるのは当然として、仕組み上、細かいものでも実行
ktykogm 2023/08/24
FinOps

Datadog

GitHub

monitoring

dashboard
リンク
2021__ICSE__MicroDiag - Fine-grained Performance Diagnosis for Microservice Systems - SRE Researcher Notes
ktykogm 2023/05/06
microservices

AIOps

incident

monitoring
リンク
Mackerelを使ったSLI/SLOによるサービス運用の紹介 - Mackerel ブログ #mackerelio
この記事では、Mackerelを使ったSLI/SLOによるサービス運用を紹介します。 SLI/SLOとは何か SLIの実装 SLOの設定エラーバジェットとはさらに詳しく知るには MackerelでのSLI/SLO運用 SLI/SLOを策定する可用性の計測レイテンシの計測ダッシュボードで定期的に状況を確認する式による監視でモニタリングする SLI/SLOを運用と開発に活用するためにはまとめ SLI/SLOとは何か SLI(Service Level Indicator)とはユーザーに提供したいサービスのレベル(水準)を計測する指標であり、SLO(Service Level Objective)とはSLIの目標値です。サービスレベルを適切に定め、その指標(SLI)を実装・計測し、設定した目標値(SLO)を満たしているかどうかを定期的に確認することで、サービスレベルを適切に改善す
ktykogm 2023/02/02
monitoring

Mackerel

SLO

SRE
リンク
【この記事だけで完結】Lambda+SNSでAWS利用料金をメール通知する【python】 | graffITi
12月 12, 20212月 12, 2022 どもども、AWS学習に個人アカウントを使用することにビビり続けるsaisaiです。みなさん、AWS利用料金は日々モニタリングしておりますでしょうか。AWSは使った分だけ料金がかかるというコスト上の特性から思わぬ高額請求につながりかねない事例が多数あります。起動したリソースの削除し忘れ、設定ミスによる予測金額超過、アクセスキーとシークレットアクセスキーの漏洩による攻撃被害などなど、利便性の裏には常に危険が付き纏います。そこで今回は日々のAWS予測金額を毎日メール通知する仕組みをAWS Lambda, Amazon Cloudwatch Event, Amazon SNSを使用してAWSコンソール画面の操作のみで実現してみたいと思います。 SNSで料金を通知するならAWS請求アラートを利用したら良いのでは？と思われる方もいると思いますが
ktykogm 2023/01/07
FinOps

monitoring
リンク
alertmanager-to-github/pkg/server/server.go at master · pfnet-research/alertmanager-to-github
ktykogm 2022/06/21
monitoring

SRE
リンク
Amazon CloudWatch Synthetics を使用して複数ステップの API を監視する | Amazon Web Services
Amazon Web Services ブログ Amazon CloudWatch Synthetics を使用して複数ステップの API を監視するアプリケーションが増えるにつれて、API やウェブページの数は指数的に増加します。Amazon CloudWatch Synthetics を使用した、複数のステップで構成される HTTP モニタリングは、このような問題の解決に役立ちます。柔軟なスクリプト実行による API の常時監視を実現することは、エンジニアリングチームが SLA を保つ助けになります。この記事では、複数の HTTP エンドポイントを対象とするブループリントを使って、Amazon CloudWatch Synthetics によるアプリケーション監視を行う方法を紹介します。 HTTP ステップは、syn-nodejs-2.2 以上で使用できます。この機能により、複数
ktykogm 2022/05/28
aws

monitoring
リンク
Monitoring our monitoring: how we validate our Prometheus alert rules
Monitoring our monitoring: how we validate our Prometheus alert rules2022-05-19 BackgroundWe use Prometheus as our core monitoring system. We’ve been heavy Prometheus users since 2017 when we migrated off our previous monitoring system which used a customized Nagios setup. Despite growing our infrastructure a lot, adding tons of new products and learning some hard lessons about operating Prometheu
ktykogm 2022/05/23
Prometheus

monitoring

metrics
リンク
Simplify SaaS scale TLS certificate management | Google Cloud Blog
Introducing Certificate Manager to simplify SaaS scale TLS and certificate management We’re excited to announce the public preview of Certificate Manager and its integration with External HTTPS Load Balancing. Certificate Manager enables you to use External HTTPS Load Balancing with as many certificates or domains as you need. You can bring your own TLS certificates and keys if you have an existin
ktykogm 2022/03/04
gcp

monitoring

TLS
リンク
Centralize Logs From Multiple Projects On Google Cloud Platform | DoiT
ktykogm 2022/02/26
GCPで複数のプロジェクトのログを一元化する方法

gcp

monitoring
リンク
Python Sklearnを使ってGridDBのデータから異常値を検出する | GridDB Developers
ktykogm 2022/02/22
monitoring

ML

IoT
リンク
IoTデバイスの死活監視を考える
2022年1月25日にSORACOM UG Online #9 ～新春LT祭り～で、ソラコム CREの三國直樹（mick）が発表した「IoTデバイスの死活監視を考える」の資料です。
ktykogm 2022/02/10
IoT

monitoring
リンク
opentelemetry-collector-contrib/receiver/googlecloudspannerreceiver at main · open-telemetry/opentelemetry-collector-contrib
ktykogm 2022/01/19
gcp

spanner

metrics

monitoring

analyze

statistics
リンク
Managed metric collection for Google Kubernetes Engine | Google Cloud Blog
Better Kubernetes application monitoring with GKE workload metrics Editor’s note (12/15/21): The date that we will begin charging for GKE workload metrics has been rescheduled from December 1, 2021 to February 1, 2022. Please see this page for more information. The newly released 2021 Accelerate State of DevOps Report found that teams who excel at modern operational practices are 1.4 times more li
ktykogm 2021/12/08
monitoring

GKE

Prometheus

kubernetes
リンク
Using OpenTelemetry auto-instrumentation/agents in Kubernetes
ktykogm 2021/11/24
monitoring

k8s

microservices

あとで読む
リンク
Sloth - Sloth
Sloth Prometheus SLO generator Stop using complex specs and processes to create Prometheus based SLOs. Fast, easy and reliable Prometheus SLO generator. Simple: Lightweight, and focused on UX Standards: Based on Google’s SRE book. Plugins: Abstracts and extends SLIs using plugins. One way: Standardizes the SLO implementation. Adaptive: Multiple specs like OpenSLO or Kubernetes CRDs. Prometheus: De
ktykogm 2021/11/22
SRE

monitoring

Prometheus
リンク
SQLを使った監視でデータ基盤の品質を向上させる - MonotaRO Tech Blog
こんにちは、データ基盤グループの吉田(id:syou6162)です。データ基盤グループでは安定してデータを利用できるように様々な取り組みを行なっています。本エントリでは、データ品質に問題がある場合にすぐに気付けるようにしたSQLによる監視の仕組みを紹介します。背景 SQLを使った監視基盤の構築実際の監視項目例他チームがdailyで転送しているデータがバッチの失敗により遅れていないか BigQueryのエラーレートが急激に増加していないか承認済みビューの設定が意図せず消えていないか今後の展望背景データ基盤の運用をしていると、日々様々なトラブルと向き合う必要があります。例えば、以下のようなものがあります。他チームがdailyで転送しているデータがバッチの失敗により遅れている TerraformなどのIaCで承認済みビューの権限管理を行なっているが、コードの設定ミスで意図せぬ状態
ktykogm 2021/08/24
SQL

monitoring
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx