開発コストのうちGitHub Actions料金が占める割合は小さい傾向にありますが、組織規模によっては削減の必要があるでしょう。 この記事では、主にDatadogを利用した可視化による特定方法と、一般的なコスト削減のヒントを述べます。 前提:パフォーマンスを改善する 従量課金のアプリケーションではパフォーマンス ≒ コストです。まずは実行時間から改善しましょう。 カケハシでは以下のような事例があります。 以下の記事も観点洗い出しができるのでおすすめです。 この記事では実行時間以外のコスト観点で解説します。 実行時間と課金時間の違いを学ぶ GitHub Actionsの最低課金時間(billable time)は1分です。 1秒実行(Run time)でも1分分の料金になりますし、1分2秒なら課金時間は2分です。 実行時間が長いものに料金がかかるのは当然として、仕組み上、細かいものでも実行
この記事では、Mackerelを使ったSLI/SLOによるサービス運用を紹介します。 SLI/SLOとは何か SLIの実装 SLOの設定 エラーバジェットとは さらに詳しく知るには MackerelでのSLI/SLO運用 SLI/SLOを策定する 可用性の計測 レイテンシの計測 ダッシュボードで定期的に状況を確認する 式による監視でモニタリングする SLI/SLOを運用と開発に活用するためには まとめ SLI/SLOとは何か SLI(Service Level Indicator)とはユーザーに提供したいサービスのレベル(水準)を計測する指標であり、SLO(Service Level Objective)とはSLIの目標値です。 サービスレベルを適切に定め、その指標(SLI)を実装・計測し、設定した目標値(SLO)を満たしているかどうかを定期的に確認することで、サービスレベルを適切に改善す
12月 12, 20212月 12, 2022 どもども、AWS学習に個人アカウントを使用することにビビり続けるsaisaiです。 みなさん、AWS利用料金は日々モニタリングしておりますでしょうか。AWSは使った分だけ料金がかかるというコスト上の特性から思わぬ高額請求につながりかねない事例が多数あります。 起動したリソースの削除し忘れ、設定ミスによる予測金額超過、アクセスキーとシークレットアクセスキーの漏洩による攻撃被害などなど、利便性の裏には常に危険が付き纏います。 そこで今回は日々のAWS予測金額を毎日メール通知する仕組みをAWS Lambda, Amazon Cloudwatch Event, Amazon SNSを使用してAWSコンソール画面の操作のみで実現してみたいと思います。 SNSで料金を通知するならAWS請求アラートを利用したら良いのでは?と思われる方もいると思いますが
Amazon Web Services ブログ Amazon CloudWatch Synthetics を使用して 複数ステップの API を監視する アプリケーションが増えるにつれて、API やウェブページの数は指数的に増加します。Amazon CloudWatch Synthetics を使用した、複数のステップで構成される HTTP モニタリングは、このような問題の解決に役立ちます。柔軟なスクリプト実行による API の常時監視を実現することは、エンジニアリングチームが SLA を保つ助けになります。 この記事では、複数の HTTP エンドポイントを対象とするブループリントを使って、Amazon CloudWatch Synthetics によるアプリケーション監視を行う方法を紹介します。 HTTP ステップは、syn-nodejs-2.2 以上で使用できます。この機能により、複数
Monitoring our monitoring: how we validate our Prometheus alert rules2022-05-19 BackgroundWe use Prometheus as our core monitoring system. We’ve been heavy Prometheus users since 2017 when we migrated off our previous monitoring system which used a customized Nagios setup. Despite growing our infrastructure a lot, adding tons of new products and learning some hard lessons about operating Prometheu
Introducing Certificate Manager to simplify SaaS scale TLS and certificate management We’re excited to announce the public preview of Certificate Manager and its integration with External HTTPS Load Balancing. Certificate Manager enables you to use External HTTPS Load Balancing with as many certificates or domains as you need. You can bring your own TLS certificates and keys if you have an existin
Better Kubernetes application monitoring with GKE workload metrics Editor’s note (12/15/21): The date that we will begin charging for GKE workload metrics has been rescheduled from December 1, 2021 to February 1, 2022. Please see this page for more information. The newly released 2021 Accelerate State of DevOps Report found that teams who excel at modern operational practices are 1.4 times more li
Sloth Prometheus SLO generator Stop using complex specs and processes to create Prometheus based SLOs. Fast, easy and reliable Prometheus SLO generator. Simple: Lightweight, and focused on UX Standards: Based on Google’s SRE book. Plugins: Abstracts and extends SLIs using plugins. One way: Standardizes the SLO implementation. Adaptive: Multiple specs like OpenSLO or Kubernetes CRDs. Prometheus: De
こんにちは、データ基盤グループの吉田(id:syou6162)です。データ基盤グループでは安定してデータを利用できるように様々な取り組みを行なっています。本エントリでは、データ品質に問題がある場合にすぐに気付けるようにしたSQLによる監視の仕組みを紹介します。 背景 SQLを使った監視基盤の構築 実際の監視項目例 他チームがdailyで転送しているデータがバッチの失敗により遅れていないか BigQueryのエラーレートが急激に増加していないか 承認済みビューの設定が意図せず消えていないか 今後の展望 背景 データ基盤の運用をしていると、日々様々なトラブルと向き合う必要があります。例えば、以下のようなものがあります。 他チームがdailyで転送しているデータがバッチの失敗により遅れている TerraformなどのIaCで承認済みビューの権限管理を行なっているが、コードの設定ミスで意図せぬ状態
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く