タグ

cloudwatchに関するopparaのブックマーク (49)

  • Amazon CloudWatch アラームの大規模なクリーンアップを自動化する | Amazon Web Services

    Amazon Web Services ブログ Amazon CloudWatch アラームの大規模なクリーンアップを自動化する AWS リージョン全体で数千の Amazon CloudWatch アラーム がある中で、リージョンを跨いで価値の低いアラームや誤設定のアラームをすばやく特定したいとお考えですか? 数日間「ALARM」または「IN_SUFFICIENT」状態になっていて、再検討が必要なアラームを特定する方法をお探しですか? 価値の低いアラームをリージョン全体で確認し、定期的に削除してアラームコストを最適化するクリーンアップメカニズムが必要ですか? このブログでは、CloudWatch で価値の低いアラームのクリーンアップメカニズムを AWS アカウントのリージョン全体に大規模にデプロイする方法を探り、さまざまな種類の設定ミスや価値の低いアラームを特定することによって、お客様が

    Amazon CloudWatch アラームの大規模なクリーンアップを自動化する | Amazon Web Services
  • CloudWatch Logsのイベントを期間指定で取得する - Qiita

    CloudWatch Logs CloudWatchに保存されたログはAWSのコンソールで確認する事ができて便利ですが、ログを解析する場合にS3にエクスポートするなど一手間かかります。ログの解析には、私はPythonスクリプトで行う事が多いので、PythonスクリプトでCloudWatchからログを取得するスクリプトの作成を目指します。なお、以下のコードはpython3(3.7.5)で動作させています。

    CloudWatch Logsのイベントを期間指定で取得する - Qiita
  • NAT Gateway のコストが気になるので CloudWatch ダッシュボードと仲良くなってみた | DevelopersIO

    いくつかのメトリクスは他のメトリクスと比較することでより意味を持つようになります。それを「対のメトリクス」として表現しています。 InFrom と OutTo と Source と Destination 全 14 個のメトリクスのうち 8 個がこれに関するメトリクスです。#2~5,11~14 が該当します。 冒頭で「似たようなメトリクスが並んでいて混乱する」と挙げたのもこれらです。絵を描いたら簡単に理解できました。 ここでは以下前提のもと図示していますが、他の構成でも考え方は同じです。 NAT Gateway がパブリックタイプ 宛先がインターネット上のリソース 送信元(クライアント)が EC2 インスタンス 行きの通信、戻りの通信ごとに対となる組み合わせがあります。 行きの通信:InFromSource,OutToDestination 戻りの通信:InFromDestination,

    NAT Gateway のコストが気になるので CloudWatch ダッシュボードと仲良くなってみた | DevelopersIO
  • 特定の時間帯にCPU使用率が高騰した時のみEC2インスタンスを自動で再起動させる方法 | DevelopersIO

    困っていた内容 特定の時間帯にCPU使用率が高騰した時のみEC2インスタンスを自動で再起動させたいです。 どうすればいいの? 他にも方法はあると思いますが、今回はEC2内部でcronを使用し、特定の時間にCloudWatchアラームの作成と削除するようにスケジュールを設定しました。 設定方法 EC2インスタンス用のIAMロールを作成する CloudWatchにアクセス可能なIAMポリシーを設定します。 今回は、IAM ポリシー「CloudWatchFullAccess」をアタッチしました。必要な権限を付与してください。 EC2 を起動する EC2を起動します。 今回は Amazon Linux 2 を使用しています。 $ cat /etc/os-release NAME="Amazon Linux" VERSION="2" ID="amzn" ID_LIKE="centos rhel fe

    特定の時間帯にCPU使用率が高騰した時のみEC2インスタンスを自動で再起動させる方法 | DevelopersIO
  • CloudWatch Agentのバージョン取得を自動化したいのでいろいろ試してみた | DevelopersIO

    しばたです。 EC2を運用しているとSSM AgentやCloudWatch Agentなどのエージェントプログラムを定期的に更新する必要があります。 更新作業自体はSSM Run CommandやSSM State Managerを使うと比較的容易に行えますが、その前段として「今どのバージョンを使っているか?」の管理も必要です。 SSM AgentはSSMの根幹のエージェントなのでマネジメントコンソールの画面やCLIから容易にバージョン情報を参照できます。 *1 (フリートマネージャーからマネージドインスタンスの一覧といっしょにSSM Agentのバージョンが取得できる) CLIならこんな感じのコマンドで一発取得できます。 # AWS CLIでSSM Agentのバージョン一覧を取得 aws ssm describe-instance-information \ --query "sor

    CloudWatch Agentのバージョン取得を自動化したいのでいろいろ試してみた | DevelopersIO
  • CloudWatch メトリクスに ECS Fargate のタスク単位のCPU・メモリ使用量を記録してみた | DevelopersIO

    はじめに アノテーション株式会社の hato です。 記事は CloudWatch Container Insights と CloudWatch Logs のメトリクスフィルターを利用して、タスク単位のCPU・メモリ使用量を自動的に CloudWatch メトリクスに登録する方法をご紹介します。 完成図 タスク単位のCPU・メモリ使用量 Container Insights を設定すると「タスクのパフォーマンス」からタスク単位のCPU・メモリ使用率が確認できますが、過去のリソース状況を確認したい場合があります。 タスク単位のリソース状況は CloudWatch メトリクスには標準で保存されませんが、Container Insights のパフォーマンスログ にはタスク単位・コンテナ単位のリソース状況が収集されています。 そのため、CloudWatch Logs のデータをメトリクスフィ

    CloudWatch メトリクスに ECS Fargate のタスク単位のCPU・メモリ使用量を記録してみた | DevelopersIO
  • アラームを実行するデータポイントでアラーム状態が短時間だけOK状態に戻る際の誤報を抑制する | DevelopersIO

    データアナリティクス事業部の鈴木です。 CloudWatchアラームのアラームを実行するデータポイントを使って、アラーム状態が短時間だけOK状態に戻る際に誤報を抑制できるか検証してみました。 解決したいケース CloudWatchアラームでメトリクスを監視し、アラーム状態に遷移した際に通知などのアクションをトリガーするユースケースがあると思います。 例えば、以下のように、SQSのデッドレターキューにメッセージが入ると、通知するような仕組みなどです。 デッドレターキューにメッセージが入った際には、メッセージをポーリングしてメッセージの内容を確認することがあると思いますが、アラームがキューの表示されたメッセージの数などを監視しているような場合は、アラームの設定によってはポーリングの際に一度アラームがOK状態に戻ってしまい、メッセージが再び表示されると通知が飛んでしまうということが起こります。

    アラームを実行するデータポイントでアラーム状態が短時間だけOK状態に戻る際の誤報を抑制する | DevelopersIO
  • CloudWatch SyntheticsでURL死活監視を試してみる

    こんにちは。社内でCloudWatch Syntheticsで外形監視(Web監視)を設定する機会があったので、やり方を紹介します! CloudWatchで外形監視(Web監視)を行うには、2パターンがあります。一つ目はURL監視で、二つ目はWebシナリオ監視です。今日はURL監視の設定手順と監視を行う際のコストについて、お伝えします。 CloudWatch Synthetics とは ウェブサイトや API のエンドポイントに対して、 SeleniumやPuppetterと同様に利用ユーザーと同じアクションを実行して、パフォーマンスや可用性をモニタリングできます。 CloudWatch Synthetics では、Canary を設定します。Canaryとは スケジュールに沿って実行されるスクリプトです。Canary では Node.js、Pythonのスクリプトや実行間隔、通知などの設

  • WordPressで発生した「No space left on device」に対応 - ヤマムギ

    CloudWatch Logsメトリクスフィルターで「No space left on device」を検知 前回、WordPressにアクセスできなくなったときに、Nginxのエラーログに「write() to “/var/log/nginx/access.log” failed (28: No space left on device) while logging request」とエラーが出力されていました。 ディスク容量がなくなってアクセスできなくなったようです。 CloudWatch Logsのメトリクスフィルターで「No space left on device」文字列を検知してアラームからSNSでメール送信するように設定していました。 そしてアラームが届きましたので、逼迫しているディレクトリを確認しました。 Amazon Linux2で逼迫しているディレクトリを確認 AMIか

    WordPressで発生した「No space left on device」に対応 - ヤマムギ
  • Amazon CloudWatch Syntheticsのリンク切れチェッカーを試してみた | DevelopersIO

    こんにちは、コンサル部@大阪オフィスのTodaです。 Amazon CloudWatch Syntheticsのリンク切れチェッカーを操作する機会がありましたので、紹介させていただきます。 利用した感想 スクレイピングを利用してリンクを探し、次のページに移動しながらリンク切れ調査をおこなうことが簡易に実装できました。 昔、独自でスクレイピングをおこない監視をしていましたが準備の工数を削減する事が可能です。 Amazon CloudWatch Syntheticsとは? CloudWatch Syntheticsとは、ウェブサイトや API のエンドポイントなどに対して、利用ユーザー視点でパフォーマンスや可用性をモニタリングをする事ができます。 チェック処理はLambdaのコードになっているためカスタマイズにて調査、判定の調整も可能になります。 リンク切れチェッカー リンク切れチェッカーは調

    Amazon CloudWatch Syntheticsのリンク切れチェッカーを試してみた | DevelopersIO
  • Amazon CloudWatch Metrics Insightsが一般提供開始(GA)されました | DevelopersIO

    CloudWatchのInsights系に仲間が! その名も「Amazon CloudWatch Metrics Insights」。メトリクスに対してSQLで集計できるよ。 Amazon CloudWatch Metricsに対してSQLで集計できるよ こんにちは、のんピ(@non____97)です。 皆さんはCloudWatch Metricsに対してSQLで集計したいと思ったことはあります? 私はあります。 CloudWatch Metric Mathを使うことでメトリクスの四則演算や絶対値、最小値を求めたりなどは今までも出来ていました。 また、CloudWatch Metric Mathの機能単体で条件に当てはまるメトリクスを抽出して計算することもSearch式やIF式を使うことで可能ですが、式が複雑になってしまいがちでした。 今回、Amazon CloudWatch Metric

    Amazon CloudWatch Metrics Insightsが一般提供開始(GA)されました | DevelopersIO
  • 【CloudWatch】RDSのストレージ使用率を監視してみる - サーバーワークスエンジニアブログ

    最近はダイエットにも熱が入り、順調に体重が減っているCI部の柿﨑です。 AWS監視について、CloudWatchを使って監視設定を行う機会がございましたので備忘録的に書きます。 今回とくに困ったのがRDSのストレージ使用率の監視となります。 CloudWatchの仕様 代替策 やってみる RDSの拡張モニタリングを有効にする ロググループを確認する ログを確認する メトリクスフィルターを設定する CloudWatch Alarmを設定する 動作チェック おまけ CloudWatchの仕様 RDSのストレージ監視を行う場合は、以下のメトリクスを使用するのが一般的かと思われます。 FreeStorageSpace Amazon RDS のメトリクス このメトリクスは単位がバイトとなっている点に注意が必要です。 ストレージ容量に対して80%以上の使用率を検知させる場合は、以下のような設定になって

    【CloudWatch】RDSのストレージ使用率を監視してみる - サーバーワークスエンジニアブログ
  • CloudWatch の費用が高い!そんな時に確認するべきポイントと手順を紹介します。

    はじめに 所属しているプロジェクトにて CloudWatch の費用が高い!という話題になりました。 CloudWatch ログは、一定期間経ったら削除しているのになぜだろう?ログのストレージ量とは別の何かかかな?という状況でした。 ということで、この時に確認した CloudWatch のどのサービスで費用がかかっているのか?どのロググループが要因なのか?について確認するべきポイントと手順を紹介します。確認した結果から、削減可能なものかを判断し、可能なものなら対応するという流れになります。 それでは、実際に確認していきましょう! Billingページでどのサービスに費用がかかっているか確認しよう! まず Billing ページにて CloudWatch の明細を見ます。 「DataProcessing-Bytes」の費用がダントツで一番多くかかっていました。 AWSのページを見ると、「Da

  • 【CloudWatch】EC2のメモリ監視&ログ収集

    はじめに CloudWatchはAWSリソースの状態を収集したり、監視したり、通知をしたり、分析をしたりすることができる非常に有用なAWSサービスである。 AWSのマネージメントコンソールでCloudWatchにアクセスすると、EC2のCPU使用率、ディスクIOなど様々リソースに関するデータを確認することができる。 これらの収集されたデータをメトリクスという。 ただし、デフォルトで監視できるメトリクスには限りがあり、メモリ使用率等は設定を追加しないと監視することができない。 このようなユーザーの設定を追加しないと監視できないメトリクスをカスタムメトリクスという。 今回は、このカスタムメトリクスの設定を追加し、EC2のメモリ監視を行った。 また、リソース監視の他にログの収集を行ってみたいと思う。 ゴール 今回メモリ監視、ログ収集を行う構成は上記の図の通り。 上記構成は、以下の記事で作成してい

    【CloudWatch】EC2のメモリ監視&ログ収集
  • 【こんなときどうする?】Amazon SESのバウンスレートが高くて、メールの送信ができない

    【こんなときどうする?】Amazon SESのバウンスレートが高くて、メールの送信ができない 2021年09月23日 コラム kodera こんにちは。サニービュー事業部の小寺です。 みなさんはSESを利用されていますか? 先日、SESのバウンスレートが高く、メールの送信制限を受けてしまったので、 対応方法について、ご紹介します。 バウンスメールとは バウンスメールとは、ソフトバウンドとハードバウンドの2つのタイプがあります。 ソフトバウンド は、メールが一時的な理由で送信できなかった事象です。主な原因は、受信箱が容量を超えていたり、メールのサイズが大き過ぎたりすることです。ソフトバウンスが起きると、メールプロバイダーの多くは、そのメールの送信を数日のあいだ試行し続けます。 ハードバウンド は メールが永続的な理由で配信できなかった事象です。アドレスが実在しないか、メールのドメインが実在し

  • Amazon SES の返送率または苦情率のしきい値に関する通知を設定する

    Amazon Simple Email Service (Amazon SES) の返送率または苦情率が高いときに通知を受け取りたいと考えています。アカウントが審査されたり、送信が一時停止されたりしないように、通知を受け取りたいと考えています。 解決策 評価ダッシュボードを開いて、返送率や苦情率を確認できます。ただし、返送率や苦情率が特定のしきい値に達した場合、ダッシュボードは通知を送信しません。 返送率または苦情率に関するしきい値の通知を受信するには、Amazon Simple Notification Service (Amazon SNS) トピックを使用して Amazon CloudWatch アラームを設定します。返送率や苦情率が指定したしきい値に達するたびに SNS トピックに通知するように CloudWatch アラームを設定できます。次に、SNS トピックは、トピックにサブ

    Amazon SES の返送率または苦情率のしきい値に関する通知を設定する
  • CloudWatch RUM を使って NuxtJS アプリのクライアント側のエラーをモニタリングしてみた | DevelopersIO

    はじめに プロフィールビューアーサービス Proflly(プロフリー)の運用にて、エラーが発生している原因を調査することがあります。その際に再現性があるエラーの場合は、原因を突き止めやすいのですが、再現性がないエラーの場合、調査して原因を突き止めるのが難しい場合があります。 そういった場合に、クライアント側のエラー(Javascript のエラーなど)をモニタリングできると、エラー時の挙動がより調査しやすくなるので、CloudWatch RUM を実際に触って試してみました。 やってみること CloudWatch RUM にアプリケーションモニターを作成 NuxtJS アプリ(Single Page Application)に Amazon CloudWatch RUM Web Client を組み込む NuxtJS アプリでエラー(例外)を発生させる エラー内容をアプリケーションモニター

    CloudWatch RUM を使って NuxtJS アプリのクライアント側のエラーをモニタリングしてみた | DevelopersIO
  • CloudWatch Synthetics の実行によって得られるメトリクスの種類を調べてみた | DevelopersIO

    CloudWatch Synthetics で確認できるメトリクスの項目の意味は以下のリンクに記載されています。記事では末尾のNoteで取り上げられている内容の意味を理解するために実際のメトリクスを元に確認します。 CloudWatch metrics published by canaries - Amazon CloudWatch Canaries that use either the executeStep() or executeHttpStep() methods from the Synthetics library also publish SuccessPercent and Duration metrics with the dimensions CanaryName and StepName for each step. DeepL翻訳 Synthetics ライブ

    CloudWatch Synthetics の実行によって得られるメトリクスの種類を調べてみた | DevelopersIO
  • CloudWatchのメトリクスデータをNew Relicに連携してみた | DevelopersIO

    こんにちは!コンサル部のinomaso(@inomasosan)です。 記事はNew Relic Advent Calendar 2021の19日目の記事です。 投稿が遅くなってすみません! New Relic実践入門を頂いたツイートした際にAdvent Calendarのお誘いがあったので、初心者目線で何か書いてみることにしました。 今回は最初の一歩ということで、CloudWatchのメトリクスデータをNew Relicに連携を試していきます。 New Relicアカウントサインアップ New Relicは以下の無料枠を無期限で継続利用できます。 月間100GBまでのデータ取り込み 全機能にアクセスできるフルアクセスユーザー1名 また、クレジットカードも登録なしで利用可能なため、気軽に検証できてありがたいですね。 New Relic 無料サインアップ やってみた 手順はNew Rel

    CloudWatchのメトリクスデータをNew Relicに連携してみた | DevelopersIO
  • [アップデート] IAM ユーザー不要!Amazon CloudWatch ダッシュボードが共有可能になりました! | DevelopersIO

    日のアップデートAmazon CloudWatch のダッシュボードが共有可能になりました。 Amazon CloudWatch Dashboards now supports sharing Cloudwatch ダッシュボードを共有できるメリット ちょっと使いの IAM ユーザー管理からの開放 CloudWatch ダッシュボードは頻繁に確認するメトリクスや、関連性のあるメトリクスをまとめて表示させておくことで安定運用の確認、および障害時の問題切り分け調査を効率化することが出来ます。 従来、このダッシュボードは CloudWatch コンソールへのアクセス権限がなければ確認することが出来ませんでした。つまり CloudWatch にモニタリングを集約するということは、参照するメンバーすべてに IAM ユーザーまたは IAM ロールなどを払い出し管理する必要がありました。 利用する

    [アップデート] IAM ユーザー不要!Amazon CloudWatch ダッシュボードが共有可能になりました! | DevelopersIO