タグ

CloudWatchに関するakatakunのブックマーク (11)

  • 【小ネタ】CloudWatchの「StatusCheckFailed_Instance」と「StatusCheckFailed_System」について | DevelopersIO

    【小ネタ】CloudWatchの「StatusCheckFailed_Instance」と「StatusCheckFailed_System」について こんにちは。半瀬です。 今日はサポート対応の備忘ネタで一筆してみようかと思います。 EC2インスタンスが突然落ちた よくあるサポートケースとして、お客様環境のEC2インスタンスが何らかの理由でネットワーク疎通不能となり、お客様より当該インスタンスからのステータスチェックのアラームを受信したので、その原因調査と対策を提示してもらいたい、といったご要望があります。 そういったケースにおいて、まず障害原因の切り分けとして知りたいのは、 「AWS側のEC2ホスティングのシステム的な問題がある」 のか、 「EC2インスタンス内部に問題がある(リソース不足など様々)」 のか、という点です。その結果如何で、ログイン調査をする必要があるのか、AWSサポート

    【小ネタ】CloudWatchの「StatusCheckFailed_Instance」と「StatusCheckFailed_System」について | DevelopersIO
    akatakun
    akatakun 2018/04/12
    CloudWatchによる詳細なモニタリングを有効にしていれば、EC2内部に問題があるときはStatusCheckFailed_Instance = 1、EC2外部に問題があるときはStatusCheckFailed_System = 1が確認できる
  • [新機能] CloudWatch アラームにデータ欠損/サンプル不足時の評価設定が追加されました | DevelopersIO

    こんにちは、菊池です。 先日のアップデートでCloudWatchのアラームに2つの設定オプションが追加されました。 CloudWatch Alarms releases two new alarm configuration settings Creating Amazon CloudWatch Alarms 追加された設定 追加された設定は以下の2つです。 メトリックデータ不足(欠損)時の処理 正常とみなす 異常とみなす 現状を維持する 不明とする(これまでのデフォルト) サンプルが少ないパーセンタイルメトリクスの評価有無 評価する(これまでのデフォルト) 現状を維持する メトリックデータ不足(欠損)時の処理 CloudWatchのアラームに設定できるメトリックは、カスタムメトリックスを含め非常に多岐にわたります。その通知されるデータの特性によって、アラームに判定する条件も様々です。 E

    [新機能] CloudWatch アラームにデータ欠損/サンプル不足時の評価設定が追加されました | DevelopersIO
    akatakun
    akatakun 2018/01/23
    パーセンタイル統計
  • Amazon CloudWatch でのアラームの使用 - Amazon CloudWatch

    1 つの CloudWatch メトリクスを監視する、または複数の CloudWatch メトリクスに基づく数式の結果を監視するメトリクスアラーム。アラームは、メトリクスや式の値が複数の期間にわたって特定のしきい値を超えた場合に 1 つ以上のアクションを実行します。アクションでは、Amazon SNS トピックに通知を送信したり、Amazon EC2 アクションまたは Amazon EC2 Auto Scaling アクションを実行できます。また、Systems Manager で OpsItem またはインシデントを作成できます。 複合アラームには、作成した他のアラームのアラーム状態を考慮したルール式が含まれます。複合アラームは、ルールのすべての条件が満たされた場合に限り、ALARM 状態になります。複合アラームのルール式で指定されたアラームには、メトリクスアラームやその他の複合アラーム

  • アラート発生時に AWS Lambda を使って音声電話をかける - Qiita

    続編:SNS + Lambda + Twilio で音声電話をかける v2 CloudWatch や独自ツールから Amazon SNS に Notification を飛ばすと、subscribe しているメールアドレスにメール通知が行えます。 サービスの監視を行ってアラートをメールで受信しているケースが多いと思いますが、深夜等でメールを受信しても気づかないケースがあり、障害検知が遅れてしまう、という問題があります。 これを回避するために、電話をかけることにしてみました。 電話をかけるのに使うサービスは Twilio。日ではKDDIが業務提携してサービスを提供しています。 Amazon SNS から AWS Lambda への通知が可能になっていますので、Lambda を使って実装します。 Lambda は現時点で東京リージョンでは使えないため、N.Virginia を使います。 7/

    アラート発生時に AWS Lambda を使って音声電話をかける - Qiita
    akatakun
    akatakun 2018/01/23
    良さ気
  • ALB+WAF利用時のCloudWatchアラーム設定 - Qiita

    概要 Classic ELB から ALB + WAF へ移行するに辺り、CloudWatch アラーム設定をどうしようか考えてみる(結局、結論は出ず。。) bad behavior なリクエストが来た場合 ※ 例えば、PHPMyAdminを狙った /PMA/ Classic ELB (WAFなし) のとき CloudWatch HTTPCode_Backend_4XX は、作業ミスやコードの不具合・バグ検知用に入れたはずが、クローラー/愉快犯/画像泥棒/攻撃事前調査(Probe)などによるアラートの方が多い。 PHPMyAdmin を狙った攻撃事前調査系の bad behavior も、PHPMyAdmin なんて入れていないので HTTPCode_Backend_4XX (=404) アラートが飛ぶ (最近特に多い)。 そこで、AWS WAF を導入したら HTTPCode_Backe

    ALB+WAF利用時のCloudWatchアラーム設定 - Qiita
  • CloudWatchの使い方

    20. 登録 メトリック ネームスペース メトリック名 ディメンジョン(任意) タイムスタンプ 値 単一値: 79.3 統計値: SampleCount=5, Sum=500, Minimum=50, Maximum=150 classmethod.jp 20 21. 登録 リソース② リソース① 20 80 5 / 300 / 10 / 150 5 / 500 / 50 / 150 メトリック 12:00 classmethod.jp 12:01 12:03 21 12:04 12:05

    CloudWatchの使い方
  • CloudWatchのELB監視項目 - Qiita

    指定されたAvailabilityZoneでのロードバランサーに登録されたhelthyなEC2インスタンスの数。 unhealthyな閾値を超えてヘルスチェックに失敗していないホストはhealthyだとみなされる。 このmetricを評価する場合、dimensionはLoadBalancerNameとAvailabilityZoneで規定されるはずである。 このmetricは指定されたAvailability Zoneでのhealthyなインスタンスの数を表している。 200でない応答(HTTPやHTTPSでのヘルスチェックの場合)が返ったり、ヘルスチェックを行っている場合にタイムアウトするような接続の問題でインスタンスはunhealthyになることがある。 全てのhealthyなホスト数の合計を得るために、このmetricは各登録されたAvailabilityZoneを取得し、全てのme

    CloudWatchのELB監視項目 - Qiita
  • CloudWatch 標準メトリクス(監視項目) 一覧 - Qiita

    標準メトリクス一覧がネットで調べてもなかなかでてこなかったので、備忘録として残しておきます。 参考:http://docs.aws.amazon.com/ja_jp/AWSEC2/latest/UserGuide/using-cloudwatch.html CPUUtilization 割り当てられた EC2 コンピュートユニットのうち、現在インスタンス上で使用されているものの比率。このメトリックスは、選択されたインスタンス上でアプリケーションを実行するのに必要な処理能力を表します。 単位: Percent DiskReadOps このインスタンスで利用できるすべてのエフェメラルディスクでの、完了した読み取り操作の数(インスタンスで Amazon EBS を使用している場合は、「Amazon EBS のメトリックス」を参照してください)。 このメトリックスは、一定の時間当たりの、アプリケー

    CloudWatch 標準メトリクス(監視項目) 一覧 - Qiita
  • Amazon CloudWatch でのアラームの使用 - Amazon CloudWatch

    1 つの CloudWatch メトリクスを監視する、または複数の CloudWatch メトリクスに基づく数式の結果を監視するメトリクスアラーム。アラームは、メトリクスや式の値が複数の期間にわたって特定のしきい値を超えた場合に 1 つ以上のアクションを実行します。アクションでは、Amazon SNS トピックに通知を送信したり、Amazon EC2 アクションまたは Amazon EC2 Auto Scaling アクションを実行できます。また、Systems Manager で OpsItem またはインシデントを作成できます。 複合アラームには、作成した他のアラームのアラーム状態を考慮したルール式が含まれます。複合アラームは、ルールのすべての条件が満たされた場合に限り、ALARM 状態になります。複合アラームのルール式で指定されたアラームには、メトリクスアラームやその他の複合アラーム

    Amazon CloudWatch でのアラームの使用 - Amazon CloudWatch
    akatakun
    akatakun 2016/05/25
    INSUFFICIENT_DATA: アラームが開始直後であるか、メトリックスが利用できないか、データが不足していていアラームの状態を判定できない
  • Using Amazon CloudWatch alarms - Amazon CloudWatch

    akatakun
    akatakun 2016/05/25
    INSUFFICIENT_DATA: アラームが開始直後であるか、メトリックスが利用できないか、データが不足していていアラームの状態を判定できな
  • AWS ElastiCache Redis のイケてないところ ※2014/12/21 時点 - weblog of key_amb

    CONFIG GET ができないとかいう制約があるのは別として、最近ハマって、他の人もハマりかねないだろうと思うことを書いておきます。 Cache Cluster のスペックアップができない RDS のように作成した Cache Cluster のインスタンスタイプを変更することはできません。 AWSサポートに問い合わせても現時点ではできないという回答でした。 また、異なるインスタンスタイプのノードをレプリケーショングループに追加することもできないため、現時点でスペックアップしたい場合、新たな Cache Cluster を作成して手動でデータ移行と、アプリケーション側のエンドポイント切り替えを行う必要があります。 最近 Multi-AZ なクラスタ構成がサポートされたので、近い将来にはスペックアップ(インスタンスタイプ変更)もサポートされると期待したいものです。 Freeable Mem

    AWS ElastiCache Redis のイケてないところ ※2014/12/21 時点 - weblog of key_amb
    akatakun
    akatakun 2016/05/17
    メモリ監視にはFreeableMemoryではなくBytesUsedForCacheを使う
  • 1