タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

障害に関するmokemokechickenのブックマーク (1)

  • Amazon EC2 障害の詳細とその教訓

    原文(投稿日:2011/04/29)へのリンク Amazon は先日,米国東部リージョンのアベイラビリティゾーンで発生したサービス障害に関する詳細な 報告書 を発表した。その分析や論評,今回の出来事から学ぶべき教訓 などの話題で,オンラインメディアは持ちきりだ。 今回の Amazon EC2 障害の 時間的経緯 の中で Eric Kidd 氏は,AWS のサービス中断に関連する一連の出来事について,外部的な視点から概説している。すべてが始まったのは 2011年4月21日 PDT(太平洋夏時間) 午前1時頃,Heroku がサービス機能に関する大量のエラーを出力し始めた時だ。障害は 4月24日 PDT 午後 7:30 頃,すべての RDS データベースがオンライン復帰したことを Amazon が発表するまで,ほぼ4日間続いた。その間,一部ユーザに対するサービスが停止,ないしは断続的に停止した

    Amazon EC2 障害の詳細とその教訓
    mokemokechicken
    mokemokechicken 2011/05/06
    どんなシステムも得てして障害復旧時の「想定外」には対応が難しいよね。。
  • 1