Developers.IOにある 冗長化(マルチAZ、マルチリージョン)、監視、障害対応などの記事をまとめてみた(全116個) これまで培ってきたDevelopers.IOの記事から、冗長化・監視・障害対応などの記事をピックアップしてまとめてみました。 少しでも参考になると幸いです。 先日の東京リージョンで発生したEC2とEBSの障害について、振り返ってみれば、 冗長化しておく 適宜バックアップを取っておく ログをすぐ可視化できる仕組みを構築しておく 障害発生時の対応を検討・シミュレートしておく などによって、影響を軽減できたと言えそうです。 もちろん、このあたりは「事業内容や構築しているシステムで必要な稼働率、予算」などで考え方や実現できる内容は異なると思います。 ところで、AWSには責任共有モデルがあり、AWSと利用者がそれぞれ行うべきことを定義しています。 利用者がこれを行うための手