eigo_sのブックマーク / 2019年8月24日

eigo_s id:eigo_s

2019年8月24日のブックマーク (2件)

8月23日のAWSの大規模障害でMultiAZでもALB（ELB）が特定条件で500エラーを返すことがあったという話 - Make組ブログ
このブログ記事で「MultiAZ」にしていたら何事も全て大丈夫という認識を変えられると嬉しいです（当該の時点で障害起こした人はちゃんとMultiAZにしてなかったんでしょ？という人の認識も変えられると嬉しいです）。 MultiAZにしておくことは基本です。その上でも、安心しきらずに監視は必要という話をしています。 MultiAZ構成にしておきましょうそのうえで監視、検知、トレーサビリティを大切にしましょう MultiAZ要らないという見当外れの解釈はしないでください（一部、間違えた解釈をしてるコメントも見受けられましたが、大いに違います）。前提 2019-08-23、AWSで大規模な障害が起こりました。障害の一般的な内容は以下のとおりです。まとめのブログ https://piyolog.hatenadiary.jp/entry/2019/08/23/174801 AW
eigo_s 2019/08/24
aws
リンク
障害から学ぶクラウドの正しい歩き方について考える - そーだいなるらくがき帳
AWSで大きな障害が発生したこの機会に、自分がクラウドと正しく付き合っていくために必要なことを考える。 piyolog.hatenadiary.jp ちなみに稼働率 99.99% くらいを目指していくために必要な事を考える。必要な稼働率を見極める今回は 99.99% くらいを目指すと言ったが、実際に自分たちにとってどのくらいの稼働率を目指すか？ということはとてもとても大切だ。幸い、今回自分は影響がなかったが、本当に完璧か？と言われるとそうではない。まず弊社の場合、マルチリージョンではないので東京リージョンが落ちたら落ちる。これを許容できない場合に99.99%を目指せるか？というと正直厳しい。しかしサイトの規模はそんなに大きくないのでデータサイズも現実的に転送出来る範囲で、コンポーネントも少なく、TerraformやAnsibleによって再構築しやすい状態は整っている。そのため
eigo_s 2019/08/24
aws

engineer
リンク
- 2019年8月25日
- 2019年8月24日
- 2019年8月23日