タグ

2019年8月24日のブックマーク (5件)

  • AWSのAZ障害で影響を受けた・受けなかったの設計の違い。サーバレス最高! - GS2 Blog

    みなさん、こんにちは。GS2 の丹羽です。 今日は大事件が起こりました。Twittetなどでも話題になったので皆さん知っているのではないかと思います。 japanese.engadget.com こんなブログを見に来てる人ならみんな知ってると思いますが、AWSの東京リージョンには3カ所のデータセンターがあります。 そのうち1カ所のデータセンターが完全に利用できない状態になりました。 その影響で様々なゲームも影響を受けたようです。 gamebiz.jp なぜAZ障害が様々なサービスの障害につながったのか さて、なぜ今回のようにAZがダウンするとこのような大規模な障害が発生するのでしょうか。 1. シングルAZ サーバはどこかのデータセンターで動いていてるわけです。EC2を使ってサーバを起動するときにもどのAZに配置するかを選びます。 この時に、一つのAZに固めてサーバを配置していた。あるいは

    AWSのAZ障害で影響を受けた・受けなかったの設計の違い。サーバレス最高! - GS2 Blog
  • AWS障害、大部分の復旧完了 原因は「サーバの過熱」

    8月23日午後1時ごろに発生した、米Amazon Web Servicesのクラウドサービス「AWS」の東京リージョンでの障害について、同社は午後8時18分、クラウドサーバの復旧がほぼ完了したことを明らかにした。制御システムの障害により、サーバの温度が上がりすぎたことが原因だったという。 同社によると問題が起きたのは、「Amazon Elastic Compute Cloud」(EC2)の東京リージョンを構成する4つのデータセンター(アベイラビリティーゾーン、AZ)の内の1カ所。AZ内の制御システムに問題が発生し、複数の冗長化冷却システムに障害が起きたという。結果として、AZ内の少数のEC2サーバが過熱状態となり、障害として表面化したとしている。 冷却システムは午後3時21分に復旧。午後6時30分までに、ほぼ全てのストレージ(EBSボリューム)とインスタンスが復旧したという。 同社は、障害

    AWS障害、大部分の復旧完了 原因は「サーバの過熱」
  • “数十年” 使えるヘッドホン誕生! 約3万円で買える基準機、ソニー「MDR-M1ST」レビュー (1/5) - Phile-web

    HOME > レビュー > “数十年” 使えるヘッドホン誕生! 約3万円で買える基準機、ソニー「MDR-M1ST」レビュー ■待望の新スタジオモニターヘッドホン!MDR「ST」新世代モデルが登場 時代が平成へと移り変わった1989年。その年に登場して以降、国内スタジオモニターヘッドホン分野における圧倒的な定番、デファクトスタンダード的な地位にあり続ける名機、それが「MDR-CD900ST」だ。純粋な性能だけではなく、現在に至るまで補修パーツが問題なく供給され続けている継続性など、製品としての在り方までを含めて、これぞ真のプロユース機と言える存在である。だからこそプロならぬ多くのヘッドホンファンにも愛され続けている。 MDR-CD900STは使いどころさえ適正であれば、その実力は現在においても十分に通用する。しかし、現在の最新技術をもって全く新規に設計すれば、今求められている様々な要素に幅広

    “数十年” 使えるヘッドホン誕生! 約3万円で買える基準機、ソニー「MDR-M1ST」レビュー (1/5) - Phile-web
  • 障害から学ぶクラウドの正しい歩き方について考える - そーだいなるらくがき帳

    AWSで大きな障害が発生したこの機会に、自分がクラウドと正しく付き合っていくために必要なことを考える。 piyolog.hatenadiary.jp ちなみに稼働率 99.99% くらいを目指していくために必要な事を考える。 必要な稼働率を見極める 今回は 99.99% くらいを目指すと言ったが、実際に自分たちにとってどのくらいの稼働率を目指すか?ということはとてもとても大切だ。 幸い、今回自分は影響がなかったが、当に完璧か?と言われるとそうではない。 まず弊社の場合、マルチリージョンではないので東京リージョンが落ちたら落ちる。 これを許容できない場合に99.99%を目指せるか?というと正直厳しい。 しかしサイトの規模はそんなに大きくないのでデータサイズも現実的に転送出来る範囲で、コンポーネントも少なく、TerraformやAnsibleによって再構築しやすい状態は整っている。 そのため

    障害から学ぶクラウドの正しい歩き方について考える - そーだいなるらくがき帳
    s_nagano
    s_nagano 2019/08/24
    “ 「クラウドが壊れたらハイボールでも飲みならが直るのを待つ」”
  • 8月23日のAWSの大規模障害でMultiAZでもALB(ELB)が特定条件で500エラーを返すことがあったという話 - Make組ブログ

    このブログ記事で 「MultiAZ」にしていたら何事も全て大丈夫という認識を変えられると嬉しいです (当該の時点で障害起こした人はちゃんとMultiAZにしてなかったんでしょ?という人の認識も変えられると嬉しいです)。 MultiAZにしておくことは基 です。 その上でも、 安心しきらずに監視は必要 という話をしています。 MultiAZ構成にしておきましょう そのうえで監視、検知、トレーサビリティを大切にしましょう MultiAZ要らないという見当外れの解釈はしないでください (一部、間違えた解釈をしてるコメントも見受けられましたが、大いに違います)。 前提 2019-08-23、AWSで大規模な障害が起こりました。 障害の一般的な内容は以下のとおりです。 まとめのブログ https://piyolog.hatenadiary.jp/entry/2019/08/23/174801 AW

    8月23日のAWSの大規模障害でMultiAZでもALB(ELB)が特定条件で500エラーを返すことがあったという話 - Make組ブログ