昨日の「AWSのAZの割り当ては、アカウントごとに違うという話」で宿題として残した、マルチAZ構成で単一AZの障害の影響を受けるのは何故かという問題について考えてみます。キーワードはELBです。 前提としてのELBの実装(の予想) マルチAZ構成での障害発生原因を検討する前に、まずELBの実装について考えてみましょう。5年ほど前に書いたELBの挙動からみる内部構造の推測です。 blog.takuros.net 旧ELB(CLB)をもとに書いていますが、ALBでも大きく変わらないと思います。要点としては、ELB自体は、AWSが管理するEC2インスタンス上で稼働し、バランシング先のAZにそれぞれ配置されているということです。図ではELBインスタンス(仮称)として表しています。そして、ELBインスタンスへの振り分けはDNSの名前解決で実現している点です。このアーキテクチャは私の個人的な予想ですが
先週の金曜日(2019/8/23)に発生したAWSの東京リージョンで大規模な障害が発生しました。障害の内容は、一つのAZで空調設備の問題からEC2インスタンス並びにEBSに問題が発生したという事象です。詳細についてはAWSから発表があるので、そちらをご参照ください。 aws.amazon.com 障害の最中にTwitterのタイムラインを見ていると、単一AZ障害ではなく複数のAZで障害が発生しているのではないかという観測が多く見られました。障害としては、AWSの発表通り単一AZ障害です。では何故多くの人に勘違いされたのでしょうか?理由は2つあります。 AZの割り当ては、アカウントごとに違うという事が知られていない マルチAZ構成にしていても、単一AZの障害の影響を受ける ここでは前者のAWSアカウントの割り当ての話を説明します。 あなたが見ているap-northeast-1aは、私が見てい
AWS、複数のアベイラビリティゾーンで稼働していたアプリケーションでも大規模障害の影響があったと説明を修正。東京リージョンの大規模障害で追加報告 2019年8月23日金曜日の午後に発生したAWS東京リージョンの大規模障害について、AWSは追加の報告を行い、複数のアベイラビリティゾーンで稼働していたアプリケーションでも障害の影響があったことを認めました。 下記は大規模障害の報告ページです。赤枠で囲った部分が、8月28日付けで追記されました。 当初の報告は、障害の原因が空調装置のバグであり、それが引き金となってサーバーのオーバーヒートが発生したことなどが説明されていました。 そして障害の影響範囲は単一のアベイラビリティゾーンに閉じており、 複数のアベイラビリティゾーンでアプリケーションを稼働させていたお客様は、事象発生中も可用性を確保できている状況でした。 と説明されていました。 複数のアベイ
VMwareのクラウド基盤がAzure東京リージョンで利用可能に。「Azure VMware Solutions」を2020年第一四半期に東京リージョンで提供と発表。VMworld 2019 US VMwareは、AWSとの協業による「VMware Cloud on AWS」をはじめとする、VMwareテクノロジーによるクラウド基盤の提供をさまざまなクラウドベンダとともに提供しています。 Azure上でVMwareクラウド基盤を提供する「Azure VMware Solution」は、今年5月に発表されました。 マイクロソフトがVMwareクラウド基盤をAzureで提供、「Azure VMware Solutions」を正式発表。Dell Technologies World 2019 Azure VMware Solutionsはあらかじめ認定されたソリューションプロバイダであるClou
VMwareは、企業がKuberntesに対応したソフトウェアの開発を支援するための一連のソフトウェアやサービスなどを含む「VMware Tanzu」を、サンフランシスコで開催中のイベント「VMworld 2019 US」で発表しました。 「VMware Tanzu」の名前の由来として、同社CEOのパット・ゲルシンガー氏は「Tanzuは、スワヒリ語で枝、つまり新しいイノベーションの分岐。あるいは日本語では持ち運ぶためのコンテナを指す」と説明。それが箪笥を示すものと明示されなかったものの、日本でコンテナのようなもので「Tanzu」(たんず)の発音に似ているとすれば、「箪笥」(たんす)を示すことは間違いないでしょう(公式サイトに「tansu」(たんす、箪笥)であると説明がありましたので確定です。現在、VMware Japanに確認中です)。 VMware Tanzuは、Kuberntes対応の
VMwareは、仮想化ハイパーバイザであるvSphereにKubernetesを統合する「Project Pacific」を発表しました。vSphere上で直接KuberenetesクラスタやPodsを実行し、運用管理できるようになります。 VMworld 2019の基調講演では、Kubernetesのオリジナル開発者の一人であり現在はVMwareでプリンシパルエンジニアを務めるJoe Beda氏がProject Pacificについて、「vSphereがKubernetesを実行するためのより優れた場所になる」と説明しました。 VMware CEOのパット・ゲルシンガー氏は「vSphereがモダンアプリケーションのプラットフォームになる。VMwareは現時点でもっとも信頼できるプラットフォームであるだけでなく、将来においても信頼できるプラットフォームになるのだ」と、Project Pac
AWS、東京リージョン23日午後の大規模障害について詳細を報告。冷却システムにバグ、フェイルセーフに失敗、手動操作に切り替えるも反応せず 報告によると直接の原因は東京リージョンのデータセンターで使用されている冷却制御システムにバグがあったこと。これにより、緊急時の手動操作にも冷却制御システムの一部が反応しないなどでサーバが過熱し、障害に至ったと説明されています。 8月23日午後に約6時間の障害。EC2だけでなくRDSも 報告によると、障害は日本時間2019年8月23日金曜日の昼過ぎに発生。影響範囲は仮想マシンを提供するAmazon EC2とブロックストレージを提供するAmazon EBSのそれぞれ一部。以下、AWSの報告を引用します。 日本時間 2019年8月23日 12:36 より、東京リージョン (AP-NORTHEAST-1) の単一のアベイラビリティゾーンで、オーバーヒートにより一
2019-08-27 11:03 AM - 最終編集日: 2021-05-18 12:34 PM 、編集者: Tatsuro Shiotsu SD-WAN の Cloud Infra に関する Service Request について SD-WAN の Cloud Infra に関するケースは Global TAC の Cloud Ops Team にて対応しています。 SD-WAN の Cloud Infra に関するケースを Japan TAC に Open 頂くことも可能ですが、Japan TAC にケース Open 頂いた場合は頂いた内容を翻訳して Global TAC へフォワードする作業のみの対応となります。Global TAC では24時間対応も可能ですので翻訳してフォワードを行う JAPAN TAC にケースを Open 頂くより、Global TAC へ直接ケースを
更新情報 ISR4K は以下に記載されているとおり、16.9(1r) を含む、それ以上の rommon version にアップグレードすると 16.9(1r) より前の rommon version にダウングレードが出来なくなる仕様になっています。 Upgrading Field-Programmable Hardware Devices for Cisco 4000 Series ISRs https://www.cisco.com/c/en/us/td/docs/routers/access/4400/cpld/isr4400_hwfp.html ----- Note: After a device is upgraded to 16.9(1r) ROMMON release, the ROMMON cannot be downgraded to a release earlier
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く