タグ

障害に関するchaxahcのブックマーク (4)

  • Engadget | Technology News & Reviews

    Some of our favorite Bose headphones and earbuds are back to all-time low prices

    Engadget | Technology News & Reviews
  • Slack、1月の大規模障害の原因を説明。「AWS Transit Gateway」がトラフィックの急上昇に対応できず、AWSはアルゴリズムを見直すと

    Slack、1月の大規模障害の原因を説明。「AWS Transit Gateway」がトラフィックの急上昇に対応できず、AWSはアルゴリズムを見直すと AWSのネットワーク基盤の一部が飽和していた 1月4日、サービス内部のエラー率上昇によって始まったSlackの障害は、太平洋標準時の午前6時ごろからはSlackのWeb層の負荷が高まり、パケットロスを発生しはじめるなど徐々に深刻化。7時頃にはついにサービス停止にまで発展してしまいます。 負荷の解消のためにWeb層をスケールアウトさせるなどの対処を行い、なんとかサービスが復旧し始めたころに、AWSから障害の引き金となった現象についての報告が次のようになされたとのこと。 「Slack’s Outage on January 4th 2021」から引用します。 By the time Slack had recovered, engineers

    Slack、1月の大規模障害の原因を説明。「AWS Transit Gateway」がトラフィックの急上昇に対応できず、AWSはアルゴリズムを見直すと
  • EC2 インスタンスの障害調査依頼を受けた時に確認していること | DevelopersIO

    記事を書こうと思ったきっかけ サポートへの問い合わせで一番多いのが "EC2 インスタンスの障害調査依頼" だから 「サーバはペットではなく畜牛のように扱え」というフレーズがあるように、クラウドではインフラがいつも変化するという前提でシステムを設計するのがよいとされています。そのため、EC2 インスタンスが障害でホストダウンしてもサービスが継続できるように設計されていればいいのですが、アプリケーションの要件や環境によっては単体の EC2 インスタンスで運用されることもあるようです。 そのため、EC2 インスタンスの障害調査依頼をいただく際は緊急度が高い場合が多くあります。テクニカルサポートとして、私が障害調査依頼があった際に実施している内容を公開することで、迅速な障害の切り分けや復旧につながればと思い書きました。 前提 EC2(Linux)を想定して書いています AWS マネジメントコンソ

    EC2 インスタンスの障害調査依頼を受けた時に確認していること | DevelopersIO
  • 全国53自治体でシステム障害続く データ復元不可能のおそれも | NHKニュース

    東京の情報処理会社が自治体向けに提供している業務システムで今月4日から不具合が発生し、全国53の自治体に影響が出ています。完全復旧の見通しはたっておらず、自治体によってはデータが消え復元が不可能になるおそれもあるとしています。 この会社が管理する大量の情報を記憶する「ストレージ」と呼ばれる機器のプログラムに問題が見つかっていて、解消に向けて作業が続けられていますが、完全復旧のめどは立っていないということです。さらに、33の自治体では後期高齢者医療制度や学校関係のデータなどが一部、消えた可能性があり、復元もできないおそれがあるとしています。 このうち、東京 練馬区では、小中学校の通知表を作成するシステムに影響が残っていて、区立小中学校のすべての児童・生徒およそ4万6000人分の配付が今月25日の終業式に間に合わずに、年明けになる見込みとなっています。 「日電子計算」は、「住民の皆様、関係者

    全国53自治体でシステム障害続く データ復元不可能のおそれも | NHKニュース
  • 1