troubleに関するstereocatのブックマーク (416)

  • CloudflareのDNSが停止し多数のサービスに影響

    Feedly, Tumblr, Discordなどに影響。 DDoS攻撃が原因ではないとの同社声明 金曜日の夜、CloudflareDNSが停止した影響で多数のサービスが停止しました。同社はこの障害は12か所の データセンター に影響を与えたとコメントしています。 DNSの主な問題は修復されましたが、一部のサイトは依然として連鎖反応による障害が続いているようです。 悪いルート「今日の午後、ネットワークの一部で停止が発生した。」とCloudflareは30分以上続いた障害について説明しました。 「グローバルバックボーン上のルータが悪いルートを通知し、ネットワークの一部が利用できなくなったようだ。根原因は修復できると信じている、また現在システムの安定性を監視している。」 同社は、この障害はDDoS攻撃によるものではないと強調しています。これは、先日のT-Mobileの停止時にもあったように

    CloudflareのDNSが停止し多数のサービスに影響
  • 停電によりGoogle Cloudネットワーキングと永続ディスクに障害発生

    Google Cloudの2拠点で、原因不明の停電による障害が発生しました。 これにより、Google の us-east1-c および us-east1-d リージョン の、クラウドネットワーキング及びPersistent Disk(永続ディスク)、そしてそれらに依存するサービスが影響を受けました。 障害は8時15分(太平洋標準時)から始まり、10時20分までにほぼ修復しました。 Googleのステータスページでは、次のようにコメントされています。「us-east1-c および us-east1-d の一部のサービスに障害が発生しており、一部のユーザが、us-east1-c または us-east1-dでホストされるゾーンサービスを利用できなくなる可能性がある。また、1か所、または両方のゾーンで、顧客サービスが中断される可能性がある。」 また、Googleは 「影響は、停電に起因している

    停電によりGoogle Cloudネットワーキングと永続ディスクに障害発生
  • 英国でボーダフォンが停止、原因は「技術的な欠陥」

    通話とブロードバンド通信に影響米国内で起きた T-Mobileの大規模停止の数日後、今後は英国のボーダフォンで同様の障害が発生しました。 ボーダフォンで起きた重大な機能停止は、モバイルおよびブロードバンドの利用ユーザに影響を及ぼしました。同社によると、システム停止は2時間であったが、多くの利用ユーザへの影響はまだ残っているとコメントしています。 通話するのに最悪な一週間 Down Detector上のユーザ投稿を見る限り、影響を受けたユーザの82%は携帯電話ユーザ、家庭用ブロードバンドが14%、モバイルインターネットは3%でした。 停止報告は、イギリス時間の午後1時から1時20分頃に掛けてピークに達し、午後4時頃まで続きました。 悪いことに、この機能停止は英国政府の101と111の電話サービスにも影響を与えました。それぞれ非緊急の警察番号とNHS(National Health Servi

    英国でボーダフォンが停止、原因は「技術的な欠陥」
  • Microsoft Azureのインドリージョンが長時間停止

    停電とオーバーヒートが原因Microsoft Azureの中央インド リージョン で一晩の停止障害が発生し、インド国内のサービスが混乱しました。 2020年5月18日のUTC 12:41頃から2020年5月19日のUTC 08:30まで続いたこのインシデントは、送電網の故障と続いて発生した空調設備の問題が原因でした。 クラウドは誰かのデータセンター「地域の公益事業会社の電力問題により、中央インドのデータセンターが自家発電機給電に移行した。」とMicrosoftはステータスページで報告しました。 「この発電機への移行は、データセンターの2か所の内部ゾーン(コロケーション)にある複数の空調ユニットを除き、設計通りに機能した。が結果、これら2エリアの室内温度が運用しきい値を上回り、アラートが引き金となり、自動化システムがデータを保護するために、ネットワークとストレージリソースのシャットダウンを開

    Microsoft Azureのインドリージョンが長時間停止
  • T-Mobile、大規模障害原因は光ファイバ回線障害と「トラフィックストーム」

    T-Mobile、大規模障害原因は光ファイバ回線障害と「トラフィックストーム」 Data Center Cafe 2020.06.18583 views 停止の夏が始まるT-Mobileの利用ユーザが今週月曜日の多くの時間、音声通話や一部のデータサービスを利用できなくなってしまった大規模停止は、光ファイバ回線障害と冗長化の問題のせいであったとされています。 この障害は、T-Mobileの加入者への連絡が取れないといった、他キャリアの利用ユーザにも影響を与えました。 T-Nobile 「弊社のエンジニアは、昨日の障害の根原因を特定し、復旧させ、そして再発を防ぐために、夜通し働いた。」とT-Mobileのテクノロジー部門プレジデントのNeville Ray氏は話しています。 「トリガーイベントは、南東部のサードパーティプロバイダーにリースされた専用光ファイバ回線の障害であったと理解している。

    T-Mobile、大規模障害原因は光ファイバ回線障害と「トラフィックストーム」
  • データセンターの電源工事作業不備によりSMBC日興証券でシステム障害、売買注文の予約などできず | スラド IT

    6月14日、SMBC日興証券でシステム障害が発生、投資家による金融商品の売買や入金・出金ができなくなるトラブルが発生した(NHK、SMBC日興証券による発表)。障害は14日中に復旧している(復旧報告、日経新聞)。 障害発生の原因はデータセンターにおける電源工事作業の不備とのこと。

  • T-Mobileの通話とメッセージが長時間ダウン中「ルーティングの問題を解決するまでFaceTimeなどを使って」【UPDATE:ほぼ復旧】

    ネット上の障害状況レポートを提供するサービスdowndetector.comによると、米東部時間の15日午後1時ごろから不調の報告が始まり、3時ごろには9万件を超えた。稿執筆現在(午後7時半)、まだ問題は解消していない。 T-Mobileはこの問題を把握しており、公式Twitterアカウントで「エンジニアが音声とテキストに影響する広範囲にわたるルーティング問題の解決に取り組んでいます。一時的な解決策として、FaceTime、WhatsApp、Signalなどのサードパーティー通話アプリを使っていてください」とツイートした。 【UPDATE】技術担当社長のネヴィル・レイ氏は16日午前0時ごろ、ほぼ復旧したとツイートした。 同社のマイク・シーバートCEOは公式ブログで、原因は「IPトラフィックに関する問題」だとし、完全復旧に注力すると説明した。 米Cloudflareのマシュー・プリンスCE

    T-Mobileの通話とメッセージが長時間ダウン中「ルーティングの問題を解決するまでFaceTimeなどを使って」【UPDATE:ほぼ復旧】
  • T-Mobileの米国内通信がダウンし、VerizonやAT&T等に影響

    T-Mobileの米国内通信がダウンし、VerizonやAT&T等に影響 Data Center Cafe 2020.06.16904 views SNS上では大規模DDoS攻撃の噂で盛り上がっているが、その証拠は現時点でほぼ存在しないT-Mobile、Verizon、およびAT&Tの利用ユーザは、T-Mobileの停止とみられる状況で米国全土での通話に影響が出ています。 T-Mobileのサービスは音声とデータ通信共に困難な状況ですが、他キャリアのユーザについては、T-Mobile利用ユーザと通信しようとすると問題が発生しています。 おそらく単なる内部エラー 「当社のエンジニアは現在、全国的に影響を及ぼしている音声とデータ通信の問題を解決するために取り組んでいる。」とT-Mobileのテクノロジー部門プレジデントのNeville Ray氏はTwitter上でコメントしています。 「ご不便

    T-Mobileの米国内通信がダウンし、VerizonやAT&T等に影響
  • 6月10日に発生しましたIBM Cloudのネットワーク障害に関するご報告

    主要カテゴリー IBM Cloud Blog IBM Data and AI IBM Consulting IBM Partner Ecosystem IBM Sustainability Software Client Engineering IBM テクニカル・サポート 社員が語る「キャリアとIBM」 IBM Cloud Blog IBM Cloud News IBM クラウド・ビジョン IBM Cloud アップデート情報 IBM Cloud チュートリアル IBM Data and AI IBM Watson Blog アナリティクス Data Science and AI SPSS Modeler ヒモトク Db2 オートメーション IBM Consulting デジタル変革(DX) アプリの開発とモダナイゼーション 製品/サービス ソフトウェア ハードウェア サービス 無料評価

    6月10日に発生しましたIBM Cloudのネットワーク障害に関するご報告
  • IBM Cloudが数時間にわたる世界規模の停止

    IBMのクラウドサービスが6/9火曜日の夜に数時間の停止に見舞われ、プラットフォームは世界規模でダウンしました。 今回の停止は、3月にダラス・データセンターで発生した短時間のダウンタイムに続く障害です。 今回の問題はおおむね解消されましたが、LogDNAインデックスの問題とDallas Cloud Functionsの問題はまだ残っています。 クラウドは他の誰かのデータセンターでもある 停止は、一般的なクラウドサービスだけでなく、Cloud Object Storage、 Kubernetes Service、App Connect、VPN for VPC、Identity and Access Management (IAM)、Continuous Delivery、そしてWatson AIクラウドサービスにも影響を与えました。 IBMのステータスページ上では、停止原因に関する詳細は提供

    IBM Cloudが数時間にわたる世界規模の停止
  • IBM Cloudで世界規模の障害発生中、「原因は調査中」

    米IBMのクラウドサービス「IBM Cloud」にで2020年6月10日に障害が発生し、利用できない状況が続いている。日IBMでは「障害が発生しているのは事実で、影響範囲や原因を調査中」(広報)とコメントした。

    IBM Cloudで世界規模の障害発生中、「原因は調査中」
  • 新型コロナでクラウド依存が進む中、DC障害のリスクを考える【特集】

    新型コロナでクラウド依存が進む中、DC障害のリスクを考える【特集】 Iwasaki Kazuyuki 2020.04.241,246 views 新型コロナが社会のオンライン化を加速新型コロナウイルス感染症(Covid-19)の感染拡大に伴い、世界的にソーシャルディスタンスが広がり、外出自粛など、人との物理接触は極端に少なくなりました。在宅勤務に伴い会議はオンラインになり、娯楽も自宅で映画鑑賞やオンラインゲームなどオンラインに集約され、人々の行動パターンは新型コロナ以前と比べ質的に変わりました。 インターネット利用が増加し、クラウド、オンラインへの依存度が史上かつてないほど高まっているのは紛れもない事実です。 幸い、IT技術の発展により、人々は生活や仕事をオンラインでかなりこなせるくらい便利な世の中になりました。この動きは5Gの発展と共に更に加速するでしょう。 人々は常時オンラインに慣れ

    新型コロナでクラウド依存が進む中、DC障害のリスクを考える【特集】
  • 葛西データセンター障害発生のお詫び – Unitas Globalのニュースリリース

    2020年6月4日22時45分頃より、弊社インターネットアクセスポイントの設置拠点である葛西データセンター電源設備故障のため一部のお客様へインターネット接続サービスが提供できない状況となっておりましたが、2020年6月6日1時頃に、弊社のインターネットサービスに関する設備の復旧作業が完了したことをご報告いたします。 今回の障害により、お客様のビジネスに多大な影響を及ぼす事態となり誠に申し訳ございませんでした。 また弊社Webサーバーおよびメールサーバーが停止し電子メールの送受信が不能となったため、お客様へのご連絡が速やかにできなかったことを重ねてお詫び申し上げます。 今回の事象: NTT東日グループが運営・管理する葛西データセンターのUPS設備の中にある部品の一部にて短絡(ショート)が発生し、データセンター内にある弊社通信設備への電源供給が停止しました。 これにより、弊社都内アクセスポイ

    葛西データセンター障害発生のお詫び – Unitas Globalのニュースリリース
  • 日本電子計算の自治体クラウドで障害、アップデート中に「想定外の事象が発生」

    電子計算(JIP)は2020年6月1日、同社が提供する自治体向けIaaS「Jip-Base」で5月31日未明からシステム障害が発生していたと日経クロステックの取材に対して明らかにした。6月1日午前4時30分に復旧したという。一部の自治体ではそれ以降の時間もメールを送受信できないといった症状が出ていたが、同日昼までに解消したとしている。 JIPによれば、5月31日にストレージ機器のコントローラーのファームウエアのバグを修正するアップデートを実施。そのとき、「想定外の事象が発生した」(広報)という。同社は想定外の事象に対応したうえで、予定していたファームウエアのアップデートを最後まで行ったとしている。 ストレージに構築している仮想OSなどのクラウドサービスを利用している自治体の業務システムに影響が出たようだ。Jip-Baseは2019年12月にもストレージ機器のファームウエアの不具合が原因

    日本電子計算の自治体クラウドで障害、アップデート中に「想定外の事象が発生」
  • どのように牛がGoogleネットワークの小規模な停止を引き起こしたか?

    どのように牛がGoogleネットワークの小規模な停止を引き起こしたか? Data Center Cafe 2020.05.22928 views 停電はしばしば、電源障害、ケーブルの誤抜去、悪天候などの単純な要因によって引き起こされます。 ただし、牛が原因となる場合もあります。オレゴン街道でのトラブルに関する一連のツイートで、Googleのテクニカル・インフラストラクチャ部門SVPのUrs Hölzle氏は、かなり珍しい事件について説明しています。 牛肉をべる、インターネットを救う「OK、これは新しい問題です。牛がネットワーク障害を引き起こす可能性があることをご存知でしたか?笑わないでください、これは私たちに起こりました。」と、Googleの8番目の社員である彼は牛の煩わしさについて説明しました。 「最近、オレゴンを通るマルチテラビットのファイバ・パス上で頻繁に短時間の停止(flaps)

    どのように牛がGoogleネットワークの小規模な停止を引き起こしたか?
  • 【報告】豪州の森林火災による通信サイト停止の多くは停電が原因

    オーストラリア政府委託による報告によると、1,390か所もの通信サイトが、2019年後半から2020年前半に掛けてオーストラリア全土に大混乱をもたらした森林火災の影響を受けていたことがわかりました。 モバイルおよび固定無線基地局、ノード、交換局、通信機器シェルター、メタルおよび光ファイバケーブルも含め、施設の77%が停止したようです。つまり、コミュニティが、最も必要なときに助けを求めることができなかったことを意味します。 未来を垣間見る 1,390の施設のうち、51%は4時間を超える停止、26%は4時間未満の停止を余儀なくされ、23%は影響を受けたものの停止は免れました。 この事故による平均停止期間は3.5日でしたが、中央値は1.6日でした。しかし通信機器シェルターは23日と、平均より大幅に長い復旧時間がかかりました。 オーストラリア通信メディア庁の報告書によると、停止事故の1/3について

    【報告】豪州の森林火災による通信サイト停止の多くは停電が原因
  • AWS東京リージョンで発生した障害について(4.20)

    Amazon Web Service(AWS)の東京 リージョン ( AP-NORTHEAST-1 )において20日の19時ごろから大規模障害が発生した模様です。 尚、23:09PM JST時点ではすべての障害は解決し、現在では正常稼働に戻ったようです。 AWSのステータスページ上では、影響を受けたサービスとして、 CloudWatch 、 Simple Queue Service 、 CloudFormation 、及び Lambda がリストされています。 ステータスページの詳細には、「いくつかのアラームの処理においての レイテンシ 増加」 、「送信および受信操作におけるエラーレートの上昇」「書き込みコントロールプレーンAPIのエラー率の増加」などが報告されていましたが、原因についてはまだ不明です。 また、DownDetector上では、10:35PM頃から12:05AM頃までにTwi

    AWS東京リージョンで発生した障害について(4.20)
  • テレワーク利用でネット通信量急増、特に目立つ時間帯は「昼過ぎ」

    【読売新聞】 新型コロナウイルスの感染拡大でテレワークの利用が広がり、インターネットの通信量が、通常時の1・6倍程度まで増加している。利用が集中しているネットサービスでは、障害や接続しづらい状況も生じている。 通信会社インターネット

    テレワーク利用でネット通信量急増、特に目立つ時間帯は「昼過ぎ」
  • 九州電力のシステム障害、データ差異が判明し完全復旧は5月にずれ込み

    送配電ネットワークの利用料金を計算する「託送料金計算システム」と関連システム間で、住所などの契約情報や電力量のデータに差異が見つかったという。すでに顧客に請求した料金についても再度確認作業を行うとしている。 九州電力は4月の送配電事業の分社化に備えて年末年始にシステムを刷新したが、同システムでいまだに障害が続いている。同社広報は「不具合の大部分はすでに解消したものの、完全復旧が5月のいつごろになるかは分からない」とした。

    九州電力のシステム障害、データ差異が判明し完全復旧は5月にずれ込み
  • パッチ盤からケーブルを引っこ抜いてしまいCloudflareに障害発生。ケーブルにラベリングされておらずどれを戻すべきかすぐに分からず

    パッチ盤からケーブルを引っこ抜いてしまいCloudflareに障害発生。ケーブルにラベリングされておらずどれを戻すべきかすぐに分からず CDNプロバイダのCloudflareは、世界協定時4月15日の午後3時31分から午後7時52分(日時間4月午前0時31分から午前4時52分)まで、ダッシュボードおよびAPIが使えなくなるという障害を発生していました。 Cloudflare Dashboard and API Outage on April 15, 2020https://t.co/zJctsOomVf — Cloudflare | #BuiltForThis (@Cloudflare) April 16, 2020 同社のブログ「Cloudflare Dashboard and API Outage on April 15, 2020」によると、同社の2つのコアデータセンターのうちの1

    パッチ盤からケーブルを引っこ抜いてしまいCloudflareに障害発生。ケーブルにラベリングされておらずどれを戻すべきかすぐに分からず