troubleに関するstereocatのブックマーク (416)

  • 那覇市職員「LANケーブルなんか余ったな。よく分からんし、とりあえずここ挿しとくか」→大規模ネットワーク障害を発生させてしまう

    篠原 修司 (Shuji Shinohara) |フリーライター✏️ @digimaga ネット炎上の解説やデマ訂正(ファクトチェック)のYahoo!ニュースエキスパート|iPhonePC・ガジェットのお役立ち&おトク情報も発信|ChatGPT等の生成AIにも興味|たまにAbema出演|アマゾンアソシエイトメンバー|あと好き 仕事のご相談は digimaganet@gmail.com まで digimaga.net 篠原 修司 (Shuji Shinohara) |フリーライター✏️ @digimaga 那覇市役所の職員「パソコン移動させよ」 ↓ 職員「LANケーブルなんか余ったな。よく分からんし、とりあえずここ挿しとくか」 ↓ 大 規 模 ネ ッ ト ワ ー ク 障 害 発 生 那覇市役所庁舎等のネットワーク障害について【令和6年4月5日 更新】 city.naha.okinawa.

    那覇市職員「LANケーブルなんか余ったな。よく分からんし、とりあえずここ挿しとくか」→大規模ネットワーク障害を発生させてしまう
  • バグは“数千パターンのテスト”をすり抜けた ―NTTデータ「2023/10/10 全銀ネット障害」について説明 | gihyo.jp

    バグは“数千パターンのテスト”をすり抜けた ―NTTデータ「2023/10/10 全銀ネット障害」について説明 NTTデータグループは2023年11月6日、10月10日に発生した全国銀行データ通信システムの障害に関する記者説明会を実施、現時点で判明している障害の概要について説明を行うとともに、再発防止策に向けたタスクフォースの設立などについて明らかにしました。会見の冒頭、NTTデータグループ 代表取締役社長 間洋氏は、今回の障害により全国の預金者や金融機関をはじめとする社会全体に大きな混乱をもたらしたことを謝罪し、今後の原因究明と再発防止に向け、全国銀行試験決済ネットワーク(以下、全銀ネット)とともに全力をかけて取り組むことを明言していました。 記事では会見の内容をもとに、現時点で判明している10月10日の事故の原因についてレポートします。 2023年10月10日 ―なにが起こったのか

    バグは“数千パターンのテスト”をすり抜けた ―NTTデータ「2023/10/10 全銀ネット障害」について説明 | gihyo.jp
  • 全国銀行データ通信システムのシステム障害についてまとめてみた - piyolog

    2023年10月10日、全国銀行資金決済ネットワークは、同社が運用している全国銀行データ通信システムでシステム障害が発生したことを公表しました。この障害の影響により一部の金融機関で送金遅延などが生じました。ここでは関連する情報をまとめます。 560万件の取引に影響 障害が起きたのは全国銀行資金決済ネットワーク(全銀ネット)が運用する全国銀行データ通信システム(全銀システム)のうち、平日8時半から15時半まで稼働するコアタイムシステムで金融機関との接続に使用される中継コンピューター(RC)。障害は10月10日8時半に発生し、10月12日未明に復旧に向けた対応が完了、同日8時半の切替完了したことで復旧した。*1 全銀システムは1,000超の金融機関が参加しており、1営業日当たりの取引件数は2022年実績で約806万件、約14兆円。*2 今回のシステム障害により金融機関間で行われる送金に遅延や取

    全国銀行データ通信システムのシステム障害についてまとめてみた - piyolog
  • 全銀システムの大規模障害、中継コンピューター2台ともに不具合で冗長構成が機能せず

    2023年10月10日午前8時30分ごろに発生した「全国銀行データ通信システム(全銀システム)」の障害。全国銀行資金決済ネットワーク(全銀ネット)は復旧に向けた対応を実施しているが、11日午前11時時点で解消のめどは立っていない。 全銀システムは東京と大阪の2カ所のセンターで並行運転し、システムを構成する各種装置や通信回線などをすべて二重化してある。顧客に影響が出るシステム障害が発生するのは1973年の稼働以降、50年間で初めてとなる。 今回、不具合が生じたと考えられるのは、金融機関が全銀システムに接続する際に使う中継コンピューター(RC)のプログラムだ。送金元の金融機関から送金先の金融機関に対して支払う「内国為替制度運営費(旧銀行間手数料)」の設定などをチェックする機能に不具合が生じたと見られる。 きっかけは保守期限到来に伴い、10月7~9日の3連休中に14の金融機関で実施したRCの更改

    全銀システムの大規模障害、中継コンピューター2台ともに不具合で冗長構成が機能せず
  • NTT東西、4月3日朝の通信障害は「未知のバグ」

    NTT東西、4月3日朝の通信障害は「未知のバグ」
  • フレッツ光の大規模障害、発端は普通のマルチキャストパケットだった──NTT東西

    NTT東西は4月3日に発生した「フレッツ光」と「ひかり電話」の障害について28日に改めて会見を行い、直接の原因は加入者収容装置の「未知のソフトウェア不具合」だったと明らかにした。総務省に対して重大事故として報告している。 3日の会見で「非常に長いロングパケット」としていた不具合の発端については、解析したところコンテンツ配信事業者が送信した普通のマルチキャストパケットだと分かった。「IETF技術標準RFC(Request For Comments)に適したパケットだった」。 しかしマルチキャストパケットを受信した際、「複数の条件が重なり」加入者収容装置の特定機種の一部で不具合が発生した。再起動とフェールセーフ機能による切り替えを繰り返し、パケットが止まるまで続いたという。 「直接的な原因は、マルチキャスト通信の内部処理において通信機器メーカーも認識していなかったソフトウェアの不具合が内在し

    フレッツ光の大規模障害、発端は普通のマルチキャストパケットだった──NTT東西
  • ANAのDB障害の裏に「危うい常態」、パッチは全て当てるべきなのか

    全日空輸(ANA)で2023年4月3日に発生したシステム障害は、50便以上が欠航するなど利用客に大きな影響を与えた。ANAが4月7日に開いた記者会見によると、データベースに「予期せぬエラーが発生」し、「フリーズ」状態になったのが原因だという。 エラーの発生はデータベースのバグに起因するもので、それを是正するパッチ(修正プログラム)は既に提供されていた。日経クロステックの記事によれば「同社はシステム構成上パッチ未適用でも問題ないとみて適用を見送っていた」という。 なぜパッチは適用されなかったのかを考えてみたい。 運用で回避しきれるか ANAのデータベースが抱えていたバグは、パラレルクエリーに関するものだ。パラレルクエリーはSQLを並列化して実行し、照会処理のパフォーマンスを向上させる機能である。同社の資料では「複数のデータ抽出処理を並列で同時に実行することによるデータベースの偶発的なエラー

    ANAのDB障害の裏に「危うい常態」、パッチは全て当てるべきなのか
  • ANAシステム障害の発端はDB両系ダウン、原因特定へ「書き込み処理を絞り込み中」

    全日空輸(ANA)は2023年4月4日、4月3日午後に発生した旅客系基幹システム「able-D」の障害について記者会見を開いた。この中で同社は、障害の発端はable-Dに連なるデータベースが2系統同時にダウンしたことだと明らかにした。同社ではソフトウエアに何らかの原因があるとみて、引き続き原因の特定を進めている。 続報(2023年4月7日) ANAシステム障害の原因判明、DB並列参照時にパッチ未適用の既知バグでフリーズ ANAではable-Dについて、障害対策の観点で同一構成の「A系」「B系」の2系統を用意しており、番系と待機系を定期的に入れ替えている。またA系、B系のそれぞれについて、「DB1」「DB2」という2系統のデータベースを接続しており、DB1とDB2は常にデータが同期されている。 今回のシステム障害が発生した4月3日の午後2時16分ごろ、番運用中だったA系の基幹システムに

    ANAシステム障害の発端はDB両系ダウン、原因特定へ「書き込み処理を絞り込み中」
  • NTT東西、4月3日のアクセス障害は45万弱の回線に影響--原因は海外メーカー製装置の故障

    故障は、同日午前7時10分頃から発生。NTT東西ともに複数メーカーで構成する「加入者収容装置」のうち、海外の特定メーカーの新機種、同一機種かつ同一バージョンが、海外からの特定の配信サーバーのパケットを受信したことで発生したという。 加入者収容装置は、従来使用していた装置の後継機として、東西ともに2018年から順次導入。いずれも二重構成を採用していたが、東日では49ビルの89台、西日は21ビルの27台でともに故障した。

    NTT東西、4月3日のアクセス障害は45万弱の回線に影響--原因は海外メーカー製装置の故障
  • NTT東西の「フレッツ光」大規模障害、原因は特定のサーバから届いた“特殊なパケット”だった

    4月3日の午前中に発生した「フレッツ光」と「ひかり電話」の障害ではNTT東日NTT西日を合わせて最大約44万6000件に影響が出た。原因は新しい加入者装置に特殊なパケットが届いたこと。ただし「アタックである可能性は限りなく低い」としている。 障害が発生したのは午前7時10分ごろ。複数のNTT局舎内にある加入者収容装置が特殊なパケットを受信後にリブートした。フェイルオーバー機能が働き、自動的に別の装置に切り替わったものの、そちらも同じ障害が発生した。 NTT東では49拠点89台、NTT西は21拠点27台の加入者収容装置で同時に障害が発生し、ネット接続サービスの「フレッツ光」と光回線を使う電話サービス「ひかり電話」が一時つながりにくい状態になった。ひかり電話は緊急通報にも支障をきたし、消防庁が公式Twitterアカウントで「携帯電話や公衆電話の利用、消防への直接駆け込み」を促すツイートを

    NTT東西の「フレッツ光」大規模障害、原因は特定のサーバから届いた“特殊なパケット”だった
  • KDDIのクラウド障害、設備の問題が解消 発生から約2週間 「申し訳ございませんでした」

    KDDIが、クラウドサービス「KDDIクラウドプラットフォームサービス」の障害について、設備の問題が解消したと発表した。1月28日の発生から約2週間かかった。 KDDIは2月9日、クラウドサービス「KDDIクラウドプラットフォームサービス」(KCPS)の障害について、設備の問題が解消したと発表した。1月28日の発生から約2週間かかった。ただしユーザーの復旧状況については「顧客の業務復旧に向け、正常性の確認を続けていく」(同社)としている。 KDDIは障害の発生以降、(1)仮想的に作成したルーターの再作成、(2)故障したストレージ内のデータを読み取り可能な状態で起動する、(3)新規ストレージを構築し、データを移行する、(4)新規ストレージ上で仮想サーバを立ち上げる──といった作業を進めていた。復旧については31日時点で「完全復旧には2週間以上かかる可能性がある」との見通しを示していた。 実際

    KDDIのクラウド障害、設備の問題が解消 発生から約2週間 「申し訳ございませんでした」
  • マイクロソフト、AzureやMicrosoft 365などに影響した先週の大規模障害の原因報告。WAN内の全ルータが再計算状態に突入し、パケット転送が不可に

    マイクロソフト、AzureやMicrosoft 365などに影響した先週の大規模障害の原因報告。WAN内の全ルータが再計算状態に突入し、パケット転送が不可に マイクロソフトは、日時間で先週の1月25日午後4時頃から最大で約5時間半に渡り、Microsoft AzureやMicrosoft 365、Microsoft Teamsなど幅広いサービスがほぼ全世界で利用できなくなっていた大規模障害について、予備的な報告書を公開しました。 WAN内の全てのルーターに誤ったメッセージが送信 報告書の原因について説明している部分を引用します。 まず原因について。同社のワイドエリアネットワークに対して行われた設定変更が全体に影響したと説明しています。 We determined that a change made to the Microsoft Wide Area Network (WAN) imp

    マイクロソフト、AzureやMicrosoft 365などに影響した先週の大規模障害の原因報告。WAN内の全ルータが再計算状態に突入し、パケット転送が不可に
  • マイクロソフト、1月25日に発生した大規模障害の原因を説明

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Microsoftは、米国時間1月25日に同社のWANに発生した大規模障害に関する詳細を公表した。この障害では、世界中の顧客が「Azure」や「Microsoft 365」、「Power Platform」などのサービスにアクセスできなくなった。 影響が数時間に及んだ今回の障害では、「Microsoft Teams」「Exchange Online」「Outlook」「SharePoint Online」「OneDrive for Business」「Microsoft Graph」「Power BI」「Microsoft 365 Admin Portal」「Microsoft Intune」「Microsoft Defender fo

    マイクロソフト、1月25日に発生した大規模障害の原因を説明
  • 「Herokuの対応は遺憾」 Skeb障害、機会損失は1500万円相当 クラウド丸ごと乗り換え約18時間で解決

    Herokuの対応は遺憾」 Skeb障害、機会損失は1500万円相当 クラウド丸ごと乗り換え約18時間で解決 クリエイターに有償でイラストなどを発注できるサービス「Skeb」で12月23日から24日にかけて発生した障害について、運営元のスケブ(東京都千代田区)は24日、損失の詳細を公開した。 「Skebでは月間約5億円の取引があるが、今回の障害で1500万円相当の取引の機会損失が発生した。しかし、12月26日午前8時現在もHerokuから詳しい状況説明はなく、詳細な経緯は判明していない。厚いサポートをうたうエンタープライズ契約を締結しているにもかかわらず、このような対応は大変遺憾」(同社) 障害は23日午後12時22分から24日午前7時にかけて発生。期間中、ログインなどがしにくい状態だった。原因はサービスの提供に使っていたクラウドサービス「Heroku」のアカウントに起きた問題。「Ske

    「Herokuの対応は遺憾」 Skeb障害、機会損失は1500万円相当 クラウド丸ごと乗り換え約18時間で解決
  • 総務省|電気通信事故検証会議|報告書

    平成27年度電気通信事故に関する検証報告 ○報告書   ○報道発表(平成28年7月29日) 平成28年度電気通信事故に関する検証報告 ○報告書   ○報道発表(平成29年7月28日) ○「平成27年度電気通信事故に関する検証報告」のフォローアップアンケート実施結果 ○「平成27年度電気通信事故に関する検証報告」のフォローアップアンケート実施結果【概要版】 平成29年度電気通信事故に関する検証報告 ○報告書   ○報道発表(平成30年9月28日) 平成30年度電気通信事故に関する検証報告 ○報告書   ○報道発表(令和元年8月9日) 令和元年度電気通信事故に関する検証報告 ○報告書   ○報道発表(令和2年9月4日) 令和2年度電気通信事故に関する検証報告 ○報告書   ○報道発表(令和3年9月22日) 令和3年度電気通信事故に関する検証報告 ○報告書   ○報道発表(令和4年11月11日)

    総務省|電気通信事故検証会議|報告書
  • KDDI通信障害の報告書で見えた地獄絵図、痛恨のミスから次々と事態が悪化

    総務省の有識者会議「電気通信事故検証会議」は2022年10月5日、KDDIが7月に起こした大規模通信障害に関する検証報告書を公表した。KDDI自身がこれまで4度にわたって記者会見を開いて説明しているので全体像は把握していたが、さらに深掘りした興味深い内容となっている。 例えば障害の影響が全国に波及した点。同業他社からは「KDDIはなぜ影響を局所化できなかったのだろうか」と疑問の声が上がっていた。原因は、同社が音声通話用の「VoLTE(Voice over LTE)交換機」のネットワークをフルメッシュ構成にしていたためだった。東西でネットワークを分けるのが一般的な印象だが、同社は「特定の拠点で発生する輻輳(ふくそう)を早期に収束させるため」に全国フルメッシュ構成を採用していた。これが裏目に出た。今後は東西分散構成に変更するという。 検証報告書を読むと、厄介な出来事が次々と発生して事態が悪化し

    KDDI通信障害の報告書で見えた地獄絵図、痛恨のミスから次々と事態が悪化
  • 総務省|電気通信事故検証会議|令和4年8月に発生した西日本電信電話株式会社の重大な事故についての検証報告

    法人番号2000012020001 〒100-8926 東京都千代田区霞が関2-1-2 中央合同庁舎第2号館 電話03-5253-5111(代表)【所在地図】

    総務省|電気通信事故検証会議|令和4年8月に発生した西日本電信電話株式会社の重大な事故についての検証報告
  • NTT西日本の大規模通信障害、光伝送装置のソフト不具合で設定が工場出荷状態に

    NTT西日2022年8月25日、大規模な通信障害を引き起こした。30府県の最大211万回線でインターネット接続に支障を来した。発端は保守ネットワークにおける装置の収容数が推奨値を超えたことだった。1台の光伝送装置で動作が不安定となり、内部データベースの同期に失敗。ソフトウエアの不具合で装置が初期化され、顧客の通信にまで影響が及んだ。 「当にご迷惑をおかけして、申し訳ございませんでした」。2022年9月30日、NTT西日の森林正彰社長は8月25日に引き起こした通信障害に関して総務省から行政指導の文書を受け取り、記者団を前にこう陳謝した。 8月25日の通信障害は、NTT西日の幅広い顧客に影響を与えた。「フレッツ光ネクスト」などの利用者が最大6時間近くにわたってインターネットに接続しづらくなった。同社は最大211万回線が影響を受けたと推計する。兵庫県や京都府など12府県の最大63万回線

    NTT西日本の大規模通信障害、光伝送装置のソフト不具合で設定が工場出荷状態に
  • ファミマでチケット発券が7時間近く不能に、原因はマルチコピー機の通信障害

    ファミリーマートは2022年10月13日、通信障害により同日午前9時ごろからチケットの発券やプリペイド購入など一部サービスを休止したと発表した。午後3時50分ごろに復旧するまで、7時間近くにわたり影響が続いた。 同社によると店内の多機能端末(マルチコピー機)を通じて提供しているマルチコピーサービスで、午前9時ごろからネットワークがつながりにくい状況が発生していた。このため予約したチケットの代金の支払いや発券、プリペイド式電子マネーの購入などができなくなったという。 今回のトラブルを受けてチケット会社がSNS(交流サイト)などで注意喚起しており、イベント主催者も対応策を公表している。例えばプロ野球のクライマックスシリーズで10月13日夜に阪神タイガースと対戦する東京ヤクルトスワローズは、チケットを購入済みでチケットを発券できないファンに対して、購入履歴を確認できれば暫定入場券を渡すとしている

    ファミマでチケット発券が7時間近く不能に、原因はマルチコピー機の通信障害
  • イオン銀行ATMで障害発生 メンテ明け直後に

    イオン銀行は10月11日、システム障害が発生していると明らかにした。銀行内などにある一部ATMが利用できない状態になっているという。復旧のめどはたっていない。提携金融機関やコンビニのATMでの操作は一部を除き可能としている。 関連記事 イオン銀行に不正アクセス、個人情報2062件が流出 情報管理用クラウドツールで設定ミス イオン銀行が、情報管理用クラウドツールが不正アクセスを受け、2062件の個人情報が流出したと発表。具体的な製品名は明らかにしていないが「設定にミスがあった」としている。 MUFG信託銀行でシステム障害 ATM、ネットバンキングで一時取引できず 三菱UFJ信託銀行でシステム障害が発生し、ATMやインターネットバンキングでの取引が一時できない状態になった。障害は復旧済み。発生原因は調査中で、分かり次第報告するとしている。 みずほ銀で大規模システム障害 全店舗で窓口取引できず、

    イオン銀行ATMで障害発生 メンテ明け直後に