タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

troubleとnetworkに関するyyamaguchiのブックマーク (2)

  • なぜ大規模・長期化したのか、KDDI通信障害を検証する

    2022年7月2日未明から続くKDDI通信障害は、発生から既に丸3日が経過した。同月4日午後に会見したKDDI取締役執行役員専務技術統括部長の吉村和幸氏は「現時点で音声通話、データ通信はほぼ復旧している。ネットワークの状態を監視し、個人・法人ユーザーのサービス利用状況を確認した上で、7月5日の夕刻をめどに全面復旧したい」と話した。 一連の通信障害は、ルーターの新旧入れ替えにより音声トラフィックが15分間不通となったことを皮切りに、音声通話用のVoLTE(Voice over LTE)交換機や加入者データベース(DB)の輻輳(ふくそう)、加入者DBとVoLTE交換機の間のデータ不一致といった事象が連鎖したことで広がった。 最大約3915万回線、社会インフラとして交通や物流、金融、気象などに使われる重要回線が、3日以上にわたってつながりにくくなるという今回の事態は、過去10年の間に日で起き

    なぜ大規模・長期化したのか、KDDI通信障害を検証する
  • ANAシステム障害の原因判明、シスコ製スイッチの「世界初のバグ」でDBサーバーがダウン

    同期処理が失敗した原因は、4台をつなぐスイッチの不具合。具体的には、スイッチが故障状態であるにもかからず、故障を知らせる「故障シグナル」を発信しなかった。国内線システムは故障シグナルを検知するとスイッチを予備機に切り替えるが、今回はその機能そのものを作動できなかった。 スイッチは完全に停止したわけではなく、「不安定ながらも動作していたようだ」(同)。そのため、DBサーバー間の同期は順次失敗し、停止していったと見られる。 ANA広報によると、スイッチは米シスコシステムズ製「Catalyst 4948E」という。「2010年6月の発売開始以降、世界で4万3000台、うち日で8700台を販売しているが、今回の不具合は初めての事象と聞いている」(ANA広報)。なぜ「故障シグナル」が発信できなかったかは分かっていない。 1台での縮退運転を決断 4台の完全停止から37分後、ANAは1台のDBサーバー

    ANAシステム障害の原因判明、シスコ製スイッチの「世界初のバグ」でDBサーバーがダウン
    yyamaguchi
    yyamaguchi 2016/03/31
    「同期処理が失敗した原因は、4台をつなぐスイッチの不具合。具体的には、スイッチが故障状態であるにもかからず、故障を知らせる「故障シグナル」を発信しなかった」
  • 1