2020年10月7日のブックマーク (1件)

  • 東証、障害の原因を特定 「自動切り替えできない設定値になっていた」

    東京証券取引所は10月5日、株式売買システム「arrowhead」(アローヘッド)で1日に発生した障害の原因を特定し、4日中に修正したと発表した。 障害は、ストレージ内でメモリ故障が起き、サブ機にも切り替わらなかったことが原因。メモリ故障による障害が起きた際、自動切り替えできない設定値になっていたという。 arrowheadのユーザー情報などを格納するストレージ「共有ディスク装置」の1号機に搭載されたメモリが故障したことに起因。1号機が障害を検知すると、切り替え用設定値に従って自動で2号機に切り替わるはずが、切り替わらなかった。 調査したところ、メモリ故障が原因の障害パターンが発生した際、自動切り替えできない設定値になっていたという。設定値を変更すれば、自動切り替えできることが判明。4日にシステムに適用し、自動切り替えが動作することを確認したという。 稼働前のテストでは、1号機と2号機相互

    東証、障害の原因を特定 「自動切り替えできない設定値になっていた」
    advancedbear
    advancedbear 2020/10/07
    障害テスト時点での確認範囲の問題よなぁ。実際自分がメモリ故障時のテストもやれって言われたら、普通のテストの倍くらいリスクと工数積んでやるだろうし、そもそもどうやるんだって話もあるし・・・。