タグ

インフラとシステムに関するatm_09_tdのブックマーク (4)

  • 2020年10月に発生した東京証券取引所のシステム障害についてまとめてみた - piyolog

    2020年10月1日、東京証券取引所はアローヘッドの機器故障によりシステム障害が発生し、終日売買を停止すると発表しました。故障した機器は交換が行われ、取引は翌日再開されています。ここでは関連する情報をまとめます。 機器故障起きるも縮退運用に失敗 障害概要図 アローヘッド内の共有ディスク装置1号機で機器故障が発生した。実際故障したのはサーバー上のメモリ周辺機器とされる。 1号機故障により両現用で稼働していた2号機のみのフェールオーバー(縮退運用)が行われるはずだったが何らかの問題により行われなかった。 共有ディスク装置を使用する相場配信、売買監視のシステムで障害が発生。 障害復旧時に発生する注文データ消失による市場混乱を避けるため当日終日の取引停止の措置を実施。(遮断) フェールオーバー失敗原因は設定ミス フェールオーバーに失敗した理由が特定できたとして10月5日に発表。 障害発生時のフェー

    2020年10月に発生した東京証券取引所のシステム障害についてまとめてみた - piyolog
  • 重要インフラのサイバー・テロに向けた官・民の取り組み

    電力、水道、通信、金融、交通といった、我々の社会生活を支える、いわゆる重要インフラと呼ばれるサービスは、コンピュータで制御されている。こうした重要インフラ・システムがサイバー攻撃によって停止させられる、または誤動作させられた場合、社会生活に大きな影響を及ぼす危険性がある。 情報処理推進機構(IPA)は、2008年から重要インフラ・システムの情報セキュリティーに関しても『制御システムの情報セキュリティー動向に関する調査』」などの海外調査や、米国Industrial Control Systems Cyber Emergency Response Team(ICS-CERT)といった国内外関連機関との連携、ガイドラインの公開、普及・啓発のために「IPA重要インフラ情報セキュリティシンポジウム」といったフォーラムの開催など、積極的な活動を行っている。 直近では、経済産業省主管の下、防衛分野や重工

    重要インフラのサイバー・テロに向けた官・民の取り組み
  • 稼働後も開発し続ける

    環境変化が激しい時代の経営を支える柔軟な基幹系を実現するために、もう一つ押さえておくべきカギがある。基幹系の刷新プロジェクトが終わったとしても、開発を続けられる体制を維持することだ。 新規事業への取り組みやグローバル展開、経営統合など、基幹系が対応しなければならない変化は続く。「一度作って後は改修」ではなく、「開発を継続する」という姿勢で臨まなければ、基幹系は変化から取り残されてしまう。 その際、欠かせないのが「基幹系の運用をしない」ことである。基幹系の動作環境として有力になってきたクラウドサービスの利用が、従来の運用を代替する最有力の選択肢だ。 クラウドを活用してインフラの運用負担をできる限り軽減する。その結果、運用に費やしていた人員や費用を、アプリケーションの開発の継続や活用支援に振り向けられるようになる(図1)。 基幹系にクラウドを取り入れ、開発プロジェクトに期限を設けない決断をした

    稼働後も開発し続ける
  • 災害にあったITシステムを操作しなければならない人が知るべきこと

    東北地方太平洋沖地震が金曜日に発生し、被災された皆様には心よりお見舞い申し上げます。 そんな中でも、この月曜日から多くのIT関係者が被災したかもしれないITシステムの復旧に取りかかるのではないかと思います。そうした方々に役に立つ記事を届けられないだろうかと、ユニアデックスの高橋優亮氏に相談したところ、大いなるご賛同をいただき有志の方々とノウハウをまとめたこの文書「災害にあったITシステムを操作しなければならない人が知るべきこと v0.2」を作り上げていただきました。 文書の主眼は被災したITシステムを復旧させようとする方々に向けた情報提供ですが、システムに電源を入れる前の注意事項、電源投入順序の考え方などの説明は、これから関東地方で計画されている停電が起きたあとのシステム再起動の際などにも参考になると思います。 文書はどなたにでも活用していただけるようにGNU Free Documen

    災害にあったITシステムを操作しなければならない人が知るべきこと
  • 1