タグ

障害に関するd_akatsukaのブックマーク (2)

  • 負荷低すぎはもはや障害じゃないのか - mikedaの日記

    前のブログの続きで、もにかじ7で話した小ネタその2。 実際にサービスでなんかやったというのじゃなく、こういうこと考えてるんだけどみんなどうしてます?って話です。 まずオンプレ時代はサーバのスペックダウンはけっこう大変だったし、頑張ってメモリやCPU引っこ抜いてもそんなに節約にならなかった。 ※CPUやメモリはサーバ価格の一部でしかないし、ラック費用(消費電力)もあるし。 でもクラウド前提だとスペックダウンはとても簡単で、スペック半分にすると価格も半分になる。 そうすると、 『イベントで一時的にc4.4xlarge(8万/月)にして、そのまま最大CPU使用率10%とかで数ヶ月放置されている』 みたいなのはビジネス的な損失という意味で明らかに障害で、監視すべきじゃないだろうか? みんななんかやってますか? というようなことを参加者に聞いてみました。 参加者の中では、AutoScalingしてい

    負荷低すぎはもはや障害じゃないのか - mikedaの日記
  • [続報]東証トラブル、原因はL3スイッチの障害

    東京証券取引所は2012年8月7日夜、全派生商品(デリバティブ)銘柄の取引が一時できなくなったトラブル(関連記事1、関連記事2)について会見を開いた。トラブル発生の原因がネットワーク機器であることを明かし、東証の宇治浩明 IT開発部トレーディングシステム部長は「大変なご迷惑をおかけしたことをお詫び申し上げる」と陳謝した。 原因はデリバティブ取引システム「Tdex+システム」と、構内ネットワーク「arrownet」の間に設置しているアラクサラネットワークス製レイヤー3(L3)スイッチ。L3スイッチは二重化していたが、「番系から待機系への自動切り替えに失敗した」(宇治部長)という。 午前9時18分、該当のL3スイッチに障害が発生。東証は同9時22分に売買を停止した。応急策として、同10時17分に手動による待機系への切り替えを実施し、10時55分に取引を再開した。後場は正常に取引を終えた。 8

    [続報]東証トラブル、原因はL3スイッチの障害
  • 1