タグ

システム障害に関するjtwのブックマーク (4)

  • Googleが引き起こした通信障害の影響 – はるかの休日

    インターネット接続不良発生 何が起きたの? 日時間午後0時22分頃~10分間にわたりGoogleが誤ったBGP経路情報を流したことで、インターネットに接続している各ISP事業者のコアスイッチが経路をさばききれなくなったために各所で切断が発生。ポイントは誤った経路情報が流されたことではなく、「大量」の誤った経路情報が流されたことが原因。誤った経路情報が流れてくるのは別段不思議ではないが、10万以上の経路情報が誤って流れてきたのは前代未聞。 Googleからの誤った広報は10分ほどで終了したものの、そのせいでつぶれたコアスイッチ達が立ち上がった後に急死したルータ・スイッチ群が復旧できずに長時間の障害に及びました。一番遅い復旧で5時間ほどですかね。どこのネットワーク情報がおかしいのか分からない状況で大変だった様子。また、システム・ネットワークは復旧しても、データの不整合が発生してしまっていて、

    Googleが引き起こした通信障害の影響 – はるかの休日
  • みずほ銀行ATMが停止、再びシステム障害 : 経済ニュース : マネー・経済 : YOMIURI ONLINE(読売新聞)

    みずほ銀行の西堀利頭取は17日、3日連続で起きた同行のシステム障害について記者会見し、「日が危機の中でしっかりしなければならないのに、逆になり申し訳ない」と陳謝した。 原因については、東日巨大地震の発生後に特定の口座の取引が急増し、想定以上にシステムの処理量が膨らんだことを挙げた。週末からの3連休中にシステムの完全復旧を目指すとしている。 しかし、17日午後にいったん復旧した同行の全国の現金自動預け払い機(ATM)が、記者会見後の午後5時40分から再び停止しており、18日以降も窓口での振り込みやATMでの預金の払い戻しなどができない可能性がある。 システム障害は、期日指定振り込みの下準備などを行う「集中記帳取引」のシステムに想定以上の取引データが流れ込んだことが起点となった。データの処理が滞った結果、15日は一部の窓口業務で振り込み業務が行えなくなり、16日は一部のATMが一時停止した

    jtw
    jtw 2011/03/17
    原因がやっと明かされた。
  • mixi大規模障害について 解明編 - mixi engineer blog

    こんにちは、システム技術部たんぽぽGの森です。 先日のmixi大規模障害の原因となったmemcachedの不具合の詳細な解明ができました。 再来週まで発表を見合わせようと思ったのですが、早くお伝えしたほうがいいと思いましたので公開発表致します。 memcachedとlibevent memcachedはlibeventというライブラリを使用してクライアントからの要求(接続、コマンド送信)を処理しています。 libeventを使用するにはevent_baseという構造体を用います。 main threadはmain_baseを使用します。 static struct event_base *main_base; ... int main (int argc, char **argv) { ... main_base = event_init(); ... /* enter the ev

    mixi大規模障害について 解明編 - mixi engineer blog
  • 【速報】電源設備が発煙,So-netやSeesaaのブログが停止

    データセンター事業者であるさくらインターネットの「西新宿データセンター」において2008年12月19日,障害が発生した。電源設備から発煙し,設置しているサーバーへの電源供給が停止した。同社の広報担当者によると,「現在復旧中であるが,復旧のメドはまだ立っていない」という。 この障害によって,同データセンターでサーバーを運用している,ソネットエンタテインメントの「So-net blog」やシーサーの「Seesaaブログ」が影響を受けているとみられる。両ブログともにログインやWebページの閲覧ができない状況になっている。シーサーの広報担当者は,「現在,故障していない電源設備から,当社のサーバーへ電力供給ができないかを試している最中。復旧のメドは立っていない」と回答した。

    【速報】電源設備が発煙,So-netやSeesaaのブログが停止
    jtw
    jtw 2008/12/22
    原因を知りたい。
  • 1