タグ

システム障害に関するluccafortのブックマーク (4)

  • AWS でいままで起きた大規模障害を振り返る - Qiita

    目的 2017/3/1 に us-east-1 の S3 大規模障害がありました。過去にもいくつか発生しているのと、いつ使っているリージョンで同じ事態が起きてもおかしくないと思い、これを機に過去どのような障害があったのか遡って調べました。 所感 毎年どこかのリージョンで大規模な障害が起きている ap-northeast-1 で起きていないのはたまたま、運がいいだけ AWS は復旧時間の改善・可用性向上に全力を尽くしているものの、未知の障害はいつかどこかで起きるもの ステータスダッシュボードは時に嘘をつく クラウドシェアトップである AWS はインターネット全体の SPOF になりつつある Chaos Monkey の思想は必須 報告書読むの面白い AWS の中身がすこし透けて見えてきます 前回データセンターについて調べたことが役に立った AWS のデータセンターに侵入する(妄想で) - Q

    AWS でいままで起きた大規模障害を振り返る - Qiita
  • ニトリ通販サイト、リニューアルで不具合 5日経っても再開できず

    ニトリは、公式通販サイト「ニトリネット」で6月17日にリニューアルを行ったところ、リリース時に一部のプログラムでエラーが発生し、不具合が起きたと発表した。サイトはメンテナンスが続いており、5日経った22日午後4時時点でも再開していない。同社によると、23日午前10時の復旧を目指して作業を続けているという。 リニューアル作業は17日午前0時から午前10時まで実施。リリース直後に一部プログラムエラーのためサーバが高負荷状態となり、表示エラーなどの不具合が発生した。 リニューアルは、サイトのグローバル対応やレビュー機能の実装、店舗在庫の閲覧機能、配送との連携機能などを追加するものだったが、リニューアル作業を委託した外部企業のプログラムに問題があったほか、サーバのCPU不足が原因で不具合が発生。サーバを入れ替え、CPUを強化するなどの対策を行った。 リニューアルに合わせ、伊藤忠テクノソリューション

    ニトリ通販サイト、リニューアルで不具合 5日経っても再開できず
    luccafort
    luccafort 2015/06/23
    リニューアル後に実装予定の内容がそこそこ重いのでなんか闇を感じる。鯖のスペックそのままでこれとこれとこれ追加してね、期限はこれで値段はこれでビタイチ変えないのでそのつもりでヨロ的な。ブラック…
  • みずほ、週末にシステム統合「障害起こさない」 : ニュース : マネー・経済 : YOMIURI ONLINE(読売新聞)

    みずほフィナンシャルグループ(FG)の佐藤康博社長は25日、都内で開いた株主総会で、今週末に行うシステム統合に関し、「過去に起こしたシステム障害について非常に重い責任を負っている。今後二度と(トラブルを)起こさない決意で迎える」と述べた。 みずほFGは、傘下のみずほ銀行とみずほコーポレート銀行が7月1日に合併するのを前に、今月29日午前0時から7月1日午前8時まで、現金自動預け払い機(ATM)を含むすべてのオンラインサービスを一時休止して、システム統合を実施する。 みずほは、第一勧業、日興業、富士の旧3行を現在の2行体制へと移行した2002年4月と、東日大震災後の11年3月の計2回にわたり、大規模なシステム障害を起こした。

    luccafort
    luccafort 2013/06/26
    これは綺麗な死亡フラグ。当日が楽しみですね!()
  • 株式会社IDCフロンティア

    IDCフロンティアのクラウドサービスが政府情報システムのためのセキュリティ評価制度(ISMAP... データセンター 2024年01月10日 【接続先追加】「バーチャルブリッジ」に主要IX事業者などの他事業者接続が追加 データセンター 2024年01月10日 令和6年能登半島地震の影響により、被災された地域のお客さまがご利用中のサービスについて支援措置を実施します。 サービス 2024年01月05日 新年のご挨拶 代表取締役社長 鈴木 勝久 その他 2024年01月04日 1月17日~19日に福岡で開催される「JANOG53 in Hakata」にブース出展します その他 2023年12月20日 ZDNET Japan Business&IT ClassWork supported by ... その他 2023年12月15日 IDCフロンティア、「AIサービスのためのデジタルインフラ」を

    株式会社IDCフロンティア
    luccafort
    luccafort 2012/06/25
    人的ミスに関しては仕方ないとしても影響範囲を限定するチェックはこういうところでは必須だと思うわけだが…そこら辺の危機意識とかが緩かったんだろうなぁ。
  • 1