[B! 障害] nekomoriのブックマーク

【1月23日追記】12月23日、24日に発生しました障害に関するご報告

いつもSkebをご利用いただき、誠にありがとうございます。 12月23日12時よりskeb.jpにアクセスできない大規模な障害が発生しておりましたが、12月24日07時に復旧いたしました。 12月23日、および12月24日が納品期限のリクエストは納品期限を12月25日23時59分までに延長させていただきます。みなさまには多大なご迷惑をお掛けしましたことをお詫び申し上げます。本障害につきまして詳細をご報告させていただきます。概要日時: 12月23日12時22分〜12月24日7時00分 (JST) ダウンタイム: 18時間38分内容: skeb.jpにアクセスできない不具合原因: SkebはすべてのサーバとシステムをHerokuに設置していたが、障害発生時刻より同サービスのアカウントが理由の通知なく利用できなくなった。解決: Herokuの一切の利用を中止し、すべてのサーバとシステ

nekomori 2022/12/24

リンク

NTTデータ子会社のクラウドが壊滅、ストレージのバグで戸籍や税務などのデータ全消失 : 痛いニュース(ﾉ∀`)

NTTデータ子会社のクラウドが壊滅、ストレージのバグで戸籍や税務などのデータ全消失 1 名前：ベスタ(茸) [US]：2019/12/05(木) 17:18:57.47 ID:yztuQHN80 日本電子計算株式会社（通称：JIP）とは、NTTデータの子会社、いわゆる「デー子」である。概要 1962年に日本証券金融株式会社の電算室が独立し「日本電子計算」として分社化するかたちで設立された。 2012年にNTTデータにより公開買付（TOB）が行われ約100億円で買収された。この買収は「NTTデータは銀行業には強いが証券業には弱い」というのを補うためだとしている。 2019年12月4日午前11時ごろ、同社が運営するクラウドサービスが吹っ飛び、その上で動く全国の自治体システムも吹っ飛び、全国約50の自治体で戸籍管理や税務処理、医療保険、図書館などのデータが消失した。 2019年12月4日午後

nekomori 2019/12/06

リンク

無停電機能を外したまま電源設備を更新、楽天などに影響した九電系データセンター障害の原因判明

九州電力の通信子会社QTnet（福岡市）のデータセンターで障害が発生した問題について、2019年11月26日に停電の原因が判明した。11月23日朝、電源設備の更新作業中に通常時の電源が遮断したことで予備電源に切り替わったが、電源の切り替え時に作動する無停電機能を外して作業していた。その結果、7秒間ほど電源が停止し、利用各社のシステム障害につながった。今回の障害で、事業継続を安定させる目的で使うはずのデータセンターに、想定外の盲点があると明らかになった格好だ。QTnetによると、影響を受けた約260の企業・自治体の中で、2019年11月26日10時時点で22社が復旧できていないという。今回の障害の影響で、クレジットカードの楽天カードやスマホQR決済の楽天ペイが11月23日朝に利用できなくなった。楽天ペイは11月25日朝に一時的に使えなくなったり、楽天カードは現在も一部機能が利用できなかっ

nekomori 2019/11/26

障害

リンク

システム移行メンテナンスにおける一部時間帯に更新されたデータが消失した原因のご報告 - Mackerel お知らせ #mackerelio

Webオペレーションエンジニアの id:y_uuki です。 2017年8月7日に、メンテナンスの完了報告及びデータ消失とカスタムダッシュボード、式監視の不具合に関するお詫びにてお知らせしたメンテナンス作業時間中のデータ消失について、本エントリにて技術的な観点から原因の詳細をお伝えいたします。概要 2017年8月7日(日本時間)に、オンプレミスデータセンターからAWSへ、Mackerelをシステム移行するためのメンテナンスを実施しました。メンテナンス開始時間である14:30以降のデータ同期に失敗していたPostgreSQLデータベースサーバへの意図しないフェイルオーバーが、メンテナンス作業途中の15:30に発生した結果、14:30から15:30の間に更新されたデータを消失しました。移行作業後のアプリケーションの動作確認中に、特定時間帯のデータを消失していることを発見し、データの復旧を

nekomori 2017/08/15

リンク

「障害に捨てるところなし」というお話をしました - Cybozu Inside Out | サイボウズエンジニアのブログ

どうも！アプリケーション基盤チームの@yokotasoです。 3月11日にBattle Conference U30 というイベントでお話をさせていただきました。準備がてら作成したディスクリプションを公開します。キーノートはSpeakerDeckからどうぞ!こちらも参考にしていただければ、嬉しい限りです。では、どうぞ！障害にすてるところなしサイボウズ株式会社の横田です。「障害に捨てるところなし」というタイトルで少しお話させていただきます。お手柔らかによろしくお願いします。運用障害の話まずはじめに、今回のお話をするにあたりまして運用障害でご迷惑をおかけしたみなさま、大変申し訳ありません。より快適に利用いただけるサービスを目指しまして、対策・改善をおこなっております。これからも、弊社製品をよろしくお願いいたします。クラウドの規模と稼働率障害の話をする前に、サイボウズの

nekomori 2017/03/15

障害

リンク

当社複数サービスサイトの表示不可等の事象について | GMOインターネット株式会社

【最終報告】1月17日（日） 14:30現在この度は当社複数のサービスに障害が発生し、多くの皆様にご迷惑をお掛けいたしましたこと、心よりお詫び申し上げます。また発生から正確な状況の確認や対策に時間を要し、復旧が遅れましたことを深くお詫び申し上げます。障害が発生しておりました全てのサービスにおいて安定稼動を確認いたしましたので、改めて以下に本件のご報告をさせていただきます。 ■発生時刻： 2016年1月16日 14:15頃～1月17日 14:25 ■影響範囲：以下のサービスをご利用のお客様・お名前.com：https://www.onamae.com/ ・かんたんサーバー：http://www.kantan-server.jp/ ・レンサバ.com：http://www.rensaba.com/ ・InterQ Office：http://biz.interq.or.jp/ ・e

nekomori 2016/01/17

障害

リンク

9月20日に発生したAmazonクラウドのDynamoDB障害。原因はセカンダリインデックス増大によるメタデータ処理のパンク

9月20日に発生したAmazonクラウドのDynamoDB障害。原因はセカンダリインデックス増大によるメタデータ処理のパンク Amazonクラウドが提供しているDynamoDBは、キーバリュー型のNoSQLデータベースサービスです。運用管理はクラウドに任せられて簡単に利用でき、高速かつ非常に大規模なスケールで展開できることなどを特長とする、クラウドならではのサービスの1つです。そのDynamoDBで、米東リージョンにおいて9月20日午前2時頃（太平洋夏時間）から午前7時頃まで障害が発生。DynamoDBを利用しているEC2 Auto Scaling、Simple Queue Service、CloudWatch、そしてコンソールなどにも一時的な障害が発生していました。また、この障害はAmazonクラウドを利用している他社のさまざまなサービスにも影響を与えたと報じられています。 Amaz

nekomori 2015/09/28

リンク

富士通の旗艦、館林データセンターが電源障害でダウンし、金融機関やニフティクラウドに影響。日経コンピュータ誌

富士通の旗艦、館林データセンターが電源障害でダウンし、金融機関やニフティクラウドに影響。日経コンピュータ誌先月、6月7日の午前6時頃、りそな銀行、ソニー銀行、東京スター銀行など複数の国内金融機関でシステム障害が発生しました。ほぼ同時刻に、ニフティのブログサービス「ココログ」や「ニフティクラウド」などにも大規模障害が発生しました。金融機関の障害についてはこの日、ScanNet Securityがいち早く報じています。複数の銀行で同時間帯に障害が発生、現在は復旧（りそな銀行ほか） | ScanNet Security (事件、インシデント・情報漏えいのニュース) 同じ日、ニフティの障害については発表が行われています。大規模障害の発生について｜ニュースリリース｜ニフティ株式会社：ニフティとなら、きっとかなう。ほぼ同時刻に発生したこれらの障害は共通の原因があると推測されますが、どこでどんな

nekomori 2012/07/23

リンク

うるう秒の挿入で複数のサイトに障害が発生

インターネットに大混乱を引き起こすには、ほんの1秒あれば十分だ。グリニッジ標準時（GMT）7月1日午前0時、協定世界時にうるう秒が追加されたことで、複数の人気ウェブサイトやソフトウェアプラットフォームでサイトの混乱が発生したようだ。国際地球回転及び基準座標系事業（International Earth Rotation and Reference Systems Service）が行うこの時間調整は、原子時計をムラのある地球の自転速度と一致させるために必要だ。1972年に時間調整が導入されて以来、何度となくうるう秒が追加されてきた。うるう秒が引き起こした障害の影響を受けたサイトには、人気のリンク共有サイトRedditが含まれる。Redditは、Javaで構築されたオープンソースデータベース「Apache Cassandra」に問題が発生したのはうるう秒が原因、とTwitterで述べた