タグ

障害に関するmamuchiのブックマーク (3)

  • Dropboxが2日以上ダウン。原因はメンテナンス用スクリプトのミス

    オンラインストレージサービスのDropboxが、米国時間1月10日の午後から約2日間にわたって障害を引き起こしていました。直接の原因は、OSをバージョンアップするために実行したメンテナンス用スクリプトにバグがあったことです。 障害の状況を時系列で追いつつ、原因についての報告を見てみましょう。 約48時間続いた復旧作業 障害の状況報告については、Dropbox Tech Blogの「Dropbox Status Update」でまとめられています。ポイントごとに引用し、訳しました。 障害発生が認識されたのは、米太平洋時間の午後6時40分です。後になって分かるのですが、この日の5時半に障害の原因となったメンテナンスが始まっています。それから1時間後にDropboxのダウンが発覚します。 1/10 at 6:40pm PT: We are aware that the Dropbox site

    Dropboxが2日以上ダウン。原因はメンテナンス用スクリプトのミス
    mamuchi
    mamuchi 2014/01/14
    ローカルにファイルあったから大して困らなかったけど業務では使えないなー。
  • システム障害対応に対する考え方について

    ヴィス @2vis 社内システムが普通に12月32日なって 「どーなってるんですか!」とユーザに言われて、 しらねーよ俺作ってねーよとは言えず呼び出されたことがw 2014-01-01 02:57:47 ヴィス @2vis 後、汎用機で1月1日になったら急に送受信が止まって呼び出されたときに… MMCFに「expire:20〷」って設定がされてた。 訳:期間満了って事 こんな地雷設定しこむんじゃねー!と叫びたくなったよw 2014-01-01 03:00:57

    システム障害対応に対する考え方について
    mamuchi
    mamuchi 2014/01/07
    変更するって事は影響があるって事です。変更をかけることの責任分散をできればした方が良いです。
  • DevOps at ChatWork

    Developers Summit 2013 Summer (2013年8月1日渋谷にて開催)のS1セッション「DevOpsは開発現場とビジネスの間に何を生むか?」の新野さんの登壇資料です。 【セッション概要】 DevOpsというムーブメントが示すものとはいったい何なのかを改めて整理しつつ、それを構成する技術要素、およびそれを構成する技術者の姿勢から、その先にどのような成果が生まれるはずなのか、講演者のさまざまな意見を聞いていく。

    DevOps at ChatWork
  • 1