タグ

ブックマーク / www.publickey1.jp (7)

  • GitLab.comが操作ミスで本番データベース喪失。5つあったはずのバックアップ手段は役立たず、頼みの綱は6時間前に偶然取ったスナップショット - Publickey

    果たしてGitLab.comで何が起きたのでしょうか? これまでの経緯をまとめました。 スパムによるトラフィックのスパイクからレプリケーションの不調へ GitLab.comは今回のインシデントについての詳細な経過を「GitLab.com Database Incident - 2017/01/31」で公開しています。また、もう少し整理された情報がブログ「GitLab.com Database Incident | GitLab」にも掲載されています。 これらのドキュメントを軸に、主なできごとを時系列に見ていきましょう。 1月31日16時(世界協定時。日時間2月1日午前8時)、YP氏(Yorick Peterse氏と思われる)はPostgreSQLのレプリケーションを設定するためにストレージの論理スナップショットを作成。これがあとで失われたデータを救う幸運につながります。 1月31日21時

    GitLab.comが操作ミスで本番データベース喪失。5つあったはずのバックアップ手段は役立たず、頼みの綱は6時間前に偶然取ったスナップショット - Publickey
    moccai
    moccai 2017/02/03
  • ING銀行の基幹データセンター、消防訓練で消火ガス噴射の衝撃音が大量のハードディスクとサーバを破壊。ATMや決済サービスが停止に

    ING銀行の基幹データセンター、消防訓練で消火ガス噴射の衝撃音が大量のハードディスクとサーバを破壊。ATMや決済サービスが停止に オランダに社を置く大手金融機関INGの基幹データセンターで、消防訓練のため消火ガスの噴射をしたところ予想以上に大規模な衝撃音が発生。大量のハードディスクやサーバが故障したと報道されています。 Fire drill knocks ING bank's data centre offline - BBC News ING Bank pays back fees to clients affected by system crash in Romania A Loud Sound Just Shut Down a Bank's Data Center for 10 Hours | Motherboard これにより9月10日土曜日の朝から夜まで、同社のATMやカード

    ING銀行の基幹データセンター、消防訓練で消火ガス噴射の衝撃音が大量のハードディスクとサーバを破壊。ATMや決済サービスが停止に
    moccai
    moccai 2016/09/14
  • マイクロソフト、Skypeをピアツーピアからクラウドベースのアーキテクチャへ移行中。数カ月以内に完了予定

    2002年に登場したSkypeは、面倒な設定をすることなくインターネットを通じて世界中のどこからでも高品質な音声通話ができる事実上初めてのソフトウェアとして、非常に大きなインパクトをもって受け入れられました。 インターネットに接続すれば無料で通話できるSkypeは、電話会社による音声通話のビジネス、特に国際通話のビジネスを崩壊させると言われたものです。 そのSkpyeの最大の特徴は、中央に大きなサーバを置いてユーザーや通信などを集中管理することがシステム構築の常識だった時代に、インターネット上に散らばるサーバを相互に接続して分散管理するピアツーピアのアーキテクチャを採用したことにあります。 ピアツーピアのアーキテクチャが、インターネットワイドで何万人ものユーザーが利用する大規模システムを支えることができるのだ、ということを証明したことも、Skypeのもうひとつのインパクトだったと言えます。

    マイクロソフト、Skypeをピアツーピアからクラウドベースのアーキテクチャへ移行中。数カ月以内に完了予定
    moccai
    moccai 2016/07/25
  • 自動改札機の運賃計算プログラムはいかにデバッグされているのか? 10の40乗という運賃パターンのテスト方法を開発者が解説(前編)

    自動改札機の運賃計算プログラムはいかにデバッグされているのか? 10の40乗という運賃パターンのテスト方法を開発者が解説(前編) ふだん何気なく使っている鉄道。改札を降りるときにICカードを自動改札にかざすと、「ピッ」という音と共に一瞬のうちに運賃を計算してくれます。けれど、複数の路線を乗り継いだり、途中で定期券区間が挟まっていたりと、想像しただけでもそこには膨大な組み合わせがあります。それでも運賃計算プログラムはわずか一瞬で正しい運賃計算が求められ、バグがあったら社会的な一大事にもつながりかねません。 爆発的な計算結果の組み合わせがあるはずの運賃計算プログラムは、どうやってデバッグされ、品質を維持しているのでしょうか? 9月12日から14日のあいだ、東洋大学 白山キャンパスで開催された日科学技術連盟主催の「ソフトウェア品質シンポジウム 2012」。オムロンソーシアルソリューションズ 幡

    自動改札機の運賃計算プログラムはいかにデバッグされているのか? 10の40乗という運賃パターンのテスト方法を開発者が解説(前編)
    moccai
    moccai 2012/09/24
  • 富士通の旗艦、館林データセンターが電源障害でダウンし、金融機関やニフティクラウドに影響。日経コンピュータ誌

    富士通の旗艦、館林データセンターが電源障害でダウンし、金融機関やニフティクラウドに影響。日経コンピュータ誌 先月、6月7日の午前6時頃、りそな銀行、ソニー銀行、東京スター銀行など複数の国内金融機関でシステム障害が発生しました。ほぼ同時刻に、ニフティのブログサービス「ココログ」や「ニフティクラウド」などにも大規模障害が発生しました。 金融機関の障害についてはこの日、ScanNetSecurityがいち早く報じています。 複数の銀行で同時間帯に障害が発生、現在は復旧(りそな銀行ほか) | ScanNetSecurity (事件、インシデント・情報漏えいのニュース) 同じ日、ニフティの障害については発表が行われています。 大規模障害の発生について |ニュースリリース|ニフティ株式会社:ニフティとなら、きっとかなう。 ほぼ同時刻に発生したこれらの障害は共通の原因があると推測されますが、どこでどんな

    富士通の旗艦、館林データセンターが電源障害でダウンし、金融機関やニフティクラウドに影響。日経コンピュータ誌
    moccai
    moccai 2012/07/23
  • さくらのクラウド、新ストレージでは性能限界テストをやりやすく、自社開発をまずは採用。さくらの夕べで参加者に説明

    さくらのクラウド、新ストレージでは性能限界テストをやりやすく、自社開発をまずは採用。さくらの夕べで参加者に説明 さくらインターネットは25日、都内で同社のユーザー会「さくらの夕べ」を開催。冒頭で同社代表取締役社長 田中邦裕氏は、さくらのクラウドのストレージ障害について「そもそも製品選択のところで十分にできなかった。その結果、ストレージの性能が十分でなかったなどのトラブルにつながった。大変申し訳ありませんでした」と、参加者の前で頭を下げました。 トラブルの経緯を説明後、新ストレージの概要を発表 トラブルに至った原因として、自社で十分なテストができなかったこと、ベンダに依存したことで自社での問題解決ができなかったこと、などがあらためて示されました。さくらのクラウドのストレージ障害については、以下の関連記事をご参照ください。 「さくらのクラウド」で続いていたストレージ障害、報告書をさくらインター

    さくらのクラウド、新ストレージでは性能限界テストをやりやすく、自社開発をまずは採用。さくらの夕べで参加者に説明
    moccai
    moccai 2012/06/27
  • [速報]mixiが障害の経緯を発表。原因はお盆のアクセス急増ではなく、memcachedの異常終了

    8月10日の17時20分頃から12日未明までの長時間にわたり、サービスが利用不能もしくは利用しにくい状況になっていた「mixi」。数度の断続的な復旧ののちに、日12日午前1時50分頃には復旧が完了し、現時点で全面的に復旧しているようです。 その障害の経緯について株式会社ミクシィの広報からプレスリリース「『mixi』のアクセス障害のお詫び及び復旧に関するお知らせ」として発表されました。 原因はアクセスの急増ではなかった プレスリリースの中で、今回の障害の原因は以下のように説明されています。 『mixi』のデータベースへの負荷軽減のために導入しているデータキャッシュシステムが複数同時に異常終了したことに伴い、データベースへの負荷が急増したため『mixi』を閲覧しづらい状態となりました。 高負荷かつ特殊な状態でのみデータキャッシュシステムの異常終了が発生していたため、根的な原因の究明に時間が

    [速報]mixiが障害の経緯を発表。原因はお盆のアクセス急増ではなく、memcachedの異常終了
    moccai
    moccai 2010/08/12
  • 1