タグ

fault toleranceに関するfubar_fooのブックマーク (6)

  • 約60時間を非常用電源設備で乗り切った石狩データセンターの奇跡

    2018年9月6日に北海道を襲った震災により、停電状態に陥ったさくらインターネットの石狩データセンターに対し、9月8日ようやく電力供給が再開された。想定を超えた約60時間を非常用電源設備で乗り切り、インフラ事業者としての矜持を見せた石狩データセンターの「奇跡」について、改めてきちんと説明していきたいと思う。 卓越したオペレーション能力で「想定外」を「想定内」に 2011年11月に開設された石狩データセンターは、数多くのサーバーを収容するさくらインターネットの基幹データセンターになる。開設当時はソーシャルゲームの普及でサーバーの需要がうなぎ登りだったほか、環境に配慮したエコなデータセンターが求められていた。こうしたニーズに対応する石狩データセンターは、寒冷地のメリットを活かした外気冷却と東京ドーム1個分に相当する広大な敷地を用いたスケーラビリティが大きな売りだった。私も開設時と増設時で2回ほ

    約60時間を非常用電源設備で乗り切った石狩データセンターの奇跡
  • 米Yahoo!がシステムダウンしない5つの理由

    昨年の10月14日、米Yahoo!のトップページがダウンしたと、米Huffington Postが記事「Yahoo DOWN: Yahoo.com Outage Reported」で伝えました。米Yahoo!にとってトップページがダウンすることはきわめてまれなことで、この件が発生するまでほぼ10年にわたりトップページのダウンは起きていなかったと言われています。 その米Yahoo!はシステムダウンを防ぐためにどのような取り組みをしているのか? 米オライリーが主催したイベント「Velocity 2011」で、Yahoo!サービスエンジニアリング部門のVice President、Jake Loomisが行ったセッション「Why the Yahoo FrontPage Went Down and Why It Didn't Go Down For up to a Decade before Th

    米Yahoo!がシステムダウンしない5つの理由
  • / WSJ日本版 - jp.WSJ.com - Wsj.com

    アパラチコラで過ごす優雅な時間 メキシコ湾沿いの入り江に面した米フロリダ州の小さな町アパラチコラ。こじんまりした海辺のホテルに宿泊し、バーで新鮮なシーフードを味わえるほか、地ビールの醸造所もある。綿花や漁業で栄えたこの町には、グリークリバイバル(ギリシャ建築への回帰)様式の優雅な住宅が散見される。数キロの沖合に浮かぶセントジョージ島には白い砂浜が広がる。

  • グーグルが構築した大規模システムの現実、そしてデザインパターン(4)~デザインパターン編

    グーグルが「Evolution and Future Directions of Large-Scale Storage and Computation Systems at Google」(グーグルにおける、大規模ストレージとコンピュテーションの進化と将来の方向性)という講演を、6月に行われたACM(米国計算機学会)主催のクラウドコンピューティングのシンポジウム「ACM Symposium on Cloud Computing 2010」で行っています。 講演の内容を4つの記事(MapReduce編、BigTable編、教訓編、デザインパターン編)で紹介しています。この記事は教訓編の続き、デザインパターン編です。 大規模システムデザインの指針 よりよく使ってもらうためのインフラのデザインと開発方法を考えてみよう。 インフラに対する機能の要望についてさまざまなグループと話すと、多くのリクエ

    グーグルが構築した大規模システムの現実、そしてデザインパターン(4)~デザインパターン編
  • 無停止環境を実現するVMware FTとは

    主要サーバ仮想化ソフトウェアであるVMware Infrastructure 3の後継バージョン、「VMware vSphere 4」が登場した。「クラウドOS」をうたい、基機能を大幅に強化するとともに、重要な機能追加を行った。連載では、このvSphere 4の主要機能を解剖する VMwareではシステムの可用性を高めるためのアプローチとして、これまでにも さまざまな機能や製品を提供してきた。物理マシン故障時の フェイルオーバ機構を提供する「VMware HA」、バックアップ業務を効率的な方法で支援する「VMware Consolidated Backup」、効果的な ディザスタリカバリ・ソリューションを提供する「VMware vCenter Site Recovery Manager」などが提供されてきた。「VMware Fault Tolerance」(以下VMware FTと略記

    無停止環境を実現するVMware FTとは
  • 実録、ほぼ無停止なMySQLのフェイルオーバ (動画もあるよ) - (ひ)メモ

    レプリケーションしてるMySQLで、マスタやスレーブが障害停止した場合のリカバリプラン でも掲げたゴールである、「マスタが落ちてもぐーすか寝ていられるようにしたい」がほぼできたので、ほとんどサービスが停止することなく、フェイルオーバする様をスクリーンキャストに収めました。 埋め込みプレイヤーだと、小さくてわからないと思うので、リンク直接でみてください。 http://www.irori.org/pub/mysql-mm.mov 登場するホスト 登場するホストは2台、db901db902です。 最初は、db901が更新系クエリを受けるプライマリでdb900の浮動IPアドレスを持っています。 画面分割 画面は5分割しています。 左上 = 「select sysdate(),@@server_id」をdb900に対して(sleep 1しながら)延々と実行しまくりんぐ 右上 = ping -n

    実録、ほぼ無停止なMySQLのフェイルオーバ (動画もあるよ) - (ひ)メモ
  • 1