くわ @kuwamain ちなみに去年あった同じような事件とは違うサーバーです x.com/kuwamain/statu… x.com/kuwamain/statu… テスト運用していたGPUサーバー(ほかにも10台ぐらい)が全部90度になっていた 落ちてなかったのが奇跡... x.com/kuwamain/statu… 2024-05-08 09:20:32 くわ @kuwamain 今日のシステム障害の流れ 空調が死ぬ(ダイキンのエアコンって60日で切れるの?) ↓ 室温が上がりサーバー機が次々にオーバーヒートして停止 ↓ 9割以上の実機が死に冗長化が保てなくなりシステム停止 ↓ 全落ち☆ 簡単に言うと「我が名はアシタカ。節電のためにエアコンを止めた!」が発生した模様 2023-08-16 17:14:24
![「朝からサーバーからえぐいほど警告が来ていると思ったら室温がやばい」→その原因が判明したが非常にシンプルかつ深刻な事態だった](https://cdn-ak-scissors.b.st-hatena.com/image/square/db20f3247f5c95f01c88c4199ec950bf24e2fa1a/height=288;version=1;width=512/https%3A%2F%2Fs.togetter.com%2Fogp2%2F1ce0d8ccd2f2e1b2ddc1a2a21e5cea39-1200x630.png)