弊社では少し前にサーバをAWSに移行しました。 それまでは継ぎ足し継ぎ足しで作っていたものを再構成しての移行だったので、この機会にサーバの監視体制についても一新しました。 この記事ではそのときどういったことを考えて設計したかをお伝えできればと思います。 はじめに決めておくとよいこと サーバの監視体制を設計するにあたり、先に決めておくとよいことがいくつかあります。 目標稼働率 サービス提供時間中はいつでも使えることが理想です。 しかし、サーバを運用していくうえで予期せぬ障害というものはつきものなので、100%いつでも完全に使える状態にしておくのは大変な労力を伴います。 大規模なサービスならともかく、小規模のサービスでは100%動作するように作るのはコストに合わないことが多いと思います。 そこで、どのくらいの頻度で、どのくらいの時間止まることを許容するかといったポリシーを決めておくと設計の際に
![サーバの監視システムを設計したときに考えたこと - ハウテレビジョンブログ](https://cdn-ak-scissors.b.st-hatena.com/image/square/f418d439cccea08aaf420fcf8be0233033fa32b5/height=288;version=1;width=512/http%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fx%2Fxyz_i%2F20151120%2F20151120174231.png)