こんにちは。FiNCデータ分析グループのこみぃです。 Redshiftはとても便利なんですが、自然に容量が増えていってしまって困るということはありませんか? 必要なデータを入れているのだからある程度増えていくのは仕方ないですが、データ量が増えれば増えるほどRedshiftのノード数を増やさないといけなくなる(つまり費用が増える)ので、抑えられるなら少しでも抑えたいですよね。 今日は、Redshiftで保持するデータ量の削減のためにFiNCで実施していることをお話しようと思います。 毎日vacuumをするRedshiftにはvacuumというコマンドがあります。 VACUUM Redshiftでは、DELETE文でレコードを削除した場合、vacuumコマンドを実行しない限りはその領域が再利用されません。 なので定期的にvacuumを実施する必要があります。この頻度はどのくらいが良いでしょうか
![Redshiftのディスク使用量削減大作戦](https://cdn-ak-scissors.b.st-hatena.com/image/square/7e4b160666546db42931ce65bc520a4343c6013f/height=288;version=1;width=512/https%3A%2F%2Fmiro.medium.com%2Fv2%2Fresize%3Afit%3A810%2F1%2A9w0L1NIGFkta9WGN-mCmCA.png)