タグ

2021年1月7日のブックマーク (1件)

  • 【AWS Redshift】導入前に知っておくべきこと - packpak’s diary

    AWS Redshiftを導入する前に知っておくべき、AWS Redshift の特性、長所、他所を開発・運用してきた中で要所っぽいところをいくつかTips的にまとめた。 字量が非常に多くて申し訳ないが、参考になれば。 RDBに比べて有用なケース/苦手なケース 下記のケースに合致する。 SQL文をベースとした、複雑で演算コストの高いETL(分析用途用のデータ加工処理の通称)の実行 BIツールのような、3~5列程度の列を利用した参照クエリの実行。 下記のケースは向かない。 短時間で非常に多くのクエリを実行するアプリケーション(1秒に5~10クエリなど)のバックエンド 短時間で非常に多くのCommitを実行するアプリケーション(Webフレームワークが勝手に)のバックエンド 一度に多くの列を取得するクエリを発行するアプリケーション(CSV出力など)のバックエンド 性能について クエリの性能 1つ

    【AWS Redshift】導入前に知っておくべきこと - packpak’s diary
    tgk
    tgk 2021/01/07
    「取得する列数が増えるほど性能劣化。15列を超えたぐらいでもう目に見えるほど遅い」「クラスタ再起動直後、ANALYZEによる統計情報が全て無効になっていることがある」「VACUUM は同時に 1つしか流せない」