エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Redshiftの論理パーティション - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Redshiftの論理パーティション - Qiita
2016年7月時点で、Redshiftには論理パーティションの機能がありません。 それでは、pvログのようにデー... 2016年7月時点で、Redshiftには論理パーティションの機能がありません。 それでは、pvログのようにデータ量が非常に大きいテーブルは、Redshiftではどのように扱えば良いのでしょうか?例えば、Hiveでは、月毎(日毎)にパーティションを作成しておき、月単位(日単位)でデータを分けておくというアプローチが一般的だと思います。が、論理パーティションの機能がないRedshiftでは、このアプローチを取ることができません。 答えは、ソートキーを正しく設定するです。特に、pvログのような時系列データの場合は、タイムスタンプ列をソートキーに設定します。例えば、タイムスタンプ列timeをソートキーに設定しておけば、 のように指定することで、Redshiftは2016年4月1日以降のデータだけをスキャンします。タイムスタンプ列timeにソートキーを設定していない場合、テーブルのフルスキャンが発