[B! hive] malmacのブックマーク

malmac id:malmac

hiveに関するmalmacのブックマーク (1)

Top N 件をとる効率的なHive / Prestoクエリ - Qiita
遅いクエリを眺めてたら、Prestoでrow_numberを使ってナンバリングをした後に、rank<=10といったことをしているクエリが多々あった。例えばPrestoだと、row_numberは全レコードを保持して処理するので、件数が多ければ多いほど遅いし、メモリ消費量もあれなことになる。例えば数億件でrow_numberをすると2~300GBピーク時に使ってそうだ。 https://github.com/prestodb/presto/issues/5298 なので、効率的なPrestoとHive0.13のクエリを書いておく。
malmac 2020/08/18
hive
リンク
1

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx