タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

hiveに関するmalmacのブックマーク (1)

  • Top N 件をとる効率的なHive / Prestoクエリ - Qiita

    遅いクエリを眺めてたら、Prestoでrow_numberを使ってナンバリングをした後に、rank<=10といったことをしているクエリが多々あった。 例えばPrestoだと、row_numberは全レコードを保持して処理するので、件数が多ければ多いほど遅いし、メモリ消費量もあれなことになる。例えば数億件でrow_numberをすると2~300GBピーク時に使ってそうだ。 https://github.com/prestodb/presto/issues/5298 なので、効率的なPrestoとHive0.13のクエリを書いておく。

    Top N 件をとる効率的なHive / Prestoクエリ - Qiita
    malmac
    malmac 2020/08/18
  • 1