タグ

ブックマーク / treasure-data.hateblo.jp (2)

  • トレジャーデータで実践:Window関数(その1) - トレジャーデータ(Treasure Data)ブログ

    トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 はじめに トレジャーデータでは最新のアップデートにより,バッチクエリ(Hive)でもWindow関数をサポートするようになりました。また,アドホッククエリ(Presto)では元々Window関数をサポートしています。 記事で紹介したほとんどのクエリは Aggregate Functions(集約関数)のみを用いてきました。Window関数 は前述の集約関数とは似て非なる概念であり,この違いを理解し,うまく活用することでデータ分析の世界はさらに広まります。 使用するデータセット 今回使用するデータセットは「トレジャーデータで実践:Basket 分析」シリーズでも紹介した,以下の項目を持ったEC購買ログになります。このログにおいて, 「category」⊃ 「sub_category」⊃「goods_id」 の階層関

    トレジャーデータで実践:Window関数(その1) - トレジャーデータ(Treasure Data)ブログ
  • トレジャーデータで実践:Window関数(その2) - トレジャーデータ(Treasure Data)ブログ

    トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 前回は集約関数と比する形でWindow関数の紹介をしました。今回はWindow関数の記述および代表的な関数を分かりやすく説明していきます。 基形1:AGGR_FUNC() OVER (PARTITION BY c) ↑ Window 関数の最もシンプルな記法ですが,集約関数(ここでは COUNT) が OVER 句を伴って記述されています。また,GROUP BY 句がありません。 まずこの OVER 句は肝で,直前の集約関数がこの OVER上のグループに対して実行され,レコードに付与されています。 さらにOVER内の ( PARTITION BY c ) は GROUP BY c と同様にカラム c の取り得る値でグルーピングします。つまり Window 関数は SELECT 内で局所的に 「GROUP BY c

    トレジャーデータで実践:Window関数(その2) - トレジャーデータ(Treasure Data)ブログ
  • 1