タグ

ブックマーク / treasure-data.hateblo.jp (1)

  • データサイエンティストのためのHiveQL分析クエリテンプレート その4 - トレジャーデータ(Treasure Data)ブログ

    *トレジャーデータはデータ収集、保存、分析のためのエンドツーエンドでサポートされたクラウドサービスです。 データサイエンティストのためのHiveQL分析クエリテンプレートシリーズ: その1, その2, その3, その4, その5, その6 C. バスケット分析 バスケット分析はアイテム間の関連度を知るための重要な指標であり,レコメンデーションのロジックとしても利用されています。ここでは最も単純な共起頻度による集計パターンを示します。 組み合わせ まずは1つのテーブル内での組み合わせを求める事を考えます。以下の例は login ログに対して,同じ月で日が異なる日付の組み合わせ(同じ日付同志は除外)を全網羅しようとしたものです。この方法はかなり力業となりますのでレコード数が多いデータには適応できていないことに注意してください。 SELECT t1.d AS a, t2.d AS b FROM

    データサイエンティストのためのHiveQL分析クエリテンプレート その4 - トレジャーデータ(Treasure Data)ブログ
    akanehara
    akanehara 2014/06/04
  • 1