タグ

2022年12月20日のブックマーク (1件)

  • BigQueryでユニーク数を推測するHyperLogLog++について - LCL Engineers' Blog

    バックエンドエンジニアの高橋です。 弊社ではデータ分析・可視化のためのデータ基盤としてBigQueryを用いていますが、その中でHyperLogLogアルゴリズムを活用したユニーク数の計測における工夫についてご紹介します。 なお、HyperLogLogアルゴリズム自体については詳細に理解していなくても実用上困ることは少ないのでこの記事では扱いません。詳細についてはネット上の記事を探ったりGoogleが公式に出している論文を当たるといいです。(私も説明できるほど詳細な理解はしてないです) ユニーク数の計測の面倒臭さ Webサイトのアクセス解析において重要な指標としてPV(ページビュー数)とUU(ユニークユーザー数)がありますが、PV数は単純に足し合わせでカウントすればいいのに対し、UUについては重複を排除した上でカウントする必要があるので分析上の取り扱いが面倒です。 簡単なお題で考えてみまし

    BigQueryでユニーク数を推測するHyperLogLog++について - LCL Engineers' Blog
    muddydixon
    muddydixon 2022/12/20
    知らなかった HyperLogLog++