多数のユーザーの行動記録からアテンション情報(注目されているデータが何か)をデータマイニングしたいというのは、大量のデータを扱っているウェブサイトにおいては自然と出てくる要求です。そこで、先月末にサービスを終了したサービス「パストラック」において使用していた、アクセスログから注目度(人気度)の高いウェブページや人名等のキーワードを抽出するためのアルゴリズムを紹介しておきたいと思います。 たとえばはてなブックマークのような、ユーザーの能動的な行為(「ブックマークする」という作業)から注目情報を抽出するのは決... > このページを見る
最終更新時間:
2010年11月11日15時28分
みんなのブックマーク 人気(0) 新着
-
良くある急上昇ワードとかの類かな。メモ。
- パストラックが使用していたアルゴリズム。機能によって指数を変えていくことで調整をしていた
- 注目度指数 = 単位時間内のヒット数 × (単位時間内のヒット数/長期間のヒット数)^2
- ランキング用の注目度指数の計算式。式を用意して、パラメータにより適した結果が得られるようチューニング
- 単位時間内のヒット数 × (単位時間内のヒット数/長期間のヒット数)2
- よくらからない 「注目度指数 = 単位時間内のヒット数 × (単位時間内のヒット数/長期間のヒット数)^2」 っていうのは、 =単位時間内のヒット数^3/長期間のヒット数^2 と同じ?それとも…
- ]
- 指数とか偏差とか逆数とか混ぜていい感じのランキングつくるの楽しい。
- 訪問データセットから注目度を算出
-
指数とか偏差とか逆数とか混ぜていい感じのランキングつくるの楽しい。






![[ビームス] BEAMS EGO BAAG JAPAN / アテンションエコバッグ 11610047633 88 19 (BLACK/ONE SIZE)](http://ecx.images-amazon.com/images/I/41J1SNNxMML._SL75_.jpg)

