(閉じる)

タグ :

コンピュータ・IT 79 users このエントリーをはてなブックマークに追加

Kazuho@Cybozu Labs: アクセスログからアテンション(注目情報)をデータマイニングする手法について

多数のユーザーの行動記録からアテンション情報(注目されているデータが何か)をデータマイニングしたいというのは、大量のデータを扱っているウェブサイトにおいては自然と出てくる要求です。そこで、先月末にサービスを終了したサービスパストラック」において使用していた、アクセスログから注目度(人気度)の高いウェブページや人名等のキーワードを抽出するためのアルゴリズムを紹介しておきたいと思います。 たとえばはてなブックマークのような、ユーザーの能動的な行為(「ブックマークする」という作業)から注目情報を抽出するのは決... > このページを見る

最終更新時間: 2010年11月11日15時28分
▼ブログで紹介する

みんなのブックマーク 人気(0) 新着

  • 良くある急上昇ワードとかの類かな。メモ。 2010/12/16
  • パストラックが使用していたアルゴリズム。機能によって指数を変えていくことで調整をしていた 2010/12/12
  • 注目度指数 = 単位時間内のヒット数 × (単位時間内のヒット数/長期間のヒット数)^2 2010/11/15
  • ランキング用の注目度指数の計算式。式を用意して、パラメータにより適した結果が得られるようチューニング 2010/11/15
  • 単位時間内のヒット数 × (単位時間内のヒット数/長期間のヒット数)2 2010/11/13
  • よくらからない 「注目度指数 = 単位時間内のヒット数 × (単位時間内のヒット数/長期間のヒット数)^2」 っていうのは、 =単位時間内のヒット数^3/長期間のヒット数^2 と同じ?それとも… 2010/11/12
  • ] 2010/11/12
  • 指数とか偏差とか逆数とか混ぜていい感じのランキングつくるの楽しい。 2010/11/12
  • 訪問データセットから注目度を算出 2010/11/11
  • 指数とか偏差とか逆数とか混ぜていい感じのランキングつくるの楽しい。 2010/11/11

このブックマーク一覧を非公開にするには?

はてなブックマークはオンラインでブックマークを管理・共有できる無料サービス。自宅、職場、外出先、どこからでも同じブックマークにアクセスできます。ユーザーはみんなでブックマークを共有して効率良く情報収集しています。あなたもはてなブックマークを始めてみませんか?