タグ

推薦とRに関するsudo1101のブックマーク (2)

  • Collaborativefilteringwith r

    9. 協調フィルタリングの課題 1. データのスパース性・・・データが圧倒的に疎であること。以下の ような問題を引き起こす。 – コールドスタート問題・・・新しいアイテムやユーザが追加された時に 類似のアイテムを見つけるのが難しい問題。 – 少カバー率問題・・・ユーザの評価が少ないアイテムは類似するアイ テム等のレコメンデーションの提示が不可能になること。 – 同類推移問題・・・スパースなデータベースの場合、類似のユーザで あっても、全く同じアイテムを共に評価しないと類似であると判別され ない問題。 2. スケーラビリティ・・・ユーザ・アイテム行列は直ぐに巨大なものに なること。 3. シノニム・・・ほとんど同じだけど異なるとされている商品がレコメ ンド精度を下げる。 4. 灰色の羊・・・複数のタイプの人と一致するあいまいなユーザ、レ コメンドの恩恵にあずかれない人々 5. シリングアタッ

    Collaborativefilteringwith r
  • はてなブックマーク記事のレコメンドシステムを作成 PythonによるはてなAPIの活用とRによるモデルベースレコメンド - データ分析がしたい

    私は情報収集にはてなブックマークを多用しており、暇な時は結構な割合ではてなブックマークで記事を探してます。しかし、はてなブックマークは最新の記事を探すのは便利ですが、過去の記事を探すにはいまいち使えません。個人的には多少過去の記事でも自分が興味を持っている分野に関しては、レコメンドして欲しいと感じてます。 ありがたいことにはてなAPIを公開しており、はてなブックマークの情報を比較的簡単に取得できます。そこでこのAPIを利用して自分に合った記事を見つけるようなレコメンド機能をRとPythonで作成してみたいと思います。 利用するデータは、はてなAPIを使って収集します。具体的には、はてなブックマークフィードを利用して自分のブックマークしているURLを取得し、そのURLをブックマークしているユーザをエントリー情報取得APIを用いて抽出し、そのユーザのブックマークしているURLを収集します。こ

    はてなブックマーク記事のレコメンドシステムを作成 PythonによるはてなAPIの活用とRによるモデルベースレコメンド - データ分析がしたい
    sudo1101
    sudo1101 2014/11/10
    同じこと思いついたと思ったら既にブクマしてたの忘れてただけだった
  • 1