タグ

databaseとrecommendationに関するtakadoのブックマーク (4)

  • nabokov7; rehash : Cicindela には豪華なおまけがついてきます

    December 25, 200822:01 カテゴリ公開やら広報やら Cicindela には豪華なおまけがついてきます ところで,オープンソース化された Cicindela のディストリビューションには,かねてからの課題だった livedoor clip の公開データセット (縮小版) が含まれている ことには皆さんお気づきでしょうか。 ちょっと分かりづらいのですが,レコメンデーションエンジンの評価用として,livedoor clip の公開クリップ情報の一部を csv 形式で利用できるようにしてあります。 あくまでもレコメンデーションエンジンの付録なので,データは最新ではなく,サイズも小さめです。ダウンロード方法や置き場所もかなり分かりづらいことになっていますが,最新版のデータセットも間もなくきちんとした形で公開される予定です。(様子見のため,フォームでまず問い合わせをしてもらって,

    takado
    takado 2008/12/28
    「レコメンデーションエンジンの評価用として,livedoor clip の公開クリップ情報の一部を csv 形式で利用できるようにしてあります」-なんだってー
  • MovieLens

    GroupLens Research has collected and made available rating data sets from the MovieLens web site (https://movielens.org). The data sets were collected over various periods of time, depending on the size of the set. Before using these data sets, please review their README files for the usage licenses and other details. Seeking permission? If you are interested in obtaining permission to use MovieLe

    MovieLens
  • Myrmecoleon in Paradoxical Library. はてな新館 - はてブ指数

    書誌学的方法による研究者評価の方法のひとつとしてh指数(h-index)というものがある。 その定義は 「その研究者が公刊した論文のうち、被引用数がh以上であるものがh以上あることを満たすような数値」 h指数 - Wikipedia というもの。イメージとしてはこのグラフをみるとわかるかなと。 要するにどの程度の質の論文をどれくらいの量書いているのか,というのが一発で分かる感覚的に優れた指標である。単純な被引用数(論文が引用された回数)の総和だと特定の論文が妙に引用されてて他はボロボロ,みたいな研究者も高く評価されてしまうのに対し,h指数を使うと質と量が同時に把握できるので分かりやすくてオススメ。 詳しいところはwikipediaが詳しいのと,あとオリジナルの論文(英文)も公開されてるので読むとよい。っても自分も読んでないが(マテ で,なんでこんなことをわざわざ説明してるのかというと, こ

    takado
    takado 2007/07/20
    H指数をはてブの評価に適用
  • GroupLens

    Social Computing Research at the University of Minnesota GroupLens advances the theory and practice of social computing by building and understanding systems used by real people Featured Research We publish research articles in conferences and journals primarily in the field of computer science, but also in other fields including psychology, sociology, and medicine. See our blog for research highl

    GroupLens
    takado
    takado 2007/01/16
    MovieLensなどの様々なデータセットを配布
  • 1