タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

livedoorとsbmに関するy_yanbeのブックマーク (2)

  • ツンデレ風「ソーシャルブックマーク研究用データセット」 : アルカンタラの熱い夏

    ツンデレ風「ソーシャルブックマーク研究用データセット」 カテゴリ: そのほか 先日の第2回SBM研究会で、「研究用のデータをどうするか」といった議題が取り上げられました。 SBM標準データの考察〜SBM研究の再現性を実現するために ある研究者がデータA を使い、他の研究者がデータBを使う場合、お互いの研究をフェアに考察することが難しい。おまけにそのデータは各研究者が独自に入手(場合によって独自にツールを作成している!)場合が多いので比較するすべがない。 もし、研究者同士が同じデータXを使えば、各研究者は研究を比較しやすくなるし、結果的にSBM研究が促進されるだろう。 一方、ライブドアでは、「データ提供するのはいいけどニーズはあるのか?」という疑問があり足踏みをしていました。 第二回SBM研究会 & 研究用データの公開方法 - nabokov7; rehash 実はこれまでにも、blog,

    ツンデレ風「ソーシャルブックマーク研究用データセット」 : アルカンタラの熱い夏
    y_yanbe
    y_yanbe 2009/01/15
    今回のデータセット公開までの顛末まとめ。分かりやすいと思う
  • nabokov7; rehash : livedoor クリップのデータセットを公開しました

    January 15, 200912:22 カテゴリ公開やら広報やら livedoor クリップのデータセットを公開しました はじめての試みなので,カジュアルな悪用を防止するための心理的なハードルとして,念のため,フォームから申し込んだ人にのみURLとパスワードを通知する,という形式をとっています。 特に個人/法人/学術機関等の区別はしていません。ライブドアからのお得なお知らせとかを配信する予定もありませんので,安心してお申し込みください。 内容はすべてサイト上に公開されているデータのみですが 研究者側の,データ収集のための余計な手間を軽減する。 クローリングによるサービス側の不要な負荷を回避する。 各研究者が同じデータに基づいて実験を行うことができるので,実験の再現/追試が可能になる。 というメリットがあると考えています。 データセットの仕様 3つ以上の公開クリップがついているページへの

    y_yanbe
    y_yanbe 2009/01/15
    今回のデータセットのparseの仕方
  • 1