タグ

ブックマーク / www.nii.ac.jp (2)

  • 情報学研究データリポジトリ ニコニコデータセット

    ニコニコ大百科データ ニコニコ大百科に2014年2月上旬までに投稿された記事全ての記事ヘッダ,記事文データと,それに付随する掲示板全データです。ただし,ユーザーページ,ユーザーIDは削除されています。 記事ヘッダデータ 記事ID,記事タイトル,記事ヨミ,記事種類(a:単語,v:動画,i:商品,l:生放送),記事作成日時などのデータです。CSV形式のファイルで,1年当たり1ファイル,圧縮ファイルで約4.9MB,展開後は約14.9MBです。 記事文データ 記事ID,記事文,記事更新日時などのデータです。CSV形式のファイルで,1月あたり1ファイル(例外あり),圧縮ファイルで約4.52GB,展開後は約22.7GBとなりますので,ダウンロードされる際はご注意ください。 掲示板データ 記事ID,レス番号,レス投稿日時,レス文などのデータです。CSV形式のファイルで,1年あたり1ファイル,圧縮

    totttte
    totttte 2015/03/08
    “コメント本文,投稿日時,書き込み再生位置などのデータです。 JSON形式のファイルで,1つの動画につき1ファイルとなっています。 圧縮ファイルで約50GBあり,展開すると約300GBとなりますので,ダウンロードされる際は
  • 情報学研究データリポジトリ

    情報学研究データリポジトリ(IDR) 情報学研究データリポジトリ(Informatics Research Data Repository : IDR)は,国立情報学研究所(NII)のデータセット共同利用研究開発センター(DSC)が運営するデータセットの共同利用事業です。IDRでは各種のデータセットを民間企業や大学等研究者から受け入れて研究者に提供するためのサービスを行っています。 データセットの利用を希望される方は,「データ一覧」から各データセットのページにアクセスし,記載内容をよくご確認ください。データセットの利用を申請された場合,「IDRデータセット提供サービス規約(法人利用者用)」(データセットによっては「同(個人利用者用)」)に同意いただいたものと見なします。 データセットの提供を希望される大学等の研究者の方は「大学等研究者提供データセット受入」のページをご覧ください。また,民間

    totttte
    totttte 2015/03/08
    コーパス、データセット。 Y!、楽天、ニコニコ、リクルート、クックパッドなどのデータセットがある
  • 1