タグ

datasetに関するsato_susumuのブックマーク (1)

  • Twitter日本語評判分析データセット

    ツイートの評判情報をクラウドソーシングにより分析し,分析結果を公開しています. データのダウンロードデータはこちらです. データはbz2で圧縮されています. ツイートの文は含まれていません. 2015年から2016年ごろのツイートを対象にしています. データ内容携帯電話などのツイートを中心に,534,962件のツイートがの分析が行われています.このツイート量は,他のデータセットと比較しても多いです.作成者の知る限り最も規模が大きく,種類数の大きなデータセットです. 最低 4 名以上の作業者により評価を行い,多数決を行った結果です.だいたい5名以上の作業者により評価を行っています. データの構造CSV ファイルで記述しています.列番号は以下の内容に該当します. ツイートのIDです.10000から始まる番号です.ジャンルIDです.次のジャンルがあります.10000: エクスペリア,Xperi

    Twitter日本語評判分析データセット
  • 1