タグ

2014年6月5日のブックマーク (1件)

  • Rでテキストファイルをセンチメントの時系列データに変換する - Tech Blog

    目的 テキストファイルから読み取れるセンチメント(感情)を測定したい。そのために、テキストに現れる各単語のセンチメントを出現順に計測し、時系列データとみてグラフを描く。また、その平均・標準偏差・歪度・尖度などを算出する。 手法 感情辞書 単語と感情を対応付ける辞書として、「単語感情極性対応表」(高村大也, 乾孝司, 奥村学, "スピンモデルによる単語の感情極性抽出", 情報処理学会論文誌ジャーナル, Vol.47 No.02 pp. 627--637, 2006. )を用いる。辞書では、各単語に対する印象を、positive: +1 ~ negative: -1の「感情極性値」で対応付けている。具体的には、辞書はテキストファイルで、55125個の単語に対して、「見出し語:読み:品詞:感情極性値」が記述されている。 なお、辞書は研究目的に限り公開されている。 ・pn_ja.txtの内容

    Rでテキストファイルをセンチメントの時系列データに変換する - Tech Blog