目的 テキストファイルから読み取れるセンチメント(感情)を測定したい。そのために、テキストに現れる各単語のセンチメントを出現順に計測し、時系列データとみてグラフを描く。また、その平均・標準偏差・歪度・尖度などを算出する。 手法 感情辞書 単語と感情を対応付ける辞書として、「単語感情極性対応表」(高村大也, 乾孝司, 奥村学, "スピンモデルによる単語の感情極性抽出", 情報処理学会論文誌ジャーナル, Vol.47 No.02 pp. 627--637, 2006. )を用いる。本辞書では、各単語に対する印象を、positive: +1 ~ negative: -1の「感情極性値」で対応付けている。具体的には、辞書はテキストファイルで、55125個の単語に対して、「見出し語:読み:品詞:感情極性値」が記述されている。 なお、本辞書は研究目的に限り公開されている。 ・pn_ja.txtの内容
![Rでテキストファイルをセンチメントの時系列データに変換する - Tech Blog](https://cdn-ak-scissors.b.st-hatena.com/image/square/9b1e3c236fe7bcfd5dfe71130d506505f22cc76a/height=288;version=1;width=512/http%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Ft%2Ftkdmah%2F20130113%2F20130113121129.jpg)