関連タグで絞り込む (1)

タグの絞り込みを解除

*Rubyと自然言語処理に関するmurakey2のブックマーク (2)

  • STBBS.NET blog: Rubyで Sennaを使って全文検索を行う

    全文検索エンジン Senna には Rubyバインディングが標準で添付されている。 N-GRAM, UTF-8キメ打ちですぐに Rubyから Sennaを使う手順をメモ。 まずはSennaをインストールする。今回は N-GRAM決め打ちなので MeCabは入れない。また、デフォルトエンコーディングをUTF-8にする。そのための configureは下記。 ./configure --without-mecab --with-encoding=utf8 configureが終わったら make && make install で /usr/local 以下に Sennaがインストールされる。 NFKC正規化エンジンのコンパイルにものすごくメモリと時間がかかるので注意されたし。マシンがチープでどうしてもリソースが不足している場合はconfigureの時に --enable-nfkc=no を付

  • Twitterの投稿内容から鬱度を測定する - Unchained Life

    もうすぐ5月です。 Twitterの投稿内容から度を測定するRubyスクリプトを書いてみました。 これには東京工業大学の高村さんが公開している単語感情極性対応表というものを使っています。 http://www.lr.pi.titech.ac.jp/~takamura/pndic_ja.html これはある単語がどの程度の感情を表すかを数値化した表で、-1 ~ +1 までの値が特定の単語に割り当てられています。 その単語がネガティブな感情表現だとマイナスの値、ポジティブな感情表現だとプラスの値になっています。 なので、度を測定といってもポジティブな投稿内容が多いときにはプラスの値を返します。 また日語文の形態素解析にはYahoo!の日形態素解析APIを使っています。 http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html

    Twitterの投稿内容から鬱度を測定する - Unchained Life
  • 1