2016 - 10 - 17 Macで京大生まれの 形態素処理エンジン JUMAN++ を使用する 形態素処理 OSX list Tweet Share on Tumblr 京大の黒橋・河原研究室が新しく開発した 形態素 処理エンジンがJUMAN++です。RNN(Recurrent Neural Network)を応用した新しい手法で MeCab のような従来型のエンジンで生じる以下の問題の解決を試みたようです。 単語の並びの自然さを表現できない 例: 外国人参政権 →外国・人参・政権 これに対してJUMAN++は単語に対して一般化された意味ベクトルとして扱うことでより自然な単語選択を行うようにしているようです。 公式の資料にイメージ図が載っています。 解析の対象とする単語だけでなく、意味的に類似した言語同士でも自然なつながりになるようなモデルに設計されているということでしょうか メリット