はじめに 形態素解析ツールは数多く存在するが,それぞれの特徴を理解した上で利用することが重要である. 今回はPythonから利用できる形態素解析ツール3つを比較してみた. MeCab CRF(Conditional Random Fields)を用いたパラメータ推定 判別精度,実行速度ともに高く,標準的な使い方をするのであればMeCabを使うのが間違いないと思われる.ただしライブラリはちょっと重い. In[1]: import MeCab In[2]: mecab = MeCab.Tagger() In[3]: %time print mecab.parse("りんごは人間の身体にとって大変良い効果があることが立証されています") りんご 名詞,一般,*,*,*,*,りんご,リンゴ,リンゴ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 人間 名詞,一般,*,*,*,*,人間,ニンゲン,ニン