適当な (今日 feed 経由で収集した Web 上の) 文書 を Yahoo のと Mecab に喰わせてみて、結果が食い違った部分を比較してみた。 surface を配列に入れて、Array::Diff で比較。 特徴がみえるところを (主観的にだけど) 抜き出してみたら、こんな感じになった。 mecab: '[1] [9] [繁華] [街] [従業] [員] [けが]' yahoo: '[19] [繁華街] [従業員] [がけ]' mecab: '[お] [怒り] [・] [・] [・] [(´] [・] [ω] [・] [`)] [何] [度] [申し訳] [ない]' yahoo: '[お怒り] [・・・] [(] [´・ω・`] [)] [何度] [申し訳ない]' mecab: '[代表] [団] [について] [国務] [長官] [記者] [会見] [として]' yahoo: