Mecab/IPA辞書を使って記号を食わせると、記号(&とか)がサ変接続と認識されます。 $ echo "P&!G" | mecab P 名詞,固有名詞,組織,*,*,*,* &! 名詞,サ変接続,*,*,*,*,* G 名詞,固有名詞,組織,*,*,*,* EOS なんでこうなるかと言うと、char.defとunk.defの設定でそうなっているからです。 (ところで、unknownの略のunkってなんて読むんと良いんでしょうね。うんこ?(´・ω・`)) char.defでは以下のように記述されています。 SYMBOLのINVOKEが1になっているので、常にunknown wordとして扱われます。そしてGROUPが1なので、同じ種別でまとめられます。 SYMBOL 1 1 0 # ASCII 0x0021..0x002F SYMBOL 0x0030..0x0039 NUMERIC 0x0