最近、ボットに漢字を含む日本語の「読み」を解析させて遊んでいます。 前回の記事でmecab-ipadic-NEologdを使いましたが、今回は元となる辞書にipadicではなくunidicを利用しているmecab-unidic-NEologdを使ってみたので、その際のメモです。 まだ触ってみた感触だけですが、unidic版のNEologdのほうが「読み」を正しく解析できる場合が多いように思います。 mecab-unidic-NEologdの導入 mecab-unidic-NEologdを導入するために、まずはmecabとmecab-unidicをシステムに導入します。 手順については、mecab-unidic-NEologdのREADMEに詳しく書いてありますので、ここでは、OSXの場合の手順を抜粋しておきます。 # mecabとmecab-unidicと関連ツールをbrewでインストール