Luceneに同梱されている形態素解析のKuromojiですが、以下の3種類の辞書を取ることができます。 IPA辞書 NAIST辞書 UniDic IPA辞書はこちら。 http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz NAIST辞書はこちら。 http://sourceforge.jp/projects/naist-jdic/ UniDicはこちら。 http://sourceforge.jp/projects/unidic/ で、今回、全パターンを試してみようと思ったのですが、UniDicは使えませんでした。辞書のビルドに失敗します。 ライセンス上の理由で、現在はIPA形式の辞書のみの対応だとか。 Japanese Tokenizer (Kuromoji) cannot build UniDic d