職場の人の繋がりでお声がけいただいて、Kuromojiという形態素解析エンジンを紹介していただきました。 ■ Kuromoji ATILIKAという某検索エンジン会社に勤めていた人の会社で作っている ApacheライセンスなピュアJavaな形態素解析エンジンです。 Javaって言う事でMavenでホゲホゲできるそうです。 http://atilika.org/こちらで紹介されています。 #黒文字ってのは植物の名前で、そっからできたつまようじの事を言うんだそうで、 #これがモチーフになんだよーと見せていただきましたw ■ 形態素解析 / N-Gram 形態素解析とN-Gram〜とかコレ系だとよくある感じですが、その辺のサポートもされてます。 #詳しい話を聞かせてもらったのですが、そもそもの知識不足と英語力不足でイマイチ…orz ■ 辞書 IPAのヤツがベースになっていて、拡張する事も出来ます
![Kuromoji(ピュアJavaでナイスなライセンスの形態素解析エンジン)を試してみる](https://cdn-ak-scissors.b.st-hatena.com/image/square/e86856158afe79e8f5e51977590edc4c63d261db/height=288;version=1;width=512/https%3A%2F%2Fshinodogg.com%2Fwp-content%2Fuploads%2F2016%2F12%2F6ef13-51rriccy8cl._sl160_.jpg)