kuromojiとは Kuromojiはatilika社が開発したJavaで作成されたオープンソースの日本語形態素解析エンジンです。 Kuromojiは下記の機能を持っています。 複合語の分割 品詞のタグ付け 見出し化 漢字の読み方を抽出 検索用の設計(複数の単語分割モード) KuromojiのライセンスはApache v2ライセンスなので、商用でも利用できそうです。 準備 ソースコードはgithubにあるのでビルドしても良いのですが、zipでもダウンロードする事が出来ます。 今回はプロジェクトディレクトリ以下に解凍し、呼び出します。 kuromojiはjavaで作成されていますが、今回はrubyから使うことが目的なので、rjbを使います。 rjbはJNI (Java Native Interface) を利用してJava VMを操作するライブラリです。 具体的には、Rubyプロセス内にJ