全文検索エンジン Senna には Rubyバインディングが標準で添付されている。 N-GRAM, UTF-8キメ打ちですぐに Rubyから Sennaを使う手順をメモ。 まずはSennaをインストールする。今回は N-GRAM決め打ちなので MeCabは入れない。また、デフォルトエンコーディングをUTF-8にする。そのための configureは下記。 ./configure --without-mecab --with-encoding=utf8 configureが終わったら make && make install で /usr/local 以下に Sennaがインストールされる。 NFKC正規化エンジンのコンパイルにものすごくメモリと時間がかかるので注意されたし。マシンがチープでどうしてもリソースが不足している場合はconfigureの時に --enable-nfkc=no を付