今回は、全文検索エンジンの Lucene をテストしてみます。標準の StandardAnalyzer は、日本語に対応していませんが、Sen の形態素解析をもちいた JapaneseAnalyzer や bi-gram による CJKAnalyzer を使うことにより、日本語にも対応することができます。 Lucene の最新バージョンは、2.0.0 で、contrib に CJKAnalyzer がはいっているので、今回はこれを使うことにします。 まずは、Lucene 2.0.0 をインストールします。 $ cat LuceneTest.java import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.cjk.CJKAnalyzer; import org.apache.lucene.in