※2012年1月18日 追記 Tomcat 7、Solr 3.5.0で日本語検索の環境構築を行ってみました。 Debian に Tomcat 7 + Apache Solr 3.5.0 + 日本語検索対応環境を構築(lucene-gosen使用) Tomcat上でsolrを動かすことはできた模様。 このままでは日本語をうまく分割してインデックス化してくれません。 たとえば、「日本語データ」というデータを登録した場合、 日本や日本語、データというキーワードでヒットしてほしいと思いますが、 「日本語データ」と全文一致しないと、ヒットとみなしません。 そこで、N-gram解析モジュールと形態素解析モジュールを導入します。 N-gram解析モジュールの導入 https://sen.dev.java.net/servlets/ProjectDocumentList?folderID=755&expa