shrkwのブックマーク - はてなブックマーク

shrkw id:shrkw

ブックマーク / blog.goo.ne.jp/13th-floor (1)

Apache LuceneのNGramTokenizer - 13F
Apache Lucene で全文検索するようなアプリケーションを作成中。とりあえず CJKAnalyzer かと思っていたらこちらで NGramTokenizer という便利そうなものが紹介されていたので使おうとしてみた。まず Analyzer が必要なので以下のようなものを作成。 public class NGramAnalyzer extends Analyzer { protected int minGram; protected int maxGram; public NGramAnalyzer(int minGram, int maxGram) { this.minGram = minGram; this.maxGram = maxGram; } public TokenStream tokenStream(String fieldName, Reader reader)
shrkw 2009/10/21
lucene

java
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx