タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

sampleとluceneに関するmanabouのブックマーク (1)

  • Lucene 2.4とLucene 2.0のインデックス構築速度比較 - kaisehのブログ

    Luceneは、こちらのベンチマークなどを見る限り、Sennaなど他の全文検索エンジンに比べて相当遅いとされているようです。 上記ページのベンチマークではLucene 2.0が使われています。僕も数年前にLucene 2.0を使ったことがあって、それ以降はLuceneに触れていなかったんですが、最近のバージョンはパフォーマンスが大幅に改善されているそうなので、どれくらい速くなったのか、インデックス作成速度を比較してみました。 比較に使ったのはLucene 2.4.1(2009/03)とLucene 2.0.0(2006/05)です。以下の条件でインデックス作成時間を計測しました。 データ: 日語版Wikipediaのダンプから先頭20万記事 インデックス形式: 記事タイトル: Store.YES, Index.ANALYZED(元文字列+インデックス) 記事文: Store.COMPR

    Lucene 2.4とLucene 2.0のインデックス構築速度比較 - kaisehのブログ
  • 1