タグ

Rastに関するhiroki23のブックマーク (2)

  • カイハツニッキ(2005-09-26) 全文検索系

    _ [ソフトウェア] 全文検索エンジン評価(Hyper Estraier / Rast / Senna) 現在(流行気味の)オープンソースの全文検索エンジンは、メジャーどころだとタイトルに挙げた Hyper Estraier Rast Senna) の3つがあります(他にもすげーのがあったら教えてください!)。テキストが集まってくる系(どんな系だ)のアプリケーションだと全文検索はかなり重要な要素を占めてくる技術要素となります、ので結構真剣に評価する必要があるわけです。とはいっても運用という面ではあまり高いサービスレベルは求められないことがおおいので、別のエンジンに入れ替える、っていうのも結構出来ちゃいそうですけどね。 さて、評価のポイントはいろいろあるんですが敢えて五月雨式に書くと 1インスタンスでどれくらい大量のテキストに耐えられるか どれくらいのスケーラビリティがあるか 更新のパフォー

  • YappoLogs: Rast,Hyper Estraierの性能評価クリップ

    Rast,Hyper Estraierの性能評価クリップ Ceekz Logsさんと/.jのOliverさんが、性能評価をしているのでクリップするテスト。 Ceekz Logs Hyper Estraier のお試し結果 前回、調子乗って行っていた100万件のニュース記事のインデキシングですが、9時間ほど掛かりました。これは、月別に差分インデキシングを行ったからかもしれません。合計で 1.0G ほどかな。 他にもソートの速度が気になっているそうです。 Hit件数が多くなるとソートに必要な処理も増えてしまうので、ある程度諦めてしまうのか 高性能な仕組みを考えなくちゃですね。。。 それかインデックスを分割して、後ろの順位をばっさり切り捨てるとか。 Oliver の日記 全文検索エンジン:Hyper Estraier 速度低下はかなりリニアで、とても素直な挙動といえる。indexのサイズも元のデ

  • 1