一定期間更新がないため広告を表示しています
研究開発グループの takahi-i です。 先日 Lucene Revolution という Apache Lucene / Solr に関する会議に参加してきました。ここでいう Lucene とは Java ベースの全文検索エンジンです。 Lucene (ルシーン) は優秀な全文検索エンジンなのですが、Lucene から実際にWebサービスで提供される検索サービスを作るのにはそこそこコストがかかります。これに対して Solr (ソーラ) は Lucene をベースにした検索プラットフォームで、簡単に検索サービスを立ち上げられるパッケージ(Webインターフェース、Spell Check機能等)を提供しています。 Lucene / Solr 共に多くの企業が提供する検索サービスで利用された実績を持ちます。 今年の Lucene Revolution はサンフランシスコで開かれ、開発者および
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo!デベロッパーネットワーク
TopHatenarとBlogopolisでは現在、全文検索用途にApache Solr 1.3を使っていますが、去年11月にSolr 1.4がリリースされたので、近いうちに1.4に移行したいと思っています。 そこで、1.3と1.4の検索パフォーマンスにどのくらい差があるのか、TopHatenarで収集しているブログの本文データを使って、以下の条件で計測してみました。 計測は、事前にSolrをウォームアップし、キャッシュが十分に効いた状態で行いました。 Solrサーバ環境 OS: CentOS 5.4 (x86_64) CPU: Phenom II X4 905e RAM: DDR2-800 9GB HDD: Seagate ST3160815AS (160GB, 7200rpm) JRE: 1.6.0_17-b04 (64bit) Tomcat: 6.0.20 Solrのキャッシュ設定
Solr で使われるメモリを減らす必要がある場合に僕がとりあえず考えることを挙げます.以下の内容は僕の Solr 1.3 での経験に基づいてますが,おそらく次期版の 1.4 でも同じではないかと思います.キャッシュを小さくするSolr はメモリ上に検索結果をキャッシュする機構を持っています.これは検索性能を向上するのにとても役立ちますが,メモリを食います.キャッシュは (Solrコアのホームディレクトリ)/conf/solrconfig.xml で定義され,サイズを指定することができます.Solr のキャッシュは何種類かあり,自分で用意することもできますが,たとえば元から用意されており世話になる可能性が高い filterCache は,Solr 添付の example 内の solrconfig.xml で次のように定義されています: キャッシュの容量を小さくするには,size 属性の値を
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く