A researcher who was a developer and has a thing for minimalism. Over the past few months, I have been working on a project titled Goodwill Currency for the Web Science Lab @ IIIT-B. It is a Ruby on Rails based portal with a VueJS frontend. One of the interesting challenges that I came across was search. Since most of the content on this portal will be hidden behind a login wall, we need a custom
全文検索システムの比較 - Elasticsearch vs Solr vs Amazon CloudSearch February 10, 2014 at 01:05 AM | categories: solr, aws, elasticsearch, web | 候補の選定方法 候補を選定するにあたって、以下の特徴をもっていることを前提とした。 LuceneやGroongaを使えば何でもできるが、ここでは対象としない。 ウェブベースのインターフェースを持つ インデックスの更新はほぼリアルタイムに反映される スケールアウトが容易 Solr https://lucene.apache.org/solr/ Luceneをバックエンドにした全文検索システム。バージョン4になってから大幅に機能が増強された。 長所 実績が十分ある 機能豊富 短所 クラスタを構築して運用するには手間がかかりそう S
solr(tomcat) のアクセス制限のメモです。 前提 nginx, solr(tomcat), rails アプリが全部同一のサーバに混在してる やりたいこと solr の admin ページにベーシック認証をかけたい solr の検索関連のクエリは rails アプリからのみに制限したい(IP 制限をかけたい) 将来的に複数サーバで運用するときに無理のない設定にしたい admin ページのパスにベーシック認証をかけて、検索関連のクエリのパスに IPアドレス制限をかければ要件は満たせます。ただ、それを tomcat の設定で満たすのは結構難しそうな感じ。パスによってベーシック認証をかけるのは tomcat の設定でできるのですが、IP 制限についてはパス毎に切り替えるようなことができません。tomcat 本体を拡張することによって可能なようですが、それはいろいろ面倒なのでできれば避け
Solr SecurityThe authoritative guide on implementing security is in the Solr Reference Guide. This page describes security features in general, but also provides information about CVEs that have been patched or dependencies which do not require a patch for Solr. Reported vulnerabilities (CVEs) are listed on the security news section on Solr's website. Known false positives, which used to be listed
Quick Review: What are Multiple Cores? Multiple cores let you have a single Solr instance with separate configurations and indexes, with their own config and schema for very different applications, but still have the convenience of unified administration. Individual indexes are still fairly isolated, but you can manage them as a single application, create new indexes on the fly by spinning up new
Schema Design Considerations indexed fields The number of indexed fields greatly increases the following: Memory usage during indexing Segment merge time Optimization times Index size These effects can be reduced by the use of omitNorms="true" Stored fields Retrieving the stored fields of a query result can be a significant expense. This cost is affected largely by the number of bytes stored per d
Solr で使われるメモリを減らす必要がある場合に僕がとりあえず考えることを挙げます.以下の内容は僕の Solr 1.3 での経験に基づいてますが,おそらく次期版の 1.4 でも同じではないかと思います.キャッシュを小さくするSolr はメモリ上に検索結果をキャッシュする機構を持っています.これは検索性能を向上するのにとても役立ちますが,メモリを食います.キャッシュは (Solrコアのホームディレクトリ)/conf/solrconfig.xml で定義され,サイズを指定することができます.Solr のキャッシュは何種類かあり,自分で用意することもできますが,たとえば元から用意されており世話になる可能性が高い filterCache は,Solr 添付の example 内の solrconfig.xml で次のように定義されています: キャッシュの容量を小さくするには,size 属性の値を
rails の本番サーバ(さくらVPS)に全文検索エンジンの Sunspot をインストールするまでの設定をまとめました。 前提 sunspot を使っているRailsアプリを/opt/yourapp/currentに置いていて、かつ同じサーバで solr サーバを立てる前提です。別サーバに solr を立てる場合もそれほど手順は変わらないと思うので、適宜脳内変換してください。 ほとんどの部分は Ubuntu 10.04 Tomcat6 and Solr 1.4 Installation Steps: · sunspot/sunspot Wiki と同じです。 関連ライブラリのインストール java と ant を yum でインストールします。 sudo yum install java-1.7.0-openjdk.x86_64 ant.x86_64 solr 用のユーザ solr を作
Ruby on Rails で Solr による検索を行う Sunspot に関して、私が運用上設定している内容を公開します。 config/sunspot.yml の設定 Sunspot (v1.3.3 現在) では、ジョブやタスクでインデックスを追加・更新した場合、自動でコミットが行われません。 そのため、auto_commit_after_request は false に設定し、代わりに Solr 側の設定 (後述) で自動 commit を行います。 また、Capistrano と連携できるよう、solr_home, data_path, pid_dir を適切に設定します。 production: auto_commit_after_request: false solr: solr_home: <%= File.expand_path('../../current/solr'
お世話になっております、開発チームの池上です。 最近ちょっとした検索機能にSolrを導入しました。Solrは検索エンジンのミドルウェアでご存知の方も多いと思います。大規模な構成による導入実績が豊富でWeb上にもたくさんの事例がありますが、今回は慎ましい構成の事例を紹介させて頂こうと思います。 使用しているSolrのバージョンは2012年1月時点で最新の3.5.0です。 なお、検索エンジンやSolrに関する基礎的な情報につきましては、有用な解説がすでに多数存在していますので割愛させて頂きます。 今回はつぎの前提条件と要件を意識して構築しました。 前提条件 サーバは極力少なめで ミッションクリティカルな機能ではない データ量はそれほど多くない 要件 更新はある程度頻繁 遅くとも数分以内にはインデックスに更新を反映させたい 一般的なWeb検索のように「いい感じに見つける」よりは「(入力されたキ
日本語の文章に対して全文検索用のインデックスを作成する方法としては、形態素解析により分解した単語をインデックスする方法や、N-Gram によってインデックスを作成する方法などがあります。形態素解析はインデックスが小さく検索が早いこと、N-Gram は業界用語などの特定ドメインの言葉や日本語以外にも対応できて部分一致検索が可能であることなど、双方に利点があります。 今回は Solr を使用した N-Gram 系トークナイザーについて記述します。 N-Gram 検索を行うには Solr コアの schema.xml を開いてフィールド型を定義します。 <fieldtype name="text" class="solr.textField" positionIncrementGap="100"> <analyzer> <tokenizer class="solr.CJKTokenizerFac
Hire the best. At 10x the speed.Hire the best. At 10x the speed.Screen and interview candidates 10x faster with MOPID AI Recruiter that saves upto 80% of your time and resources. Hiring 100+ positions? Try⚡Blitzhiring⚡for a change!Hiring 100+ positions?Try ⚡Blitzhiring⚡ for a changeWe get it. Large scale hiring costs a lot. What if you could hire the perfect talent AND save up to 80% resources? We
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く