Clojure, Cold Fusion, Erlang, Go, Groovy, Haskell, Java, JavaScript, .NET, OCaml, Perl, PHP, Python, R, Ruby, Scala, Smalltalk, Vert.x Complete list
FunctionQuery allows one to use the actual value of a field and functions of those fields in a relevancy score. What is a Function? A function can be: A Constant (numeric or string literal) - See "constant" and "literal" below. A Field - See "fieldvalue" below. Also see notes later on multivalued/vector fields. Another Function Solr4.0 A parameter substitution: $arg, where arg is another function
Solrとは なんかすごいOSSの検索エンジンであるLuceneを元にしたREST風になんか楽ができる検索サーバー。サーバーはJavaでできているが、クライアントはいろいろなスクリプトで取り出せるらしい 構築環境 Ubuntu 11.10 MySQL インストール とりあえずhomeにwgetしただけ。好きなところから落としましょう http://www.apache.org/dyn/closer.cgi/lucene/solr/ wget http://ftp.jaist.ac.jp/pub/apache//lucene/solr/3.5.0/apache-solr-3.5.0.tgz tar xzvf apache-solr-3.5.0.tgz インストールはこれだけでできる。ここではapache-solr-3.5.0を解凍したディレクトリを$SOLRとする。 実行にはJDKが必要らし
で、テーブルは制約はつけていませんが、ER図を書くと以下のような感じ。 データが入っていないと意味がないので、下記の SQL でデータを入れておきます。 INSERT INTO maker(name) VALUES('apple'); INSERT INTO maker(name) VALUES('SONY'); INSERT INTO maker(name) VALUES('MicroSoft'); INSERT INTO product(mid, name) VALUES (1, 'iPhone'); INSERT INTO product(mid, name) VALUES (1, 'iPod'); INSERT INTO product(mid, name) VALUES (1, 'iPad'); INSERT INTO product(mid, name) VALUES (2,
solr3.6をダウンロードして、 example └solr └conf のconfを使用していて、tomcatを起動すると、以下のエラーが発生します。 致命的: org.apache.solr.common.SolrException: undefined field text なんだろうこれは。 schema.xmlを見てもよく解りません。んんん?? ではsolrconfig.xmlの方かな。ジーーーッと見てみる。 <listener event="newSearcher" class="solr.QuerySenderListener"> <arr name="queries"> </arr> </listener> <listener event="firstSearcher" class="solr.QuerySenderListener"> <arr name="querie
なんで、Solr の GETパラメータを日本語で解説しているサイトがないのか!? 速度の比較記事やインストールしたがうまくいかないとか、そんなばっかです。 Solr Wikiは簡単な英語で書かれているのでわかる事はわかるんだけどね。 「何が出来ないのか」ってのがよくわからんかったよ。 とりあえず、よく使うであろうパラメータを箇条書き 1.問合せURL http://192.168.1.1:8983/solr/select/?検索パラメータを繋げる 2.問合せパラメータ 「q=条件」は必須です。 問合せはクエリー「q=検索条件」で行う方法と、フィルタ「fq=検索条件」で行う方法があります。 フィルタの方が検索スピードは速くなります。 XX_IDといったキー項目だけではなく、単価などで範囲を指定する事もできます。 例1.なんたらIDで検索を行なう場合 foo_id:1001 例2.単価を範囲指
来年も作りたい!ふきのとう料理を満喫した 2024年春の記録 春は自炊が楽しい季節 1年の中で最も自炊が楽しい季節は春だと思う。スーパーの棚にやわらかな色合いの野菜が並ぶと自然とこころが弾む。 中でもときめくのは山菜だ。早いと2月下旬ごろから並び始めるそれは、タラの芽、ふきのとうと続き、桜の頃にはうるい、ウド、こ…
新しくインデキシングされたドキュメントを検索結果の上位に表示したいというニーズは割とよくあると思います。 フレッシュネスブーストと呼ばれる手法です。 Solr の場合 TIMESTAMP などの日付でソートすることもできるのですが Solr はソートがあまり上手ではありません。 時間とシステムリソースを大量に消費します。 ヒット件数が数十万件を超えるような場合にはあまり使いたくありません。 正確にソートされなくても最近インデキシングされたドキュメントが だいたい上位にくればいいのであれば日付でブーストする方法があります。 1つめは クエリタイプが dismax の場合で、BoostQuery を使う方法です。 bq で指定します。 bq=TIMESTAMP:[NOW/DAY-7DAY TO NOW/DAY]^20000 この例では1週間以内にインデキシングされたドキュメントがブーストされま
検索結果をソートするにはクエリストリングで以下のように指定します。 sort=フィールド名 asc または desc 具体的にはこんな感じ。 http://localhost:8080/solr/select?q=role&sort=ISSUED%20desc ISSUED というフィールドの値の大きい順にソートしています。 descの前にスペース(%20)を入れるのを忘れないでください。 asc(昇順)、desc(降順)はどちらかを指定しないとエラーになります。 複数フィールドの値でソートする場合には,で区切って記述していきます。 http://133.194.36.194:8080/solr/select?q=role&sort=ISSUED%20desc,TIMESTAMP%20asc ではでは 参考ページ http://wiki.apache.org/solr/CommonQuer
今週はAmazonのCloudSearchが発表されたり、Lucene/Solrの3.6がリリースされたりと、全文検索さんとお付き合いしている人たちにはアドレナリンが出やすい1週間でした。 3.6には形態素解析を使ったAnalyzer(Kuromoji)が入るなど、日本人にとっては脳内物質が駆けめぐりやすいリリースになっているようです。β‐エンドルフィン。チロシン。エンケファリン。 とりあえず触ってみたところとかをメモ。 Change Logとか Lucene3.6のChange Log core : http://lucene.apache.org/core/3_6_0/changes/Changes.html contrib : http://lucene.apache.org/core/3_6_0/changes/Contrib-Changes.html Solr3.6のReleas
CJKAnalizerでは「花」の1文字の検索を行うと、検索出来ない不具合が見つかった。 その他に検索できない日本語が色々出てきたので、CJKAnalizerには身を引いてもらいます。 んで、色々試したのですがどれも一長一短すぎ、使い物にならないので、 N-Gramを使用することにしました。 N-Gram を 1-gram で使用した場合、語句に関係無く文字が一致するとヒットしてしまうので、検索ワードが2文字以上の場合は 2-gram を使用する方針としました。 データ上に検索キーワードが存在するのに CJKAnalizer ではヒットしない場合があるなんて、信じられない!。 solrを使用している事例は日本語のページでも見ますが、こういう事が明らかにされていないのは非常に不親切ではないでしょか?? 実際solrの問い合わせパラメータを日本語で説明しているサイトも無いし、オープンソースなん
DebianにTomcat 7 + Apache Solr 3.5.0の環境を構築し、日本語検索が行えるように設定しました。 DebianにOpenJDK + Tomcat 7 + Solr 3.5.0 の環境を構築する Debian に Tomcat 7 + Apache Solr 3.5.0 + 日本語検索対応環境を構築(lucene-gosen使用) schema.xmlは、このようにid(long)、title(text_ja)、body(text_ja)の 3つのフィールドを持つように指定しています。 <?xml version="1.0" encoding="UTF-8" ?><schema name="example" version="1.4"> <types> <!-- The StrField type is not analyzed, but indexed/s
見慣れないフィールドが増えましたね〜 solr4.0がリリースされたので、早速使ってみました。 早速起動時に躓きました。。 致命的: Unable to use updateLog: _version_field must exist in schema, using indexed="true" stored="true" and multiValued="false" (_version_ does not exist) org.apache.solr.common.SolrException: _version_field must exist in schema, using indexed="true" stored="true" and multiValued="false" (_version_ does not exist) at org.apache.solr.updat
概要 Javaの有名な形態素解析器でありながら、長らく「公式サイトどこ?」な状況だったSenとGoSenですが、最近はlucene-gosenなるGoSenベースのライブラリがちゃんと管理された状態で公開されてるとか。 lucene-gosen http://code.google.com/p/lucene-gosen/ しかもこの子は辞書内包なのでjarを落とすだけで使えて、Lucene用AnalyzerやSolr用Toknizerも付いていて、日本語の検索用インデックスを貼る時に便利な各種フィルタも用意されているという、至れり尽くせりな構成になっているとか。 これは触ってみねばということで、とりあえず簡単な形態素解析、辞書の追加、Luceneでの利用、Solrでの利用を試してみました。 ちなみに上のURLでCommiterのところに名前が出ているKoji SekiguchiさんはSol
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く