[B! solr] blueleのブックマーク

Apache Solr vs Elasticsearch - the Feature Smackdown!

Clojure, Cold Fusion, Erlang, Go, Groovy, Haskell, Java, JavaScript, .NET, OCaml, Perl, PHP, Python, R, Ruby, Scala, Smalltalk, Vert.x Complete list

bluele 2014/05/08

リンク

Elasticsearch入門 pyfes 201207

I'm learning elasticsearch now. This slide is old, new version is here. -> http://blog.johtani.info/blog/2013/08/30/hold-first-elasticsearch-meetup-in-japan/

bluele 2013/06/20

リンク

pixiv サイバーエージェント共同勉強会 solr導入記

WebSocket及びWebRTCの技術紹介資料です。 WebSocket : 概要、標準化状況、HTTPとの通信量比較、PUSH方式の比較、ブラウザの対応状況 WebRTC : 概要、標準化状況、通信（PeerConnection）確立までの流れ、利用事例、ブラウザの対応状況（NTTアドバンステクノロジ（NTT-AT））

bluele 2013/06/19

solr

リンク

FunctionQuery allows one to use the actual value of a field and functions of those fields in a relevancy score. What is a Function? A function can be: A Constant (numeric or string literal) - See "constant" and "literal" below. A Field - See "fieldvalue" below. Also see notes later on multivalued/vector fields. Another Function Solr4.0 A parameter substitution: $arg, where arg is another function

bluele 2013/05/20

リンク

DjangoでMySQLなサイトでのSolr環境構築メモ - 憧れ駆動開発

SolrとはなんかすごいOSSの検索エンジンであるLuceneを元にしたREST風になんか楽ができる検索サーバー。サーバーはJavaでできているが、クライアントはいろいろなスクリプトで取り出せるらしい構築環境 Ubuntu 11.10 MySQL インストールとりあえずhomeにwgetしただけ。好きなところから落としましょう http://www.apache.org/dyn/closer.cgi/lucene/solr/ wget http://ftp.jaist.ac.jp/pub/apache//lucene/solr/3.5.0/apache-solr-3.5.0.tgz tar xzvf apache-solr-3.5.0.tgz インストールはこれだけでできる。ここではapache-solr-3.5.0を解凍したディレクトリを$SOLRとする。実行にはJDKが必要らし

bluele 2013/05/06

リンク

MySQL のデータを Solr にぶちこむ: おちエンのブログ

で、テーブルは制約はつけていませんが、ER図を書くと以下のような感じ。データが入っていないと意味がないので、下記の SQL でデータを入れておきます。 INSERT INTO maker(name) VALUES('apple'); INSERT INTO maker(name) VALUES('SONY'); INSERT INTO maker(name) VALUES('MicroSoft'); INSERT INTO product(mid, name) VALUES (1, 'iPhone'); INSERT INTO product(mid, name) VALUES (1, 'iPod'); INSERT INTO product(mid, name) VALUES (1, 'iPad'); INSERT INTO product(mid, name) VALUES (2,

bluele 2013/05/06

参考にする

MySQL
solr

リンク

solr3.6の起動時のエラー：org.apache.solr.common.SolrException: undefined field text - 文系プログラマによるTIPSブログ

solr3.6をダウンロードして、 example └solr └conf のconfを使用していて、tomcatを起動すると、以下のエラーが発生します。致命的: org.apache.solr.common.SolrException: undefined field text なんだろうこれは。 schema.xmlを見てもよく解りません。んんん？？ではsolrconfig.xmlの方かな。ジーーーッと見てみる。 <listener event="newSearcher" class="solr.QuerySenderListener"> <arr name="queries"> </arr> </listener> <listener event="firstSearcher" class="solr.QuerySenderListener"> <arr name="querie

bluele 2013/05/06

solr

リンク

https://github.com/minghai/ElasticSearch_VS_Solr/blob/master/part2.md

bluele 2013/05/06

solr

リンク

Ride（らいど)の技術メモ　solr qeury parameter (問合せの記述)

なんで、Solr の GETパラメータを日本語で解説しているサイトがないのか！？速度の比較記事やインストールしたがうまくいかないとか、そんなばっかです。 Solr Wikiは簡単な英語で書かれているのでわかる事はわかるんだけどね。「何が出来ないのか」ってのがよくわからんかったよ。とりあえず、よく使うであろうパラメータを箇条書き 1.問合せURL http://192.168.1.1:8983/solr/select/?検索パラメータを繋げる２.問合せパラメータ「q=条件」は必須です。問合せはクエリー「q=検索条件」で行う方法と、フィルタ「fq=検索条件」で行う方法があります。フィルタの方が検索スピードは速くなります。 XX_IDといったキー項目だけではなく、単価などで範囲を指定する事もできます。例１.なんたらIDで検索を行なう場合 foo_id:1001 例２.単価を範囲指

bluele 2013/04/25

問い合わせパラメータ

solr

リンク

はてなブログ | 無料ブログを作成しよう

来年も作りたい！ふきのとう料理を満喫した　2024年春の記録春は自炊が楽しい季節 1年の中で最も自炊が楽しい季節は春だと思う。スーパーの棚にやわらかな色合いの野菜が並ぶと自然とこころが弾む。中でもときめくのは山菜だ。早いと2月下旬ごろから並び始めるそれは、タラの芽、ふきのとうと続き、桜の頃にはうるい、ウド、こ…

bluele 2013/04/25

solr

リンク

https://github.com/hatena/solr-tutorial/blob/master/doc/creating-search-requests.md

bluele 2013/04/25

solr

リンク

ヒット件数が数十万件を超えるような場合でも使える。新しくインデキシングしたドキュメントを検索結果の上位に表示する２つの方法。 - Solr, Python, MacBook Air in Shinagawa Seaside

新しくインデキシングされたドキュメントを検索結果の上位に表示したいというニーズは割とよくあると思います。フレッシュネスブーストと呼ばれる手法です。 Solr の場合 TIMESTAMP などの日付でソートすることもできるのですが Solr はソートがあまり上手ではありません。時間とシステムリソースを大量に消費します。ヒット件数が数十万件を超えるような場合にはあまり使いたくありません。正確にソートされなくても最近インデキシングされたドキュメントがだいたい上位にくればいいのであれば日付でブーストする方法があります。 1つめはクエリタイプが dismax の場合で、BoostQuery を使う方法です。 bq で指定します。 bq=TIMESTAMP:[NOW/DAY-7DAY TO NOW/DAY]^20000 この例では1週間以内にインデキシングされたドキュメントがブーストされま

bluele 2013/04/25

boost

solr

リンク

sort ソートそーっと - Solr, Python, MacBook Air in Shinagawa Seaside

検索結果をソートするにはクエリストリングで以下のように指定します。 sort=フィールド名 asc または desc 具体的にはこんな感じ。 http://localhost:8080/solr/select?q=role&sort=ISSUED%20desc ISSUED というフィールドの値の大きい順にソートしています。 descの前にスペース(%20)を入れるのを忘れないでください。 asc(昇順)、desc(降順)はどちらかを指定しないとエラーになります。複数フィールドの値でソートする場合には,で区切って記述していきます。 http://133.194.36.194:8080/solr/select?q=role&sort=ISSUED%20desc,TIMESTAMP%20asc ではでは参考ページ http://wiki.apache.org/solr/CommonQuer

bluele 2013/04/25

sort

solr

リンク

Lucene/Solr3.6リリース - 形態素解析が使えるようになった : mwSoft blog

今週はAmazonのCloudSearchが発表されたり、Lucene/Solrの3.6がリリースされたりと、全文検索さんとお付き合いしている人たちにはアドレナリンが出やすい1週間でした。 3.6には形態素解析を使ったAnalyzer（Kuromoji）が入るなど、日本人にとっては脳内物質が駆けめぐりやすいリリースになっているようです。β‐エンドルフィン。チロシン。エンケファリン。とりあえず触ってみたところとかをメモ。 Change Logとか Lucene3.6のChange Log core : http://lucene.apache.org/core/3_6_0/changes/Changes.html contrib : http://lucene.apache.org/core/3_6_0/changes/Contrib-Changes.html Solr3.6のReleas

bluele 2013/04/25

日本語インデックス形態素解析

solr

リンク

GitHub - django-haystack/pysolr: Pysolr — Python Solr client

bluele 2013/04/25

python
solr

リンク

Ride（らいど)の技術メモ　solr

CJKAnalizerでは「花」の１文字の検索を行うと、検索出来ない不具合が見つかった。その他に検索できない日本語が色々出てきたので、CJKAnalizerには身を引いてもらいます。んで、色々試したのですがどれも一長一短すぎ、使い物にならないので、 N-Gramを使用することにしました。 N-Gram を 1-gram で使用した場合、語句に関係無く文字が一致するとヒットしてしまうので、検索ワードが２文字以上の場合は 2-gram を使用する方針としました。データ上に検索キーワードが存在するのに CJKAnalizer ではヒットしない場合があるなんて、信じられない！。 solrを使用している事例は日本語のページでも見ますが、こういう事が明らかにされていないのは非常に不親切ではないでしょか？？実際solrの問い合わせパラメータを日本語で説明しているサイトも無いし、オープンソースなん

bluele 2013/04/25

日本語

solr

リンク

IBM Developer

IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant techno logies such as generative AI, data science, AI, and open source.

bluele 2013/04/25

solr

リンク

Apache Solr 3.5.0にPythonからデータの登録・検索を行う(solrpy使用)

DebianにTomcat 7 + Apache Solr 3.5.0の環境を構築し、日本語検索が行えるように設定しました。 DebianにOpenJDK + Tomcat 7 + Solr 3.5.0 の環境を構築する Debian に Tomcat 7 + Apache Solr 3.5.0 + 日本語検索対応環境を構築(lucene-gosen使用) schema.xmlは、このようにid(long)、title(text_ja)、body(text_ja)の 3つのフィールドを持つように指定しています。 <?xml version="1.0" encoding="UTF-8" ?><schema name="example" version="1.4"> <types> <!-- The StrField type is not analyzed, but indexed/s

bluele 2013/04/25

python
solr

リンク

solr4.0から導入された_version_フィールド - 文系プログラマによるTIPSブログ

見慣れないフィールドが増えましたね〜 solr4.0がリリースされたので、早速使ってみました。早速起動時に躓きました。。致命的: Unable to use updateLog: _version_field must exist in schema, using indexed="true" stored="true" and multiValued="false" (_version_ does not exist) org.apache.solr.common.SolrException: _version_field must exist in schema, using indexed="true" stored="true" and multiValued="false" (_version_ does not exist) at org.apache.solr.updat

bluele 2013/04/25

solr

リンク

Java製形態素解析ライブラリ「lucene-gosen」を試してみる

概要 Javaの有名な形態素解析器でありながら、長らく「公式サイトどこ？」な状況だったSenとGoSenですが、最近はlucene-gosenなるGoSenベースのライブラリがちゃんと管理された状態で公開されてるとか。 lucene-gosen http://code.google.com/p/lucene-gosen/ しかもこの子は辞書内包なのでjarを落とすだけで使えて、Lucene用AnalyzerやSolr用Toknizerも付いていて、日本語の検索用インデックスを貼る時に便利な各種フィルタも用意されているという、至れり尽くせりな構成になっているとか。これは触ってみねばということで、とりあえず簡単な形態素解析、辞書の追加、Luceneでの利用、Solrでの利用を試してみました。ちなみに上のURLでCommiterのところに名前が出ているKoji SekiguchiさんはSol

bluele 2013/04/25

日本語

solr

リンク

はてなブックマーク

タグ

関連タグで絞り込む (11)

solrに関するblueleのブックマーク (33)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス