[B! Solr] ji_kuのブックマーク

第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive

1. Amazon CloudSearch Deep Dive 2014年年12⽉月8⽇日第15回 Solr勉強会 #SolrJP アマゾンデータサービスジャパン株式会社篠原英治 2. Amazon CloudSearch Deep Dive ! Agenda • Who am I • Amazon CloudSearch Overview • Amazon CloudSearch Update • Inside Amazon CloudSearch • Amazon CloudSearch Pro Tips • Wrap up 3. Amazon CloudSearch Deep Dive ! Agenda • Who am I • Amazon CloudSearch Overview • Amazon CloudSearch Update • Inside Amazon Clou

ji_ku 2015/03/23

リンク

クックパッドの検索の裏側 - クックパッド開発者ブログ

初めまして、インフラストラクチャー部の加藤 (@EugeneK) です。クックパッドでは現在178万ものレシピが公開されていますが、目的のレシピを探すために検索機能を提供しています。今回は検索機能の裏側の仕組みについて、インフラストラクチャーの観点からお話ししようと思います。全ての検索機能を支えるSolrと周辺のアーキテクチャクックパッドにはレシピの検索だけでなく様々な検索機能がありますが、その全てはSolrを活用して実装されています。以前はMySQL Tritonnによる全文検索機能を使用していましたが、2011年頃からSolrに切り替わりました。クックパッドではSolrをマスタ - スレーブ構成にすることで冗長性と負荷分散を実現しています。以下の構成図をご覧ください。マスタとスレーブの間には、リピータと呼ばれる検索インデックスを中継するためだけの役割のサーバがいます。この

ji_ku 2015/02/23

リンク

Solr の Spatial Search 機能試してみました

以前に勤めてた会社のエンジニアブログで公開してたシロモノなんですが、都合によりそちらのブログが消えちゃったのでこちらで公開します。もう一年半以上前に書いたものなのでだいぶ古いですが。（もう Solr もバージョン4が出てますし…）全文検索システム Solr のバージョン 3.2 を使って Solr の Spatial Search 機能に触れてみました、という内容です。Solr Wiki の Spatial Search をなぞってみたのですが、こちらで使われているサンプルデータに含まれるのはもちろん海外の位置情報です。島国に生まれた人間として、どうもイメージしづらかったので大雑把な日本のランドマーク位置情報データを作り、これに対して Spatial Search してみました。環境今回の作業は以下の環境で行いましたが、たぶんこの環境でなくともだいたいは実施可能と思います。 Cent

ji_ku 2013/03/16

Solr

リンク

強烈に素晴らしいプロダクトに変貌した Apache Solr - Solr 4.0 登場 - にょきにょきブログ

Apache Solr 4.0 がリリースされた。本記事では Solr 4.0 の新機能や改善された点のうち気になるものを紹介する。概要 Solr 4.0 では、下記の変更が入る。 83 個の新機能 13 個の最適化 121 個のバグ改修 Solr 4.0 はメジャーバージョンアップにふさわしい、非常に強力なリリースとなる。 SolrCloud Solr 4.0 の数ある新機能のうちの目玉機能。 SolrCloud という名前から推測できるように、Solr の分散構成が行えるようになった。とはいうものの、Solr 3.6 以前でもレプリケーションは行えたのだが、Solr 4.0 は一味ちがう。今までより断然賢くなった。シャーディングもクラスタリングも簡単な設定で行うことができる。インデクス書き込みも複数ノードから行える。そしてなにより自動フェイルオーバーができるようになった。さらに

ji_ku 2012/10/31

Solr

リンク

GitHub - suguru/elasticsearch-analysis-japanese: Japanese analyzer uses kuromoji japanese tokenizer for ElasticSearch

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

ji_ku 2012/01/20

Solr

リンク

「Apache Solr入門」のサンプルのlucene-gosen対応（1章から4章） | @johtani の日記

一定期間更新がないため広告を表示しています

ji_ku 2011/11/26

Solr

リンク

Solr at cookpad

Solr at cookpad - Download as a PDF or view online for free

ji_ku 2011/11/13

Solr

リンク

Ride（らいど)の技術メモ　solr

CJKAnalizerでは「花」の１文字の検索を行うと、検索出来ない不具合が見つかった。その他に検索できない日本語が色々出てきたので、CJKAnalizerには身を引いてもらいます。んで、色々試したのですがどれも一長一短すぎ、使い物にならないので、 N-Gramを使用することにしました。 N-Gram を 1-gram で使用した場合、語句に関係無く文字が一致するとヒットしてしまうので、検索ワードが２文字以上の場合は 2-gram を使用する方針としました。データ上に検索キーワードが存在するのに CJKAnalizer ではヒットしない場合があるなんて、信じられない！。 solrを使用している事例は日本語のページでも見ますが、こういう事が明らかにされていないのは非常に不親切ではないでしょか？？実際solrの問い合わせパラメータを日本語で説明しているサイトも無いし、オープンソースなん

ji_ku 2011/11/05

Solr

リンク

SpatialSearch - Solr - Apache Software Foundation

{{{#!wiki red/solid The most up to date information about spatial search at the Solr Reference Guide instead: https://cwiki.apache.org/confluence/display/solr/Spatial+Search. Some details, examples, and other info is still here, however. }}} Solr3.1 Spatial Search Introduction Many applications wish to combine location data with text data. This is often called spatial search or geo-spatial search.

ji_ku 2011/10/26

Solr

リンク

Lucene/Solrの位置情報検索デモ(１) - 株式会社データ・コム・ナレッジ:Data Com Knowledge

Lucene/Solr 3.1 から新たに実装されたSpatial Search について試してみました。今回、位置情報データに使用したのは国土数値情報ダウンロードサービスの公共施設データです。 1.データ準備国土数値情報ダウンロードサービスから公共施設データ47都道府県分のXMLファイルをダウンロード XMLデータをパースしてMySQLに格納 → 直接Solrに格納することも当然できるが、今回はMySQLに一旦格納した理由としては以下の2点。公共施設データ本体と緯度経度データがXML中の別のところにあり、XPathで検索もできるが速度的にはMySQLのほうが速そうだった施設の大分類、小分類、市区町村がコード化されているので、MySQLにマスターデータを持ってJOINしたほうがよさそう ※このプログラムはあまりに汚いので公開しません。。。概要としては、ざっと以下のような感じ

ji_ku 2011/10/25

Solr

リンク

Apache Solr3.4.0のマルチコア機能で嵌った時のメモ - FAT47の底辺インフラ議事録

CentOS5.7で全文検索エンジンApache Solr3.4.0のインストールからMySQLデータのインポートまで Apache Solr入門 ―オープンソース全文検索エンジン作者: 関口宏司,三部靖夫,武田光平,中野猛,大谷純出版社/メーカー: 技術評論社発売日: 2010/02/20メディア: 大型本購入: 18人クリック: 567回この商品を含むブログ (22件) を見るの記事の続きです。マルチコア化作業を進めた時に嵌ったことをメモしました。 Solrのマルチコア機能通常1つのSolrをサーブレットコンテナにデプロイすると、1つのインデックスとそれに対応するインタフェースが提供されます。マルチコアを利用すると、1つのsolr上に複数のインデックスとそれに対応するインタフェースを利用することができます。インストールされたSolrのexampleには、multicore

ji_ku 2011/10/24

Solr

リンク

ZABBIXでApache Solr1.4のステータス監視をする - FAT47の底辺インフラ議事録

CentOS5.7にZABBIX1.8.7をインストール上記の記事で導入したZABBIXでApache Solrのステータス値を取得する手順を紹介します。本当はApache Soler3.xの値を取得したかったのですが、どうもうまくいかずバージョン1.4での利用になります。どなたかSolr3.xでの設定方法わかる方いたら教えて頂きたいです。 Solrの情報を得るためにはブリッジアプリケーションであるzapcatを導入します。 http://www.kjkoster.org/zapcat/ wget http://sourceforge.net/projects/zapcat/files/zapcat/zapcat-1.2/zapcat-1.2.zip/downloadここでダウンロードしてきたzapcat-1.2.zipの中にある、zapcat-1.2.warをsolrに配置します。

ji_ku 2011/10/24

Solr

リンク

CentOS5.7で全文検索エンジンApache Solr3.4.0のインストールからMySQLデータのインポートまで - FAT47の底辺インフラ議事録

Apache Solr http://lucene.apache.org/solr/ Apache Solr（ソーラー）はApacheコミュニティによってオープンソースで開発されている全文検索エンジンです。 Apache LuceneのHTTPラッパーのようなものです。 Luceneでは全文検索を行う為にはそれなりにコードを書かなければいけないですが、Solrを使うとSolrに対してHTTPのリクエストを行うだけで指定したデータをHTTPレスポンスで返してきてくれます。利用するにはTomcatなどのサーブレットコンテナを利用する必要があります。 MySQLのデータベースにあるデータをSolrにインポートしてデータを検索するといったことも可能です。現時点（2011/09/16）で最新のSolrは3.4.0です。1.4.xの時は同梱されていたJettyのバージョンは6.13でしたが、Sol

ji_ku 2011/10/24

Solr

リンク

Apache Solr 3.3.0 で日本語検索できるようになるまでにしたこと - 働かないプログラマのメモ帳

これからはSolrを使って全文検索サービスの時代だということで、Solrをダウンロードしてきてサンプルアプリケーションで日本語が扱えるようにしました。調べつつやっているのでもしかしたら間違っていることを言ってるかもしれません。 Apache Solr 3.3.0のダウンロード〜解凍 http://lucene.apache.org/solr/ の左側のメニューから【Resources】->【Download】と辿り、最新版（3.3.0）をダウンロードします。今回は apache-solr-3.3.0.tgz をダウンロードしました。 $ wget http://ftp.kddilabs.jp/infosystems/apache//lucene/solr/3.3.0/apache-solr-3.3.0.tgz $ tar xvf apache-solr-3.3.0.tgz $ # 適当

ji_ku 2011/10/19

Solr

リンク

Kuromojiを調べてみた | @johtani の日記

一定期間更新がないため広告を表示しています

ji_ku 2011/10/19

Solr

リンク

春山征吾のくけー : Solr: Kuromojiを評価 #SolrJP - livedoor Blog（ブログ）

Twitter / @ブルーツリー: Sen以外でのJavaのOSSの形態素解析器があるな ... で知った Kuromoji - ATILIKA Community Innovation という形態素解析器は, Solrで利用することができます. Lucene & Solr Integration - Koromoji - Confluence 5/16のSolr勉強会での評価をKuromojiでも行ない追記しました. Solr/Tokenizer評価201105 - 春山征吾のWiki - livedoor Wiki（ウィキ） Solr/Tokenizer評価201105/KuromojiTokenizer - 春山征吾のWiki - livedoor Wiki（ウィキ） Kuromojiは...dictionaries are based on MeCab-IPADIC とのことです

ji_ku 2011/10/19

Solr

リンク

アメーバサーチ第二回solr勉強会

1. アメブロ記事検索に Apache Solr 1.4 をつかってみた（お蔵入りした資料）第二回 Solr 勉強会　 2010/03/11 @ECNavi 株式会社サイバーエージェント新規開発局 2. Solr 導入の経緯 ■ 以前のアメーバサーチ・ Lucene 使用（ RMI 機能利用）・検索対象： 6000 万件ほど（直近 3 ヶ月～ 6 ヶ月）・スケールしにくいつくり・ Lucene のバージョンアップ困難　（ RMI は非推奨化予定？）・「アクセス過多のため・・・・・」と　検索できない・ QPS 　 50 ぐらい・・・・・　（ 4 セット合計で・・・）

ji_ku 2011/09/15

Solr

リンク

Solr3.1のHighlighterで数値文字参照にならないようにする - エメラルドアオキロック

たまたま#SolrJPのハッシュタグを見ていたら、exabugsさんのつぶやきを見つけて、Solrのソースを追いかけてみたりしました。折角良いネタを頂いたので、しっかりblogのネタにさせてもらいますw この問題はSolr3.1からなのかどうかは調べていませんが、確かにhighlightingの結果として返される文字列は、非ASCII文字が数値文字参照になっています。試しにSolr3.1で「日本語テスト」という文字列に対して「日本語」で検索してみます。ブラウザで見るとと、問題無く表示されているように見えますが、実際に返されているXMLを見てみるとこのように非ASCII文字が数値文字参照になっている事が分かります。この事には気付いていたのですが、私には実害があまり思い当たらなかったので放置していました。英語圏で作られたライブラリのコードで何度か見かけた事があります。むかーしむか

ji_ku 2011/07/22

Solr

リンク

3.1 は 1.4 に比べて 4割高速!! - Solr, Python, MacBook Air in Shinagawa Seaside

2011年3月にリリースされた Solr3.1.0 とそれまでの最新バージョンであったSolr1.4.1 とで速度比較を行ってみました。内包している Lucene の性能が上がったためでしょうか、かなり高速化されているようです。私の試したところ下記となりました。レスポンス : 1.4 倍 (平均 26ミリ秒 -> 19ミリ秒) スループット 1.33 倍 (5874/分 -> 7807/分) テスト環境 CPU インテル(R) Xeon(R) プロセッサー E5630 (12MB L3 キャッシュ、2.53GHz、5.86GT/s、4コア) メモリ 24GB (4GBx6) DDR3 RDIMM メモリ（1333MHz、ECC）ディスク 1.5TB SATA 3.0GB/s NCQ HDD (7200回転) × 2 OS CentOS release 5.5 (Final) Java

ji_ku 2011/07/22

Solr

リンク

Debian に Tomcat + Apache Solrの環境を構築

※2011年11月30日　追記 Tomcat 7、Solr 3.5.0でのインストールを試してみました。 DebianにOpenJDK + Tomcat 7 + Solr 3.5.0 の環境を構築する以前、Apache Solr をインストールしてみましたが、その後放置してました。 Debianで全文検索サーバー「Apache Solr」を動かす http://symfoware.blog68.fc2.com/blog-entry-131.html 改めて調べてみます。 Tomcatの導入前回はSolr同梱のjettyで動作させましたが、今回はTomcatで動かしてみようと思います。 ※Tomcatの方が経験が多いので。 Javaはインストール済の前提で話を進めます。今回はJava1.6.0_16を使用しました。 Tomcatのダウンロードは Tomcat 6 Downloads

ji_ku 2011/07/21

Solr

リンク

はてなブックマーク

タグ

関連タグで絞り込む (2)

Solrに関するji_kuのブックマーク (36)

お知らせ

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

今週のはてなブックマーク数ランキング（2024年9月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス