[B! Solr] robonicoのブックマーク

Rosette for Solr - Solr Name Search - Rosette Text Analytics

Smart Indexing for Brilliant Search Enhancing Solr with AI-Powered Text Analytics Apache Solr is at the heart of many innovative search-based applications. With Rosette’s advanced natural language processing (NLP) techno logy, you can power your existing Solr applications up with artificial intelligence. Request a Demo ● Document Tagging ● Multi-Faceted index enrichment for data discovery Rosette e

robonico 2013/04/16

Solr

リンク

Solr Tutorial

This document covers the basics of running Solr using an example schema, and some sample data. To follow along with this tutorial, you will need... Java 1.6 or greater. Some places you can get it are from Oracle, Open JDK, or IBM. Running java -version at the command line should indicate a version number starting with 1.6. Gnu's GCJ is not supported and does not work with Solr. A Solr release. Ple

robonico 2013/04/16

Solr

リンク

慎ましい構成で使うSolr « NAVER Engineers' Blog

お世話になっております、開発チームの池上です。最近ちょっとした検索機能にSolrを導入しました。Solrは検索エンジンのミドルウェアでご存知の方も多いと思います。大規模な構成による導入実績が豊富でWeb上にもたくさんの事例がありますが、今回は慎ましい構成の事例を紹介させて頂こうと思います。使用しているSolrのバージョンは2012年1月時点で最新の3.5.0です。なお、検索エンジンやSolrに関する基礎的な情報につきましては、有用な解説がすでに多数存在していますので割愛させて頂きます。今回はつぎの前提条件と要件を意識して構築しました。前提条件サーバは極力少なめでミッションクリティカルな機能ではないデータ量はそれほど多くない要件更新はある程度頻繁遅くとも数分以内にはインデックスに更新を反映させたい一般的なWeb検索のように「いい感じに見つける」よりは「（入力されたキ

robonico 2013/04/16

Solr

リンク

Wikipedia のテキストデータを使ってベンチマークをする! その3 Solr のスキーマ設計 - Solr, Python, MacBook Air in Shinagawa Seaside

WikiPediaのデータを入れるための Solr のスキーマ設計です。 Wikipedia のデータ構成 [Solr][MySQL] Wikipedia のテキストデータを使ってベンチマークをする! その２ Wikipedia のテキストデータを MySQL に入れるで MySQL に入れた Wikipedia のデータ構造は以下の用になっています。 Solr に入れるのは 3のテーブルそれぞれの主キーと、日本語が入っている4つのフィールドの合計7フィールドです。 page_id page テーブルの主キーです。Solrでもユニークキーに使います。 rev_id revision テーブルの主キーです。検索では特に使わないのですが、デバッグ目的でデータベースを検索したりするときに役だってくれればと思って入れています。 old_id text テーブルの主キーです。こちらもデバッグ目的です

robonico 2013/04/16

Solr

リンク

tree-tips: solrを使う前に知っておくべき事 | Apache Solr

solrって何？ Apache solr solr wiki オープンソースのpure javaの全文検索エンジンです。 Apacheのトッププロジェクトであり、twitterやfacebook級のサイトでも使用されています。 solrにできる事は？超高速検索のエンジンを自分で作成可能（オレオレMySQLのようなものを作る事ができる）。検索する項目を自分で定義可能（RDBのカラム）。定義した項目に、順序を保持したままリスト形式で値を保存可能（カラムにjavaでいうところのListを保存できる）。完全一致検索可能。中間一致検索可能（フルスキャンで超低速になるので非推奨）。前方一致検索可能。超高速に件数を取得する、ファセット検索が可能。（select count(*)を100回同時に行なっても超高速）超高速に同義語検索可能で、同義語の辞書を自分で定義可能。（or name =

robonico 2013/04/16

Solr

リンク

Solr による N-Gram 検索 - MOYO Laboratory

日本語の文章に対して全文検索用のインデックスを作成する方法としては、形態素解析により分解した単語をインデックスする方法や、N-Gram によってインデックスを作成する方法などがあります。形態素解析はインデックスが小さく検索が早いこと、N-Gram は業界用語などの特定ドメインの言葉や日本語以外にも対応できて部分一致検索が可能であることなど、双方に利点があります。今回は Solr を使用した N-Gram 系トークナイザーについて記述します。 N-Gram 検索を行うには Solr コアの schema.xml を開いてフィールド型を定義します。 <fieldtype name="text" class="solr.textField" positionIncrementGap="100"> <analyzer> <tokenizer class="solr.CJKTokenizerFac

robonico 2013/04/16

Solr

リンク

Solrの導入資料を公開します - Hatena Developer Blog

こんにちは、 id:yanbe です。全文検索エンジンLucene上に構築されたSolrという検索ミドルウェアがあります。拡張性・カスタマイズ性に富み、既存のデータのインポート機能が豊富なのもあって、広く利用されています。参考: Solr - Wikipedia 国内のウェブサービスでのSolrの採用事例を挙げるとNAVERやCookpad、アメーバなどがありますが、はてなでも以前より一部のサービスでSolrを採用しています。 Solrの公式ドキュメント(英語)はwiki形式で提供されており、網羅的な情報はこちらで手に入ります。また、Solrの基本的な使い方を学べるチュートリアルもありますが、「すでにある典型的なLAMP構成のウェブサービスにSolrによる検索機能を組み込む」までには、ここからさらに多くの情報を調べる必要があり、Solrの導入のハードルとなっていると感じました。そこで

robonico 2013/02/19

Solr

リンク

GitHub - hatena/solr-tutorial: Solrの導入資料です。LAMP構成に特化しています。

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

robonico 2013/02/19

Solr

リンク

Solr Tutorial

This document covers the basics of running Solr using an example schema, and some sample data. To follow along with this tutorial, you will need... Java 1.6 or greater. Some places you can get it are from Oracle, Open JDK, or IBM. Running java -version at the command line should indicate a version number starting with 1.6. Gnu's GCJ is not supported and does not work with Solr. A Solr release. Ple

robonico 2013/02/19

solr

リンク

検索エンジンの常識をApache Solrで身につける

現在利用できる主な検索エンジン9選現在までに、さまざまな企業・団体が商用・OSS（オープンソース）のものを合わせて、多数の検索エンジンを開発しています。以下に、よく知られているものを集めました。商用 Sedue Preferred Infrastructer社が開発した検索エンジン。アルゴリズムに接尾辞配列を利用している Fast ESP ノルウェーのファストサーチ＆トランスファ社が開発した検索エンジン。高いスケーラビリティと柔軟なカスタマイゼーションを提供し、多くの大規模サービスで利用されている。マイクロソフト社に買収されたが、現在もマイクロソフト社から購入できる ConceptBase Enterprise Search ジャストシステム社が開発した検索エンジン。古くから日本語処理を開発してきた知見を生かした、高い検索精度に特徴を持つ OSS Apache Lucene（以下、Lu

robonico 2013/02/19

Solr

リンク

DebianにOpenJDK + Tomcat 7 + Solr 4.0 の環境を構築する

# java -version java version "1.6.0_18" OpenJDK Runtime Environment (IcedTea6 1.8.13) (6b18-1.8.13-0+squeeze2) OpenJDK Client VM (build 14.0-b16, mixed mode, sharing) Tomcat 7のインストール Tomcat 7 Downloads http://tomcat.apache.org/download-70.cgi ここから最新バージョンの、Binary DistributionsのCoreを取得し、 usr/local/jakartaに展開します。今回ダウンロードしたファイルは「apache-tomcat-7.0.32.tar.gz」です。 # mkdir /usr/local/jakarta # cd /usr/loc

robonico 2013/02/19

Solr

リンク

Tomcat7.0にSolr3.5をセットアップする

気付けば環境設定ばかりしている毎日なのですが、今日はTomcat7.0にSolr3.5をセットアップします。 ■ Solrのダウロード＆Tomcatにデプロイ Solrのホームページからダウンロードしてきます。Ultra Fastて…って思うけどもｗ zipファイルを落としてきて解凍後、solr.warをTomcatのwebappsディレクトリに突っ込みます C:UsersoreoreDownloadsapache-solr-3.5.0apache-solr-3.5.0examplewebappssolr.war から C:Program FilesApache Software FoundationTomcat 7.0webapps に。 Tomcatを起動するとwarファイルが解凍されます。 admin画面を開こうとすると404になってしまいます。まぁ、そんなものです。 ■ エラーログ

robonico 2013/02/19

solr

リンク

Apache Solr で全文検索 - とりあえず使ってみる

1.1　Apache Solrとは?¶ Apache Solrは、全文検索ライブラリであるApache Luceneを使用した検索エンジンサーバです。Solrの特徴としては以下の通りです。 Javaで記述されている. 各種サーブレットコンテナ上で動く. RESTライクなAPIを提供し、ドキュメントの登録にはXML, JSONなどを使う検索結果のハイライトファセット検索レプリケーション ... 機能がありすぎて調べきれていません。 1.2　Solrのインストール¶ ここではApache TomcatにSolrをインストールする手順を説明します。使用したソフトウェアは以下の通りです。 Apache Tomcat 7.0.32 Apache Solr 4.0.0 Java 1.6.0_37 まず、Apache Tomcat を適当なディレクトリに展開します。(ここでは/usr/local以

robonico 2013/02/19

Solr

リンク

Welcome to Apache Solr

Solr is the popular, blazing-fast, open source enterprise search platform built on Apache Lucene™. Learn more about Solr. Solr is highly reliable, scala ble and fault tolerant, providing distributed indexing, replication and load-balanced querying, automated failover and recovery, centralized configuration and more. Solr powers the search and navigation features of many of the world's largest inter

robonico 2013/02/19

Solr

リンク

強烈に素晴らしいプロダクトに変貌した Apache Solr - Solr 4.0 登場 - にょきにょきブログ

Apache Solr 4.0 がリリースされた。本記事では Solr 4.0 の新機能や改善された点のうち気になるものを紹介する。概要 Solr 4.0 では、下記の変更が入る。 83 個の新機能 13 個の最適化 121 個のバグ改修 Solr 4.0 はメジャーバージョンアップにふさわしい、非常に強力なリリースとなる。 SolrCloud Solr 4.0 の数ある新機能のうちの目玉機能。 SolrCloud という名前から推測できるように、Solr の分散構成が行えるようになった。とはいうものの、Solr 3.6 以前でもレプリケーションは行えたのだが、Solr 4.0 は一味ちがう。今までより断然賢くなった。シャーディングもクラスタリングも簡単な設定で行うことができる。インデクス書き込みも複数ノードから行える。そしてなにより自動フェイルオーバーができるようになった。さらに