タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

solrに関するsisidovskiのブックマーク (13)

  • tree-tips: solrのReplicationHandlerで簡単レプリケーション! | Apache Solr

    solrのレプリケーション レプリケーションとは、複数のサーバでデータを同期することを言います。 solrのレプリケーションには2通りの方法があります。 solr1.3までのバージョンではssh + rsyncによるレプリケーションが行えます。 solr1.4以降ではReplicationHandlerでhttp通信によるレプリケーションが可能になりました。 ReplicationHandlerはhttp通信なので、ssh+rsync形式と違ってdaemonの起動も不要でportを開ける必要もありません。 solr1.4以降ではReplicationHandlerを使う事をおすすめします。 なお、ReplicationHandlerを行うにはcommons-httpClientが必要なので、jarを追加しましょう。 レプリケーションの設定をする レプリケーションの設定はsolrconfig

    tree-tips: solrのReplicationHandlerで簡単レプリケーション! | Apache Solr
  • solrでmultiValueなフィールドのunigram検索 - ひ孫

    solr3.3での話。 solrで単純にunigramがやりたいとなると <fieldType name="unigram" class="solr.TextField"> <tokenizer class="solr.KeywordTokenizerFactory" /> <!-- ↓NGram --> <filter class="solr.NGramFilterFactory" maxGramSize="1" minGramSize="1" /> </fieldType> のようにフィールドを定義するとさらっとできてしまう。 これが一つしかフィールドを持ってないようなフィールドであればそんなに問題ないのだけど multiValuedなフィールドの場合だとちょっと面倒な問題が起こる。 例えば <fields> <field name="id" type="int" indexed="t

    solrでmultiValueなフィールドのunigram検索 - ひ孫
  • Apache Solr で全文検索 - スキーマの設定方法

    今回はスキーマの設定方法について説明します。 スキーマには、検索したいドキュメントに含まれるフィールドの構造を定義します。 3.1 スキーマ定義ファイル¶ スキーマは各コアごとに conf/schema.xml ファイルに記述します。例えば、サンプルのcollection1コアの場合 ${solr.solr.home}/collection1/conf/schema.xml がスキーマ定義ファイルになります。 スキーマ定義ファイルに記述するのは主に以下の項目です。 フィールド (<fields>) フィールドタイプ (<types>) フィールドには検索したいデータを記述します。フィールドタイプには各フィールドのデータ型を記述します。 まず、スキーマを <schema> タグを使って定義します。

    Apache Solr で全文検索 - スキーマの設定方法
  • 第4回 Solr4にRDBのデータをくわせる

    Solr4を動かしてみるシリーズの4回目です。 今回は、SolrにRDBのデータをくわせてみます。 solrのチュートリアルにはRESTインターフェイスからインデックスするデータを登録するやり方が書いてありますが、インデックスしたいデータの多くはRDBやNoSQL等のストレージに格納されていることが多いと思います。 いっこいっこPOSTなんてやってられません。 で、RDBのデータを読んでインデックスを作成することにします。 このチュートリアルではRDBとしてMySQLを使用します。 4.1. JDBCドライバを設置する solrはjava製のプロダクトなので、MySQLに接続するためにJDBCドライバを使います。 MySQLのサイトからJDBCドライバをダウンロードします。 MySQL Connector/J 解凍してjarをコアディレクトリのlib内に置きます。 tar zxvf mys

  • SolrにWikipediaのデータを入れて遊ぶ

    概要 全文検索エンジンのSolrを使って、Wikipedia(日語版)の記事を検索する機能をさらっと作ってみる。面倒なことはすっ飛ばして、できるだけ少ない手数を選択。あと、ソースコードはJava。 注意事項として、Solrはけっこうメモリう。特にoptimize時とか、大掛かりなソート時とか。 メモリが少ないマシンでは使うと不自由するので避けた方が良いかもしれない。とりあえず手元の4G積んだマシンでは快適に動いている。 @CretedDate 2011/09/04 @Env Solr3.5.0 / lucene-gosen1.2.1 @UpdateDate 2012/02/21 Solr3.5.0に変更したりクエリの誤りを直したり Solrの導入 まずSolrをダウンロードして解凍する。 ここからダウンロード http://lucene.apache.org/solr/#getstar

  • 『Apache Solrのデモ環境を作ってみる』

    前回の「Apache Solrを利用して格的な検索エンジンを導入する 」の続き。 前回のエントリでApache Solr4.2のインストールと日語検索の環境設定を行いましたが、今回は具体的なApache Solrの操作感をまとめていきたいと思います。 何にせよやっぱり動く環境を見ていくのが一番理解しやすいわけですが、デモサイトを一から用意してとなると結構手間になることから、下記のサイトの情報をベースに書いていきます。 第5回 全文検索エンジン「Lucene/Solr」を導入する @ ITpro この記事はApache Solr1.3系の古いバージョンでの解説記事なので、このエントリではそれを4系のバージョンに焼きなおしたようなものになっています。 まず、P.1のSolrのインストールや環境準備は前回のエントリで整っているので割愛します。 ということで、P.2以降(要会員登録)のところか

    『Apache Solrのデモ環境を作ってみる』
  • TechCrunch | Startup and Technology News

    Amazon has received approval from the U.S. Federal Aviation Administration (FAA) to fly its delivery drones longer distances, the company announced on Thursday. Amazon says it can now expand its…

    TechCrunch | Startup and Technology News
  • tree-tips: solr adminでデータ確認 | Apache Solr

    インデックスデータを確認する。 開発時でも必要になりますが、リリース後の運用でも値の確認は非常に重要になりますね。 まず、インデックスデータと言っても2種類有る事を認識しておく必要があります。 1つ目は「stored」、2つ目は「indexed」、です。 storedの値は容易に確認できますが、indexedの値は非常に確認がし難いです。 その2つは何が違うのでしょう。storedは検索結果として返却される値で、indexedは検索時に使用される値です。 RDBと比較すると解りやすいので、以下をご覧下さい。 solr MySQL stored selectした結果 indexed Bツリーインデックスやユニークインデックスの値 いかがでしょうか。 indexedの値が確認し難いのですが、RDBはindexされた値は確認する事ができません。 理由は、RDBには基的に形態素解析が無く常に指定

    tree-tips: solr adminでデータ確認 | Apache Solr
  • pixiv サイバーエージェント共同勉強会 solr導入記

    WebSocket及びWebRTCの技術紹介資料です。 WebSocket : 概要、標準化状況、HTTPとの通信量比較、PUSH方式の比較、ブラウザの対応状況 WebRTC : 概要、標準化状況、通信(PeerConnection)確立までの流れ、利用事例、ブラウザの対応状況 (NTTアドバンステクノロジ(NTT-AT))

    pixiv サイバーエージェント共同勉強会 solr導入記
  • QueryParametersIndex - Solr - Apache Software Foundation

    A table listing many query parameters and where you can find more details about them. NOTE: This index is maintained manually, and may be out of date!

  • Masakiの戯言部屋::【Solr】クエリパラメータについて

    正直まだ調査中のところが多いのです。 今の時点でも結構精度はよくなってきてはいるのですが形態素解析の悪いところが出るケースもあります。 辞書に登録されていないものに関してはうまく行かないことがあります。 後はLike検索がうまく言ってない場合も。 なのでこのエントリーでは引用を中心に書きます ↓参考サイト [Lucene] Query Parser Syntax|ミ通信(編) http://ameblo.jp/miralis/entry-10289721378.html Ride(らいど)の技術メモ http://alexride.blog83.fc2.com/blog-entry-6.html クエリパラメータ ■qt クエリータイプで、標準はstandard。 詳細は現在調査中。 ■wt 検索結果のフォーマットを指定できる。 xml:XML形式 js

  • Resources

    Tutorials Solr Quick Start Solr on Docker Solr on Kubernetes Users who have completed the tutorial are encouraged to review the other documentation available. Documentation The Apache Solr Reference Guide Solr Reference Guide Visual Guide to Streaming Expressions and Math Expressions Solr Javadocs Solr generates JavaDocs for all included code in each release. Copies of this documentation for every

    Resources
  • 全文検索サーバ: これからSolrを始める人のためのApache Solr概要と便利な情報リスト集

    はじめまして。 プロダクト&サービス事業部 リーダーの久保です。 今日は、当社で利用しているOSSの全文検索アプリケーションであるApache Solrについてご紹介したいと思います。 GoogleでSolrを検索しても、日語圏のコンテンツはまだまだ少ないようです。 当社がSolrを使い始めた昨年は現在よりもさらに少なく、結構苦労しました。 今回はやや雑多な内容となりますが、新しくSolrを使う際に必要と考えられる情報をまとめてみました。 エントリーでは、Solr1.3を対象としています。 Solr1.3が現在の安定版で、Solr1.4-devが開発版となります。 目次 Solrとは 機能一覧 実績/事例 Solrを使ったシステムの開発方法 おすすめする方 データ量/性能とハードウェア マルチコア構成 様々な検索 スケールアウト 検索と更新 Solrを始めるための情報リスト 全

  • 1