タグ

Solrとsolrに関するnaoeのブックマーク (44)

  • apache solrとは?ウェブサイトのスピードアップで売上向上を目指そう | GMOクラウドアカデミー

    連載「売り上げ向上の即効薬『電光石火のウェブサイト』」のほかの記事はこちら 第1回:イントロダクション 第2回:この記事 第3回:Cacheを知ろう 第4回:ダイナミックページアッセンブリーの威力がすごい 第5回:Solrをインストールしてみよう 今回は、サイト高速化のための3種の神器のうちの一つApache Solr(以後Solr)を知りたい、あるいはプロジェクトのパフォーマンス改善にSolrを検討している方々に対して、かしこく使えばウェブサイト高速化の強力な武器となるSolrパワーをご紹介します。 Ⅰ.高速で多様な検索能力をカンタンに導入できるSolr Solrは「ソーラー」と発音することからもわかるようにSolar(太陽)に由来しています。ちなみに英語がネイティブな人の発音は「ソォー」と聞こえます。Apache Solrは、スタンドアロンのエンタープライズ検索エンジンサーバーで、非常

    apache solrとは?ウェブサイトのスピードアップで売上向上を目指そう | GMOクラウドアカデミー
    naoe
    naoe 2017/11/30
  • OSSのツール「Solr」「Flume」「Banana」の組み合わせによるデータ可視化プラットフォーム構築

    ヤフー株式会社には、技術や制作の分野において専門性に優れたエキスパート人財を「黒帯」に認定し、その活動を手厚く支援する黒帯制度があります。「ある分野に突出した知識とスキルを持っているその分野の第一人者」が黒帯として認定され、褒賞金と活動予算が付与され、それぞれの分野のエバンジェリストとして社内外で活躍します。この黒帯によるリレー連載として、第2回目は「Solr黒帯」が執筆します。 はじめに 企業において、データの可視化(Visualization)の重要性が取り上げられ、今注目されています。WebサイトやECサイトを運営しているのであれば、サーバーのアクセスログには、現在までの顧客の活動記録といった膨大な量のデータが蓄積されており、顧客がどんなキーワードで自社サイトにたどり着いたのか、どんな商品を購入していったのかなど、その内容は多岐にわたります。そのデータを分析することで、新たな発見につ

    OSSのツール「Solr」「Flume」「Banana」の組み合わせによるデータ可視化プラットフォーム構築
    naoe
    naoe 2017/11/30
  • Apache Solr 5.xで、Managed Schema DefinitionからClassicIndexSchema(schema.xml)に変更しつつ、日本語検索したい - CLOVER🍀

    Apache Solrを使って、日語検索をするまでの初歩的な?話について。 まず、「bin/solr create」でコアを作成した時、日語系の設定はないのだろうなぁと思っていたのですが、意外とそうでもありませんでした。 スタンドアロンなSolrを使っている場合、「bin/solr create」で作成されるのはコアになります(SolrCloudの場合はコレクション)。 「bin/solr create -help」を行ってみると、そんな感じのことが書かれています。 $ bin/solr create -help Usage: solr create [-c name] [-d confdir] [-n configName] [-shards #] [-replicationFactor #] [-p port] Create a core or collection dependi

    Apache Solr 5.xで、Managed Schema DefinitionからClassicIndexSchema(schema.xml)に変更しつつ、日本語検索したい - CLOVER🍀
    naoe
    naoe 2016/01/15
  • Apache Solr 5.xで、コアの作成からサンプルドキュメントの登録まで - CLOVER🍀

    前回のエントリで、Apache Solrのインストールをやったので、今度はコアの作成とサンプルのドキュメントを登録してみます。 Solrでは、コアという単位で設定やインデックスの保持を行うみたいですね。 以降の操作の前提として、Solr 5.3.0のインストールディレクトリをカレントディレクトリとします。 $ cd solr-5.3.0 コアの作成 コアの作成は、「bin/solr create」コマンドで行います。 オプションなどを知りたい場合は、「-help」を付けて実行。 $ bin/solr create -help Usage: solr create [-c name] [-d confdir] [-n configName] [-shards #] [-replicationFactor #] [-p port] Create a core or collection dep

    Apache Solr 5.xで、コアの作成からサンプルドキュメントの登録まで - CLOVER🍀
    naoe
    naoe 2016/01/14
  • CentOS7にSolr5.0を入れる手順 - サナギわさわさ.json

    ユリ熊嵐面白いですよね。 CentOS7にSolr5.0を入れたので、その時の手順を残しておきます。 まず注意点として、Solr5.0ではJavaは1.7u55以上でないと正常に動きません。更にsolr.xmlの形式が変わっており、Solr4.3以前のものでは動かなくなっていることにも注意してください。 また、5.0ではSolrはスタンドアロンなサーバーアプリケーションとして動作します。今まで通りwar形式で出力してJettyやTomcat上で動かすことも一応できるようですが、推奨はされていません。 サービスインストールから起動確認まで Solr5.0ではinstall_solr_service.shがサービスインストールをやってくれるので、非常に簡単です。 yum install java-1.7.0-openjdk* java -version ※u55以上になっていることを確認 wg

    CentOS7にSolr5.0を入れる手順 - サナギわさわさ.json
    naoe
    naoe 2016/01/14
  • Apache Solr 5.3.0をインストールする - CLOVER🍀

    最近、Apache Solrを使うことになりそうなので、ちょっと勉強してみようかと。 Apache Solr http://lucene.apache.org/solr/ 完全に初めて、とは言えませんが、限りなくそれに近い状態でApache Solrを使います。 Quick Startを参考にして、進めていってみましょう。 Solr Quick Start http://lucene.apache.org/solr/quickstart.html インストール まずは、インストールからですね。 ダウンロード、展開。 $ wget http://ftp.tsukuba.wide.ad.jp/software/apache//lucene/solr/5.3.0/solr-5.3.0.tgz $ tar -zxvf solr-5.3.0.tgz ディレクトリを移動。 $ cd solr-5.3.

    Apache Solr 5.3.0をインストールする - CLOVER🍀
    naoe
    naoe 2016/01/14
  • Luceneフィルタ一覧 | mwSoft

    概要 英字を小文字で揃えるLowerCaseFilter、カタカナの長音の有無を揃えるJapaneseKatakanaStemFilter等、LuceneのTokenFilterやCharFilter系のクラスの中で、使いそうなものを一覧にしてみた。 Lucene3.6を利用。

  • Sunspot (Apache Solr) 導入

    こんにちは、tahara です。 いこーよ に Apache Solr の全文検索を使う Sunspot を導入しました。 これとかこれで MySQL の全文検索を使っていましたが、Sunspot を試してみたら 速い ファセットがものすごく便利 Kuromoji という日形態素解析機が使える だったので、 Sunspot は Apache Solr を使う。 Apache Solr を Java を使う。 Java か。。。 というあたりの精神的障壁を克服し、がんばって乗り換えることにしました。 ちょうど Solr 4.0.0 がリリースされたので Solr 4.0.0 sunspot 2.0.0.pre.120925 sunspot_rails 2.0.0.pre.120925 を使うことにしました。 vi Gemfile gem "sunspot_rails", "~> 2.0.

  • Full index of CUBRID Database using Solr DataImportHandler | Wiki Tutorials

    naoe
    naoe 2013/02/09
  • SolrTomcat - Solr - Apache Software Foundation

    {{{#!wiki red/solid Beginning with Solr 5.0, Solr is no longer distributed as a "war" (Web Application Archive) suitable for deployment in any Servlet Container. Solr is now distributed as a stand alone java server application, including start and stop scripts for use on Unix and MS-Windows platforms, as well as an installation script for setting up a "production" installation of Solr on *nix plat

  • ビーキョウのIT Solr 4.0 + Tomcat 7 インストール(構築)

    [PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。 こんちゃ(´・ω・)ノ Solr4.0とTomcat7の組み合わせでの 構築手順を記載するよ! ※そのうちSolr4.0+Jetty(同梱)の手順も書いておこうと思う。 <%SOLR_INST_HOME%>:Solrのインストーラホームディレクトリ <%SOLR_HOME%>:Solrのホームディレクトリ <%TOMCAT_HOME%>:TOMCATのホームディレクトリ 【環境】 ・Apache Tomcat 7.0.32 ・Apache Solr 4.0 ・JDK 1.6.0_24 【事前準備】 ・Tomcat7を構築済みであること。 Tomcat7のインストール方法はこちらを参照。 http://itdata.blog.shinobi.jp/Entry/84/ 私は最初すでに

  • Solrの日本語対応 -新しく追加されたトークナイザ・トークンフィルタ- 株式会社ロンウイット

    先日、Lucene/Solrのbranch_3x(3.6)とtrunk(4.0)にコミットされた日語向けのトークナイザ・トークンフィルタをご紹介します。 LuceneのJIRAのチケット LUCENE-3305 にて、日形態素解析器Kuromojiが導入されました。 これにより、日語ドキュメントに対して形態素解析に基づく単語分割が可能になります。 従来、Lucene/Solrで日語対応をする場合は、lucene-gosenやSenを使用する方法などをとってきましたが、今回の対応であらかじめLucene/Solrに組み込まれたものを使用するということが可能になります。 また一方で、LUCENE-2906にて、CJK文字に関するトークンフィルタも追加されました。 記事では、これらのトークナイザ・トークンフィルタに関して、2012/2/23時点のソースに基づいて調査したものを解説いた

    Solrの日本語対応 -新しく追加されたトークナイザ・トークンフィルタ- 株式会社ロンウイット
  • Apache Solrをインストールしてみる | GENDOSU@NET

    Apache Solrを入れてみます。 ちょっと前までは、Apache Solrで日語を扱う時は SenとかGosenとかの日形態素解析ライブラリを一緒に入れる必要がありました。 Apache Solr 3.6からは、Kuromojiという日形態素解析ライブラリがApache Solrに同梱されるようになりました。 これにより、日語を扱う時、Apache Solrだけをインストールすれば良くなりました。 ということで、Apache Solrのインストールをしてみます。 まず、Apache Solrのサイトから3.6をダウンロードします。 ダウンロードした物を適当に展開します。 [shell]tar xvfz apache-solr-3.6.0-src.tgz[/shell] 続いて、schema.xmlを編集します。 今回はtext_jaいうフィールドを日語解析にかけようと思

    Apache Solrをインストールしてみる | GENDOSU@NET
    naoe
    naoe 2013/01/17
  • Apache Solrを使ってみる | @blog.justoneplanet.info

    ■インストール macにインストールする Javaは既に入ってると思うので、以下のコマンドでダウンロードする。 wget http://ftp.tsukuba.wide.ad.jp/software/apache/lucene/solr/3.6.0/apache-solr-3.6.0.zip unzip apache-solr-3.6.0.zip cd apache-solr-3.6.0 CentOSにインストールする Javaが必要なので以下のコマンドでJavaをインストールする。 yum install java-1.6.0-openjdk java -version 以下のコマンドでダウンロードする。 wget http://ftp.tsukuba.wide.ad.jp/software/apache/lucene/solr/3.6.0/apache-solr-3.6.0.tgz t

    naoe
    naoe 2013/01/17
  • livedoor Techブログ : livedoor グルメの DataSet を公開

    櫛井です。 以前 livedoor clip のデータを学術研究用に公開しましたが,おかげさまで,たまに発表等で livedoor clip という名前が引用されているのを見かけるようにもなり感慨深い限りです。 さて,今回は第二弾としまして,livedoor グルメのデータをまとめてダウンロード & 利用可能にしようと思います。 今回はいろいろと余裕がなかったため 豪華なイラスト付きページが用意できませんでした livedoor clip のデータとは違い,定期アップデートはされません。2011年4月22日の時点のデータのみとなります ...が,なにかしら皆様の研究のお役に立てればと思います。 よくありそうな質問と答え ライブドアグルメのユーザですが,自分の個人情報が公開されちゃうってこと?困ります! 公開されるのは,もともとライブドアグルメのサイトで誰でも見れるようになっている情報だけで

    naoe
    naoe 2013/01/17
  • Solr4.0のPivotFacetingを使ってみる

    先日のSolr勉強会でドリルダウンの実装に関するセッションがあって、 その中でSolr4.0のPivot Facetingが最強じゃね?って話で、 スゲー良さげだったので自分も試してみる事にしました。 ってか、FacetPivotって何なのっていうと、、Solr4.0のWikiに以下のように書いてあります。 * Pivot Faceting – Multi-level or hierarchical faceting where the top constraints for one field are found for each top constraint of a different field. ってことで、使うデータはこれまたSolr勉強会の際にクックパッドの@PENGUINANA_が ElasticSeachのセッションでコレいいよーってオススメしてたlivedoorグルメさ

    Solr4.0のPivotFacetingを使ってみる
    naoe
    naoe 2013/01/08
  • 先日リリースされたSolr4.0と話題のSolrCloudを試してみる

    何かと検索の需要ってあるわけなんですが、その中でもオープンソースで 最もポピュラーなのはApache Solr(http://lucene.apache.org/solr/)だと思います。 メジャーバージョンアップ版の4.0が出てたのは知ってたのですが まだ試していませんでした。 ↓を読んでたら居ても立ってもいられなくなってきたので、やってみましたw 強烈に素晴らしいプロダクトに変貌した Apache Solr – Solr 4.0 登場 | にょきにょきブログ Solr3.6でKuromojiを試した時はTomcatを使いましたが、 今回は家のチュートリアル↓に沿ってJettyでやってみます。 http://lucene.apache.org/solr/4_0_0/tutorial.html ■ Solrサーバーを起動 $ wget http://ftp.jaist.ac.jp/pub

    先日リリースされたSolr4.0と話題のSolrCloudを試してみる
    naoe
    naoe 2013/01/08
  • ossaj.org

    OSSAJ ミニセミナー(2011年度第3回目) 全文検索エンジン Lucene/Solr の全貌 ミニセミナー概要 今回のミニセミナーではオープンソースの全文検索エンジン「Lucene/Solr」(ルシーン/ソーラー)を取り上げ、早くから「Lucene/Solr」を手掛けているお二人の専門家をお招きして様々な視点から解説していただきます。 オープンソースソフトウェア検索サーバ Solr 入門 大谷純 氏(株式会社シーマーク) Apache Solr(ソーラー)は簡単に全文検索の機能が導入できるオープンソースソフトウェアの検索サーバです。今回は、Solrの良さを知っていただくために、検索エンジンの基的な仕組み、利用シーンを元にSolrの機能を紹介します。また、検索エンジンライブラリApache Lucene(ルシーン)を中心にしたオープンソースソフトウェアのエコシステムについても簡単に紹

  • solr4.0のsolr adminが使いにくい件 - 文系プログラマによるTIPSブログ

    最初ビックリしました。 solr4.0でsolr adminがガラっと変わった訳ですが、使いにくいです。 まずはよく使うクエリ実行画面です。 この画面、xmlが初期選択、インデントがオフ、なのです。 インデントをデフォルトでonにするパラメータがあるのでしょうか??? 無いと激しく使いにくいです。毎回チェックする作業が嫌です。 続いてクエリ実行結果をXMLでインデントした例です おわかり頂けるでしょうか・・・ なんとXMLのタグが表示されないという・・インデントの意味無いです。 solr3.6まではブラウザがxmlを自動でインデントしてくれていたから、綺麗に表示されていました。 xmlのインデントができないので、代わりにjsonを使えばインデント表示できます。 これですよこれ。インデント表示。 これらの結果を踏まえると、 インデント表示するためには、 1,クエリを入力。 2,wtコンボボッ

    solr4.0のsolr adminが使いにくい件 - 文系プログラマによるTIPSブログ
    naoe
    naoe 2012/12/17
  • http://logmania.masakiplus.net/archives/6154

    naoe
    naoe 2012/12/17