タグ

全文検索に関するtreby006のブックマーク (2)

  • Apache Solr - Wikipedia

    Solr(ソーラー)は、オープンソースの全文検索システム。Apacheソフトウェア財団のLuceneプロジェクトのサブプロジェクトとして開発されている。 概要[編集] 全文検索エンジンライブラリLuceneをベースに、管理画面やキャッシュ機構を取り入れたアプリケーション。 機能上の特徴は、検索結果にファセットと呼ばれる検索結果を特定の軸でクラスタリング、それぞれの件数情報を付加することができること。商用の検索エンジンでもこの機能があるものは少ない。 構造上の特徴は、内部はいくつかのコンポーネントに分かれ、各所にプラグイン機構を持っているため拡張性に優れる、また、さまざまなキャッシュを持つことからより多くの検索クエリを捌けるようになっていること。 なお、v1.3になって追加されたDataImportHandler (DIH) という追加機能(contribに収録)を使うと、Oracleをはじ

    Apache Solr - Wikipedia
  • Apache Lucene - Wikipedia

    Apache Lucene(アパッチ ルシーン)は、Doug Cuttingによって開発された、Java製のFLOSSの検索ライブラリである。Luceneは、強力な文書インデキシング及び検索機能、スペルチェック、ハイライト、テキスト解析機能を提供する。Apacheのトップレベルプロジェクトの1つである。 概要[編集] Luceneは、Apache Solr、Elasticsearch等の検索プラットフォームで利用される検索ライブラリである。以前はLucene.NET、Mahout、Tika、Nutchといったサブプロジェクトが存在したが、現在はすべて独立したApacheのトップレベルプロジェクトとなっている。2010年3月から、Apache SolrがLuceneのサブプロジェクトとして開発コミュニティがマージされた。 Luceneで日語のテキスト解析を利用するためには、Kuromoji

  • 1