タグ

Solrとfull text searchに関するyterazonoのブックマーク (5)

  • 拡張性を強化したメジャーアップデート、Apache Lucene/Solrが4.0をリリース | OSDN Magazine

    Apache Lucene/Solrの開発チームは10月12日、オープンソースの全文検索エンジン「Apache Lucene 4.0」およびLuceneをベースとする検索プラットフォーム「Apache Solr 4.0」をリリースした。 Apache LuceneはJavaで実装された全文検索エンジン。さまざまなプラットフォームで利用でき、全文検索を必要とするあらゆるアプリケーションで利用できるという。 Lucene 4.0ではより柔軟にコンテンツをインデックス化するための機能が実装された。インデックスに新しい情報を格納できるようになり、格納されている情報を変更する手段も提供される。また、キーワードや記事リストなどのインデックスフォーマットもプラグインで容易に変更・拡張できるようになっている。インデックスをストレージに記録するためのモジュール「Codec」は複数が用意され、用途に応じた異な

    拡張性を強化したメジャーアップデート、Apache Lucene/Solrが4.0をリリース | OSDN Magazine
  • Apacheのテキスト検索システム、SolrとLuceneの最新版が登場

    The Apache Lucene projectは12日(米国時間)、「Apache Lucene 3.6」及び「Apache Solr 3.6」を公開した。Apache Luceneは、Javaで開発されているオープンソースのフルテキスト検索エンジンライブラリ。クロスプラットフォームであるため様々なアプリケーションで利用できる。 Apache Solrは、Apache Luceneベースのフルテキスト検索プラットフォーム。強力な全文検索やヒットの強調表示、ファセットサーチ、動的クラスタリング、データベース統合、リッチドキュメント対応、地理空間検索など様々な機能が提供されている。 Apache Lucene 3.6では、Java 7のフルサポートやMetaphone、Soundex、Caverphone、Beider-Morseなどの音声アルゴリズムの追加などが行われている。Apache

  • 全文検索サーバ: これからSolrを始める人のためのApache Solr概要と便利な情報リスト集

    はじめまして。 プロダクト&サービス事業部 リーダーの久保です。 今日は、当社で利用しているOSSの全文検索アプリケーションであるApache Solrについてご紹介したいと思います。 GoogleでSolrを検索しても、日語圏のコンテンツはまだまだ少ないようです。 当社がSolrを使い始めた昨年は現在よりもさらに少なく、結構苦労しました。 今回はやや雑多な内容となりますが、新しくSolrを使う際に必要と考えられる情報をまとめてみました。 エントリーでは、Solr1.3を対象としています。 Solr1.3が現在の安定版で、Solr1.4-devが開発版となります。 目次 Solrとは 機能一覧 実績/事例 Solrを使ったシステムの開発方法 おすすめする方 データ量/性能とハードウェア マルチコア構成 様々な検索 スケールアウト 検索と更新 Solrを始めるための情報リスト 全

  • Java全文検索ライブラリApache Lucene 3.5リリース。Solrも同時にアップデート | OSDN Magazine

    Apache Lucene Projectは11月27日、Javaベースの全文検索エンジン「Apache Lucene 3.5」をリリースした。同時に、Luceneを利用した全文検索システム「Apache Solr 3.5」も公開されている。 Apache LuceneはApache Software Foundationのトップレベルプロジェクトとして開発が進められているテキスト全文検索エンジン。シンプルなAPIで強力な検索機能を提供するとしている。スケーラビリティやインデクシング性能に優れており、最近のハードウェアであれば1時間に95GBものインデクシングが可能という。ワイルドカードなどさまざまな検索クエリをサポートし、検索結果の順位付けやソートといった機能も備えている。 Apache Lucene 3.5.0では、IndexReaderクラスにおけるメモリ消費の大幅な削減や「Inde

  • 検索エンジンの常識をApache Solrで身につける

    表のような転置インデックス完成後は、クエリに対する結果を返す処理は簡単です。例えば、ユーザーが「Vim」というクエリを発行すると、検索エンジンは「Vim」を含む文書IDリストを返します。表では文書IDの「2」を返します。 検索エンジンを取り巻く7つの技術 検索エンジンのコア技術は前節で紹介したインデックスです。しかし実際に、検索インデックスだけで構成する検索エンジンから、検索サービスを構築するには多大なコストが掛かります。以下の節で検索エンジンを利用したシステム、検索サービスを構築する際に便利なコンポーネントを紹介します。 これらの機能のいくつかは、多くの検索エンジンが組み込んでいます。一方で、簡素な検索エンジンは、以下で紹介するコンポーネントをサポートしていないため、ユーザーが独自に開発するか、その機能を持つコンポーネントを組み込む必要があるものもあります。 【1】トークナイザ 検索エン

    検索エンジンの常識をApache Solrで身につける
  • 1