タグ

Solrに関するyterazonoのブックマーク (13)

  • 拡張性を強化したメジャーアップデート、Apache Lucene/Solrが4.0をリリース | OSDN Magazine

    Apache Lucene/Solrの開発チームは10月12日、オープンソースの全文検索エンジン「Apache Lucene 4.0」およびLuceneをベースとする検索プラットフォーム「Apache Solr 4.0」をリリースした。 Apache LuceneはJavaで実装された全文検索エンジン。さまざまなプラットフォームで利用でき、全文検索を必要とするあらゆるアプリケーションで利用できるという。 Lucene 4.0ではより柔軟にコンテンツをインデックス化するための機能が実装された。インデックスに新しい情報を格納できるようになり、格納されている情報を変更する手段も提供される。また、キーワードや記事リストなどのインデックスフォーマットもプラグインで容易に変更・拡張できるようになっている。インデックスをストレージに記録するためのモジュール「Codec」は複数が用意され、用途に応じた異な

    拡張性を強化したメジャーアップデート、Apache Lucene/Solrが4.0をリリース | OSDN Magazine
  • オープンソースのクローラツール「Apache Nutch 2.0」登場

    The Apache Nutch PMCは7日(米国時間)、Apache Nutchの最新版「Apache Nutch 2.0」を公開した。Apache Nutchは、Javaで開発されているハイスケラーブルなWeb検索フレームワーク。Apache Solr、Apache Tika、Apache Hadoop、Apache GoraといったApacheプロジェクトで構築されており、Webクローリング機能やリンクグラフデータベース、HTML解析といった機能を備えている。 Apache Nutch 2.0は小規模なクローラから、Hadoopクラスターでデプロイされた大規模なWebクローラまで、様々なユースケースをカバーできるよう設計されているWeb検索ソフトウェア。Apache Nutch 2.0で構築されたWebクローラは、Apache Accumulo、 Apache Avro、Apach

  • Apacheのテキスト検索システム、SolrとLuceneの最新版が登場

    The Apache Lucene projectは12日(米国時間)、「Apache Lucene 3.6」及び「Apache Solr 3.6」を公開した。Apache Luceneは、Javaで開発されているオープンソースのフルテキスト検索エンジンライブラリ。クロスプラットフォームであるため様々なアプリケーションで利用できる。 Apache Solrは、Apache Luceneベースのフルテキスト検索プラットフォーム。強力な全文検索やヒットの強調表示、ファセットサーチ、動的クラスタリング、データベース統合、リッチドキュメント対応、地理空間検索など様々な機能が提供されている。 Apache Lucene 3.6では、Java 7のフルサポートやMetaphone、Soundex、Caverphone、Beider-Morseなどの音声アルゴリズムの追加などが行われている。Apache

  • 検索エンジンの常識をApache Solrで身につける

    検索エンジンの常識をApache Solrで身につける:ビッグデータ処理の常識をJavaで身につける(1)(2/4 ページ) 【2】言語同定器 検索エンジンで複数の言語からなる文書集合のインデックスを生成する際、入力文書の記述言語によって処理が異なることがあります。 例えば、日語文書では単語の区切りがないため、トークナイザが文中に含まれる単語を確率的に推定して単語を切り出してあげる必要があります。一方で、英語の文は単語の区切りが自明であるため、トークナイザが行う処理はほとんどありません。このように、入力文書の記述言語が複数存在する状況では、入力文書の記述言語によって利用するトークナイザなどのコンポーネントを変更する必要があります。 上記のように入力言語によって処理内容を変えるためには、そもそも入力クエリや文書が、どの言語で記述されているのかを同定する必要があります。「言語同定器」というコ

    検索エンジンの常識をApache Solrで身につける
  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
  • 「リクルートにおける検索エンジンSolrの活用」

    tf0054@r.recruit.co.jp / FIT / z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z ¾ z z ¾ z z ¾ z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z Internet batch web batch web … 2 /FW DB/NFS 1 (F)

  • 全文検索サーバ: これからSolrを始める人のためのApache Solr概要と便利な情報リスト集

    はじめまして。 プロダクト&サービス事業部 リーダーの久保です。 今日は、当社で利用しているOSSの全文検索アプリケーションであるApache Solrについてご紹介したいと思います。 GoogleでSolrを検索しても、日語圏のコンテンツはまだまだ少ないようです。 当社がSolrを使い始めた昨年は現在よりもさらに少なく、結構苦労しました。 今回はやや雑多な内容となりますが、新しくSolrを使う際に必要と考えられる情報をまとめてみました。 エントリーでは、Solr1.3を対象としています。 Solr1.3が現在の安定版で、Solr1.4-devが開発版となります。 目次 Solrとは 機能一覧 実績/事例 Solrを使ったシステムの開発方法 おすすめする方 データ量/性能とハードウェア マルチコア構成 様々な検索 スケールアウト 検索と更新 Solrを始めるための情報リスト 全

  • 株式会社ロンウイット - ロンウイットはオープンソースのLucene/Solrを使った高速・高性能・大規模・企業向け全文検索エンジンをお客様にご提供する会社です.

    受付中 独自のAI技術を活用し問い合わせの削減を実現! 独自のAI技術を活用し問い合わせの削減を実現するための最前線のFAQソリューションセミナー 開催日:2024.06.26 13:00-13:40WED 終了 革新的AI技術を使って問い合わせの効率化を実現! 問い合わせ対応の効率化を実現する最前線のメールナレッジ共有ソリューションセミナー 開催日:2024.06.11 13:00-13:40TUE 終了 問い合わせを60%以上削減!AI技術に よる革新的FAQソリューション FAQシステムにセマンティック検索を適用すれば、問い合わせコストを大幅削減できます! 開催日:2024.5.15 14:00-14:30WED

  • Java全文検索ライブラリApache Lucene 3.5リリース。Solrも同時にアップデート | OSDN Magazine

    Apache Lucene Projectは11月27日、Javaベースの全文検索エンジン「Apache Lucene 3.5」をリリースした。同時に、Luceneを利用した全文検索システム「Apache Solr 3.5」も公開されている。 Apache LuceneはApache Software Foundationのトップレベルプロジェクトとして開発が進められているテキスト全文検索エンジン。シンプルなAPIで強力な検索機能を提供するとしている。スケーラビリティやインデクシング性能に優れており、最近のハードウェアであれば1時間に95GBものインデクシングが可能という。ワイルドカードなどさまざまな検索クエリをサポートし、検索結果の順位付けやソートといった機能も備えている。 Apache Lucene 3.5.0では、IndexReaderクラスにおけるメモリ消費の大幅な削減や「Inde

  • 検索エンジンの常識をApache Solrで身につける

    表のような転置インデックス完成後は、クエリに対する結果を返す処理は簡単です。例えば、ユーザーが「Vim」というクエリを発行すると、検索エンジンは「Vim」を含む文書IDリストを返します。表では文書IDの「2」を返します。 検索エンジンを取り巻く7つの技術 検索エンジンのコア技術は前節で紹介したインデックスです。しかし実際に、検索インデックスだけで構成する検索エンジンから、検索サービスを構築するには多大なコストが掛かります。以下の節で検索エンジンを利用したシステム、検索サービスを構築する際に便利なコンポーネントを紹介します。 これらの機能のいくつかは、多くの検索エンジンが組み込んでいます。一方で、簡素な検索エンジンは、以下で紹介するコンポーネントをサポートしていないため、ユーザーが独自に開発するか、その機能を持つコンポーネントを組み込む必要があるものもあります。 【1】トークナイザ 検索エン

    検索エンジンの常識をApache Solrで身につける
  • Java 7最新アップデートで「Lucene」問題に対応 | エンタープライズ | マイコミジャーナル

    Java Programming Language スケジュール通り7月28日(米国時間)に公開されたJavaの最新版「Java SE 7」だが、同日付で「Apache Lucene Core」および「Apache Solr」のユーザは「Java SE 7」を使わないようにという注意が発表されていた。JITコンパイラにバグがあり、誤って演算が実施されることがあるという。この問題はリリースの数日前に発覚したもので、正式リリースまでに修正が間に合わなかった。状況によってはJava仮想マシンがクラッシュするほか、データベースのインデックスデータが破損する恐れがあるという。 Oracleはアップデート版となるJava 7u1とJava 6u29をリリースしたが、このApache問題が解決しているのか明確な説明がなかった。しかし、10月26日(米国時間)に追加でアップデートされたリリースノートの中で

  • Welcome to Apache Solr

    Solr is the popular, blazing-fast, open source enterprise search platform built on Apache Lucene™. Learn more about Solr. Solr is highly reliable, scalable and fault tolerant, providing distributed indexing, replication and load-balanced querying, automated failover and recovery, centralized configuration and more. Solr powers the search and navigation features of many of the world's largest inter

    Welcome to Apache Solr
  • 1