Searching Numerical Fields NumericRangeQuery (in Lucene Core since version 2.9) Because Apache Lucene is a full-text search engine and not a conventional database, it cannot handle numerical ranges (e.g., field value is inside user defined bounds, even dates are numerical values). We have developed an extension to Apache Lucene that stores the numerical values in a special string-encoded format wi
はじめまして。 プロダクト&サービス事業部 リーダーの久保です。 今日は、当社で利用しているOSSの全文検索アプリケーションであるApache Solrについてご紹介したいと思います。 GoogleでSolrを検索しても、日本語圏のコンテンツはまだまだ少ないようです。 当社がSolrを使い始めた昨年は現在よりもさらに少なく、結構苦労しました。 今回はやや雑多な内容となりますが、新しくSolrを使う際に必要と考えられる情報をまとめてみました。 本エントリーでは、Solr1.3を対象としています。 Solr1.3が現在の安定版で、Solr1.4-devが開発版となります。 目次 Solrとは 機能一覧 実績/事例 Solrを使ったシステムの開発方法 おすすめする方 データ量/性能とハードウェア マルチコア構成 様々な検索 スケールアウト 検索と更新 Solrを始めるための情報リスト 全
本連載ではJBoss Enterprise Middlewareを使った「エンタープライズレベルの検索サービス」を提供するWebアプリケーションの作成を行う。検索エンジンとしてオープンソースソフトウェア(以下、OSS)のApache Lucene(以下、Lucene:ルシーン)を使用する。 前回「第1回:OSS検索エンジンLuceneとは」では、検索エンジンLuceneについて詳しく解説した。今回はいよいよ実際の検索プログラムを作成していく。 ここでは簡単なサンプルプログラムとするため、JBoss Enterprise Application Platform(以下、JBoss EAP)のJBoss Application Server上で動作するJSPプログラムを作成する。JBoss EAPのインストールについては以下記事を参照していただきたい。
こんにちは 。 検索 関連 を 担当 して いる やましー です 。 今回は livedoor で提供しているサービスの中の「検索関連」について書きます。 このブログでも過去に何度か取り上げられていますが、livedoor では検索エンジンとして HyperEstraier、lucene、mysql + senna、Namazu、SUFARY などを利用しています。 その中で lucene の利用方法や機能拡張について説明します。 lucene とは Apache Lucene は、Java で書かれた高性能で高機能な検索エンジンライブラリです。全文検索を(特にクロスプラットフォームで)必要とするほとんどのアプリケーションに適している技術です。※ 公式サイトから抜粋 インデックスの作成 lucene は転置インデックス型の検索エンジンなので、ドキュメントを検索するには、まずインデックスの作
テクニカルSEOとは、オンページSEOの一部であり、検索結果での順位を向上させるためにウェブサイトの技術的な側面を改善することを指します。検索エンジンにとって、クロールしやすく理解しやすくすることがテクニカルSEOの中心です。具体的には、サイト内のリンク構造を最適化したり、ページ内の論理的な構造を最適化したり、ページの読み込みを高速化することなどの技術的な最適化が含まれます。 WordPressは様々なフィードを自動で出力しますが、それらがGooglebotに発見され、サーチコンソールの「クロール済み – インデックス未登録」に表示されることがあります。このままではインデックスレポートの見通しが悪くなってしまいますが、X-Robots-Tag でnoindexを指定する方法でこの状況を改善できます。
2008年04月06日 SolrのTomcatへのインストールでハマる 早速SolrをTomcat6.0の環境にインストールしてみる。 最初は、IBMの記事を参考にしたのだが、「以下のいずれかの方法で、Solr のホーム・ロケーションを設定します」のあたりで具体的に何をすべきかのかがわからなくなってしまった。 とりあえず、apache-solr-1.2.0.war ファイルはダウンロードしてあったので、これを $TOMCAT_HOME/webapps の下に置いてみたり、TomcatのWebアプリケーションマネージャ(http://localhost:8080/manager/html/)から配備してみたりしたが、いずれも失敗。画面が出るはずのURL(http://localhost:8080/solr/admin/)にアクセスしても、404エラーになってしまう。 Webアプリケーションマ
{{{#!wiki red/solid Beginning with Solr 5.0, Solr is no longer distributed as a "war" (Web Application Archive) suitable for deployment in any Servlet Container. Solr is now distributed as a stand alone java server application, including start and stop scripts for use on Unix and MS-Windows platforms, as well as an installation script for setting up a "production" installation of Solr on *nix plat
メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。
<OpenSearchDescription xmlns="http://a9.com/-/spec/opensearch/1.1/" xmlns:moz="http://www.mozilla.org/2006/browser/search/"> <ShortName>[SNK]</ShortName> <Description>[Search engine full name and summary]</Description> <InputEncoding>[UTF-8]</InputEncoding> <Image width="16" height="16" type="image/x-icon">[https://example.com/favicon.ico]</Image> <Url type="text/html" template="[searchURL]"/> <Ur
米ヤフーは、近く同社のSearchプラットフォームのAPIを提供して、外部の開発者が構造化データを使って検索結果をカスタマイズし、ユーザーの利便性を向上させられるようにすると明らかにした。 このプログラムでは、外部プログラマがAPIに独自のアルゴリズムを加えて、ヤフーの検索インデックスをどう利用するかを決めることができる。 また、Yahoo! Searchプラットフォーム上でのプログラミングを向上させるために、ヤフーはRDF(Resource Description Framework)やマイクロフォーマットなどのセマンティックWeb標準をいくつかサポートすると、Yahoo! Search製品管理ディレクター、アミット・クマー氏は3月13日付のブログで述べている。 ワールドワイドウェブの生みの親ティム・バーナーズ-リー氏が広めたセマンティックWebとは、Webコンテンツを使いたいというユー
エンタープライズサーチの導入を検討する段階でいくつかの課題(陥りやすい罠)が出てきます。これらの課題を解決しなければ、エンタープライズサーチを導入しても、効果的な情報検索の実現という最終目標は達成できないと考えていいでしょう。 最近のテレビCM いまやテレビで「詳しくは○○○で検索!」といった検索窓を表示する手法を使ったCMを見ない日はありません。これは、一般家庭で携帯電話やパソコンを使った検索が日常的に行われていることを表しています。 このように、「欲しい情報を検索という手段ですぐ得られる」というのは便利この上ありません。CMで流れた○○○というキーワードを検索ボックスに入れて検索ボタンを押せば、インターネット上に数多く存在するWebサイトの中から見たい商品や知りたい場所の情報がすぐに得られます。同じようにすれば企業の中でも欲しい情報(および情報源)が検索して得られて便利だ、と考えてもお
「インターネットの検索において、Webページ検索というのは、そろそろピークを過ぎるのではないか。人物や商品などドメインを区切ったバーチカルサーチや、Webページではなく知識そのものを検索できるようなナレッジサーチなどが今後の研究テーマになってくる」。2007年11月27日から2日間の予定で開催されている「データベースとWeb情報システムに関するシンポジウム」(DBWeb 2007)において「情報爆発に対処できる次世代サーチ技術」と題した講演を行った京都大学大学院情報学研究科の田中克己教授は、今後のネット検索技術の動向をそう総括する。 既存の検索サービスを使ってできることはまだまだある 田中氏は、2005年から5年間の予定で文部科学省が研究補助金を出すプロジェクト「情報爆発時代に向けた新しいIT基盤技術の研究」において「情報爆発に対応するコンテンツ融合と操作環境融合に関する研究」という研究テ
このページでは、PostgreSQLの全文検索モジュール“Tsearch2”と、形態素解析による分かち書きを行う関数“pgkakasiw()”を使って、日本語全文検索システムを構築する方法についてご紹介します。 新着情報 2005/01/19 PostgreSQL8.0.0での動作を確認しました。 2005/01/19 pgkakasiw Verison 1.1 を公開しました。本体に変更はありませんが、1.0に添付したMakefileではmakeできないプラットフォームがある問題を修正しました。 2004/10/19 pgkakasiw Verison 1.0 を公開しました。 2004/10/19 環境構築手順書を公開しました。 Tsearch2とは Tsearch2は、PostgreSQLに添付される拡張機能(contribモジュール)の一つで、ヨーロッパ言語向け全文検索用のモジュー
07 June 2007 - Apache Solr 1.2 released Apache Solr 1.2 is the first release since graduating from the Apache Incubator. Solr is a high performance full-text search server based on Apache Lucene, written in Java5, and easily extensible through plugins written in Java. Documents are added to a search collection via XML over HTTP. The collection is queried via HTTP to receive an XML response (or alt
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く