タグ

全文検索に関するHeRoのブックマーク (6)

  • Apache Solr で全文検索 - スキーマの設定方法

    今回はスキーマの設定方法について説明します。 スキーマには、検索したいドキュメントに含まれるフィールドの構造を定義します。 3.1 スキーマ定義ファイル¶ スキーマは各コアごとに conf/schema.xml ファイルに記述します。例えば、サンプルのcollection1コアの場合 ${solr.solr.home}/collection1/conf/schema.xml がスキーマ定義ファイルになります。 スキーマ定義ファイルに記述するのは主に以下の項目です。 フィールド (<fields>) フィールドタイプ (<types>) フィールドには検索したいデータを記述します。フィールドタイプには各フィールドのデータ型を記述します。 まず、スキーマを <schema> タグを使って定義します。

    Apache Solr で全文検索 - スキーマの設定方法
  • 全文検索システム: Fess - オープンソース全文検索サーバー Fess (フェス)

    概要 現在表示されているサイトは旧サイトです。新サイトは http://fess.codelibs.org/ja/ です。 Fess は「5 分で簡単に構築可能な全文検索サーバー」です。Java 実行環境があればどの OS でも実行可能です。Fess は Apache ライセンスで提供され、無料 (フリーソフト) でご利用いただけます。 Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。 ドキュメントクロールには S2Robot を利用することで、Web やファイルシステムに対するクロールが可能になり、MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。 特徴 5 分で簡単に構築可能な全文検索サーバー Apache ライセンスで提供 (フリーソフト) OS 非依存

  • Fessで作るApache Solrベースの全文検索サーバー ~ 導入編

    はじめに ドキュメントは日々増えて続けています。ドキュメントの数が多くなるほど、目的の情報は見つけにくくなるため、それらのドキュメントを効率よく管理する方法が必要です。その解決策の一つとして、複数のドキュメント(ファイル)をまたいで検索することができる「全文検索サーバー」の導入が挙げられます。 Fessは簡単に導入できる、Javaベースのオープンソース全文検索サーバーです。Fessの検索エンジン部分にはApache Solrを利用しています。Solrは、2億ドキュメントもインデックス可能と言われる非常に高機能な検索エンジンです。一方で、Apache Solrで検索システムを構築しようとする場合、クローラ部分などを自分で実装する必要性があります。Fessではクローラ部分にSeasar Projectから提供されるS2Robotを利用して、ウェブやファイルシステム上の様々な種類のドキュメントを

    Fessで作るApache Solrベースの全文検索サーバー ~ 導入編
  • Solrを使ってみる2 - alabaster1982の日記

    世の中に数周遅れてSolr http://d.hatena.ne.jp/zuki_ebetsu/20070721/1185005307 ↑みたら日語も検索できた。 1.2.0で記事は書かれているけど、solr-1.3.0でもいけた ===== ★自分でやるよりこの人のブログを見たほうが良いことが判明 http://d.hatena.ne.jp/knaka20blue/20080922/1222104683

    Solrを使ってみる2 - alabaster1982の日記
  • The xlhtml Homepage

    Download xlhtml source code (03-12-02) Download xlhtml source code (03-19-02) Download xlhtml version 0.5 (04-13-02) Download xlhtml Binarys xlhtml mailing list xlhtml Status Report a bug in xlhtml xlhtml Addons An Excel viewer written in TCL/TK, which uses xlhtml as a backend This program requires tkhtml. It uses this to display the HTML output of xlhtml. I highly recommend it for anyone doing TC

  • OSM記事:新世代検索エンジン大集合

    このページは、オープンソースマガジン2006年4月号の第2特集「新世代検索エンジン大集合」に寄稿した記事の校正前の版です。 超弩級全文検索システムHyper Estraier 巷で話題の全文検索システムHyper Estraier。Webサイトやデスクトップの検索システムとして使えることはもちろん、ライブラリとして様々な用途に使うことができます。稿ではその特徴を説明し、導入から応用までを案内します。 Hyper Estraierのススメ O型のあなた、デスクトップにウンザリするほどのファイルが散らかっていませんか? A型のあなた、フォルダで整理したつもりが、階層が深すぎて毎回探すのが面倒になっていませんか? B型のあなた、人から貰ったファイルの保存場所を忘れて何度も再送してもらうことはありませんか? AB型のあなた、メーリングリストやメールマガジンに登録しすぎてメーラを開くと大変なことに

  • 1