タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

fessに関するlefsyのブックマーク (3)

  • オープンソース全文検索サーバー Fess

    利用環境 Apache ライセンスで提供 (フリーソフトなので、無料で利用可能) Java環境またはDocker環境で利用(OS非依存) OpenSearchまたはElasticsearchを検索エンジンとして利用 用途に応じて柔軟に対応可能な設計 クロール Web、ファイルシステム、Windows共有フォルダ、データベースをクロール MS Office(Word/Excel/PowerPoint) や PDF など多くのファイル形式に対応 リクエストヘッダーに情報付加、重複ドメインの設定、検索結果のパス変換 OCRなどの外部テキスト抽出対応

    オープンソース全文検索サーバー Fess
    lefsy
    lefsy 2016/02/23
  • 全文検索システム: Fess - 簡単構築ガイド

    管理 UI にアクセス http://localhost:8080/fess/admin にアクセスします。 管理者アカウントのユーザー名/パスワードは、admin/admin になります。 ログイン後、左側のメニューの「ウェブ」をクリックします。 新規でウェブクロールの設定情報を作ります(設定名、URL、最大アクセス数(100とか)、ブラウザタイプ(全部))。 次に左側のメニューの「クローラ全般」をクリックします。 スケジュールに数分後を設定します。 開始時刻が 10:35 am の場合は、0 35 10 * * ? とします(フォーマットは「秒 分 時 日 月 曜日 年」)。 更新すると、その時間以降にクロールが開始されます。 開始されているかどうかは、「セッション情報」で確認できます。 完了していると、セッション情報に WebIndexSize の情報が表示されます。

    lefsy
    lefsy 2012/06/28
  • 全文検索システム: Fess - オープンソース全文検索サーバー Fess (フェス)

    概要 現在表示されているサイトは旧サイトです。新サイトは http://fess.codelibs.org/ja/ です。 Fess は「5 分で簡単に構築可能な全文検索サーバー」です。Java 実行環境があればどの OS でも実行可能です。Fess は Apache ライセンスで提供され、無料 (フリーソフト) でご利用いただけます。 Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。 ドキュメントクロールには S2Robot を利用することで、Web やファイルシステムに対するクロールが可能になり、MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。 特徴 5 分で簡単に構築可能な全文検索サーバー Apache ライセンスで提供 (フリーソフト) OS 非依存

  • 1