タグ

全文検索に関するton__tonのブックマーク (18)

  • ナレッジマネジメント KnowledgeMeister | 東芝デジタルソリューションズ

    製品ラインアップ 業務に応じて組み合わせ可能な5つの製品ラインアップ。お客様のニーズに的確に応えます。 企業内のさまざまな情報を効率よく収集し、データベースに登録をします。 多彩な検索方法で、必要かつ目的の情報を速やかに導き出します。 お客様の声を分析し、短時間で傾向や要因を抽出します。 社内のコミュニケーションの場をつくり、知識を蓄積、活用します。 企業活動で発生する紙文書、電子文書を安全に管理・保管します。

  • 全文検索システム: Fess - Fessで作るApache Solrベースの検索サーバー 〜 導入編

    はじめに 管理するドキュメントは日々増えていき、それらのドキュメントを効率よく管理することを求められています。 管理対象ドキュメントが多くなればなるほど、その中から特定の情報をもつものを見つけにくくなっていきます。 その解決策として、膨大な情報から検索することができる全文検索サーバーを導入することなどがあげられます。 Fess は簡単に導入できる、Java ベースのオープンソース全文検索サーバーです。 Fess の検索エンジン部分には Apache Solr を利用しています。 Solr は、2 億ドキュメントもインデックス可能と言われる非常に高機能な検索エンジンです。 一方で、 Apache Solr で検索システムを構築しようとする場合、クローラ部分などを自分で実装する必要性があります。 Fess ではクローラ部分に Seasar Project から提供される S2Robot を利用

  • 全文検索システム: Fess - 簡単構築ガイド

    管理 UI にアクセス http://localhost:8080/fess/admin にアクセスします。 管理者アカウントのユーザー名/パスワードは、admin/admin になります。 ログイン後、左側のメニューの「ウェブ」をクリックします。 新規でウェブクロールの設定情報を作ります(設定名、URL、最大アクセス数(100とか)、ブラウザタイプ(全部))。 次に左側のメニューの「クローラ全般」をクリックします。 スケジュールに数分後を設定します。 開始時刻が 10:35 am の場合は、0 35 10 * * ? とします(フォーマットは「秒 分 時 日 月 曜日 年」)。 更新すると、その時間以降にクロールが開始されます。 開始されているかどうかは、「セッション情報」で確認できます。 完了していると、セッション情報に WebIndexSize の情報が表示されます。

  • 全文検索システム: Fess - オープンソース全文検索サーバー Fess (フェス)

    概要 現在表示されているサイトは旧サイトです。新サイトは http://fess.codelibs.org/ja/ です。 Fess は「5 分で簡単に構築可能な全文検索サーバー」です。Java 実行環境があればどの OS でも実行可能です。Fess は Apache ライセンスで提供され、無料 (フリーソフト) でご利用いただけます。 Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。 ドキュメントクロールには S2Robot を利用することで、Web やファイルシステムに対するクロールが可能になり、MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。 特徴 5 分で簡単に構築可能な全文検索サーバー Apache ライセンスで提供 (フリーソフト) OS 非依存

  • xdoc2txt

    xdoc2txt.exe [-s|-e|-j][-c][-f][-p][-n][-r=(0|1|2)] <filename...> -h ヘルプの表示 -s 出力のエンコードはShiftJIS(デフォルト) -j 出力のエンコードはJIS -s 出力のエンコードはEUC -c PDFキャッシュ on(デフォルトはoff) -f 変換結果をファイルに出力。デフォルトでは標準出力に出力 -p OLE2複合文書の場合、文書プロパティを表示(Office、一太郎で有効) -n PDF文書のアクセス権限の設定を無視(cryptlib.dllが必要) -r= HTML文書のルビの変換 -r=0 ルビ削除 -r=1 () -r=2 《》青空文庫形式 -o= その他のオプション -o=0 PDFで -- ? -- の形式のページ番号を表示しない -o=1 PDFで改行を削除(

  • livedoor Techブログ : 全文検索エンジン lucene(ルシーン) を使ってみた

    こんにちは 。 検索 関連 を 担当 して いる やましー です 。 今回は livedoor で提供しているサービスの中の「検索関連」について書きます。 このブログでも過去に何度か取り上げられていますが、livedoor では検索エンジンとして HyperEstraier、lucene、mysql + senna、Namazu、SUFARY などを利用しています。 その中で lucene の利用方法や機能拡張について説明します。 lucene とは Apache Lucene は、Java で書かれた高性能で高機能な検索エンジンライブラリです。全文検索を(特にクロスプラットフォームで)必要とするほとんどのアプリケーションに適している技術です。※ 公式サイトから抜粋 インデックスの作成 lucene は転置インデックス型の検索エンジンなので、ドキュメントを検索するには、まずインデックスの作

  • DesktopHE -Hyper Estraierを使用したWindows用デスクトップ検索ツール-

    ホーム DesktopHE ■概要 Hyper Estraierを検索エンジンに使用した、Windows用のデスクトップ検索ツールです。 日語の文書に対して、N-gram方式による漏れのない検索が行えるのが特長です。 指定したディレクトリの配下の、次の種類のファイルから全文検索を行えます。 ・テキストファイル ・HTMLファイル ・電子メールファイル(拡張子が「.eml」「.mime」「.mht」「.mhtml」のもの) ・Wordファイル ・Excelファイル ・PowerPointファイル ・pdfファイル ・OpenOffice.orgファイル 類似ツールとして、Hyper Estraier Modeがあります。 DesktopHEをおすすめするユーザーも、Hyper Estraier Modeと同じです。 Googleデスクトップ検索などは、システムに常駐するので重くなるのが嫌

  • http://www.nishihiroshima.com/tips/searchengine.html

  • Hyper Estraier: a full-text search system for communities

    Overview Hyper Estraier is a full-text search system. You can search lots of documents for some documents including specified words. If you run a web site, it is useful as your own search engine for pages in your site. Also, it is useful as search utilities of mail boxes and file servers. The characteristic of Hyper Estraier is the following. High performance of search High scalability of target d

  • theta.ne.jp

    This domain may be for sale!

  • PHP で MySQL FULLTEXT + MeCab で簡単に全文検索を実装する

    大量のデータがあるサイトに検索機能を実装することになりました。LIKE 演算子で %keyword% と検索してみたところ、結果が1分経っても返って来なかったのでで Ngram もしくは MeCab を使った全文検索をできるように仕組みを実装しました。 自分の勉強のために改めて自分で解説してみることにします。初心者の視点から書いてるので、全文検索をやったことがない方やこれから全文検索をしようと思ってる人は入門の参考にしてください。 MySQL での日語全文検索について MySQL の FULLTEXT 型とは そもそも MySQL の FULLTEXT 型というインデックスを使えばそれだけで全文検索をできます。しかし英語のように単語がスペースで区切られてる時だけであり、日語のように全て繋がっている場合は機能しません。 そのため MeCab などの日形態素解析で日語から単語を抽出し

  • LudiaFrontPage - Ludia Wiki

    TypeError 'dict' object is not callable If you want to report a bug, please save this page and attach it to your bug report. Show debugging information Report bug Visit MoinMoin wiki Traceback A problem occurred in a Python script. Here is the sequence of function calls leading up to the error, in the order they occurred. /home/groups/l/lu/ludia/python/lib/python2.4/site-packages/MoinMoin/request.

  • Fessで作るApache Solrベースの全文検索サーバー ~ 導入編

    はじめに ドキュメントは日々増えて続けています。ドキュメントの数が多くなるほど、目的の情報は見つけにくくなるため、それらのドキュメントを効率よく管理する方法が必要です。その解決策の一つとして、複数のドキュメント(ファイル)をまたいで検索することができる「全文検索サーバー」の導入が挙げられます。 Fessは簡単に導入できる、Javaベースのオープンソース全文検索サーバーです。Fessの検索エンジン部分にはApache Solrを利用しています。Solrは、2億ドキュメントもインデックス可能と言われる非常に高機能な検索エンジンです。一方で、Apache Solrで検索システムを構築しようとする場合、クローラ部分などを自分で実装する必要性があります。Fessではクローラ部分にSeasar Projectから提供されるS2Robotを利用して、ウェブやファイルシステム上の様々な種類のドキュメントを

    Fessで作るApache Solrベースの全文検索サーバー ~ 導入編
  • Senna 組み込み型全文検索エンジン - Senna 組み込み型全文検索エンジン

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

  • 全文検索サーバ: これからSolrを始める人のためのApache Solr概要と便利な情報リスト集

    はじめまして。 プロダクト&サービス事業部 リーダーの久保です。 今日は、当社で利用しているOSSの全文検索アプリケーションであるApache Solrについてご紹介したいと思います。 GoogleでSolrを検索しても、日語圏のコンテンツはまだまだ少ないようです。 当社がSolrを使い始めた昨年は現在よりもさらに少なく、結構苦労しました。 今回はやや雑多な内容となりますが、新しくSolrを使う際に必要と考えられる情報をまとめてみました。 エントリーでは、Solr1.3を対象としています。 Solr1.3が現在の安定版で、Solr1.4-devが開発版となります。 目次 Solrとは 機能一覧 実績/事例 Solrを使ったシステムの開発方法 おすすめする方 データ量/性能とハードウェア マルチコア構成 様々な検索 スケールアウト 検索と更新 Solrを始めるための情報リスト 全

  • 全文検索システム: Fess - オープンソース全文検索サーバー Fess (フェス)

    概要 現在表示されているサイトは旧サイトです。新サイトは http://fess.codelibs.org/ja/ です。 Fess は「5 分で簡単に構築可能な全文検索サーバー」です。Java 実行環境があればどの OS でも実行可能です。Fess は Apache ライセンスで提供され、無料 (フリーソフト) でご利用いただけます。 Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。 ドキュメントクロールには S2Robot を利用することで、Web やファイルシステムに対するクロールが可能になり、MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。 特徴 5 分で簡単に構築可能な全文検索サーバー Apache ライセンスで提供 (フリーソフト) OS 非依存

  • 【ハウツー】5分で簡単構築! 全文検索サーバ"Fess"を試してみよう | エンタープライズ | マイコミジャーナル

    Fessとは FessはSourceForge.jpで開発されるオープンソースの全文検索サーバである。Apacheライセンスで提供され、無償で利用することができる。オープンソースの全文検索エンジンにはさまざまなものがあるが、Fessの最大の特徴はインストールから起動までが簡単であり、起動後は管理画面ですばやく検索システムとして構築できることが挙げられる。 そのほかの特徴としては次のことが挙げれる。 OS非依存(Java実行環境があれば利用可能) Webまたはファイルシステム上にあるドキュメントを検索対象にできる MS OfficeやPDFなど多くのファイル形式に対応 携帯端末の表示に対応 (端末ごとに検索表示を最適化) Fessの心臓部分ともいえる検索エンジンにはApache Solrが採用されている。Apache Solrはサーバの構成次第では数億ドキュメントも検索対象とすることができ

  • Namazu: a Full-Text Search Engine

    What's Namazu Namazu is a full-text search engine intended for easy use. Not only does it work as a small or medium scale Web search engine, but also as a personal search system for email or other files. (The Japanese word `Namazu' means `catfish' in English.) Table of contents News Features License Download Stable source code deb packages for Debian GNU/Linux Windows edition Search Tutorial Manua

  • 1