製品ラインアップ 業務に応じて組み合わせ可能な5つの製品ラインアップ。お客様のニーズに的確に応えます。 企業内のさまざまな情報を効率よく収集し、データベースに登録をします。 多彩な検索方法で、必要かつ目的の情報を速やかに導き出します。 お客様の声を分析し、短時間で傾向や要因を抽出します。 社内のコミュニケーションの場をつくり、知識を蓄積、活用します。 企業活動で発生する紙文書、電子文書を安全に管理・保管します。
製品ラインアップ 業務に応じて組み合わせ可能な5つの製品ラインアップ。お客様のニーズに的確に応えます。 企業内のさまざまな情報を効率よく収集し、データベースに登録をします。 多彩な検索方法で、必要かつ目的の情報を速やかに導き出します。 お客様の声を分析し、短時間で傾向や要因を抽出します。 社内のコミュニケーションの場をつくり、知識を蓄積、活用します。 企業活動で発生する紙文書、電子文書を安全に管理・保管します。
はじめに 管理するドキュメントは日々増えていき、それらのドキュメントを効率よく管理することを求められています。 管理対象ドキュメントが多くなればなるほど、その中から特定の情報をもつものを見つけにくくなっていきます。 その解決策として、膨大な情報から検索することができる全文検索サーバーを導入することなどがあげられます。 Fess は簡単に導入できる、Java ベースのオープンソース全文検索サーバーです。 Fess の検索エンジン部分には Apache Solr を利用しています。 Solr は、2 億ドキュメントもインデックス可能と言われる非常に高機能な検索エンジンです。 一方で、 Apache Solr で検索システムを構築しようとする場合、クローラ部分などを自分で実装する必要性があります。 Fess ではクローラ部分に Seasar Project から提供される S2Robot を利用
管理 UI にアクセス http://localhost:8080/fess/admin にアクセスします。 管理者アカウントのユーザー名/パスワードは、admin/admin になります。 ログイン後、左側のメニューの「ウェブ」をクリックします。 新規でウェブクロールの設定情報を作ります(設定名、URL、最大アクセス数(100とか)、ブラウザタイプ(全部))。 次に左側のメニューの「クローラ全般」をクリックします。 スケジュールに数分後を設定します。 開始時刻が 10:35 am の場合は、0 35 10 * * ? とします(フォーマットは「秒 分 時 日 月 曜日 年」)。 更新すると、その時間以降にクロールが開始されます。 開始されているかどうかは、「セッション情報」で確認できます。 完了していると、セッション情報に WebIndexSize の情報が表示されます。
概要 現在表示されているサイトは旧サイトです。新サイトは http://fess.codelibs.org/ja/ です。 Fess は「5 分で簡単に構築可能な全文検索サーバー」です。Java 実行環境があればどの OS でも実行可能です。Fess は Apache ライセンスで提供され、無料 (フリーソフト) でご利用いただけます。 Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。 ドキュメントクロールには S2Robot を利用することで、Web やファイルシステムに対するクロールが可能になり、MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。 特徴 5 分で簡単に構築可能な全文検索サーバー Apache ライセンスで提供 (フリーソフト) OS 非依存
xdoc2txt.exe [-s|-e|-j][-c][-f][-p][-n][-r=(0|1|2)] <filename...> -h ヘルプの表示 -s 出力のエンコードはShiftJIS(デフォルト) -j 出力のエンコードはJIS -s 出力のエンコードはEUC -c PDFキャッシュ on(デフォルトはoff) -f 変換結果をファイルに出力。デフォルトでは標準出力に出力 -p OLE2複合文書の場合、文書プロパティを表示(Office、一太郎で有効) -n PDF文書のアクセス権限の設定を無視(cryptlib.dllが必要) -r= HTML文書のルビの変換 -r=0 ルビ削除 -r=1 () -r=2 《》青空文庫形式 -o= その他のオプション -o=0 PDFで -- ? -- の形式のページ番号を表示しない -o=1 PDFで改行を削除(
こんにちは 。 検索 関連 を 担当 して いる やましー です 。 今回は livedoor で提供しているサービスの中の「検索関連」について書きます。 このブログでも過去に何度か取り上げられていますが、livedoor では検索エンジンとして HyperEstraier、lucene、mysql + senna、Namazu、SUFARY などを利用しています。 その中で lucene の利用方法や機能拡張について説明します。 lucene とは Apache Lucene は、Java で書かれた高性能で高機能な検索エンジンライブラリです。全文検索を(特にクロスプラットフォームで)必要とするほとんどのアプリケーションに適している技術です。※ 公式サイトから抜粋 インデックスの作成 lucene は転置インデックス型の検索エンジンなので、ドキュメントを検索するには、まずインデックスの作
ホーム DesktopHE ■概要 Hyper Estraierを検索エンジンに使用した、Windows用のデスクトップ検索ツールです。 日本語の文書に対して、N-gram方式による漏れのない検索が行えるのが特長です。 指定したディレクトリの配下の、次の種類のファイルから全文検索を行えます。 ・テキストファイル ・HTMLファイル ・電子メールファイル(拡張子が「.eml」「.mime」「.mht」「.mhtml」のもの) ・Wordファイル ・Excelファイル ・PowerPointファイル ・pdfファイル ・OpenOffice.orgファイル 類似ツールとして、Hyper Estraier Modeがあります。 DesktopHEをおすすめするユーザーも、Hyper Estraier Modeと同じです。 Googleデスクトップ検索などは、システムに常駐するので重くなるのが嫌
Overview Hyper Estraier is a full-text search system. You can search lots of documents for some documents including specified words. If you run a web site, it is useful as your own search engine for pages in your site. Also, it is useful as search utilities of mail boxes and file servers. The characteristic of Hyper Estraier is the following. High performance of search High scalability of target d
大量のデータがあるサイトに検索機能を実装することになりました。LIKE 演算子で %keyword% と検索してみたところ、結果が1分経っても返って来なかったのでで Ngram もしくは MeCab を使った全文検索をできるように仕組みを実装しました。 自分の勉強のために改めて自分で解説してみることにします。初心者の視点から書いてるので、全文検索をやったことがない方やこれから全文検索をしようと思ってる人は入門の参考にしてください。 MySQL での日本語全文検索について MySQL の FULLTEXT 型とは そもそも MySQL の FULLTEXT 型というインデックスを使えばそれだけで全文検索をできます。しかし英語のように単語がスペースで区切られてる時だけであり、日本語のように全て繋がっている場合は機能しません。 そのため MeCab などの日本語形態素解析で日本語から単語を抽出し
TypeError 'dict' object is not callable If you want to report a bug, please save this page and attach it to your bug report. Show debugging information Report bug Visit MoinMoin wiki Traceback A problem occurred in a Python script. Here is the sequence of function calls leading up to the error, in the order they occurred. /home/groups/l/lu/ludia/python/lib/python2.4/site-packages/MoinMoin/request.
はじめに ドキュメントは日々増えて続けています。ドキュメントの数が多くなるほど、目的の情報は見つけにくくなるため、それらのドキュメントを効率よく管理する方法が必要です。その解決策の一つとして、複数のドキュメント(ファイル)をまたいで検索することができる「全文検索サーバー」の導入が挙げられます。 Fessは簡単に導入できる、Javaベースのオープンソース全文検索サーバーです。Fessの検索エンジン部分にはApache Solrを利用しています。Solrは、2億ドキュメントもインデックス可能と言われる非常に高機能な検索エンジンです。一方で、Apache Solrで検索システムを構築しようとする場合、クローラ部分などを自分で実装する必要性があります。Fessではクローラ部分にSeasar Projectから提供されるS2Robotを利用して、ウェブやファイルシステム上の様々な種類のドキュメントを
This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.
はじめまして。 プロダクト&サービス事業部 リーダーの久保です。 今日は、当社で利用しているOSSの全文検索アプリケーションであるApache Solrについてご紹介したいと思います。 GoogleでSolrを検索しても、日本語圏のコンテンツはまだまだ少ないようです。 当社がSolrを使い始めた昨年は現在よりもさらに少なく、結構苦労しました。 今回はやや雑多な内容となりますが、新しくSolrを使う際に必要と考えられる情報をまとめてみました。 本エントリーでは、Solr1.3を対象としています。 Solr1.3が現在の安定版で、Solr1.4-devが開発版となります。 目次 Solrとは 機能一覧 実績/事例 Solrを使ったシステムの開発方法 おすすめする方 データ量/性能とハードウェア マルチコア構成 様々な検索 スケールアウト 検索と更新 Solrを始めるための情報リスト 全
概要 現在表示されているサイトは旧サイトです。新サイトは http://fess.codelibs.org/ja/ です。 Fess は「5 分で簡単に構築可能な全文検索サーバー」です。Java 実行環境があればどの OS でも実行可能です。Fess は Apache ライセンスで提供され、無料 (フリーソフト) でご利用いただけます。 Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。 ドキュメントクロールには S2Robot を利用することで、Web やファイルシステムに対するクロールが可能になり、MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。 特徴 5 分で簡単に構築可能な全文検索サーバー Apache ライセンスで提供 (フリーソフト) OS 非依存
Fessとは FessはSourceForge.jpで開発されるオープンソースの全文検索サーバである。Apacheライセンスで提供され、無償で利用することができる。オープンソースの全文検索エンジンにはさまざまなものがあるが、Fessの最大の特徴はインストールから起動までが簡単であり、起動後は管理画面ですばやく検索システムとして構築できることが挙げられる。 そのほかの特徴としては次のことが挙げれる。 OS非依存(Java実行環境があれば利用可能) Webまたはファイルシステム上にあるドキュメントを検索対象にできる MS OfficeやPDFなど多くのファイル形式に対応 携帯端末の表示に対応 (端末ごとに検索表示を最適化) Fessの心臓部分ともいえる検索エンジンにはApache Solrが採用されている。Apache Solrはサーバの構成次第では数億ドキュメントも検索対象とすることができ
What's Namazu Namazu is a full-text search engine intended for easy use. Not only does it work as a small or medium scale Web search engine, but also as a personal search system for email or other files. (The Japanese word `Namazu' means `catfish' in English.) Table of contents News Features License Download Stable source code deb packages for Debian GNU/Linux Windows edition Search Tutorial Manua
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く