[B! 全文検索] ton__tonのブックマーク

ナレッジマネジメント KnowledgeMeister | 東芝デジタルソリューションズ

製品ラインアップ業務に応じて組み合わせ可能な5つの製品ラインアップ。お客様のニーズに的確に応えます。企業内のさまざまな情報を効率よく収集し、データベースに登録をします。多彩な検索方法で、必要かつ目的の情報を速やかに導き出します。お客様の声を分析し、短時間で傾向や要因を抽出します。社内のコミュニケーションの場をつくり、知識を蓄積、活用します。企業活動で発生する紙文書、電子文書を安全に管理・保管します。

ton__ton 2011/10/20

全文検索

リンク

全文検索システム: Fess - Fessで作るApache Solrベースの検索サーバー〜導入編

はじめに管理するドキュメントは日々増えていき、それらのドキュメントを効率よく管理することを求められています。管理対象ドキュメントが多くなればなるほど、その中から特定の情報をもつものを見つけにくくなっていきます。その解決策として、膨大な情報から検索することができる全文検索サーバーを導入することなどがあげられます。 Fess は簡単に導入できる、Java ベースのオープンソース全文検索サーバーです。 Fess の検索エンジン部分には Apache Solr を利用しています。 Solr は、2 億ドキュメントもインデックス可能と言われる非常に高機能な検索エンジンです。一方で、 Apache Solr で検索システムを構築しようとする場合、クローラ部分などを自分で実装する必要性があります。 Fess ではクローラ部分に Seasar Project から提供される S2Robot を利用

ton__ton 2011/10/19

リンク

全文検索システム: Fess - 簡単構築ガイド

管理 UI にアクセス http://localhost:8080/fess/admin にアクセスします。管理者アカウントのユーザー名/パスワードは、admin/admin になります。ログイン後、左側のメニューの「ウェブ」をクリックします。新規でウェブクロールの設定情報を作ります(設定名、URL、最大アクセス数(100とか)、ブラウザタイプ(全部))。次に左側のメニューの「クローラ全般」をクリックします。スケジュールに数分後を設定します。開始時刻が 10:35 am の場合は、0 35 10 * * ? とします(フォーマットは「秒分時日月曜日年」)。更新すると、その時間以降にクロールが開始されます。開始されているかどうかは、「セッション情報」で確認できます。完了していると、セッション情報に WebIndexSize の情報が表示されます。

ton__ton 2011/10/18

全文検索

リンク

全文検索システム: Fess - オープンソース全文検索サーバー Fess (フェス)

概要現在表示されているサイトは旧サイトです。新サイトは http://fess.codelibs.org/ja/ です。 Fess は「5 分で簡単に構築可能な全文検索サーバー」です。Java 実行環境があればどの OS でも実行可能です。Fess は Apache ライセンスで提供され、無料 (フリーソフト) でご利用いただけます。 Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。ドキュメントクロールには S2Robot を利用することで、Web やファイルシステムに対するクロールが可能になり、MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。特徴 5 分で簡単に構築可能な全文検索サーバー Apache ライセンスで提供 (フリーソフト) OS 非依存

ton__ton 2011/10/18

リンク

xdoc2txt

xdoc2txt.exe [-s|-e|-j][-c][-f][-p][-n][-r=(0|1|2)] <filename...> -h ヘルプの表示 -s 出力のエンコードはShiftJIS(デフォルト) -j 出力のエンコードはJIS -s 出力のエンコードはEUC -c PDFキャッシュ on(デフォルトはoff) -f 変換結果をファイルに出力。デフォルトでは標準出力に出力 -p OLE2複合文書の場合、文書プロパティを表示(Office、一太郎で有効) -n PDF文書のアクセス権限の設定を無視(cryptlib.dllが必要) -r= HTML文書のルビの変換 -r=0 ルビ削除 -r=1 （） -r=2 《》青空文庫形式 -o= その他のオプション -o=0 PDFで -- ? -- の形式のページ番号を表示しない -o=1 PDFで改行を削除(

ton__ton 2011/10/18

windows

リンク

livedoor Techブログ : 全文検索エンジン lucene(ルシーン) を使ってみた

こんにちは。検索関連を担当しているやましーです。今回は livedoor で提供しているサービスの中の「検索関連」について書きます。このブログでも過去に何度か取り上げられていますが、livedoor では検索エンジンとして HyperEstraier、lucene、mysql + senna、Namazu、SUFARY などを利用しています。その中で lucene の利用方法や機能拡張について説明します。 lucene とは Apache Lucene は、Java で書かれた高性能で高機能な検索エンジンライブラリです。全文検索を（特にクロスプラットフォームで）必要とするほとんどのアプリケーションに適している技術です。※ 公式サイトから抜粋インデックスの作成 lucene は転置インデックス型の検索エンジンなので、ドキュメントを検索するには、まずインデックスの作

ton__ton 2011/10/18

リンク

DesktopHE -Hyper Estraierを使用したWindows用デスクトップ検索ツール-

ホーム DesktopHE ■概要 Hyper Estraierを検索エンジンに使用した、Windows用のデスクトップ検索ツールです。日本語の文書に対して、N-gram方式による漏れのない検索が行えるのが特長です。指定したディレクトリの配下の、次の種類のファイルから全文検索を行えます。・テキストファイル・HTMLファイル・電子メールファイル（拡張子が「.eml」「.mime」「.mht」「.mhtml」のもの）・Wordファイル・Excelファイル・PowerPointファイル・pdfファイル・OpenOffice.orgファイル類似ツールとして、Hyper Estraier Modeがあります。 DesktopHEをおすすめするユーザーも、Hyper Estraier Modeと同じです。 Google デスクトップ検索などは、システムに常駐するので重くなるのが嫌

ton__ton 2011/10/18

リンク

http://www.nishihiroshima.com/tips/searchengine.html

ton__ton 2011/10/18

全文検索

リンク

Hyper Estraier: a full-text search system for communities

Overview Hyper Estraier is a full-text search system. You can search lots of documents for some documents including specified words. If you run a web site, it is useful as your own search engine for pages in your site. Also, it is useful as search utilities of mail boxes and file servers. The characteristic of Hyper Estraier is the following. High performance of search High scalability of target d

ton__ton 2011/10/18

リンク

theta.ne.jp

This domain may be for sale!

ton__ton 2011/10/18

リンク

PHP で MySQL FULLTEXT + MeCab で簡単に全文検索を実装する

大量のデータがあるサイトに検索機能を実装することになりました。LIKE 演算子で %keyword% と検索してみたところ、結果が1分経っても返って来なかったのでで Ngram もしくは MeCab を使った全文検索をできるように仕組みを実装しました。自分の勉強のために改めて自分で解説してみることにします。初心者の視点から書いてるので、全文検索をやったことがない方やこれから全文検索をしようと思ってる人は入門の参考にしてください。 MySQL での日本語全文検索について MySQL の FULLTEXT 型とはそもそも MySQL の FULLTEXT 型というインデックスを使えばそれだけで全文検索をできます。しかし英語のように単語がスペースで区切られてる時だけであり、日本語のように全て繋がっている場合は機能しません。そのため MeCab などの日本語形態素解析で日本語から単語を抽出し

ton__ton 2011/10/18

全文検索

リンク

LudiaFrontPage - Ludia Wiki

TypeError 'dict' object is not callable If you want to report a bug, please save this page and attach it to your bug report. Show debugging information Report bug Visit MoinMoin wiki Traceback A probl em occurred in a Python script. Here is the sequence of function calls leading up to the error, in the order they occurred. /home/groups/l/lu/ludia/python/lib/python2.4/site-packages/MoinMoin/request.

ton__ton 2011/06/03

リンク

Fessで作るApache Solrベースの全文検索サーバー　～導入編

はじめにドキュメントは日々増えて続けています。ドキュメントの数が多くなるほど、目的の情報は見つけにくくなるため、それらのドキュメントを効率よく管理する方法が必要です。その解決策の一つとして、複数のドキュメント（ファイル）をまたいで検索することができる「全文検索サーバー」の導入が挙げられます。 Fessは簡単に導入できる、Javaベースのオープンソース全文検索サーバーです。Fessの検索エンジン部分にはApache Solrを利用しています。Solrは、2億ドキュメントもインデックス可能と言われる非常に高機能な検索エンジンです。一方で、Apache Solrで検索システムを構築しようとする場合、クローラ部分などを自分で実装する必要性があります。Fessではクローラ部分にSeasar Projectから提供されるS2Robotを利用して、ウェブやファイルシステム上の様々な種類のドキュメントを

ton__ton 2011/05/10

リンク

Senna 組み込み型全文検索エンジン - Senna 組み込み型全文検索エンジン

This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

ton__ton 2010/05/07

全文検索

リンク

全文検索サーバ: これからSolrを始める人のためのApache Solr概要と便利な情報リスト集

はじめまして。プロダクト&サービス事業部リーダーの久保です。今日は、当社で利用しているOSSの全文検索アプリケーションであるApache Solrについてご紹介したいと思います。 GoogleでSolrを検索しても、日本語圏のコンテンツはまだまだ少ないようです。当社がSolrを使い始めた昨年は現在よりもさらに少なく、結構苦労しました。今回はやや雑多な内容となりますが、新しくSolrを使う際に必要と考えられる情報をまとめてみました。本エントリーでは、Solr1.3を対象としています。 Solr1.3が現在の安定版で、Solr1.4-devが開発版となります。目次 Solrとは機能一覧実績/事例 Solrを使ったシステムの開発方法おすすめする方データ量/性能とハードウェアマルチコア構成様々な検索スケールアウト検索と更新 Solrを始めるための情報リスト全

ton__ton 2010/05/07

全文検索

リンク

全文検索システム: Fess - オープンソース全文検索サーバー Fess (フェス)

概要現在表示されているサイトは旧サイトです。新サイトは http://fess.codelibs.org/ja/ です。 Fess は「5 分で簡単に構築可能な全文検索サーバー」です。Java 実行環境があればどの OS でも実行可能です。Fess は Apache ライセンスで提供され、無料 (フリーソフト) でご利用いただけます。 Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。ドキュメントクロールには S2Robot を利用することで、Web やファイルシステムに対するクロールが可能になり、MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。特徴 5 分で簡単に構築可能な全文検索サーバー Apache ライセンスで提供 (フリーソフト) OS 非依存

ton__ton 2010/03/04

全文検索

リンク

【ハウツー】5分で簡単構築! 全文検索サーバ"Fess"を試してみよう | エンタープライズ | マイコミジャーナル

Fessとは FessはSourceForge.jpで開発されるオープンソースの全文検索サーバである。Apacheライセンスで提供され、無償で利用することができる。オープンソースの全文検索エンジンにはさまざまなものがあるが、Fessの最大の特徴はインストールから起動までが簡単であり、起動後は管理画面ですばやく検索システムとして構築できることが挙げられる。そのほかの特徴としては次のことが挙げれる。 OS非依存(Java実行環境があれば利用可能) Webまたはファイルシステム上にあるドキュメントを検索対象にできる MS OfficeやPDFなど多くのファイル形式に対応携帯端末の表示に対応 (端末ごとに検索表示を最適化) Fessの心臓部分ともいえる検索エンジンにはApache Solrが採用されている。Apache Solrはサーバの構成次第では数億ドキュメントも検索対象とすることができ

ton__ton 2009/11/21

リンク

Namazu: a Full-Text Search Engine

What's Namazu Namazu is a full-text search engine intended for easy use. Not only does it work as a small or medium scale Web search engine, but also as a personal search system for em ail or other files. (The Japanese word `Namazu' means `catfish' in English.) Table of contents News Features License Download Stable source code deb packages for Debian GNU/Linux Windows edition Search Tutorial Manua

ton__ton 2006/06/11

リンク

はてなブックマーク

タグ

関連タグで絞り込む (14)

全文検索に関するton__tonのブックマーク (18)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第4週）

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス