タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

検索に関するcugelのブックマーク (3)

  • 2009-12-08

    勤め先の部門内ファイルサーバで、ずっとHyperEstraierによる検索システムを使用していたのですが、ここしばらく止めてしまっていました。 停止した直接のきっかけはサーバのクラッシュだったのですが、検索システムの再稼働を先延ばしにしていたのは、インデックス更新処理が止まらなくなるトラブルが起きていたからです。 インデックス更新処理トラブルの現象 現象としては、 ある特定のPDFファイル(とりあえず2つだけ)のxdoc2txtによるテキスト抽出処理が、CPUを使いきったまま停止しなくなる というものでした。 問題が生じるのは数百GByteは消費しているファイルサーバ中のたった2つのファイルですが、何しろ止まらないので、夜間にインデックス更新させようとしても翌朝更新処理が終わっていないことになります。 気付いた時点でxdoc2txtを強制終了するのですが、今度はそこから残りのインデックス更

    2009-12-08
    cugel
    cugel 2011/03/08
    IFilter の利用
  • ファイルサーバ検索システムを作る - めも日記

    職場でHyperEstraierを使わせてもらっているので、自分が引っかかっていろいろ試したことなど、この日記に何度か書いてきました。 でも、トピックごとにばらばらに書き散らしていただけだったので、ここらで一度、基的な手順のまとめなど書いてみます。 なぜHyperEstraierか ファイルサーバにいろいろな文書ファイルが降り積もってくると、どうしても必要なファイルを見つけ出すのが困難になってきて、「googleみたいに」検索して探したくなります。これを実現するのが全文検索エンジンと呼ばれるソフトウェアですが、それこそgoogle自身が販売している”イントラネットにつなげばgoogleで検索ができる”代物から、数十万オーダーの市販品、そして無償で利用できるオープンソースのプロダクトまで、いろいろとあります。 オープンソースの全文検索エンジンとしては、長くNamazuが定番でしたが、200

    ファイルサーバ検索システムを作る - めも日記
    cugel
    cugel 2011/03/08
  • CiNii Articles

    JaLC IRDB Crossref DataCite NDL NDL-Digital RUDA JDCat NINJAL CiNii Articles CiNii Books CiNii Dissertations DBpedia Nikkei BP KAKEN Integbio MDR PubMed LSDB Archive 公共データカタログ ムーンショット型研究開発事業

    cugel
    cugel 2009/04/03
    国立情報学研究所論文情報ナビゲータ
  • 1