タグ

hyperEstraierに関するmanboubirdのブックマーク (2)

  • y-matsui::Weblog: HyperEstraierのインデックス処理

    HyperEstraierを使っていると、インデックスが結構壊れる。repairというコマンドがあるので、まずこれを試してみるのだが、完全に壊れてしまっている場合が結構ある。 壊れると再スキャン、再クロールが必要になり、かなりの時間が無駄になる。何よりもデータベースがロックされ、その間、検索が出来ないのが痛い。 そこで、 ここを参考にHyperEstraierのインデックスを一度コピーしておいて、メンテナンスし、最後に差し替えるようにスクリプトを書き替えた。 処理は、下記の通り ・前回処理の残骸が残っていたらスキップ ・現在のインデックスをコピーする ・コピーしたインデックスにテキスト系文書を追加登録する ・コピーしたインデックスにOffice系文書を追加登録する ・コピーしたインデックスにPDF文書を追加登録する ・コピーしたインデックスにXDW文書を追加登録する

  • 第4回 OpenSocialのベースになっているGDataサーバに挑戦 | gihyo.jp

    前回まででAtomPubの機能をすべて実装しました。今回はAtomPubの拡張仕様であるGoogle Data APIs(GData)を取り上げ、検索クエリとJSONをサポートします。GDataは、昨年秋にGoogleが発表したOpenSocialのベースになっていることで話題になりました。 全文検索にはHyper Estraierというオープンソースの検索エンジンを用います。Hyper Estraierはフレーズ検索や属性検索をサポートしているため、GDataサーバの実装にうってつけです。 サンプルコードはこちらからダウンロードできます。 GDataとは GDataはGoogle CalendarやBloggerなどのサービスを利用するためのAPIです。AtomPubの拡張仕様として定義されています。GDataは、プロトコルに関する仕様とXMLフォーマットに関する仕様に分けられます。プロ

    第4回 OpenSocialのベースになっているGDataサーバに挑戦 | gihyo.jp
  • 1