Blogging is a disease: selfkleptomania, your normal condition. About GPG Public Key 思い立って仕事の合間にブラウザから閲覧する社内文書の全文検索システムを作っている。 【ざっとした要件】 ■PDF、Word、Excel、PowerPointのファイルに対応 wvWare、pdftotext、xlhtmlが使える。 ■検索エンジンはSennaを利用 Hyper EstraierとNamazuが候補だった。 前者は付属のCGIが便利だけど改造するのが面倒で、後者は珍しさと真新しさに欠けるので。 技術的な優位性とかは考慮せず。 ludiaが使えるので。 ■ファイルをアップロードするとその場でインデックスを更新 PDFはludiaのマニュアル通りに、他はテキストに変換してINSERT。 ■アップロード処理中はプログ