平林幹雄さんの Hyper Estraier を Cent OS に入れてみたりしたときの試行錯誤メモ。 OpenOffice.org の .odt, .ods, .odp なんかを検索対象にしたかったので、すこぶる簡易的なフィルタを作ってみました。 といっても、元々 zip 圧縮されている中の「content.xml」というファイルを取り出すだけで、 /usr/bin/unzip -caq "$infile" content.xml で XML を取り出して、あとは HTML として解釈させればそれなりにいけちゃいました。 作成したフィルタスクリプト → estfx_ooo2xml.sh ついでに MS Office 2007 の Office Open XML も .docx の場合 /usr/bin/unzip -caq "$infile" */document.xml .xlsx
![Hyper Estraier で OpenDocument & Office Open XML を検索対象にする](https://cdn-ak-scissors.b.st-hatena.com/image/square/8d71ff5111e05619a10d29bb40d7aebaa75c8fbc/height=288;version=1;width=512/https%3A%2F%2Fs0.wp.com%2Fi%2Fblank.jpg)