今回は、Windows環境のテキスト抽出方法の代表格といえるIFilterについてとりあげます。 IFilterの構造 現在、さまざまなWindowsのシステム上では、Windows Indexing Service, Windows Desktop Search, SharePoint Server 2003/2007, Microsoft Search Server 2008などのMicrosoftの全文検索エンジンが動作します。これらのソフトウェアでは、各ファイルからテキスト情報を抽出するためにIFilterと呼ぶフィルタを用いています。最近では、Microsoft SQL ServerのフルテキストインデックスもIFilterを利用しており、IFilterは多くのMicrosoft製品で利用されています。 また、Microsoft以外の多くのベンダの開発する検索エンジンや、文書管理
![第16回 テキスト情報の抽出[その3] | gihyo.jp](https://cdn-ak-scissors.b.st-hatena.com/image/square/7dde9d3c2dadf5eaef59bc773920f2f872179120/height=288;version=1;width=512/https%3A%2F%2Fgihyo.jp%2Fassets%2Fimages%2FICON%2F2007%2F032_make-se.png)