今回は、Windows環境のテキスト抽出方法の代表格といえるIFilterについてとりあげます。 IFilterの構造 現在、さまざまなWindowsのシステム上では、Windows Indexing Service, Windows Desktop Search, SharePoint Server 2003/2007, Microsoft Search Server 2008などのMicrosoftの全文検索エンジンが動作します。これらのソフトウェアでは、各ファイルからテキスト情報を抽出するためにIFilterと呼ぶフィルタを用いています。最近では、Microsoft SQL ServerのフルテキストインデックスもIFilterを利用しており、IFilterは多くのMicrosoft製品で利用されています。 また、Microsoft以外の多くのベンダの開発する検索エンジンや、文書管理