GETAによるファイルの全文検索 Up$Date: 2003/01/05 10:05:20 $ $Revision: 1.1 $ (UnixMagazineに 記事を書きましたので こちらも参照下さい - 2003/4/29) 情報学研究所の高野氏/ 日立の西岡氏らによる GETA というライブラリを使うことにより ファイルの全文検索を行なうことができる。 GETAの使い方 チュートリアルが 用意されているが、いまひとつわかりやすいとはいえないので、 忘れないように書いておく。 GETAプログラムは標準で /usr/local/geta にインストールされる その下の sbin/mkw を使って、単語出現マトリックス WAM (Word-Article Matrix)を作成することにより tf/idf法などによる検索を高速に実行することができる。 WAMは疎行列を効率的に表現するデータ構造