ExtractTermというPerlで書かれたライブラリがあるらしい。 専門用語(キーワード)自動抽出用Perlモジュール "TermExtract"の解説 CGI版で試してみる 専門用語(キーワード)自動抽出サービス 「言選Web」 「本文」とかゴミは混ざってるけどなかなかの精度。事前に候補を絞る程度には使えそうだ。 インストール $ wget http://gensen.dl.itc.u-tokyo.ac.jp/soft/TermExtract-4_08.tar.gz $ tar xzvf TermExtract-4.08.tar.gz makefileをutf-8にしておくらしい $ cd TermExtract $ cp MeCab.pm MeCab.org.pm $ iconv -f euc-jp -t utf-8 MeCab.org.pm > MeCab.pm $ cd ..$