英語の文章からキーワードを抽出したくなったので 形態素解析ツールを探していた所、TreeTaggerというツールを見つけました。 英語の他にもフランス語、ドイツ語など色々などにも対応しているようです。 英語以外は解りませんので、英語をインストールしました。 インストールはここから、以下のファイル群を適当なディレクトリにダウンロードしてinstall-tagger.shを走らせます。ファイルの解凍含めて全て処理してくれます。 tree-tagger-linux-3.2.tar.gz (本体) tagger-scripts.tar.gz (実行スクリプト) install-tagger.sh (インストーラ) english-par-linux-3.1.bin.gz (English parameter file) english-chunker-par-linux-3.1.bin.gz (E