ここで紹介しているライブラリの最新版はWordScoopという名前に変更されています。詳細はこちら( WordScoop ver2.0.0をリリースしました。)。 このブログ、kaeruspoonには、はてなダイアリーキーワードと同じような機能( かえるキーワード)があります。昨日、その内容を社内勉強会(スライドは slideshareに)で発表したのですが、そのコアとなるクラスKaeruKeywordをRubyForgeで公開しました。クラス自体の大きさ40行くらいの小さなものです。 これを使うと、ある文章の中にどんなキーワードが含まれているかを検出することができるようになります。6000字程度の文章の中から登録しておいた20万のキーワードを探し出すのにかかる時間はだいたい0.01秒くらいです。個人で使うには十分な性能だと思います。 KaeruKeywordのインストール