タグ

あとでとフィルタリングに関するfoaranのブックマーク (2)

  • Kazuho@Cybozu Labs: キーワード抽出モジュールを作ってみた

    « IIS のログを tail -f | メイン | Lingua::JA::Summarize 0.02 » 2006年04月26日 キーワード抽出モジュールを作ってみた 一昨日、同僚の竹迫さんに、文書内からのキーワード抽出技術について教えてもらっていた時、わざわざ TF-IDF注1 用に別のコーパスを用意しなくても、MeCab だったら生起コストを辞書内に持っているんだから、それを使えばいいのではないか、という話になりました。 竹迫さんがその日のうちに作ってくれたプロトタイプで、アルゴリズムの改善とパラメータのチューニングを行ったところ、十分な品質が出そうなので、書き直して公開することにしました。 普通の Perl モジュールなので、 perl Makefile.PL && make && make install すれば使うことができます (15:50追記: すみません。 MeCab

  • 2006-04-29

    やっとできました。 今までのKikkerでははてブをクロールした結果しか扱っていませんでしたが、CEEK.JP NEWS*1をクロールしてニュースサイトのようにしてみました(情報源はばっちりですよ)。 これによって、今までGeekしか使いようがなかった*2Kikkerが、誰でも便利に使って情報を集められるKikkerになったわけです。 宣伝 あなたはどうやってWeb上のホットな話題を集めていますか?毎日たくさんのサイトを巡回して情報を集めてきているのですか?それには無駄な時間がかかりすぎていませんか? Kikkerはそんなあなたの代わりに情報の取捨選択を行ってくれます。無駄な時間を削減してその時間をあなた与えてくれます。 是非ご覧になって下さい。 [Top Page] http://ryogrid.myhome.cx:1234/ [ニュース表示のサンプル(Ryoに対してのリンク)] htt

    2006-04-29
  • 1