タグ

2009年9月1日のブックマーク (1件)

  • Kazuho@Cybozu Labs: Lingua::JA::Summarize 0.03, 0.04

    « Perl Monger への道は遠い | メイン | はてな認証 API » 2006年05月02日 Lingua::JA::Summarize 0.03, 0.04 Lingua::JA::Summarize の 0.03 と 0.04 をリリースしました。CPAN のミラーにはまだ届いていないと思いますので、http://search.cpan.org/~kazuho/ からダウンロード願います。 0.03 では、TF-IDF の計算式が間違っていたという恐ろしいバグを修正しました (すいませんすいません)。正しく修正できていると思います。たぶん... なお、チューニングとして、複数の形態素を結合する場合のコスト計算は sum(log(probability))*(log(wordcount)*0.7+1)、TF は occurences-0.5 としています。 それだけではあんま