この学習データをもとにinboxとspamでspam度判定を行ってみると こうなった。 nospamをspamと判定: 0/3265 spamをnospamと判定: 68/3443 (捕捉率 98.0%) うち、日本語メールについては 4/1854 (捕捉率 99.8%) tokenizationは原始的でもけっこういけるんじゃなかろうか。 ということで、このエンジンをscmailから使うようにして、 届いたメールをscmail-refileで自動振り分けするのをしばらく 試している。scmail-refileではまず身元のはっきりしている メルマガやメーリングリストのメッセージを規則によって 振り分けてしまい、残ったものに対してspam度判定を行っている。 今のところ新着メールに対しては望み通りの判定が行われている。 使用経過 (2003/03/24 20:10:58 PST) 旅行など
August 2002 (This article describes the spam-filtering techniques used in the spamproof web-based mail reader we built to exercise Arc. An improved algorithm is described in Better Bayesian Filtering.) I think it's possible to stop spam, and that content-based filters are the way to do it. The Achilles heel of the spammers is their message. They can circumvent any other barrier you set up. They ha
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く