タグ

ベイジアンフィルタとスパムに関するdaddyscarのブックマーク (3)

  • ベイジアンフィルタによるスパム対策 - SourceForge.JP Magazine

    日々舞い込んでくるスパム(未承諾広告メール)はいまやオンラインのやっかいものだ。世界を行き交うメールトラフィックの50%以上がスパムで占められているとするリサーチ報告もある。 受信ボックスはスパムであふれ、その中から必要なメールを掘り出して整理するのは困難になる一方だ。しかし対抗手段はある。スパムを効率的に排除できるパッケージとその設定について考えてみよう。 スパム排除で最初に効果を上げたのは、ブラックリストを作成して共有するという試みだ。このリストには世界中から寄せられたジャンクメッセージのサンプルと送信元IPアドレスが載っていて、メール送信エージェント(MTA)はこのリストをチェックし、スパムであることが判明しているメッセージとアドレスを拒絶する。また、ユーザの間では、メールクライアントに用意されているキーワードベースのフィルタの使用も広がり始めた。これは、特定の言葉が含まれているメ

  • Better Bayesian Filtering - ベイジアンフィルタの改善

    ベイジアンフィルタの改善 --- Better Bayesian Filtering Paul Graham, January 2003 これは、Paul Graham: Better Bayesian Filtering を、原著者の許可を得て翻訳・公開するものです。 <版権表示> 和訳テキストの複製、変更、再配布は、この版権表示を残す限り、自由に行って結構です。 (「この版権表示」には上の文も含まれます。すなわち、再配布を禁止してはいけません)。 Copyright 2002 by Paul Graham 原文: http://www.paulgraham.com/better.html語訳:Shiro Kawai (shiro @ acm.org) <版権表示終り> Paul Graham氏のエッセイをまとめた『ハッカーと画家』の 邦訳版が出版されました。 出

    daddyscar
    daddyscar 2007/11/04
    これは、Paul Graham: Better Bayesian Filtering を、原著者の許可を得て翻訳・公開するものです。
  • ベイジアンフィルタ - Wikipedia

    ベイジアンフィルタ (英: Bayesian filter, naive Bayes spam filtering) は単純ベイズ分類器を応用し、対象となるデータを解析・学習し分類する為のフィルタ。学習量が増えるとフィルタの分類精度が上昇するという特徴をもつ。個々の判定を間違えた場合には、ユーザが正しい内容に判定し直すことで再学習を行う[1]。 現状ではスパムメール(いわゆる迷惑メール)を振り分ける機能を持つソフトウェア(フィルタリングソフト)で、スパムフィルターでのスパム判定に利用されることが多い[1]。最近ではWeblogのトラックバック用フィルタ(トラックバックスパム対策)にも利用されるようになるなど、その利用範囲は徐々に広がりつつある。 ベイジアンフィルタでは、初期状態である程度までの振り分けができるように設定されている。振り分け対象となるデータ(迷惑メールなど)の学習量が増えると

    ベイジアンフィルタ - Wikipedia
  • 1