タグ

spamに関するnagwikiのブックマーク (9)

  • A Plan for Spam

    August 2002 (This article describes the spam-filtering techniques used in the spamproof web-based mail reader we built to exercise Arc. An improved algorithm is described in Better Bayesian Filtering.) I think it's possible to stop spam, and that content-based filters are the way to do it. The Achilles heel of the spammers is their message. They can circumvent any other barrier you set up. They ha

  • スパムを見分けるリテラシー

    語句の判定では、単純に「特定の語句が含まれていたら、即刻スパム扱いにする」という動作では、ほとんどの場合うまく機能しない。その理由は、スパムで使われる語句には巧みな表現が増えてきており、語句の有無だけでは来受け取りたいものも該当してしまう、または、来受け取りたくないものまで通してしまう、といった状態になるためだ。 そこで語句の有無を調べるのではなく、「語句が、どの程度含まれているのか」という割合を統計的に調べることで、総合的な判定をしている。総合的な判定をするのに使われる代表的な方法は、次の2つだ。 1. 語句の登場数でスコア判定する 「Aという語句が含まれていれば1ポイント」、「Bという語句が含まれていれば0.5ポイント」といったように、語句が含まれるごとに加点していき、その結果が例えば10以上であればスパムとして判定するといった方法だ。 この方法では、実装も動作も単純だが、「どの語

    スパムを見分けるリテラシー
  • ベイジアンフィルタについて

    最近話題のベイズ理論を用いたフィルタについて整理してみました.まず,ベ イズ理論が注目され始めたというニュースを最初にみたのが,MSも注目する “ベイズ”って何だ(oricom.co.jp)でした. このときは対して気にもとめていませんでしたが,再度興味をそそられ出した のが,グーグル、インテル、MSが注目するベイズ理論(CNET)のニュース. MSだけならまだしも,Googleが,というのが自分的には大きかったです.しか し,このニュースだけでは,この技術が具体的にどのように採用されるのか, 特に検索エンジンのような大規模なものに適用可能かどうかは大きな疑問でし た. そもそも,このベイズ理論がどこに聞いてくるのかということを考えるとその 疑問は自然だと思います.ベイズ理論(ベイズ推定)は,過去に起きた事象の 確率を利用して未来を予測する手法です.そのため,直感的にはユーザごとの 最適化

  • 独BMWのサイト、Googleインデックスから削除される :: SEM R

    独BMWのサイト、Googleインデックスから削除される ドイツ大手自動車メーカーBMWのサイトが検索エンジンスパム行為を行っていたとしてGoogleインデックスから削除された。JavaScriptによるリダイレクトを悪用して検索エンジンを欺いていたことが原因だ。 公開日時:2006年02月06日 09:37 検索エンジンを騙す行為を行っていたとして、ドイツ大手自動車メーカー BMWのサイトがGoogleインデックスから削除された。 GoogleエンジニアのMatt Cutts氏によると、BMW社は訪問者用とクローラ(googlebot)用のウェブを別々に用意。訪問者がアクセスした際には自動車のイメージを多用したグラフィカルなウェブを表示する一方、クローラが訪問した際には訪問者用とは異なるウェブページにリダイレクト(転送)してテキストを詰め込んだウェブを表示していた。JavaScript

    独BMWのサイト、Googleインデックスから削除される :: SEM R
    nagwiki
    nagwiki 2006/02/15
    クローラが訪問した際には訪問者用とは異なるウェブページにリダイレクト(転送)してテキストを詰め込んだウェブを表示していた。
  • グーグル、ドイツのBMWサイトをブラックリストに - CNET Japan

    Googleが、BMWのドイツ語サイト「BMW.de」をブラックリストに載せた。このサイトではGoogleでの検索結果の表示順位を意図的に引き上げるテクニックが用いられており、同社のガイドラインに違反したためだとGoogleエンジニアは説明している。 GoogleのソフトウェアエンジニアMatt Cuttsはブログのなかで、Googleが自社のウェブインデックスからBMW.deを削除したことを明らかにした。BMW.deサイトに、アクセスしたユーザーを異なるURLに自動的にリダイレクトする「入口ページ」が組み込まれていたためだという。 Cuttsによると、GoogleのロボットがBMW.deサイトにアクセスしたところ、ドイツ語で「新車」を意味する「neuwagen」などの一連の検索語を集めた記述が見つかったという。しかし、ユーザーがこのリストのあるページを訪れると、自動的に別のページにリダ

    グーグル、ドイツのBMWサイトをブラックリストに - CNET Japan
  • エロを大切にしよう-blog編 : 404 Blog Not Found

    nagwiki
    nagwiki 2006/01/21
    エロトラックバックのスパムについての考察。ただ否定するだけではないことが秀逸。
  • スパムのブログ版「スプログ」、ブログ界の脅威に | WIRED VISION

    スパムのブログ版「スプログ」、ブログ界の脅威に 2005年11月 1日 コメント: トラックバック (0) Nicole Lee 2005年11月01日 一見したところでは、普通のブログのようだ。しかし注意深く見ると、そのコンテンツの実に奇妙な点に気づくだろう。コンテンツに見覚えがあるのだ。いや、単に見覚えがあるどころではない。 なぜなら、それは6ヵ月前に自分のブログに書いた文章だからだ。他の部分のコンテンツは意味をなしていない。同じ言葉が延々と繰り返されている。サイドバーは、バイアグラや住宅ローンなどの広告で埋め尽くされている。 ここでようやく、これが「スプログ」(splog)――「スパム・ブログ」を縮めた呼び名――だと気づく。あなたのブログはスプログの餌になったのだ。 スプログは、スパム業者がブログ界から利益を得るために使う最新の方法だ。最近、このスプログが大発生するという現象が起こ

  • caramel*vanilla - Flickrがかなり面白い件と関連ツールいろいろ

  • 生協の白石です - 星澤裕二メモ

    便乗型(?)スパム

    生協の白石です - 星澤裕二メモ
    nagwiki
    nagwiki 2005/12/28
    どうせスパムメール書くならこれぐらい気がきいていないとw
  • 1