タグ

tDiaryとspamに関するpmakinoのブックマーク (12)

  • Referer spam 臭が強い検索サイト - [ぴ](2007-09-17)

    _ [日記/blog] Referer spam 臭が強い検索サイト tDiary のリンク元を見ていると、ここ最近見慣れない検索サイト?からのアクセスが急増していることに気がついた。 ざっと眺めていると、ある程度共通点がある。 このサイトへのリンクは、ページのメインコンテンツからではなく、「関連エントリー」「ピックアップ・エントリー」等としてページ最後などに小さな枠として表示されているアフィリエイトがページの大半を占めているものが多い関連エントリーのリンク先が tDiary サイトであることが多い どうも、検索サイトを装って Anti Referer Spam プラグイン対策を行ったうえで tDiary を狙った spam サイトではないかという疑いがある。 (Anti Referer Spam プラグインの作者の日記でもちょうど spam 対策漏れについて取り上げられていた) アクセス

    Referer spam 臭が強い検索サイト - [ぴ](2007-09-17)
    pmakino
    pmakino 2008/07/08
    セルクマ。
  • tDiary.org

    ツッコミやTrackBackを狙ったspamが増えています。日記を書いている自分では気づいていないかも知れませんが、フィード(RSS)経由で日記を読んでいると、かなりの数のツッコミspamを読まされることになって、読者が迷惑していることが少なくありません。 tDiary 2.2からは標準でspamフィルタが付属していますが、適切な設定をしないとspamを撃退することができません。読者のためにも、きちんとspamフィルタを設定しましょう。 この記事では、最低限の設定で効果的にspamを撃退できるフィルタの設定方法をお教えします。 メール欄をトラップにする「hide-mail-fieldプラグイン」 のっけから標準のspamフィルタでない機能ですが、最近のspamには非常に効果がある方法です。この手法では、「人間には見えないがspamボット1には見える」というトラップ(罠)用のフィールドを用意

  • NamedBrancheについて, リポジトリの再構築, インストールとスクリーンショット - 忘れたときに備えた記録(2007-11-30)

  • Bayesフィルタ, Bayesライブラリ, tDiary用Bayesフィルタ - 忘れたときに備えた記録(2007-11-26)

    唐突ですが、次のようなゲームを考えます。 デカい箱に、印刷されたメールがどっさり入っている メールは、1通につき1枚の紙に印刷されている SPAMメールか、非SPAMメール(HAMメール)かが、一目で分かるようになっている(紙が色分けされているとか)。 箱から手探りで、メールを1通取り出す。 この時点で、メールがSPAMかHAMかが分かる メールから単語をでたらめに1つ選ぶ さて、このゲームをこれから始めるとすると、箱に入っているメールに関して次のことが分かっていると、いくつかの確率を求めることができます。 箱に入っているメールの総数 箱に入っているメール全ての集合を$\Lambda$とおいて、総数を$|\Lambda|$と書きます SPAMとHAMの数の内訳 それぞれ、$\Lambda_S, \Lambda_H \subset \Lambda$と書きます 各メール$\lambda$に含ま

  • 「YG ブログ検索」のドメインが移転した模様 - [ぴ](2007-10-27)

    _ [日記/blog] 「YG ブログ検索」のドメインが移転した模様 検索サイトを装った spam サイトの中でも最大勢力の「YG ブログ検索」が、アドレス http://blog.chew.jp/ から http://bloger.x0.com/ に変わったらしく、また大量の referer が送られてくるようになった。やっぱり spammer だな。(ちなみに access_log 上の初出は 2007/10/26 01:34:20) 親ドメインの x0.com をググるとやっぱりアレなサイトばかりが並ぶ。親ドメインごと氏んでください。 SetEnvIf Referer "^http://([^/]+\.)?x0\.com" referer_spam (中略) deny from env=referer_spam ところで、YG ブログ検索の各結果ページの末尾を見ると [PR]FAQ

    「YG ブログ検索」のドメインが移転した模様 - [ぴ](2007-10-27)
    pmakino
    pmakino 2007/10/27
    セルクマ。
  • tDiary: refererスパムの話 - ただのにっき(2007-10-22)

    ■ tDiary: refererスパムの話 tDiaryリファラスパムについてお詫びという記事からTrackBackを受け取った*1。最近増加中のrefererスパム(「日のリンク元」になんの役にもたたない検索サイトっぽいリンクを残していくアレ)発生の、一端を担っているとおぼしき人の釈明である。スパムに悩まされている人は一読して……も役には立たないが。 もっとも、スパムサイトの作り方なんてものを公開することに対する倫理的な問題はさておき、基的にスパム対策が遅れているのは、作者の責任だと思う。つまりおれのことだが。 refererに、それを受け取る人が期待しないものを乗せたからと言って、とりたてて非難されることはないと思うし。「迷惑referer」はメールほど真っ黒ってわけでもなかろう。特にちゃんとリンクがある場合は。実際、refererスパムは海外からの方がはるかに多いので、こんな記

  • http://www.netlife.gr.jp/redbug/diary/?date=20071021

  • ۞ スパムサイト作成講座43 - tDiary リファラスパムについてお詫び : a++ My RSS 管理人ブログ

    先日の講座でバックリンクの獲得方法の一例を示した件について。 ۞ スパムサイト作成講座21 - リファラスパムでバックリンク : a++ My RSS 管理人ブログ 実験サイトをそのまま放置していたのと、手法を公開してしまったことで、tDiary を利用している方にいろいろとご迷惑をかけてしまっているようです。 大変申し訳ありません。 SEO の実験・検証を行っていくつもりが、この点についてはスパムテクニックに偏向していたと思います。 どちらも紙一重という世界であるとはいえ、ブロガーの方に不快感を与える手法であったことについてはお詫びいたします。 [ぴ] - Referer spam 臭が強い検索サイト tDiary のリンク元を見ていると、ここ最近見慣れない検索サイト?からのアクセスが急増していることに気がついた。 ざっと眺めていると、ある程度共通点がある。 [ぴ] - 検索サイトに偽装

    pmakino
    pmakino 2007/10/22
    tDiaryがspammerにとって色々都合良いのは確かにその通りなんだよね / URLにマルチバイトのエンコード文字列が含まれる場合 < Wikiサイトが軒並み死ぬのでその判定基準は無理では。IDNは蹴ってもいいかもしれないけど
  • 激情综合色五月丁香六月亚洲,日本乱偷人妻中文字幕,无码亚洲日韩久久中文字幕

    激情综合色五月丁香六月亚洲,日乱偷人中文字幕,无码亚洲日韩久久中文字幕,caopro超碰最新地址

    pmakino
    pmakino 2007/10/21
    サイトオーナー自ら認めるスパムサイト→http://blog.myrss.jp/archives/2007/01/5_sfacmscom.html / http://pmakino.jp/tdiary/20071011.html#p01 も参照
  • 検索サイトに偽装した Referer spam サイト (2) - [ぴ](2007-10-11)

    _ [日記/blog] 検索サイトに偽装した Referer spam サイト (2) 先月取り上げた Referer spam 臭が強い検索サイトだが、予想通りその後も似て異なるサイトからの Referer がぽろぽろ tDiary のリンク元に上がってくる。 URL やページ構成がどれも似通っているので、誰かが基となる spam サイト作成キットのようなものを配布しているのだろうと考え少し探してみた。 …で。 その結果、「tDiary 日のリンク元」は魔法の呪文か!? (CLUB.AKITOMO.NET) 経由で見つけたのが a++ My RSS 管理人ブログ: スパムサイト作成講座である。 My RSS 管理人が実験サイトと称して sfa-cms.com を公開した話や、「ピックアップ・エントリー」という欄を設けて tDiary を狙い打ちした spam Referer を送る方

    検索サイトに偽装した Referer spam サイト (2) - [ぴ](2007-10-11)
    pmakino
    pmakino 2007/10/16
    セルクマ。
  • 諸君、私はspamフィルタが好きだ - ただのにっき (2007-02-25)

    ■ 諸君、私はspamフィルタが好きだ 諸君 私はspamフィルタが好きだ 諸君 私はspamフィルタが大好きだ NGワードフィルタが好きだ ベイジアンフィルタが好きだ ソーシャルフィルタリングサービスが好きだ ブラックリストが好きだ ホワイトリストが好きだ グレイリストが好きだ E-mailで 携帯メールで 掲示板で コメント欄で TrackBackで HTTP Refererで SNSで 検索エンジンで ソーシャルブックマークで このネット上で行われるありとあらゆるspamフィルタリングが大好きだ プロバイダが提供するフィルタが的確にspam判定をするのが好きだ spamフラグを付けられたメールがごみ箱に振り分けられた時など心がおどる フィルタに新手のspamを学習させるのが好きだ すり抜けてきたspamに対して「迷惑メールを報告する」ボタンを押す時など胸がすくような気持ちだった 何重

  • ISBN-13 ⇔ ISBN-10相互変換(3), 町田駅の特殊性に絶望した!, ドメイン名の長さでspam判定してみる - ただのにっき(2007-01-24)

    ■ ISBN-13 ⇔ ISBN-10相互変換(3) 先日話題にした、Amazon ECSがISBN-13に対応したのを受けて、tDiaryのamazonプラグインを最新の2007-01-17版APIに対応させた。 IdTypeにイロイロと与えられるのはいいんだが、今のamazonプラグインにはそういうインタフェースがない。しょうがないので与えられたIDから数字以外の文字を除いたものが13桁あった場合には"ISBN"、それ以外は"ASIN"と判断。JPサービスの場合、他に"EAN"が指定できるが、無視して大丈夫だろうか。 おまけに、IdTypeを"ISBN"にした時にはSearchIndexを"Books"にするか"ForeignBooks"にするか選ばないといけないのだが、これも情報がないので"Books"固定に。ForeignBooksにリンクしたいときはどーすりゃいいんだ? これ以上

  • 1