タグ

ブックマーク / tokkono.cute.coocan.jp (1)

  • スパムに効く正規表現2-URLの分解とドメイン名の抽出 | ゆっくりと…

    ウチのCGI掲示板には、スパムと判定された投稿からURLのドメイン名を抽出し、投稿禁止ワードとして一定期間保持する機能を持たせています。他のスパム判定フィルタと合わせることでモレを少なくする効果を狙ったものですが、特にスパム対策が未熟だった頃、この機能に引っかかったスパム投稿も少なくありませんでした。 さて、正規表現 URL 分解 を Google で検索する と第1位に「正規表現サンプル(URLを分解する)」が挙がり、次のような正規表現が紹介されています。 ^(.+?)://(.+?):?(d+)?(/.*)?$ この正規表現は、左側のカッコから順に スキーム、ホスト、ポート、パス へと分解してくれるのですが、http://127.0.0.1/ の様にIPアドレスで構成されたURLの場合、ホストが 127.0.0.、ポートが 1 となってしまうという問題点があります。 もちろんこれを改善

  • 1