2008年3月10日のブックマーク (8件)

  • YappoLogs: Apacheで携帯キャリアのIPアドレス制限をするには

    Apacheで携帯キャリアのIPアドレス制限をするには 塩とDishuberを使えば良い。 用意するもの config.yaml cidr.tt contents.tt frame.tt 以上のファイルと最新のDishuberだけである。 それぞれのファイルの中身はとても単純。 frame.tt [% content %] contents.tt[% FOREACH cidr = meta.cidr %] [% cidr -%] [% END %] cidr.tt# [% meta.source.meta.carrier %] [% FOREACH cidr = source %] Allow from [% cidr -%] [% END %] そして config.yaml plugins: - module: Source::MobileCIDR cid: docomo config

    ugawalab
    ugawalab 2008/03/10
    う〜ん、こんなに簡単にできるとは!さすが。よく教えてくれました。
  • taRgrey - S25R + tarpitting + greylisting

    taRgrey - S25R + tarpitting + greylisting (tarpit + greylist policy server) K2-net ホームへ English 2006/11/14 (lastupdate 2012/4/18) これはなに? taRgreyとは、メールサーバ上でスパムやウイルスメールを排除するためのフィルタの手法で、 S25Rとtarpittingとgreylistingというスパム判定手法を組み合わせて使うというものです。 S25Rにより、動的IPっぽいFQDNからの接続からは怪しいと判断し、tarpitting(応答の遅延)を行います。tarpittingを待ちきれずに送信元が接続を切った後、再度送ってきた場合にはgreylisting(再送のチェック)により救済します。S25Rとtarpittingとgreylistingと、全てのフィ

    ugawalab
    ugawalab 2008/03/10
    taRgrey - S25R + tarpitting + greylisting (tarpit + greylist policy server)
  • Rgrey - S25R + greylisting

    K2-net ホームへ English (postgrey ML archive) 2004/9/30 (lastupdate 2009/5/29) これはなに? Rgreyとは、メールサーバ上でスパムやウイルスメールを排除するためのフィルタの手法で、 S25Rとgreylistingというスパム判定手法を組み合わせて使うというものです。 スパムの検出率を上げることより、正しいメールの誤検出をしないことを目標 として設計されており、原理的にほとんど誤検出無く運用することが出来ます。 そのため、ベイジアンフィルタ等の他のコンテンツフィルタと組み合わせて 1次フィルタとして利用すると有効ですが、これだけでも95%弱程の検出率はあります。 同様の手法で、greylistingの代わりにtarpitting(遅延)を利用したStarpitという手法と、tarpittingとgreylistingを

    ugawalab
    ugawalab 2008/03/10
    Rgrey - S25R + greylisting
  • Kozupon.com - 日本語Spamはやっぱbsfilter!

    bsfilter は bogofilter と同じベイジアン(bayesian)方式によるSpamフィルターである。メールの内容を調査して、spamらしいからしくないかを単語ベース判別する。さらに、まともなメールやspamメールを bsfilter にわせて学習 させることで判別効率を上げる。また、bsfilterは日語に完全対応している。bogofilterは、kakasiなどを使って日語対応しているが、bsfilterでは独自に日語Spam対応している。ここでの説明は、 Postfix+procmail の環境を前提にして説明する。 インストール環境 ) OS : CentOS4.4 マシン : Dell サーバPowerEdge 420 メールサーバモジュール : Postfix+Procmail+Amavis+Clamv+Postgrey 1.インストールの準備

    ugawalab
    ugawalab 2008/03/10
    ngram bsfilter bogofilterで見つかるリンク
  • Justin's Linklog

    Just to get a little techie again… here’s a short article on a new algorithm I’ve come up with. Text-matching rule-based anti-spam systems are pretty common — SpamAssassin, of course, is probably the most well-known, and of course the proprietary apps built on SpamAssassin also use this. However, other proprietary apps also seem to use similar techniques, such as Symantec’s Brightmail and MessageL

    ugawalab
    ugawalab 2008/03/10
    ngram とspamassassinで、それらしいもの
  • Sennaとは コンピュータの人気・最新記事を集めました - はてな

    未来検索ブラジルが開発した組み込み型の検索エンジン。 オープンソース。 DBMSやスクリプト言語処理系等に組み込んで使用するのが特徴。 世界で一番速かった男、アイルトンにちなんで名付けられた。 はまぞうのエンジンにもなっている。 Greeやコトノハでも利用されているらしい。 はてなブックマークのブックマーク検索でも使用されている。 インデックスのサイズが比較的小さくて適合率が高いという単語インデックス方式のエンジンの特徴を備えつつ、 n-gramインデックス方式エンジンのような再現率の高さを実現している。 はてな検索のキーワード検索でも用いられている。 http://search.hatena.ne.jp/keyword?mode=top このタグの解説についてこの解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性

    Sennaとは コンピュータの人気・最新記事を集めました - はてな
    ugawalab
    ugawalab 2008/03/10
    はてなからはてな?はてな?
  • ruby ngram - Google 検索

    www.xmisao.com › 2016/10/29 › create-ngram-using-each-cons-in-ruby 2016/10/29 · Rubyでは Enumerable#each_cons を使って簡単にN-gramを作ることができます。 このエントリはkawasaki.rb #41で、パーフェクトRubyの”5-5-1 ...

    ugawalab
    ugawalab 2008/03/10
    rubyとngramは関係ある?
  • koress.jp: Ruby on Rails + MySQL 日本語全文検索まとめ

    「よいさいと」で日語の検索やろうと思って忘れていました。せっかくなので、最近のMySQLの日語全文検索の事情についてまとめてみます。2007/10/3時点。 ちなみに、以前に別のアプリで全文検索を実装したときには、例の如く「メカブで分解して16進の文字列で格納する」という方法でやっていたのですが、もうやりたくないです。 アルゴリズムいろいろ インデキシングの方法です。 単語分かち書き 形態素解析エンジンを使って、日語の文章を分解し、スペースを挿入してインデキシング。 形態素解析のエンジンにはmeCabとかchaSenがある。 インデックスのサイズはn-gramと比較して小さい。 辞書に登録されていない単語がある場合にはナイーブ。「脳トレ」「みっくみっく」 n-gram 基的に文章の任意の位置から後方n文字を切り出してインデキシングする。 bigramの場合 「その域に達していない」

    ugawalab
    ugawalab 2008/03/10
    なんか新しそうなRuby on Rails.