[B! Algorithm][はてな] gan2のブックマーク

gan2 id:gan2

Algorithmとはてなに関するgan2のブックマーク (2)

新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ - 射撃しつつ前転改
新はてブ正式リリース記念ということで。もうリリースから何週間も経っちゃったけど。新はてなブックマークではブックマークエントリをカテゴリへと自動で分類しているが、このカテゴリ分類に使われているアルゴリズムはComplement Naive Bayesらしい。今日はこのアルゴリズムについて紹介してみる。 Complement Naive Bayesは2003年のICMLでJ. Rennieらが提案した手法である。ICMLというのは、機械学習に関する（たぶん）最難関の学会で、採択率はここ数年は30%を切っている。2003は119/371で、32.1%の採択率だったようだ。 Complement Naive Bayesの位置づけは実装が簡単学習時間が短い性能もそこそこよいという感じで、2003年段階にあっても、絶対的な性能ではSVMに負けていた。しかし、学習が早いというのは実アプリケーシ
gan2 2008/12/20
algorithm

はてな

bookmark
リンク
はてなのCAPTCHAは簡単に破れる
CAPTCHAをご存知でしょうか。スパム防止のために歪んだ文字とかを入力させる、アレのことなのですが、はてなのCAPTCHAの強度が妙に低く思えたので検証してみました。 CAPTCHAというのはいわゆる逆チューリングテストという奴で、人間には可能だが機械には処理しにくいことをさせることで、ロボットによる操作を弾こうというものです。たとえば、Gmailのユーザ登録には以下のような画像が表示され、表示されている文字を入力することが求められます。 CAPTCHAの強度例えばスパムを送るために大量のGmailアカウントを得ようとしてる人がいたとします。手作業でGmailを登録するのは骨が折れる。そこでプログラムによる機械化を試みることになるわけです。その際、障壁となるのがこのCAPTCHAなのです。この画像から正解である文字列"vittac"を得ることは機械には難しい。プロ
gan2 2007/10/29
algorithm

セキュリティ

はてな
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx