明日はComplement Naive Bayesいってみよー。 参考 Rubyでベイジアンフィルター - ザリガニが見ていた...。 新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ - 射撃しつつ前転 改
RubyGemsのclassifierを使ってみる † githubを見るに最新版はたぶんこれ↓ luisparravicini's classifier at master - GitHub なんだけど、まずは素のclassifierを使ってみる。 $ sudo gem install classifier Successfully installed stemmer-1.0.1 Successfully installed classifier-1.3.1 2 gems installed stemmerというのも依存で入れさせられた。 あとは、こちらを参考にサンプルを実行してみると→ベイジアンフィルターで日本語を分類する。 - ザリガニが見ていた...。 classifier_test.rb: #!ruby -Ku $KCODE = 'u' require 'rubygems' re
ベイジアンフィルターという仕組みを知ったのは、何年か前に迷惑メールの多さに困り始めた頃だった。OSX付属のMailにも迷惑メールフィルター機能は存在するが、これがあまり賢くない。(いくら学習させても、すり抜けてくる迷惑メールが日に何通かあり、また必要なメールを迷惑メールとしてしまったり。)そんな時に巡り会ったのが、PopfileMgrだった。 使い始めは全くトンチンカンな分類だが、間違って分類した時は、正しく訂正して学習させる。そうしているうちに、驚くほど高精度にメールを分類できるようになる。単なる迷惑メールのフィルタリングだけに留まらず、設定した通りに、どんな風にも分類してくれる。(例えば、「プライベート」「仕事」「DM」「買物」「迷惑」など。) 最近の1ヶ月を振り返って、迷惑メールか、それ以外で、その分類の精度を確認してみた。最近では1日に50通前後の迷惑メールが届く。今確認したところ
インターンの増田です。 ActiveRecordのデータを使ってベイジアンフィルタを使う必要があったので、この部分をプラグイン"Acts as classified":http://labs.airs.co.jp/projects/acts-as-classified として抜き出してみました。 インストール 依存しているライブラリをインストールします。 gem install classifier stemmer プラグインをインストールします。 ./script/plugin install svn://rubyforge.org/var/svn/actasclassified/trunk/acts_as_classified また、日本語のデータを学習に用いる場合は"MeCab":http://mecab.sourceforge.net/ とそのRubyバインディングをインストールし
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く