タイトルは若干釣りです>< MongoDB は使ってみたかっただけ。 先月から「言語処理のための機械学習入門」を読んでいるので、ナイーブベイズ分類器を書いてみました。 「言語処理のための機械学習入門」はホントに説明が分かりやすい良本だった(数式全然分からなくてそっちの勉強からのスタートになったけど・・)。 あと、Wikipediaも詳しいです。 ナイーブベイズは実装が簡単な割によく働くテキスト分類手法です。 メールを自動でフィルタリングとかよく見かけるブログのこの記事と似ている記事はこちら、みたいなことをやりたいときに使えそうなやつです。 ナイーブベイズの説明はググればいくらでも出てくるのでカット。 事後確率P(cat|doc)を求める方法として、多項ナイーブベイズモデルとベルヌーイモデルの二つがあるようなのですが、ベルヌーイモデルの方はまだ理解できてない><ので、多項ナイーブベイズモデル