タグ

bayesに関するhiroyadoraemonのブックマーク (3)

  • TWCNB分類器を試す - Negative/Positive Thinking

    はじめに テキスト分類でよく使われるNaive Bayesにはいくつかの厳しい仮定や条件があり、それによって性能が落ちてしまっている。 経験則をいれたりして性能を向上させたTWCNB分類器を試してみる。 多項モデルによるNaiveBayes l_MNB(d) = argmax_c{ log P(c) + Σ_w{f_w * log P(w|c) } } l_MNB(d) : 多項モデルでの文書dの予測クラスラベル P(c) : クラスcである確率 f_w : 文書での単語wの出現頻度 P(w|c) : クラスcでの単語wの出現確率 P(w|c)の推定値=(N_cw + α_w) / (Σ_w {N_cw} + 単語の種類数) N_cw : クラスcで単語wが出現する訓練文書数 α_w : パラメータ(=1) 【メモ】P(c)の推定値=(N_c + α_c) / (Σ_c {N_c} + ク

    TWCNB分類器を試す - Negative/Positive Thinking
  • Algorithm::NaiveBayesで2ch系まとめサイトをカテゴライズしてみた - 岩手からこんにちは ☆彡 perl とかウェブ系なブログ

    2ch系まとめサイトのアンテナ?的な新着サイトは結構あるんですが、勉強もかねてAlgorithm::NaiveBayesでベイズ使ってカテゴライズしてみたメモ。 Algorithm::NaiveBayes http://search.cpan.org/~kwilliams/Algorithm-NaiveBayes-0.04/lib/Algorithm/NaiveBayes.pm 目標 はてぶみたいに自動でカテゴリ分けしたい 参考に・・ 新はてなブックマークでも使われてるComplement Naive Bayesを解説するよhttp://d.hatena.ne.jp/tkng/20081217/1229475900上のサイトをみるとはてなではComplement Naive Bayesがつかわれてるっぽいです。 ここではAlgorithm::NaiveBayes 単純ベイズを使いました。

    Algorithm::NaiveBayesで2ch系まとめサイトをカテゴライズしてみた - 岩手からこんにちは ☆彡 perl とかウェブ系なブログ
  • ベイジアンフィルタ - Wikipedia

    ベイジアンフィルタ (英: Bayesian filter, naive Bayes spam filtering) は単純ベイズ分類器を応用し、対象となるデータを解析・学習し分類する為のフィルタ。学習量が増えるとフィルタの分類精度が上昇するという特徴をもつ。個々の判定を間違えた場合には、ユーザが正しい内容に判定し直すことで再学習を行う[1]。 現状ではスパムメール(いわゆる迷惑メール)を振り分ける機能を持つソフトウェア(フィルタリングソフト)で、スパムフィルターでのスパム判定に利用されることが多い[1]。最近ではWeblogのトラックバック用フィルタ(トラックバックスパム対策)にも利用されるようになるなど、その利用範囲は徐々に広がりつつある。 概要[編集] ベイジアンフィルタでは、初期状態である程度までの振り分けができるように設定されている。振り分け対象となるデータ(迷惑メールなど)の学

    ベイジアンフィルタ - Wikipedia
  • 1