タグ

ベイズの定理に関するA-CUP-OF-TEAのブックマーク (2)

  • ベイズの定理 | 遊ぶエンジニア

    条件付き確率とは一言でいうならば「得られた情報である事象を全体だ、と考え、可能性のなくなった曽事象を消滅させ、あらためて比率をとったもの」(「独習」ベイズ統計学入門より) ということだ。(この、すごい!) つまり事象Bという情報を得た上での事象Aの条件付き確率は p(B|A) = p(A & B) ÷ p(B) (Aの事象は消えて、Bの世界だけで確率を再計算する) つぎに式を変形すると、 p(A & B) = p(B) x p(A|B) 例えば事象Aがトランプの絵札だとし、事象Bがハートだったとする。 p(A & B) とはハートかつ絵札は3枚であることより、3/52 p(B) は13枚であることより 13/52 p(A|B)は 先の定義より、13枚であるウチの3枚なので 3/13 3/52 = 13/52 x 3/13 事象Bと情報Aを「かつ(AND)」で結んだものは、 Bの事前確率と

  • 綱引きに蛇口当てゲーム?! 楽しく学ぶベイズフィルターの仕組み

    メールの特徴抽出——単語の詰まった袋をモデルとして コンピュータ上でスパム判定を行うためには、まず、判断の材料になるメールの特徴を取り出さなくてはなりません。 あるメールがスパムであるか否かを判断するのに必要な特徴とはなんでしょう。特徴には、メールの長さや、言語、配送元の国、HTMLメールの有無などさまざまな要素を盛り込めますが、多くのスパムフィルターでは、単語などトークンの出現頻度をメールの特徴としています。このように、文書を語の並びを無視して単語の詰まった1つの袋としてモデル化したものを“bag-of-words”といいます。

    綱引きに蛇口当てゲーム?! 楽しく学ぶベイズフィルターの仕組み
  • 1