< ---- < | > Naive Bayesの罠 > ================================================ Naive Bayes(NB,ナイーブベイズ)の実装についてメモ。 NBというのはベイズ則に基づく単純な分類器で lnP(Ci|D) = Σj{lnP(wj|Ci)} + lnP(Ci)で文書DがクラスCiに属する確率が得られるよ、というもの。(以下、Σiで添字iのすべての場合についての足し合わせを表す) これを実装する場合、まず手元にデータ集合を用意する。データ集合はクラスラベル(Ci)の付けられた単語(wj)、つまり(Ci,wj)のペアの集まり。例えば (甘い,りんご) (甘い,りんご) (甘い,りんご) (甘い,ハチミツ) (甘い,ハチミツ) (甘い,バナナ) (甘い,砂糖) (甘い,カレー) (辛い,カレー) (辛い,カレー)