「入門 機械学習」手習い、3日目。「3章 分類:スパムフィルタ」です。 www.amazon.co.jp ナイーブベイズ分類器を作って、メールがスパムかどうかを判定するフィルタを作ります。 分類器の仕組み 1) 以下の単語セットを作成 (a) スパムメッセージに出現しやすい単語とその出現確率 (b) スパムメッセージに出現しにくい単語とその出現確率 2) で作成した単語セットを元に、メール本文を評価し、以下を算出 (a2) メールをスパムと仮定した時の尤もらしさ (b2) メールを非スパムと仮定した時の尤もらしさ 3) a2 > b2 となるメールをスパムと判定する という感じで判定を行います。 必要なモジュールとデータの読み込み > setwd("03-Classification/") > library('tm') > library('ggplot2') # テスト用データ # 分
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く