【perlメモ】KAKASIを使った文章のわかち書き – KUMA TYPE 【perlメモ】Algorithm::NaiveBayesのサンプル – KUMA TYPE 上記の記事を踏まえて、スパムフィルタリングの処理を作ってみた。 準備 まず、spamというフォルダとhamというフォルダを作成。 spamフォルダの中にスパムメール数十通分のテキスト(shiftjis)を格納。 hamフォルダの中に普通のメール数十通分のテキスト(shiftjis)を格納。 スパム情報を格納したテキストファイル(spam.txt)を作成するスクリプト spam.pl(utf8) use Strict; use Warnings; use utf8; use Encode qw/from_to decode_utf8 encode_utf8 encode decode/; use Encode::Guess