ツイートストリームをベイジアンフィルタでカテゴリ分けしていく様子を見てみました。 カテゴリとしてハッシュタグを利用します。 ハッシュタグが付いているツイートは、フィルタの学習テキストとなります。 ハッシュタグが付いていないツイートは、どのハッシュタグに近い内容となっているのかを推定します。 これを行なうプログラム。 use strict; use warnings;use lib './lib'; use utf8; use FindBin::libs; use Text::MeCab; use Classifier; use Classifier::Filter::DBI; use Encode; use Config::Pit; use AnyEvent::Twitter::Stream; use DBI; use DBIx::Class; my ($username, $passwo