目的 とりあえずどれぐらいでできるものかベンチマークとしてやってみる. 既存 ナイーブベイズ分類器の実装とか 〜畑さん/こだまさん問題〜 - naoya_t@hatenablog ナイーブベイズ分類器の実装とか(その2)〜新アルバムの楽曲で畑さん/こだまさん分類器を試してみた〜 - naoya_t@hatenablog データ 作詞家 データ数 大森祥子 126曲 森由里子 176曲 こだまさおり 187曲 くまのきよみ 200曲 畑亜貴 377曲 この5クラス分類に取り組む. 特徴量は歌詞に含まれる名詞/動詞/形容詞の頻度. モデル 普通にSVM. LIBSVM -- A Library for Support Vector Machines SVM実践ガイド (A Practical Guide to Support Vector Classification) - 睡眠不足?!を読み