「銀座で働くデータサイエンティスト」さんこと、Ozeki さん のブログ記事を参考に、ディープ・ラーニング と 従来の機械学習モデル( 7種類 )を使って、電子メールのスパム判定予測の分類精度を比較してみた。 使用したデータと、精度比較した学習モデルは、以下のとおり。 (1) データセット R言語 {Kernlab} パッケージ 組み込みの spam データセット。 中身は、電子メールの属性項目データ(数値データ)と、スパム・メールか、スパム・メールでないかのtype項目 (2) 精度比較した学習モデル ※ ディープ・ラーニング + 既存の機械学習モデル 6種類 1 ディープ・ラーニング ( {H2O} パッケージ ) 2 ランダム・フォレスト ( {randomForest} パッケージ ) 3 Extremely Randomized Trees ( {extraTrees} パッケー