R, 統計, 機械学習 まぁ、表題の通りです。NeuralNetwork、SVM、NaiveBayesの3つの手法で、訓練データの割合を1〜99%まで変更させた時に、どのように正答率が変化するのかをシュミレーションしてみましょう。結果はこのようになりました。 明らかにNaiveBayesの精度が悪いですね。SVMとニューラルはほぼ同じくらいですが、訓練データの割合が少ない場合はSVMよりもニューラルネットの方が精度が高いようです。 これは、4600のデータしかないので訓練データが1%などというのは少なすぎて微妙だとは思いますが、結構如実に3手法の間で違いが出てきて興味深いですね。なぜそうなるのかは、のちのち書いていこうと思います。 あと、Tipsとしては、for文の中において、今何回目のループなのかを判別するためにfor文内の最初に message(paste(i,""),appendLF