2016.09.14 処理時間のバラつきについて追記しました scikit-learnのSVC(rbfカーネルとlinearカーネル)とLinearSVCの処理速度を比較してみました. 利用したデータはRのkernlabパッケージに含まれているspamデータです. 説明変数は4601サンプル,57次元, ラベルはspam:1813サンプル,nonspam:2788サンプルです. サンプル数,次元数を変えた時の結果は以下の通りです. SVCのlinearカーネルが遅すぎますね. ついついカーネル種別まで含めてグリッドサーチしてしまいたくなりますが, きちんとLinearSVCを使ったほうが良さそうです. 検証用コードは以下. 処理時間計測の都合でパラメータCを振っています. また特徴量選択(次元削減)はRandomForestのfeature importanceを利用しました. これは適当