はじめに コルモゴロフ-スミルノフ検定を利用した特徴量選択 コルモゴロフ-スミルノフ検定とは 特徴量選択にどう活用する? Kaggle Kernel おわりに はじめに えじさんの下記記事を読んで「コルモゴロフ-スミルノフ検定を利用した特徴量選択」が気になりました。自分なりに簡単に手を動かしてみたので、備忘録としてまとめておきます。 amalog.hateblo.jp 元になったdiscussionの投稿はこちらです。 www.kaggle.com コルモゴロフ-スミルノフ検定を利用した特徴量選択 コルモゴロフ-スミルノフ検定とは Pythonでは「scipy.stats.ks_2samp」で実行できます。 docs.scipy.org This tests whether 2 samples are drawn from the same distribution. 日本語にすると「2つ