データセットを分割するときに scikit-learn の train_test_split() をよく使う.今回は train_test_split() に設定できる stratify パラメータを試す.stratify は「層化」という意味で「データセットの特性を考慮した分割」とも言える.特に「不均衡データセット」を使うときに重要になる. scikit-learn.org train_test_split() をデフォルト設定で使う train_test_split() のデフォルト設定を抜粋すると以下のようになる.stratify はデフォルトで None になる. train_size = 0.75(トレーニングデータ 75 %) test_size = 0.25(テストデータ 25 %) shuffle = True(ランダムに分割する) stratify = None(層化なし