If we take a look at the distribution of the target, train_raw_df$went_on_backorder, we see that the data set is severely imbalanced. We’ll need a strategy to balance the data set if we want to get maximum model performance and efficiency. # Unbalanced data set train_raw_df$went_on_backorder %>% table() %>% prop.table() ## . ## No Yes ## 0.993309279 0.006690721 We can also inspect missing values.
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く