タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

Rに関するr_onodrのブックマーク (1)

  • kaggleで予測モデルを構築してみた (5) - Rで行うMultipleImputation - About connecting the dots.

    ということで,前回で触れたように,データの前処理を実際に行っていきたいと思います.その中でも今回は,欠損値補完についての話をしていきます. 今回のデータでは,NAが含まれているageのデータを補完する必要があります.とはいえ,欠損値を補完するにもいくつか方法があって,どの補完を行うのが妥当かというのを考えなければいけません.そこでまず,欠損値がどういう性質を持っているかについてみていきましょう. 欠損のメカニズム 欠損のパターン データの欠損には大きく分けて3つのパターンがあります. Missing Completely At Random(MCAR):完全にランダムに欠損が生じているもの Missing At Random(MAR) :データ欠損が,データに含まれるほかの変数と関連はしているが,その影響を取り除いた自分自身の値とは関連していないもの Missing Not At Rand

    kaggleで予測モデルを構築してみた (5) - Rで行うMultipleImputation - About connecting the dots.
  • 1