4. たとえば • 欠測値への対応 • 連続データの離散化 • 外れ値処理 • 単位の変換(標準化) • サンプリング • 不均衡データ • 属性抽出 • データ形式の変換(時系列、グラフ等) 6. シリーズ前処理について • 一説では、データ分析の8-9割の時間を占め るといわれながら、その方法についてはあまり 語られることのない前処理について迫っていく シリーズです。 • 私の発表をたたき台にして、「ぼくのかんがえ たさいきょうのまえしょり」をみんな共有してく れると嬉しいです。 • 一人で続けるのはしんどいので、誰か続いてく れると嬉しいです。 7. これまでの前処理@Tokyo.R • Rで学ぶロバスト推定(第13回) – 外れ値 • xtsパッケージで時系列解析(第15回) – データ形式の変換 • Rを用いた地理的情報解析(第16回) – デー