印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 今回は、データの「前処理」について話そうと思う。 前処理、と本稿で呼ぶのは、機械学習や可視化の前の処理すべてで、具体的には抽出や集計などの「データ加工」や「データ検証」のことを指す。 前処理は、これが結果に直結するというものではないため、データ活用事例の紹介記事などで触れられることもまずなく、分析業務に直接携わる者でなければその存在を意識することもないのではないだろうか。 ところが「データ分析業務は8割が前処理」と揶揄(やゆ)されることがあるほど、分析業務における前処理の比重は大きい。また、前処理が終わらなければ機械学習などの本格的な分析を始めることができないという構造もあり、分析プロジェクトのボトルネックに、容易になりうるのだ。 統計
![データ分析プロジェクト失敗回避のために--「前処理」実践法](https://cdn-ak-scissors.b.st-hatena.com/image/square/97ad3ad62d5c6ab8109320ae53f280cd9a26414a/height=288;version=1;width=512/https%3A%2F%2Fjapan.zdnet.com%2Fstorage%2F2015%2F03%2F02%2F83c005c1d3d816210d849409349b11a9%2F130711_database_184x138.jpg)