【Day-8】絶望的なデータを前処理で何とかする。(pandas/sklearn) - プロクラシスト

テクノロジーカテゴリーの変更を依頼記事元:

www.procrasist.com

20users がブックマークコメント

コメント

2

記事へのコメント2件

注目コメント
新着コメント

オーナーコメントを固定しています

オーナー imslotter 書きました！前処理の話！

2017/12/08 リンク

オーナーコメントを固定しています

オーナー imslotter 書きました！前処理の話！

2017/12/08 リンク

karaage 良い内容！ただ、実務ではcsvが入手できればまだ良い方で、謎エクセルからcsvへの変換から始まったりする

2017/12/08 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

【Day-8】絶望的なデータを前処理で何とかする。(pandas/sklearn) - プロクラシスト

データ分析ガチ勉強アドベントカレンダー 8日目。 Day-7の記事で、データを取り扱えるようになりました... データ分析ガチ勉強アドベントカレンダー 8日目。 Day-7の記事で、データを取り扱えるようになりました。しかし、データがいつもきれいで美しいものだとは限りません。なかには絶望的なデータもたくさんあります。機械学習等の学習器に投げ入れるには、もうひと工夫いることのほうが多いです。 pandasとsklearnで、できる工夫、前処理についてまとめて行きます前処理とは絶望的なデータの入手データを統一的な型(数値等)に変換(df.apply) NaNの除去 df.dropna() df.fillna() df.interpolate() その他スケーリング StandardScaler MinMaxScaler その他まとめ前処理とは学習の流れを簡単な図にまとめてみる。データ分析の労力の7~8割は、↑図の赤の部分、前処理といわれている。適当に学習器に投げ入れたデータよりも、

ブックマークしたユーザー

cocosuzu2019/07/12
piro_suke2019/02/20
endor2019/02/17
tsubuo2019/01/20
ArcWaterCash2018/11/26
katz19552018/02/28
alaluta2017/12/09
Hiro_Matsuno2017/12/09
atm_09_td2017/12/09
flyingbird12017/12/09
pechiyon2017/12/09
yukimori_7262017/12/08
imslotter2017/12/08
karaage2017/12/08

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx