[B! R][あとで読む] gonhainuのブックマーク

gonhainu id:gonhainu

Rとあとで読むに関するgonhainuのブックマーク (1)

ランダムフォレストを使った初期分析例 | カメリオ開発者ブログ
白ヤギコーポレーションのデータ分析担当　堅田です。今回は、時間がない中でデータをさくっと分析したいという人向けに、RのrandomForestパッケージを使った分析方法を紹介したいと思います。データの前処理まずデータの前処理では、難なくRのrandomForestに突っ込むための加工を施します。主なステップは以下の4つです。 1. データのサンプリング初期分析の段階で全データを使う必要はないと考えます。変数のサイズにもよりますが、私は10%くらいのデータでまずやるようにしています。 2. 数値型の変数の欠損値は中央値で補完。さらに、欠損の有無そのものを新たな変数とする RのrandomForestのデフォルト設定では、欠損値があると実行できません。そのため、欠損値を補完する必要があります。数値データの欠損は、本来は理由に応じて処理すべきですが、理由がわからなければ中央値で補完して
gonhainu 2016/08/04
あとで読む

analysis

R
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx