タグ

Rに関するgonhainuのブックマーク (2)

  • Rはいいぞ!むしろなぜ使わないのか!!

    61. What R is いい? まとめ • 世界中で変態が複雑なスクリプトを1行に してくれてたりするので、ちょっとググれ ば文系の我々にも簡単な解析・作図から複 雑な解析・作図まですぐ出来ちゃう。 • サンプルデータもくっそ豊富。?関数、で Rさんに直接質問すれば使用例が紹介され る。それをコピペするだけでおk。 • わからんことは先人の知恵をお借りできる。 ググラビリティ(検索能力)も多分向上するぞ!

    Rはいいぞ!むしろなぜ使わないのか!!
  • ランダムフォレストを使った初期分析例 | カメリオ開発者ブログ

    白ヤギコーポレーションのデータ分析担当 堅田です。 今回は、時間がない中でデータをさくっと分析したいという人向けに、RのrandomForestパッケージを使った分析方法を紹介したいと思います。 データの前処理 まずデータの前処理では、難なくRのrandomForestに突っ込むための加工を施します。主なステップは以下の4つです。 1. データのサンプリング 初期分析の段階で全データを使う必要はないと考えます。変数のサイズにもよりますが、私は10%くらいのデータでまずやるようにしています。 2. 数値型の変数の欠損値は中央値で補完。さらに、欠損の有無そのものを新たな変数とする RのrandomForestのデフォルト設定では、欠損値があると実行できません。そのため、欠損値を補完する必要があります。 数値データの欠損は、来は理由に応じて処理すべきですが、理由がわからなければ中央値で補完して

    ランダムフォレストを使った初期分析例 | カメリオ開発者ブログ
  • 1