タグ

ブックマーク / www.housecat442.com (2)

  • AWSにRStudio入れてからkaggleのデータを読み込む話。 | 分析のおはなし。

    アメリカへの交換留学とノルウェーへの大学院留学を経た後に、データサイエンティストを目指そうとする人の戯れ言。 さびびさにRの話です。 仕事でこの先AWSから逃げれないなと思ったので、生活に取り入れようと決心した今日この頃。 とりあえず自分のPCのメモリに載らないデータを扱う決心をすれば必要性が生じるのでkaggleのclick-through competitionのデータを使って何かしてみようと決めた訳です。 という事でこの辺を参考にしながらやってみました。 1. AWSのアカウントを取る。 とってくださいw 2. AMIがあるので見つける。 こちらのサイトへ行くと右側にrstudioのAMIを利用してAWSを立ち上げる画面へのリンクが置いてあるので、立てたいリージョンのリンクをクリックする。 あとは、ポチポチやっていけばr-studioがインストールされた状態のものが立ち上がる。 ちな

    AWSにRStudio入れてからkaggleのデータを読み込む話。 | 分析のおはなし。
  • Gradient Boosting Decision Treeでの特徴選択 in R | 分析のおはなし。

    Gradient Boosting Decision Tree(GBDT)を勉強したので、その概要とRでのパッケージの簡単な使い方を乗っけておきます。 1. そもそもGBDTってなんだよっていう話。 単純に言えば、複数の決定木を作成して、集団で学習させる方法の事です。 1決定木を作り、上手くモデルで説明が出来なかったobservationに対して重みを付け、重みのついた状態で次の木を作り、また重みを付けて・・・ というステップを指定した数分だけ繰り返します。 誤差に対して学習しなおしてくれるので、決定木よりもっと良いモデルが出来上がります。 理論の詳細はこちらのを参考にしていただければと。 英語版は著者サイトで無料公開されています。英語大丈夫な人はこちらを参照するとよいかと。 http://statweb.stanford.edu/~tibs/ElemStatLearn/ あとこのイ

    Gradient Boosting Decision Treeでの特徴選択 in R | 分析のおはなし。
    akishin999
    akishin999 2015/01/25
  • 1