タグ

2015年1月30日のブックマーク (2件)

  • Gradient Boosting Decision Treeでの特徴選択 in R | 分析のおはなし。

    Gradient Boosting Decision Tree(GBDT)を勉強したので、その概要とRでのパッケージの簡単な使い方を乗っけておきます。 1. そもそもGBDTってなんだよっていう話。 単純に言えば、複数の決定木を作成して、集団で学習させる方法の事です。 1決定木を作り、上手くモデルで説明が出来なかったobservationに対して重みを付け、重みのついた状態で次の木を作り、また重みを付けて・・・ というステップを指定した数分だけ繰り返します。 誤差に対して学習しなおしてくれるので、決定木よりもっと良いモデルが出来上がります。 理論の詳細はこちらのを参考にしていただければと。 英語版は著者サイトで無料公開されています。英語大丈夫な人はこちらを参照するとよいかと。 http://statweb.stanford.edu/~tibs/ElemStatLearn/ あとこのイ

    Gradient Boosting Decision Treeでの特徴選択 in R | 分析のおはなし。
    horihorio
    horihorio 2015/01/30
  • foreachについてまとめたい - J's blog

    foreachパッケージのforeach関数についてです。 Rで並列処理を行う際に今まで使用してきましたが、引数は.combineをいじるくらいでした。他にも%dopar%とかよくわからないものを蔑ろにしていました。この関数は今後もよく使うことになりそうなので、頑張ってまとめてみたいと思います。 基形としてはこんな感じです。 foreach(i = 範囲) %do% { -- 処理 -- } 1~3の平方根の計算例が以下になります。返り値はデフォルトでlistです。 > foreach(i = 1:3) %do% { sqrt(i) } [[1]] [1] 1 [[2]] [1] 1.414214 [[3]] [1] 1.732051 イテレータをここではiとしていますが、もちろんaでもbでもokです。さらに言えば、イテレータは2つ以上あっても大丈夫で、その場合は要素数の少ない方に

    foreachについてまとめたい - J's blog