前書き とあるRのお悩み相談室*1にて、激しい圧力を受けたRandom Forestの新しいパッケージ{ranger}の「行数よりも列数の方が大きい疎なデータ」への適用に関して、とてもざっくりとした申し訳ない程度のメモを書きました。 パッケージ自体は下記リンクをご参照ください。 mnwright/ranger · GitHub CRAN - Package ranger [1508.04409] ranger: A Fast Implementation of Random Forests for High Dimensional Data in C++ and R 「行数よりも列数の方が大きい疎なデータ」として、今回はLIBSVMの二値分類タスクのデータセットのうち、news20.binaryを利用しました。 LIBSVM Data: Classification (Binary Cla
追記('15/01/04):*_join()の図を追加しました。 新年早々、dplyrの新バージョンがリリースされるらしいです。 dplyr/NEWS.md at master · hadley/dplyr · GitHub 新機能についてはHadleyさんがRPubsに書いてるので、もうブログ書かなくてもいいかなーと思いつつ、修行のため使ってみます。 RPubs - dplyr-0.4 インストール まだCRANには来てないのでinstall_github()します。 devtools::install_github("dplyr") バージョン確認。 > packageVersion("dplyr") [1] ‘0.4.0’ add_rownames() add_rownames() turns row names into an explicit variable (#639). r
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く