mahler-5のブックマーク / 2015年10月26日 - はてなブックマーク

mahler-5 id:mahler-5

2015年10月26日のブックマーク (6件)

Sta 523
mahler-5 2015/10/26
R

dplyr
リンク
"ranger: A Fast Implementation of Random Forests"のメモ書き - バイアスと戯れる
前書きとあるRのお悩み相談室*1にて、激しい圧力を受けたRandom Forestの新しいパッケージ{ranger}の「行数よりも列数の方が大きい疎なデータ」への適用に関して、とてもざっくりとした申し訳ない程度のメモを書きました。パッケージ自体は下記リンクをご参照ください。 mnwright/ranger · GitHub CRAN - Package ranger [1508.04409] ranger: A Fast Implementation of Random Forests for High Dimensional Data in C++ and R 「行数よりも列数の方が大きい疎なデータ」として、今回はLIBSVMの二値分類タスクのデータセットのうち、news20.binaryを利用しました。 LIBSVM Data: Classification (Binary Cla
mahler-5 2015/10/26
機械学習

RandomForest

R
リンク
Rのこれだけ覚えておけばいいdata.tableの使い方 - Qiita
library(data.table) data.tableは簡単に言うとサイズの大きいデータフレーム。確かに高速。慣れると大規模データはこれなくして扱えない。データフレームと扱い方が大きく異なるが、これだけ抑えておけば十分ということをまとめた。 data.tableには行名がない dplyrとセットで使うことが多いので、同時に呼び出しておくといいただしtidyr（集計用ライブラリ）までは使わなくていい
mahler-5 2015/10/26
dplyr

R

data.table

あとで読む
リンク
dplyr 0.4を使ってみる - Technically, technophobic.
追記（'15/01/04）：*_join()の図を追加しました。新年早々、dplyrの新バージョンがリリースされるらしいです。 dplyr/NEWS.md at master · hadley/dplyr · GitHub 新機能についてはHadleyさんがRPubsに書いてるので、もうブログ書かなくてもいいかなーと思いつつ、修行のため使ってみます。 RPubs - dplyr-0.4 インストールまだCRANには来てないのでinstall_github()します。 devtools::install_github("dplyr") バージョン確認。 > packageVersion("dplyr") [1] ‘0.4.0’ add_rownames() add_rownames() turns row names into an explicit variable (#639). r
mahler-5 2015/10/26
R

dplyr
リンク
https://www3.nd.edu/~steve/computing_with_data/24_dplyr/dplyr.html
mahler-5 2015/10/26
dplyr

R
リンク
Blog | Data Science Articles
Introducing The State of Data & AI Literacy Report 2024Explore the key takeaways from the 2024 State of Data & AI Literacy report, including key statistics and opinions from data & AI thought leaders
mahler-5 2015/10/26
R

dplyr
リンク
- 2015年10月27日
- 2015年10月26日
- 2015年10月25日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx