タグ

data.tableとRに関するmahler-5のブックマーク (2)

  • 大規模データの高速処理 ーdata.table、dplyrー

    Rは便利な統計解析ツールですが、処理の遅さや大規模データの扱いにくさが弱点と言われています。 このような状況に対処すべく、現在ではパフォーマンスの向上に役立つパッケージが数多く開発されています。 そこで今回は「Rとウェブの融合」をお休みして、data.tableとdplyrによる大規模データの高速処理について紹介します。 この記事では2014年7月現在の最新バージョン(data.table 1.9.2及びdplyr 0.2)を利用しています。 必要に応じてインストールして下さい。また紙面の都合で実行結果の掲載は省略しているので、手元の環境で試して実行結果を確認してみることをお勧めします。 > # パッケージのインストールと読み込み > install.packages(c("data.table", "dplyr")) > library(data.table) > library(dpl

  • Rのこれだけ覚えておけばいいdata.tableの使い方 - Qiita

    library(data.table) data.tableは簡単に言うとサイズの大きいデータフレーム。 確かに高速。慣れると大規模データはこれなくして扱えない。 データフレームと扱い方が大きく異なるが、これだけ抑えておけば十分ということをまとめた。 data.tableには行名がない dplyrとセットで使うことが多いので、同時に呼び出しておくといい ただしtidyr(集計用ライブラリ)までは使わなくていい

    Rのこれだけ覚えておけばいいdata.tableの使い方 - Qiita
  • 1