野球データを速く集計したい (R vs nysol) はじめに R advent calendar, 12月10日分です. nysolを使ってみた, という話です. 速度比較の記事を見ると, nysol使いたくなりますよね. 使ってみたら案外イケました. コードも書きやすいです. 野球データ解析のコードを例に, plyr, dplyr, nysolのコードと処理速度を比較してみました. メジャーリーグ: 大チャンスでの得点率 メジャーリーグで, 犠牲フライでも点が入る場面で, ちゃんと得点を挙げてくれる選手を調べます. 2013年メジャーリーグの全打席結果データ(77MB)を利用して, 集計してみます. データはretrosheetからダウンロード出来ますし, githubにもあります. . 集計は, 以下の3つの方法で行います. data.frame + plyr data.table