アメリカへの交換留学とノルウェーへの大学院留学を経た後に、データサイエンティストを目指そうとする人の戯れ言。 Tokyo.Rに行くたびにdplyrの話が話題に上がっていて、数か月前は完全に「なんすか、それ?意味あるんすか?」みたいな感じだったんですが、最近データの前処理で使いまくりです。 もうね、便利すぎてヤヴァイ。 という事で使い方をまとめておこうかと。 library自体はCRANからtidyverseをインストールするか、そのままdplyrをインストールすれば大丈夫です。 どちらの場合も library(dplyr)で呼び出せます。 twoyp, area, ku, matiの4つの変数のある賃貸物件のサンプルデータがあるとしましょう。 それぞれ家賃二年分・面積・23区・市町というデータです。 この発表で使われたものですね。 頭の10行を取り出してみます。 > head(sample
![Rのdplyrが便利ですねって話。 | 分析のおはなし。](https://cdn-ak-scissors.b.st-hatena.com/image/square/cfc9cb250d0005053c53d00f90f305577b6866f0/height=288;version=1;width=512/http%3A%2F%2Fwww.housecat442.com%2Fwordpress%2Fwp-content%2Fuploads%2F2013%2F04%2FP5020876-1024x768.jpg)