以前からR, とりわけdplyrユーザーのpandas操作のために記事をまとめてきましたが、dplyr同様の操作は実現できていませんでした。が、ついにdfplyという素晴らしいライブラリを見つけましたので記事にまとめます。 関連シリーズ dplyr使いのためのpandas dfply データ加工編(tidyr) dplyr使いのためのpandas dfplyでもJOIN編 dplyr使いのためのpandas dfply window関数編 以前の記事はコチラ dplyr使いのためのpandas 基礎編 dplyr使いのためのpandas スライスsliceとインデックスindex編 dplyr使いのためのpandas マルチカラム操作編 dplyr? ってかたはコチラ(敬愛するmatsuou1氏の記事) dplyrを使いこなす!基礎編 dfplyのなにがすごい? dplyrの機能がほぼその
更新(2019/02/19): いろいろ議論があって、group_by()のデフォルトの挙動はこれまでと同じ(empty groupはつくらない)ようになりました。 group_by()するときに.drop = FALSEとした場合だけ、empty groupがつくられます。 dplyr 0.8.0がもうすぐ(来年1月上旬?)リリースされます。 この公式記事を読んでおけばいいかと思ったんですが、今回は、group_by()に大きな変更がいくつもあります。 まじで大きな変更なので、「もう俺たちが知っているgroup_by()じゃない」くらいのつもりで臨みましょう。 便利な新機能もあるんですが、それは日を改める*1ことにして、 breaking changeに絞って書きます。 factorの扱い 今のdplyrは、factorを文字列と同じように扱って、そのベクトル中に存在する値を見てグループ
dbplyr: A 'dplyr' Back End for Databases A 'dplyr' back end for databases that allows you to work with remote database tables as if they are in-memory data frames. Basic features works with any database that has a 'DBI' back end; more advanced features require 'SQL' translation to be provided by the package author.
As well as working with local in-memory data like data frames and data tables, dplyr also works with remote on-disk data stored in databases. Generally, if your data fits in memory there is no advantage to putting it in a database: it will only be slower and more hassle. The reason you’d want to use dplyr with a database is because either your data is already in a database (and you don’t want to w
※この記事は4/9に書いた「dplyr 0.4.3.9000を使ってみる」という記事を加筆したものです 「1か月くらいしたら新しいdplyr出るよ」とHadleyが言ってました。 Getting ready to start dplyr release process. Over >150 issues fixed: https://t.co/N6fOAnN5pF. Expect on CRAN in ~1 month #rstats— Hadley Wickham (@hadleywickham) March 24, 2016 それから1か月が過ぎ、2か月が過ぎ、3か月が過ぎ、、、ようやくリリースされました! 長かった。。 Release dplyr 0.5.0 · hadley/dplyr · GitHub 変更点を見てみます。 Breaking changes arrange()はグ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く